AA_sandybridge.jpg

© Intel

Intels neue Prozessorarchitektur "Sandy Bridge"

Brücken aus Sand

Obwohl die Entwicklung in der Computerbranche meist rasend schnell zu gehen scheint, haben Prozessorarchitekturen oft ein erstaunlich langes Leben. Mit "Sandy Bridge" führt Intel nun nach sehr vielen Jahren wieder einmal eine neue ein.

Bei "Sandy Bridge" handelt es sich um Intels erste wirklich neue Prozessorarchitektur seit dem Pentium 4 vor zehn Jahren. Die CPUs der offiziell als "Core i7 Second Generation" bezeichneten Serie tragen denn auch vierstellige Typbezeichnungen statt der dreistelligen Modellnummern der bisherigen Prozessoren.

Freilich erfand der Halbleitergigant für Sandy Bridge das Rad nicht neu, auf den 32-Nanometer-Chips finden sich auch bekannte und bewährte Techniken, teilweise auch in verbesserter Ausführung. Die "Bridge" im Namen kommt nicht von ungefähr: Im CPU-Teil finden sich sowohl Techniken der Core-i7-Generation als des P6-Nachfolgers "Netburst". Daneben flossen auch Erfahrungen aus der von Intel ursprünglich als GPU geplanten und später als Numbercruncher umetikettierten "Larrabee"-Serie mit ihren zig Kernen in Intels neueste CPUs ein. All das verheiratet Intel mit der aktuellsten Ausführung seiner integrierten Chipsatzgrafik, die dem Hersteller zufolge zumindest dedizierte Einsteiger-Grafikkarten schlagen soll.

Auf den ersten Blick (Abbildung 1) hat sich wenig geändert: Bis zu vier Kerne, 256 KByte L2-Cache pro Kern, Hyperthreading, integrierter Zweikanal-Speichercontroller und PCI-Express-Interface, 8 MByte L3-Cache, 3.4 GHz Taktrate, 95 Watt TDP – das kennt man alles schon von der Vorgänger-Generation. Die wirklichen Neuerungen zeigen sich erst beim Blick unter die Haube.

Abbildung 1: Der Sandy Bridge-Die mit seinen einzelnen Komponenten.

Neuerungen

Die sicherlich größte Neuerung stellt das mit 256 Bit gegenüber den Vorgängern doppelt so breite Vektor-Register dar. Mit den neuen AVX-SIMD-Befehlen (siehe Kasten "Advanced Vector Extensions") verrechnet man damit 8 Fließkommazahlen doppelter Präzision oder 16 in einfacher Präzision in einem Rutsch. Das funktioniert, wie man es von anderen Architekturen (PA-RISC, Itanium, SPARC64, PowerPC) teils schon seit Jahrzehnten kennt, auch endlich nicht-destruktiv mit mehreren Operanden sowie Addition und Multiplikation in einem Befehl (FMA).

Advanced Vector Extensions

Die neue Befehlserweiterung AVX kombiniert Ideen aus Intels LRBNI ("Larrabee New Instructions") und AMDs SSE5. Die 16 XMM-Register von SSE wurden in der Breite auf 256 Bit verdoppelt und heißen nun YMM; die SSE-Befehle nutzen nur die untere Hälfte der Register. Daneben macht eine Vielzahl von Instruktionen das nicht-destruktive Rechnen mit mehreren Operanden möglich, was Register-Befehle zum Sichern der Operanden einspart. Als dritte Neuerung muss die Anordnung der SIMD-Daten zur flüssigen Abarbeitung (Alignment) nun nicht mehr so strikt sein. Drei Byte große VEX-Präfixe signalisieren der CPU, dass es sich bei der folgende Instruktion um ein AVX-Kommando handelt, und mit wievielen und welchen Operanden der Befehl rechnet. Ähnlich wie bei AMD64 muss das Betriebssystem explizit AVX unterstützen, anderenfalls funktioniert der Prozessor wie eine herkömmliche CPU und kann AVX-Software nicht verarbeiten. Linux kann schon seit Kernel 2.6.30 (Juni 2009) mit AVX umgehen, Windows ab Windows 7 respektive Windows Server 2008 SP1.

AVX rechnet ausschließlich mit Fließkommazahlen und schließt0t gleichzeitige Integer-Operationen aus. Der Grund dafür: Statt das Fließkomma-Rechenwerk auf 256 Bit zu verbreitern, kombiniert Intel bei AVX die 128 Bit breite SIMD-Fließkomma-Unit mit den 128 Bit der SIMD-Integer-Unit. Nicht wenig Software nutzt jedoch auch stark Ganzzahlen. Wo sie hohe Präzision und ellenlange Mantissen nicht brauchen, setzen Entwickler gerne auf schnelle Fixed-Point-Arithmetik über Integer, etwa beim beliebten H.264-Encoder x264. AMDs agiert hier schlauer: Deren mit "Bulldozer" kommende Befehlserweiterung XOP bleibt zwar in der Struktur weitgehend zu AVX befehlskompatibel, umfasst jedoch neben FMA4 auch eigene neue Integer-Instruktionen.

Ebenfalls völlig neu ist ein schneller Ring-Bus, der den L3-Cache, die CPU-Kerne, die GPU und den "Uncore"-Bereich mit der Schnittstelle zum Rest des Systems verbindet. Diesen bereits im Larrabee erprobten Ansatz vergleicht Intel mit einem Paternoster, auf den die Daten auf- und an der richtigen Stelle wieder abspringen. Der Bus besteht eigentlich aus vier Ringen (Data, Request, Acknowledge, Snoop), die zusammen mit einem eigenen Protokoll auch die Cache-Kohärenz sicherstellen. Der Vorteil zum bisherigen Crossbar-Switch-Ansatz: Es lassen sich beliebig viele Stationen (sprich: CPU-Kerne) hinzufügen, ohne den Ringbus anpassen zu müssen.

Der "Trace Cache" des Pentium 4 erlebt in Sandy Bridge einen zweiten Frühling. Der neuen Cache puffert als Micro-Ops (uOps) dekodierte x86-Instruktionen. Das erhöht den Datendurchsatz und verbessert die Latenz, da wiederkehrende Befehle nun nicht mehr aus dem L1-Befehls-Cache geladen und erst dekodiert werden müssen. Obendrein spart es Strom, da der Befehlsdecoder sich derweil schlafen legen kann. Intel nennt den neuen Trace-Cache L0, weil er quasi unter dem L1-Befehls-Cache sitzt (aber dennoch Teil von diesem ist). Bei einer Kapazität von 1500 Micro-Ops findet sich laut Intel in 80 Prozent aller Fälle die Instruktion bereits dekodiert im L0-Cache. Das ermöglichteinen besseren dauerhaften Durchsatz von 4 Micro-Instruktionen pro Takt ("4-issue").

Auch die Sprungvorhersage (Branch Prediction Unit, BPU) hat Intel verbessert. Moderne Prozessoren schauen per Lookahead-Buffer quasi in die Zukunft und versuchen Sprungziele vorherzusagen. Verschätzen sich die CPU, muss sie die gesamte Pipeline mit bis zu 100 "In-Flight-Instructions" leeren, den Code für das korrekte Sprungziel neu laden und ausführen (eine sogenannte "Bubble"). Durch Verkürzen der Sprungvektoren auf die relative Entfernung statt der absoluten Speicherposition kann Sandy Bridge mehr Sprungadressen im Branch Target Buffer (BTB) vorhalten, da die meisten Schleifen relativ klein ausfallen. Mehr History-Bits ermöglichen, die Wahrscheinlichkeit eines Sprungs nun auch besser zu bestimmen, die Confidence-Bits können nun obendrein für mehrere Sprungadressen gelten.

Neu arrangiert

Per Reorder-Buffer (ROB) arrangiert der Prozessor Befehlsfolgen zur effizienteren Abarbeitung. Diesen hat Intel ebenfalls verbessert: Es gibt nun wie beim Pentium 4 ein PRF (Physical Register File). Das erleichtert das Verwalten vieler Befehle, da nur Vektoren ins PRF geändert werden müssen, zudem benötigt auch AVX dieses Feature. Insider vermuten, dass Intel den ROB auch deswegen überarbeitet hat, um einen bekannten Hotspot besser über den Prozessorkern zu verteilen, was eine höhere Taktrate erlaubt.

Nicht zuletzt hat Intel auch den Turbo-Modus für CPU und GPU modernisiert ("Turbo 2.0"). Statt wie bisher einfach bei Erreichen der maximalen TDP herunterzutakten, orientiert sich der Modus nun auch an der tatsächlichen Temperatur. Intel vergleicht das mit einem Kessel Wasser, den man auf den Herd stellt: Auch bei voller Heizleistung kocht das Wasser erst nach einiger Zeit. Bis es soweit ist, übertaktet "Turbo 2.0" munter weiter und darf dabei sogar die TDP kurzzeitig überschreiten. Erst bei Erreichen der kritischen Temperatur taktet die CPU schrittweise herunter. Da sich in den meisten Programmen rechenintensiver und weniger anspruchsvoller Code abwechseln, funktioniert dieser Ansatz recht gut.

Der Grafikkern residiert nun wie beim "Pinetrail"-Atom direkt auf dem Prozessor-Die. Dies ermöglicht eine engere Integration von GPU und CPU: So können etwa beide auf den L3-Cache (von Intel nur noch LLC, also "Last Level Cache", genannt) zugreifen. Intel verspricht eine gegenüber dem Vorgänger GMA HD verdoppelte Leistung. Ärgerlicherweise hat Intel der neuen GPU keine OpenCL-Unterstützung spendiert, auch neue Shader-Features wie Tesselation (OpenGL 4.0 / DirectX 11) sucht man vergeblich. OpenGL 2.1 und DirectX 10.1 bleiben das Höchste der Gefühle.

Die integrierte Media-Engine überarbeitete Intel ebenfalls. Sandy Bridge kann zwar immer noch zwei H.264-Streams gleichzeitig dekodieren, erledigt dies allerdings in der Media-Engine statt über die Shader des Grafikkerns. Das ist wesentlich energieeffizienter und lässt den Grafikkern für andere Aufgaben frei. Intel verspricht auch eine doppelt so hohe Encoding-Leistung wie zuvor, dies dann jedoch in Kombination mit dem Grafikkern.

Zu guter Letzt wäre noch die Crypto-Engine AES-NI zu nennen, deren Leistung Intel in Sandy Bridge deutlich verbessert haben will, insbesondere bei RSA und SHA-1.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

Kommentare
dp67bg und Linux
tom (unangemeldet), Mittwoch, 20. April 2011 12:21:05
Ein/Ausklappen

Hi,

also bei mir rennt auf dem Board mit einem 2600K udn 16GB RAM weder opensuse 11.4, noch Fedora 15beta oder Ubuntu 11.4 beta 2 - alle starten noch nicht mal, oder hängen dann beim laden.

cheers,
tom


Bewertung: 280 Punkte bei 109 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Lieber etwas warten
Daniel Gultsch, Sonntag, 09. Januar 2011 03:42:41
Ein/Ausklappen

Einerseits kann ich verstehen, dass ihr den Artikel für die aktuelle Ausgabe fertig bekommen wolltet andererseits hätte ich mir etwas ausführlichere Tests zum Grafikchip inklusive der h264-Decodierfunktion (VAAPI) - die mit den aktuellen Treibern (git bzw Q4) laufen sollte - und dem AES-NI Set gewünscht (crypto benchmarks)
Ehrlich gesagt versteh ich nicht, warum die meisten Magazine Hardwaretests immer mit Ubuntu und co machen und sich dann aufregen, dass die Treiber nicht oder nur schlecht funktionieren. Unter Gentoo oder Arch ist es so viel einfacher git Treiber zu installieren und die Hardware damit zu testen. Denn wenn es um Linuxtreiber Support geht, ist eigentlich nur git relevant und nicht irgendeine veraltete Ubuntu Version. Klar die meisten Leser werden Ubuntu einsetzen, aber dort würde eigentlich ein Hinweis reichen, dass die aktuelle Ubuntu Version das nicht kann - die neuen Treiber aber auf jedenfall in der nächsten Version (oder in Backports) enthalten sein werden.


Bewertung: 263 Punkte bei 129 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Lieber etwas warten
Daniel Kottmair, Freitag, 28. Januar 2011 10:58:21
Ein/Ausklappen

Hallo Daniel,
Ubuntu war nicht das Problem: Der erste, der die GPU auf Sandybridge zum Laufen gekriegt hat außerhalb Intels Labs war meines Wissens nach Michael Larabel von Phoronix, mit dem ich diesbezüglich auch in Kontakt stand, er zitiert mich auch an mehreren Stellen:
http://www.phoronix.com/sca...p?page=news_item&px=ODk2OA

Laut ihm kamen erst zum offiziellen Sandybridge launch (als unser Heft schon lange in Druck war!) die Pakete raus, mit denen das überhaupt möglich ist:
http://www.phoronix.com/sca...m=intel_sandy_breaks&num=1

"It was not until the time that Sandy Bridge launched that there was the releases of Linux 2.6.37, Mesa 7.10, and the xf86-video-intel 2.14 DDX that are the versions reported to play well with the new Intel graphics."

Und selbst jetzt, da er's zum Laufen gekriegt hat, ist die Kompatibilität unterirdisch, er berichtet, dass kein einziger seiner 3D-Benchmarks sauber durch lief:

"However, in the end, I did not have a single valid result for one reason or another with each test."

Und nicht nur mit 3D gibt's Probleme:
"While building the kernel though another Sandy Bridge issue was discovered: very high CPU load on the Linux 2.6.37 kernel with the Core i5 2500K will cause the system to lock up with a corrupted screen as if the GPU is being starved. It happened several times and within two minutes of beginning the kernel build process commencing."

Die Situation ist also alles andere als toll (obwohl laut Releasenotes Ubuntu 11.04 die Sandy Bridge GPU unterstützen soll, da bin ich mal gespannt!) - und das, obwohl Intel schon seit Kernel 2.6.34 daran arbeitet (dort gab es die ersten Hinweise auf Sandybridge-GPUs!).

Es war also genügend Zeit, wenigstens bis zum Launch den GPU-Support für Linux sauber hinzubekommen (inbesondere wenn Intel in ihren PR-Materialien und bei ihren Presseterminen immer wieder von der supertollen integrierten Grafik spricht, wieviel die kann und wie super schnell die sein soll!) - aber offensichtlich hat Linux eben nur eine sehr niedrige Priorität bei Intel..

Charlie Demerjian (semiaccurate, TheInquirer) betitelt einen Artikel darüber aus diesem Grund sogar mit "Sandy Bridge is the biggest disappointment of the year":
http://semiaccurate.com/201...ge-biggest-disapointment-year/


Bewertung: 259 Punkte bei 123 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Fernstudium Informatik
Joe Cole, 12.12.2017 10:36, 1 Antworten
Hallo! habe früher als ich 13 Jahre angefangen mit HTML und später Java zu programmieren. Weit...
Installation Linux mint auf stick
Reiner Schulz, 10.12.2017 17:34, 1 Antworten
Hallo, ich hab ein ISO-image mit Linux Mint auf einem Stick untergebracht Jetzt kann ich auch...
Canon Maxify 2750 oder ähnlicher Drucker
Hannes Richert, 05.12.2017 20:14, 4 Antworten
Hallo, leider hat Canon mich weiterverwiesen, weil sie Linux nicht supporten.. deshalb hier die...
Ubuntu Server
Steffen Seidler, 05.12.2017 12:10, 1 Antworten
Hallo! Hat jemand eine gute Anleitung für mich, wie ich Ubuntu Server einrichte? Habe bisher...
Tinte sparen bei neuem Drucker
Lars Schmitt, 30.11.2017 17:43, 2 Antworten
Hi Leute, ich habe mir Anfang diesen Monats einen Tintenstrahldrucker angeschafft, der auch su...