Pentium III-S et Celeron Tualatin
By Franck
Sommaire:

Le Core Tualatin


Le tableau ci-dessous compare les caractéristiques techniques des trois versions desktop du Tualatin à celles des Céléron et Pentium III Coppermine :

Céléron Coppermine
Céléron Tualatin
Pentium III Coppermine
Pentium III Tualatin
Pentium III-S Tualatin
Core
P6
P6
P6
P6
P6
Gravure
0.18µ
0.13µ
0.18µ
0.13µ
0.13µ
Voltage nominal
1.6 à 1.75v
1.475v
1.65 à 1.75v
1.475v
1.45v
Dissipation (W)
26.7W@1 Ghz
29.9W@1.2 Ghz
33W@1.1 Ghz
29.1W@1.13 Ghz
27.9W@1.13 Ghz
Taille L1
16 + 16
16 + 16
16 + 16
16 + 16
16 + 16
Taille L2
128 Ko (4 way)
256 Ko (8 way)
256 Ko (8 way)
256 Ko (8 way)
512 Ko (8 way)
Latence L2 (MSR)
1 ou 2
1
0
0
0
Largeur du bus L2
256 bits
256 bits
256 bits
256 bits
256 bits
Data Prefetch Logic
non
oui
non
oui
oui
Nb de Transistors
28.1 M (*)
44 M (**)
28.1 M
44 M (**)
44 M
Bus
AGTL+
AGTL
AGTL+
AGTL
AGTL


* Bien que disposant de moins de cache, le Céléron Coppermine possède le même nombre de transistors que le Pentium III. 128Ko des 256 sont désactivés.

** d'après le site sandpile.org, toutes les versions du Tualatin intègrent 44 millions de transistors. Les versions à 256Ko de cache auraient 256Ko de cache présent mais inactif.

Voyons en détail les points communs et les différences entre les deux générations.

  • Le noyau (unités de calcul et cache L1)

Le Tualatin conserve le noyau commun à toute la gamme Pentium III ; c'est un noyau RISC comportant cinq ports (ou pipelines) à 10 niveaux de profondeur, et intégrant des unités de calcul entières, flottantes, MMX et SSE (voir schéma ci-dessous).
Le cache L1 totalise 32Ko, répartis en 16Ko pour les données et 16Ko pour les instructions, tous deux étant de type associatif à 4 voies, avec des lignes de cache d'une longueur de 32 octets.

 

Port Execution units
0
  • Integer Unit (ALU)
  • Floating Point Unit (FPU)
  • Address Generation Unit (AGU)
  • MMX Integer Unit (ALU) · MMX Multiplier Unit
  • SSE Multiply, Divide, Square Root, Move Unit (PFMULT)
1
  • Integer Unit
  • MMX Integer Unit (ALU)
  • MMX Shift Unit
  • SSE Add Unit (PFADDER), Shuffle Unit (PFSHUFF) and Reciprocal and Reciprocal Square Root Unit (PFROM)
2 Load Unit
3 Store Address Calculation Unit
4 Store Data Unit
Les cinq pipelines composant le noyau du P!!!


  • Le cache L2

Le cache de second niveau des Tualatins bénéficie de la technologie ATC (Advanced Transfer Cache) inaugurée sur le Coppermine. Il s'agit d'un cache intégré au noyau, et donc fonctionnant à la même vitesse que celui-ci. Il est de type inclusif et communique avec le noyau par un bus large de 256 bits.

Le Tualatin possède en plus un mécanisme de préchargement des données, appelé Data Prefetch Logic, hérité de l'architecture NetBurst du Pentium 4. L'idée consiste à utiliser une partie de la bande passante mémoire afin de remonter des données depuis la mémoire centrale vers la mémoire cache.
A la différence du prefetch logiciel (le jeu d'instruction SSE possède en effet quatre instructions de préchargement de données qui différent selon les niveaux de caches concernés), le prefetch hardware se base sur des modèles prédéfinis pour déclencher le préchargement, et il ne concerne que le cache de niveau 2. De plus, il permet de précharger du code aussi bien que des données, ce qui n'est pas possible de façon logicielle. Un autre avantage de ce mécanisme tient dans son automatisme, c'est-à-dire qu'il fonctionne sur les applications existantes, à la différence du préchargement logiciel qui ne fonctionne que dans les applications utilisant les instructions spécifiques.
Il reste que le DPL est un mécanisme délicat à mettre en pratique, car il peut être un gros consommateur de bande passante mémoire. Un mauvais usage entraîne à coup sûr l'effet inverse de celui désiré, à savoir une baisse des performances globales. Pour cette raison, le préchargement hardware ne se déclenche que dans certains cas précis et prédéfinis, et uniquement si le bus mémoire n'est pas déjà saturé.

L'efficacité du DPL est d'autant plus importante que la bande passante mémoire est grande. La technologie " Hyper Pipelined " du Pentium 4 et son débit de 3,2Go/s (maximum théorique) offre une bande passante suffisante pour une bonne efficacité du DPL, mais on peut se poser des questions sur son intérêt (et son efficacité) sur le bus AGTL+ à 1,06Go/s du Pentium III Tualatin.

  • Au rayon " divers " …

Autre ajout du Tualatin, mais anecdotique celui-ci : le " processor name string ", déjà présent sur le Pentium 4, et qui est une chaîne de caractère codée dans le processeur et contenant son nom et sa fréquence. A titre d'exemple, le Céléron affiche " Intel(R) Céléron(TM) CPU 1200MHz ".
Son rôle est double : faciliter l'identification du processeur dans les programmes, et également éviter le remarquage (bien que cela soit rendu bien plus difficile maintenant que les coefficients multiplicateurs sont bloqués). A la différence de l'Athlon, le PNS n'est pas reprogrammable sur les processeurs Intel.



Suite ( Celeron 1.2 Ghz Tualatin - Le Test )

Fermer