Pentium III-S et Celeron Tualatin
By Franck
Sommaire:

Celeron 1.2 Ghz : Le Test

Le Céléron 1,2GHz Tualatin succède au Céléron 1,1GHz, dernière version utilisant le core Coppermine. Depuis la version à 800MHz, le Céléron Coppermine utilise un bus à 100MHz, et les versions successives ne diffèrent que par l'augmentation de la fréquence d'horloge. Le Céléron 1,2GHz apporte quant à lui bien plus que 100MHz supplémentaires par rapport à son prédécesseur à 1,1GHz. Ces améliorations concernent essentiellement la mémoire cache L2, comme le montrent ces deux tableaux :



Céléron Coppermine


Céléron Tualatin

Le cache L2 du Céléron Tualatin utilise un cache associatif à 8 voies (contre 4 voies pour le Céléron Coppermine), rejoignant ainsi les caractéristiques du Pentium III.


Le Céléron Tualatin conserve cependant quelques caractéristiques de la famille Céléron :

  • Le bus à 100MHz.


  • Un cache à latence non nulle. Cette valeur est lue dans un registre de configuration du processeur. En réalité, Intel prétend que cette valeur ne signifie rien, et que le cache L2 du Céléron possède la même latence que celui du Pentium III. Quoiqu'il en soit, la latence du cache L2 n'est certainement pas nulle, ni même de 1 ou 2. Intel annonce une latence d'accès de 7 cycles pour le cache L2 du Pentium III. Qu'en est-il pour le Céléron ?


Afin de mesurer précisément les améliorations apportées par le Céléron Tualatin, nous avons utilisé un programme de benchmark mémoire. Ce programme effectue des lectures par paquets de 64 bits, en utilisant le jeu d'instruction MMX, et ce sur des buffers de taille croissante. On relève alors le temps pris par chaque lecture ; on en déduit les débits mémoires ainsi que les temps de latence en lecture pour chaque niveau de mémoire cache.

  • Les débits mémoires

Pour ce test, nous avons comparé les débits du Céléron Tualatin avec ceux du Céléron Coppermine dans sa version à 1GHz, tous deux montés sur une Asus TUSL2-C (chipset i815EP).

Les résultats sont les suivants :

 
Céléron Coppermine 1 Ghz
Céléron Tualatin 1,2GHz
Débit L1 (pic)
7830 Mo/s
9360 Mo/s
Débit L2 (moyen)
4292 Mo/s
5280 Mo/s
Débit mémoire (moyen)
750 Mo/s
785 Mo/s

Quelques remarques sur ces résultats :

  • Les différents niveaux de cache apparaissent clairement sur ces courbes. Le benchmark ne fait apparaître le cache L1 réservé aux données, qui correspond au premier pic de 0 à 16Ko. Le cache L2 étant unifié, il est tout entier utilisé, et il correspond au pallier allant jusqu'à 128Ko pour le Coppermine et 256Ko pour le Tualatin.


  • Les quantités de mémoire cache ne se cumulent pas, car les caches L1 et L2 sont gérés de façon inclusive. Cela revient à dire que le contenu du L1 est présent dans le L2, ce qui porte la quantité totale de mémoire cache du Céléron Tualatin à 256Ko et non à 288Ko (256+32).


  • Les débits du L1 sont très proches des valeurs théoriques pour les deux processeurs. En effet, l'unité de chargement du noyau P6 nécessite au moins 1 cycle processeur pour lire 64 bits (8 octets), ce qui nous donne les débits théoriques suivants :
    - pour le Tualatin 1,2GHz : 1200x8 = 9600Mo/s, pour une valeur lue de 9360Mo/s ;
    - pour le Coppermine 1GHz : 1000x8 = 8000Mo/s, pour une valeur lue de 7830Mo/s ;
    Ces résultats révèlent le temps de latence très faible du cache L1 en lecture, en fait très proche de zéro.


  • Bien que cadencé à la même fréquence, le cache L2 présente pour les deux processeurs des débits inférieurs. Ceci peut avoir deux origines :
    - le temps d'accès du noyau au L2 (latence) ;
    - la largeur du bus L2. Il n'est pas en cause dans ce test, car sa largeur est de 256 bits alors que 64 bits sont transférés à chaque cycle.


  • Les débits mémoires sont également très proches de leur valeur théoriques. Les deux processeurs utilisent un bus mémoire large de 64 bits et à 100MHz, ce qui donne un débit théorique maximal de 100x8 = 800Mo/s.

 

  • Les temps de latence

A partir des résultats théoriques, il est possible de déterminer la latence générée par l'accès en lecture aux différents niveaux de cache, et en particulier le L2. Nous avons comparé les deux Célérons avec un Pentium III Coppermine. Nous avons également ajouté au test un Céléron A à core Katmaï, gravé en 0,25µm et intégrant 128Ko de cache L2.

Le Pentium III Coppermine (en vert sur le graphique) affiche une latence de 7 cycles, comme annoncé par le constructeur. On constate avec surprise que le Céléron Coppermine et le Tualatin possèdent la même latence, avec même un petit avantage pour le Tualatin dont la courbe apparaît en bleu.
Le Céléron A quant à lui dépasse les 10 cycles de latence.

Il apparaît donc que le cache du Céléron Tualatin n'est plus du tout bridé, ni part la taille, ni par les temps d'accès au cache L2. Il offre même une latence légèrement inférieure à celle du Coppermine, ce que l'on peut éventuellement justifier par des temps de propagation légèrement améliorés par la finesse de gravure inférieure, et donc un temps de transmission légèrement supérieur.

 

Suite ( Pentium III-S - Le Test )

Fermer