Asus A7N8X Deluxe

Asus A7N8X Deluxe (nForce2 SPP + MCP-T)

By Franck - 12/12/2002

Sommaire:

Tests, Benchmarks et comparatifs

Les tests ont été menés avec un FSB de précisément 168MHz, le processeur tournant donc à 2271MHz. Un petit tour dans le gestionnaire de périphériques permet de contrôler la présence des fonctionnalités offertes par la carte et par le MCP-T.

Gestionnaire de périphériques
(cliquez pour agrandir) L'Athlon XP 2800+
(cliquez pour agrandir)

Les benchmarks

Dans ce test des performances de la nForce2, nous allons mettre l'accent sur l'interface mémoire du nForce2, et plus particulièrement en mode DualDDR. En effet, alors que les excellentes performances de l'Athlon sont connues, le goulet d'étranglement de la plateforme Socket A réside bel et bien dans son architecture mémoire, notamment face à l'architecture QDR du Pentium 4. Dans un premier temps nous allons donc regarder les performances des technologies mises en avant par nVidia, puis nous comparerons les résultats obtenus à ceux du chipset concurrent du nForce2 : le VIA KT400.

Pour mesurer les performances mémoire, nous utilisons les logiciels suivants :

Le benchmark mémoire de SiSoft Sandra 2003
MBench, pour les mesures de latence et des débits en modes 32, 64 et 128 bits
WStream nous fournira les débits sur des opérations mémoires courantes.

- DualDDR

La première série de tests a été effectuée en mode synchrone (FSB et mémoire à 166MHz). Nous nous intéressons dans un premier temps à la latence d'accès à la mémoire.

La latence mémoire correspond au temps séparant une requête en lecture du processeur dans la mémoire centrale et le moment où la donnée est effectivement disponible.
Elle est mesurée statistiquement en effectuant des lectures successives dans un buffer mémoire ; afin d'être certain d'accéder à la mémoire centrale et non aux caches du processeur, l'algorithme provoque un échec de cache à chaque itération. On obtient ainsi une première valeur exprimée en cycle processeurs, convertie en temps "absolu" (en secondes, ou plus pratiquement en nano-secondes) afin de la rendre indépendante de la vitesse du processeur.

En simple ou en double channel, la latence du nForce2 est tout simplement exceptionnelle. Peu de chipsets obtiennent une latence de l'ordre de 100ns, ou alors avec de gros FSB et des timings mémoires très bas. Le nForce2 atteint ce résultat avec une mémoire certes cadencée à 166MHz, mais avec des timings assez peu performants (2.5-3-3-8). Nous constatons en outre qu'en mode DualDDR la latence diminue effectivement, bien que le gain ne soit pas phénoménal il atteint presque 6%. Cela étant, quelques ns de gagnées sur la latence peuvent augmenter de façon non négligeable les performances globales de l'interface mémoire.
Voyons maintenant les tests de débit avec Sandra et MBench.

Le test de mémoire de Sandra effectue une mesure du débit mémoire en Mo/s, et affiche des résultats entre 25 et 50% supérieurs à ceux d'autres programmes effectuant la même mesure, tels que MBench et Cachemem. Pourquoi de tels écarts ?
En réalité, le bench mémoire de Sandra utilise une technique de "block prefetching", qui consiste à précharger des blocs de mémoire dans le cache L2 du processeur. Cette technique d'optimisation est certes très efficace, mais fausse complètement la mesure : une partie des données lues pour le bench proviennent du cache du processeur et non de la mémoire.
Sandra permet d'ailleurs de désactiver cette option, bien qu'elle soit active par défaut

Les résultats chutent drastiquement pour retomber aux valeurs obtenues avec les autres benchmarks, qui correspondent davantage à la bande passante réelle.Dans ce test nous avons cependant gardé l'option, pour la simple raison que nous ne voulons pas défavoriser le test de la carte en affichant des valeurs au bench de Sandra beaucoup plus faibles que ce que l'on a l'habitude de lire. Il faut juste le savoir !

Les gains de débit mesurés sur le test mémoire de Sandra s'échellonnent entre 5 et 6,5%. Un gain assez faible, mais qui se justifie pleinement par la diminution de la latence d'accès. Regardons maintenant les résultats de débit de MBench, qui permettent d'affiner les résultats suivant la taille des données transférées (32, 64 et 128 bits) et le type d'opération (lecture ou écriture).

Les résultats en lecture 32 (INT) et 128 bits (SSE) progressent en mode DualDDR, dans des proportions comprises entre 6 et 8%.
En revanche, en mode 64 bits (MMX), on observe des résultats pratiquement identiques avec un ou deux canaux, avec même un très léger avantage en single channel. Pourquoi cela ?
La raison est à chercher du côté du processeur. En effet, c'est lors de lectures 64 bits que l'Athlon fournit la plus grande bande passante (et non en 128 bits, comme c'est le cas pour le Pentium 4). Ainsi, en mode 64 bits l'Athlon sature complètement le bus EV6, qui devient alors le goulet d'étranglement et fait plafonner les résultats. Ainsi, le bus mémoire n'est plus le facteur limitant et le mode DualDDR n'apporte rien.

Ce résultat révèle que, malgré tout l'intérêt qu'apporte le DualDDR, le bus EV6 a atteint ses limites et devient le facteur limitant de l'architecture K7, d'autant plus que la puissance des processeurs continue d'augmenter.

En écriture, les gains apportés par le DualDDR varient entre 8 et 10%.
En résumé, la technologie DualDDR apporte un surplus de bande passante mémoire de l'ordre de 8%, ce qui est loin d'être fabuleux. Il y a fort à parier que le DualDDR profite d'avantage au core graphique de la version IGP du nForce2, et l'intérêt du DualDDR sur le SPP est relativement anecdotique.

WStream mesure les performances de la mémoire sur des opérations couramment utilisées, et fournit donc un résultat un peu moins synthétique que Sandra ou MBench. Le mode DualDDR fait des merveilles, en augmentant les performances de près de 30% en moyenne.

- Fonctionnement asynchrone et DASP

Dans la seconde partie des benchs mémoire, nous allons regarder comment se comporte le mode asynchrone, en comparant trois configurations en DualDDR :

FSB à 133MHz, mémoire à 133MHz (synchrone)
FSB à 133MHz, mémoire à 166MHz (asynchrone)
FSB à 166MHz, mémoire à 166MHz (synchrone)

De plus, nous avons ajouté les résultats en 166:166 en désactivant le DASP, et ce en fixant "CPU Interface" dans le BIOS sur "optimal" au lieu de "aggressive".

Première constatation : le mode asynchrone est en effet très pénalisant sur le temps de latence, celle-ci augmente de près de 15% par rapport au mode synchronisé sur le même FSB. L'activation du DASP quant à lui diminue la latence de 10% environ, on mesure là l'efficacité des technologies nVidia : le DASP et le DualDDR font réellement des merveilles.

Après avoir vu l'effet de la désynchronisation sur la latence, les résultats de débit ne surprennent pas. Dans tous les cas, le mode synchrone 133:133 est plus rapide que le mode 133:166.
Moralité : ne pas utiliser le mode asynchrone sur le nForce2 !!

- Le nForce2 face au KT400

La plateforme nForce2 se place parmi les plateformes AMD les plus performantes du moment, nous l'avons donc comparé à son principal concurrent sur ce segment de marché, le chipset KT400 de VIA.

La plateforme de test du KT400 est la suivantes :

Asus A7V8X (VIA KT400)
Athlon XP 2800+ (2250MHz), FSB 166MHz (166x13,5)
DDR Kingmax PC2700 (333MHz), timings 2.5-3-3-8

Les performances des deux chipsets se tiennent dans un mouchoir de poche, difficile de départager les deux plateformes sur le seul débit. Notons que le KT400 s'en tire parfaitement bien face au nForce2 et son architecture DualDDR ! Comme nous l'avons vu, le DualDDR (associé au DASP) se montre particulièrement efficace au test de latence, voyons donc ce que donne MBench.

Le test de latence révèle la suprématie du nForce2 dans ce domaine : plus de 16% inférieure à celle du KT400.
Au final, le nForce2 s'avère légèrement plus rapide que le KT400, et gagne ainsi la palme du chipset le plus performant pour la plateforme Socket A.

Suite ( Prix et Conclusion )

Fermer