Vidéos overclocking.com
Du côté de NVIDIA, les choses avancent concernant Vera Rubin, la future génération de puce à destination du secteur de l’intelligence artificielle. Effectivement, suite à l’annonce de ses résultats financiers, lors d’une conférence téléphonique, Colette Kress, directrice financière, indiquait que les premiers échantillons étaient expédiés aux clients de l’entreprise.
Vera Rubin : les premiers échantillons expédiés !
Avec cette génération, on s’attend donc à des solutions très performantes puisque ces dernières sont censées faire le même travail que Blackwell, mais avec le quart des GPU requis. Une autre donnée intéressante est mentionnée et elle concerne le facteur financier puisque Vera Rubin permettrait de diviser par 10 les coûts en inférence.
Pour le moment, ces GPU ne sont pas disponibles à l’achat, mais la marque commence à envoyer quelques échantillons de ses racks VR200 à quelques clients. Cela prend la forme d’échantillon et nous imaginons que cela permet de les mettre à l’épreuve en condition réelle et de collecter les premiers retours d’expérience.
Pour rappel, cette plateforme est constituée de plusieurs éléments. En effet, nous retrouvons un GPU Rubin couplé à un CPU Vera. Le GPU est hors norme puisqu’il est constitué de deux chiplet de taille réticule… Et il envoie ! Les verts annoncent des performances de 50 PFLOPS en FP4, soit une capacité doublée pour le superchip qui dispose de deux GPU. Du côté de la mémoire, on parle de 288 Go de HBM4 répartis dans huit stack de mémoire. Cela nous fait donc 576 Go pour un superchip. Notons également que les GPU communiqueront les uns avec les autres grâce au NVLink 6 et c’est sans parler des autres modes de communication à forte bande passante intégrés aux racks permettant une diminution de la
Pour aller plus loin, lisez cet article - Un contenu original publié sur ce site

