Cinq faits concernant le programme DOJO de Tesla

Lors de la première Journée de l’IA, Tesla a enfreint toutes les lois et défié toutes les normes industrielles reconnues en matière de construction d’un ordinateur. La présentation était quelque peu technique, et les personnes qui la faisaient ont peut-être oublié de considérer que tout le monde n’est pas totalement instruit en matière de conception et d’ingénierie des microprocesseurs.

Une présentation technique

La présentation était similaire à celle du Battery Day. Cependant, la Journée de l’autonomie a été conçue pour piquer l’intérêt des nerds de la technologie, et faciliter le recrutement de professionnels de l’industrie. Il est donc probable que cela ait été fait exprès.

La pile de GPU Tesla

Au cas où cela ne serait pas déjà évident, Tesla a construit l’un des superordinateurs les plus puissants au monde en utilisant des GPU fabriqués par NVIDIA. Ils y font référence sous le nom de pile GPU, et une fois que Tesla Dojo sera opérationnel, ils prévoient que leurs programmeurs voudront la désactiver et ne plus jamais l’utiliser. Au cours de la présentation, ils ont déclaré que le nombre de GPU est « plus important que les 5 premiers superordinateurs du monde ».

Le Dojo

Par conséquent, à première vue, on pourrait croire qu’il s’agit du superordinateur le plus puissant du monde, avec une puissance de traitement de 1,1 exaflops. Néanmoins, Tesla a été un peu trompeur sur les chiffres, et le Dojo sera, en fait, le sixième ordinateur le plus puissant du monde. Le « Fugaku », situé à Kobe, au Japon, est le superordinateur le plus puissant du monde à l’heure actuelle. Il a un record mondial de 442 Petaflops, ce qui est trois fois plus rapide que le « Summit » du Tennessee, situé aux États-Unis d’Amérique, qui a 148,6 Petaflops.

Tout savoir sur le programme Dojo

Structure interne

Tout ordinateur moderne est équipé d’une unité centrale de traitement (CPU) ; dans certains cas, un serveur d’entreprise peut avoir deux CPU. Le CPU se trouve sur une carte mère, qui abrite également la mémoire vive (mémoire temporaire rapide de 8 à 16 Go dans les ordinateurs portables et de bureau de haute qualité).

Lire également : Pourquoi Hertz a bien joué ? (+ Vidéo)

Enfin, l’ordinateur dispose d’un bloc d’alimentation qui envoie de l’électricité dans la carte mère pour alimenter le reste des composants. La majorité des ordinateurs de bureau grand public sont équipés d’une unité de traitement graphique (GPU) dédiée, tandis que la grande majorité des CPU grand public comprennent également une carte graphique intégrée.

Wafer et rendement des wafers

Je dois fournir une explication concernant la méthode de construction typique des CPU, et des cartes graphiques. Tous les composants, comme les transistors, ne sont pas ajoutés à chaque processeur individuel. Ils sont fixés au processeur, alors qu’ils sont encore contenus dans une plaquette (wafer).

Ensuite, la tranche est découpée en plusieurs parties, et chacune de ces parties est transformée en un CPU ou GPU distinct. La rendement de la puce n’est pas toujours optimale et, par conséquent, il arrive fréquemment que certains processeurs ne fonctionnent pas du tout ou seulement partiellement. Un faible rendement des wafers est le terme le plus couramment utilisé pour caractériser ce problème dans l’industrie.

Comment cela fonctionne

Malheureusement, le pipeline de données de Tesla est un secret commercial. Or, pour comprendre le fonctionnement précis du supercalculateur Dojo, une connaissance assez précise de cette infrastructure est, pour le moins malheureusement nécessaire.
Toutefois, d’après les connaissances limitées auxquelles a accès le public, il semble que le processus fonctionne de la manière suivante : lorsque vous utilisez l’IA et qu’elle commet des erreurs (i.e. elle ne fonctionne pas comme elle le devrait), elle prend note de cette erreur et la corrige, afin d’améliorer le processus dans son ensemble.

Lire également : Quelle est la plus puissante Tesla ?

En savoir plus en anglais sur le programme Dojo

BREAKING: Hot Chips 34 got an exclusive new look at the @Tesla Dojo Supercomputer & the Dojo Chip! TONS great info:

• DOJO is a large-scale distributed system: One exa-pod has more than 1,000,000 CPUs
• DOJO relies less on local storage and more on fast data movement

1/4 pic.twitter.com/mm7NayFzVO
— Sawyer Merritt (@SawyerMerritt) August 24, 2022