4 choses que nous avons apprises de la conférence AWS d’Amazon, notamment sur son projet de supercalculateur

4 choses que nous avons apprises de la conférence AWS d'Amazon, notamment sur son projet de supercalculateur

Matt Garman, PDG d’Amazon Web Services, a fait plusieurs nouvelles annonces importantes sur AWS lors de la conférence re:Invent mardi.

Son discours d’ouverture de deux heures et demie s’est penché sur les offres et mises à jour logicielles et matérielles actuelles d’AWS, avec des propos de clients tels qu’Apple et JPMorgan. Des unités de traitement graphique (GPU), des superordinateurs et une apparition surprise d’Apple se démarquent parmi la multitude d’informations.

AWS, la branche cloud computing d’Amazon, développe ses propres semi-conducteurs pour former l’IA. Mardi, Garman a annoncé la création d’UltraServers – contenant 64 de ses puces Trainium 2 – afin que les entreprises puissent augmenter leurs charges de travail GenAI.

De plus, il construit également un supercalculateur d’IA, un UltraCluster composé d’UltraServers, en partenariat avec la startup d’IA Anthropic. Nommé Projet Rainier, ce sera « le plus grand cluster de calcul d’IA au monde signalé à ce jour disponible pour qu’Anthropic puisse construire et déployer ses futurs modèles » une fois terminé, selon un article de blog Amazon. Amazon a investi 8 milliards de dollars dans Anthropic.

De tels progrès pourraient pousser AWS davantage en concurrence avec d’autres entreprises technologiques dans la course aux armements en cours en matière d’IA, notamment le géant des puces IA Nvidia.

Voici quatre points à retenir du discours d’ouverture complet de Garman mardi.

Les puces Trainium d’AWS pourraient concurrencer Nvidia.

Nvidia domine actuellement le marché des puces IA avec ses GPU recherchés et coûteux, mais Garman a soutenu le silicium local d’AWS lors de son discours d’ouverture de mardi. L’objectif de son entreprise est de réduire le coût de l’IA, a-t-il déclaré.

« Aujourd’hui, il n’y a vraiment qu’un seul choix du côté des GPU, et c’est uniquement Nvidia. Nous pensons que les clients apprécieraient avoir plusieurs choix », a déclaré Garman au Wall Street Journal.

L’IA connaît une croissance rapide et la demande de puces qui rendent cette technologie possible est sur le point de croître parallèlement. De grandes entreprises technologiques, comme Google et Microsoft, se lancent également dans la création de puces pour trouver une alternative à Nvidia.

Cependant, Garman a déclaré au Journal qu’il ne s’attend pas à ce que Trainium détrône Nvidia « avant longtemps ».

« Mais j’espère que Trainium pourra se tailler une bonne niche dans laquelle je pense que ce sera une excellente option pour de nombreuses charges de travail – pas pour toutes les charges de travail », a-t-il déclaré.

AWS a également présenté Trainium3, sa puce de nouvelle génération.

Le nouveau supercalculateur d’AWS pourrait rivaliser avec le xAI d’Elon Musk.

Selon The Journal, le cluster de puces connu sous le nom de Project Rainier devrait être disponible en 2025. Une fois prêt, Anthropic prévoit de l’utiliser pour former des modèles d’IA.

Avec « des centaines de milliers » de puces Trainium, il défierait le Colossus d’Elon Musk, un supercalculateur doté de 100 000 puces Hopper de Nvidia.

Apple envisage Trainium 2 pour la formation Apple Intelligence.

Garman a déclaré qu’Apple est l’un de ses clients utilisant des puces AWS, comme Amazon Graviton et Inferentia, pour des services tels que Siri.

Benoit Dupin, directeur principal de l’IA et de l’apprentissage automatique chez Apple, est ensuite monté sur scène lors de la conférence de Las Vegas. Il a déclaré que l’entreprise avait travaillé avec AWS pour « pratiquement toutes les phases » du cycle de vie de son IA et de son apprentissage automatique.

« L’un des éléments uniques de l’activité d’Apple est l’échelle à laquelle nous opérons et la rapidité avec laquelle nous innovons », a déclaré Dupin.

Il a ajouté : « AWS a réussi à suivre le rythme et nous sommes clients depuis plus d’une décennie. »

Maintenant, Dupin a déclaré qu’Apple en était aux premiers stades de test des puces Trainium 2 pour potentiellement aider à former Apple Intelligence.

La société a introduit une nouvelle génération de modèles fondamentaux, Amazon Nova.

Amazon a annoncé quelques nouveaux enfants sur le bloc GenAI.

Les clients AWS pourront utiliser les applications GenAI basées sur Amazon Nova « pour comprendre des vidéos, des graphiques et des documents, ou générer des vidéos et d’autres contenus multimédias », Amazon dit. Il existe une gamme de modèles disponibles à des prix différents, précise-t-on.

« Amazon Nova Micro, Amazon Nova Lite et Amazon Nova Pro sont au moins 75 % moins chers que les modèles les plus performants dans leurs classes d’intelligence respectives dans Amazon Bedrock », a déclaré Amazon.

A lire également