Le modèle Grok 3 d'Elon Musk impressionne - mais les premières réactions suggèrent que Openai reste à venir

Elon Musk a présenté lundi Grok 3, la dernière version du chatbot de Xai, l’appelant « un ordre de grandeur plus capable » que son prédécesseur.

Certains chercheurs et experts de l’IA mettent Grok 3 lors de tests précoces – et leurs réactions initiales ont été mitigées.

Musk a affirmé que le nouveau modèle dépasse GPT-4O d’Openai et les systèmes d’IA concurrents de Google, Deepseek et Anthropic sur des références clés en mathématiques, sciences et codage.

« Nous améliorons continuellement les modèles tous les jours, et littéralement dans les 24 heures, vous verrez des améliorations », a déclaré Musk lors d’une présentation en direct sur sa plate-forme de médias sociaux X aux côtés de trois ingénieurs Xai.

Andrej Karpathy, l’informaticien qui a cofondé Openai et a précédemment dirigé les opérations de l’IA de Tesla, a déclaré dans un post lundi x que Grok 3 a réussi des tâches telles que la recherche d’informations complexes à partir d’un document de formation. Cependant, comme O1-Pro d’Openai, il a eu du mal à résoudre des planches « délicates » tic-tac-toe, a-t-il déclaré.

« L’impression dans l’ensemble que j’ai obtenu ici est que c’est quelque part autour de la capacité O1-Pro, et en avance sur Deepseek-R1, bien que nous ayons bien sûr besoin d’évaluations réelles et réelles pour examiner », a ajouté Karpathy, qui avait un accès précoce à Grok 3.

XAI a également introduit un nouvel outil pour Grok 3 appelé DeepSearch, qui vise à améliorer la recherche, le brainstorming et l’analyse des données tout en expliquant comment il traite les requêtes et formule les réponses. La startup avait travaillé sur l’outil Depuis au moins à la fin de l’année dernière, Trading Insider a rapporté pour la première fois.

Karpathy a déclaré que Deepsearch est « approximativement autour de l’offre de recherche de profondeur de Perplexity, qui est géniale, mais pas encore au niveau de la » recherche profonde « récemment publiée d’Openai, qui se sent toujours plus approfondie et fiable ».

Ethan Mollick, un professeur au École Wharton de l’Université de Pennsylvanie qui fait des recherches sur l’AI, a déclaré que, bien que Xai se soit mis à l’échelle rapidement, Grok 3 n’est pas un leader clair.

« Un modèle de frontière très solide, mais pas celui pour lequel vous cesserais d’utiliser votre modèle Frontier actuel », a écrit Mollick dans un post LinkedIn du lundi.

Il a ajouté que bien que Grok 3 surpasse certains modèles OpenAI dans des repères sélectionnés, il ne dépasse clairement pas O3 d’OpenAI.

Gary Marcus, le fondateur de l’intelligence géométrique et critique de longue date du battage médiatique de l’IA, était plus sceptique.

« Elon Musk a promis que Grok 3 serait la plus intelligente Ai de tous les temps. Spoiler Alert: ce n’était pas le cas », a écrit Marcus sur Subsk.

Il a qualifié l’événement de lancement de « copie carbone » de démos précédentes, ajoutant que bien que Grok 3 montre la progression, il n’y avait « pas de changeur de jeu » dans ses performances par rapport aux modèles OpenAI.

La karpathy était plus positive, appelant les capacités de raisonnement de Grok 3 « de pointe » et mettant en évidence sa capacité à résoudre des problèmes de codage complexes.

Musc contre Altman

Le lancement de Grok 3 survient au milieu des tensions accrues entre Musk et Sam Altman, le PDG d’Openai.

Leur rivalité s’est intensifiée ce mois-ci lorsque Musk a mené une offre non sollicitée de 97,4 milliards de dollars pour prendre le contrôle d’Openai, la société qu’il a cofondée avec Altman en 2015 avant de s’éloigner trois ans plus tard en raison de différences. La semaine dernière, le conseil d’administration d’Openai a rejeté l’offre de Musk.

Mollick a déclaré que bien que Grok 3 soit un modèle solide, Openai maintient un fort avantage dans les partenariats de l’industrie et l’adoption des entreprises.

« Je ne sais pas si Grok a une grande ouverture », a-t-il écrit.

Marcus a dit qu’Openai n’avait pas encore à s’inquiéter.

« Sam Altman peut respirer facilement pour le moment. Aucun saut majeur en avant ici », a-t-il écrit, ajoutant que la domination d’Openai dans l’accès au calcul et l’échelle de recherche reste un fossé majeur.

Musk a déclaré que Grok 3 a « plus de 10 fois » la puissance de calcul de son prédécesseur et a achevé la pré-formation début janvier.

Grok 3 se déroule immédiatement aux abonnés de X’s Premium +, avec XAI qui lance également un nouveau service d’abonnement appelé Supergrok pour les utilisateurs accédant au bot via mobile ou Grok.com.

Musk a déclaré que Xai prévoyait d’ouvrir les versions précédentes de ses modèles une fois que la dernière atteint la maturité, estimant que Grok 3 atteindra ce seuil « dans quelques mois ».

Le modèle Grok 3 d’Elon Musk impressionne – mais les premières réactions suggèrent que Openai reste à venir

Musc contre Altman

Elon Musk dit qu’il « aimerait être à nouveau ami » avec le cofondateur de Google, Larry Page, après leur dispute à propos de l’IA

Le S&P 500 est sur le point d’atteindre un nouveau sommet historique. Voici ce qui pourrait arriver ensuite.

Les immigrants ayant un privilège «zéro» font partie des meilleurs talents de la Silicon Valley, explique que l’investisseur en technologie milliardaire David Friedberg

Les actions américaines progressent alors que les investisseurs réfléchissent au calendrier de réduction des taux de la Fed

Les actions américaines chutent au milieu de données économiques plus solides et des commentaires de Powell sur les perspectives de taux

J’ai conduit une Chevrolet Equinox de 40 000 $. Ces 15 fonctionnalités en font un petit SUV parfaitement capable – et abordable –

Histoires connexes

Musc contre Altman

A lire également