Comment les États-Unis ont peut-être involontairement aidé à créer un monstre d'IA en Chine

Le gouvernement américain a été activement activement à limiter l’accès de la Chine aux puces semi-conductrices, un élément clé des modèles d’IA génératifs. Au lieu de cela, ces limites d’exportation peuvent avoir alimenté l’innovation qui a conduit à la R1 de Deepseek – un modèle de langue large qui perturbe l’industrie de l’IA nationale et l’économie en plein essor qui l’ont construite.

Brian Colello, analyste technologique pour Morningstar, a déclaré que la citation « les contraintes conduisaient à la créativité » venait à l’esprit.

« Ces modèles chinois ont été limités au processeur, ce qui a conduit à certaines techniques créatives en formation, et le modèle Deepseek a réalisé des performances meilleures que prévu étant donné les processeurs sur lesquels il a été formé », a-t-il déclaré à Trading Insider.

Perturbation profonde

Deepseek, une startup d’IA basée en Chine, a abandonné la version de l’application de son modèle R1 la semaine dernière. Le modèle a semblé rivaliser avec ceux des grandes entreprises technologiques américaines, comme Meta, Openai et Google – mais à un coût beaucoup plus faible.

Deepseek a déclaré avoir dépensé près de 6 millions de dollars en puissance informatique pour former son nouveau système, une fraction de ce que les entreprises technologiques américaines ont dépensées pour leurs modèles.

Deepseek a déclaré que ses modèles étaient formés avec des puces semi-conductrices moins et moins puissantes que leurs concurrents ne l’utilisent généralement.

Depuis 2022, les sanctions américaines ont rendu illégal pour la fabrication du leader Nvidia de vendre certaines de ses puces à la Chine, y compris ses puces les plus avancées. Les sanctions visaient à limiter les progrès de la Chine dans l’IA et la technologie militaire.

« Les sanctions ont forcé Deepseek à utiliser les H800, qui étaient moins puissantes que les H100 », a déclaré Patrick Moorhead, PDG de Moor Insights and Strategy, à Bi des Nvidia Chips Deepseek.

« D’une manière détournée, les sanctions initiées à l’administration Biden ont motivé Deepseek à être plus créatif dans la façon dont il a formé et a dirigé des modèles », a-t-il ajouté. « Personne ne devrait être surpris, car » la nécessité est la mère de l’invention. « »

Coûts de formation et d’informatique troubles

Certains experts et analystes qui ont parlé à BI ont exprimé le scepticisme concernant les affirmations de Deepseek sur le coût des modèles et le nombre et le type de puces sur lesquelles ils ont été construits. Cependant, on ne sait pas exactement quels semi-conducteurs ont été utilisés pour former et déployer Deepseek.

Pourtant, certains Les analystes ont déclaré que la startup a montré qu’il était possible de faire plus avec moins en ce qui concerne l’IA.

Les analystes de la Deutsche Bank, Adrian Cox et Galina Pozdnyakova, ont écrit à propos de Deepseek dans une note de recherche publiée lundi: « Ils ont dû extraire plus de valeur de leurs logiciels et des méthodes telles que le raisonnement en chaîne de pensées et l’utilisation de plusieurs modèles à la fois, au lieu de Jetez juste plus de puissance de calcul au problème. «

Chris Miller, auteur du livre de 2022 « Chip War », a déclaré que les modèles Deepseek sont impressionnants, mais que les coûts en IA sont considérablement baissés depuis 2023, donc il n’a pas trouvé le dernier article de l’entreprise particulièrement surprenant.

Il a également déclaré que l’idée que Deepseek travaillait sur un « budget de secours » n’était pas vraie, affirmant que l’entreprise utilisait une « définition très étroite des coûts de formation ». Miller a déclaré qu’il est « assez clair que le coût de formation est un ordre de grandeur plus élevé » que Deepseek l’a suggéré.

Restrictions de puces inefficaces

Alexandr Wang, PDG de Scale AI, a déclaré lors d’une interview CNBC le 23 janvier que Deepseek avait 50 000 H800, ce qui, selon Miller, serait un « nombre substantiel ». Bien que ce nombre soit encore beaucoup moins que ce que les entreprises américaines ont, a déclaré Miller, c’est, c’est Probablement beaucoup plus que les responsables des exportations américains auraient voulu qu’une seule entreprise chinoise s’accumule.

Zongyuan Zoe Liu, membre principal des études en Chine au Conseil des relations étrangères, a déclaré à BI que les développements de Deepseek suggèrent que le développement de l’IA en Chine « semble au moins à égalité avec les États-Unis ».

Cependant, elle a déclaré: « Nous sommes toujours au début de la course » pour la domination de l’IA.

« Cela rappelle certainement les décideurs américains que la restriction technologique peut ne pas fonctionner, selon l’objectif final », a déclaré Liu.

Plusieurs experts ont déclaré qu’ils pensaient que les derniers développements avec Deepseek pourraient conduire à des sanctions encore plus semi-conductrices contre la Chine, mais ne cesseraient pas nécessairement d’innovation.

« Les États-Unis pourraient exercer des sanctions en Chine toute la journée », a déclaré Colello, « mais il y a toujours la menace: et si la Chine propose de toute façon une percée? »