L’industrie technologique est dans une frénésie sur Deepseek. Voici qui pourrait gagner et perdre de la progression de l’IA chinoise.

L'industrie technologique est dans une frénésie sur Deepseek. Voici qui pourrait gagner et perdre de la progression de l'IA chinoise.

Deepseek, une entreprise chinoise avec des modèles d’IA qui rivalisent avec les OpenAI à une fraction du coût, génère presque autant de prises que les jetons.

Dans toute la Silicon Valley, les dirigeants, les investisseurs et les employés ont débattu des implications de modèles aussi efficaces. Certains ont remis en question les milliers de dollars dépensés pour les infrastructures d’IA, car Deepseek affirme que ses modèles ont été formés pour une poitrine de pain relative.

« C’est fou !!!! » Aravind Srinivas, PDG de Startup Perplexity AI, a écrit en réponse à un article sur X notant que les modèles Deepseek sont moins chers et meilleurs que certaines des dernières offres d’Openai.

Les prises sur les implications de Deepseek arrivent vite et chaudes. Voici huit des plus courants.

Prendre 1: l’adoption générative de l’IA explosera

« Jevons Paradox frappe à nouveau! » Le PDG de Microsoft, Satya Nadella, a publié le X lundi matin. « Comme l’IA devient plus efficace et accessible, nous verrons son utilisation montée en flèche, en le transformant en un produit dont nous ne pouvons tout simplement pas en avoir assez. »

L’idée que, à mesure que la technologie s’améliore, qu’elle soit plus intelligente, moins chère ou les deux, elle n’apportera que de la demande exponentielle plus basée sur un principe économique du XIXe siècle. Dans ce cas, la barrière à l’entrée pour les entreprises qui cherchent à plonger leur orteil dans l’IA a été élevée. Des outils moins chers pourraient encourager plus d’expérimentation et poursuivre la technologie plus rapidement.

« Semblable à Llama, il réduit les obstacles à l’adoption, permettant à plus d’entreprises d’accélérer les cas d’utilisation de l’IA et de les déplacer dans la production. » Umesh Padval, directeur général de Thomvest Ventures, a déclaré à Trading Insider.

Cela dit, même si l’IA se développe plus vite que jamais, cela ne signifie pas nécessairement que les milliards d’investissements qui ont inondé l’espace seront payants.

Take 2: Deepseek a brisé la sagesse dominante du coût de l’IA

« Deepseek semble avoir brisé l’hypothèse que vous avez besoin de beaucoup de capitaux pour former des modèles de pointe », a déclaré Debarghya Das, un investisseur de Menlo Ventures à BI.

Le prix du modèle open source de Deepseek est compétitif – 20 à 40 fois moins cher à utiliser que les modèles comparables d’OpenAI, selon les analystes de Bernstein.

Le coût exact de la construction de modèles Deepseek est vivement débattu. Le document de recherche de Deepseek expliquant son modèle V3 répertorie un coût de formation de 5,6 millions de dollars – un nombre hardonneux pour d’autres fournisseurs de modèles de fondation.

Cependant, le même article indique que « les coûts susmentionnés comprennent uniquement la formation officielle de Deepseek-V3, à l’exclusion des coûts associés aux recherches antérieures et aux expériences d’ablation sur les architectures, les algorithmes ou les données ». Le chiffre de 5 millions de dollars n’est donc qu’une partie de l’équation.

L’écosystème technologique réagit également fortement à l’implication que l’architecture de modèle de pointe de Deepseek sera moins chère à exécuter.

« Cette percée réduit les demandes de calcul, permettant des frais plus bas – et exerçant une pression sur les titans de l’industrie comme Microsoft et Google pour justifier leur prix premium », a écrit lundi Kenneth Lamont, directeur de Morningstar, dans une note.

Il a continué à rappeler aux investisseurs qu’avec la technologie à un stade précoce, en supposant que les gagnants sont fixés.

« Les méga-tendances se déroulent rarement comme prévu, et les joueurs dominants d’aujourd’hui pourraient ne pas être les vainqueurs de demain », a écrit Lamont.

Dmitry Shevelenko, le directeur des affaires de Perplexity, un grand consommateur de modèles de calcul et de modèles existants, a conclu que les grands joueurs de la technologie devraient repenser leurs chiffres.

« Cela remet certainement en question la structure de marge qu’ils vendaient peut-être aux investisseurs », a déclaré Shevelenko à BI. « Mais en termes d’accélération du développement de ces technologies, c’est une bonne chose. » Perplexity a ajouté les modèles de Deepseek à sa plate-forme.

Prenez 3: Considérer un passage à Deepseek

Lundi, plusieurs plateformes qui fournissent des modèles d’IA aux entreprises – Groq et Liquid.ai pour n’en nommer deux – ont ajouté des modèles Deepseek à leurs offres.

Sur le relâchement interne d’Amazon, une personne a publié un mème suggérant que les développeurs pourraient laisser tomber le modèle de Claude AI d’Anthropic en faveur des offres de Deepseek. Le post comprenait une image du modèle Claude s’est déroulée.

« L’amitié s’est terminée avec Claude. Maintenant, Deepseek est mon meilleur ami. » La personne a écrit, selon une capture d’écran du Post vu par BI, qui a obtenu plus de 60 réactions emoji de collègues.

Amazon a investi des milliards de dollars dans anthropic. Le géant du cloud donne également accès aux modèles Claude via sa plate-forme de service Web Amazon. Et certains clients AWS demandent Deepseek, a signalé exclusivement.

« Nous écoutons toujours les clients pour apporter les derniers modèles émergents et populaires à AWS », a déclaré un porte-parole d’Amazon, tout en notant que les clients peuvent accéder à certains produits liés à Deepseek sur AWS en ce moment via des outils tels que le substratum rocheux.

« Nous nous attendons à voir beaucoup plus de modèles comme celui-ci – grand et petit, propriétaire et open-source – excellent à différentes tâches », a ajouté le porte-parole d’Amazon. « C’est pourquoi la majorité des clients du fondement d’Amazon utilisent plusieurs modèles pour répondre à leurs besoins uniques et pourquoi nous restons concentrés sur la fourniture de nos clients – afin qu’ils puissent facilement expérimenter et intégrer les meilleurs modèles pour leurs besoins spécifiques dans leurs applications. »

Le changement de coûts pour les entreprises créant leurs propres produits en plus des modèles de fondation est relativement faible, ce qui génère de nombreuses questions quant à savoir si Deepseek dépasse d’autres modèles de Meta, Anthropic ou Openai en popularité auprès des entreprises. (C’est déjà numéro un dans l’App Store d’Apple.)

Deepseek, cependant, appartient au Haid Flyer chinois et les mêmes préoccupations de sécurité qui obtiennent Tiktok pourraient éventuellement s’appliquer à Deepseek.

« Alors que les modèles open source comme Deepseek présentent des opportunités passionnantes, les entreprises – en particulier dans les industries réglementées – peuvent hésiter à adopter des modèles d’origine chinoise en raison des préoccupations concernant la formation des données, la confidentialité et la sécurité des données », a déclaré Padval.

Mis à part les problèmes de sécurité, les sociétés de logiciels qui vendent des API aux entreprises ont ajouté Deepseek tout au long de lundi.

Prendre 4: les joueurs d’infrastructure pourraient prendre un coup

Les sociétés d’infrastructure en tant que service, telles que Oracle, Digital Ocean et Microsoft, pourraient être dans une position précaire si les modèles d’IA plus efficaces gouvernent à l’avenir.

« La pure efficacité du cadre de formation pré et post-formation de Deepseek (si vrai) soulève la question de savoir si les hyperscaleurs et les gouvernements mondiaux, qui ont et ont l’intention de continuer à investir d’importants dollars Capex dans les infrastructures d’IA, peuvent s’arrêter pour considérer les méthodologies innovantes Cela a été révélé avec les recherches de Deepseek « , a écrit des analystes Stifel.

Si la même quantité de travail nécessite moins de calcul, ceux qui ne vendent que le calcul pourraient en souffrir, ont écrit les analystes de Barclays.

« Avec l’incertitude accrue, nous avons pu voir la pression du cours des actions parmi les trois », selon les analystes.

Microsoft et Digital Ocean ont refusé de commenter. Oracle n’a pas répondu à une demande de commentaires à temps pour publication.

Prendre 5: La mise à l’échelle n’est pas morte, elle est juste déplacée

Pendant des mois, les luminaires de l’IA, y compris le PDG de Nvidia, Jensen Huang, ont prédit un grand changement d’IA, de l’accent mis sur la formation à l’accent mis sur l’inférence. La formation est le processus par lequel les modèles sont créés tandis que l’inférence est le type de calcul qui exécute des modèles AI et des outils connexes tels que ChatGpt.

Le changement dans la part totale de l’informatique à l’inférence est en cours depuis un certain temps, mais maintenant, le changement provient de deux endroits. Premièrement, plus d’utilisateurs d’IA signifie plus de demande d’inférence. La seconde est qu’une partie de la sauce secrète de Deepseek est la façon dont l’amélioration se déroule dans le stade d’inférence. Nvidia a fait une rotation positive, via un porte-parole.

« Deepseek est un excellent progrès de l’IA et un parfait exemple de mise à l’échelle du temps de test. Le travail de Deepseek illustre comment les nouveaux modèles peuvent être créés en utilisant cette technique, tirant parti de modèles largement disponibles et de calculs entièrement conformes au contrôle des exportations », a déclaré un porte-parole de NVIDIA à BI.

« L’inférence nécessite un nombre important de GPU NVIDIA et de réseautage haute performance. Nous avons maintenant trois lois sur la mise à l’échelle: pré-formation et post-formation, qui continuent, et une nouvelle mise à l’échelle du temps de test. »

Prendre 6: Modifications open source

Selon Jack Clark, une cofondatrice anthropique plus puissante, la partie la plus sous-hypothèse des innovations de Deepseek est la facilité avec laquelle Jack Clark, un cofondateur anthropique, est facile à prendre un modèle d’IA en un modèle « de raisonnement » plus puissant, un ancien employé d’Openai, a écrit sur Deepseek dans sa newsletter Import IA lundi.

Clark a également expliqué que certaines sociétés d’IA, comme Openai, ont caché toutes les étapes de raisonnement que prennent leurs derniers modèles d’IA. Les modèles de Deepseek montrent toutes ces «chaînes de pensée» intermédiaires pour que quiconque puisse le voir et l’utiliser. Cela change radicalement la façon dont les modèles d’IA sont contrôlés, a écrit Clark.

« Certains fournisseurs comme Openai avaient précédemment choisi d’obscurcir les chaînes de la pensée de leurs modèles, ce qui rend cela plus difficile », a expliqué Clark. « Il y a maintenant un modèle de poids ouvert flottant autour d’Internet que vous pouvez utiliser pour bootstrap tout autre modèle de base suffisamment puissant pour être un raisonnement d’IA. Les capacités AI du monde entier ont juste fait un cliquet à sens unique. »

Prendre 7: les programmeurs comptent toujours

Deepseek s’est amélioré en utilisant de nouvelles méthodes de programmation, que Samir Kumar, co-fondatrice et partenaire général de la société VC Touring Capital, a vu comme un rappel que les humains codaient toujours les innovations les plus excitantes de l’IA.

Il a dit à BI que Deepseek est « un bon rappel du talent et des compétences des programmeurs hardcore de bas niveau ».

Vous avez un pourboire ou un aperçu à partager? Contactez la journaliste principale de BI, Emma Cosgrove ecosgro@businessinsider.com ou utilisez le signal d’application de messagerie sécurisé: 443-333-9088.

Contactez Pranav à partir d’un dispositif non de travail en toute sécurité sur le signal + 1-408-905-9124 ou envoyez-lui un courriel à pranavdixit@protonmail.com.

Vous pouvez envoyer un e-mail à Jyoti à jmann@businessinsider.com ou dm via x @ jyoti_mann1

A lire également