Qu’est-ce que Deepseek? Apprenez à connaître la startup chinoise qui a choqué l’industrie de l’IA

Qu'est-ce que Deepseek? Apprenez à connaître la startup chinoise qui a choqué l'industrie de l'IA

Une entreprise d’intelligence artificielle Basé en Chine a secoué l’industrie de l’IA, Envoi de certains actions technologiques américaines plongeant et élever Des questions sur la question de savoir si l’exemple des États-Unis dans l’IA s’est évaporé.

La startup chinoise, Deepseek, a dévoilé un nouveau modèle d’IA la semaine dernière qui, selon la société, est beaucoup moins cher à exécuter que les meilleures alternatives de grandes sociétés technologiques américaines comme Openai, Google et Meta.

Voici tout ce que vous devez savoir sur la nouvelle entreprise chaude.

Qu’est-ce que Deepseek?

Deepseek est une startup d’intelligence artificielle chinoise fondée en 2023.

C’est la conférence de l’industrie technologique depuis qu’elle a dévoilé un nouveau modèle d’IA phare la semaine dernière appelée R1 le 20 janvier avec une capacité de raisonnement qui, selon Deepseek, est comparable au modèle O1 d’Openai mais à une fraction du coût.

Deepseek a rendu la dernière version de son assistant AI disponible sur son application mobile la semaine dernière – et il a depuis monté en flèche pour devenir la meilleure application gratuite sur l’App Store d’Apple, versant Chatgpt.

Qui est derrière Deepseek?

Deepseek a commencé comme un projet parallèle de l’IA de l’entrepreneur chinois Liang Wenfeng, qui en 2015 a cofondé un fonds spéculatif quantitatif appelé High Flyer qui a utilisé l’IA et les algorithmes pour calculer les investissements.

Après avoir acheté des milliers de puces Nvidia, Wenfeng a commencé Deepseek en 2023 avec un financement de High-Flyer.

Le chatbot AI est accessible à l’aide d’un compte gratuit via le Web, l’application mobile ou l’API.

Pourquoi les investisseurs se préoccupent-ils de Deepseek?

Le modèle R1 de Deepseek est construit sur son modèle de base V3. La société a déclaré que le modèle V3 avait été formé sur environ 2 000 puces NVIDIA H800 à un coût global d’environ 5,6 millions de dollars.

Et bien que les coûts de formation ne soient qu’une partie de l’équation, c’est toujours une fraction de ce que les autres grandes entreprises dépensent pour développer leurs propres modèles d’IA fondamentaux. Mark Zuckerberg, par exemple, a annoncé que Meta prévoyait de dépenser plus de 60 milliards de dollars de dépenses en capital cette année alors qu’elle double sur l’IA.

Selon les analystes de Bernstein, le modèle de Deepseek est estimé à 20 à 40 fois moins cher à exécuter que les modèles similaires d’OpenAI.

Le coût déclaré relativement faible du dernier modèle de Deepseek – combiné à sa capacité impressionnante – a soulevé des questions sur la stratégie de la Silicon Valley consistant à investir des milliards dans les centres de données et l’infrastructure d’IA pour former de nouveaux modèles avec les dernières puces.

Nvidia, une entreprise qui produit les puces de grande puissance cruciales pour alimenter les modèles d’IA, a vu ses actions à la baisse lundi de près de 17%, en essuyant des centaines de milliards de sa capitalisation boursière. D’autres grandes entreprises technologiques ont également été touchées.

Deepseek a également déclaré que ses modèles étaient en grande partie formés sur des versions moins avancées et moins chères de Nvidia Chips – et puisque Deepseek semble se produire aussi bien que la concurrence, cela pourrait épeler de mauvaises nouvelles pour Nvidia si d’autres géants technologiques choisissent de réduire leur dépendance à l’égard de la Chips les plus avancés de l’entreprise.

Que disent les chefs de technologie à propos de Deepseek?

Le succès de Deepseek consiste également à faire parler les meilleurs leaders de la technologie.

Le scientifique en chef de l’IA de Meta, Yann LeCun, a cherché à tempérer la panique de certaines personnes sur la montée de Deepseek dans un post sur les fils ce week-end.

LeCun a déclaré que ce n’est pas tant que les progrès de l’IA de la Chine se déplaçaient devant les États-Unis, c’est plus que « les modèles open source dépassent les États-Unis ».

Le PDG de Microsoft Satya Nadella a également pesé sur X.

« Jevons Paradox frappe à nouveau! » Nadella a posté lundi matin, faisant référence à l’idée que l’innovation engendre la demande. « Comme l’IA devient plus efficace et accessible, nous verrons son utilisation montée en flèche, en le transformant en un produit dont nous ne pouvons tout simplement pas en avoir assez. »

Marc Andreessen, le cofondateur de la société de capital-risque de la Silicon Valley, Andreessen Horowitz, a déclaré dans un article sur les réseaux sociaux que « Deepseek R1 est le moment Sputnik de l’AI », faisant référence au satellite de l’Union soviétique qui a choqué les États-Unis et a aidé à lancer la course spatiale.

Comment Deepseek se compare-t-il à Chatgpt et quelles sont ses lacunes?

Deepseek dit que son modèle R1 rivalise avec O1 de l’Openai, le modèle de raisonnement de la société dévoilé en septembre.

Comme O1, le R1 de Deepseek prend des questions complexes et les décompose en tâches plus gérables.

La compétence de R1 dans les tâches de mathématiques, de code et de raisonnement est possible grâce à son utilisation de «pur apprentissage par renforcement», une technique qui permet à un modèle d’IA d’apprendre à prendre ses propres décisions en fonction de l’environnement et des incitations.

Semblable à Chatgpt, le R1 de Deepseek a un mode « Deepthink » qui montre aux utilisateurs le raisonnement ou la chaîne de pensée de la machine derrière sa sortie.

Tom Carter de Trading Insider a testé R1 de Deepseek et a constaté qu’il semblait capable de faire une grande partie de ce que le chat de chat peut. L’application ressemble à celle de Chatgpt, avec une interface clairsemée dominée par une zone de texte.

Cependant, l’une des rares choses que R1 est moins habile est de répondre aux questions liées aux problèmes sensibles en Chine. Par exemple, lorsque Carter a interrogé Deepseek sur le statut de Taiwan, le chatbot a tenté de ramener le sujet à « des problèmes de mathématiques, de codage et de logique », ou a suggéré que Taiwan a été une « partie intégrante de la Chine » depuis des siècles.

A lire également