Cette démo Deepseek montre à quel point le modèle d’IA chinois est bon en mathématiques et en raisonnement
Deepseek chinois AI Deepseek a récemment publié des modèles AI qui correspondent ou dépassent certaines des meilleures offres de la Silicon Valley.
Deepseek utilise une approche appelée temps de test ou calcul du temps d’inférencequi coupe les interrogations en tâches plus petites, en transformant chacun en une nouvelle invite que le modèle s’attaque. Chaque étape nécessite l’exécution d’une nouvelle demande, connue sous le nom de stade d’inférence dans l’IA.
Trading Insider a récemment testé l’un des modèles de Deepseek en utilisant son mode Deepthink, qui montre aux utilisateurs à chaque étape de son processus de réflexion.
Nous avons donné au modèle un problème de mathématiques en plusieurs étapes qui a été suggéré par Charlie Snell, chercheur en IA à UC Berkeley.
Snell a déclaré que Deepseek fonctionne bien sur des problèmes mathématiques complexes qui doivent être résolus en pensant plus longtemps et en étapes. Le chercheur a choisi des problèmes de l’American Invitational Mathematics Examination, un test difficile pour les whizz en mathématiques du secondaire.
« Je pose des questions dans le modèle Deepseek », a déclaré Snell à BI dans une interview. « J’ai lu la chaîne de pensée. C’était compréhensible. »
Une démo profonde
Voici le problème des mathématiques que Snell a suggéré pour la démo Deepseek de BI: « Trouvez une séquence de +, -, /, * qui peut être appliquée aux numéros 7, 3, 11, 5 pour atteindre 24, où chacun des nombres donnés est utilisé Exactement une fois. «
BI a mis cette invite dans la fenêtre de chat de Deepseek sur son site Web. Le modèle a répondu initialement en présentant le défi à venir.
« Très bien, j’ai donc ce problème ici: j’ai besoin d’utiliser les numéros 7, 3, 11 et 5, et les combiner avec les opérations d’addition, de soustraction, de multiplication et de division, en utilisant chaque numéro exactement une fois, pour obtenir à 24« Il a répondu. »À première vue, cela semble un peu délicat, mais je pense qu’avec une pensée systématique, je peux le comprendre. «
Il a ensuite traversé plusieurs étapes sur environ 16 pages de discussion qui comprenaient des calculs et des équations mathématiques. Le modèle s’est parfois trompé, mais il a repéré cela et n’a pas abandonné. Au lieu de cela, il est rapidement parti pour essayer une autre solution possible, puis une autre.
« Presque s’est rapproché avec 33/7 * 5 ≈ 23,57, mais pas tout à fait 24. Peut-être que j’ai besoin d’essayer une approche différente», A écrit à un moment donné.
Plus tard, le modèle Deepseek semblait se capter de répéter une solution potentielle.
« Attends, j’ai déjà fait celui-là,« Le modèle a écrit. »D’accord, je dois peut-être envisager d’utiliser la division d’une manière différente.«
Après quelques minutes, il a trouvé la bonne réponse.
« Vous pouvez le voir essayer différentes idées et revenir en arrière », a déclaré Snell. Il a souligné cette partie de la chaîne de pensée de Deepseek comme particulièrement remarquable:
« Cela prend vraiment du temps. Peut-être que j’ai besoin de considérer une stratégie différente« Le modèle d’IA a écrit. »Au lieu de combiner deux nombres à la fois, je devrais peut-être chercher un moyen de les regrouper différemment ou d’utiliser les opérations de manière imbriquée.«
