OpenAI lance Operator, son premier agent IA capable de réserver des réservations, de voyager et d’acheter des produits

OpenAI lance Operator, son premier agent IA capable de réserver des réservations, de voyager et d'acheter des produits

Les experts prédisaient que 2025 serait l’année où les agents d’IA se généraliseraient, et OpenAI répond à ces prévisions.

Jeudi, OpenAI a dévoilé Operator, un système qui peut utiliser un navigateur Web pour effectuer des tâches telles que réserver des réservations de voyage et acheter des produits.

Alors que les chatbots comme le populaire ChatGPT d’OpenAI utilisent l’IA générative pour répondre aux requêtes, Operator est un agent conçu pour effectuer des tâches de manière autonome.

OpenAI a déclaré qu’Operator serait disponible jeudi aux États-Unis pour les utilisateurs de ChatGPT Pro, un forfait mensuel de 200 $ qui donne accès à ses derniers modèles, dont o1. Dans les mois à venir, a indiqué la société, il sera également mis à la disposition des abonnés de ChatGPT Plus, le niveau d’abonnement mensuel de 20 $ d’OpenAI, ainsi que des utilisateurs d’autres pays.

Lors d’une diffusion en direct annonçant Operator jeudi, le PDG d’OpenAI, Sam Altman, a qualifié la version de « premier aperçu de la recherche », ajoutant qu’elle serait affinée au cours des prochains mois. Il a déclaré qu’OpenAI aurait également davantage d’agents à lancer.

L’interface est similaire à ChatGPT. Les utilisateurs demandent à l’opérateur une demande, telle que « réserver une réservation pour un dîner à 19 heures ». Ils peuvent sélectionner un site Web spécifique via lequel ils souhaitent traiter la demande, comme OpenTable, ou envoyer la demande via un moteur de recherche comme Google.

Operator résume son processus de raisonnement dans une barre latérale afin que les utilisateurs puissent identifier les étapes où il commet des erreurs, ce qu’OpenAI dit être toujours enclin à faire.

Les utilisateurs peuvent également télécharger une photo d’une liste d’épicerie manuscrite et inviter l’opérateur à acheter les articles de la liste.

Les utilisateurs peuvent choisir un site spécifique, tel qu’Instacart, sur lequel l’opérateur pourra acheter ses produits d’épicerie. Si aucun site n’est sélectionné, il s’agira par défaut d’un moteur de recherche.

Reiichiro Nakano, membre du personnel technique de l’entreprise, a déclaré dans le livestream qu’Operator était alimenté par CUA, un nouveau modèle construit sur GPT-4o.

Il est « entraîné à utiliser et à contrôler un ordinateur de la même manière que les humains, en regardant simplement l’écran et en utilisant une souris et un clavier pour le contrôler », a-t-il déclaré.

Nakano a déclaré que le modèle contournait le besoin d’API, des mécanismes qui permettent aux composants logiciels de communiquer entre eux, et « déverrouille une toute nouvelle gamme de logiciels que nous pouvons utiliser et qui étaient auparavant inaccessibles ».

Il a ajouté que le modèle supprimait « un goulot d’étranglement supplémentaire sur notre chemin vers l’AGI », ou intelligence artificielle générale.

Pourtant, Operator a encore du chemin à parcourir avant de correspondre à la capacité des humains à naviguer sur le Web.

OpenAI a déclaré que dans une évaluation mesurant la manière dont les agents d’IA naviguent dans les systèmes d’exploitation courants, comme le système d’exploitation open source Linux, Operator a obtenu un score de 38,1 %, contre 72,4 % pour les humains. Dans un autre benchmark mesurant la manière dont les agents IA naviguent sur les sites Web courants, Operator a obtenu un score de 58,1 %, contre 78,2 % pour les humains.

A lire également