Sam Altman pourrait avoir Siri et Alexa dans sa ligne de mire après qu'OpenAI ait déposé une demande de marque « assistant vocal numérique »
Sam Altman pourrait s'efforcer de s'attaquer aux assistants vocaux Siri d'Apple et Alex d'Amazon.
OpenAI a déposé une demande de marque pour créer des « assistants vocaux numériques » et un « moteur vocal », ce qui indique qu'il pourrait être sur le point de lancer un nouveau produit.
La demande a été déposée mardi auprès de l'Office américain des brevets et des marques, un jour après la diffusion d'une interview avec Sam Altman dans laquelle il a déclaré qu'OpenAI avait « beaucoup d'autres choses importantes à publier » avant son prochain GPT-5.
Ces fonctionnalités pourraient ne pas se concrétiser, car les entreprises déposent souvent des demandes de marque pour des idées qui ne voient jamais le jour. OpenAI devrait cependant publier une mise à niveau « sensiblement meilleure » de son modèle ChatGPT au milieu de l’année, comme l’avait précédemment rapporté Trading Insider.
Dans une interview avec le podcasteur Lex Fridman, Altman a déclaré : « Nous allons sortir un nouveau modèle incroyable cette année. Je ne sais pas comment nous l'appellerons. Nous publierons dans les mois à venir beaucoup de choses différentes, je pense qu'elles ce sera très cool. »
Il a ajouté : « Je pense qu'avant de parler d'un modèle de type GPT-5 appelé ainsi ou non appelé ainsi ou un peu pire ou un peu meilleur que ce que l'on attend d'un GPT-5, je pense que nous avons beaucoup de d'autres choses importantes à publier en premier. »
La société ne propose pas encore d'assistant vocal numérique à ses utilisateurs, bien qu'elle dispose d'une API qui convertit la parole en texte appelée TTS, selon son site Internet. Il dispose également d'un modèle de reconnaissance vocale à usage général appelé Whisper.
OpenAI a également déposé des demandes de marque pour ses futurs modèles, notamment GPT-6 et GPT-7, en octobre.
Le dossier GPT-6 comprend la simulation de conversations, le partage d'ensembles de données à des fins d'apprentissage automatique, d'analyse prédictive et « l'analyse d'algorithmes capables d'apprendre à analyser, classer et prendre des mesures en réponse à l'exposition aux données ».
La demande de marque GPT-7 couvre les logiciels utilisant l'intelligence artificielle pour la génération de musique, la conversion de fichiers texte et de données en code logiciel, ainsi que la création et la génération de code logiciel. Les deux candidatures sont toujours en cours d'examen.
Le Bureau des brevets pourrait ne pas accorder ces marques, mais, comme en février, il a rejeté les tentatives d'OpenAI de déposer la marque « GPT ». L'agence a déclaré qu'il s'agissait d'un « acronyme largement utilisé » qui est « simplement descriptif » car il signifie « transformateurs génératifs pré-entraînés ».
La demande de marque « ingénieur vocal », qui est en attente d'examen par un examinateur, entend couvrir les logiciels pour les 10 domaines suivants :
-
Créer des assistants vocaux numériques
-
Reconnaissance vocale et vocale, traitement des commandes vocales et conversion entre texte et parole
-
Traitement des commandes vocales et conversion entre texte et parole
-
reconnaissance et génération automatiques de la parole et de la voix
-
Générer des sorties vocales et audio basées sur des invites en langage naturel, du texte, de la parole, des invites visuelles, des images et/ou des vidéos
-
Génération d'audio et/ou de voix en réponse aux invites de l'utilisateur
-
Traitement du langage naturel et de la parole basé sur l'apprentissage automatique
-
Reconnaissance vocale, traduction et transcription multilingues
-
Utilisation de l'intelligence artificielle pour la conversion automatique de texte en voix et de texte en audio
-
Développement de la prestation de services vocaux
OpenAI n'a pas immédiatement répondu à une demande de commentaire de Trading Insider.
