Le fabricant de ChatGPT, OpenAI, a annoncé, lundi 13 mai 2024, qu’il lancerait un nouveau modèle d’IA appelé GPT-4o, capable d’une conversation vocale réaliste et capable d’interagir à travers le texte et l’image. Sa dernière initiative pour rester en tête dans la course à la domination du marché technologique émergent.
De nouvelles capacités audio permettent aux utilisateurs de parler à ChatGPT et d’obtenir des réponses en temps réel sans délai, ainsi que d’interrompre ChatGPT pendant qu’il parle, deux caractéristiques des conversations réalistes que les assistants vocaux IA ont trouvé difficiles, ont montré les chercheurs d’OpenAI lors d’un événement en direct.
« Cela ressemble à l’IA des films… Parler à un ordinateur ne m’a jamais semblé vraiment naturel; maintenant c’est le cas », a écrit Sam Altman, PDG d’OpenAI, dans un article de blog.
Microsoft soutenu par OpenAI, fait face à une concurrence et à une pression croissante pour élargir la base d’utilisateurs de ChatGPT, son produit chatbot populaire qui a séduit le monde entier par sa capacité à produire un contenu écrit de type humain et un code logiciel de premier ordre.
Lors de l’événement en direct, les chercheurs d’OpenAI ont présenté les nouvelles capacités d’assistant vocal de ChatGPT. Dans une démo, ChatGPT a utilisé ses capacités visuelles et vocales pour expliquer à un chercheur la résolution d’une équation mathématique sur une feuille de papier.
Dans une autre démonstration, les chercheurs ont montré la capacité du modèle GPT-4o à traduire des langues en temps réel.
Les démonstrations d’OpenAI frôlaient la science-fiction, avec ChatGPT et son interlocuteur se livrant à un moment donné à des plaisanteries coquettes. Le chercheur d’OpenAI a déclaré au chatbot qu’il était de bonne humeur car il démontrait « à quel point vous êtes utile et incroyable ».
ChatGPT a répondu : « Oh, arrête ça ! Tu me fais rougir! »
Mira Murati, directrice de la technologie d’OpenAI, a déclaré lors de l’événement que le nouveau modèle serait proposé gratuitement car il est plus rentable que les modèles précédents de l’entreprise. Les utilisateurs payants de GPT-4o auront des limites de capacité plus élevées que les utilisateurs gratuits de l’entreprise, a-t-elle déclaré. Le modèle GPT-4o sera disponible dans ChatGPT au cours des prochaines semaines, a précisé la société.