OpenAI, le créateur de ChatGPT, développe une nouvelle approche pour ses modèles d’intelligence artificielle dans un projet nommé « Strawberry », selon une personne familière du dossier et des documents internes révélés hier par Reuters.
Ce projet, dont les détails n’avaient pas été dévoilés auparavant, vise à démontrer que les modèles d’OpenAI peuvent fournir des capacités de raisonnement avancées. Des équipes d’OpenAI travaillent sur Strawberry, comme le montre un document interne récent consulté par Reuters en mai. Reuters n’a pas pu déterminer la date précise de ce document, qui décrit comment OpenAI prévoit d’utiliser Strawberry pour mener des recherches. La source a confirmé que le projet est en cours de réalisation. Cependant, Reuters n’a pas pu établir à quel stade de développement se trouve Strawberry ni quand il sera disponible au public.
Le fonctionnement de Strawberry reste un secret bien gardé, même au sein d’OpenAI, selon la source. Le document décrit un projet utilisant les modèles Strawberry pour permettre à l’IA de générer des réponses aux requêtes et de planifier suffisamment à l’avance pour naviguer sur Internet de manière autonome et fiable, accomplissant ce qu’OpenAI appelle une « recherche approfondie ».
Cette capacité a échappé aux modèles d’IA jusqu’à présent, selon plus d’une douzaine de chercheurs en IA interrogés. Lorsqu’ils sont questionnés sur Strawberry, un porte-parole d’OpenAI a déclaré : « Nous voulons que nos modèles d’IA voient et comprennent le monde davantage comme nous. La recherche continue sur de nouvelles capacités d’IA est une pratique courante dans le secteur, avec la conviction partagée que ces systèmes amélioreront leur raisonnement au fil du temps. » Le porte-parole n’a pas répondu directement aux questions sur Strawberry.
Le projet Strawberry, précédemment connu sous le nom de Q*, était déjà considéré comme une avancée majeure au sein de l’entreprise, selon Reuters. Deux sources ont décrit des démonstrations de Q* plus tôt cette année, capables de répondre à des questions scientifiques et mathématiques complexes.
Lors d’une réunion interne mardi, OpenAI a montré une démonstration d’un projet de recherche présentant de nouvelles capacités de raisonnement de type humain, selon Bloomberg. Un porte-parole d’OpenAI a confirmé la réunion mais n’a pas donné de détails sur le projet présenté.
Les défis de l’IA
OpenAI espère que cette innovation améliorera considérablement les capacités de raisonnement de ses modèles d’IA. Strawberry implique une méthode spécialisée de traitement des modèles d’IA après leur pré-entrainement sur de grands ensembles de données, a déclaré la source.
Les chercheurs interrogés par Reuters estiment que le raisonnement est essentiel pour que l’IA atteigne un niveau d’intelligence humaine ou surhumaine. Bien que les grands modèles linguistiques puissent résumer des textes et composer une prose élégante rapidement, ils échouent souvent à résoudre des problèmes de bon sens, reconnaissant des erreurs logiques ou jouant au morpion.
L’amélioration du raisonnement est clé pour permettre aux modèles d’accomplir des tâches variées, de la découverte scientifique à la création de logiciels. Sam Altman, PDG d’OpenAI, a déclaré que « les domaines de progrès les plus importants concerneront la capacité de raisonnement ».
D’autres entreprises comme Google, Meta, et Microsoft expérimentent également des techniques pour améliorer le raisonnement dans les modèles d’IA, tout comme les laboratoires universitaires. Cependant, les chercheurs ne s’accordent pas sur la capacité des grands modèles linguistiques à intégrer des idées et planifications à long terme.
Ces derniers mois, OpenAI a signalé en privé aux développeurs qu’elle était sur le point de commercialiser une technologie avec des capacités de raisonnement plus avancées, selon quatre sources. Strawberry inclut une méthode spécialisée de post-formation des modèles d’IA, améliorant leurs performances après leur pré-entrainement, a indiqué une source.
Strawberry présente des similitudes avec une méthode développée à Stanford en 2022, appelée « Self-Taught Reasoner » ou « STaR ». STaR permet aux modèles d’IA de s’auto-amorcer vers des niveaux d’intelligence supérieurs en créant leurs propres données d’entraînement, potentiellement capables de dépasser l’intelligence humaine, selon Noah Goodman, l’un de ses créateurs.
OpenAI souhaite utiliser ces capacités pour mener des recherches en naviguant sur le Web de manière autonome avec l’aide d’un « CUA », ou agent utilisant un ordinateur, qui peut agir en fonction de ses découvertes. OpenAI prévoit également de tester ces capacités en effectuant des tâches d’ingénierie logicielle et d’apprentissage automatique.