Le groupe soutenu par Microsoft OpenAI a annoncé, jeudi 12 septembre 2024, le lancement de sa série « Strawberry » de modèles d’IA conçus pour passer plus de temps à traiter les réponses aux requêtes, afin de résoudre des problèmes difficiles.
Les modèles sont capables de raisonner sur des tâches complexes et peuvent résoudre des problèmes plus difficiles que les modèles précédents en sciences, en codage et en mathématiques, a déclaré la société d’IA dans un article de blog.
OpenAI a utilisé le nom de code Strawberry pour désigner le projet en interne. Tandis que les modèles annoncés jeudi ont été baptisés o1 et o1-mini. Le o1 est disponible dans ChatGPT et son API depuis jeudi soir, a indiqué la société.
Noam Brown, un chercheur d’OpenAI qui s’est concentré sur l’amélioration du raisonnement dans les modèles de l’entreprise, a confirmé dans un message sur la plateforme de médias sociaux X que les modèles étaient les mêmes que ceux du projet Strawberry.
« Je suis ravi de partager avec vous tous le fruit de nos efforts chez OpenAI pour créer des modèles d’IA capables d’un raisonnement véritablement général », a écrit M. Brown.
Dans son article de blog, OpenAI a déclaré que le modèle o1 avait obtenu un score de 83 % à l’examen de qualification pour l’Olympiade internationale de mathématiques; contre 13 % pour son modèle précédent, GPT-4o.
Le modèle a également amélioré les performances sur les questions de programmation compétitives et a dépassé la précision du niveau de doctorat humain sur une référence de problèmes scientifiques, a déclaré la société.
M. Brown a déclaré que les modèles ont pu atteindre ces résultats en incorporant une technique connue sous le nom de raisonnement par « chaîne de pensée », qui consiste à décomposer des problèmes complexes en étapes logiques plus petites.
Les chercheurs ont constaté que les performances des modèles d’IA sur des problèmes complexes tendent à s’améliorer lorsque l’approche est utilisée comme technique d’incitation. OpenAI a désormais automatisé cette capacité afin que les modèles puissent résoudre les problèmes par eux-mêmes, sans intervention de l’utilisateur.
« Nous avons entraîné ces modèles à passer plus de temps à réfléchir aux problèmes avant de réagir, comme le ferait une personne. Grâce à la formation, ils apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs », a déclaré OpenAI.
Reuters a été le premier à rendre compte des travaux d’OpenAI sur le projet de raisonnement, alors appelé Q*, en novembre 2023. Il a rapporté en juillet que le projet était devenu connu sous le nom de Strawberry.