OpenAI publie son très attendu modèle GPT-o1

OpenAI a publié aujourd'hui un aperçu de ses modèles de langage de nouvelle génération, qui, selon la société, fonctionnent mieux que ses modèles précédents, mais comportent quelques réserves.

Dans son annonce pour le nouveau modèle, o1-preview, OpenAI a vanté ses performances sur une variété de tâches conçues pour les humains. Le modèle a obtenu un score de 89e percentile dans les concours de programmation organisés par Codeforces et a répondu à 83 % des questions d'un test de qualification pour l'Olympiade internationale de mathématiques, contre 14 % de bonnes réponses pour GPT-4o.

Sam Altman, PDG d'OpenAI, a déclaré que les modèles o1-preview et o1-mini étaient le « début d'un nouveau paradigme : une IA capable de réaliser un raisonnement complexe à usage général ». Mais il a ajouté que « o1 est toujours imparfait, toujours limité, et il semble toujours plus impressionnant lors de la première utilisation qu'après y avoir passé plus de temps ».

Lorsqu’on leur pose une question, les nouveaux modèles utilisent des techniques de chaîne de pensée qui imitent la façon dont les humains pensent et la façon dont de nombreux utilisateurs d’IA générative ont appris à utiliser la technologie, en incitant et en corrigeant continuellement le modèle avec de nouvelles instructions jusqu’à ce qu’il obtienne la réponse souhaitée. Mais dans les modèles o1, des versions de ces processus se produisent en coulisses sans incitation supplémentaire. « Il apprend à reconnaître et à corriger ses erreurs. Il apprend à décomposer les étapes délicates en étapes plus simples. Il apprend à essayer une approche différente lorsque l’approche actuelle ne fonctionne pas », a déclaré l’entreprise.

Bien que ces techniques améliorent les performances des modèles sur divers tests, OpenAI a constaté que dans un petit sous-ensemble de cas, elles conduisent également les modèles o1 à tromper intentionnellement les utilisateurs. Lors d'un test portant sur 100 000 conversations ChatGPT alimentées par o1-preview, l'entreprise a constaté qu'environ 800 réponses fournies par le modèle étaient incorrectes. Et pour environ un tiers de ces réponses incorrectes, la chaîne de pensée du modèle a montré qu'il savait que la réponse était incorrecte mais l'a quand même fournie.

« Les hallucinations intentionnelles se produisent principalement lorsque o1-preview est invité à fournir des références à des articles, des sites Web, des livres ou des sources similaires qu'il ne peut pas facilement vérifier sans accès à la recherche sur Internet, ce qui amène o1-preview à inventer des exemples plausibles à la place », a écrit la société dans sa fiche système modèle.

Dans l'ensemble, les nouveaux modèles ont obtenu de meilleurs résultats que GPT-4o, le précédent modèle de pointe d'OpenAI, sur divers tests de sécurité de l'entreprise mesurant la facilité avec laquelle les modèles peuvent être jailbreakés, la fréquence à laquelle ils fournissent des réponses incorrectes et la fréquence à laquelle ils présentent des biais concernant l'âge, le sexe et la race. Cependant, l'entreprise a constaté que o1-preview était significativement plus susceptible que GPT-4o de fournir une réponse lorsqu'on lui posait une question ambiguë à laquelle le modèle aurait dû répondre qu'il ne connaissait pas la réponse.

OpenAI n'a pas divulgué beaucoup d'informations sur les données utilisées pour former ses nouveaux modèles, indiquant seulement qu'ils ont été formés sur une combinaison de données accessibles au public et de données propriétaires obtenues grâce à des partenariats.

OpenAI publie son très attendu modèle GPT-o1

Le Charles de Gaulle en mer d’Arabie : la France se positionne pour le détroit d’Ormuz

Somalie : 50 combattants al-Shabaab tués près de Baidoa

Drame aux Maldives : cinq plongeurs italiens morts dans une grotte, la sixième rescapée par un coup du sort

Guerre en Ukraine : 205 prisonniers échangés, un signal ou une illusion ?

Les Etats-Unis rejettent la proposition de paix en 14 points de l’Iran

Ebola en RDC : une épidémie qui ressurgit à l’est, aux portes de l’Ouganda

Des chercheurs australiens conçoivent une puce nanofluidique dotée d’une mémoire semblable à celle du cerveau

Australie : un nouveau virus détecté chez les chauves-souris, les scientifiques surveillent de près

Duffy relance la conquête spatiale : un réacteur nucléaire sur la Lune d’ici 2030

Égypte ancienne : pourquoi les statues d’Hatchepsout ont été détruites après sa mort

Un immense nuage de particules cosmiques bouleverse les certitudes des astronomes

Pourquoi les chauves-souris ne développent (presque) jamais de cancer — et ce que cela peut changer pour les humains

Laisser un commentaireAnnuler la réponse

Zack Snyder présente un nouveau Thor dans la bande-annonce de Twilight Of The Gods

Pas d’avions vendredi à Charleroi non plus: une nouvelle réunion prévue pour essayer de faire reprendre le dialogue entre travailleurs et direction