in

OpenAI publie son très attendu modèle GPT-o1

OpenAI publie son très attendu modèle GPT-o1

OpenAI a publié aujourd'hui un aperçu de ses modèles de langage de nouvelle génération, qui, selon la société, fonctionnent mieux que ses modèles précédents, mais comportent quelques réserves.

Dans son annonce pour le nouveau modèle, o1-preview, OpenAI a vanté ses performances sur une variété de tâches conçues pour les humains. Le modèle a obtenu un score de 89e percentile dans les concours de programmation organisés par Codeforces et a répondu à 83 % des questions d'un test de qualification pour l'Olympiade internationale de mathématiques, contre 14 % de bonnes réponses pour GPT-4o.

Sam Altman, PDG d'OpenAI, a déclaré que les modèles o1-preview et o1-mini étaient le « début d'un nouveau paradigme : une IA capable de réaliser un raisonnement complexe à usage général ». Mais il a ajouté que « o1 est toujours imparfait, toujours limité, et il semble toujours plus impressionnant lors de la première utilisation qu'après y avoir passé plus de temps ».

A Lire aussi  Comment et pourquoi le caméo surprise d'Alien : Romulus a eu lieu

Lorsqu’on leur pose une question, les nouveaux modèles utilisent des techniques de chaîne de pensée qui imitent la façon dont les humains pensent et la façon dont de nombreux utilisateurs d’IA générative ont appris à utiliser la technologie, en incitant et en corrigeant continuellement le modèle avec de nouvelles instructions jusqu’à ce qu’il obtienne la réponse souhaitée. Mais dans les modèles o1, des versions de ces processus se produisent en coulisses sans incitation supplémentaire. « Il apprend à reconnaître et à corriger ses erreurs. Il apprend à décomposer les étapes délicates en étapes plus simples. Il apprend à essayer une approche différente lorsque l’approche actuelle ne fonctionne pas », a déclaré l’entreprise.

Bien que ces techniques améliorent les performances des modèles sur divers tests, OpenAI a constaté que dans un petit sous-ensemble de cas, elles conduisent également les modèles o1 à tromper intentionnellement les utilisateurs. Lors d'un test portant sur 100 000 conversations ChatGPT alimentées par o1-preview, l'entreprise a constaté qu'environ 800 réponses fournies par le modèle étaient incorrectes. Et pour environ un tiers de ces réponses incorrectes, la chaîne de pensée du modèle a montré qu'il savait que la réponse était incorrecte mais l'a quand même fournie.

A Lire aussi  Apple abandonne la fonction oxygène sanguin sur ses montres pour échapper à l'interdiction d'importation

« Les hallucinations intentionnelles se produisent principalement lorsque o1-preview est invité à fournir des références à des articles, des sites Web, des livres ou des sources similaires qu'il ne peut pas facilement vérifier sans accès à la recherche sur Internet, ce qui amène o1-preview à inventer des exemples plausibles à la place », a écrit la société dans sa fiche système modèle.

Dans l'ensemble, les nouveaux modèles ont obtenu de meilleurs résultats que GPT-4o, le précédent modèle de pointe d'OpenAI, sur divers tests de sécurité de l'entreprise mesurant la facilité avec laquelle les modèles peuvent être jailbreakés, la fréquence à laquelle ils fournissent des réponses incorrectes et la fréquence à laquelle ils présentent des biais concernant l'âge, le sexe et la race. Cependant, l'entreprise a constaté que o1-preview était significativement plus susceptible que GPT-4o de fournir une réponse lorsqu'on lui posait une question ambiguë à laquelle le modèle aurait dû répondre qu'il ne connaissait pas la réponse.

A Lire aussi  Un patient atteint de la fièvre de Lassa est décédé en Angleterre

OpenAI n'a pas divulgué beaucoup d'informations sur les données utilisées pour former ses nouveaux modèles, indiquant seulement qu'ils ont été formés sur une combinaison de données accessibles au public et de données propriétaires obtenues grâce à des partenariats.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

GIPHY App Key not set. Please check settings

Zack Snyder présente un nouveau Thor dans la bande-annonce de Twilight Of The Gods

Zack Snyder présente un nouveau Thor dans la bande-annonce de Twilight Of The Gods

Pas d’avions vendredi à Charleroi non plus: une nouvelle réunion prévue pour essayer de faire reprendre le dialogue entre travailleurs et direction

Pas d’avions vendredi à Charleroi non plus: une nouvelle réunion prévue pour essayer de faire reprendre le dialogue entre travailleurs et direction