Réflexion sur les modèles linguistiques o1 et o3 d'OpenAI pendant 5 secondes

  • En septembre 2024, l'entreprise a présenté un aperçu du modèle linguistique o1.
  • OpenAI a annoncé les modèles o3 et o3-mini.
    • Le modèle précédent s'appelle o1.
    • L'entreprise a délibérément sauté un chiffre "par respect pour Telefonica (une entreprise de télécommunications opérant sous la marque O2) et la tradition de trouver de mauvais noms", a déclaré le PDG d'OpenAI, Sam Altman.
  • Les développeurs ont formé o3 à "réfléchir" avant de répondre à une requête utilisateur.
    • Le modèle répond avec un léger délai.
    • Il réitère sa chaîne de raisonnement avant de donner la réponse qu'il considère la plus précise, selon TechCrunch.
  • Les utilisateurs peuvent "ajuster" le temps de réflexion — plus le modèle dispose de temps, mieux il peut traiter une demande.
  • Dans le test ARC-AGI, conçu pour mesurer la capacité d'une IA à apprendre des compétences au-delà de ses données d'entraînement, o3 a obtenu un score de 87,5%.
    • Un score de 85% est considéré comme "au niveau humain".
    • TechCrunch note que ces résultats doivent être pris avec précaution en attendant des tests externes.
Une comparaison de la version d'aperçu de o1, o1, et des performances de o3 :Graphique de gauche : une compétition de mathématiquesGraphique de droite : un questionnaire avec des questions scientifiques de niveau universitaireÉchelle verticale : précision des réponses (source : OpenAI)
  • Actuellement, les deux modèles ne sont pas disponibles pour le grand public, mais seront ouverts pour des tests de sécurité publique — les chercheurs en sécurité pourront les tester.
    • Selon Altman, OpenAI prévoit de sortir o3-mini d'ici la fin janvier 2025, suivi de o3.
  • OpenAI a introduit l'aperçu du modèle linguistique o1 (axé sur les tâches nécessitant beaucoup de raisonnement) en septembre 2024.
    • Début décembre, l'entreprise a publié la version complète de o1 et ajouté un abonnement ChatGPT Pro avec accès à une version "exclusive".