Réflexion sur les modèles linguistiques o1 et o3 d'OpenAI pendant 5 secondes
- En septembre 2024, l'entreprise a présenté un aperçu du modèle linguistique o1.
- OpenAI a annoncé les modèles o3 et o3-mini.
- Le modèle précédent s'appelle o1.
- L'entreprise a délibérément sauté un chiffre "par respect pour Telefonica (une entreprise de télécommunications opérant sous la marque O2) et la tradition de trouver de mauvais noms", a déclaré le PDG d'OpenAI, Sam Altman.
- Les développeurs ont formé o3 à "réfléchir" avant de répondre à une requête utilisateur.
- Le modèle répond avec un léger délai.
- Il réitère sa chaîne de raisonnement avant de donner la réponse qu'il considère la plus précise, selon TechCrunch.
- Les utilisateurs peuvent "ajuster" le temps de réflexion — plus le modèle dispose de temps, mieux il peut traiter une demande.
- Dans le test ARC-AGI, conçu pour mesurer la capacité d'une IA à apprendre des compétences au-delà de ses données d'entraînement, o3 a obtenu un score de 87,5%.
- Un score de 85% est considéré comme "au niveau humain".
- TechCrunch note que ces résultats doivent être pris avec précaution en attendant des tests externes.
- Actuellement, les deux modèles ne sont pas disponibles pour le grand public, mais seront ouverts pour des tests de sécurité publique — les chercheurs en sécurité pourront les tester.
- Selon Altman, OpenAI prévoit de sortir o3-mini d'ici la fin janvier 2025, suivi de o3.
- OpenAI a introduit l'aperçu du modèle linguistique o1 (axé sur les tâches nécessitant beaucoup de raisonnement) en septembre 2024.
- Début décembre, l'entreprise a publié la version complète de o1 et ajouté un abonnement ChatGPT Pro avec accès à une version "exclusive".