- ← Retour aux ressources
- /GPT-4 : L'IA Qui a Réussi l'Examen du Barreau et Tout Changé
GPT-4 : L'IA Qui a Réussi l'Examen du Barreau et Tout Changé
Le 14 mars 2023, OpenAI a publié GPT-4. Il pouvait voir des images, a réussi des examens professionnels et établi un nouveau standard pour l'intelligence IA.
Le 14 mars 2023, OpenAI a publié GPT-4. L'annonce incluait un détail qui a fait que tout le monde s'arrête et relise : GPT-4 avait obtenu le 90e centile à l'examen du barreau. Pas un test d'entraînement—le vrai examen que les avocats passent pour pratiquer le droit.
Le prédécesseur de ChatGPT, GPT-3.5, a obtenu le 10e centile. En quelques mois, l'IA était passée de « passe à peine » à « haut de la classe ».
Ce n'était pas une amélioration incrémentale. C'était un bond.
Le Développement Silencieux
Contrairement au lancement surprise de ChatGPT, GPT-4 était en développement depuis des mois avec des testeurs sélectionnés sous NDA stricts.
Des entreprises comme Morgan Stanley, Khan Academy et Duolingo construisaient sur GPT-4 en secret. Ils savaient que quelque chose de grand arrivait.
OpenAI a appris de l'explosion virale chaotique de ChatGPT. Cette fois, ils se sont préparés soigneusement. Tests red-team, évaluations de sécurité et annonces de partenariat étaient tous prêts avant la révélation publique.
Les Grandes Révélations
GPT-4 a apporté plusieurs percées qui ont redéfini ce que l'IA pouvait faire.
1. Vision Multimodale
La capacité nouvelle la plus dramatique : GPT-4 pouvait voir et comprendre les images.
Vous pouviez lui montrer une photo et poser des questions. Télécharger un croquis de mise en page de site web, et il générait le code. Prendre une photo du contenu de votre réfrigérateur, et il suggérait des recettes.
Cela ouvrait des cas d'usage entièrement nouveaux. L'IA n'était plus juste du texte.
2. Contexte Plus Long
GPT-4 pouvait gérer 32 000 tokens—environ 25 000 mots ou 50 pages de texte. Vous pouviez lui donner des documents entiers, de longs articles ou des bases de code et poser des questions dessus.
La limite précédente de 4 000 tokens (environ 3 000 mots) avait été une contrainte majeure. GPT-4 a brisé ce plafond.
3. Amélioration Dramatique du Raisonnement
Les résultats de benchmark étaient stupéfiants :
- Examen du Barreau : 90e centile (monté du 10e)
- SAT Maths : 700/800 (89e centile)
- SAT Lecture/Écriture : 710/800 (93e centile)
- AP Biologie : 5/5
- AP Calcul BC : 4/5
Ce n'étaient pas des exemples sélectionnés. GPT-4 performait constamment au niveau expert humain ou au-dessus à travers les tests standardisés.
4. Hallucinations Réduites
GPT-4 était 40% moins susceptible d'inventer des faits comparé à GPT-3.5. Il était encore imparfait, mais l'amélioration était notable.
Pour les cas d'usage professionnels où la précision compte, c'était crucial.
Les Applications Réelles
Dans les heures suivant la publication de GPT-4, les développeurs ont commencé à partager ce qu'ils avaient construit.
Khan Academy a démontré Khanmigo, un tuteur IA propulsé par GPT-4 qui pouvait expliquer des concepts, répondre aux questions et s'adapter au niveau de l'étudiant.
Be My Eyes a montré comment GPT-4 pouvait décrire des images pour les utilisateurs aveugles et malvoyants, lire des étiquettes, naviguer dans les espaces et identifier des objets.
Duolingo a introduit la pratique conversationnelle avec des personnages IA propulsés par GPT-4, rendant l'apprentissage des langues plus interactif.
Ce n'étaient pas des démos—c'étaient de vrais produits que les gens pouvaient utiliser immédiatement.
L'Onde de Choc Concurrentielle
La publication de GPT-4 a fait se précipiter les concurrents.
Google venait de lancer Bard une semaine plus tôt. Soudainement, Bard semblait dépassé. Google s'est précipité pour répondre, mais ils ont été pris au dépourvu.
Microsoft, qui avait investi 10 milliards $ dans OpenAI, a immédiatement intégré GPT-4 dans Bing et a commencé à le déployer dans toute sa suite de produits.
Anthropic, le principal concurrent d'OpenAI axé sur la sécurité IA, a accéléré le développement de Claude. La pression était là pour rattraper.
L'Histoire des Coulisses
Ce que beaucoup de gens ne savaient pas : GPT-4 était terminé depuis des mois avant la publication.
OpenAI a passé environ six mois sur les tests de sécurité, la recherche d'alignement et le red-teaming. Ils voulaient comprendre les capacités et risques de GPT-4 avant de le déchaîner publiquement.
Ce délai a frustré certains qui voulaient la technologie immédiatement. Mais il a établi un précédent : les systèmes IA les plus capables méritaient une évaluation attentive avant déploiement.
La Stratégie d'Accès
GPT-4 a lancé exclusivement pour les abonnés ChatGPT Plus (20$/mois) et les clients API.
C'était intelligent pour plusieurs raisons :
Capacité serveur : Limiter l'accès empêchait le système d'être submergé Revenus : Les frais d'abonnement finançaient les coûts de calcul massifs Positionnement : GPT-4 devenait une fonctionnalité premium valant la peine de payer
Les utilisateurs gratuits de ChatGPT pouvaient voir ce qui leur manquait mais devaient payer pour y accéder. Beaucoup sont passés à Plus juste pour GPT-4.
Les Limitations que Tout le Monde a Découvertes
Malgré les améliorations, GPT-4 n'était pas parfait.
Il hallucinait encore des faits occasionnellement. Il luttait encore avec les maths complexes multi-étapes. Il avait encore des problèmes de date limite de connaissance (données d'entraînement terminées en septembre 2021).
Les capacités de vision, bien qu'impressionnantes, étaient limitées. Vous ne pouviez pas télécharger de vidéos. L'analyse d'image en temps réel n'était pas possible.
Et il était plus lent que GPT-3.5. Plus capable, mais aussi plus coûteux à exécuter.
Où en Sont-Ils Maintenant ?
GPT-4 est resté le modèle phare d'OpenAI pendant plus d'un an jusqu'au lancement de GPT-4o (« omni ») en mai 2024. Même aujourd'hui, des variantes de GPT-4 alimentent beaucoup de ChatGPT, Microsoft Copilot et des milliers d'applications IA.
Le modèle qui a réussi l'examen du barreau en mars 2023 a établi le standard pour les capacités IA. Il a prouvé que l'IA pouvait aller au-delà des tours de passe-passe vers des outils professionnels véritablement utiles.
Plus important encore, GPT-4 a établi ce que « IA frontière » signifiait. Chaque modèle publié depuis—de Claude 3 à Gemini à Llama 3—a été comparé à la performance de benchmark de GPT-4.
Le 14 mars 2023 était le jour où les capacités IA ont fait un bond en avant visible et indéniable. Le résultat de l'examen du barreau était symbolique, mais l'amélioration sous-jacente était réelle : l'IA était devenue dramatiquement plus intelligente, et la course pour construire des modèles encore meilleurs était officiellement entrée en surmultipliée.