GPT‑5.4 débarque : l’IA qui peut désormais travailler à votre place et contrôler votre PC — êtes‑vous prêt à déléguer ?

Octave

il y a 3 mois

OpenAI dévoile GPT‑5.4, une version qui ne se contente plus de répondre à des questions : elle exécute des tâches complexes, orchestre des outils et interagit directement avec des environnements logiciels. Ce n’est pas une simple évolution incrémentale : GPT‑5.4 représente une étape où le modèle devient un véritable assistant opérationnel capable de prendre en charge des workflows de bout en bout, réduire les allers‑retours humains et livrer des résultats exploitables dans des contextes professionnels.

Qu’est‑ce qui change réellement avec GPT‑5.4 ?

La principale nouveauté réside dans l’intégration poussée de capacités de raisonnement, de codage et de contrôle d’outils. GPT‑5.4 fusionne les acquis des précédentes branches (notamment les fonctionnalités Codex) avec des améliorations ciblées pour le travail de connaissance : traitement des feuilles de calcul, génération de présentations, synthèse et structuration de documents longs. L’ambition affichée est claire : réduire les corrections manuelles et augmenter la fiabilité des livrables produits par l’IA.

Des chiffres qui parlent : performance sur tâches professionnelles

Sur le benchmark GDPval, conçu pour évaluer la qualité du “knowledge work” sur 44 professions, GPT‑5.4 se place très haut : il atteint ou dépasse le niveau professionnel humain dans 83,0 % des comparaisons, contre 70,9 % pour GPT‑5.2. Ces gains ne sont pas que statistiques : l’analyse montre des progrès nets sur la modélisation dans les tableurs, la mise en forme de présentations et la réduction des erreurs factuelles. Par exemple, pour des tâches d’analyste sur tableur, GPT‑5.4 obtient en moyenne 87,3 %, contre 68,4 % pour la génération précédente.

Moins d’hallucinations, plus d’exactitude

OpenAI met l’accent sur la fiabilité : GPT‑5.4 réduit les affirmations fausses de 33 % par rapport à GPT‑5.2, et diminue la probabilité qu’une réponse complète contienne des inexactitudes de 18 %. Pour les usages professionnels sensibles (comptabilité, reporting, conseils), cette amélioration est cruciale : elle rend l’usage de l’IA plus praticable dans des processus où l’erreur coûte cher.

Lire Windows 11 va enfin intégrer un mode “ultra-basse consommation” : comment Microsoft veut prolonger l’autonomie de votre PC portable de façon spectaculaire

Usage du PC et agents plus autonomes

La nouveauté la plus visible pour les développeurs et les entreprises est la capacité d’« usage du PC » : GPT‑5.4 peut contrôler des applications, interagir avec des pages web, simuler entrées clavier/souris et manipuler des interfaces via captures d’écran et DOM. Ces agents peuvent exécuter des séquences d’actions complexes — ouvrir un tableur, appliquer des formules, exporter un rapport et l’envoyer par mail — avec une supervision minimale.

Sur OSWorld‑Verified (interaction en environnement desktop), GPT‑5.4 obtient 75,0 % de réussite, contre 47,3 % pour GPT‑5.2 et un score humain moyen de 72,4 %.

Sur WebArena‑Verified (navigateur, interaction DOM), GPT‑5.4 atteint 67,3 % de réussite, surpassant nettement la génération précédente.

Sur Online‑Mind2Web, utilisant uniquement des screenshots, GPT‑5.4 affiche un impressionnant 92,8 %.

Ces résultats indiquent qu’un modèle peut désormais effectuer des tâches concrètes au sein d’un desktop ou d’un navigateur, ouvrant la voie à des assistants automatisés pour la recherche, la collecte d’information ou la génération de rapports.

Contexte long et tool search : mémoire étendue et efficacité

GPT‑5.4 gère un contexte colossal : jusqu’à 1 million de tokens, ce qui lui permet de maintenir la mémoire sur des projets très longs, suivre des étapes multiples et réutiliser des informations sans retomber dans des redondances. La fonction tool search est aussi déterminante : au lieu d’envoyer la définition complète de chaque outil à chaque requête, le modèle reçoit un index léger et récupère les détails selon les besoins. Cela réduit la consommation de tokens, la latence et le coût, surtout dans des environnements riches en connecteurs et services externes.

Lire OpenAI prépare un tour de financement record à 100 milliards $ — qui investit et pourquoi ça change tout ?

Images et vision : plus de précision

Sur la partie vision, GPT‑5.4 propose un palier « original » capable de supporter jusqu’à 10,24 millions de pixels au total (ou 6000 px sur le côté majeur), avec un palier « high » à 2,56 millions de pixels. Concrètement, cela améliore la localisation d’objets, la compréhension contextuelle d’images complexes et la précision lors d’interactions visuelles (clics, annotations, repérage de zones).

Codage et pipelines de développement

GPT‑5.4 incorpore les compétences de GPT‑5.3‑Codex et les améliore sur les tâches longues et itératives. En tests comme SWE‑Bench Pro, il égalise ou dépasse les performances antérieures, tout en réduisant la latence. La modalité /fast permet d’accélérer la génération de tokens jusqu’à 1,5×, utile pour des boucles de développement rapides ou du debugging assisté par l’IA. Les gains se remarquent surtout sur le frontend, où GPT‑5.4 produit des interfaces plus abouties et fonctionnelles.

Contrôlabilité et transparence : le plan de travail dès le départ

Pour les tâches longues, GPT‑5.4 introduit un préambule de planification : le modèle expose son plan d’action initial, et l’utilisateur peut ajuster les instructions en cours de route sans tout recommencer. Cette façon de “penser à voix haute” améliore la contrôlabilité et permet une collaboration homme‑machine plus fluide sur des workflows complexes.

Disponibilité et offres

GPT‑5.4 est déjà disponible via ChatGPT, Codex et API en version `gpt-5.4`, tandis que la déclinaison `gpt-5.4-pro` cible les usages intensifs demandant plus de ressources. Dans ChatGPT, GPT‑5.4 Thinking est accessible aux abonnés Plus, Team et Pro ; GPT‑5.2 restera encore disponible en legacy pour quelques mois avant retrait.

Lire Outils de suivi de marques sur les LLMs en 2025 : gratuit vs payant, que choisir ?

Impacts et questions éthiques

Si GPT‑5.4 promet d’alléger des tâches répétitives et complexes, il soulève aussi des interrogations : dépendance accrue aux agents, responsabilités en cas d’erreur opérationnelle, sécurité des automations (contrôle d’accès, permissions), et impact sur l’emploi des métiers du savoir. L’intégration prudente, des audits humains et des garde‑fous techniques seront essentiels pour éviter des effets indésirables.

En définitive, GPT‑5.4 marque un tournant vers des modèles IA plus « opérateurs » que simples outils conversationnels. Reste à mesurer dans la durée comment ces capacités transformeraient réellement les pratiques professionnelles — entre gains de productivité et nouveaux enjeux de gouvernance.