Nouveautés des agents IA de ChatGPT (2026)

De simples discussions à des actions autonomes

En quelques mois, ChatGPT est passé du statut de chatbot conversationnel à celui d’assistant agentique capable de penser et d’agir. L’« agent » de ChatGPT combine les capacités de navigation Web et de recherche du prototype Operator avec l’analyse approfondie du mode Deep Research. Il fonctionne sur un ordinateur virtuel accessible dans l’interface de ChatGPT et peut cliquer, faire défiler des pages, remplir des formulaires et manipuler des fichiers pour accomplir des tâches complexes. Cette approche marque un tournant pour les professionnels : au lieu d’enchaîner manuellement les étapes, on décrit le résultat souhaité et l’agent exécute l’ensemble du flux de travail sous supervision.

Le mode Agent : un ordinateur virtuel et des outils intégrés

Un environnement complet

Le mode Agent offre un ordinateur virtuel qui conserve l’état entre les actions. L’agent peut utiliser plusieurs outils intégrés :

Navigateur visuel pour interagir avec des sites Web de manière humaine (cliquer, saisir, faire défiler).
Navigateur texte pour récupérer rapidement de longs documents et y raisonner.
Terminal pour exécuter du code et manipuler des fichiers.
Appels d’API directs pour interroger des services externes.
Connecteurs : intégrations sécurisées avec des applications tierces (Gmail, Google Drive, GitHub, Slack, etc.) afin d’importer des e‑mails, des fichiers ou des événements. Les connecteurs sont gérés par un registre et peuvent être activés ou désactivés à tout moment.

Grâce à cette palette d’outils, l’agent est capable de réaliser des workflows multi‑étapes : par exemple analyser un tableau via une API, rédiger un rapport en s’appuyant sur un navigateur texte, puis envoyer un e‑mail via Gmail — le tout dans une session unique. L’utilisateur peut interrompre l’agent à tout moment pour fournir des précisions, prendre la main ou refuser une action.

Exemples d’usages

Tâches professionnelles : l’agent automatise des tâches répétitives comme la mise à jour de feuilles de calcul sans casser les formules, la génération de présentations ou la rédaction de rapports.
Vie quotidienne : il peut réserver des rendez‑vous médicaux, organiser des voyages ou rechercher des spécialistes en fonction de votre agenda.
Supervision humaine : avant toute action ayant des conséquences dans le monde réel (envoi d’un e‑mail, achat en ligne, suppression de données), l’agent demande confirmation. Les actions sensibles sont réalisées en mode « Watch » qui nécessite l’approbation de l’utilisateur.

Contrôle utilisateur et sécurité renforcée

L’ouverture de l’agent aux sites Web en direct pose des risques. OpenAI a mis en place plusieurs garde‑fous :

Journal en temps réel : l’agent décrit chacune de ses actions à l’écran et signale quand il a besoin de votre autorisation.
Effacement des données : un simple clic permet de supprimer l’historique de navigation de l’agent et de le déconnecter des sites où il est identifié.
Isolation des informations sensibles : lorsque vous reprenez la main pour saisir vos identifiants, ces informations ne sont pas transmises au modèle ; elles restent privées sur votre machine.
Détection des injections de commande : le système surveille en permanence les pages visées pour repérer des instructions cachées destinées à détourner l’agent. Il refuse ou demande confirmation s’il détecte un comportement suspect.
Quota et disponibilité : depuis juillet 2025, le mode Agent est déployé progressivement pour les abonnements Pro, Plus et Team. Les utilisateurs Pro reçoivent environ 400 messages agent par mois, tandis que les autres niveaux ont des quotas inférieurs. L’accès est encore limité dans certaines régions pour des raisons réglementaires.

AgentKit : construire vos propres agents

Lors du DevDay d’octobre 2025, OpenAI a dévoilé AgentKit, un ensemble d’outils destinés aux développeurs pour créer, tester et déployer des agents personnalisés. AgentKit comprend quatre piliers :

Agent Builder : une interface visuelle de type Canva permettant de concevoir des workflows sans code. Les utilisateurs assemblent des blocs (conditions, boucles, actions) pour définir la logique d’un agent. Des modèles pré‑construits (service client, enrichissement de données, Q/R, comparaison de documents) accélèrent la mise en production.
ChatKit : un composant d’interface intégrable pour ajouter un chat piloté par GPT dans votre application, sans avoir à développer l’interface de zéro.
Evals for Agents : des outils d’évaluation permettant de noter chaque étape, d’optimiser les invites et d’automatiser les tests pour garantir la fiabilité.
Connector Registry : un répertoire d’intégrations vers des services comme Salesforce, Slack, Dropbox ou PostgreSQL pour connecter facilement vos agents aux données de votre entreprise.

En regroupant la conception, l’interface, l’évaluation et les connecteurs, AgentKit remplace l’assemblage manuel d’outils disparates (Zapier, n8n, LangChain) et facilite la construction d’agents robustes.

Les apps dans ChatGPT : une nouvelle vitrine pour les services

En octobre 2025, OpenAI a également lancé les apps dans ChatGPT, une évolution des connecteurs. Ces mini‑applications interactives s’exécutent directement dans la conversation. Par exemple, demander « Booking.com, trouve‑moi un hôtel à Paris » affiche des résultats avec photos et tarifs, ou « Spotify, crée une playlist pour vendredi soir » ouvre l’interface de Spotify. Les premières apps disponibles incluent Booking.com, Canva, Coursera, Expedia, Figma, Spotify et Zillow, d’autres partenaires arrivant progressivement.

Les apps utilisent le Model Context Protocol (MCP) pour intégrer la logique back‑end et une interface Web sandboxée. Elles peuvent être affichées en mode inline, en image dans l’image ou en plein écran. Depuis décembre 2025, le terme « apps » englobe aussi les anciens connecteurs. Cette unification simplifie la gestion des outils par l’utilisateur et prépare l’arrivée du protocole de commerce agentique (ACP) pour faciliter les achats dans ChatGPT.

Améliorations de la mémoire et personnalisation

En avril 2025, OpenAI a étendu la mémoire de ChatGPT afin de rendre les réponses plus cohérentes et personnalisées. Jusqu’alors, seule une liste limitée de faits enregistrés était utilisée, mais la nouvelle option « référencer l’historique » permet à ChatGPT de s’appuyer sur l’ensemble des conversations passées pour adapter ses réponses. Cette fonctionnalité est déployée progressivement pour les abonnés Plus et Pro et donne un contexte beaucoup plus riche, ce qui améliore la pertinence des agents. Les utilisateurs peuvent activer ou désactiver la mémoire et utiliser des chats temporaires pour éviter de sauvegarder des informations sensibles.

En juin 2025, OpenAI a annoncé que les utilisateurs gratuits bénéficieraient également d’une version allégée de cette mémoire améliorée. Elle permet une continuité sur les conversations récentes, alors que les abonnés Plus/Pro profitent d’un contexte plus étendu. Les options de suppression et de désactivation restent disponibles pour maîtriser la confidentialité.

Implications pour les cabinets comptables et les développeurs

Pour un cabinet d’expertise comptable, ces nouveautés changent la donne :

Automatisation poussée : le mode Agent peut alimenter automatiquement un tableau d’analyse financière à partir de relevés bancaires, générer une présentation et l’envoyer au client. Ce niveau d’automatisation réduit les tâches répétitives et laisse plus de temps pour l’analyse et le conseil.
Intégrations métier : grâce aux apps et aux connecteurs, vous pouvez relier l’agent à des outils comptables (ERP, CRM, outils de facturation) et orchestrer des workflows de saisie ou de lettrage en langage naturel.
Personnalisation via mémoire : l’agent retient vos préférences (format des rapports, règles de contrôle interne) et adapte ses actions en conséquence. Les développeurs peuvent coder des agents personnalisés avec AgentKit pour automatiser des processus spécifiques (gestion des pièces manquantes, rapprochements bancaires).
Supervision et conformité : la narration en temps réel et les confirmations obligatoires permettent de garder la maîtrise des opérations et de respecter les exigences réglementaires. Les fonctions d’effacement et de contrôle des autorisations sont essentielles pour la confidentialité des données clients.

Conclusion

L’arrivée du mode Agent, d’AgentKit et des apps dans ChatGPT marque un pas décisif vers des assistants autonomes capables de combiner raisonnement et action. Ces innovations ouvrent de nouvelles perspectives pour automatiser des tâches professionnelles et personnelles tout en conservant un contrôle humain. Pour les cabinets comptables et les développeurs, elles offrent des outils puissants pour améliorer la productivité et proposer des services numériques intégrés. Toutefois, l’accès progressif, les quotas et les questions de confidentialité exigent une adoption maîtrisée et une veille continue sur les évolutions de la plateforme.