Écart organisationnel: Le principal obstacle au déploiement de l’IA n’est pas technique mais réside dans le manque d’infrastructures organisationnelles.
Evolution du jugement: Les organisations doivent passer d’un jugement individuel à un jugement collectif pour améliorer la prise de décision des systèmes d’IA.
Importance de la gouvernance: Mettre en place une responsabilité claire et des audits pour garantir l’imputabilité des systèmes d’IA et la correction des erreurs.
Redéfinition de la valeur: Repenser les critères de valeur, en privilégiant la précision et la qualité de la décision à la rapidité, afin de renforcer l’intégration de l’IA.
Facteurs de succès des pilotes: Des résultats clairs, une responsabilité définie et des objectifs alignés entre IT et métier sont essentiels à la réussite des projets pilotes IA.
Selon l'étude sur les tendances technologiques émergentes de Deloitte pour 2025, 30 % des organisations explorent l'IA agentique et 38 % testent des solutions. Mais seulement 11 % utilisent ces systèmes en production.
Le fossé n'est pas dû à un manque de maturité technologique. Les modèles fonctionnent. Les données existent. Les outils sont accessibles. Ce qui manque, c'est l'infrastructure organisationnelle : la gouvernance, la répartition des responsabilités et les systèmes d'incitation qui rendent possible et sûr de confier des décisions à l'IA.
Les équipes qui passent des pilotes à la production opèrent trois changements spécifiques. Aucun n'est principalement technique.
Premier changement : Redéfinir le jugement comme une compétence organisationnelle
La plupart des organisations considèrent le jugement comme une compétence personnelle propre aux cadres expérimentés. Deux personnes peuvent traiter le même dossier différemment sans que personne puisse expliquer pourquoi. Il est impossible d'améliorer le processus de manière systématique car la propriété des décisions de l'IA reste mal définie.
Ahmed Zaidi, PDG d'Accelirate, a rencontré ce schéma en travaillant avec un grand groupe hospitalier. L'équipe de 15 infirmières responsables de la rédaction des lettres d'appel contre les refus de prise en charge par les assurances semblait suivre un processus clair. À première vue, ce travail paraissait facilement modélisable.
Ce qui est rapidement devenu problématique, c'est qu'il n'existait pas vraiment « un » processus, explique Zaidi. Chacune des infirmières avait développé sa propre stratégie au fil des années d'expérience.
Lorsque l'équipe de Zaidi a tenté de formaliser « comment nous procédons réellement », les infirmières se sont opposées sur des questions fondamentales :
- Qu'est-ce qui constitue une justification clinique solide ?
- Quelle documentation mettre en avant ?
- À quel ton ou langage certains assureurs réagissent-ils ?
- Quand faut-il faire remonter un dossier plutôt que reformuler l'appel ?
Les dépendances cachées étaient encore plus complexes. Les décisions ne se basaient pas simplement sur le code de refus. Elles dépendaient de notes médicales saisies dans un système, de données d'autorisation préalable dans un autre, et de formulations cliniques nuancées présentes dans la documentation libre. Certaines stratégies reposaient sur les habitudes de documentation de certains médecins, qui n'étaient pas standardisées.
« Ce qui semblait simple — 'automatiser les recours' — s'est transformé en exercice organisationnel pour rendre explicite un jugement jusqu'ici implicite », explique Zaidi.
La percée a eu lieu lorsque l'équipe est passée de la recherche de la « meilleure » approche individuelle à l'agrégation du savoir empirique de l'ensemble des 15 infirmières. Ils ont organisé des sessions structurées au cours desquelles les infirmières débattaient des stratégies, partageaient des cas particuliers, et s'accordaient sur ce qui avait historiquement conduit à de bons résultats. Puis ils ont croisé ces conclusions avec des données réelles : quels modèles de lettre remportaient plus de recours, quelles combinaisons de documents amélioraient le taux de rétractation.
Au lieu de formaliser des opinions, ils ont formalisé des schémas validés.
Cette extériorisation permet d'obtenir ce que les organisations possèdent rarement : la capacité d'observer et d'améliorer le jugement à grande échelle. Chaque action est enregistrée. Chaque exception est visible. Chaque dérogation révèle où les règles ne sont pas alignées avec la réalité. Les équipes peuvent repérer des schémas, ajuster les seuils, améliorer la performance sur le temps.
Le résultat a été mesurable : meilleure précision des recours, temps de traitement réduit, taux de récupération en hausse, et diminution du risque de non-conformité grâce à des décisions désormais standardisées, documentées et auditées.
La gouvernance n'a pas ralenti le système ; elle a offert à l'organisation un moyen d'apprendre de ses propres décisions de façon systématique.
Deuxième changement : Désigner clairement un responsable du comportement de l'agent
La contrainte principale pour passer en production, c'est la confiance organisationnelle que les actions de l'IA sont délimitées, traçables, réversibles et sous supervision.
Les équipes qui avancent désignent un propriétaire opérationnel unique, expressément responsable du comportement de l'agent, y compris de ses erreurs. La première erreur significative permet de tester si cette infrastructure fonctionne réellement.
Dans le déploiement hospitalier des recours, Zaidi a mis en place un agent pour aider à la rédaction et à la priorisation des appels de refus, conçu pour trier les dossiers et recommander une escalade lorsque certains seuils de risque étaient atteints.
La première erreur significative est survenue lorsque l'agent a mal classé un refus de dossier à fort enjeu et urgent en dossier de routine, sans procéder à l’escalade. La logique avait correctement interprété le code de refus mais n'avait pas pris en compte un facteur contextuel secondaire — la fenêtre d'appel arrivant à expiration liée au contrat de ce payeur.
L'erreur a été contenue mais a eu un impact financier non négligeable. Elle a été détectée grâce à un audit d'exceptions quotidien intégré au flux de travail — une couche de révision humaine échantillonnant les cas à forte valeur.
Ce que ce moment a révélé, ce n'est pas que l'agent était imprudent, mais que nos critères d'escalade étaient incomplets, explique Zaidi. Nous avions intégré la logique clinique et celle du refus, mais n'avions pas pleinement pris en compte les métadonnées contractuelles dans le système de priorisation.
La structure de gouvernance a aidé de deux façons :
- La journalisation et la traçabilité montraient exactement pourquoi l'agent avait pris la décision, et l'audit humain dans la boucle permettait de détecter les cas à haut risque.
- Elle a révélé une lacune. La définition du « risque » était trop restrictive.
L'équipe a réagi en élargissant les règles d'escalade pour inclure des variables de risque financier et temporel, en mettant en place des seuils dynamiques liés aux contrats, en renforçant la surveillance des recours arrivant à expiration, et en ajoutant des voies de dérogation plus claires.
Dans les systèmes agentiques, les erreurs proviennent rarement d’une mauvaise décision mais d’une modélisation du contexte incomplète. La responsabilité dans le leadership de l’IA signifie concevoir pour une détection précoce, et non supposer la perfection.
![]()
La façon dont la direction gère cette première erreur est déterminante. Si elle y voit une occasion d'apprendre et adapte le système, les équipes gagnent en confiance. Si elle fait marche arrière ou attribue la faute à un individu, le projet pilote échoue.
Les organisations qui réussissent n'évitent pas les erreurs. Elles conçoivent des systèmes qui font remonter les erreurs rapidement, les considèrent comme des données et s'améliorent.
L'angle mort de la gouvernance
L'un des échecs de gouvernance les plus courants que constate Zaidi est ce qu'il appelle la gouvernance passive de l'IA, ou la conviction que journaliser équivaut à contrôler.
« Les organisations affirment avec confiance : “Chaque décision prise par l'agent est consignée. Nous avons une traçabilité complète”, » explique Zaidi. « Cela semble rassurant, surtout dans un environnement réglementé. Mais la journalisation à elle seule ne réduit pas le risque. Elle ne fait que l'enregistrer. »
Dans le secteur de la santé, les décisions des agents et les usages de l'IA concernent souvent la gestion contractuelle, des subtilités de langage clinique, l'interprétation des organismes payeurs et des contraintes de temps. Même si chaque résultat est techniquement traçable, le risque s'accumule dans les cas limites juste hors des seuils prédéfinis, dans la dérive des modèles de documentation ou des réponses des payeurs, et dans les escalades qui auraient dû avoir lieu mais qui n’ont techniquement enfreint aucune règle.
De nombreuses organisations supposent que parce que rien n’a dysfonctionné, le système est conforme. Mais l'absence d'échec immédiat n'est pas une preuve de sécurité. Cela signifie peut-être simplement que personne ne regarde assez en profondeur.
Une véritable maturité de gouvernance de l'IA inclut des fréquences de révision définies pour l’échantillonnage des décisions, des seuils de risque quantitatifs qui déclenchent automatiquement une revue humaine, une attribution claire des responsabilités quant à la surveillance opérationnelle, et des boucles de retour où la répétition d'exceptions mène à l'affinage des règles.
Je pose souvent une question simple aux dirigeants : « Qui se réveille le matin en étant responsable de ce que l’agent a décidé la veille ? » dit Zaidi. « S'il n'y a pas de réponse claire, le modèle de gouvernance n'est pas abouti.
Troisième évolution : Changer ce qui est valorisé
Dans la plupart des organisations, l’expertise est fortement liée au statut, à la sécurité de l'emploi et au pouvoir informel. Être « la personne qui sait » est le moyen de se constituer et de préserver son influence. Rendre le jugement explicite peut donner l'impression de renoncer au seul levier que le système a appris à valoriser.
Dans un système hospitalier, les équipes infirmières étaient historiquement évaluées selon le volume : combien de lettres d’appel elles pouvaient préparer par jour.
Après l’introduction de l’aide à la rédaction par agent, cet indicateur est devenu contre-productif. Si l’IA génère les premiers jets, le seul volume ne reflète plus la valeur.
L’évaluation de la performance a donc évolué vers la précision de la revue clinique, l’efficacité des ajustements aux lettres générées par l’IA, les montants récupérés influencés, et la contribution à l'amélioration des modèles et de la logique d'escalade.
Une infirmière en particulier s’est démarquée comme leader. Elle avait une capacité exceptionnelle à expliquer pourquoi certaines formulations fonctionnaient mieux auprès de certains assureurs. Au lieu d’être évaluée sur la rapidité d’exécution, elle est devenue essentielle à la mise en forme de son jugement dans des règles et des modèles réutilisables par le système.
Son influence s’est étendue parce qu’elle savait traduire son intuition en logique structurée, dit Zaidi. « C’est une compétence très différente, mais dans les environnements agentiques, elle est extrêmement précieuse.
Le changement a été culturel : on est passé de « Quelle est ta vitesse d’exécution ? » à « Quelle est ta capacité à façonner le système de décision ? »
Lorsque les organisations valorisent l’héroïsme, la rapidité ou l’intuition – mais pas la documentation, la supervision ou l’amélioration des systèmes – l’expertise reste prisonnière des individus. Les équipes qui franchissent cette étape mettent en avant ceux qui savent transmettre leur jugement à un système, l’améliorer dans le temps, et faire progresser les autres grâce à cela.
Une fois que l’expertise est considérée comme un levier pour renforcer la capacité organisationnelle, plutôt que comme facteur d’indispensabilité individuelle, la résistance à l’IA s’estompe. La passation aux agents devient alors une marque de séniorité et non une menace à celle-ci.
Les premiers signes annonciateurs d’échec
Au cours des 30 à 60 premiers jours d’un pilote, l’échec est presque toujours prévisible.
Le principal signal d’alerte est l’absence d’un résultat clairement défini. Si une équipe n’est pas capable d’exprimer, en termes opérationnels, à quoi ressemble le succès — réduction des délais, hausse de la récupération, diminution des taux d’erreur — alors le pilote relève davantage d’une expérimentation sans cap que d’une démarche structurée.
Parmi les autres signaux d’alerte figurent l’absence de propriétaire opérationnel clairement désigné, un désalignement entre business et IT sur l’engagement temporel et la complexité, l’incapacité à détailler le véritable processus de décision automatisé, et le fait de présenter l’initiative comme une « exploration IA » plutôt qu’une refonte opérationnelle.
Les pilotes stagnent lorsque les parties prenantes métiers sous-estiment l’effort requis pour externaliser un jugement en logique structurée, tandis que l’IT sous-estime la variabilité et les cas limites dans les processus métier.
Les pilotes réussis accomplissent trois choses durant les 30 premiers jours :
- Définir un périmètre restreint avec des résultats mesurables
- Désigner un propriétaire métier dédié et des experts métiers impliqués
- Garantir l’appui de la direction pour expérimenter et lever les obstacles procéduraux.
« L’IA agentique n’est pas un problème de déploiement technologique, mais d’architecture décisionnelle », affirme Zaidi. « Si cela n’est pas résolu dès le départ, on finit avec une preuve de coût. »
À quoi ressemble la maturité organisationnelle
Quand une organisation affirme être prête à déployer une solution agentique à grande échelle, Zaidi recherche une maturité structurelle portant sur les personnes, les processus et la technologie. Cela implique :
- Un propriétaire métier nommé, responsable des résultats
- Un arbre d’exceptions et d’escalades clairement défini
- Une visibilité sur les décisions et leurs résultats
- Des performances économiques qui justifient la montée en charge
- Un cadre de gouvernance opérationnel en place.
La plupart des équipes sous-estiment deux choses : le coût de l’analyse et le temps nécessaire pour externaliser correctement la logique décisionnelle.
Un signe de maturité que Zaidi a appris à reconnaître :
Si je demande : « Comment l’agent décide-t-il en cas d’incertitude ? » et qu’ils savent répondre clairement — y compris les seuils d’escalade et les responsabilités — ils sont probablement prêts. Si la réponse est vague ou se limite à « le modèle le déterminera », ils restent optimistes mais ne sont pas préparés.
La capacité aujourd’hui déterminante se situe à la frontière entre le jugement humain et les systèmes. Ce sont les personnes capables d’expliquer pourquoi une décision est prise, et pas seulement ce qui a été décidé. Celles qui décomposent leur intuition en signaux, seuils et exceptions. Celles qui s’interrogent sur les limites de leur propre jugement.
Au quotidien, elles passent moins de temps à exécuter des tâches, et davantage à superviser, corriger et améliorer la façon dont le travail s’effectue, qu’il soit réalisé par des humains ou des agents.
Les organisations qui maîtrisent ce changement acquièrent une compétence que leurs concurrentes restées au stade pilote n’ont pas : la capacité à améliorer le jugement à grande échelle. Elles peuvent tester des hypothèses, mesurer les résultats, et ajuster la qualité des décisions d’une façon qui était impossible lorsque l’expertise ne vivait que dans la tête des gens.
L’avantage concurrentiel ne réside pas dans une IA supérieure, mais dans une infrastructure organisationnelle qui permet une vraie appropriation de l’IA. Cette infrastructure — une gouvernance agile, une responsabilité claire, des incitations qui valorisent l’expertise transférable — est ce qui distingue les 11 % en production des 38 % bloqués à l’étape pilote.
