Écart organisationnel: Le principal obstacle au déploiement de l’IA n’est pas technique mais réside dans le manque d’infrastructures organisationnelles.
Changement de jugement: Les organisations doivent passer d’un jugement individuel à un jugement collectif pour améliorer la prise de décision des systèmes d’IA.
Importance de la gouvernance: Mettre en place une propriété et un audit clairs pour garantir que les systèmes d'IA sont responsables et que les erreurs sont prises en compte.
Redéfinition de la valeur: Repenser les indicateurs de valeur en privilégiant la précision et la qualité de la décision plutôt que la rapidité pour renforcer l'intégration de l’IA.
Facteurs de succès des pilotes: Des résultats clairs, une propriété définie et des objectifs IT-métier alignés sont essentiels à la réussite d’un projet pilote IA.
Selon l'étude "Tendances des technologies émergentes 2025" de Deloitte, 30 % des organisations explorent l'IA agentique et 38 % testent des solutions pilotes. Mais seulement 11 % utilisent ces systèmes en production.
L'écart ne vient pas d'un manque de maturité technique. Les modèles fonctionnent. Les données existent. Les outils sont accessibles. Ce qui manque, c'est l'infrastructure organisationnelle : la gouvernance, la définition de la responsabilité et les systèmes d'incitation qui rendent sûr le fait de confier des décisions à l'IA.
Les équipes qui passent des pilotes à la production effectuent trois changements spécifiques. Aucun n'est principalement technique.
Première évolution : redéfinir le jugement comme une capacité organisationnelle
La plupart des organisations considèrent le jugement comme une compétence individuelle, détenue par les personnes expérimentées. Deux personnes pourraient traiter le même dossier différemment et personne n'est en mesure d'expliquer pourquoi. Il est donc impossible d'améliorer le processus de manière systématique, car la responsabilité des décisions de l'IA reste indéfinie.
Ahmed Zaidi, PDG d'Accelirate, a été confronté à ce schéma en travaillant avec un grand groupe hospitalier. L'équipe de 15 infirmières chargées de rédiger les lettres de contestation du refus de prise en charge par les assurances semblait suivre un processus simple. En surface, il paraissait facile de le formaliser.
Ce qui est vite devenu source de tension, c'est que le processus n'était pas unique, dit Zaidi. Chaque infirmière avait développé sa propre stratégie au fil des années d'expérience.
Lorsque l'équipe de Zaidi a essayé de décrire « comment nous procédons réellement », les infirmières n'étaient pas d'accord sur des questions fondamentales :
- Qu'est-ce qui constitue une justification clinique solide ?
- Quels éléments de documentation mettre en avant ?
- Quel ton ou type de langage privilégier selon les assureurs ?
- Quand doit-on escalader un dossier ou au contraire requalifier la contestation ?
Les dépendances cachées étaient encore plus profondes. Les décisions ne reposaient pas seulement sur le code de refus. Elles dépendaient aussi des notes du médecin stockées dans un système, des données d'autorisation préalable dans un autre, et du phrasé clinique nuancé présent dans la documentation libre. Certaines stratégies s'appuyaient sur les habitudes rédactionnelles de médecins, qui n'étaient pas standardisées.
« Ce qui semblait simple — 'automatiser les recours' — s'est transformé en un exercice organisationnel visant à rendre explicite un jugement implicite », souligne Zaidi.
Le déclic est venu lorsque l'équipe a cessé d'essayer de choisir la "meilleure" approche et a commencé à agréger les savoirs de toutes les infirmières. Des ateliers structurés ont permis de confronter les stratégies, d'identifier les cas extrêmes et de s'accorder sur ce qui menait historiquement aux succès. L'équipe a ensuite croisé ces consensus avec les données réelles d'issue : quels modèles de lettres réussissaient le plus, quelles combinaisons de documents amélioraient les taux de rétractation.
Au lieu de consigner des opinions, ils ont formalisé des schémas validés.
Cette externalisation apporte quelque chose de rare : la capacité d'observer et d'améliorer le jugement à grande échelle. Chaque action est tracée. Chaque exception devient visible. Chaque dérogation révèle où les règles ne collent pas à la réalité. Les équipes peuvent repérer les schémas, ajuster les seuils et améliorer continuellement leur performance.
Le résultat est mesurable : précision accrue des recours, cycles de traitement réduits, meilleur taux de récupération et baisse du risque de non-conformité grâce à la standardisation, la documentation et la traçabilité des décisions.
La gouvernance n'a pas ralenti le dispositif, elle a offert à l'organisation un moyen d'apprendre systématiquement de ses propres décisions.
Deuxième évolution : attribuer une responsabilité claire au comportement de l’agent
Le principal frein au passage en production est la confiance organisationnelle dans le fait que les actions de l’IA sont bien encadrées, auditées, réversibles et supervisées.
Les équipes qui avancent attribuent un responsable opérationnel unique, explicitement redevable du comportement de l’agent, y compris de ses erreurs. La première erreur significative met à l’épreuve l’efficacité de cette infrastructure.
Dans le cas du déploiement à l’hôpital, Zaidi a mis en place un agent assistant à la rédaction et à la priorisation des recours, chargé de classer les cas et de recommander une escalade lorsque certains seuils de risque étaient atteints.
La première véritable défaillance s'est produite lorsque l’agent a mal classé un refus à enjeu financier élevé et à échéance courte comme un dossier ordinaire, ne l’escaladant pas. La logique avait correctement interprété le code de refus, mais avait négligé un facteur contextuel secondaire : la fenêtre de recours arrivant à expiration, liée aux spécificités contractuelles de ce payeur.
L’erreur a été contenue mais a eu un impact financier réel. Elle a été détectée lors d’un audit d’exception quotidien intégré au flux de travail — une vérification humaine par échantillons sur les cas à fort enjeu.
Ce que ce moment a révélé, ce n'est pas que l'agent était imprudent, mais que nos critères d’escalade étaient incomplets, explique Zaidi. Nous avions codifié la logique clinique et celle du refus, mais nous n’avions pas entièrement intégré les métadonnées contractuelles dans le cadre de priorisation.
