Ne perdez pas le fil : Comment empêcher l’utilisation de l’IA de devenir un indicateur de performance

David Rice

on May 26, 2026

Découvrez pourquoi suivre l’utilisation de l’IA comme indicateur de performance peut fausser les comportements, nuire à la confiance et affaiblir le développement réel des compétences en IA au sein des équipes.

Key Takeaways

Problème du tokenmaxxing: Les employés manipulent les métriques d’utilisation des tokens IA au lieu de se concentrer sur la productivité réelle.

Défauts de mesure: Les méthodes d’évaluation actuelles privilégient l’activité liée à l’IA au détriment de résultats concrets, entraînant des indicateurs de performance trompeurs.

Risques de corruption: La dépendance aux données d’utilisation compromet leur fiabilité, rendant difficile l’évaluation réelle de la performance des employés.

Stratégies de prévention: Les organisations devraient passer à des indicateurs IA basés sur les résultats, en mettant l’accent sur la qualité plutôt que la quantité dans l’évaluation de la performance.

Communication du leadership: Un leadership efficace doit donner la priorité aux résultats d’apprentissage dans les discussions sur l’IA pour encourager un véritable développement des compétences.

Début avril 2026, un tableau de bord interne ayant fuité chez Meta a révélé que l'entreprise classait environ 85 000 de ses employés selon leur consommation de jetons IA.

Les jetons sont les unités de données traitées par les modèles d'IA, et quelqu'un chez Meta a estimé que les compter était un moyen utile de savoir qui utilisait réellement l’IA. L'utilisateur en tête avait consommé 281 milliards de jetons en un seul mois. L'utilisation totale suivie sur le tableau de bord dépassait les 60 000 milliards de jetons avant sa suppression.

Peu après, le Financial Times a signalé un schéma parallèle chez Amazon. Des employés automatisent des tâches inutiles uniquement pour gonfler leur nombre d'utilisations de l’IA, fabriquant ainsi l’apparence d’un engagement envers l’initiative IA de l’entreprise.

Ce comportement a depuis pris le nom de « tokenmaxxing », d’après un terme de l’argot Gen Z qui signifie maximiser quelque chose, en l’occurrence la performance visible de l’utilisation de l’IA plutôt que les résultats qu’elle est censée produire.

Deux des plus grandes entreprises mondiales, la même dynamique, et un nom qui laisse entendre que le phénomène se propage.

Le tokenmaxxing est moins un problème technologique qu’un problème de gestion de la performance et de culture d’entreprise, et on y retrouve la marque des RH et des opérations, que les RH aient été présents ou non lors des prises de décisions qui l’ont engendré.

Quelqu’un a défini l’incitation. Quelqu’un a construit ou toléré le classement. Quelqu’un a décidé que la consommation était un indicateur raisonnable de compétence. Cet article porte sur la compréhension de ce mécanisme et sur ce qu’il convient de faire pour l’éviter.

Pourquoi la mesure échoue

Les organisations ne cherchent généralement pas à instaurer une culture du classement. Le tokenmaxxing apparaît dans l’écart entre ce que les entreprises attendent réellement de l’IA et ce qu'elles sont actuellement capables de mesurer.

Un sondage Gallup de février 2026 (en anglais) mené auprès de plus de 23 000 salariés américains a révélé que la moitié des adultes employés utilisent l’IA au moins quelques fois par an, et que les salariés d’entreprises ayant adopté l’IA font état de plus de bouleversements et d’anxiété concernant leur emploi que ceux de structures non équipées.

En parallèle, selon Gartner, seulement un investissement sur cinquante dans l’IA apporte une valeur transformationnelle, et un sur cinq offre un retour sur investissement mesurable. L’étude McKinsey « State of AI 2025 » a constaté que la plupart des organisations n’en sont qu’aux premiers stades de la création de valeur à l’échelle de l’entreprise malgré une adoption rapide.

D’après McKinsey, ce qui différencie les meilleurs résultats des moins bons, c’est la refonte des processus de travail et la gouvernance, et non le volume brut d’utilisation.

Cependant, ce n’est pas cette nuance que perçoivent les conseils d’administration et les PDG. Ils ressentent l’urgence, laquelle se traduit par des exigences de preuves visibles d’adoption, qui redescendent jusqu’aux managers intermédiaires cherchant des résultats à montrer. Quand on ne peut pas mesurer si l’IA améliore vraiment les résultats, on mesure ce qui s’en rapproche le plus, à savoir l’activité. D’où le tableau de bord.

Yakov Filippenko, PDG de la plateforme de mise en relation professionnelle Intch, fait le parallèle avec les politiques de retour au bureau. Les entreprises y ont poussé leurs salariés en partie parce que les actionnaires détenaient des bâtiments vides coûteux, avance-t-il.

Aujourd’hui, des organisations consomment des jetons pour démontrer à leurs investisseurs qu’elles ne passent pas à côté de la révolution IA. Dans les deux cas, une pression légitime — visibilité des actionnaires, positionnement concurrentiel — débouche sur une mesure qui sert l’image, non les opérations.

Le CTO de Meta, Andrew Bosworth, a explicitement exprimé ce raisonnement, présentant publiquement son meilleur ingénieur comme dépensant l’équivalent de son salaire en jetons IA et étant « 5 à 10 fois plus productif » en conséquence. « C’est comme de l’argent facile. Continuez comme ça. Il n’y a pas de limite. »

Ce recours à la dépense de jetons comme signal de productivité, émis par un dirigeant technologique d’une des entreprises les plus influentes au monde, n’est pas un avis isolé. Il reflète une incapacité plus large à distinguer corrélation et causalité. Le haut potentiel utilise beaucoup de jetons, alors ceux-ci deviennent, à tort, le motif de la performance plutôt qu’un signe de celle-ci.

L’erreur s’amplifie rapidement. Les managers exposés à cette vision en provenance du sommet n’ont même pas besoin de tableau de classement officiel pour intégrer le message. Le comportement suit le signal, même quand l’émetteur n’a pas cherché à l’envoyer.

Ce que cela coûte

Les tableaux de bord d’usage étaient déjà un indicateur peu fiable de la productivité IA avant même que certains ne commencent à les manipuler.

Yasser Drif, fondateur de Roman AI, a partagé des données issues de sa clientèle suggérant que l’écart entre activité et résultat final est plus large que ce qu’imaginent la plupart des organisations. Seuls environ 24 % des utilisations humaines de l’IA produisent un artefact utile. Le reste correspond à de l’itération et des travaux en cours, qui gonflent artificiellement les métriques de volume en une productivité apparente. Voilà pour la référence. Le tokenmaxxing aggrave la situation.

Le premier coût est la corruption des signaux. Une fois que l’usage devient la métrique principale, les données d’utilisation deviennent peu fiables. Il n’est alors plus possible d’observer qui consomme le plus d’IA et d’en tirer des conclusions dignes de confiance sur qui est performant, qui apprend ou qui apporte de la valeur.

Les données sont faussées, et vous ne saurez pas toujours par qui. Toute analyse du personnel fondée sur ces données hérite de cette contamination.

Le deuxième coût est plus profond. Lorsque les employés optimisent leur travail pour donner l’apparence d’une maîtrise de l’IA au lieu de la développer réellement, vous inversez les conditions d’apprentissage dont vous avez vraiment besoin. Le développement authentique des compétences en IA nécessite de l’expérimentation — y compris des échecs — ainsi que des comptes rendus honnêtes sur ce qui a fonctionné.

Une culture du « tokenmaxxing » crée une pression à démontrer sa compétence publiquement, tout en rendant risqués les retours honnêtes. Ce sont des conditions incompatibles.

Le troisième coût touche les employés qui ne manipulent rien. Dans un environnement où la consommation de jetons devient visible et valorisée, la personne qui effectue un travail d’IA soigné et bien ciblé, produisant d’excellents résultats sans générer de chiffres impressionnants, risque de se sentir à la traîne.

Ce sentiment n’est pas corrigé par de simples réassurances. Le moyen le plus rapide de rendre le vrai développement de compétences en IA risqué est de laisser croire à ceux qui ne gonflent pas leurs chiffres qu’ils sont en train de perdre une course qu’ils ne comprennent pas.

Amazon, à son crédit, a répondu au problème qu’il avait créé en restreignant la visibilité des statistiques d’utilisation à l’échelle des équipes, pour n’autoriser l’accès qu’aux individus et à leurs managers directs. C’est une mesure corrective. Mais la prévention nécessite un autre type d’action, plus tôt dans le processus.

Comment l’éviter

La question pratique pour une DRH ou un directeur des opérations est donc : par où commencer ? « Mesurez les résultats, pas les intrants » est certes vrai, mais ne dit toujours pas à quoi changer dès le lundi matin.

Commencez par un audit de ce qui est actuellement suivi et par qui ces données sont visibles. Filippenko signale comme signe d’alerte immédiate tout indicateur clé d’adoption de l’IA directement lié à la rémunération.

C’est l’équivalent de mesurer la performance d’un avocat au nombre de pages imprimées, ou l’efficacité d’un développeur au nombre de lignes de code.

Yakov Filippenko

Fondateur et CEO d’Intch

Yasser Drif, dont l’entreprise Roman AI développe des outils d’IA déployés à grande échelle, propose une approche concrète pour démarrer.

Récupérez 30 jours de données d’utilisation, classez par dépenses, et demandez ce qui a été réellement livré. La personne peut-elle vous présenter un livrable ?

Yasser Drif

Fondateur de Roman AI

Parmi les alertes surveillées par son équipe : des utilisateurs à forte dépense sans aucun livrable associé, une inflation du nombre d’exécutions où une tâche accumule dix interactions ou plus avec l’IA sans aucun changement de statut, ou encore un seul « champion IA » consommant une part disproportionnée des crédits sans produire de résultats concrets. Si vos tableaux de bord ne permettent pas de savoir ce qui a été livré, c’est le premier problème à corriger.

Si votre organisation dispose de tableaux de bord d’utilisation de l’IA visibles par plusieurs employés, ou si le volume d’usage apparaît dans les évaluations de performance, les cycles de définition d’objectifs ou le reporting des managers, alors ces points constituent un risque réel de « tokenmaxxing ». La question n’est pas tant de savoir si les données sont collectées, mais si elles sont visibles de manière à générer une pression concurrentielle sur le volume plutôt que sur la qualité.

Une évaluation de l’IA fondée sur les résultats diffère selon la fonction. En vente, on s’intéressera à l’impact de l’IA sur le taux de conversion, et non au nombre de prompts envoyés. En exploitation, on mesurera la réduction des cycles ou le taux d’erreur des processus assistés par IA, et non les historiques d’utilisation système.

Le principe de conception reste le même pour tous : mesurer ce qui a changé en aval de l’utilisation de l’IA, pas l’utilisation elle-même. Cela nécessite une collaboration entre les responsables de fonctions et les RH pour définir ce que signifie « mieux » avant de construire les référentiels de mesure, et non après.

Quel message transmettez-vous ?

La communication du leadership doit être recalibrée en même temps que les indicateurs. Si les seuls messages que les employés entendent à propos de l’IA concernent les taux d'adoption et les étapes d'utilisation, le signal implicite est que ce qui est surveillé, c’est la consommation.

Les dirigeants qui veulent réellement développer les compétences en IA doivent parler de résultats concrets : comment l’IA a changé la façon de travailler d’une équipe, ce qu’une expérience particulière a appris à l’organisation, où un déploiement a échoué et ce que cela a révélé. Ce type de récit montre que l'organisation valorise l'apprentissage, et non la seule performance liée à l'apprentissage.

Redresser la trajectoire dans une équipe où le tokenmaxxing est déjà présent demande de la délicatesse. Les employés qui ont joué avec un indicateur répondaient généralement à un signal généré par la direction. Le traiter uniquement comme un problème de comportement individuel fait passer à côté du problème et crée exactement les conditions où un reporting honnête semble risqué.

Lorsque vos employés sont prêts à faire un travail dénué de sens juste pour cocher une case, ce n'est pas un problème d'indicateur," dit Filippenko. C’est une défaillance opérationnelle.

Pour y remédier, la direction doit reconnaître le signal qu’elle a envoyé avant de demander aux collaborateurs de changer leur comportement.

Le cadre le plus productif pour les managers consiste à redéfinir ce qui importe réellement à l'organisation et à donner aux gens la possibilité de démontrer de vraies compétences. Cela suppose de valoriser ouvertement des exemples de réussites fondées sur des résultats, et pas seulement de supprimer l’ancien indicateur.

L’intervention suggérée par Drif est directe et mérite réflexion : renommez publiquement la métrique, passez de « utilisation de l’IA » à « travail réalisé avec l’IA ». Ce changement de nom envoie un signal clair sur ce que l’organisation valorise, sans que personne ne soit pointé du doigt pour le comportement induit par l’ancien indicateur.

Gérer l’ambiguïté

La discipline la plus profonde ici est la patience face à l’ambiguïté. La plupart des organisations ne sont pas encore en mesure de mesurer précisément la contribution de l’IA aux résultats business, et la pression pour présenter des avancées d’ici là est réelle. Les tableaux de bord et les classements comblent ce vide car ils produisent des chiffres et les chiffres donnent l’impression de responsabilité.

Le problème est que cette redevabilité porte sur la mauvaise chose. Concevoir des systèmes de mesure qui rendent les gens responsables des résultats prend plus de temps, exige plus de travail transversal, et c’est la seule démarche qui ne corrompt pas les données dont vous aurez besoin, plus tard, pour prendre de meilleures décisions.

Le tokenmaxxing est un signal d’alerte précoce, pas une finalité. Considérez-le comme un signal culturel à prendre au sérieux dès aujourd’hui, et vous obtiendrez à l’avenir des données de performance bien plus fiables, ainsi qu’une adoption de l’IA bien plus saine.

Ne perdez pas le fil : Comment empêcher l’utilisation de l’IA de devenir un indicateur de performance

Continuez à lire—et continuez à diriger plus intelligemment

Pourquoi la mesure échoue

Ce que cela coûte

Comment l’éviter

More Articles

Quel message transmettez-vous ?

Gérer l’ambiguïté

Continuez à lire—et continuez à diriger plus intelligemment

Pourquoi la mesure échoue

Ce que cela coûte

Comment l’éviter

More Articles

Quel message transmettez-vous ?

Gérer l’ambiguïté

L’eau se réchauffe. Vos meilleurs talents le sentent.

Quelqu’un doit gérer les robots

Votre stratégie culturelle n’a pas été conçue pour le changement permanent