Problème de tokenmaxxing: Les employés manipulent les métriques d’usage de jetons IA au lieu de se concentrer sur la véritable productivité.
Défauts de mesure: Les méthodes d’évaluation actuelles privilégient l’activité liée à l’IA plutôt que les résultats significatifs, ce qui entraîne des indicateurs de performance trompeurs.
Risques de corruption: Se fier aux données d’utilisation compromet leur fiabilité, rendant l’évaluation réelle de la performance des employés difficile.
Stratégies de prévention: Les organisations doivent passer à des indicateurs de performance IA axés sur les résultats, en mettant l’accent sur la qualité plutôt que sur la quantité.
Communication du leadership: Un leadership efficace doit privilégier les résultats d’apprentissage dans les discussions sur l’IA pour encourager un développement authentique des compétences.
Début avril 2026, un tableau de bord interne ayant fuité chez Meta a révélé que l’entreprise classait ses quelque 85 000 employés selon leur consommation de jetons IA.
Les jetons sont les unités de données que traitent les modèles d’IA, et quelqu’un chez Meta a estimé qu’il était utile de les comptabiliser pour savoir qui utilisait réellement l’IA. Le plus gros utilisateur avait consommé 281 milliards de jetons en un seul mois. L’usage total, suivi par le tableau de bord, a dépassé les 60 mille milliards de jetons avant que celui-ci ne soit supprimé.
Peu après, le Financial Times a rapporté un phénomène similaire chez Amazon. Les employés y automatiseraient des tâches inutiles précisément pour gonfler leurs chiffres d’utilisation de l’IA, créant artificiellement l’apparence d’un engagement dans la stratégie IA de l’entreprise.
Ce comportement a depuis été baptisé « tokenmaxxing », un terme issu du jargon Gen Z pour maximiser quelque chose — ici, il s’agit de la performance visible de l’utilisation de l’IA plus que l’impact réel de cet usage.
Deux des plus grandes entreprises mondiales, la même dynamique, et un nom qui laisse entendre que le phénomène se propage.
Le tokenmaxxing n’est pas tellement un problème technologique qu’un problème de culture d’entreprise et de gestion de la performance, et on y trouve l’empreinte des RH et des opérations — que les RH aient ou non participé aux décisions qui l’ont engendré.
Quelqu’un a défini l’incitation. Quelqu’un a construit ou toléré le classement. Quelqu’un a décidé que la consommation était un indicateur raisonnable de compétences. Cet article vise à comprendre comment cela se produit et comment l’éviter.
Pourquoi les mesures déraillent
Les organisations ne se fixent généralement pas pour objectif de créer des cultures du classement. Le tokenmaxxing émerge dans l’écart entre ce que les entreprises attendent réellement de l’IA et ce qu’elles arrivent à mesurer pour l’instant.
En février 2026, une enquête Gallup menée auprès de plus de 23 000 employés américains a révélé que la moitié des adultes en emploi utilisent l’IA au moins quelques fois par an, et que les salariés d’organisations adoptant l’IA rapportent davantage de perturbations et d’anxiété liée à l’emploi que ceux d’entreprises qui ne l’ont pas encore adoptée.
Pendant ce temps, selon Gartner, une seule initiative IA sur cinquante génère une valeur transformationnelle, et seulement une sur cinq délivre un ROI mesurable. Le rapport « État de l’IA 2025 » de McKinsey souligne que, malgré l’adoption rapide de l’IA, la plupart des organisations n’en retirent encore qu’une valeur limitée à l’échelle de l’entreprise.
Selon McKinsey, ce qui distingue les résultats à plus forte valeur ajoutée, c’est la refonte des processus et la gouvernance — pas le volume d’utilisation brut.
Mais les conseils d’administration et PDG ne perçoivent pas cette nuance. Ils ressentent l’urgence, et cette urgence se transmet en demandes de preuves visibles d’adoption, ce qui pousse les managers intermédiaires à vouloir montrer quelque chose. Quand il est impossible de mesurer si l’IA améliore vraiment les résultats, on mesure ce qui s’en rapproche le plus : l’activité. D’où l’apparition du tableau de bord.
Yakov Filippenko, PDG de la plateforme de réseautage professionnel Intch, fait le parallèle avec les politiques de retour au bureau. Selon lui, les entreprises ont en partie obligé leurs employés à revenir car les actionnaires possèdent des immeubles coûteux restés vides.
Aujourd’hui, les organisations brûlent des jetons pour montrer aux investisseurs qu’elles ne passent pas à côté de la révolution IA. Dans les deux cas, une pression légitime — visibilité pour les actionnaires, positionnement concurrentiel — débouche sur une mesure qui sert l’image plus que l’opérationnel.
Andrew Bosworth, CTO de Meta, a rendu cette logique explicite, affirmant publiquement que son meilleur ingénieur dépensait l’équivalent de son salaire en jetons IA, tout en étant « 5 à 10 fois plus productif ». « C’est comme de l’argent facile. Continuez. Pas de limite. »
Présenter la dépense de jetons comme un signal de productivité, de la part d’un dirigeant technologique d’une des entreprises les plus influentes du monde, n’est pas une opinion isolée. Cela reflète l’incapacité à distinguer corrélation et causalité. Le haut-performant utilise beaucoup de jetons, donc les jetons en viennent à sembler être la cause de la performance, plutôt qu’une conséquence.
L’erreur s’amplifie rapidement. Les managers exposés à ce discours venant du sommet n’ont même pas besoin d’un classement formel pour intégrer le message. Le comportement suit le signal, même si personne n’avait prévu de le lancer.
Le prix à payer
Les tableaux de bord d’usage étaient déjà une mesure peu fiable de la productivité IA avant même que quiconque ne commence à les manipuler.
Yasser Drif, fondateur de Roman AI, a partagé des données provenant de ses clients montrant que l’écart entre activité et résultats est plus important que ce que supposent la plupart des entreprises. Seuls environ 24 % des lancements IA initiés par un humain produisent un livrable utile. Le reste correspond à de l’itération et à du travail en cours que les métriques de volume transforment en fausse productivité. Voilà la norme. Le tokenmaxxing empire la situation.
Le premier coût est la corruption du signal. Dès que l’utilisation devient la métrique, les données d’utilisation deviennent peu fiables. Vous ne pouvez plus regarder qui consomme le plus d’IA et tirer des conclusions fiables sur qui est performant, apprend ou crée de la valeur.
Les données ont été manipulées, et vous ne saurez pas toujours par qui. Toute analyse de la main-d’œuvre construite dessus hérite de cette contamination.
Le second coût est encore plus profond. Quand les employés optimisent l’apparence de la maîtrise de l’IA plutôt que de la développer réellement, vous inversez les conditions d’apprentissage dont vous avez besoin. Le développement authentique de compétences en IA nécessite de l’expérimentation, y compris des essais non fructueux, et des retours honnêtes sur ce qui a fonctionné.
Une culture du « tokenmaxxing » crée une pression à afficher publiquement sa compétence, tandis que faire un retour honnête semble risqué. Ce sont des conditions incompatibles.
Le troisième coût concerne les employés qui ne cherchent à rien manipuler. Dans un environnement où la consommation de tokens est devenue visible et valorisée, la personne qui effectue un travail d’IA minutieux et bien ciblé, donnant de bons résultats mais sans générer de chiffres spectaculaires, commence à se sentir à la traîne.
Ce sentiment n’est pas corrigé par des paroles rassurantes. La façon la plus rapide de rendre le véritable développement de compétence IA anxiogène est de laisser croire à ceux qui n’exagèrent pas leurs chiffres qu’ils perdent une course dont ils ignorent les règles.
Amazon, à son crédit, a réagi au problème qu’il avait créé en limitant la visibilité des statistiques d’utilisation au sein des équipes afin que seuls les individus et leurs managers directs puissent les consulter. C’est une mesure corrective. Prévenir exige une action différente, plus en amont.
Comment prévenir le phénomène
Pour un DRH ou un COO, la question pratique est : par où commencer ? « Mesurer les résultats, pas les efforts » est vrai mais ne dit à personne ce qu’il doit changer dès lundi matin.
Commencez par un audit de ce qui est suivi actuellement et de qui y a accès. Filippenko signale comme un drapeau rouge immédiat tout indicateur d’adoption de l’IA directement lié à la rémunération.
C’est l’équivalent d’évaluer la performance d’un avocat en comptant le nombre de pages qu’il imprime, ou l’efficacité d’un développeur en lignes de code.
Yasser Drif, dont l’entreprise Roman AI développe des outils IA déployés en entreprise, propose une méthode concrète pour démarrer.
Récupérez 30 jours de données d’utilisation, classez par dépenses, et demandez ce qui a réellement été livré. La personne peut-elle montrer un livrable ?
Les signaux d’alerte surveillés par son équipe incluent : des utilisateurs gourmands en crédits mais sans livrable associé, le gonflement des interactions où une tâche accumule dix actions IA sans aucun changement de statut, et un champion IA unique consommant une part disproportionnée des crédits IA sans livrable à la clé. Si vos tableaux de bord ne permettent pas de répondre à la question « qu’est-ce qui a été livré ? », c’est la première chose à corriger.
Si votre organisation dispose de tableaux de bord IA visibles de tous, ou si le volume d’utilisation apparaît dans tout entretien annuel, fixation d’objectifs, ou reporting managerial, ce sont les lieux où le risque de « tokenmaxxing » est réel. La question n’est pas de savoir si la donnée est collectée — c’est sa visibilité qui génère ou non une pression compétitive sur le volume plutôt que la qualité.
La mesure des résultats IA dépend du métier. En vente, il s’agit de savoir si la prospection assistée par IA améliore le taux de conversion, pas du nombre de prompts envoyés. Dans les opérations, cela revient à mesurer si le temps de cycle ou le taux d’erreur diminue lors de processus assistés par IA, et non les logs d’utilisation du système.
Le principe de conception reste le même pour tous : mesurez ce qui a changé à la suite de l’utilisation de l’IA, pas l’utilisation en elle-même. Cela exige que les responsables métier et les RH définissent ensemble ce que « mieux » signifie avant de construire les cadres de mesure, et pas après.
Quel message envoyez-vous ?
La communication du leadership doit être recalibrée en même temps que les indicateurs. Si les seuls messages que les employés entendent sur l’IA concernent les taux d’adoption et les étapes d’utilisation, le signal implicite est que ce qui importe, c’est la consommation observée.
Les dirigeants qui souhaitent développer de véritables compétences en IA doivent parler de résultats concrets, là où l’IA a changé la façon de travailler d’une équipe, ce qu’une expérience particulière a appris à l’organisation, où un déploiement a échoué et ce que cela a révélé. Ce type de récit indique que l’organisation valorise l’apprentissage, et non la simple performance liée à l’apprentissage.
Redresser la barre dans une équipe où le tokenmaxxing est déjà présent demande de la délicatesse. Les employés qui ont biaisé un indicateur réagissaient généralement à un signal envoyé par la direction. Le traiter uniquement comme un problème de conduite individuelle fait l’impasse sur cette réalité et crée précisément les conditions dans lesquelles un retour d'information honnête est perçu comme risqué.
« Lorsque vos employés sont prêts à effectuer un travail inutile juste pour cocher une case, il ne s’agit pas d’un problème de mesure, explique Filippenko. Il s’agit d’une pourriture opérationnelle. »
Le corriger implique que les dirigeants reconnaissent le signal qu’ils ont envoyé avant de demander aux gens de changer leur comportement.
L’attitude la plus productive pour les managers est de redéfinir ce qui compte vraiment pour l’organisation, puis d’offrir aux équipes un moyen de démontrer leurs véritables compétences. Cela signifie reconnaître des exemples visibles de réussite fondée sur des résultats, et pas simplement supprimer l’ancien indicateur.
L’intervention suggérée par Drif est franche et mérite réflexion : renommer l’indicateur publiquement, en passant de « utilisation de l’IA » à « travail accompli avec l’IA ». Ce changement de nom envoie lui-même le signal de ce que l’organisation valorise réellement, sans que personne n’ait besoin d’être désigné pour le comportement induit auparavant.
Naviguer dans l’ambiguïté
La discipline la plus profonde ici est la patience face à l’ambiguïté. La plupart des organisations ne sont pas encore en mesure de mesurer précisément la contribution de l’IA aux résultats commerciaux, et la pression pour montrer des progrès en attendant est réelle. Les tableaux de bord et classements comblent ce vide parce qu’ils produisent des chiffres, et que les chiffres donnent une impression d’imputabilité.
Le problème, c’est que l’imputabilité qu’ils produisent porte sur le mauvais sujet. Construire des systèmes de mesure qui rendent les gens responsables des résultats prend plus de temps et exige une collaboration interdisciplinaire plus poussée, mais c’est la seule approche qui ne corrompra pas les données dont vous aurez besoin plus tard pour prendre de meilleures décisions.
Le tokenmaxxing est un signal précoce, pas une finalité. Considérez-le comme un indicateur de culture à prendre très au sérieux dès maintenant, et vous obtiendrez par la suite des données de performance bien plus propres, et une adoption de l’IA nettement plus saine.
