KI-Feedback: KI-generiertes Feedback verbessert die Leistung von Mitarbeitenden stärker als menschliches Feedback, sofern der Ursprung nicht offengelegt wird.
Offenbarungseffekt: Die Offenlegung, dass Feedback von KI stammt, führt zu Widerstand und schlechteren Leistungen aufgrund von Vertrauensproblemen.
Vertrauenskrise: Das Vertrauen der Mitarbeitenden in den KI-Einsatz durch Arbeitgeber ist gering, viele sehen darin eine Zunahme von Vorurteilen.
Transparenzstrategie: Es wird empfohlen, KI-Einsatz im Feedbackprozess offen zu kommunizieren, um langfristige Vertrauensbrüche zu vermeiden.
Langfristige Auswirkungen: Die Entscheidung zwischen Transparenz und Verschleierung spiegelt die Werte einer Organisation wider und beeinflusst deren Resilienz.
Die besten Feedbacksysteme zur Leistungsbeurteilung funktionieren in gewisser Hinsicht wie ein Zaubertrick: Sie sind dann am wirkungsvollsten, wenn man nicht weiß, wie der Trick funktioniert.
Eine 2021 im Strategic Management Journal veröffentlichte Studie ergab, dass von KI generiertes Feedback die Mitarbeitendenleistung stärker verbessert als Feedback menschlicher Führungskräfte. Der Haken? Es funktionierte nur, wenn die Beschäftigten glaubten, dass es von einer menschlichen Führungskraft stammte. Wird die Methode enthüllt, ist der Zauber weg.
Das Feedback war konsistenter, stärker personalisiert und objektiv wirksamer bei der Leistungssteigerung, doch sobald die Mitarbeitenden erfuhren, dass Algorithmen die Leistungsrückmeldungen erzeugten, waren die Verbesserungen dahin.
Genau jenes Feedback, das als menschliche Rückmeldung zu besseren Ergebnissen führte, rief Widerstand, geringeres Engagement und schlechtere Leistung hervor, sobald die Mitarbeitenden dessen wahren Ursprung kannten. Die Forschenden nannten das den "Disclosure Effect" – einen messbaren Leistungsabfall, verursacht allein durch das Wissen um KI-Beteiligung.
Der Einsatz von KI im Leistungsmanagement ist heute immer üblicher, genauso wie KI in vielen anderen Lebensbereichen angesichts der Verbreitung von KI-Tools wie ChatGPT, Claude und Gemini integriert wird. Doch die Tatsache, dass die Nutzung zunimmt, bedeutet nicht automatisch, dass auch das Vertrauen steigt.
Für HR-Leitungen, die sich mit der Einführung von KI auseinandersetzen, schafft das von den Forschern 2021 entdeckte Paradoxon eine nahezu unmögliche Lage: Setzt man KI-Feedbacksysteme transparent ein, gehen Leistungsgewinne verloren. Verheimlicht man die KI-Nutzung, drohen schwerwiegende Vertrauensverluste, wenn die Wahrheit ans Licht kommt.
Diese Entscheidung offenbart etwas Grundsätzliches darüber, worauf Organisationen ihre Optimierung ausrichten. Geht es um die Zahlen dieses Quartals oder um langfristige Transformationsfähigkeit?
Der Kontext der Vertrauenskrise
Der Disclosure Effect tritt nicht im luftleeren Raum auf. Aktuelle Forschung von SHL zeigt: Nur 27 % der Beschäftigten vertrauen ihren Arbeitgebern voll und ganz, dass sie KI in HR-Entscheidungen verantwortungsvoll einsetzen. Noch alarmierender: 59 % glauben, dass KI Vorurteile am Arbeitsplatz verschlimmert, statt sie zu verringern.
Damit tritt das Paradoxon noch deutlicher zutage. Die Technologie, die besseres und weniger voreingenommenes Feedback liefern könnte, wird von der Mehrheit der Empfangenden misstraut. Und die Forschung legt nahe, dass dieses Misstrauen selbstverstärkend wirkt. Zu wissen, dass KI beteiligt ist, verschlechtert die Leistung, ganz unabhängig von der Qualität des Feedbacks selbst.
Dr. Ryne Sherman, Chief Science Officer bei Hogan Assessments, das mit über 75 % der Fortune-500-Unternehmen arbeitet, sieht zwei Faktoren, die Widerstand bei Beschäftigten hervorrufen:
Der erste ist die Annahme, dass KI die Nuancen des Arbeitsumfelds nicht würdigen kann. Wir gehen davon aus, dass ein menschlicher Leistungsbeurteiler ein besseres Gefühl für den organisatorischen Kontext hat und Leistungen eher anerkennt, die nicht von einem Computer leicht gezählt werden können.
Der zweite Faktor greift tiefer. Es geht nicht darum, ob KI Leistung akkurat bewerten kann, sondern darum, was die Entscheidung für KI über die Haltung der Organisation gegenüber ihren Mitarbeitenden aussagt.
„Das Fehlen menschlichen Einflusses lässt Mitarbeitende das Gefühl bekommen, sie würden einfach als buchstäbliche Humanressourcen verarbeitet, ohne Empathie oder echtes Interesse an ihrem Wohlergehen als Menschen“, sagt Sherman. „Unsere Forschung zeigt, dass die wirksamsten Führungskräfte echtes Interesse am Wohlergehen ihrer Mitarbeitenden zeigen. Der Einsatz von KI bei Leistungsbewertungen vermittelt den Eindruck, dass die Führung einer Organisation sich tatsächlich nicht für ihre Beschäftigten interessiert.“
Ob diese Annahmen zutreffen, ist weniger wichtig, als die Tatsache, dass sie existieren. Die Wahrnehmung der Mitarbeitenden bestimmt das Verhalten und das Verhalten wiederum die Leistung.

Warum Täuschung nicht funktioniert
Organisationen, die sich die Leistungsvorteile von KI sichern wollen, ohne dem Disclosure Effect zu unterliegen, stehen vor einem praktischen Problem: Die Mitarbeitenden wissen es ohnehin schon.
Edie Goldberg, Arbeits- und Organisationspsychologin sowie Autorin des demnächst erscheinenden Buches Performance Enablement, weist auf die verräterischen Anzeichen hin, die KI-generiertes Feedback entlarven.
Die meisten Mitarbeiter können erkennen, ob das Feedback von einem Computer mit all den Gedankenstrichen geschrieben wurde. Diese Art von Feedback mangelt häufig an der Spezifität, die ein Manager liefern könnte.
Die stilistischen Muster von KI-generierten Texten sind mittlerweile so wiedererkennbar, dass der Versuch, deren Beteiligung zu verbergen, zwecklos erscheinen mag. Selbst wenn Organisationen die Nutzung von KI nicht explizit offenlegen, erkennen Mitarbeitende die algorithmischen Fingerabdrücke.
Das untergräbt die gesamte Versteckstrategie. Wenn Mitarbeiter KI-Beteiligung vermuten, aber nicht direkt informiert werden, erleben Organisationen das Schlechteste aus beiden Welten: Den Leistungsabfall durch wahrgenommene KI-Nutzung kombiniert mit dem Vertrauensbruch durch versuchte Täuschung.
Goldbergs empfohlener Ansatz umgeht dieses Paradoxon vollständig.
Die Unterscheidung ist wichtig. KI kann Feedback aus verschiedenen Perspektiven wie Kollegen, Kunden, internen Kommunikationsplattformen zusammenführen und mit harten Daten aus internen Systemen kombinieren.
„All diese Faktoren machen das Feedback von Natur aus gerechter, weil es nicht nur die Sichtweise einer einzelnen Person ist“, sagt Goldberg und verweist auf die umfangreiche Forschung zur Voreingenommenheit von Führungskräften bei Leistungsbewertungen.
Aber der Fairnessvorteil tritt nur ein, wenn die Mitarbeiter dem Prozess vertrauen. Goldberg beschreibt dies eher als ein Problem der Arbeitsteilung denn als ein Problem der Transparenz. Setzen Sie KI für Aggregation und Mustererkennung ein, wo sie ihre Stärken hat. Lassen Sie den Menschen weiterhin die Verantwortung für Kontext, Spezifität und Beziehungsaspekte, die Mitarbeiter brauchen, um Feedback als authentisch zu empfinden.
Am Ende geht es nicht darum, die Rolle von KI zu verbergen, sondern sie neu zu definieren.
Die Transparenz-zuerst-Position
Kate O'Neil, Geschäftsführerin der Performance-Management-Plattform Opre, hat ihr gesamtes Produkt darauf aufgebaut, den Ansatz „Verstecke die KI“ abzulehnen. Jegliches Feedback, das Opre-Nutzer erhalten, ist eindeutig als KI-generiert gekennzeichnet und weder Führungskräfte noch Mitarbeiter können es manipulieren, um es wie von Menschen geschrieben erscheinen zu lassen.
Es sollte niemals Verwirrung darüber herrschen, was von KI erzeugt wurde und was von Menschen stammt. Schließlich können wir nur dann ‘den Menschen im Prozess behalten’, wenn klar ist, was menschlich ist und was KI-generiert ist. Ein Mangel an Klarheit darüber, wer Feedback erstellt, dient letztlich nur dazu, die Führungsverantwortung zu verwässern.
Die Design-Philosophie von Opre konzentriert sich auf das, was O'Neil als ein "Manager-und-Mitarbeiter gegen Opre"-Modell bezeichnet. Das System sendet Leistungs-Insights gleichzeitig an beide Parteien und schafft so eine gemeinsame Diskussionsgrundlage, statt eine einseitige Bewertung von oben herab.
In ihrem nächsten Einzelgespräch besprechen Führungskraft und Mitarbeiter, was Opre richtig erkannt hat, was fehlte und worin möglicherweise Kontextmissverständnisse bestehen.
„Damit wird die viel weniger produktive Dynamik ersetzt, die wir heute häufig sehen: Führungskraft gegen Mitarbeiter – besonders, wenn die Leistung gering ist oder Leistungsbeurteilungsgespräche vermieden werden“, erklärt O'Neil.
O'Neil räumt jedoch ein, dass sie keine Vergleichsdaten hat. „Ich weiß nicht, ob es sich darauf ausgewirkt hat, dass die Mitarbeiter wissen, dass das Feedback von KI generiert wurde – denn ich habe keine Gruppe von Mitarbeitern, die das nicht wussten, als Vergleichsbasis.“
Auf die Frage, ob sie durch den Fokus auf Transparenz Leistungsgewinne verschenkt, bleibt O'Neil unbeirrt.
Ich glaube nicht, dass die Kenntnis, dass es KI-generiert ist, die Wirksamkeit torpediert. Ich denke, die Illusion, dass Feedback authentisch ist, wenn es das nicht ist, zerstört das Vertrauen und die sozialen Verträge zwischen Managern und Teams. Verlust von Vertrauen bedeutet Leistungsabfall.
Sie geht in der Frage der Voreingenommenheit noch weiter. Selbst wenn KI-generiertes Feedback kurzfristig objektiv Vorurteile reduziert, führt die Verschleierung der Quelle zu einem Vertrauensproblem, das letztlich mit der Zeit die Vorurteile erhöht.
„Wenn KI-generierte Inhalte tatsächlich Vorurteile reduzieren, Mitarbeitende aber den Eindruck haben, dass sie verstärkt werden, wird das langfristige Ergebnis sein, dass das Vertrauen zerstört wird“, erklärt O'Neil. „Wenn Führungskräfte KI-generiertes Feedback als ihr eigenes ausgeben, schadet dies dem Vertrauensverhältnis zu ihrem Team, und das führt später zu mehr Voreingenommenheit.“
Deshalb verhindert das System von Opre, dass Führungskräfte KI-generierte Erkenntnisse bearbeiten oder beschönigen. Sowohl Führungskraft als auch Mitarbeitende erhalten das identische Feedback gleichzeitig, was Täuschung ausschließt. Führungskräfte und Mitarbeitende können Kontext hinzufügen oder das System um eine Erklärung bitten, aber sie können die erzeugten Inhalte nicht verändern.
Ihre Position beruht auch auf einer Überlegung bezüglich des Zeithorizonts. Unternehmen können entweder auf sofortige Leistungskennzahlen optimieren oder auf die Fähigkeit, sich über Jahre hinweg zu transformieren. Beide Zielsetzungen, so ihre Auffassung, lassen sich beim Einsatz von KI nicht miteinander vereinbaren.
„Intransparenz ist keine Leistungsstrategie“, sagt sie. „Es ist eine kurzfristige Ausbeutungsstrategie. Man bekommt vielleicht einen plötzlichen Leistungsschub, wenn die Mitarbeitenden versuchen, die neuen Regeln zu verstehen. Aber schon bald gehen die besten Leute, der Rest ist überfordert, und die Fähigkeit, neue Talente zu gewinnen, wird zerstört.“
Wenn Vertrauen zerbricht
Sowohl Goldberg als auch Sherman warnen, dass Täuschung beim Einsatz von KI Konsequenzen hat, die etwaige kurzfristige Leistungsgewinne weit übersteigen.
„Vertrauen ist leicht zu zerstören und sehr schwer wieder aufzubauen“, sagt Goldberg. „Es gibt hier keinen Nutzen, nur Risiken.“
Diese Warnung ist kein reines ethisches Statement. Goldberg und Sherman arbeiten beide in Umgebungen, in denen sie die Folgen von gebrochenem Vertrauen in vielen Organisationen erleben. Ihre Sicherheit, dass Täuschung scheitert, basiert auf Mustererkennung statt auf philosophischer Überzeugung.
„Es ist katastrophal für Unternehmen, sich auf betrügerische Praktiken bei Leistungsbeurteilungen einzulassen“, warnt Sherman. „Erstens – in keiner Organisation, egal welcher Größe, gibt es die geringste Hoffnung, dass die Täuschung nicht ans Licht kommt. Jedes Unternehmen hat Informationslecks, und solche Informationen werden definitiv nach außen dringen.“
Die Folgen wären nach Shermans Einschätzung gravierend.
„Sobald diese Informationen publik werden, fällt das Vertrauen in die Organisation auf ein absolutes Minimum“, sagt er. „Mitarbeitende werden protestieren, kündigen und womöglich – noch schlimmer – vollkommen resignieren.“
Seine Empfehlung für Unternehmen in einer solchen Lage ist kompromisslos. Die Mitarbeitenden werden Verantwortung einfordern, was vermutlich bedeutet, dass die involvierten Führungskräfte entfernt werden.
„Selbst dann“, sagt er, „muss das Unternehmen eine radikale Transparenz im gesamten Leistungsbeurteilungsprozess in Betracht ziehen, um überhaupt damit beginnen zu können, Vertrauen zurückzugewinnen.“
Goldbergs Rat für Organisationen in einer solchen Situation ist direkter, kommt aber zum gleichen Ergebnis.
Was die Entscheidung offenbart
Die Frage, ob der KI-Einsatz im Performance Management offengelegt wird, wird selten als Entscheidung zwischen Leistung und Vertrauen gerahmt. Häufiger ist sie als technische Implementierungsfrage oder als Change-Management-Herausforderung dargestellt. Die Forschung aber legt nahe, dass sie vielmehr ein Lackmustest für die Werte einer Organisation ist.
Unternehmen, die auf kurzfristige Leistungskennzahlen optimieren, haben einen klaren Anreiz, den KI-Einsatz zu verschweigen. Der Deploymenteffekt ist real und messbar.
Unternehmen, die für langfristige Transformation bauen, können sich einen Vertrauensbruch nicht leisten – selbst wenn das bedeutet, eine geringere unmittelbare Performance in Kauf zu nehmen.
Es gibt zudem eine problematische soziale Komponente, die Praktiker selten direkt ansprechen. In Unternehmen, die den KI-Einsatz nur teilweise offenlegen: Wer bekommt Einsicht? Erhalten Führungskräfte transparente KI-Systeme, während Beschäftigte an der Front mit verstecktem KI-Feedback arbeiten müssen? Die Vertrauenskücke zwischen Führung und Mitarbeitenden ist ohnehin schon groß. Selektive Offenlegung könnte sie endgültig ruinieren.
Shermans Argument über die Unvermeidbarkeit der Entdeckung verdient besondere Betonung. In einer Zeit, in der Mitarbeitende interne Kommunikation per Screenshot festhalten, anonym auf Bewertungsseiten posten und sich über private Slack-Channels organisieren, ist die Vorstellung, dass der KI-Einsatz bei Leistungsbeurteilungen geheim bleiben könnte, schlicht unrealistisch.
Nimmt man Goldbergs Beobachtung hinzu, dass Mitarbeitende bereits heute KI-generierte Texte an deren Muster erkennen, wirkt das Versteckspiel wie eine Verzögerungstaktik statt wie eine echte Strategie.
Die Frage ist also nicht mehr, ob Mitarbeitende es herausfinden – sondern was passiert, wenn es soweit ist.
AI Transparency in Performance Management
Eine andere Anwendung
Goldberg sieht das eigentliche Potenzial von KI im Leistungsmanagement in einer ganz anderen Richtung: Echtzeit-Feedback statt jährlicher oder vierteljährlicher Beurteilungen.
„KI-Systeme können in genau dem Moment viel Feedback liefern, in dem es am nützlichsten ist“, erklärt sie. „Doch KI kann all diese Feedbackpunkte über einen Leistungszeitraum hinweg integrieren, um ein ausgewogeneres und weniger voreingenommenes Bild der individuellen Leistung zu schaffen. Das ist die Stärke von KI im Leistungsmanagement, nicht einfach nur das Schreiben der Beurteilung.“
Das verändert die Frage der Offenlegung. Wenn KI unmittelbares, kontextbezogenes Feedback zu bestimmten Handlungen liefert — indem sie beispielsweise meldet, wenn Projektzeitpläne aus dem Ruder laufen, Kooperationsmuster sich ändern oder die Kommunikationshäufigkeit sinkt —, ist die Quelle weniger wichtig als die Aktualität. Mitarbeitende können den direkten Zusammenhang zwischen ihrem Handeln und dem Feedback sehen, was das Vertrauen in die Genauigkeit des Systems stärkt, anstatt es zu untergraben.
Die von KI geschriebene jährliche Leistungsbeurteilung löst nach wie vor den Offenlegungseffekt aus, da hier versucht wird, menschliches Urteil in einem Kontext zu ersetzen, in dem Beziehung und Autorität zählen.
Echtzeit-Feedback von KI bewegt sich in einer anderen Sphäre. Es will keine menschliche Weisheit vortäuschen, sondern bietet datengetriebene Beobachtungen, die Menschen in dieser Skalierung nur schwer leisten könnten.
Ob dieser Ansatz tatsächlich den Leistungsabfall vermeidet, den die Offenlegung verursacht, ist nach meinem Wissen in großem Maßstab noch nicht getestet worden, und die Wahrnehmung dazu könnte sich verändern, je vertrauter man mit der Funktionsweise von KI wird. Doch es deutet darauf hin, dass die Debatte „verbergen oder offenlegen“ vielleicht die falsche Frage zu einer falschen Anwendung der Technologie stellt.
Die ungelöste Frage
Für Führungskräfte, die heute Entscheidungen zur Einführung von KI treffen, bieten die Forschungsergebnisse keine komfortablen Optionen.
Die Verfechter von Transparenz — O'Neil, Goldberg, Sherman — argumentieren, dass das Verbergen von KI-Einsatz einen Vertrauensverlust garantiert, wenn es herauskommt, und Mitarbeitende KI-generierte Texte ohnehin erkennen. Es ist besser, mittels Ehrlichkeit KI-bereite Kulturen aufzubauen, auch wenn dies kurzfristig auf Kosten der Leistung geht.
Das Gegenargument lässt sich schwerer entkräften, als es scheint. Wenn KI-Feedback objektiv Vorurteile reduziert, für konsistentere Bewertungen sorgt und die Ergebnisse verbessert, ist Transparenz dann ein teurer Luxus, der vor allem dazu dient, dass sich HR-Leitende ethisch fühlen?
Keine der beiden Seiten kann auf Langzeitdaten verweisen, die zeigen, was drei Jahre nach der Einführung von transparentem KI-Feedback passiert. Die Technologie hat sich zu schnell entwickelt und die Einsätze sind zu aktuell. Doch die Wahl offenbart, was Führungskräfte über ihre Belegschaft denken und wozu sie bereit sind, um Ergebnisse zu erzielen.
Organisationen, die sich für Intransparenz entschieden haben, gingen die Wette ein, dass Leistungssteigerungen die spätere Vertrauenskrise wert sein würden. Wer sich für Transparenz entschieden hat, setzt darauf, dass KI-bereite Kulturen aufzubauen Ehrlichkeit über die Rolle von KI erfordert – auch wenn das kurzfristig Leistung kostet.
Die Forschung zeigt, was unmittelbar nach der Offenlegung geschieht. Was wir noch nicht mit Sicherheit beantworten können, ist, welcher Ansatz langfristig widerstandsfähigere und leistungsstärkere Organisationen hervorbringt.
Bislang bleibt das eine Frage von Philosophie, Risikobereitschaft und davon, welche Art von Organisation Führungskräfte aufbauen wollen.
