Amazons Tool: Amazon stellte ein voreingenommenes Einstellungs-Tool ein, das auf ein Jahrzehnt männlich dominierter Einstellungsdaten trainiert war.
Bedenken wegen Voreingenommenheit: Die Bewertung von KI-Systemen ließ den Fokus auf faire Ergebnisse vermissen, was zu unbeachteten Vorurteilen und Governance-Lücken führte.
Governance-Rollen: Das HR spielt eine zentrale Rolle bei der KI-Governance, um faire Ergebnisse und transparente Prozesse für Mitarbeitende zu gewährleisten.
Hochriskante KI: Der EU KI Act stuft KI im Personalwesen als hochriskant ein und verlangt strenge Dokumentation und Kontrolle.
Die Herausforderung des HR: Dem HR fehlt die Autorität in der KI-Governance und es braucht die Unterstützung der Geschäftsführung, um Standards und Verantwortlichkeiten zu setzen.
Im Jahr 2018 stellte Amazon die Entwicklung eines über Jahre hinweg aufgebauten Machine-Learning-Tools zur Lebenslauf-Sichtung ein. Das System war mit einem Jahrzehnt an Einstellungsdaten trainiert worden, die die historische Vorliebe des Unternehmens für männliche Bewerber in technischen Rollen widerspiegelten.
Das Modell lernte dieses Muster und reproduzierte es, indem es Lebensläufe abwertete, die Begriffe wie „Frauen-“ enthielten, und Absolventinnen von reinen Frauenhochschulen benachteiligte. Amazons Ingenieure versuchten, dies zu korrigieren. Sie konnten jedoch nicht garantieren, dass der Bias nicht an anderer Stelle wieder auftauchen würde, also legten sie das Projekt still.
Die Geschichte wird oft als warnendes Beispiel für KI und Vorurteile zitiert. Was seltener beleuchtet wird, ist die strukturelle Frage, die sie aufwirft: Wer war ursprünglich dafür zuständig, dies zu erkennen?
Die technischen Teams, die das System entwickelten, konzentrierten sich darauf, ob es funktionierte. Die Rechtsabteilung achtete vermutlich auf Haftungsrisiken. Keiner war offenbar primär damit beauftragt zu überwachen, ob das System faire Ergebnisse für die geprüften Menschen produzierte – zumindest nicht als Hauptaufgabe der Governance.
Dieses Problem ist in den meisten Unternehmen weiterhin ungelöst. Tatsächlich ist es, da der unternehmensweite Einsatz von KI gewachsen und beschleunigt wurde, noch schwerer greifbar geworden.
Die zwei aktuell beantworteten Fragen
Die meisten KI-Governance-Rahmenwerke in Unternehmen wurden entworfen, um zwei Kategorien von Fragen zu beantworten.
Die erste ist juristischer Natur: Welche Haftungsrisiken bestehen, wenn das System versagt, diskriminierende Ergebnisse erzeugt oder regulierte Daten preisgibt?
Die zweite ist technischer Natur: Welche Ausfallarten gibt es, mit welchen Daten wurde das System trainiert, wo liegen Sicherheitslücken? Beide Kategorien sind wichtig. Keine ist für sich allein ausreichend, denn keine wurde mit der Hauptverantwortung gegenüber den betroffenen Menschen entwickelt.
Das ist keine Kritik an der Rechtsabteilung oder IT. Diese Funktionen haben Governance-Strukturen aufgebaut, um genau die Fragen zu beantworten, für die sie zuständig sind. Das Problem ist, dass der KI-Einsatz so rasch voranschritt, dass Zeit für bewusste Diskussionen über verbleibende Fragestellungen fehlte, und viele Organisationen einfach auf bestehende Rahmenwerke zurückgriffen.
Laut der Responsible AI-Umfrage von PwC für 2025 geben 56 % der Führungskräfte an, dass ihre Erstlinien-Teams – IT, Technik, Daten und KI – inzwischen verantwortliche KI-Initiativen leiten. HR taucht in dieser Statistik praktisch nicht auf.
Laut Pacific AI’s 2025 Governance-Umfrage haben drei Viertel der Unternehmen KI-Nutzungsrichtlinien etabliert, aber nur 36 % haben ein formelles Governance-Rahmenwerk eingeführt – also definierte Rollen, Kontrollen und Durchsetzung. Genau in der Lücke zwischen Policy-Dokument und echter Verantwortung bleiben die Fragen zu den Auswirkungen auf Menschen unbeantwortet.
Das EU-KI-Gesetz, das ab 2024 schrittweise Durchsetzungsanforderungen vorgibt, ordnet KI-Systeme, die im Bereich Beschäftigung und Workforce Management eingesetzt werden, als Hochrisiko-Systeme ein. Diese Kategorie umfasst Tools für Rekrutierung, Leistungsbewertung, Aufgabenzuweisung und Überwachung – praktisch die Tool-Suite, die Unternehmen derzeit großflächig ausrollen.
Die Hochrisiko-Klassifizierung verlangt strengere Anforderungen an Dokumentation, Transparenz und menschliche Aufsicht. Sie bestimmt aber nicht, wer im Unternehmen dafür zuständig ist, diese Anforderungen zu erfüllen. Diese Entscheidung wird an das Unternehmen zurückgegeben.
In den meisten Organisationen gilt: „Wer schon die Governance besitzt", ist dafür zuständig. Das sind meist Rechtsabteilung, Compliance oder IT-Sicherheit – die Funktionen mit eingeführten Frameworks. HR wird häufig lediglich als Stakeholder eingebunden oder bei der Umsetzung konsultiert. Die Führung übernimmt es selten.
Die Fragen, die ausgelassen werden
Die entscheidenden Fragen, ob KI tatsächlich Menschen schadet, lassen sich nicht einfach auf juristisches Risiko oder technische Fehler abbilden. Sie erfordern einen anderen Ausgangspunkt.
Erzeugt dieses System verzerrte Ergebnisse über verschiedene demografische Gruppen hinweg?
Um diese Frage zu beantworten, muss man wissen, was in einem bestimmten Beschäftigungsumfeld als fair gilt – nicht nur, was rechtlich vertretbar ist. Das sind unterschiedliche Maßstäbe.
Ein System kann juristisch unangreifbar sein, aber dennoch systematisch schlechtere Ergebnisse für eine bestimmte Mitarbeitergruppe liefern. Um das zu erkennen, braucht es jemanden, der versteht, wie faire Beschäftigungspraktiken aussehen, und der befugt ist, darauf hinzuweisen, wenn das System davon abweicht.
Werden Mitarbeitende auf Basis von Daten bewertet, die sie nicht verstehen oder von denen sie nichts wussten?
Laut der Owl Labs Arbeitsplatzstudie 2025 sind 20,5 % der Mitarbeitenden unsicher, ob überhaupt ein Monitoring stattfindet, und 12,8 % wissen nicht, was erfasst wird.
Dies ist kein Randthema. 61 % der US-Unternehmen setzen mittlerweile KI-gestützte Analysen ein, um die Produktivität oder das Verhalten der Mitarbeitenden zu messen. Ob die Mitarbeitenden wissen, dass dies geschieht, verstehen, wie dies in ihre Bewertungen einfließt, und ob sie überhaupt eine Möglichkeit haben, die Ergebnisse des Systems anzufechten, sind Fragen, die das Beschäftigungsverhältnis betreffen. Sie gehören zu der Funktion, die das Arbeitsverhältnis verantwortet.
Wer entscheidet, wann eine KI-Empfehlung übergangen wird – und auf welcher Grundlage?
In Organisationen, in denen KI-Tools Entscheidungen beeinflussen oder unterstützen – etwa bei Einstellung, Beförderung, Leistungsbeurteilung oder Kündigung – zählt die Frage nach dem "Override" zu den wichtigsten Governance-Entscheidungen, die ein Unternehmen treffen kann.
Wenn man diesen Punkt in die eine Richtung falsch setzt, bleiben KI-Empfehlungen ohne Kontrolle. In die andere Richtung wird das System lediglich zu einem Alibi-Instrument oder zu teurer Infrastruktur, der niemand vertraut.
Diese Schwelle zu kalibrieren, erfordert sowohl ein Verständnis dafür, wie das Tool funktioniert, als auch dafür, wie Führungskräfte Entscheidungen treffen, wo Vorurteile die menschliche Beurteilung beeinflussen und wie Rechenschaftspflicht aussieht, wenn Resultate angezweifelt werden.
Keine dieser Fragen finden sich standardmäßig in den meisten Unternehmens-Governance-Frameworks wieder. Sie verlangen Fachkompetenz aus HR und Organisationsdesign, nicht aus den Bereichen Recht oder Technik.
Die Accountability Map
Was im Rahmen der KI-Governance in den Zuständigkeitsbereich von HR fällt, ist keine Frage von Präferenz oder Organisationstaktik – es ergibt sich aus der Funktion: HR ist die Unternehmensfunktion mit der primären Verpflichtung gegenüber den Mitarbeitenden, von fairer Behandlung über Entwicklung bis zu ihren Rechten im Arbeitsverhältnis.
Diese Verpflichtung verschwindet nicht, wenn KI in die Prozesse eingeführt wird – sie wird lediglich komplexer.
Einige Accountability-Entscheidungen liegen naturgemäß in der Verantwortung von HR und nicht nur kraft Zuweisung.
Bias-Auditing in Beschäftigungs-KI ist am direktesten
Technische Teams können testen, ob ein Modell über verschiedene Eingaben hinweg konsistent arbeitet. Nur HR kann beurteilen, ob diese konstante Performance im Kontext auch zu fairen Ergebnissen führt – und ob das Leistungsbewertungstool, das alle nach den gleichen Kriterien bewertet, in der Praxis Bewertungsverteilungen erzeugt, die Mitarbeitende bestimmter Rollen, Regionen oder demografischer Gruppen benachteiligen.
Dies erfordert Zugang zu HR-Daten, Wissen über Arbeitsrecht und Gleichbehandlungsstandards sowie den Status in der Organisation, um auf Entdecktes reagieren zu können.
Transparenzpflichten gegenüber Mitarbeitenden
Mitarbeitende haben ein Interesse daran zu verstehen, wann KI genutzt wird, um Entscheidungen über sie vorzubereiten, welche Daten verwendet werden und wie Schlussfolgerungen gezogen werden.
In manchen Ländern haben sie darauf sogar gesetzliche Ansprüche. Ob ein Unternehmen diese Verpflichtungen durch Richtlinien, Schulungen oder Prozessgestaltung einlöst und ob diese als Mindeststandard oder echte Richtschnur betrachtet werden, hängt von den HR-Praktiken ab.
Die Befugnis zum Override
Das menschliche Überschreiben („Override“) ist nuancierter und folgenreicher, als meist angenommen wird. Die Frage, wann ein Mensch eine KI-Empfehlung übergehen kann oder muss, setzt voraus, zu wissen, wo KI-Tools Fehlerquellen haben, wann menschliches Urteil zuverlässiger ist und wie man Verantwortlichkeit in Override-Entscheidungen einbaut, damit sie nicht zu einem neuen Einfallstor für Vorurteile werden.
Dazu braucht es jemanden, der sowohl das Tool als auch das organisationale Verhalten drumherum versteht. HR, in enger Kooperation mit den KI-Implementierungsteams, ist hierfür am besten aufgestellt.
Rechtsmittel für Mitarbeitende
Was passiert, wenn jemand glaubt, dass eine von KI beeinflusste Entscheidung falsch war, gehört zur HR-Governance. Nicht nur deshalb, weil HR für Beschwerdeprozesse zuständig ist, sondern weil das Design von Rechtsmitteln ein Nachdenken darüber verlangt, wie Streitfälle rund um KI-Ausgaben geprüft werden, welche Beweismittel zur Verfügung stehen und welche Abhilfen möglich sind.
Die Rechtsabteilung definiert das Minimum. Die Personalabteilung bestimmt, ob die Organisation es wirklich ernst meint.
Technische Fachkompetenz
Es gibt einen berechtigten Einwand gegen die Annahme einer von HR geführten KI-Governance, den es wert ist, direkt zu adressieren. Die Personalabteilung verfügt nicht immer über die technische Fachkompetenz, um KI-Systeme zu bewerten.
Das stimmt. Aber Governance-Verantwortung und technische Bewertung sind unterschiedliche Dinge. Die Rechtsabteilung programmiert nicht und die Finanzabteilung führt nicht die Ingenieurprozesse durch, die sie prüft.
Die Funktion, die einen Governance-Bereich verantwortet, muss nicht unbedingt die technische Arbeit machen, sondern braucht die Stellung und die fachliche Kompetenz, Standards zu setzen, Ergebnisse zu bewerten und andere zur Verantwortung zu ziehen.
Was HR braucht, um die Führung bei der KI-Governance zu übernehmen, ist kein Team aus Informatikern. Es braucht Klarheit darüber, welche Fragen sie beantworten muss, die organisatorische Autorität, diese Fragen zu stellen, und Zugang zu den dafür benötigten technischen und datenbezogenen Ressourcen.
In den meisten Unternehmen hat HR derzeit von allen drei Bereichen nur eingeschränkte Ausführungen. Die organisatorische Autorität ist oft am schwersten aufzubauen, da sie von den Chief Human Resource Officers verlangt, Governance-Bereiche zu beanspruchen, die bislang meist von anderen Funktionen besetzt wurden.
Dieser Anspruch muss auf Ebene der Unternehmensleitung eingefordert werden. Ein KI-Governance-Komitee, das ausschließlich in der Rechts- und IT-Abteilung angesiedelt ist, wird rechtliche und technische Risikorahmen schaffen. HR als Teilnehmer in den Rahmenwerken anderer zu ergänzen, ändert nicht, wessen Fragen zuerst beantwortet werden.
CHROs, mit denen ich spreche und die eine wirksame, menschenzentrierte KI-Governance aufgebaut haben, haben dies in der Regel dadurch erreicht, dass sie die Verantwortung von HR klar VOR den Einsatzentscheidungen festgelegt haben – nicht, indem sie versucht haben, ihren Einfluss nachträglich in einen bereits an anderen Prioritäten ausgerichteten Prozess einzubringen.
Das Amazon-Desaster mit dem Einstellungs-Tool passierte, weil die Organisation, die es entwickelt hat, keine Funktion hatte, der eindeutig die Frage „Sind diese Ergebnisse fair für die gescreenten Personen?“ oblag. Die Rechtsabteilung fragte nach Haftung. Die Technik fragte nach Leistung. Keine dieser Fragen erfasste, was tatsächlich falsch lief.
Unternehmens-KI trifft nun Entscheidungen darüber oder beeinflusst, wer eingestellt, befördert, in der Leistung bewertet und in der Arbeit überwacht wird – und das in einem Ausmaß, das alles übertrifft, was einzelne Führungskräfte jemals leisten könnten. Mit der vollständigen Durchsetzung des EU AI Act für Beschäftigungssysteme ab August wird diese Unklarheit auf mehr als eine Weise zum Risiko.
Die Personalabteilung wurde damit beauftragt, Menschen innerhalb von Organisationen zu schützen. KI-Governance ist jetzt einer der wichtigsten Kontexte, in denen diese Verpflichtung wahrgenommen werden muss. Die Funktion beansprucht dieses Feld – oder überlässt es Rahmenwerken, die für ganz andere Fragestellungen geschaffen wurden.
