digitalien.org — Stefan Knecht

Weshalb Leistungsbewertungen und appraisals schädlich sind

In traditionellen Organisationsformen muss der Vorgesetzte zufrieden sein mit der geleisteten Arbeit: Boss zufrieden = gute Arbeit.

Die Erhebung und Bewertung individueller Leistung qualifiziert für Karrierepfade, Titel, mehr Verantwortung und vielleicht auch für mehr Geld in der nächsten Gehaltsverhandlung. Wie genau funktioniert Bewertung? Und funktioniert sie überhaupt? (Spoiler: nein.)

Dieser Beitrag erkundet Annahmen und Grundlagen für Leistungsbewertungen. Es werden Dilemmata entdeckt, wenn in agilen Organisationsformen unverändert Jahresziele vereinbart und Einzelleistungen dokumentiert werden. Am Ende kommt heraus: das klappt alles nicht, und funktionierte noch nie — und dennoch geht es weiter.

(Es gibt zu diesem Text auch einen zweiten Teil Wie kann man (und soll man?) Leistung in agilen Organisationen bewerten?)

Es öffnen sich mehrere Höllenpforten:

  • die ➚ Leistung von Wissensarbeitern kann interindividuell weder sinnvoll gemessen noch verglichen werden und
  • appraisals zerstören, was sie fördern sollen: subjektive Motivation.
 
Aber der Reihe nach.
 

Warum wird Leistung bewertet?

In der betriebswirtschaftlichen Personalführung geschehen Leistungsbewertungen unter mindestens zwei Annahmen:

  1. Mitarbeiter seien vergleichbar und
  2. aus der Rangreihe bewerteter Mitarbeiter könnten unternehmerische Aktionen abgeleitet werden.
 
Das konventionelle Personalmanagement bringt einige, vordergründig auch sinnvolle Argumente um individuelle Leistungen zu erheben und zu bewerten etwa diese:
 
  • angemessene und gerechte Bezahlung oder Bonifizierung im Vergleich zur Kohorte ähnlich bewerteter Mitarbeiter,
  • die Gewinnung von Anhaltspunkten zur Förderung und damit Potenzialentfaltung,
  • die Identifikation von high potentials zur Beförderung in verantwortungsvolle Managementrollen

Wenn das nicht so gut klappt — dann soll aus Bewertungen und Rankings wenigstens die Identifikation von ‘Minderleistung’ geschehen um daraus Indizien für eine Kündigung zu gewinnen. Selbst wenn man annimmt, wesentliche Elemente seien damit erfassbar: Bewerter und bewertete Mitarbeiter haben wesensverschiedene Ziele:

Mitarbeiter und bewertender Vorgesetzter haben verschiedene und vor allem versteckte Ziele — was die Ergebnisse verfälscht oder missbräuchlich verwenden lässt.

Wie geschieht Leistungsbeurteilung?

Die Erhebung von persönlicher Leistung geschieht meist in Jahresgesprächen. Vorgesetzter und Mitarbeiter treffen sich einmal im Jahr und reden.

Vielleicht gibt es einen Gesprächsleitfaden samt Checkliste, vielleicht auch nicht. Die Ergebnisse werden in der Personalakte dokumentiert und begleiten den persönlichen Karrierepfad. Sie sind ein Faktor bei Beförderungen, Gehaltsverhandlungen, neuen oder weiteren Rollen und einem Jahresbonus, so es diesen gibt und er ausgeschüttet wird.

Also sind appraisals für das persönliche Fortkommen und die Karriere wichtig. Wirklich jede:r kann das einsehen.

Allerdings: wer kann sich schon an ein Jahr erinnern, an grob zweihundert Arbeitstage? Wieviele davon hatte man miteinander zu tun?

Ein jährlicher Prozess ist zu träge um handlungsleitend bedeutsam zu sein: niemand kann erinnern, was in zwölf zurückliegenden Monaten geschah. (...) Die zu bewertende Leistung ist generisch und erfasst nicht die inhärente Verschiedenheit von Menschen und ihren Aufgaben​

Noch eine Höllenpforte:

Die Erhebung, Terminierung und das Reporting dieser Mitarbeitergespräche sind für die Personalfachleute selbst eine self fulfilling prophecy und somit ein impliziter Leistungsnachweis der eigenen Tätigkeit — denn wie sonst könnten Personaler nachweisen, genau die Richtigen eingestellt zu haben?

Niemand kann appraisals leiden. Niemand.

Spätestens hier ist die Schieflage schon sichtbar. Drehen wir das noch eine Runde weiter:

For some, the annual performance appraisal is a tedious exercise which just needs to be “got through” to satisfy the HR staff—a case of “Don’t mess with HR”. Employees and managers often tend to share this view, and together they work out an easy way of conducting the appraisal without actually doing it. Last year’s appraisal form is re-used and altered slightly, with both parties agreeing on which boxes to tick. And that’s it. Everyone is happy and satisfied — including the HR department.​

Dabei sind Mitarbeiter- und Leistungsbewertungen schon ihrem Wesen nach untauglich: sie messen nicht, was gemessen werden soll und bewirken das Gegenteil: Demotivation und eigennützliches Verhalten statt offene Zusammenarbeit. Erhebung und Bewertung manifestieren Macht in eine Richtung.

Appraisals stehen wie kaum etwas anderes für patriarchalische oben/unten-Beziehungen zwischen Vorgesetztem und Untergebenen. Sie behandeln den Mitarbeiter als Besitz des Unternehmens.

Leistungsbewertungen verstärken also genau das, was moderne Unternehmen abbauen wollen um agiler, beweglicher und kollaborativer zu werden: starre Hierarchien.

Woher kommt das Bewerten-Wollen?

George Odiorne

Peter Drucker

Peter Drucker entwickelte 1954 ‘Führen durch Zielvereinbarung’, im Englischen MbO, management by objectives als Form transaktionaler Führung. In der Betriebswirtschaftslehre ging das ab wie Schmidts Katze und gehörte fürderhin zum Standardrepertoire. George Odiorne stellte fast zwanzig Jahre später fest, das MbO als Managementansatz nur mit funktionierender Hierarchie klappen kann (Odiorne, 1972). Diese Denkform ist fast magisch-naiv: Chef und leitenden Manager wissen am Besten, was die Firma wie zu tun hat. Oben wird gedacht, unten gemacht — ‘Thinking at the top, acting at the bottom’:

The basic structure of the corporation is the organizational form often called a hierarchy. This is the familiar arrangement of boxes showing the boss in the top box and two, three, or more subordinates in the box one level down. Management by objectives is a system for making that structure work and for bringing about more vitality and personal involvement of the people in the hierarchy.​

MbO ist der Hebel zwischen den operativen Hierarchieebenen, Ziele werden durchgereicht bis zu denen, die sie umsetzen. Sollen.

 
Wenn das klappt: fantastisch! Besser wird es nicht.
 

Hierarchien sind prima

Gerhard David von Scharnhorst, preußischer Generalleutnant und Heeresreformer
Gerhard David von Scharnhorst, preußischer Generalleutnant und Heeresreformer

Funktionierende Hierarchien sind überlegen leistungsfähig. Wenn sie funktionieren, dann schnell, sowohl effizient wie effektiv.

Hierarchien sind prima wenn sie funktionieren.

Es gibt viele Umgebungen, in denen eine klare chain-of-commmand sinnvoll ist, in der eine:r entscheiden muss weil längliche Debatten schädlich wären. Flugzeuge, Schiffe, Raumstationen, Herzoperationen … all das sind Situationen, in denen im Zweifel, unter Zeitdruck und mit Verantwortungsübernahme einer einzigen erfahrenen und entscheidenden Person im Fehlerfall Leben auf dem Spiel stehen.

Heute ist nicht einmal mehr militärische Organisation nach Befehl und Gehorsam  gestaltet sondern in ➚ Selbstorganisation und Auftragstaktik. Alle modernen Armeen operieren nach einem Konzept, das der hier abgebildete Gerhard David von Scharnhorst, preußischer Generalleutnant und Heeresreformer vor gut zweihundert Jahren entwickelte.

Allerdings: in den allermeisten zivilen Unternehmen gibt es diese kritischen Randbedingungen ebensowenig wie funktionierende Hierarchien.

(Wenn Sie Ausnahmen für funktionierende Hierarchien kennen: ich freue mich aufrichtig auf Nachrichten!)

(...) direct interactions become rare or at least more difficult in a complex organization that consist of a multitude of layers and hierarchical levels.​

Vielmehr ist es so, dass mehrschichtige Hierarchie die direkte Interaktion und beobachtbare Leistung gar nicht mehr erlaubt. Oder: was ‘unten’ geschieht, kann ‘oben’ nur mehr vermittelt und längst nicht mehr unmittelbar wahrnehmen.

Leistungsbewertungen sind falsch und schädlich

Seit Jahrzehnten zeigen Längsschnittstudien aus den Arbeits- und Organisationswissenschaften immer wieder das Gleiche. Leistungsbeurteilungen bewirken das Gegenteil dessen, wofür sie eingesetzt werden: sie zerstören intrinsische Motivation und vertrauensvolle Zusammenarbeit.

W. Edwards Deming bezeichnete 1980, vor 40(!) Jahren performance reviews als eine der tödlichen sieben Krankheiten:

W.E. Deming Personal review systems, or evaluation of performance, merit rating, annual review, or annual appraisal, by whatever name, for people in management, the effects of which are devastating. Management by objective, on a go, no-go basis, without a method for accomplishment of the objective, is the same thing by another name. Management by fear would still be better.

Jüngere Forschung kommt zum selben, niederschmetternden Verriss:

Wenn jährliche performance appraisals (...) Persönlichkeitseigenschaften und Selbstregulation adressieren, laufen sie nachgewiesenermaßen ins Leere.

Kann man nicht wenigstens Leistungsgruppen bilden ...?

Jack Welch

Leider nein: auch die losere Variante des stack ranking, bei General Electric eingeführt vom legendären Jack ‘Dampfhammer’ Welch wurde noch 2012 von 60% der Fortune 500 Firmen praktiziert — und zunehmend abgeschafft. 

Microsoft etwa will gruppierte Bewertungsformate weil Deloitte richtig erkannte, dass sie das Gegenteil bewirken, nämlich …

(...) capricious rankings, power struggles among managers, and unhealthy competition among colleagues

Mit dem Aufhören anfangen.

Weshalb eine Praktik fortführen, die niemand leiden kann, die weder nutzt sondern schadet?

Vielleicht, weil es bei Beurteilungen im stillen Kern um Macht und Dominanzgesten geht:
 
»(…) meine Macht als Dein Vorgesetzter Dir spüren zu geben, dass ich über dein Schicksal in diesem Unternehmen entscheiden kann.«
 
Sollte mit dieser Haltung Führung geschehen?
Bitte nicht.
 

Wenn es schwer fällt, trotz aller Belege von Leistungsbeurteilungen abzufallen: diese fünf Prinzipien (adaptiert nach Trost 2017) können bei der Evaluation von Modellen in der Leistungsbeurteilung hilfreich sein.

  1. Verantwortung. Sind Entscheidungen und Bewertungen in der Verantwortung einer zentralen HR oder von Mitarbeiter in Teams? Wem gehören die Ergebnisse?
  2. Offenheit und diversity. Wieviel Variabilität und Offenheit ist möglich? Sollen Massnahmen statistisch über alle Mitarbeiter vergleichbar sein oder ist individuelle Verschiedenheit möglich?
  3. Hierarchie vs Netzwerke. Wer trifft Bewertungen, wer entscheidet? Kunden, Kollegen oder Vorgesetzte? Betreffen Massnahmen Einzelne, Teams oder Gruppen?
  4. Konzentration auf Bedürfnisse. Gibt es ein einziges Instrument zu einem Zeitpunkt und sind immer dieselben Entscheider beteiligt? Oder sind viele Instrumente und Massnahmen möglich und die Entscheider rollieren?
  5. Sein lassen. Wo können Prozesse, Instrumente und Massnahmen komplett eingestellt werden? Gibt es genug Mut, den Dingen ihren Lauf zu lassen?

Sein lassen.

Mit dem Aufhören anfangen.

Weiter geht es in der Betrachtung von Leistungsmessungen und -bewertung in agiler organisierten Unternehmen. Ist da die Situation nicht eine andere …?

Weiterlesen: Wie kann man (und soll man?) Leistung in agilen Organisationen bewerten?

Quellen

Bobinski, Dan. „Performance appraisals don’t work“. Management-Issues (blog), 8. Juli 2010. http://www.management-issues.com/2010/7/8/opinion/ performance-appraisals-dont-work.asp.

Culbert, Samuel, und Lawrence Rout. Get Rid of the Performance Review! City: Business Plus, 2010.

Dessler, Gary, Virginia Sutherland, Patricia Goodman, und Nina Cole. Fundamentals of Human Resources Management in Canada. Toronto: Pearson/Prentice Hall, 2004.

Hattie, John, und Helen Timperley. „The Power of Feedback“. Review of Educational Research 77, Nr. 1 (März 2007): 81–112. https://doi.org/10.3102/003465430298487.

Heathfield, Susan M. „Performance Appraisals Don’t Work“. About.com, 2010. http:// humanresources.about.com/od/performanceevals/a/perf_appraisal.htm.

Locke, Edwin A., und Gary P. Latham. „Building a Practically Useful Theory of Goal Setting and Task Motivation: A 35-Year Odyssey.“ American Psychologist 57, Nr. 9 (September 2002): 705–17. https://doi.org/10.1037/0003-066X.57.9.705.

Maurer, Rick. Beyond the wall of resistance: why 70% of all changes still fail–and what you can do about it. Rev. ed. Austin, Texas: Bard Press, 2010.

Nuttgens, Claudia. „The Death of the Performance Review“, Future Work Centre, 16. Februar 2016, 28. (file moved to an unknown location).

Odiorne, George S. Management by objectives: a system of managerial leadership. New York: Pitman publishing, 1972.

Pulakos, Elaine D., und Kenneth N. Wexley. „The Relationship Among Perceptual Similarity, Sex, and Performance Ratings in Manager-Subordinate Dyads“. Academy of Management Journal 26, Nr. 1 (1. März 1983): 129–39. https://doi.org/10.2307/256139.

Scullen, S. E., M. K. Mount, und M. Goff. „Understanding the Latent Structure of Job Performance Ratings“. The Journal of Applied Psychology 85, Nr. 6 (Dezember 2000): 956–70.

Shinsato, Harold. „Appraising Performance Appraisals for Agile Practitioners“, 2016. https://www.agilealliance.org/wp-content/uploads/2016/01/Appraising-Performance-Appraisals.pdf.

Trost, Armin. The End of Performance Appraisal: A Practitioners’ Guide to Alternatives in Agile Organisations. Cham: Springer International Publishing Springer, 2017.

Wood, Angela. The Motivational Interviewing Workbook: Exercises to Decide What You Want and How to Get There, 2020.

Wood, Robert E. „Task Complexity: Definition of the Construct“. Organizational Behavior and Human Decision Processes 37, Nr. 1 (Februar 1986): 60–82. https://doi.org/10.1016/0749-5978(86)90044-0.