digitalien.org — Stefan Knecht

Wie kann man (und soll man?) Leistung in agilen Organisationen bewerten?

In traditionell organisierten Unternehmen steht die Erhebung und Bewertung individueller Leistung ausser Frage. Dass das noch nie funktioniert hat und mehr schadet als mützt, ist im Beitrag Weshalb Leistungsbewertungen und appraisals schädlich sind hergeleitet. Wie soll und kann das in agiler Organisation geschehen? Oder besser auch nicht?

Spoiler: Leistungsbewertungen sind Cargo Cult

 
Ab hier geht es weiter mit einer weiteren und brisanteren Frage: Was machen Leistungsmessungen in agilen Organisationen?

Zielvereinbarungen oder appraisals waren schon in konventionellen Arbeitsumgebungen schädlich. In agiler Organisation werden appraisals zu  sinnlosem cargo cult.

Agile Manager werden zu Möglichmachern

In zunehmend agilen Umgebungen verändern sich hierarchisch Vorgesetzte idealerweise zu enablern und befähigen Teams ihre Arbeit bestmöglich zu tun. Klassische Linienvorgesetzte werden mit der Agilisierung von Organisationen zu Möglichmachern. Sie räumen Hindernisse aus dem Weg bevor sie die Leistung wertliefernder Teams behindern. Das ist ➚ dienende Führung oder servant leadership. Kein leichter Wandel — das Gegenteil der konventionellen Sozialisierung als ‘Manager’.

Die Funktion der Linienverantwortlichkeit braucht es weiterhin — mit agiler Organisation ändert sich der Rollenzuschnitt von Gruppenleitern oder Abteilungsleitern im mittleren Management. Auch wenn agiler zusammengearbeitet wird, müssen etwa Aufwände korrekt in ERP-Systeme gebucht werden, so dass Leistungen entgolten werden, in den Zahlungslauf kommen und Geld fliessen kann. Oder Urlaubs- und Reiseanträge bewilligt werden. So lange es das noch gibt, muss es jemand machen weil es sich als Verwaltungsakt von selbst nicht erledigt.

Wenn die Rollenanpassung von Vorgesetzten zu Führungskräften, von Managern zu Möglichmachern positiv gelingt, dann bleibt als Relikt aus hierarchischer Organisation und konventioneller HR die Bewertung der Leistung Einzelner — um die es ja nicht mehr geht, wenn die Wertstiftung in Teams geschieht.

Also steht etwas im Weg und behindert, was es beheben soll.

Das zugrunde liegende Problem ist also ein anderes: Beobachten, messen und vergleichen. Bewertung heißt immer auch messen und damit vergleichen mit den Leistungen anderer.

Betrachten wir zuerst …

Wer kann was beobachten? Wie wird verglichen und bewertet?

Mit agiler Organisation ändern sich Rollen und Begriffe. Management wird zu ermöglichender Führung und Teamleistung wird wichtiger als heroische Einzelleistungen.

Ein zweifaches Dilemma winkt:

(1) Wer kann was beobachten?

Welche Personen können unmittelbar und selbst beobachten, was Einzelne im konzertierten agilen Team an individueller Leistung beisteuern? Wie kann ein Linienmanager ausserhalb des produktiven Teams das schaffen — wenn er/sie selbst nicht dabei ist.

(2) Wie geschieht die Messung von Beobachtungen und welcher Art Vergleiche verschiedener Messungen können geschehen?

Können Beobachter die Leistung einzelner Personen fundiert bewerten?
Auf welcher Skala geschieht die Messung und wie differenziert?

Um es sehr kurz zu machen:

Beobachten kann nur, wer Teil der Gruppe ist, in der gemeinsam operativ an Lösungen für drängende Probleme gearbeitet wird. Wer nicht aktiver Teil der Gruppe ist, kann nur dem Hörensagen nach beobachten. Also: weder erfassen noch bewerten.

Eine unabhängige Messung selbst aus einem strukturierten Interviewfragebogen abzuleiten ist schon für darin trainierte Sozialpsychologen nicht leicht. Wie kann das dem überwiegend methodisch untrainierten Vorgesetzten in einem Jahresgespräch gelingen?

Alle messtheoretischen Fehler aussen vor: Leistungsbewertung hat noch nie funktioniert: Menschen sind ernsthaft schlecht darin, die Leistung anderer fair und akkurat zu beurteilen. Messen will gelernt sein und verlangt starke Bedingungen.

Mitarbeiter und bewertender Vorgesetzter haben verschiedene und vor allem versteckte Ziele — was die Ergebnisse verfälscht oder missbräuchlich verwenden lässt.

Gemeinsam ist Bewertern und Bewerteten, ein lästiges ToDo abzuhaken:
[ ] Jahresgespräch → HR
 
Im Motiv des erstrebten Ergebnisses unterscheiden sich Manager und Mitarbeiter.

Die Wahrheit: Brown Nosing beats performance

Nun sprechen da zwei Menschen miteinander, keiner kommt neutral und ohne Vorerfahrung, die Motive und Erwartungshaltungen sind verschieden.

Es zeigt sich: strukturelle Denkfehler dominieren, wo objektive Begutachtung sein sollte.

Der bias des Bewerters hat den grössten Einfluss auf das rating.​

Diese strukturellen Denkfehler sind gut dokumentiert: der Halo Effect, Zentraltendenz, Recency und der similar-to-me-Effekt … mehr als 140 sind bekannt und niemand, niemand kann ihnen dauerhaft verlässlich entkommen.

Kein Mensch und damit auch kein bewertender Vorgesetzter kann objektiv beurteilen da kognitive Denkfehler die valide Messung und den Vergleich von Ergebnissen über mehrere Mitarbeiter verhindern.

Die Passung eines Menschen zu allen anderen wird in der Kaffeeküche verhandelt. Die soziale Keule macht die schlimmsten Beulen: »passt nicht zu uns«, »mit dem hab’ ich Schwierigkeiten«. Was so geschieht, ist Diffamierung und Stigmatisierung — der so Gezeichnete ist angezählt und hat geringe Chancen, die Zuschreibung von Eigenschaften ungeschehen zu machen.

Was du machst ist egal — so lange du beliebt bist.

Die subjektive Beliebtheit, das liking hat einen höheren Einfluss auf die Leistungsbewertung als die tatsächliche Leistung.

Soziale Passung statt Leistung

Hinzu kommt eine weitere heftige und bestens untersuchte kognitive Verzerrung (Pulakos & Wexley, 1983): je ähnlicher sich bewertende/r Vorgesetzt/e und Mitarbeiter sind, um so besser fallen appraisals aus.

Von unabhängiger Beobachtung oder Messung kann bei appraisals also keine Rede sein: Gleich und gleich läuft besser als diversity: Gemessen erhoben wird also nicht Leistung (Arbeit x Zeit) sondern die soziale Passung.

Anpassung an sozialnormiertes Verhalten wird belohnt, nicht subjektive Leistung.

Dafür könnte man sich den Aufwand sparen: die soziale Passung zu einer Gruppe ist bei einem Kaltgetränk an einem Tresen schneller geklärt als in einem Jahresgespräch.

Feedback ≠ Feedback

Persönliches Feedback ist vertraulich

Wird agiler gearbeitet, hat der Begriff ‘Feedback’ eine grundlegend andere Bedeutung als umgangssprachlich ‘ich sag Dir jetzt mal, wie Du bei mir ankommst’.

Feedback im sozialen Diskurs ist privat, persönlich und vertraulich.

Feedback in agilen Organisationsprozessen ist ein öffentlicher und nützlicher  Datenpunkt um besser zu werden, das Richtige zu tun und größtmöglichen Nutzen schaffen zu können.

Feedback gehört dem Mitarbeiter, nicht dem Unternehmen, nicht HR. Wenn sich Kollegen vertraulich Feedback geben, dann bleibt das genau dort.

Feedback ist unaufrichtig und ethisch verwerflich, wenn die Ergebnisse zu einem Instrument zur Leistungs- oder Passungsmessung umgewidmet werden. Genau dieser Mißbrauch geschieht, wenn ‘der Personaler’ s/eine Sicht als Notiz in die Personalakte gibt.

Agiles Feedback justiert (Zwischen-)Ziele

Feedback von Nutzern ist entscheidend um Produkteigenschaften schnell so anzupassen, dass Nutzerverhalten in die gewünschte Richtung geschieht: mehr Anmeldungen, mehr Transaktionen … was auch immer das Ziel einer Lösung ist.

Je kürzer auf dem Weg zur Lösung Feedbackschleifen geschehen, desto eher kann das jeweils dringlichste Kundenproblem gelöst werden. Um diesen zentralen Regelkreis dreht auch Scrum als agiles Framework:

Zuerst liefern, was den größten Nutzen schafft und auf Dauer nachhaltig kontinuierlichen Durchsatz herstellen.

Scrum trennt geschickt und konsequent, das WAS und WIE vom WARUM — so entsteht mehr als eine Feedback-Schleife:

Das Ziel, das WARUM ist die Produktvision und alle Beteiligten kennen sie. Die eingesetzte Zeit und Aufwand möglichst verlustfrei auf den business value konzentrieren — oder weniger verklausiert: das Ziel verlässlich erreichen.

Den unmittelbaren Nutzen, das WAS kennt die ➚ Rolle des Product Owner am Besten. Sie hat dichten Kundenkontakt und ist das vermittelnde Scharnier zum umsetzenden Team.

Mit welchen Mitteln, WIE das Ziel erreicht wird, ist in Scrum als ➚ Verantwortung und Rolle des Teams definiert. Das Team ist gemeinsam und selbst verantwortlich für die Konsequenzen seines kollektiven Handelns. In schnellen Iterationen wird justiert.

Das ist gewöhnungsbedürftig für konventionelles Management und läuft dem meist unartikulierten Menschenbild entgegen. »Wie können ‘die’ wissen, wo es hin geht? Das muss ich als Manager Ihnen doch vorgeben …?«

Genau so tickt MbO, Management by Objectives.

Individuelle Leistungsmessung oder Verhaltensbewertung gibt es in keinem agilen Framework

Weil die direkte Interaktion mit dem Kunden idealerweise ständig und in kurzen Zyklen geschieht, erleben Entwicklungsteams unmittelbare Konsequenzen in kurzen feedback loops als Regelkreis von einer Iteration zur nächsten, in kleinen Schritten und immer näher am emergenten Ziel.

Emergent? Ja, die Dinge können sich ändern und meistens tun sie das auch: welcher Masterplan bleibt über eine Projektlaufzeit unverändert? Und welcher Steuerungsausschuss ist schnell und informiert genug um effektiv steuern zu können?

Da braucht es keinen vermittelnden Vorgesetzten oder Gremien mehr und keinen client satisfaction survey (der noch dazu keinerlei Gütekriterien einer Messung genügt).

Agilität heisst: Aktion und Reaktion sind so nahe beisammen, wie es nur irgend geht.

Zielvereinbarungen — wenigstens die taugen doch ...?

Eine wissenschaftlich fundierte Begründung für den Nutzen von definierten Zielen stammt häufig von Locke und Latham (2002): 

Menschen, die sich selbst ein Ziel setzen, erreichen dieses besser als jene, die nur versuchen, ihr Bestes zu geben.​

Darunter liegt die Hypothese, es gäbe eine direkte Beziehung zwischen der persönlichen Leistung und der Schwierigkeit, das Ziel zu erreichen: je schwieriger das Ziel, desto höher die Leistung?

Leider auch nicht:

Ziele schaden nicht, tragen aber auch nicht zu höherer Leistung bei.

Ziele motivieren — wenn man sich selbst Ziele setzt

Douglas McGregor

Die unausgesprochene Grundannahme für den Einsatz von appraisals und Zielvereinbarungen ist eine ganz andere: Menschen müssten mit Zielen motiviert werden — sonst würden sie nicht ordentlich arbeiten.

Frederick Winston Taylor

Diese Sicht entstammt einem Menschenbild aus der Mottenkiste Mitte des letzten Jahrhunderts mit McGregors Typ X/Y und aus dem Zusammenhang interpretierten Taylorismus.

Beide sind seit mehr als 40 Jahren durch die Sozialforschung widerlegt und sind dennoch nicht aus den BWL-Curricula und Köpfen zu kriegen.

The Performance Review is a severe extrinsic motivation device that really assumes that the employee can't be trusted to manage their own motivation intrinsically, and instead it depends on the carrot and the stick. Bonus and promotions are the carrot. Probation and termination are the stick.

 

Der entscheidende Unterschied agiler Organisation zur Lesart konventioneller Führung ist: man kann nur sich selbst motivieren, nicht andere.

Extrinsische Motivation durch rigide Zielvereinbarungen und die Aussicht auf anteilige Boni am Jahresende verpufft schneller als das obligatorische Jahresgespräch zu Ende ist — intrinsische Motivation ist das WARUM des eigenen Tuns und wirkt jeden Tag aufs Neue.

 

Also ist — wenig verwunderlich — auch für agiler organisierte Unternehmen die Antwort dieselbe: nein. Bleiben lassen.

 

(Hier geht es zum ersten Teil Weshalb Leistungsbewertungen und appraisals schädlich sind)

 

 

Quellen

Bobinski, Dan. „Performance appraisals don’t work“. Management-Issues (blog), 8. Juli 2010. http://www.management-issues.com/2010/7/8/opinion/ performance-appraisals-dont-work.asp.

Culbert, Samuel, und Lawrence Rout. Get Rid of the Performance Review! City: Business Plus, 2010.

Dessler, Gary, Virginia Sutherland, Patricia Goodman, und Nina Cole. Fundamentals of Human Resources Management in Canada. Toronto: Pearson/Prentice Hall, 2004.

Hattie, John, und Helen Timperley. „The Power of Feedback“. Review of Educational Research 77, Nr. 1 (März 2007): 81–112. https://doi.org/10.3102/003465430298487.

Heathfield, Susan M. „Performance Appraisals Don’t Work“. About.com, 2010. http:// humanresources.about.com/od/performanceevals/a/perf_appraisal.htm.

Locke, Edwin A., und Gary P. Latham. „Building a Practically Useful Theory of Goal Setting and Task Motivation: A 35-Year Odyssey.“ American Psychologist 57, Nr. 9 (September 2002): 705–17. https://doi.org/10.1037/0003-066X.57.9.705.

Maurer, Rick. Beyond the wall of resistance: why 70% of all changes still fail–and what you can do about it. Rev. ed. Austin, Texas: Bard Press, 2010.

Nuttgens, Claudia. „The Death of the Performance Review“, Future Work Centre, 16. Februar 2016, 28. (file moved to an unknown location).

Odiorne, George S. Management by objectives: a system of managerial leadership. New York: Pitman publishing, 1972.

Pulakos, Elaine D., und Kenneth N. Wexley. „The Relationship Among Perceptual Similarity, Sex, and Performance Ratings in Manager-Subordinate Dyads“. Academy of Management Journal 26, Nr. 1 (1. März 1983): 129–39. https://doi.org/10.2307/256139.

Scullen, S. E., M. K. Mount, und M. Goff. „Understanding the Latent Structure of Job Performance Ratings“. The Journal of Applied Psychology 85, Nr. 6 (Dezember 2000): 956–70.

Shinsato, Harold. „Appraising Performance Appraisals for Agile Practitioners“, 2016. https://www.agilealliance.org/wp-content/uploads/2016/01/Appraising-Performance-Appraisals.pdf.

Trost, Armin. The End of Performance Appraisal: A Practitioners’ Guide to Alternatives in Agile Organisations. Cham: Springer International Publishing Springer, 2017.

Wood, Angela. The Motivational Interviewing Workbook: Exercises to Decide What You Want and How to Get There, 2020.

Wood, Robert E. „Task Complexity: Definition of the Construct“. Organizational Behavior and Human Decision Processes 37, Nr. 1 (Februar 1986): 60–82. https://doi.org/10.1016/0749-5978(86)90044-0.

Dieser Beitrag steht unter einer
CC BY-NC 4.0-Lizenz

Post Views: 0