Tag: Forschung

  • Haltung macht Ergebnisse?

    … so scheint es, wenigstens für politisch bedeutsame Forschungsfragen. Die Wahl statistischer Instrumente und die Interpretation von Ergebnissen scheint einem experimenter bias zu unterliegen. 158 Forschende in 71 Gruppen sollten auf Basis derselben Rohdaten die Hypothese “Beeinflusst Einwanderung die öffentliche Unterstützung von Sozialhilfeprogrammen?” mithilfe statistischer Instrumente prüfen. Bei gleichen Daten sollten alle Ergebnisse in die gleiche Richtung weisen, möchte man meinen. Tatsächlich aber schwankten die Interpretationen zwischen stark negativ bis stark positivem Zusammenhängen. Wie kann das sein, eklatant verschiedene Interpretationen bei gleichen Rohdaten?

    Borjas & Preznau stellen in ihren Korrelationen fest, dass Forschungsgruppen mit positiver Einstellung zu Einwanderung eher positive Effekte fanden und einwanderungskritische eher negative. Die Unterschiede in den Korrelationen entstünden, weil verschiedene Teams unterschiedliche statistische Modelle fachlich korrekt verwendeten. Die Auswahl der Methoden geschah scheinbar jeweils passend zur eigenen Haltung und im impliziten Wissen um den twist, den die Wahl der Methode auf das Ergebnis haben würde.

    Borjas, G. J., & Breznau, N. (2026). Ideological bias in the production of research findings. Science Advances12(1), eadz7173. https://doi.org/10.1126/sciadv.adz7173

    Aufmerksam darauf machte Sebastian Herrmann in der SZ am 16.1.26 im Wissen, S. 12 “Ein Datensatz und viele Ergebnisse: Die Einstellung der Forscher beeinflusst Studien, selbst wenn sie korrekt arbeiten.”

  • Sehr vielleichtig!

    Sehr vielleichtig!

    Was meinen wir mit unscharfen Wahrscheinlichkeitsbegriffen?

    Wenn man es nicht so genau sagen kann oder weiss, dann bietet Sprache geschmeidige Ausweich- und Vermeidungsmöglichkeiten. Welche Spannweite diese Geschmeidigkeit hat, kann man messen. Das funktioniert grob so, dass Personen zu Aussagen wie »ein Hochwasser dieses Ausmasses ist höchst unwahrscheinlich« oder »ziemlich sicher gewinnt Merz die Wahl« Zahlen als subjektive Wahrscheinlichkeiten angeben. In den 1960ern gab es ein Vorläuferexperiment, bei dem die verbalen Beschreibungen von Eintrittswahrscheinlichkeiten an einer kleinen Stichprobe validiert wurden.1 Es handelte sich damals um NATO-Offiziere und deren Einschätzung zum Eintritt von Ereignissen im Kalten Krieg. Die CIA war interessiert am Ausgang. Begriffe wie likely, probable, probably, better than even, we doubt, unlikely usw. sollten also mit interpretationsfreien Zahlen bezeichnet werden.

    Dieses Experiment hat Wade Fagen-Ulmschneider wiederholt, mit einer eher kleinen, dennoch größten bekannten Stichprobe (n = 123) von Wahrscheinlichkeitsbegriffen und für den amerikanischen Sprachraum.2

    Wade Fagen-Ulmschneider: Wahrnehmung und Ausdruck von Wahrscheinlichkeitsbegriffen in Wörtern und Zahlen

    Ergebnisse: die Entsprechungen zwischen verbaler und numerischer Wahrscheinlichkeitsbezeichnung haben sich seit den 1960er-Jahren nicht wesentlich verschoben. Die Probanden bevorzugen Zahlen mit Einerstellen von 0 oder 5 und höchst selten ‘krumme’ Zahlen. Unklar bzw. nicht experimentell fundiert bleibt, ob und wie stark sich die Ergebnisse zwischen Sprachen und mit weiteren Kontextfaktoren unterscheiden.

    »Ich glaube« entspricht in Zahlen 65–85%. Ungefähr. Da ist genug Luft für geschmeidige Interpretationen, wenn es denn sein muss.

    * * *


    1. Kent, S.; 1964. Words of Estimative Probability. PDF ↩︎
    2. Fagen-Ulmschneider, Wade. „Perception of Probability Words“. Zugegriffen am 5.11.2022. URL. ↩︎
  • Simulieren wir uns!

    Seit mehr als vierzig Jahren wird versucht, realistische Modelle für menschliches Verhalten zu erschaffen. Jede Menge Zeit, Leid und Irrwege könnten wir vermeiden und viel lernen, würden wir unsere Interaktionen mit Hilfe von AI-Agenten modellieren.

    Wir könnten Kunden simulieren, gute wie schlechte Führung, introvertierte Einzel- wie Gruppenarbeit und die am Besten wirksamen Mischungen umsetzen statt an uns selbst zu experimentieren. Dass das heute recht verlässlich möglich ist, lassen zwei Arbeiten einer Forschergruppe erahnen.1 2 Die Einstellungen und Verhaltensweisen von 1052 Personen wurden in generativen Agenten abgebildet. Diese wurden zuvor mit Sprachmodellen aus qualitativen Interviews, demografischen und ethnischen Daten, Persönlichkeitstests und Logikspielen gefüttert. Das gelang offenbar überraschend gut: die Agenten waren mit 85% Übereinstimmung in der re-test Genauigkeit3 vergleichbar gut wie die lebendigen Personen. In einer an ‘The Sims’ erinnernden Klötzchenwelt-Umgebung4 interagierten die sozialen Agenten dann wie man es von ihrer wetware5 erwarten würde. Im Ergebnis sei das wie … »eine Reihe kleiner ‘Ichs’, die herumlaufen und tatsächlich die Entscheidungen treffen, die Sie getroffen hätten« … sagt Joon Sung Park, einer der Autoren. Die Simulanten kommunizieren in Sprechblasen miteinander, planen ihren Tag, tauschen Nachrichten aus, bilden Beziehungen und koordinieren gemeinsame Aktivitäten.

    Das LLM6 speichert für jeden Agenten in natürlicher Sprache dessen Erfahrungen und synthetisiert daraus Erinnerungen oder abstrahierte Reflektionen um aus der Summe weiteres Verhalten zu planen. In der beschriebenen Sandbox werden wie bei ‘The Sims’ 25 Charaktere gleichzeitig dargestellt — doch scheinen diese glaubwürdiges emergentes7 Sozialverhalten. Wenn etwa eine Agentenperson eine Valentinsparty ausrichten will, laden andere autonom dazu ein oder koordinieren sich um gemeinsam zur Party zu kommen.

    “Na und?” könnte man nun raunzen und zurück zur Kostenstelle der ebenso realen Klötzchenwelt in Powerpoint schwenken — doch denken wir das nur eine kleine Umdrehung weiter. Wir haben es ja nicht mit Science Fiction zu tun sondern nur mit Science: wenn KI-getriebene Agenten sich so realistisch verhalten wie wir selbst es würden, dann könnten wir daraus viel lernen für Veränderungen in Sozialsystemen wie Unternehmen. Wie etwa Boni oder Anreizsysteme wirken oder welche unerwarteten Konsequenzen hastige Organisationsveränderungen haben. Würden soziale Agenten etwa ein ganzes Unternehmen oder wenigstens ihre Alphapersonen und deren Führungsspanne abbilden, dann könnten teure, riskante, schwer durchzuführende oder verdachtsweise unethische Organisationsänderungen vor ihrer Umsetzung einmal mit deren Sims durchgespielt werden. Das wäre dann eine open-end Simulation weil man ja nie genau weiss, was bei grösseren Sozialinterventionen geschieht. Ist das Ergebnis dann erstrebenswert? Dann machen. Klappt nicht gut? Dann besser neue Fehler machen. Das alles würde sicherlich auch im high-speed mode funktionieren. Dann könnte man etwa SAFe bis ins letzte level zu Ende spielen. Oder sehen, wozu eine komplett in Prozessen durchorchestrierte Organisation führt. Dann müsste man weniger glauben und würde mehr wissen.

    Das wäre doch toll! 

     * * *


    1. Park, Joon Sung, Carolyn Q. Zou, Aaron Shaw, Benjamin Mako Hill, Carrie Cai, Meredith Ringel Morris, Robb Willer, Percy Liang, und Michael S. Bernstein. 2024. „Generative Agent Simulations of 1,000 People“. arXiv. DOI. ↩︎
    2. Park, Joon Sung, Joseph C. O’Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, und Michael S. Bernstein. 2023. „Generative Agents: Interactive Simulacra of Human Behavior“. In The 36th Annual ACM Symposium on User Interface Software and Technology (UIST ’23), October 29-November 1, 2023, San Francisco, CA, USA. ACM, New York, NY, USA, 22 pages. DOI ↩︎
    3. Im re-test wird gemessen, ob die Werte derselben Person bei einer Wiederholung des gleichen Tests auch gleiche Ergebnisse erbringen. Bei recht stabilen Eigenschaften wie Haltungen oder Persönlichkeitsfacetten wird das erwartet. ↩︎
    4. siehe https://reverie.herokuapp.com/UIST_Demo/ ↩︎
    5. … das wären dann wir Menschen; Software ist Code, Hardware sind unbelebte Maschinen. ↩︎
    6. LLM, large language model – quasi die ‘Hirnmasse’ oder das repository der Agenten ↩︎
    7. emergentes Verhalten ist, wenn etwas zuvor nicht beschriebenes, ge-scriptetes in Interaktion mit der Umwelt geschieht. ↩︎
  • Alles egal: das Skalierungsframework macht keinen Unterschied

    Wie Veränderung am Besten geht, wie Wandel kommt und bleibt? Genau weiss das niemand, es gibt mehr Meinungen als Fakten. Eine seltene Ausnahme ist der Preprint einer im Juli 2024 erscheinenden Arbeit von Verwijs und Russo1, die sowohl statistisch robuste2 wie unerwartete Antworten zu einer zähen Glaubensfrage bietet: Was ist das beste Skalierungsframework?

    Wann ist SAFe, LeSS oder ein eigener Methodenmix produktiver? Unter welchen Bedingungen sollte man agile Skalierung bleiben lassen? Die Forschungsfrage dieser jüngsten Arbeit von Verwijs und Russo1 lautete …

    »Wie werden die Effektivität von agilen Teams und die Zufriedenheit ihrer Stakeholder durch den agilen Skalierungsansatz beeinflusst?«

    <tl;dr> Das agile Skalierungsframework hat keinen wesentlichen Einfluss auf die Effektivität von Entwicklungsteams. Zwar gibt es kleine statistisch signifikante3 Unterschiede zwischen den Skalierungsansätzen, doch deren Effektgrößen sind in der Praxis irrelevant.4 Das bedeutet für ausnahmslos alle Ansätze: Frameworks haben vernachlässigbaren Einfluss auf die Effektivität der Entwicklungsteams und die Zufriedenheit der Stakeholder. Die Skalierungsmethode selbst ist also waste, wie es angenehm kurz in lean für etwas heisst, das niemand braucht. Entscheidend sind vielmehr die handfesten Erfahrungen der Entwicklungsteams mit agilen Praktiken und Methoden, also die Kompetenz, das praktische Können. Auch diese Erkenntnis ist länglich bekannt, wenn man es denn wissen wollte.5

    Um vergleichbare Daten erheben zu können, definieren die Autoren Begriffe: ’Skalierung’ bezieht sich1 auf kompliziertere Softwareprodukte6 mit mindestens sechs Teams bei Teamgrößen von sechs bis sieben Personen.7 Vereinfacht: es arbeiten mehr als 50 Entwicklerinnen zusammen an einem Produkt. Als large-scale gilt, wenn 2–9 Teams beteiligt sind, bei mehr als zehn Teams werden Vorhaben als very large-scale8 bezeichnet. ‘Stakeholder’ ist dabei jeder, der einen Anteil (stake) am Endprodukt hat und davon im weiteren Sinn betroffen ist. Die Zufriedenheit der Stakeholder drückt aus, ob jene kriegen, was sie bestellten. Team effectiveness ist definiert als Komposit aus stakeholder satisfaction und team morale oder job satisfaction. Das ist plausibel, von Unternehmen, Branche und Umfeld unabhängig und ermöglicht damit den Vergleich über die breite Stichprobe, aus der die experimentellen Daten stammen. Als Nebenprodukt der Studie gibt es für diese Messgrößen sogar einen validierten und kostenlosen Fragebogen. Die Selbsteinstufung von Teams kann darin um die Stakeholder-Zufriedenheit erweitert werden.9 Nach diesem Ansatz ist die Effektivität von Scrum-Teams in Softwareumgebungen10 aus fünf Faktoren zusammengesetzt:

    1. Reaktionsfähigkeit als die Fähigkeit von Teams, schnell auf neue Bedürfnisse und Anforderungen von Stakeholdern zu reagieren (Release-Häufigkeit, Release-Automatisierung, Verfeinerungen / refinements
    2. Stakeholder-Concern erfasst, inwieweit Teams verstehen, was ihren Stakeholdern wichtig ist (Zusammenarbeit, gemeinsame Ziele, Qualität der Sprint-Reviews, Wertorientierung)
    3. Kontinuierliche Verbesserung meint das Ausmaß, in dem sich Entwicklungsteams in Prozessen kontinuierlicher Verbesserung engagieren und die Sicherheit haben, dies zu tun (psychologische Sicherheit, Sorge um Qualität, gemeinsames Lernen, Verwendung von Kennzahlen, Lernumgebung)
    4. Teamautonomie spiegelt den Spielraum der Teams, ihre eigene Arbeit zu organisieren (Selbstmanagement, Querschnittsfunktionalität)
    5. Unterstützung durch Führungskräfte

    Validiert wurde dieses Modell unter einschränkenden Bedingungen: (a) der kompetente Einsatz von Scrum in erfahrenen Teams (b) in einer reinen Softwareumgebung (c) bei gemäßen Teamgrößen und -konfigurationen.

    Den größten Effektbeitrag für die Teameffektivität hat die Erfahrung der Entwicklerinnen mit agilen Praktiken und Methoden. Das lässt sich altbacken an — ist es aber nicht: Erfahrung ist die Summe der durch stetiges Lernen erworbene Kenntnisse und Verhaltensweisen, ein Vertrautsein mit Etwas, die Leichtigkeit etwas Gewohntes zu tun — keineswegs die Theorie, Prozessvorgaben, Rituale oder deliverables eines Prozess- oder Skalierungsframeworks.

    Überraschenderweise unerheblich für die Teameffektivität ist demnach1 die Unternehmensgröße. Ebenso unterscheidet sich auch die Unterstützung der Teams durch Management und/oder Führungskräfte nicht über die Unternehmensgröße. Irritierend ist: SAFe hat einen signifikant negativen Einfluss auf die Variable stakeholder concern und Teamautonomie — doch keine relevante Effektgröße. Interpretieren könnte man das als: »je mehr SAFe, um so weniger wird beachtet, was wirklich Wert stiftet«. Ja, das schmeckt nach cargo cult und magischem Denken. Die von Fundamental-Agilisten gerne geäusserte Meinung »leichtgewichtige Frameworks wie LeSS sind besser als stark präskriptive wie SAFe«11 12 kann aus den Daten1 nicht bestätigt werden.13

    Im Sinne der Forschungsfrage ist es ist gleichgültig, welches Framework eingesetzt wird weil alle gleichermassen wirkungsarm sind

    Die Autoren raten abschliessend: statt Energie auf die penible, regeltreue Umsetzung (by the book) eines Frameworks zu geben, sollten skalierungswillige Unternehmen die einfacheren Grundsätze des Agilen Manifests14 so gut als möglich umsetzen. Wenn es denn unbedingt ein Framework sein soll, dann eines, das die vorhandene Struktur, Kultur und Kompetenzen reflektiert. So mag das kompliziertere, präskriptiv-starre, trainings- und beraterlastige SAFe taugen für hochregulierte, hierarchische Konzernumgebungen mit geringer Erfahrung im agilen Miteinander und gut gefüllter Transformationskasse. Unternehmen, deren Entwicklerinnen agile Praxiserfahrung haben, skalieren sich zu größeren Vorhaben eher mit dem leichtgewichtigeren Scrum of Scrums, LeSS oder entwickeln eine eigene, realistisch an die vorhandenen Fähigkeiten angepasste ‘Hausmethode’.

    Im Kleingedruckten der Eingangsbedingungen erwarten jedoch alle Ansätze bereits vor der Implementierung funktionierende agile Teams. Ohne robuste agile Grundkompetenzen werden aus release trains schnell release trams: während der output sich in Methodentreue überschlägt, stottert der outcome.

    Weiters wird Praktikern unabhängig vom Skalierungsansatz empfohlen, die Zufriedenheit der Stakeholder und die Effektivität der Teams laufend zu überwachen. Relentless improvement nennen das die SAFe-Jünger, PDCA-loop (plan-do-check-act) oder Hausverstand alle anderen.

    Was genau diese ‘Kultur’ in Unternehmen sein soll, ist leider ohne akademischen Konsens. »Kultur ist was geschieht, wenn niemand hinsieht« hilft nicht wirklich weiter. Wie ‘mindset’ ist ’Kultur’ ein Kaugummibegriff, der immer dann herhalten muss, wenn es nicht so gut läuft mit dem change. Oder mit dem Framework.

    Rasender Stillstand!

    * * *


    1. Verwijs, Christiaan, und Daniel Russo. „Do Agile Scaling Approaches Make a Difference? An Empirical Comparison of Team Effectiveness across Popular Scaling Approaches“. Empirical Software Engineering 29, Nr. 4 (Juli 2024): 75. DOI. Strukturierte qualitative Befragung von n = 15078 Mitarbeitende in 4013 agilen Teams zur Messung ihrer Effektivität, kombiniert mit Zufriedenheitsumfragen bei 1841 Stakeholdern von 529 dieser Teams. ↩︎
    2. inferenzstatistische Analysen, einschließlich Varianzanalyse und multipler linearer Regression, um signifikante Unterschiede zu ermitteln; Kontrollvariablen: Teamerfahrung und Größe der Organisation ↩︎
    3. das Ausmass, zu dem ein Ergebnis nicht zufällig ist ↩︎
    4. Effektgröße (d) setzt den durchschnittlichen Unterschied in Relation zur Varianz, also zur Breite der Verteilung. Effektgrößen werden manchmal als die »Währung der psychologischen Forschung« bezeichnet. Sie drücken aus, wie relevant ein Unterschied zwischen zwei Durchschnittswerten zweier Gruppen ist; Beispiel: der durchschnittliche Größenunterschied zwischen Fichten und Föhren. d = 0,2 → kleine …, d = 0,5 → mittlere …, d = 0,8 → große Effektgröße Quelle: Schäfer, T., & Schwarz, M. A. (2019). The meaningfulness of effect sizes in psychological research: Differences between sub-disciplines and the impact of potential biases. Frontiers in Psychology, 10(813) ↩︎
    5. Almeida, Fernando, und Eduardo Espinheira. „Large-Scale Agile Frameworks: A Comparative Review“. Journal of Applied Sciences, Management and Engineering Technology 2, Nr. 1 (31. März 2021): 16–29. DOI. ↩︎
    6. Für mechatronische und industrielle Fertigung erklärt sich keines der betrachteten Skalierungsframeworks ausdrücklich zuständig. ↩︎
    7. Dikert, Kim, Maria Paasivaara, und Casper Lassenius. „Challenges and Success Factors for Large-Scale Agile Transformations: A Systematic Literature Review“. Journal of Systems and Software 119 (September 2016): 87–108. DOI. ↩︎
    8. Dingsøyr, Torgeir, Tor Erlend Fægri, und Juha Itkonen. „What Is Large in Large-Scale? A Taxonomy of Scale for Agile Software Development“. In Product-Focused Software Process Improvement, herausgegeben von Andreas Jedlitschka, Pasi Kuvaja, Marco Kuhrmann, Tomi Männistö, Jürgen Münch, und Mikko Raatikainen, 8892:273–76. Lecture Notes in Computer Science. Cham: Springer International Publishing, 2014. DOI. ↩︎
    9. Die datenschutzkonforme Abfrage ist so gestaltet, dass Teams ihren eigenen Entwicklungsprozess selbst validieren können und ihre Stakeholder einladen, das ebenso zu tun. Siehe https://www.scrumteamsurvey.org – kostenpflichtige Varianten erlauben den Vergleich zwischen mehreren Teams eines skalierten Projektes und bieten (wer hätte das gedacht!) Beratung und Dienstleistungen an. ↩︎
    10. Verwijs, Christiaan, und Daniel Russo. „A Theory of Scrum Team Effectiveness“. ACM Transactions on Software Engineering and Methodology 32, Nr. 3 (31. Juli 2023): 1–51. DOI. ↩︎
    11. Wolpers S (2023) SAFe’s NPS Score as a Scaling Framework Is –56 According to 505 Survey Participants. URL ↩︎
    12. Hinshelwood M (2023) The SAFe delusion: Information for decision-makers considering the SAFe framework. URL ↩︎
    13. im Original der Arbeit heisst es »lightweight approaches do not seem to outperform more expansive and prescriptive approaches, which is a prevalent belief among practitioners« ↩︎
    14. das Agile Manifest in seiner Urform ist hier zu finden. Seit mehr als zwanzig Jahren. ↩︎
  • Gewolltes Nichtwissen: wie Glauben sich verdichtet

    Sind wir stets neugierig1 und bestens informiert, um rationale Entscheidungen zu treffen? Oder sind wir Menschen doch keine ‘Informavoren’23 Wie kann es sein, dass wir absichtlich Informationen vermeiden um — von lästigen Fakten ungestört — längst gefasste Meinungen zu pflegen? Erstaunlich oft schauen Menschen absichtlich weg, vermeiden Informationen um in bewusster Ignoranz selbstdienliche Entscheidungen zu treffen. Im Glauben verharren obwohl Fakten dagegen sprechen? Finsterstes Mittelalter!

    Informationsvermeidung oder epistemische Abstinenz4 ist kein Problem, so lange das Suchen nach Wahrheiten nur die eigene Person und niemand sonst betrifft. Berühren unterinformierte Entscheidungen allerdings andere, dann wird gewolltes Nichtwissen problematisch. So gibt es etwa ziemlich treffsichere Tests, die vorhersagen, mit welcher Wahrscheinlichkeit sich ein frisch vermähltes Paar innerhalb von 14 Jahren Ehe wieder trennen wird.5 Wer will das wissen, wenn Rosenblätter im Standesamt regnen?

    Straussen stecken ihren Kopf nicht in den Sand. Das ist ein Missverständnis.

    Eine Metastudie6 fasst die Ergebnisse aus zweiundzwanzig Untersuchungen zusammen. Mehr als sechstausend Teilnehmenden sollten widersprüchliche ethische Entscheidungen treffen. Sie wussten dabei nicht, welche Folgen das für andere Personen hat. Würden sie sich altruistisch verhalten, wenn sie vor ihrer Entscheidung die Konsequenzen für andere Menschen kennen? Fast 40% der Teilnehmer wollten im Experiment die Konsequenzen ihrer Entscheidung für andere nicht wissen und zahlten sogar moderate Beträge um diese Informationen nicht zur Kenntnis nehmen zu müssen. Absichtlich unterinformiert zu bleiben, wie der Vogel Strauss den Kopf noch ein Stückchen weiter in den Sand zu bohren7, hat offenbar einen Wert.

    Wie ist absichtliches Nichtwissen-Wollen erklärbar?

    Mindestens sechs Funktionen absichtlichen Ignorierens werden unterschieden:8

    • Vermeidung negativer Emotionen — nur ein geringer Teil der Betroffenen wollten Einsicht in ihre eigenen Stasi-Akten9
    • Spannung und Überraschung halten — in einem Krimi den Mörder vorher zu kennen, verdirbt den Film
    • strategischer Schutz — »davon habe ich nichts gewusst« z.B. in Korruptionsfällen wie ENRON oder Watergate
    • vorurteilsfreie Entscheidungen treffen können — im blind auditioning spielen Interpreten für die Jury unsichtbar, ihr Aussehen hat keinen Einfluss auf die Bewertung
    • als Strategie zum subjektiven Informationsmanagement — Selektivität in der Nachrichtenwahrnehmung blendet irritierende Informationen aus
    • Erwerb neuer Fertigkeiten — als Anfänger ständig mit Profis verglichen zu werden wirkt demotivierend auf das eigene Lernen

    Das englische ignorance steht für einen Zustand, in dem eine Person die Frage verstanden hat und die Antwort nicht kennt obwohl sie diese umstandslos herausfinden könnte.1 Es handelt sich also um bekannte Unbekannte, nicht um unbekannte Unbekannte, wie Donald Rumsfeld, ehemaliger US-Verteidigungsminister in einem seltenen philosophischen Ausnahmezustand formulierte.10 11

    Beispiele gibt es im Dutzend, zwei herausgegriffen: die Vermeidung kostenloser Informationen zu den Lebensbedingungen von Nutztieren führt zu einem Anstieg des Fleischkonsums um 16 Prozent12, Menschen, die in Regionen mit vielen Geflüchteten leben, vermeiden Nachrichten über Schutzsuchende.13

    »How many times can a man turn his head, pretending he just doesn’t see?« — Bob Dylan in ‘Blowin’ in the Wind’ (1963)14

    Dieses gewollte Nichtwissen oder willful ignorance ist in der Ökonomie, in Unternehmen, der Politik und Soziologie breit untersucht und lässt sich doch nur schwer mit Theorien vereinbaren, die davon ausgehen, dass Menschen ein Bedürfnis nach Gewissheit, nach Vermeidung von Mehrdeutigkeit oder Schlüssigkeit haben.15 16 Nicht-wissen-wollen ist ein harter Kontrast zu Rational-Choice-Theorien, die uns als rationale Entscheider und algorithmische Kosten-Nutzen-Ökonomen verstehen. Erklärbar scheint das Phänomen mit der vom Ökonomen Herbert Simon formulierten bounded rationality, nach der uns ein ‘gut genug’ als Entscheidungsgrundlage völlig ausreicht,17 wir also nicht allesalles wissen müssen, um entscheiden zu können.18 Besser noch trifft die Neue Erwartungstheorie von Kahneman und Tversky die Lage. Sie beschreibt, wie Entscheidungsfindung unter Risiko geschieht, wenn Alternativen sich in Eintrittswahrscheinlichkeit und möglichem Gewinn unterscheiden:19 wir bevorzugen in Entscheidungssituationen einen hohen doch unsicheren Verlust gegenüber einem sicheren geringeren Verlust.20 Wir wertschätzen, was wir besitzen, erheblich höher, als Dinge ausserhalb unseres Zugriffs.21 Für entscheidungsrelevante Informationen scheint das Gleiche zu gelten: was wir zu wissen glauben, zählt mehr, als was wir weiters in Erfahrung bringen sollten.

    Weshalb ist das so? Es kann taktisch entscheidend sein, wahrheitsgemäß sagen zu können: »Von diesen Vorgängen habe ich nichts gewusst«. Im ENRON-Prozess 2006, dem grössten Korruptionsprozess der US-Geschichte, hatten die Angeklagten höchste Zuversicht in ihre Immunisierung durch absichtliches Nichtwissen.22 Erfolglos: sie wurden trotz einer Besonderheit im US-amerikanischen Recht verurteilt, nach der Informationen über frühere Verurteilungen des Angeklagten als character evidence nicht in einen aktuellen Prozess eingeführt werden dürfen. Platziert etwa ein druckvoller Ankläger diese unzulässigen Informationen dennoch, dann muss der Richter die Geschworenen auffordern, diese Informationen zu ignorieren. Das kann natürlich nicht gelingen: einmal gehört, können Informationen nicht mehr ungehört gemacht werden — das geben unsere Gehirne nicht her. »Denken Sie nicht an rosa Elefanten!« — Prozesse des Vergessens geschehen überwiegend automatisch23, absichtlich vergessen klappt nicht, absichtlich nicht-wissen-wollen hingegen ganz gut.

    Das erscheint alles plausibel. Sofern die Konsequenzen subjektiver Entscheidungen nur die Entscheiderin betreffen, gibt es kein Dilemma. Wenn Dritte betroffen sind, sehr wohl — etwa bei Strukturreformen oder Arbeits- und Organisationsverfahren, die in Unternehmen viele hunderte Mitarbeitende unmittelbar beeinflussen.

    Der ‘Elefant im Raum’ als Metapher für das Unausgesprochene, das jeder weiss, doch niemand benennen will, ist kein Einzelgänger — eher eine ebenso ausgewachsene wie unsichtbare Herde. In Unternehmen ist das in schöner Regelmässigkeit zu beobachten: eine Reform folgt auf die nächste, Prozesse, Regeln werden entschieden und Konsequenzen über die unmittelbar eigene Sphäre der Akteure hinaus ausgeblendet. Genau das ist willful ignorance oder epistemische Abstinenz4: man könnte wohl wissen, welche Konsequenzen Reorganisationen und Massnahmen haben. Das absichtliche nicht-wissen-wollen macht corporate orgflix erst amüsant: ‘Vorwärts immer, rückwärts nimmer’24 — treten ignorierte Konsequenzen ein, dann sind Beraterinnen längst beim nächsten Kunden und Reformer mit noch wichtigeren Verbesserungen betraut.

    Aber wer will das schon wissen?

    * * *


    1. Krutsch, Artur, und Kerstin Skork. „‚Gewolltes Nichtwissen kann als kulturelle Fähigkeit verstanden werden‘ – Interview mit Ralph Hertwig, Direktor am Max-Planck-Institut für Bildungsforschung, und Christoph Engel, Direktor am Max-Planck-Institut zur Erforschung von Gemeinschaftsgütern“, 5. Mai 2021. URL. ↩︎
    2. Gigerenzer, Gerd, und Rocio Garcia-Retamero. „Cassandra’s Regret: The Psychology of Not Wanting to Know.“ Psychological Review 124, Nr. 2 (März 2017): 179–96. DOI. ↩︎
    3. Miller, G. A. (1983). Informavores. In F. Machlup & U. Mansfield (Eds.), The study of information: Interdisciplinary messages (pp. 111–113). New York, NY: Wiley-Interscience. — zitiert nach Gigerenzer und Garcia-Retamero. 2017 ↩︎
    4. Herrmann, Sebastian. „News Fatigue: Will ich nicht wissen – besonders, wenn viel auf dem Spiel steht“. Süddeutsche.de, 2.11.2023. URL. — zitiert werden Ralph Hertwig und Christoph Engel ↩︎
    5. Gottman, John Mordechai, und Robert Wayne Levenson. „The Timing of Divorce: Predicting When a Couple Will Divorce Over a 14‐Year Period“. Journal of Marriage and Family 62, Nr. 3 (August 2000): 737–45. DOI. ↩︎
    6. Vu, Linh, Ivan Soraperra, Margarita Leib, Joël Van Der Weele, und Shaul Shalvi. „Ignorance by Choice: A Meta-Analytic Review of the Underlying Motives of Willful Ignorance and Its Consequences.“ Psychological Bulletin 149, Nr. 9–10 (September 2023): 611–35. DOI. ↩︎
    7. Der Strauss macht das natürlich nicht! Ein Mythos seit dem Mittelalter; Wikipedia ↩︎
    8. Hertwig, Ralph, und Christoph Engel. „Homo Ignorans: Deliberately Choosing Not to Know“. Perspectives on Psychological Science 11, Nr. 3 (Mai 2016): 359–72. DOI. ↩︎
    9. Hertwig, R., & Ellerbrock, D. (2022). Why people choose deliberate ignorance in times of societal transformation. Cognition, 229, Article 105247. DOI — Von jenen Personen, die annahmen, es gäbe Stasiakten zu ihnen selbst wollten nur 28% (277 von 973) auch Akteneinsicht und die Wahrheit über ihre Bespitzelung selbst sehen. ↩︎
    10. „There are known knowns; there are things we know we know. We also know there are known unknowns; that is to say we know there are some things we do not know. But there are also unknown unknowns – there are things we do not know we don’t know.“ „Es gibt bekannte Bekannte, es gibt Dinge, von denen wir wissen, dass wir sie wissen. Wir wissen auch, dass es bekannte Unbekannte gibt, das heißt, wir wissen, es gibt einige Dinge, die wir nicht wissen. Aber es gibt auch unbekannte Unbekannte – es gibt Dinge, von denen wir nicht wissen, dass wir sie nicht wissen.“ ist der bekannteste Ausspruch des damaligen US-Verteidigungsministers Donald Rumsfeld, den er während einer Pressekonferenz im Februar 2002 im Vorfeld des Dritten Golfkriegs bekannt sagte und der in der Öffentlichkeit wie Fachliteratur seit dem zu Risikoabschätzungen verwendet. YouTube Video ↩︎
    11. Gigerenzer et al. 2017, Definition S. 181 ↩︎
    12. Epperson, Raphael, und Andreas Gerster. „Information Avoidance and Moral Behavior: Experimental Evidence from Food Choices“. SSRN Electronic Journal, 2021. DOI. ↩︎
    13. Freddi, Eleonora. „Do People Avoid Morally Relevant Information? Evidence from the Refugee Crisis“. The Review of Economics and Statistics, 16. August 2021, 1–16. DOI. ↩︎
    14. Dylan, Bob. ‘Blowin’ in the Wind’ TV-Mitschnitt, 1963, YouTube-Video ↩︎
    15. Hogarth, R. (1987). Judgment and choice (2nd ed.). New York, NY: Wiley. Janis, I. L., & Mann, L. (1977). Decision making. New York, NY: Free Press. zitiert nach 2
    16. Kruglanski, A. W. (2004). The psychology of closed mindedness. New York, NY: Psychology Press. zitiert nach 2
    17. Simon, Herbert A. „A Behavioral Model of Rational Choice“. The Quarterly Journal of Economics 69, Nr. 1 (Februar 1955): 99. DOI. S. 99 »Broadly stated, the task is to replace the global rationality of economic man with the kind of rational behavior that is compatible with the access to information and the computational capacities that are actually possessed by organisms, including man, in the kinds of environments in which such organisms exist.« ↩︎
    18. ‘Good enough to try’ ist ein beliebter Textbaustein agiler Methoden- und Organisationsentwicklung. Sinngemäß meint es ‘Wir haben zwar keine Ahnung, was genau nach diesem Spielzug geschieht, müssen uns aber bewegen weil Stillstand keine Alternative ist.’ Siehe auch Erich Honeckers Motto unter 24
    19. Kahneman, Daniel, und Amos Tversky. „Prospect Theory: An Analysis of Decision under Risk“. Econometrica 47, Nr. 2 (März 1979): 263. DOI. ↩︎
    20. Kahneman, Daniel. Thinking, Fast and Slow. London: Allen Lane, 2011. Die Prospect Theory ist auf S. 278–288 gut erläutert. ↩︎
    21. Kroeber-Riel, Werner, und Andrea Gröppel-Klein. Konsumentenverhalten. 10., Überarbeitete, Aktualisierte und Ergänzte Auflage. Vahlens Handbücher der Wirtschafts- und Sozialwissenschaften. München: Verlag Franz Vahlen, 2013. -Die neue Erwartungstheorie in Bezug zu irrationalem Konsumentenverhalten ↩︎
    22. Simon, William. „Wrongs of Ignorance and Ambiguity: Lawyer Responsibility for Collective Misconduct“. Yale J. on Reg. 22 (1. Januar 2005): URL ↩︎
    23. Schooler, Lael J., und Ralph Hertwig. „How Forgetting Aids Heuristic Inference.“ Psychological Review 112, Nr. 3 (Juli 2005): 610–28. DOI. — zitiert nach Gigerenzer und Garcia-Retamero. 2017 ↩︎
    24. von Erich Honecker als „in der Gründerzeit der DDR geprägte Losung“ zitiert in der Festansprache zum 40. Jahrestag der DDR, 7. Oktober 1989, URL ↩︎
  • Mitarbeitergespräche? Super Sache! Oh wait … wofür?

    Sprechen ist immer besser als Schweigen: keine Frage, völlig einleuchtend! So winkt braven Angestellten mindestens einmal jährlich ein ‘Mitarbeitergespräch’. Nach einem von einer Personalabteilung hilfreich erstellten Gesprächsleitfaden befragt ein Angestellte/r eine/n anderen. Die Fragen stellt, wer in einem Hierarchiebaum eine Stufe weiter oben steht. Das Ergebnis des Gespräches ist eine Notiz in der Personalakte und der Pflicht ist genügt. Längst ist ausgeforscht, wie sinnlos und kontraproduktiv1 das jährliche HR-Ritual ist, noch dazu teuer2 und von jedem ungeliebt:3 zwei Menschen haben ein Pflichtgespräch, Motive und Erwartungshaltungen sind verschieden, keiner kommt neutral und ohne Vorerfahrung. Die beiden Pflichtsprecher eint nur eines: diesen lästigen Termin hinter sich bringen. Wofür also geschieht dieses Ritual?

    Mitarbeiter und bewertende Vorgesetzte haben verschiedene und vor allem versteckte Ziele — was die Ergebnisse verfälscht oder missbräuchlich verwenden lässt.4

    Verhalten aus erster Hand über die Zeit beobachten kann, wer Teil einer gemeinsam und regelmässig arbeitenden Gruppe ist. Als teilnehmender Beobachter das eigene Ego und Verzerrungen herauszuhalten ist schon schwierig genug, wenn man das nicht erlernt und geübt hat, wie professionelle Psychotherapeuten. Von ausserhalb der losen Gruppe sind alle Beobachtungen zum Verhalten in der Gruppe und bestenfalls Spekulation aus zweiter Hand. Auch aus einem strukturierten Interviewfragebogen belastbare Daten zu gewinnen, ist für trainierte Pädagogen, Ethnologen, Therapeuten nicht leicht. Dazu muss man einiges wissen über Datenqualitäten und -vergleichbarkeit, Varianzen und strukturelle biases. Wie soll methodisch untrainierten Linienvorgesetzten das gelingen? Wie differenziert, auf welcher Skala geschieht Bewertung?

    Kein Mensch und damit auch kein bewertender Vorgesetzter kann objektiv beurteilen da kognitive Denkfehler die valide Messung und den Vergleich von Ergebnissen über mehrere Mitarbeiter verhindern. 5

    Um es sehr kurz zu machen: wir Menschen sind ernsthaft schlecht darin, die Leistung anderer fair und akkurat zu beurteilen. Mit Übung wird es ein wenig besser und bleibt dennoch schwierig. Belastbar wird es niemals.

    Informiert man sich oberflächlich zu qualitativer Beobachtung und nur ganz kurz zu Messtheorie, wird schnell klar: strukturelle Denkfehler dominieren, wo objektive Bewertung das Ziel sein sollte.

    Der Bias des Bewerters hat den grössten Einfluss auf das Rating.​6

    Diese Wahrnehmungsfehler sind gut dokumentiert: Halo Effect7,confirmation bias 8, Recency9 und der similar-to-me-Effekt … mehr als 140 dieser Biases sind bekannt und kein Menschlein kann verlässlich entkommen. (»Frechheit! Ich sehr wohl! « — Herzlich willkommen beim Blind Spot Trap.10)

    Der bestens untersuchte similar-to-me-Effekt ist in Personalgesprächen eine hartnäckige kognitive Verzerrung: je ähnlicher sich Vorgesetzt/e und Mitarbeiter sind, um so besser fallen Bewertungen aus.11 Gleich und gleich gesellt sich gern, der Volksmund weiss das längst. Natürlich beisst sich nicht nur das mit dem Streben nach diversity, möglichst verschiedene Erfahrungen, Kulturen und Sichten gemeinsam arbeiten zu lassen um voneinander zu lernen.

    Die Passung eines Menschen zu allen anderen einer Gruppe wird tatsächlich im gemeinsamen Arbeiten, in der Kaffeeküche verhandelt, beim Plausch nach der Kantine: »passt nicht zu uns«, »mit dem hab’ ich Schwierigkeiten«, »eckt an« — soziale Keule macht die schlimmsten Beulen. So diffamierte und stigmatisierte sind angezählt und haben geringe Chancen, die Zuschreibung von Eigenschaften ungeschehen zu machen. Was Du machst ist egal — so lange du beliebt bist. Mit karriereförderlichen Beurteilungen wird die Anpassung an sozialnormiertes Verhalten belohnt, nicht unbedingt Leistung: Brown nosing beats performance12. Doch geht es bei Performance Reviews nicht um genau das, die Leistung, für die Mitarbeitende ihre Zeit gegen Gehalt tauschen?

    Die subjektive Beliebtheit (liking) hat einen höheren Einfluss auf die Leistungsbewertung als die tatsächliche Leistung.13

    Abweichungen mag es bei Rollen geben, deren Leistung unmittelbar in Zahlen zu messen ist: verkaufte Verträge, gesägte Bretter, geschaufelte Schubkarren. In der Wissensarbeit gibt es diese objektive Messbarkeit nicht. Aber … aber wenigstens Feedback geben, Rückmeldung? Kann man damit nicht ein Mitarbeitendengespräch wertvoll machen?

    Feedback gehört dem Mitarbeiter, nicht dem Unternehmen, nicht HR. Wenn sich Kollegen vertraulich Feedback geben, dann bleibt das genau dort.14

    Feedback wird von anderen im Vertrauen erfragt und ist ein Geschenk an Verletzlichkeit und Offenheit — keine Disziplinarmassnahme.15 Es ist unethisch, Inhalte aus vertraulichem Feedback zu einem Instrument der Leistungs- oder Passungsmessung umzuwidmen. Genau dieser Mißbrauch geschieht, wenn aus einem persönlichen Gespräch eine Sicht als Notiz in die Personalakte gelangt.

    Weshalb dann überhaupt Mitarbeitergespräche und weshalb nur einmal im Jahr? Weshalb nicht einmal monatlich oder gleich jeden Tag im daily, wenn in agileren Formaten zusammen gearbeitet wird?

    Die unausgesprochene Grundannahme für den Einsatz schriftlicher Bewertungen (appraisals) und Zielvereinbarungen ist eine ganz andere:

    Leistungsbeurteilung ist ein starkes extrinsisches Motivationsinstrument, das davon ausgeht, dass man dem Mitarbeiter nicht zutraut, seine eigene Motivation intrinsisch zu steuern, und stattdessen auf Zuckerbrot und Peitsche setzt. Bonus und Beförderung sind das Zuckerbrot. Bewährung und Kündigung sind die Peitsche. 16

    Menschen müssten mit Zielen motiviert werden — sonst würden sie nicht ordentlich arbeiten. Diese Sicht entstammt einem Menschenbild aus der Mottenkiste des letzten Jahrhunderts. McGregors Typ X/Y kombiniert mit einem aus dem Zusammenhang interpretierten, halb verstandenen Taylorismus. Seit mehr als 40 Jahren längst widerlegt ist McGregor doch nicht aus den BWL-Curricula und HR-Köpfen zu kriegen. Das Bild ist so wunderbar einfach wie falsch.

    Zielvereinbarungen — wenigstens die taugen doch …? Darunter liegt die Hypothese, es gäbe eine direkte Beziehung zwischen der persönlichen Leistung und der Schwierigkeit, das Ziel zu erreichen: je schwieriger das Ziel, desto höher die Leistung? Leider auch nicht:

    Menschen, die sich selbst ein Ziel setzen, erreichen dieses besser als jene, die nur versuchen, ihr Bestes zu geben.​17

    Ziele schaden nicht, tragen aber auch nicht zu höherer Leistung bei. 18

    Extrinsische, von aussen kommende Motivation durch rigide Zielvereinbarungen und die gekoppelte Aussicht auf anteilige Boni am Jahresende verpufft schneller als das obligatorische Jahresgespräch zu Ende ist — intrinsische Motivation ist das Wofür des eigenen Tuns und wirkt jeden Tag aufs Neue: weil es vielleicht Freude macht und man selbst will. Das ist der entscheidende Unterschied fortschrittlicher Organisation zur Lesart konventioneller Führung: man kann nur sich selbst motivieren, niemals andere.

    Andernfalls versuchen Sie das doch mit Ihren Kindern, dem Partner … und wenn es klappt: verraten Sie dem Rest der Welt bitte, wie?

    * * *


      1. Bobinski, Dan. „Performance appraisals don’t work“. Management-Issues (blog), 8. Juli 2010. URL. ↩︎
      2. Nehmen wir ein Unternehmen an mit 1000 Mitarbeitenden, Führungsspanne 24 in Ebene 3 des Organigramms (eine Führungskraft führt 24 Mitarbeitende), damit 40 x 24 = 960 Mitarbeitergespräche á 1h x 100€ Stundensatz (die rechnerischen Zeitkosten der Führungskräfte ignoriert) – macht defensiv gerechnet 96000€ pro Saison. Das entspricht dem Salär einer sehr gut entlohnten Personalfachkraft in Ebene 2. ↩︎
      3. Heathfield, Susan. „Why Employee Performance Appraisal Just Doesn’t Work“. LiveAbout, 10. Oktober 2019. URL zugegriffen 31.01.2024. ↩︎
      4. Culbert, Samuel, und Lawrence Rout. Get Rid of the Performance Review! City: Business Plus, 2010. ↩︎
      5. Dessler, Gary, Virginia Sutherland, Patricia Goodman, und Nina Cole. Fundamentals of Human Resources Management in Canada. Toronto: Pearson/Prentice Hall, 2004. ↩︎
      6. Scullen, S. E., M. K. Mount, und M. Goff. „Understanding the Latent Structure of Job Performance Ratings“. The Journal of Applied Psychology 85, Nr. 6 (Dezember 2000): 956–70. ↩︎
      7. Wir schliessen unwillentlich von bekannten Eigenschaften auf unbekannte, lassen uns von einem Aspekt blenden und erweitern ihn auf das Gesamtbild. Wir kennen das alle aus der Schule und vielfach empirisch belegt ist es auch: Lehrer bewerten die Leistungen eines gut aussehenden und freundlichen Schülers höher als sie es objektiv im Vergleich mit anderen Schülern sind. ↩︎
      8. Informationen, die die eigene Sicht stärken, werden über-, gegenläufige Informationen unterbewertet. ↩︎
      9. Junge Informationen werden besser erinnert – was zuletzt erlebt wurde ist präsenter im Gedächtnis. Bei Leistungsbewertungen sind allenfalls die letzten vier Wochen noch erinnerbar. Diese werden auf ein ganzes Jahr extrapoliert … das kann kaum die Realität abbilden? ↩︎
      10. unsere eigenen strukturellen Denkfehler fallen uns Wenger auf als die anderer LeuteURL ↩︎
      11. Pulakos, Elaine D., und Kenneth N. Wexley. „The Relationship Among Perceptual Similarity, Sex, and Performance Ratings in Manager-Subordinate Dyads“. Academy of Management Journal 26, Nr. 1 (1. März 1983): 129–39. JSTORE ↩︎
      12. wofür brown steht? Ein wenig Fantasie nur. ↩︎
      13. Sutton, Ashley W., Sean P. Baldwin, Lauren Wood, und Brian J. Hoffman. „A Meta-Analysis of the Relationship Between Rater Liking and Performance Ratings“. Human Performance 26, Nr. 5 (November 2013): 409–29. DOI. ↩︎
      14. Trost, Armin. The End of Performance Appraisal: A Practitioners’ Guide to Alternatives in Agile Organisations. Cham: Springer International Publishing Springer, 2017. ↩︎
      15. Hattie, John, und Helen Timperley. „The Power of Feedback“. Review of Educational Research 77, Nr. 1 (März 2007): 81–112. DOI. ↩︎
      16. Shinsato, Harold. „Appraising Performance Appraisals for Agile Practitioners“, 2016. Blogbeitrag auf dem Website der Agile Alliance, PDF. Im Original lautet die Passage: »The Performance Review is a severe extrinsic motivation device that really assumes that the employee can’t be trusted to manage their own motivation intrinsically, and instead it depends on the carrot and the stick. Bonus and promotions are the carrot. Probation and termination are the stick.« ↩︎
      17. Locke, Edwin A., und Gary P. Latham. „Building a Practically Useful Theory of Goal Setting and Task Motivation: A 35-Year Odyssey.“ American Psychologist 57, Nr. 9 (September 2002): 705–17. DOI. ↩︎
      18. Wood, Robert E. „Task Complexity: Definition of the Construct“. Organizational Behavior and Human Decision Processes 37, Nr. 1 (Februar 1986): 60–82. DOI. ↩︎
    • Was ist dran an beliebten Glaubenssätzen des Change Management?

      Was ist frommer Glauben, was belegt? Wie filtert man aus einer Flut populäre Statements zu change’, Wandel’, ‘Veränderung’, was tatsächlich wahr und belegt ist? Scheitert tatsächlich ein Dreiviertel aller Change-Initiativen? Schon dieser satten Behauptung fehlt das Fundament.1 2 Die wenigen empirischen Untersuchungen kranken an lauen Begriffsdefinitionen, der Eingrenzung des Sachgebietes und methodischen Schwächen. Wenigstens der Ursprung der kolportierten ‘siebzig Prozent’ ist halbwegs klar und stammt aus einem anderen Kontext als die Verallgemeinerung zu alle Change-Initiativen. Hammer & Champy3 gaben 1994 diese 70%-Fehlrate als ihre subjektive Einschätzung für ‘Reengineering-Vorhaben’ an.4 Auch ein Widerruf half nicht:

      »Unfortunately, this simple descriptive observation has been widely misrepresented and transmogrified and distorted into a normative statement (…)« — Hammer & Stanton, 19955

      Falsche Informationen werden durch Wiederholung weder richtiger noch verschwinden sie freiwillig. Die Missinterpretation einer subjektiven Einschätzung wurde durch wiederholt ungeprüfte Zitate zu einer universellen Wahrheit. Das ist der Kern der Brandolini-Asymetrie: der Energieaufwand um Blödsinn zu entlarven ist eine Größenordnung mehr als es zur Produktion braucht.

      Evidenz ist ein scheues Reh. ​In der evidenzbasierten Wirkungsprüfung medizinischer Interventionen gibt es das Cochrane-Verfahren6. Zu einer Indikation oder Therapie ergibt dies einen umfassenden Überblick über Forschungsergebnisse und Metaanalysen randomisiert kontrollierter klinischen Studien, dem Goldstandard wissenschaftlicher Arbeit zu einem Zeitpunkt. Das kann sich ändern, wenn neue Daten veröffentlicht werden. Die Ergebnisse fliessen in Leitlinien zur Behandlung zusammen. Für die Sozial-, Management- und Organisationsforschung sind harte Evidenzen schwieriger zu erbringen: Interventionen in sich ständig verändernden sozialen Systeme wie Unternehmen es sind, widersetzen sich kontrollierter Randomisierung. Sozialforscher verwenden andere Methoden7 weil es für Management- und Organisationsmethoden kann kein Cochrane-Verfahren geben kann. Das nicht-kommerzielle ’Center for Evidence-Based Management’ (CEBM)8 versucht Annäherungen an die methodisch saubere Prüfung von Managementmoden. Am nächsten kommt die aufwändige Methode eines Rapid Evidence Assessments (REA).9 Bei dieser ‘schnellen Beweisaufnahme’ werden wissenschaftliche Beiträge objektiv und reproduzierbar gefiltert um nach einer gründlichen Bewertung des Inhaltes Rückschlüsse auf ursächliche Wirkungen ziehen zu können. Anders als eine Literaturübersicht ist ein REA transparent, überprüfbar, reproduzierbar und eliminiert strukturelle Denkfehler (nach Bestätigung der eigenen Sicht suchen, gegenläufige Ergebnisse ignorieren und viele Dutzende weitere biases). Als Daten fliessen Informationen, Fakten und ebenso nicht-systematische Praxiserfahrungen aus publizierter und unabhängig prüfbarer wissenschaftlich durchgeführter Forschung ein. Diese Daten können eine Behauptung, Annahme oder Hypothese unterstützen oder eben widerlegen. Ziel einer REA ist es, quantitativ und qualitativ bewertbar zu machen, ob eine Erkenntnis generalisierbar ist oder nur unter spezifischen Randbedingungen gilt.  Das Verfahren ist aufwändig und zeitintensiv und alles andere als rapid: in zwölf standardisierten Schritten10 werden systematisch Primärstudien in 5 Güteklassen von A+ bis D qualifiziert. A+ wäre ein systematischer Review mit einer Metaanalyse randomisiert-kontrollierter Studien, D wäre eine Querschnittstudie mit geringster Verallgemeinerung. Alleinstehende Fallstudien werden aussortiert.

      Ergebnis einer REA ist eine nachvollziehbar ausgewogene Bewertung dessen, was in der wissenschaftlichen Literatur über eine Intervention, einen Anspruch oder ein praktisches Problem zu einem Zeitpunkt bekannt ist. Ändert sich die Datenlage, dann kann sich auch die Bewertung ändern.

      Fact or Fake? Was ist haltbar an beliebten Glaubenssätzen zu ‘Veränderung’, welche Aussagen haben schwache Grundlagen?

      Diesen mühsamen Weg einer Faktenprüfung für populäre Aussagen im ‘Change Management’ gingen 2017 mehrere Autoren.11 Als Datengrundlage wurden 563 populäre Genre-Bücher nach ihrem Amazon-Verkaufsrang ausgewählt. Aussortiert wurden mangels interner Validität one-trick-ponies und Bücher, in denen prominente Management-Gurus ihre Meinung ausbreiten, doch Daten schuldig bleiben. Die verbleibenden 23 Büchern hatten drei Eigenschaften gemeinsam, sie …

      • konzentrieren sich darauf, wie man Organisationen verändert und nicht, was zu verändern ist, 
      • beziehen eine fundierte Position und sind keine überblicksartige Handbücher,
      • bieten Anleitungen und Rat für Praktiker

      Dieser erstaunlich kleine Rest ist, was Praktikerinnen brauchen: Wirksame Interventionen, die in Veränderungssituationen zuverlässig wirken sollten. Aus den verbleibenden, nur mehr 23 ‘Change Management’-Büchern wurden 18 Aussagen kondensiert, ein Ausschnitt:

      Menschen ändern sich nicht, wenn es keine Dringlichkeit (sense of urgency nach Kotter) gibt.

      In Änderungszuständen ist ein transformativer Führungsstil effektiver als ein transaktionaler.12

      Veränderungen in Unternehmen braucht Führungsrollen mit starker emotionaler Intelligenz.13

      Die Unternehmenskultur hat einen Effekt auf die (ökonomische) Unternehmensleistung.

      Welche dieser achtzehn populären Aussagen sind evident und mit solider Forschung unterlegt, welche nicht?

      Aussageeher wahrunsichereher falsch
      1. Siebzig Prozent aller Veränderungsinitiativen scheitern.keine Evidenz
      2. Eine klare Vision ist für einen erfolgreichen Wandel unerlässlich.klare Belege
      3. Menschen werden sich nicht verändern, wenn kein Gefühl der Dringlichkeit besteht.keine Evidenz
      4. Für erfolgreichen Wandel ist Vertrauen in die Führung erforderlich.kleine bis mittlere positive Effekte
      5. Bei der Bewältigung des Wandels ist ein transformationaler Führungsstil effektiver als ein transaktionaler.12sowohl transaktional wie transformative Führung hat nur kleinen Einfluss
      6. Organisatorischer Wandel erfordert Führungskräfte mit ausgeprägter emotionaler Intelligenz 13.
      7. Die Unterstützung durch Vorgesetzte ist entscheidend für den Erfolg des Wandels.
      8. Um den Wandel in Organisationen zu verwirklichen, ist eine starke Führungskoalition erforderlich.Schwache Effekte, uneinheitlich: Vertrauen scheint ein wirksamer Prädiktor
      9. Die Fähigkeit der Mitarbeiter zur Veränderung bestimmt die Fähigkeit der Organisation zur Veränderung.kaum Untersuchungen, definitorisch unsicher
      10. Partizipation ist der Schlüssel zum erfolgreichen Wandel.uneinheitliche, eher kleinere Effektstärken
      11. Widerstand gegen den Wandel ist dem Erfolg des Wandels abträglich.kaum valide Daten, eher keine Evidenz
      12. Ein fairer Veränderungsprozess ist wichtig, um erfolgreiche Veränderungen zu erreichen.fairer Prozess hat mittleren bis großen positiven Einfluss (level A).
      13. Die Veränderung der Organisationskultur ist zeitaufwändig und schwierig.bei 150+ Definitionen von ‘Organisationskultur’ sind Studien nicht mehr sinnvoll vergleichbar
      14. Die Organisationskultur hängt mit der Leistung zusammen.(wie 13)
      15. Die Festlegung von Zielen in Verbindung mit Feedback ist ein wirksames Instrument für Führungskräfte im Wandel.konsistente Effekte auf hohem Niveau (level A)
      16. Das Engagement für den Wandel ist ein wesentlicher Bestandteil einer erfolgreichen Veränderungsinitiative.bestätigt auf mittlerem Niveau
      17. Finanzielle Anreize sind ein wirksames Mittel, um Veränderungen zu fördern und die Leistung zu verbessern.bestätigt auf mittlerem Niveau
      18. Selbstverwaltete Teams erzielen bessere Ergebnisse bei der Umsetzung von Veränderungen als traditionell verwaltete Teams.moderat positive Effekte – nicht generalisierbar

      Zwei dieser 18 Aussagen herausgegriffen:

      »Menschen werden sich nicht verändern, wenn kein Gefühl der Dringlichkeit besteht.« — Kotter, Leading Change, 1996

      Als universelle Aussage ist Kotter’s signature quote des sense of urgency nicht haltbar, nicht durch Daten fundiert. Schwache Hinweise gibt es wohl, doch nicht als Eingangsbedingung: es muss nicht zuerst die Hütte brennen damit etwas geschieht. Zeitlicher Druck oder Zeitknappheit hat einen positiven Einfluss auf kooperatives Verhalten in Entscheidungssituationen und wirkt unter experimentellen Bedingungen leistungssteigernd (level A). Angst hingegen befördert kurzfristiges Denken und Handeln — was bei nachhaltigen Veränderungen in Unternehmen kaum ein sinnvolles Ziel sein kann. Eine wahrgenommene Bedrohung ist nur dann auch individuell wirksam, wenn die Selbstwirksamkeit einer Person ebenfalls hoch ist.14 Oder: bin ich willens und fähig meine eigene Situation zu ändern — dann aktiviert eine wahrgenommene Bedrohung. Sonst nicht. Das hört sich zu Recht an wie die ‘gelernte Hilflosigkeit’, mit der Martin Seligman sich wissenschaftliche Sporen verdiente, ehe er in die Positive Psychologie abdriftete.

      Auch Selbstorganisation muss nicht besser im Sinne von effizienter sein als organisiert-werden. »Self-managing teams perform better in realizing change than traditionally managed teams.« ist Kern und Glaubensbekenntnis der Aglisten. »… lass’ die Leute machen, räume Hindernisse aus dem Weg, vertraue und sorge für gute Umgebungsbedingungen — dann wird alles besser.«. Ist das so? Die validen Untersuchungen dazu bringen vage Ergebnisse. Es gibt wohl Belege für spezifische Arbeits- und damit Sozialsituationen, in denen sich selbst organisierende Gruppen oder Teams bessere Leistungen bringen:

      »(…) the positive effect on performance is greatest for self-managing teams dealing with high-tech novelty and radical innovation« — Patanakul & Lynn (2012)15

      Die Verallgemeinerung zu ‘Selbstorganisation ist immer besser als organisiert werden’ ist nicht haltbar: auf den Kontext kommt es an. In Situationen radikaler Innovation mit brandneuen Technologien ist Selbstorganisation belegt besser als direktiv organisiert werden.

      Scheitern nun 70% aller Change-Initiativen? Niemand kann eine wahre Antwort geben, die Datenlage ist dürftig. Für die Unternehmenspraxis wäre schon nützlich zu wissen, welche Interventionen oder Praktiken in welcher Art Situationen zuverlässig erwünschten Verhaltensänderungen führen. So lange das der Fall nicht ist: Selber denken hilft — und freundlich skeptisch bleiben.

      * * *


      1. Hughes, M. (2011). Do 70 Per Cent of All Organizational Change Initiatives Really Fail? Journal of Change Management, 11(4), 451–464. DOI ↩︎
      2. Cândido, C. J. F., & Santos, P. (2015). Strategy implementation: What is the failure rate? Journal of Management & Organization, 21(2), 237–262. und Slater, R. (2015). Leadership genius: 40 insights from the science of leading. Abingdon, UK: Teach Yourself. ↩︎
      3. Hammer, M., & Champy, J. (1994). Reengineering the Corporation: A Manifesto for Business Revolution (Bd. 10). DOI ↩︎
      4. Zum Verständnis muss man wissen: ’Reengineering’ ist ein Modebegriff der 1990er-Jahre zur Beschreibung damals schicker IT-Restrukturierungen. Heute geschieht das noch immer, hat aber noch viel schickere Bezeichnungen als damals. ↩︎
      5. Hammer & Stanton, 1995, S. 14 in Hammer, Michael, und Steven A. Stanton. Die Reengineering Revolution: Handbuch für die Praxis. Frankfurt: Campus Verl, 1995. — zitiert nach Hughes, M. (2011). Do 70 Per Cent of All Organizational Change Initiatives Really Fail? Journal of Change Management, 11(4), 451–464. DOI ↩︎
      6. Higgins, J., Thomas, J., Chandler, J., Cumpston, M., Li, T., Page, M., & Welch, V. (2021). Cochrane Handbook for Systematic Reviews of Interventions (v6.2, 2021). Abgerufen 5. April 2021, URL und Wikipedia ↩︎
      7. das Standardwerk ist Petticrew, M., & Roberts, H. (2006). Systematic reviews in the social sciences: A practical guide. Malden, MA: Blackwell. ↩︎
      8. CEBM Website “What Is Evidence-Based Management? – Center for Evidence Based Management. ↩︎
      9. eine von vielen Quellen zu diesem standardisierten Verfahren: Thomas, J., Newman, M., & Oliver, S. (2013). Rapid evidence assessments of research to inform social policy: Taking stock and moving forward. Evidence & Policy: A Journal of Research, Debate and Practice, 9(1), 5–27. DOI ↩︎
      10. Die zwölf Schritte einer REA sind:
        1 Background 2 Definition: what is meant by x 3 Assumed Causal mechanism
        4 Inclusion criteria
        5 Search strategy
        6 Study selection
        7 Data extraction
        8 Critical Appraisal: How Was the Trustworthiness of the Evidence Appraised? methodological appropriateness, quality; Impact = effect sizes
        9 Main findings
        10 Synthesis: What does it mean?
        11 Conclusion: What is the evidence for the assumption?
        12 Practical reflections ↩︎
      11. Have, S. ten, Have, W. ten, Huijsmans, A.-B., & Otto, M. (2017). Reconsidering change management: Applying evidence-based insights in change management practice (First Edition). Routledge, Taylor & Francis Group. 978–1–315–64601–5 ↩︎
      12. Burns, J.M. (1978) Leadership. New York. Harper & Row. und Bass, B. M. (1985). Leadership and performance beyond expectations. New York, NY: The Free Press. ↩︎
      13. entwickelt von Salovey, P., & Mayer, J. D. (1990). Emotional intelligence. Imagination, Cognition and Personality, 9(3), 185–211., popularisiert von Goleman, D. (1995). Emotional intelligence: Why it can matter more than IQ. New York, NY: Bantam Dell; Goleman, D. (2015). On emotional intelligence. Boston, MA: Harvard Business Review Press. ↩︎
      14. Peters, Gjalt-Jorn Ygram, Robert A.C. Ruiter, und Gerjo Kok. „Threatening Communication: A Critical Re-Analysis and a Revised Meta-Analytic Test of Fear Appeal Theory“. Health Psychology Review 7, Nr. sup1 (Mai 2013): S8–31. DOI. In einer umfangreichen Metastudie wurde die Theorie von Rogers weitgehend bestätigt. Drei Faktoren bestimmen die Angstreaktion: die Wahrscheinlichkeit des Auftretens, das Ausmaß der negativen Folgen und die Wirksamkeit der Reaktion. Rogers, Ronald W. „A Protection Motivation Theory of Fear Appeals and Attitude Change1“. The Journal of Psychology 91, Nr. 1 (September 1975): 93–114. DOI. ↩︎
      15. Patanakul, P., Chen, J., & Lynn, G. S. (2012). Autonomous teams and new product development. Journal of Product Innovation Management, 29(5), 734–750. ↩︎
    • Bockige Mitarbeitende? Warnhinweise für Führende.

      Die Forscherinnen Anna van der Velde und Fabiola Gerpott untersuchten renitente Mitarbeitende und gelangen zu überraschenden Rückschlüssen auf das Führungspersonal: »die Einordnung als kontraproduktives Verhalten greift zu kurz«, schreiben sie in einer im Dezember 2023 veröffentlichten Arbeit.1

      <tl;dr>2 Mit Renitenz schützen widerstrebende Mitarbeitende sich gegen Arbeitsüberlastung oder Übergriffigkeit von Führungspersonen. Mangelnde Fügsamkeit kann also Warnhinweise zu Führung geben — wenn man Warnungen sehen will.

      Fünf Formen der Renitenz wurden identifiziert3, die ähnlich häufig4 auftraten. In Summe beschreiben diese Widerstände das werktägliche Verhaltensspektrum der Lohnarbeit in ganzer Pracht:

      1. überzogenes Selbstbild (entitlement5)
      2. übermäßige Kontaktsuche oder -vermeidung
      3. Minimierung des Aufwands6
      4. gefühlsbetont schwankende Kommunikation7
      5. Untergrabung der Teamstruktur8

      Hängt die Wahrnehmung widerborstigen Verhaltens systematisch mit Merkmalen der Führungsperson9 wie Intelligenz oder Persönlichkeit10 zusammen? Methodisch etwas schwächer11 und unter einem Anfangsverdacht des social desirability bias12 (wer hat schon gerne ’seine Leute nicht im Griff’?) sind die Ergebnisse nicht direkt selbsterklärend:

      Kluge und bescheidene Menschen erleben seltener Widerstand gegen ihre Führung, es sei denn, sie fragen Mitarbeitende aktiv nach Kritik.13 Je unkonventioneller allerdings die Führungspersönlichkeit, um so mehr Renitenz scheint zu entstehen.14

      Wenn man nun schlau ist, noch dazu unkonventionell und obendrein Führungskraft und sich trotz alledem mit bockigen Mitarbeitenden zu plagen hat — wie kommt man aus dieser Zwickmühle wieder heraus? Van der Velde und Gerpott verweisen auf weitere Arbeiten15, die vermuten lassen, dass mit mehr Führungsaufgaben auch der Austausch mit anderen Führenden rapide schwindet. Oder anders: ‘oben wird die Luft dünner: jede/r steht für sich alleine, dazugelernt wird nichts mehr ’. Zur Abhilfe dieser hierarchisch induzierte Selbstisolation wird zu reverse mentoring16 geraten: Führungskräfte werden Mentees von Mitarbeitenden — die Wirkkräfte werden umgedreht.

      Das wäre dann dieses ‘miteinander auf Augenhöhe arbeiten’, zu dem man zurückkehrt, wenn es mit direktiver Führung nicht so gut klappt? Verrückte Welt.

      * * *


      1. Velde, Anna van der, und Fabiola Gerpott. „Ich bin dagegen – Fünf Formen der Renitenz von Mitarbeitenden“. PERSONALquarterly 2024, Nr. 1 (Dezember 2023): 44–47. ↩︎
      2. too long, didn’t read — die Zusammenfassung für eilige Leser ↩︎
      3. 40 Interviews und Befragung von n= 1.229 deutschen Führungskräften; Auswertung per „Topic-Modelling“ um zentrale Themen in großen Textsammlungen zu finden sowie Korrelationsanalysen: immerhin 80 % der Führungskräfte gaben an, mehrmals täglich mit Mitarbeitenden zu kommunizieren, 12,5 % gaben an, einmal wöchentlich zu interagieren ↩︎
      4. übermäßiger/vermeidender Kontakt mit 15 % als geringste, Minimierung des Aufwandes mit 23% als häufigste Nennung ↩︎
      5. Bedürfnis, immer Recht haben zu müssen; übertriebene Selbsteinschätzung; Infragestellen von Entscheidungen der Führungskraft; Überbetonung eigener Probleme; Herabsetzen anderer, um selbst besser dazustehen; Schutz des eigenen positiven Selbstbilds durch Lügen; Mitarbeitende, die „sich selbst für den/die einzige hielten, die wirklich arbeiten“, Anweisungen nicht befolgten, »Ja, aber wir könnten doch …“ als Reaktion auf Arbeitsaufträge ↩︎
      6. gemeint ist damit, als Mitarbeitende/r den eigenen Aufwand so gering als möglich zu halten – konkreter: ‘überall dabei sein doch nichts Handfestes beitragen’ bzw. Weiterdelegieren der eigenen Aufgaben an andere Teammitglieder oder Rückdelegation ↩︎
      7. emotionale Ausbrüche (…); übersteigerte Darstellung eigener Themen und Verdrängung der Themen der Führungskraft; reservierte Kommunikation, bei der Mitarbeitende emotional verschlossen oder undurchsichtig bleiben ↩︎
      8. u.a. (Selbst-)Isolation des Mitarbeitenden vom Team; Ignorieren von Teamabsprachen und Regeln; fehlende Bereitschaft, eigenständig Konflikte mit anderen Teammitgliedern zu lösen ↩︎
      9. demografische Charakteristika, Intelligenz, Persönlichkeit ↩︎
      10. Intelligenz gemessen über einen kognitiven Fähigkeitstest; Persönlichkeit ermittelt über den sog. HEXACO-Persönlichkeitstest ↩︎
      11. n = 1.229; 19 bis 69 Jahre; Online-Fragebogen; Teilnehmende aus USA und UK – nicht aber aus DE ↩︎
      12. Die Autorinnen schreiben »In der (Führungs-)Forschung hat sich gezeigt, dass Personen besonders bei Fragen nach unangenehmen Themen oftmals ihre Antworten an die sozialerwünschten Normen anpassen („social desirability bias“) da renitentes Verhalten von Mitarbeitenden in schlechtes Licht auf die sie Führenden werfen würde.« ↩︎
      13. Führende mit hohen Ausprägungen in der Dimension »Ehrlichkeit-Bescheidenheit« und höheren kognitiven Fähigkeiten berichteten von weniger Renitenz. Je häufiger allerdings bescheidene Führende von Mitarbeitenden Rückmeldungen aktiv erfragen — um so häufiger erleben sie auch Renitenz. ↩︎
      14. Führende mit hohen Werten in der Dimension »Offenheit für Erfahrungen«, beschrieben u.a. mit Adjektiven wie kreativ, unkonventionell, innovativ, ironisch … berichteten von mehr Widerstand mitarbeitender Kollegen. ↩︎
      15. Ashford, S. „Reflections on the Looking Glass: A Review of Research on Feedback-Seeking Behavior in Organizations“. Journal of Management 29, Nr. 6 (Dezember 2003): 773–99. DOI. ↩︎
      16. Jordan, J. und Sorell, M. „Why Reverse Mentoring Works and How to Do It Right“. Harvard Business Review, 3. Oktober 2019. URL. ↩︎
    • Der Dunning-Kruger Effekt stimmt nur zu einer Hälfte

      In den 1990ern prüften David Dunning und Justin Kruger, ob inkompetente Personen sich ihrer Unfähigkeit bewusst seien, also ihre subjektiven Fähigkeiten systematisch überschätzen und glauben, etwas zu können obwohl das objektiv nicht der Fall ist.1 Das Experiment wurde mehrfach mit ähnlichen Ergebnissen wiederholt2. Nach einer Prüfung fragten Dunning und Kruger nach einer absoluten und einer relativen Einschätzung der eigenen Leistung. Als erste Frage, wieviele Lösungen sie glaubten richtig zu haben. Als zweite Frage, wie sie glauben im Vergleich zu ihren Mitstudenten abgeschnitten zu haben. Diese zweite relative Schätzung ist Türöffner zu einem strukturellen kognitiven Denkfehler denn wir alle meinen, besser als der Durchschnitt zu sein. Wenn das so stimmt, dann trauen wir uns systematisch mehr zu als wir tatsächlich können. Sich mehr zutrauen als beobachtbar ist? Das ergibt den arroganten Narren. John Cleese sagte es (leicht verkürzt) prägnanter: »… wenn du doof bist, dann weisst du nicht mal das.«3

      Im originalen Experiment teilte Dunning und Kruger die Ergebnisse der Tests in Viertel. Die unteren 25 Prozent hatten 10 der 20 Fragen richtig, die besten des oberen Viertels durchschnittlich 17 von 20. Während die untere Gruppe, die mit den relativ schlechtesten Testergebnissen, sich selbst um 20 Prozent überschätzten (also meinten, sie seien um ein Fünftel besser als sie es tatsächlich waren) unterschätzten die Besseren ihre eigene Leistung um etwa 15 Prozent.

      In der sonderbaren Welt der Lohnarbeit hat der Dunning-Kruger-Effekt schmerzhafte Konsequenzen. Für ein gängiges Szenario muss man nicht viel konstruieren: eine Führungsperson ist fachlichen Argumenten und Fakten nicht zugänglich und trifft in der Folge uninformierte ’Bauch’-Entscheidungen, hält sie für korrekt. Das Zirkelschluß-Muster dahinter ist ebenso trivial wie häufig: Ich bin ja Führungsperson (und nicht du) weil ich ‘es drauf habe’, sonst wäre ich nicht Chef. Mit ein wenig Abstand zur Sache tragen jene Führenden eine doppelte Last: nicht nur zögen sie falsche Schlüsse und treffen daraus schlechte Entscheidungen. Schwerer wiegt, sie stehen ihrem eigenen Lernen im Weg weil ihnen die metakognitive Fähigkeit fehlt, die eigene Inkompetenz zu erkennen: der arrogante Narr ist gefangen in der selbstgemachten Echokammer. Das kennen wir alles aus dem Zivilleben: 80 Millionen Deutsche halten sich für die besseren Nationaltrainer und ebenso viele fahren besser Auto als all die anderen, die Straßen verstopfenden Vollhorste.

      Der Mathematiker Eric Gaze hat sich mehr als dreißig Jahre nach der originalen Arbeit von Dunning und Kruger die Zusammenhänge und Schlussfolgerungen genauer angesehen und das Versuchsdesign ein wenig modifiziert.4 Experimentiert wurde nicht mit realen sondern mit 1154 fiktiven Personen, denen zufällig sowohl ein Testergebnis wie eine ebenso randomisierte Selbsteinschätzung im Vergleich zu ihren ebenso erfundenen Testpersonen zugewiesen wurde. Allein durch den statistischen Effekt einer zufälligen Zuordnung der computergenerierten Versuchsdaten geschah eine Überschätzung von 37,5 Prozentpunkten — ohne dass auch nur ein einziger menschlicher Narr beteiligt gewesen wäre.5

      Eric Gaze gibt Gründe, warum wenigstens der zweite Teil der Analyse von Dunning und Kruger, der Vergleich mit der peer group irreführend ist.4 Die Schlechtesten der Kohorte würden ihre Leistung auch am meisten überschätzen weil sie am Weitesten von einem perfekten Ergebnis entfernt sind, also die Spannweite nicht taxieren können und zudem dem strukturellen Denkfehler aufsitzen, besser als der Durchschnitt zu sein. Tatsächlich zeigen die Daten aber, dass die schlechtesten Prüflinge ihre objektive Leistung nicht wesentlich schlechter einschätzen als sie tatsächlich war. Die Selbstwahrnehmung ist also zutreffend, die eigene, relative Position in der Leistungsreihe Kohorte ist schräg. Weil der Effekt in zufälligen, computergenerierten Daten zu sehen ist, handelt es sich möglicherweise nicht um einen strukturellen Denkfehler sondern um ein Artefakt des Experimentdesigns.6

      Dunning und Kruger beschrieben also einen realen Effekt korrekt: die meisten Menschen glauben, sie seien besser als der Durchschnitt. Das ist es aber auch, nichts weiter. Die Realität ist, dass Menschen sehr wohl eine Fähigkeit haben, die eigene Kompetenz und Wissen realistisch einzuschätzen.

      »the reality is that very few people are truly unskilled and unaware«4

      Wie man die einen von den anderen unterscheiden kann? Da ist noch zu forschen.

      * * *


      1. Kruger, Justin, und David Dunning. 1999. „Unskilled and Unaware of It: How Difficulties in Recognizing One’s Own Incompetence Lead to Inflated Self-Assessments.“ Journal of Personality and Social Psychology 77 (6): 1121–34. DOI. ↩︎
      2. Ehrlinger, Joyce, Kerri Johnson, Matthew Banner, David Dunning, und Justin Kruger. 2008. „Why the Unskilled Are Unaware: Further Explorations of (Absent) Self-Insight among the Incompetent“. Organizational Behavior and Human Decision Processes 105 (1): 98–121. https://doi.org/10.1016/j.obhdp.2007.05.002. ↩︎
      3. Robert Grimsby, Reg. 2014. John Cleese on Stupidity. Video-URL. ↩︎
      4. Gaze, Eric C. 2023. „Debunking the Dunning-Kruger Effect – the Least Skilled People Know How Much They Don’t Know, but Everyone Thinks They Are Better than Average“. The Conversation. 8. Mai 2023. URL. ↩︎
      5. Nuhfer, Edward, California State University (retired), Christopher Cogan, Independent Consultant, Steven Fleischer, California State University – Channel Islands, Eric Gaze, Bowdoin College, Karl Wirth, und Macalester College. 2016. „Random Number Simulations Reveal How Random Noise Affects the Measurements and Graphical Portrayals of Self-Assessed Competency“. Numeracy 9 (1). DOI. ↩︎
      6. Jarry, Jonathan. o. J. „The Dunning-Kruger Effect Is Probably Not Real“. Office for Science and Society. Zugegriffen 30. Mai 2023. URL. ↩︎
    • Der Hawthorne-Effekt ist keiner.

      Von den vielen Mythen der angewandten Küchen- und Industriepsychologie ist der Hawthorne-Effekt einer der älteren und darf auch ins Altpapier: wer beobachtet wird, verhält sich anders. Im zivilen Leben kennen wir das — es sei denn, wir sind keine Rampensäue, professionelle Influencer oder Marietta Slomka.

      Was in den Hawthorne-Werken tatsächlich geschah

      Vor grob hundert Jahren gab es westlich Chicago in den Hawthorne-Werken von Western Electric einen Fabrikkomplex, der vierzigtausend Menschen Arbeit und Einkommen gab. Hergestellt wurde die Telefonietechnik für den damaligen Monopolisten AT&T. Ab 1924 wurden mit Verbesserungen der Beleuchtung bis zu optimierten Maschinenplätzen Versuche zur Produktivitätssteigerung angestellt. Die Varianten im Versuchsaufbau wurden allerdings nicht oder nur lückenhaft dokumentiert. Rohdaten gibt es nicht mehr. 1953 und zwanzig Jahre später fand sich der ‘Hawthorne Effekt’ in einem Fachbuch wieder und muss seit dem her halten für alle nicht-kontrollierten und unerwarteten Effekte. Eine Art carte blanche und Datenlumpensammler.

      Mehr Störgrößen als Signale

      2011 entdeckten dann zwei Forschende auf Mikrofilm wenigstens einige wenige Aufzeichnungen der Experimente in den Hawthorne-Werken. So wurde etwa an Sonntagen die Beleuchtung an Arbeitsplätzen verbessert. Wundersamerweise stieg die Produktivität an Montagen. Kein Kunststück: nach sechs Arbeitstagen und einem freien Sonntag dazwischen ist der Werker montags leistungsfähiger. Auch ein paar Aufzeichnungen zur Konfektion von Relais tauchten wieder auf. In monotonen zweiunddreissig Handgriffen wurden Relais von Frauen im Akkord zusammengebaut. Neun Stunden am Tag, sechs Tage die Woche, 300 Tage im Jahr. Zwischen 1927 und 1932 wurden je fünf Frauen vom Arbeitsplatz in einen Testraum gebeten um dort die gleiche Arbeit zu machen — jedoch mit kontrollierter Manipulation der Randbedingungen. Egal, was an den Arbeitsbedingungen verändert wurde: die Leistung stieg und die Fehlerrate sank. Ein confounder, eine unbeachtete Störgröße mag die wahrscheinlichere Ursache sein. Nicht die Arbeitsbedingungen können die verbesserten Leistungen erklären sondern die Angst vor Arbeitsplatzverlust. Ende 1929 kam es zu den großen Börsencrashs in London und New York, die zur great depression führten. es erscheint einleuchtend, dass die Arbeiterinnen alles taten um nicht in die Arbeitslosigkeit entlassen zu werden — wie es zwei Kolleginnen geschah. Zwei der Frauen wurden 50 Jahre später befragt und bestätigten, dass sie um keinen Preis zurück an die alte Arbeitsstelle und zu einem übergriffigen Vorarbeiter wollten und sich deshalb so anstrengten.

      »Es gibt keinen Hawthorne-Effekt« schliesst eine 1989 erschienene Metastudie, die 86 Untersuchungen auswertete. Es ist ja nicht so als wisse man das nicht schon ein paar Tage.

      * * *


      Adair, John G., Donald Sharpe, und Cam-Loi Huynh. „Hawthorne Control Procedures in Educational Experiments: A Reconsideration of Their Use and Effectiveness“. Review of Educational Research 59, Nr. 2 (Juni 1989): 215–28. DOI.

      Festinger, Leon, und Daniel Katz. Research Methods in the Behavioral Sciences. New York: Holt, Rinehart & Winston, 1953. URL.

      Gale, E.A.M. „The Hawthorne studies—a fable for our times?“ QJM: An International Journal of Medicine 97, Nr. 7 (1. Juli 2004): 439–49. DOI

      Greenwood, Ronald G., Alfred A. Bolton und Regina A. Greenwood. „Hawthorne a Half Century Later: Relay Assembly Participants Remember“. Journal of Management 9, Nr. 2 (1. September 1983): 217–31. DOI.

      Jarry, Jonathan. „One of Last Century’s Most Influential Social Science Studies Is Pretty Bad“. Office for Science and Society, 17. Februar 2023. URL.

      Jones, Stephen R. G. „Was There a Hawthorne Effect?“ American Journal of Sociology 98, Nr. 3 (1992): 451–68. JSTOR.

      Levitt, Steven D., und John A. List. „Was There Really a Hawthorne Effect at the Hawthorne Plant? An Analysis of the Original Illumination Experiments“. American Economic Journal: Applied Economics 3, Nr. 1 (2011): 224–38. JSTOR.

      Abbildung: ‘Measuring industrial fatigue, 1920s style. From Hill AV, Living Machinery.’ aus: QJM, Volume 97, Issue 7, July 2004, Pages 439–449, DOI

    • Teambildung? Tuckman liegt falsch

      Die einleuchtend einfache Tuckman-Kurve wird gerne als Schaubild dafür verwendet, dass Teams nicht vom Himmel fallen und das Sich-Formieren einer Gruppe als gemeinsam arbeitendes Team Zeit braucht. Empirisch nicht zu belegen ist die Abfolge, in der diese Phasen nach Tuckman geschehen. Sie geschehen eben nicht linear in der scheinbar schlüssigen Reihenfolge sondern irgendwann und irgendwie und nicht nach einer naturgegebenen Regelhaftigkeit. Was steckt drin? Bruce Tuckman beobachtete in seinem Kontext der Gesundheitsvorsorge und Psychotherapie, dass Teaming scheinbar immer in der gleichen Abfolge von vier Zuständen forming, storming, norming zum unternehmerisch erwünschten performing geschieht, in dem ein Team dann endlich stetig Ergebnisse liefert. Doch auch wenn falsch ist, nützlich ist es allemal: es stecken Hinweise darin, dass eine Gruppe nicht automatisch durch ihre Konfiguration zu einem funktionierenden Team wird. Vielmehr muss soziale Arbeit geschehen, Reibung, Normierung und Selbstorganisation. Das braucht gemeinsame Zeit und Anlass für Reibungsflächen. Dafür wiederum ist das Tuckman-Modell auch bei fehlender Evidenz gut und nützlich: als Einwandvorwegnahme und Schaumbremse für allzu nassforsche Managementmethoden.

      All models are wrong bit some are useful. — George Box

      Auf der Vertikalen steckt vermutlich schon der Geburtsfehler des Tuckman-Modelles.

      Die Annahme ist, dass aus einem (Grund-)Konflikt heraus und dessen Bearbeitung ein Zusammenhalt und daraus Vertrauen in einander entstünde. Wenn es aber keinen Konflikt gibt, dann auch kein Vertrauen …? Auf der zeitlichen Dimension setzt eine ähnliche Vermutung die Sequenz der Stadien: eine Gruppe (noch kein Team) müsse sich zuerst hin zu gemeinsam akzeptierten, zu bearbeitenden Aufgaben orientieren bevor diese ebenso kollaborativ organisiert und dann gelöst werden. Woher diese Annahme kommt, bleibt auch in den originalen Arbeiten Tuckmans offen. Die Formierung von Teams aus losen Gruppen geschähe nach Tuckman dann über vier Phasen. Eine fünfte ganz rechts zur Auflösung der (Arbeits-)Gruppe wurde später ergänzt (Tuckman und Jensen, 1977).

      Tuckman formuliert also als Modell eine sequentielle, hierarchische Folge von vier Stadien. Ein performantes oder effizient funktionierendes Team müsse zwingend vom Forming zum Storming und gelangt erst nach erfolgreich durchlaufenem Norming in den erstrebten Zustand eines performing Teams. Abkürzungen sind nicht vorgesehen. Ändert sich die Zusammensetzung eines Teams, dann würden alle Stadien von Anfang erneut durchlaufen.

      Bruce Tuckman publizierte sein Modell 1965 als Metaanalyse fünfzig anderer Untersuchungen und er gab Warnhinweise mit: es sei kein allgemeingültiges, repräsentatives Modell und allenfalls für Therapie-/Trainings- und Laborgruppen beobachtbar. Von organischen Projektgruppen, wie sie sich in Unternehmen formieren oder zusammengestellt werden, war nie die Rede. In der Revision des Modelles 1977 kamen weitere 20 Untersuchungen hinzu eine Verallgemeinerung fehlte. Auch viele weitere Studien (Agazarian & Gantt, 2003; Connors & Caple, 2005; Miller, 2003; Tubbs, 2004) konnten die Linearität der Stadien nicht replizieren. Gersick (1988; 1989; 1991) fand keinerlei zeitliche Komponenten in der Abfolge der Tuckman-Stadien. Knight (2007, S87) etwa konnte bei 321 beobachteten Teams weder die lineare Abfolge der Stadien noch andere Ähnlichkeiten mit dem Tuckman-Modell beobachten.

      Es ist komplizierter: aus Gruppen werden nicht immer Teams, einen Masterplan um Teambuilding zu beschleunigen oder zu ermöglichen gibt es nicht. Wenn es keinen Regelhaftigkeit gibt, keinen Masterplan — dann auch kein 08/15-Programm und nichts, woran man sich festhalten oder orientieren könnte.

      Sozialhydraulik ist ballistisch. (Das ist ja das Schöne.)

      * * *

      Agazarian, Y., & Gantt, S. (2003). Phases of group development: Systems-centered hypotheses and their implications for research and practice. Group Dynamics: Theory, Research, and Practice, 7(3), 238–252. DOI

      Box, G. E. P. (1976). Science and Statistics. Journal of the American Statistical Association, 71(356), 791–799. DOI

      Box, G. E. P., & Draper, N. R. (1987). Empirical model-building and response surfaces. Wiley.

      Connors, J. V., & Caple, R. B. (2005). A Review of Group Systems Theory. The Journal for Specialists in Group Work, 30(2), 93–110. DOI

      Gersick, C. J. G. (1988). Time and Transition in Work Teams: Toward a New Model of Group Development. Academy of Management Journal, 31(1), 9–41. DOI

      Gersick, C. J. G. (1989). Marketing Time: Predictable Transistions in task groups. Academy of Management Journal, 32(2), 274–309. DOI

      Gersick, C. J. G. (1991). Revolutionary Change Theories: A Multilevel Exploration of the Punctuated Equilibrium Paradigm. The Academy of Management Review, 16(1), 10. DOI

      Hurt, A. C., & Trombley, S. M. (2007). The Punctuated-Tuckman: Towards a New Group Development Model. 7. PDF

      Knight, P. (2007). Acquisition Community Team Dynamics: The Tuckman Model vs. the DAU Model. 55. PDF

      Miller, D. L. (2009). The Stages of Group Development: A Retrospective Study of Dynamic Team Processes. Canadian Journal of Administrative Sciences / Revue Canadienne Des Sciences de l’Administration, 20(2), 121–134. DOI

      Norton, D. (2017, May 5). Tuckman Was Wrong! OnBelay. URL

      Tubbs, S. L. (2012). A systems approach to small group interaction (11th ed). McGraw-Hill Humanities/Social Sciences/Languages.

      Tuckman, B. W. (1965). Developmental sequence in small groups. Psychological Bulletin, 63(6), 384.

      Tuckman, B. W., & Jensen, M. A. C. (1977). Stages of Small-Group Development Revisited. Group & Organization Studies, 2(4), 419–427. DOI

    • Psychological Safety? Sozialkapital!

      Psychological Safety ist die individuelle Sicherheit, auch Dinge tun und sagen zu können, mit denen man ein persönliches Risiko und somit Verletzlichkeit eingeht. In einer Situation psychologischer Sicherheit ist nichts tabu und es gibt nichts, wofür man lächerlich gemacht werden kann. Das lässt Menschen ihr Bestes geben und Unternehmen lernen: es gibt keine Angst, bei Fehlern oder abweichenden Meinungen dumm dazustehen. Das Phänomen scheint universell, kulturneutral und unabhängig von Industrien oder Branchen. In der Umkehrung wird vielleicht schnell deutlich, worum es geht: fehlt psychologische Sicherheit, dann kommt es zu ‘organisatorischem Schweigen’, zu employee silence — ‘Dienst nach Vorschrift’ und eher früher als später: Stillstand. Das will man nicht.

      Die Zusammenhänge gelten im Handwerk, in der Medizin und Pflege ebenso wie in der Wissensarbeit oder im Cockpit. Der Begriff ‘psychologische Sicherheit’ wurde 1965 in Beobachtung von Veränderungsprozessen von Edgar Schein und Warren Bennis eingeführt. 1990 zeigte William Kahn, dass psychologische Sicherheit die Einsatzbereitschaft von Menschen in ihrer Arbeit fördert. Amy Edmundson erforscht seit den 1990er Jahren, wie Teams interagieren und was es braucht um besser zu werden. 1996 beobachtete sie in Krankenhäusern, dass bessere Teams nicht mehr Fehler machten, sondern ein gruppendynamisches Klima hatten, in dem es in Ordnung war, über Fehler zu sprechen.

      »Psychological safety is the shared belief that one will not be punished or humiliated for speaking up with ideas, questions, concerns or mistakes.« — Amy Edmondson

      2011 popularisierte Edmondson psychological safety nach den Ergebnissen eines aufwändigen Feldversuches bei Google. Das zentrale Ergebnis dort war: psychologische Sicherheit macht gute zu noch besseren, zu performanten Teams. Für Unternehmen ist es also förderlich, wenn die Investition in ‘die Besten’ noch weiter in Teams skaliert um in Summe optimale Leistungen zu bringen. Der Kern psychologischer Sicherheit ist persistentes wechselseitiges Vertrauen, durch das man sich nicht scheut man selbst zu sein, auch unangenehme Fragen zu stellen, Probleme und Risiken zu benennen und Fehler zu machen und daraus zu lernen. In Teams kann jede:r sich äußern und andere nachvollziehen. Dieses Sozialkapital wird über gemeinsame Erfahrungen in einem geteilten Bezugsrahmen verdient und es ist binär: man vertraut jemandem oder nicht. Es braucht also in Unternehmen ein gemeinsames ‘Etwas’, an dem im Team gearbeitet wird. Und ein bisschen Vertrauen geht ebenso schlecht wie ein bisschen schwanger sein. Sozialkapital oder psychologische Sicherheit ist damit der Schlüsselfaktor für Effektivität — was nicht bedeutet, dass man ‘nett’ sein muss oder dass es keine Konflikte gibt: vielmehr ist Vertrauen das wirksame Mittel um ständig zu lernen um sich an verändernde Umstände anzupassen.

      Die Abwesenheit von psychological safety ist employee silence: der GAU jeder Organisation. Fehlt Vertrauen als Sozialkapital, dann kommt es zwangsläufig zu “organisatorischem Schweigen”, zu employee silence: Mitarbeitende gehen in die innere Emigration.

      ’Dienst nach Vorschrift’ ist der GAU, der schlimmste anzunehmende Unfall. Nur mehr exakt machen, was angewiesen ist und präzise alle Vorschriften und Prozesse beachten führt über zügige Verlangsamung zu Stillstand. Nichts geht mehr. ‘Dienst nach Vorschrift’ ist ein mächtiges Mittel im industriellen Arbeitskampf und doch noch lange kein Streik — vielmehr das ernsthafte Ausreizen des Organisationsmodelles.

      »(…) the withholding of any form of genuine expression about the individual’s behavioral, cognitive and/or affective evaluations of his or her organizational circumstances to persons who are perceived to be capable of effecting change or redress.« — Morrison & Milliken (2000)

      Was bedeutet das? Psychologische Sicherheit und das Erwirtschaften von Sozialkapital klappt nur bei gleichzeitiger Operationalisierung einer Fehlerkultur: Fehler entstigmatisieren und daraus lernen. Lieber neue Fehler machen, die alten haben nicht so gut funktioniert. Was soll geschehen, wenn trotz aller Planung, Um- und Aufsicht Fehler geschehen? Was ist das erwartete Verhalten wenn etwas daneben geht? Die Antwort ist so einfach wie aufwändig: Fehler offen ansprechen, Regeln in Frage stellen und vor allem aus Fehlern offen lernen, sie eben nicht unter den Teppich kehren. Je mehr unter dem Teppich liegt, um so größer wird die Beule und die Organisation lernt nichts. Und allem voran: gute Experimente wagen, wenn in Turbulenz nicht eindeutig ist, was der richtige nächste Schritt sein kann.

      »In einer Kommunikationskultur, in der man Probleme offen anspricht, wird zwanglos kommuniziert; über Regeln darf diskutiert und gestritten werden. (…) Wertschätzung entsteht mit emotionaler Unterstützung und Toleranz gegenüber Fehlern. (…) Es gibt einen Zusammenhang zu Sinnerfüllung: Unternehmen mit dieser Kultur werden mit steigendem Arbeitsengagement belohnt.« — Weber, Unterrainer und Höge. 2016

      Kann psychological safety, Sozialkapital, Vertrauen aktiv hergestellt, produziert werden? Individuelle psychologische Sicherheit ist schwer messbar und kontextabhängig. Indizien kann man einsammeln und zu interpretieren versuchen, etwa mit den folgenden Hinweisen:

      7 Fragen stellen: Haben wir psychologische Sicherheit im Team?​

      In ihrem 2020 erschienenen Buch bietet Edmondson sieben Fragen, die auf einer Likert-Skala beantwortet werden können. Es geht um persönliche Haltungen, hier um Zustimmung/Ablehnung zu einer Aussage. Die Skala hat 7 Stufen, eine 4 wäre eine neutrale weder-/noch-Haltung. Diese Fragen werden einem Team vorgelegt und jede:r beantwortet sie still und anonym.

      • Wenn ich im Team einen Fehler mache, wird er oft gegen mich verwendet. (R)
      • Die Mitglieder des Teams können Probleme und schwierige Fragen ansprechen.
      • Personen im Team lehnen manchmal andere ab, weil sie anders sind. (R)
      • In diesem Team ist es sicher, ein Risiko einzugehen.
      • Es ist schwierig, andere Teammitglieder um Hilfe zu bitten. (R)
      • Niemand in diesem Team würde absichtlich gegen meine Bemühungen handeln.
      • Bei der Arbeit mit anderen werden meine Fähigkeiten wertgeschätzt und genutzt.

      Bei den vier positiv formulierten Fragen deutet individuelle Zustimmung auf größere, bei negativ formulierten (reverse) Fragen zeigt Ablehnung höhere psychologische Sicherheit. R-Fragen werden invertiert ausgewertet (1 für 7, 6 für 2 usw.). In der Summe entsteht ein über die Gruppe normalisiertes Ergebnis. Wenn alle Teilnehmenden einverstanden sind, dann können die Einzelergebnisse nebeneinander gestellt und verglichen werden. Sind auffällige Abweichungen zu erkennen? Dann genauer hinschauen: es scheint divergente Sichten zu geben.

      Wie kann Sozialkapital erwirtschaftet werden?

      In einem kurzen Vortrag von Amy Edmondson 2014 folgen drei Hinweise (ab 7’30‘’), wie Psychological Safety erreicht werden kann:

      • Arbeit als Lernaufgabe verstehen lassen, nicht als Ausführung (execution)
      • die eigene Fehlbarkeit anerkennen und kommunizieren
      • Neugierde vorleben 

      Unmittelbar ‘actionable’ ist das nicht. Die Hinweise zielen auf eher tiefere Schichten und Gewohnheiten, auf subjektives Verhalten, das nicht ohne weiters veränderbar scheint.

      Wie kann Verhalten verändert werden?

      Für ‘Führungskräfte’, Personen, die über ihre Einordnung in eine Hierarchie Leitungs- (und im Sprachgebrauch synonym) und Führungsrollen einnehmen, dann ist das Verändern von Verhalten zuerst reflexiv: das eigene Verhalten verändern. Schwer genug! Mehr dienen als anordnen, eher servant leader sein als Boss. Einhalten, was man selbst ankündigt, accountable sein. Für alle anderen Personen ohne designierte Führungsrolle bedeutet das: exakt das Gleiche. 

      Der 3er-Kanon für vertrauensvolles Arbeiten

      1 — Jede Stimme ist willkommen

      Produktiv aufeinander reagieren. »Danke für Deinen Beitrag.« Ohne Wenn und ohne Aber. Das kann anstrengend werden, wenn schon alles gesagt ist — nur noch nicht von jedem. Moderation dämpft umsichtig, wenn die Aussage des Vorredners ohne weiteren Beitrag wiederholt wird — doch aufmerksame Wertschätzung ist die Grundlage für Vertrauen.

      2 — schlau scheitern

      Ein intelligenter Fehler in einem ambitionierten Experiment bringt nützliche Erkenntnisse, die vorher niemand hatte. Zu wissen, wie etwas nicht geht, hat Wert: es reduziert Unsicherheit und kann neue Chancen bieten, die zuvor nicht ersichtlich waren. Dumme Fehler wurden bereits anderswo gemacht. Sie wurden nur nicht weitergetragen und niemand konnte daraus lernen. Tipp: fuck-up talks veranstalten. 15 min, ein·e Sprecher·in berichtet detailliert, wie er/sie etwas mit Ansage und Vollkaracho vor die Wand gefahren hat.

      3 — Regelverstöße sanktionieren

      Erwünschtes Verhalten muss klar definiert sein. Am Besten schriftlich und in einer Team Charta. Das Team schreibt sich selbst eine Verfassung, ein Protokoll für das Miteinander: wie wollen wir miteinander umgehen, was machen wir Konfliktfall? Allein das gemeinsame Herstellen dieser Charta ist eine vertrauensvolle Übung und lässt Andere besser verstehen. Wie gehen wir um mit unvorbereitet sein, mit zu spät kommen/liefern/reagieren … was ist zu spät? Wie verstehen wir Qualität einer Zuarbeit oder Lieferung? Was tolerieren wir, was akzeptieren wir nicht mehr? Wie wollen wir Veranstaltungen oder Termine planen: gibt es Termine ohne Agenda und zu jedem Termin auch Ergebnisse?

      * * *

      Baer, Markus, and Michael Frese. 2003. ‘Innovation Is Not Enough: Climates for Initiative and Psychological Safety, Process Innovations, and Firm Performance’. Journal of Organizational Behavior 24 (1): 45–68. DOI

      Building a Psychologically Safe Workplace – TEDxHGSE. 2014. 16:9. Harvard Graduate School of Education Cambridge, Massachusetts. Video.

      Clark, Timothy R. 2020. The 4 Stages of Psychological Safety: Defining the Path to Inclusion and Innovation. First edition. Oakland, CA: Berrett-Koehler Publishers, Inc. 

      Duhigg, Charles. 2016. ‘What Google Learned From Its Quest to Build the Perfect Team’. The New York Times, 25 February 2016. URL

      Edmondson, Amy. 1999. ‘Psychological Safety and Learning Behavior in Work Teams’. Administrative Science Quarterly 44 (June): 350–83. DOI. ———. 2019. ‘The Role of Psychological Safety: Maximizing Employee Input and Commitment’. Leader to Leader 2019 (January). DOI.  Edmondson, Amy C, Mike Kauschke, and Verlag Franz Vahlen GmbH. 2020. Die angstfreie Organisation wie Sie psychologische Sicherheit am Arbeitsplatz für mehr Entwicklung, Lernen und Innovation schaffen. 

      Edmondson, Amy C., and Zhike Lei. 2014. ‘Psychological Safety: The History, Renaissance, and Future of an Interpersonal Construct’. Annual Review of Organizational Psychology and Organizational Behavior 1 (1): 23–43. DOI

      Edmondson, Amy, and Bertrand Moingeon. 1999. ‘Learning, Trust and Organizational Change: Contrasting Models of Intervention Research in Organizational Behaviour’. In Organizational Learning and the Learning Organization: Developments in Theory and Practice, 157–75. 1 Oliver’s Yard,  55 City Road,  London    EC1Y 1SP  United Kingdom: SAGE Publications Ltd. DOI

      Ferris, Gina. 2009. Research in Personnel and Human Resources Management. Bingley: Emerald Group Publishing Limited. Halpern, David. 2015. ‘Social Trust Is One of the Most Important Measures That Most People Have Never Heard of – and It’s Moving’. 12 November 2015. URL

      Harvey, Jean-François, Kevin Johnson, Kate S Roloff, and Amy C Edmondson. 2019. ‘From Orientation to Behavior: The Interplay between Learning Orientation, Open-Mindedness, and Psychological Safety in Team Learning’. Human Relations, January, 001872671881781. DOI

      Kahn, W. A. 1990. ‘Psychological Conditions of Personal Engagement and Disengagement at Work’. Academy of Management Journal 33 (4): 692–724. DOI

      Kahn, William A. 1990. ‘Psychological Conditions of Personal Engagement and Disengagement at Work’. Academy of Management Journal 33 (4): 692–724. DOI

      Liang, Hsiao-Yun, Hsi-An Shih, and Yun-Haw Chiang. 2015. ‘Team Diversity and Team Helping Behavior: The Mediating Roles of Team Cooperation and Team Cohesion’. European Management Journal 33 (1): 48–59. DOI

      Milliken, Frances J., Elizabeth W. Morrison, and Patricia F. Hewlin. 2003. ‘An Exploratory Study of Employee Silence: Issues That Employees Don’t Communicate Upward and Why*’. Journal of Management Studies 40 (6): 1453–76. DOI

      Morrison, Elizabeth Wolef, and Frances J. Milliken. 2000. ‘Organizational Silence: A Barrier to Change and Development in a Pluralistic World’. Academy of Management Review 25 (4): 706–25. DOI

      Oswald, Andrew J., Eugenio Proto, and Daniel Sgroi. 2015. ‘Happiness and Productivity’. Journal of Labor Economics 33 (4): 789–822. DOI

      Reimann, Sascha. 2018. ‘Kollektive Intelligenz entwickeln | Was macht Teams gut?’ October 2018. PDF. re:Work with Google. 2016. What Makes One Team Smarter than Another?  | Anita Williams Woolley, Carnegie Mellon University. 16:9. Video

      Schein, Edgar H., and Warren G. Bennis. 1965. Personal and Organizational Change through Group Methods: The Laboratory Approach. New York: Wiley. 

      TEDx Talks. 2014. Amy Edmondson: Building a Psychologically Safe Workplace | TEDxHGSE.

      Weber, W. G., C. Unterrainer, and T. Höge. 2016. ‘Sociomoral Atmosphere and Prosocial and Democratic Value Orientations in Enterprises with Different Levels of Structurally Anchored Participation’. German Journal of Human Resource Management: Zeitschrift Für Personalforschung 22 (2): 171–94. DOI

      Woolley, Anita, and Thomas Malone. 2011. ‘What Makes a Team Smarter? More Women’. Harvard Business Review 89 (June): 32–33. Woolley, Anita Williams, Christopher F. Chabris, Alex Pentland, Nada Hashmi, and Thomas W. Malone. 2010. ‘Evidence for a Collective Intelligence Factor in the Performance of Human Groups’. Science 330 (6004): 686–88. DOI.

    • Spiral Dynamics? ’Data entirely missing’​

      Schmerzhafte Erkenntnis für sanft esoterisch beflügelte Veränderungsagenten: Spiral Dynamics ist recht frei erfunden und ohne jegliche Evidenz.

      Dieser Beitrag bedient sich ruchlos verkürzend am Original ‘Spiral Dynamics: A foolish alternative theory about human evolution’ von Patrick Vermeren.1

      Der US-Psychologe Clare Graves hatte Ende der 1960er wild über die neue Zukunft der Menscheit spekuliert und ‘8 Ebenen der menschlichen Existenz’ herbeifabuliert. Der moralisch-ethische Niedergang sei ‘die Folge des Festhaltens an den falschen existenziellen Werten in Zeiten tiefgreifender Änderung’. Würde man die achte Ebene erreichen, dann würden Vorurteil, Aberglaube, religiöse Regeln und die Angst vor dem Sterben verschwinden, wir würden zu einer liebenden Gemeinschaft und unsere Organisationen wären selbstorganisiert. Die gesamte Menschheit als Spezies wäre dann auf einer neuen Ebene (teal).

      Hui! Das ist schon keine Theorie mehr sondern ein ausgebautes Glaubenssystem mit Glöckchen und Räucherkerzen. Vermeren wollte es genau wissen und zerlegte Graves ‘Theorie’. Das theoretisch-empirische Raster dazu entwickelte er selbst um gute, schlechte und Pseudotheorien unterscheidbar zu machen.2 Gute Theorien sind demnach stimmig, schlüssig und in sich logisch. Auf den 12 Stufen von -6 bis +6 liegen auf einer -6 (‘it sucks’) Theorien, die im Widerspruch zu Physik, Chemie und Biologie stehen oder sich mit Aussagen wie ‘heutige wissenschaftliche Methoden sind nicht ausreichend’ gegen Kritik wie Begutachtung immunisieren. Theorien dieser Art gibt es nun nicht wenige, die Homöopathie etwa folgt erfolgreich diesem Pfad. Eine +5 steht für viele konvergente Ergebnisse aus verschiedenen Disziplinen, eine +6 zeichnet Theorien aus, bei denen Fachexperten Einigkeit haben, etwa die Evolutionstheorie oder die Plattentektonik.

      Frederic Laloux’s book ‘Reinventing Organizations’3 is entirely based on the Integral Theory and the theories of Clare Graves. He also claims we really have three brains. — Patrick Vermeren

      Süss wie Globuli behauptet Laloux dort3 neben einer Batterie weiterer herbeifabulierter Aussagen, die Menschheit sei auf dem Wege zu ’evolutionary-teal, der höchsten Ebene menschlichen Bewusstseins’, was Abraham Maslows Ebene des self-actualizing, der Selbstverwirklichung entspräche. Vermeren bemerkt, dass Laloux neben den fehlenden Fakten entging dass Maslow sich von seiner eigenen Hypothese längst distanziert hatte. Hoppala.

      What about the evidence for Spiral Dynamics? Well, Graves’ research database is nowhere to be found, and according to Cowan, Graves threw away a large part of his research data by accident upon cleaning out his … barn. — Patrick Vermeren

      Barn ist auf Deutsch die Scheune. Das ist dann ärgerlich: da recherchierst Du etwas, baust eine Theorie darauf und dann gehen die Daten beim Kärchern verloren. Da weiss man nun auch nicht so genau, ob es die Daten jemals gab. Prüfen kann man nun nicht mehr. Laloux kann also auch in die Altpapierkiste.

      * * *


      1. Vermeren, Patrick. „Spiral Dynamics: A foolish alternative theory about human evolution“. Wirtschaftspsychologie heute (Blog), 2.7.2020. URL ↩︎
      2. Vermeren, Patrick. A Skeptic’s HR Dictionary: The Good, the Bad, and the Partially True: The Ultimate (Self-Defense) Guide for CEOs, HR Professionals, I/O Students and Employees. 1st edition. Londerzeel, Belgium: A4SK consulting bvba (BV), 2019. ↩︎
      3. Laloux, Frédéric. Reinventing Organizations: A Guide to Creating Organizations Inspired by the next Stage of Human Consciousness. 1. ed. Brussels: Nelson Parker, 2014.  auf S. 37 die Behauptung (eine der vielen haltlosen Behauptungen) ↩︎
    • Maslow hat leider keine Bedürfnispyramide gebaut

      In wenigen Management- oder Personalseminaren fehlt die einprägsame Bedürfnispyramide, die ‘hierarchy of needs’. Doch hat Abraham Maslow sie nicht erfunden und völlig anders gemeint als interpretiert.

      Abraham Maslow reichte eine tiefe humanistische Bildung um 1943 eine ‘Hierarchie der Bedürfnisse’  zu entwickeln. Maslow sah nicht den finsteren Triebapparat der Psychoanalyse sondern das Gute im Menschen, das Streben nach Selbstverwirklichung und persönlichem Wachstum.  Destruktiv würden wir, wenn unsere Bedürfnisse nicht bedient werden.

      Maslow selbst war eine starre Bedürfnishierarchie nicht wirklich wichtig. Ihn interessierte mehr die Vorstellung, dass selbstverwirklichte Menschen durch Gesundheit, Wachstum, Ganzheitlichkeit, Integration, humanitäre Ziele und die ‘wirklichen Probleme des Lebens’ motiviert sind. (Kaufmann 2018) Dass diese oder ähnliche Darstellungen zur bekanntesten Pyramide ausserhalb Ägyptens wurde, ist Maslows Verfehlen nicht: er hatte eine Leiter aus Begriffen, niemals ein visuelles Dreieck angelegt.

      Kritik/en an der Maslow Pyramide sind ebenso alt, breit und weitreichend wie die Pyramide hartnäckig. Douglas McGregor machte Maslows Treppenleiter in Managementbüchern populär. Um die Übersetzung in den Unternehmenskontext zu erleichtern, ignorierte McGregor die von Maslow formulierten Nuancen. Die Pyramidenform hat er allerdings auch nicht erfunden. (Bridgman et al 2019)

      (Douglas McGregor ist — nebenbei — der Name hinter der unseligen ‘Theory X/Y’, die ebenso hartnäckig missverstanden ist wie die Maslow-Pyramide.) In einem Buch (Davis 1957) taucht dann das Dreieck wieder auf:

      Die Pyramide selbst scheint erstmals 1960 Form angenommen zu haben. In einem Artikel  ‘How money motivates men’, in dem ein Charles McDermid argumentiert, wie maximale Motivation bei geringsten Kosten zu erreichen sei. (Kaufman 2019, McDermid 1960)

      Ob es so ist oder anders, spielt keine Rolle, so lange man an diese einfache, scheinbar schlüssige Wahrheit glauben mag.

      For most of us, most of the time, we continue to fire the same circuits activated by our same old beliefs and perspectives. We keep getting the same results over and over again, deepening the grooves of our familiar thoughts and patterns, laying down the same template, assuming it is the only possibility. — Skillicorn 2020 Tweet

      Es ist auch egal: Bedürfnisse in einer aufeinander aufbauenden Folge anzuordnen ist einleuchtend und koppelt bestens mit dem ‘gesunden Menschenverstand’. Dem kann man trauen. Muss man nicht.

      * * *


      Bridgman, Todd, Stephen Cummings, and John Ballard. 2019. ‘Who Built Maslow’s Pyramid? A History of the Creation of Management Studies’ Most Famous Symbol and Its Implications for Management Education’. Academy of Management Learning & Education 18 (1): 81–98. https://doi.org/10.5465/amle.2017.0351.

      Davis, Keith. 1957. Human Relations in Business. New York: McGraw-Hill.

      Kaufman, Scott Barry. 2018. ‘What Does It Mean to Be Self-Actualized in the 21st Century?’ Scientific American Blog Network. 7 November 2018. URL.

      Kaufman, Scott Barry. 2019. ‘Who Created Maslow’s Iconic Pyramid?’ . 29 April 2019. URL.

      Maslow. 1973. Psychologie des Seins – Ein Entwurf, S. 21

      McDermid, Charles. 1960. How money motivates men. Business Horizons, 3(4): 94

      Skillicorn, Jodie. 2020. Healing Depression without Medication: A Psychiatrist’s Guide to Balancing Mind, Body, and Soul. Berkeley, California: North Atlantic Books.

    • Positive Psychologie: ein Bündel Seltsamkeiten

      Die Positive Psychologie betreibt Professuren, vergibt Abschlüsse und spezialisiert in Fachrichtungen. Tatsächlich ist die Faktenlage uneinheitlich:

      Praktisch jedes Ergebnis der Positiven Psychologie (…) bleibt umstritten, sowohl von Insidern als auch von Außenstehenden. (…) Wichtige Schlussfolgerungen wurden in Frage gestellt, verändert oder sogar aufgegeben.”10

      Wie kann das sein? Stärken stärken statt Defizite beheben1·2·3·4 ist jederzeit sympathischer als Krankheit und Leid. Wer ist schon gerne krank? Mit einfachen Mitteln sollen wir fast mühelos glücklicher werden statt weniger krank. Funktionieren die Interventionen der positiven Psychologie? Und wie lange hält die Wirkung über das momentane sich-besser-fühlen hinaus an?

      Tatsächlich hat die Positive Psychologie nach 20jährigem Bemühen und über 64.000 Forschungsstudien zur Frage, was das Leben lebenswert macht, nicht viel mehr als lückenhafte, mehrdeutige, wenig aussagekräftige und sogar widersprüchliche Ergebnisse vorzuweisen. — Edgar Cabanas

      Folgt man skeptischen Hinweisen5·6·7·8·9·10, so öffnet sich ein weites Feld loser Annahmen, vager Interpretationen und lockerer Methodik. Hält die Positive Psychologie, was sie verspricht?

      Hoffnung verlernen

      Der Psychologe Martin Seligman ist die Gallionsfigur der Positiven Psychologie seit ihrer Erfindung in den 1970er Jahren. Als experimenteller klinischer Psychologe erforscht Seligman Phänomene der erlernten Hilflosigkeit. Das ist die Folge einer Erfahrung, in der eigenes Handeln keine oder unerwünschte Konsequenzen hat. In einem Experiment konnten Hunde durch das Auslösen eines Schalters oder einer Positionsänderung schmerzhaften elektrischen Stromstößen in einem Experimentierkäfig entweder entgehen oder waren ihnen ausgeliefert. Konnten die Tiere ihren unangenehmen Zustand durch eigenes Handeln nicht verändern, wurden sie apathisch. Vermenschlicht formuliert: sie gaben die Hoffnung auf weil es immer schmerzte, egal ob sie etwas taten oder nicht. Weitergeführte Experimente und Übertragungen auf menschliches Verhalten zeigten, wie die Reaktion auf Kontrollverlust situativ wie interindividuell verschieden bewertet werden. Pessimistisches Framing wie »… es ist immer so, ich kann nichts machen« interpretieren diese Zustände als unveränderlich und führen eher zu Depression als eine optimistische Erklärung wie »… na, blöd gelaufen. Nächstes Mal mache ich das besser«. Seligman formulierte eine weithin anerkannte Theorie der erlernten Hilflosigkeit und vermutet, dass klinische Depressionen und psychische Erkrankungen auf die tatsächliche oder wahrgenommene subjektive Kontrolle über das Ergebnis einer Situation zurückzuführen sein könnten. Mehr als vierzig Jahre lang ist Seligmans Interpretation herrschende Lehrmeinung bis sie 2016 mit experimentellen Ergebnissen aus der Attributionsforschung korrigiert wurde: Passivität als Reaktion auf einen Schock ist tatsächlich die angeborene Reaktion auf längere aversive Ereignisse.

      »Sei kein Grantler, Papa.«

      Nach Seligmans Erinnerung war es seine damals fünfjährige Tochter Nikki, die ihn beim gemeinsamen Jäten des Gartens einen finsteren und ungeduldigen Griesgram nannte6, vielleicht eine Folge der freudlosen Beschäftigung mit in Experimentierkäfigen leidenden Tieren. 

      Positive psychology called to me just as the burning bush called to Moses. — Martin Seligman6

      Was, wenn man anstelle Hilflosigkeit und Depressionen, statt Schwächen lieber Glück und Stärken erforscht und diese systematisch fördert? Wenn Hoffnung verlernt werden kann, dann sollte Optimismus doch erlernt werden können? Vielleicht ist sogar Glück trainierbar? Wie nützlich wäre das der Menschheit statt sich mit unangenehmen Experimenten, mühseliger Statistik und Methodik abzumühen! Raus aus den Laboren, hinein ins Leben! Forschung zum gesellschaftlichen Wohle einsetzen, berühmt werden und Geld verdienen. Seligman startete seine Karriere neu und liess sich 1996 für eine dreijährige Amtszeit zum Vorsitzenden der mächtigen American Psychological Association (APA) wählen — mit dem besten Ergebnis jemals, wie seine Fakultätswebsite erwähnt. Unter seinem Vorsitz wurde die zeitgleich frisch erfundene Positive Psychologie damit zum Programm der APA.

      Finanzierung: seltsames Geld

      Zu Beginn scheint die Finanzierung eines völlig neuen Forschungsfeldes zwar mysteriös aber bestens funktioniert zu haben. Ein anonym bleibender ‘PT’ erbittet von Seligman Ende 1997 eine Zusammenfassung seiner Vorhaben und ein grobes Budget. Zwei Wochen später erscheint ein Scheck über 120.000 U$, einen Monat und nach einem persönlichen Besuch bei zwei anonym bleibenden Anwälten in New York später ein weiterer über 1,5 Mio U$. “Positive psychology began to flourish with this funding” erinnert Seligman in Flourish.12

      Es liess sich bestens an: Seligman finanzierte den Start des von ihm an der Universität von Pennsylvania bei New York gegründeten Penn Positive Psychology Center u.a. mit Geld der amerikanischen Templeton Foundation, einer höchst konservativen Organisation. Eines derer Stiftungsziele war und ist die Gleichstellung von Religion und Wissenschaft. Noch mehr Geld kam von der Stiftung Atlantic Philanthropies, die bis 2016 eher liberale Vorhaben unterstützte und vom Marktforschungsunternehmen Gallup. Dessen CEO Don Clifton war zuvor ebenso Psychologe und Mitglied der APA.

      Die Positive Psychologie erfinden

      Im Januar 1998 und mit vorhandener Anschubfinanzierung des mysteriösen Großspenders ‘PT’, verbrachte Seligman eine Woche mit seiner Frau Mandy, Mihaly und Isabella Csíkszentmihályi sowie Ray und Sandy Fowler. Ray Fowler hatte sich auf die Messung und Analyse von Persönlichkeitseigenschaften spezialisiert, war 1988 APA Präsident und bis 2003 deren CEO. Sandra Fowlers Feld war die interkulturelle Psychologie. Mihaly Csíkszentmihályi erforschte und beschrieb den hochkonzentrierten und intrinsisch motivierten Zustand des Flow. Es sassen also Profis zusammen, im Wissenschaftsbetrieb sozialisiert und mit allen Mechanismen bestens vertraut. Ziel der gemeinsamen Woche war: die Positive Psychologie ‘erfinden’ und einen konkreten Plan entwerfen, erinnert Seligman.11 

      Ein gemeinsamer Beitrag mit Mihaly Csíkszentmihályi in der reichweitenstarken und renommierten Zeitschrift ‘American Psychologist’ gilt als Manifest der Positiven Psychologie: Das Gute sehen und Stärken fördern — Schluß mit defizitären Perspektiven!

      Psychology is not just a branch of medicine concerned with illness or health; it is much larger. It is about work, education, insight, love, growth, and play. (…) Fight pessimism, remember the good, count your blessings, focus on strengths — Seligman und Csíkszentmihályi , 200113

      Der frisch erfundenen Positiven Psychologie ging es um praktische Anwendungen und greifbare Verbesserungen in Therapie, Prävention, Bildung, Karriere, Gesundheit und möglichst vielen Lebensbereichen. Anstelle dröger Laborversuche sollte ‘konkreter Nutzen in der Welt’ gefunden werden — externe Validität statt brotloser Grundlagenforschung und Hunde quälen. Csíkszentmihályi war sich wohl bewusst, dass mit einer rasanten Popularisierung die empirische Fundierung schwerlich hinterherkäme:

      Viele gute Ideen, die zu schnell und wahllos umgesetzt werden, brechen mangels solider Grundlagen in sich zusammen. — Csíkszentmihályi 2014, 14

      Er befürchtete, dass das sinnvolle Reifen und Prüfen von Ergebnissen und Interpretationen, die kritische peer review und Replikation von Experimenten zu kurz komme und mindere Qualität entstehe. Der geschäftstüchtige, des Laborbetriebs überdrüssige Seligman sah vor allem die Möglichkeiten.

      It is much better to be criticized than to be ignored. — Seligman 2018 15 S. 276

      Für einen Verkäufer ist Reichweite ein Qualitätsmerkmal. Für einen Wissenschaftler eher irritierend, auch weil der Kritikerchor Seligman signalisierte, auf eine medial interessante Sache gestossen zu sein:

      … and the fact that critics are legion tells me that positive psychology is genuinely popular.

      Es geht und ging Seligman also um Popularität, das Gemocht-werden, um Anerkennung. Csíkszentmihályis war ‘die gute und richtige Sache’ wichtiger. Er wollte keinesfalls kommerzielle Selbsthilfe-Gurus befeuern sondern ordentliche Wissenschaft betreiben. Seligman zielte auf Reichweite: so lange über Positive Psychologie öffentlich gesprochen wird, verstärkt sich die wahrgenommene externe Validität und das Geschäft läuft von alleine. Mit Kritik würde man schon irgendwann, irgendwie zu Rande kommen. Csikszentmihalyi wollte behutsamer vorgehen:

      Viele enthusiastische und idealistische junge Männer und Frauen (…) nutzen vorläufige Forschungsergebnisse voreilig als Allheilmittel für die Übel des Daseins an. Mit den besten Absichten bedrohten diese life coaches die Zukunft der Positiven Psychologie, indem sie Erwartungen schürten, unbeabsichtigt Ansprüche aufblähten und so die intellektuelle Perspektive (…) in Misskredit brachten.
      — Csikszentmihalyi 2014, im Vorwort seiner Gesamtausgabe14

      Die widersprüchlichen Zitate der beiden Gründer der Positiven Psychologie zeigen: die mühsamen Mechanismen wissenschaftlicher Evidenz sind ebenso bekannt wie die Mechaniken der Vermarktung. Seligman sollte sich durchsetzen. Marketing und Reichweite erschienen lukrativer als knochige Wissenschaft mit kleinteiligen Fragen zu Methoden, Statistik oder Evidenzkontrollen durch langatmige peer reviews.

      Ein Problem konstruieren und Lösung anbieten

      Die Positive Psychologie wurde ‘erfunden’ und ökonomisch geplant — sie hat sich mitnichten ergeben. Was im Konzept noch fehlte, war ein anspruchsvolles Problem, das nur mit Positiver Psychologie gelöst werden könne. Also identifizierte Seligman eine ‘Charakterkrise’ in den USA indem pauschalierende Schlagworte zu einem durchaus plausiblen Spannungsbogen gestapelt werden:

      … der Hedonismus der 1960er Jahre, der Narzissmus der 1970er Jahre, der Materialismus der 1980er Jahre und die Apathie der 1990er Jahre.
      — Seligman 1999:165

      Seligman zitiert ein reaktionär-rückschrittliches, auf Dysfunktionalität fixiertes Establishment. Die Konzentration der Mainstream-Psychologie auf negative Emotionen und Krankheit beschränke und verzerre die Theoriebildung zu einem pessimistischen Menschenbild: Krankes wird behandelt, das Gesundsein nicht hinreichend gefördert.

      Furthermore, psychology’s negative focus has contributed to a culture of blame and victimology which may breed anger and violence and contribute to a pessimistic view of human nature. — Seligman 1999:165

      Was krank und was gesund ist, definiert in den USA das Diagnostical and Statistical Manual of Mental Disorders (DSM) herausgegeben von der APA, dem psychiatrischen Berufsverband der USA. Es ist ein regelmäßig aktualisierter Katalog psychischer Symptommuster und Krankheiten in eindeutigem Vokabular und Sprache und ermöglicht so die theorieunabhängige Beschreibung der Formen psychischen Krankseins. In den USA ist das DSM die Grundlage für die Abrechnungen von Leistungen. Von der WHO herausgegeben wird das International Statistical Classification of Diseases and Related Health Problems (ICD), das alle Krankheitsformen beschreibt.

      War die Situation vor der Jahrtausendwende in den USA tatsächlich so krisenhaft? Wirtschaftlich gesehen und für konventionelle Psychologen, Psychiater und Therapeuten entstand durch Antidepressiva und managed care tatsächlich ein Nachfrageproblem. Während in den 60er Jahren in den USA Depression bei 50 von 1 Million Patienten diagnostiziert wurde, stieg die Diagnoserate in den 1990ern auf 100.000 pro 1 Million. Stimmungsaufhellende Medikamente wie Prozac wurden zur gesellschaftlichen Normalität und nach 10 Minuten Diagnose von jedem Hausarzt verordnet. Sozial akzeptiert und verschrieben wurden diese Psychopharmaka massenweise weil jeder Arzt seinen Patienten helfen möchte. Die angeblich stimmungsaufhellenden Medikamente wurden lange Zeit so häufig verordnet, dass Prozac noch 2005 im britischen Trinkwasser nachgewiesen werden konnte. Im Trinkwasser, nicht im Abwasser. Für das kostenoptimierte Gesundheitswesen und die auf Erlös getrimmten Versicherungsgesellschaften waren schnelle Pillen allemal günstiger als traditionelle, zeitaufwändige Psychotherapie. So stagnierte die stetig nachwachsende Patientenschaft für konventionelle Therapieformen.10 Dass diese Medikamente ein Suchtpotenzial mit sich bringen, war schon früher klar, doch das scheinbar geringere Übel.

      Die Positive Psychologie konnte also das therapeutische Konjunkturproblem als life coaching lukrativ und mit breiteren Zielgruppen lösen helfen: nicht mehr nur die verstummten, depressiv Kranken, auch den Gesunden könne man mit positiven Interventionen ein noch besseres Leben ermöglichen. Ein gesünderes Gegenmodell zum Mainstream: statt zum Filterkaffe morgens für die gute Laune eine blaue Pille und zum Runterkommen abends eine gelbe lieber positive Verhaltensänderungen. Dass Antidepressiva nicht viel besser wirken als ein Placebo wurde erst um 2005 evident. Die Antidepressiva Paxil und Citalopram wirken nicht besser als Placebos.16

      »In 2006 — in a review that was much larger and more far-reaching than the recent one undertaken into Prozac — the US Food and Drug Administration reviewed all antidepressant trials, with data from 100,000 patients. The FDA reported that while five out of 10 people appeared to respond to the pills, four out of 10 responded to the placebo.«

      Das Ergebnis wurde 2018 in einer großen Metastudie bestätigt: außer bei schwersten Depressionen bieten Antidepressiva keinen klinischen Vorteil17

      Placebo bedeutet: das Glaubenssystem aktivieren. Unser Glaube an eine Wirkung hat mächtigen Einfluss darauf, wie wir uns fühlen. Im zweiten Weltkrieg arbeitete eine Krankenschwester unter schwerem Beschuss. Als Morphium zur Neige ging, versicherte sie einem verwundeten Soldaten, er würde eine Spritze mit einem starken Schmerzmittel erhalten, obwohl die Spritze nur Salzwasser enthielt. Erstaunlicherweise linderte das die Schmerzen des Soldaten und verhinderte einen lebensgefährlichen Schock.16 Die eigene Wahrnehmung und Bewertung von Situationen zu ändern, scheint zuverlässig auch die Physiologie zu beeinflussen.

      Eine Lösung zu haben, dann das Problem zu definieren funktionierte offenbar bestens: generiere eine Charakterkrise und zeige den Ausweg. Schon läuft das Geschäft! Originell und originär war diese Salutogenese, die Herstellung von Gesundheit, als Gegensatz zur angekreideten Pathogenese schon um die 2000er-Jahre längst nicht mehr. Abraham Maslow, bekannt als Erfinder der missverstandenen ‘Bedürfnispyramide’ hatte Gleiches schon 1947 formuliert und 1954 in humanistischer Tradition jedoch ohne den Beleg experimentelle Daten niedergeschrieben. Auch erfand Maslow den Begriff einer positiven Psychologie und nicht der geschäftstüchtigere Martin Seligman. Die empirische Fundierung, die Herleitung und Einkleidung in Wissenschaftlichkeit war die Differenzierung, der USP (unique selling proposition) der Positiven Psychologie: mit wissenschaftlichen Methoden glücklicher werden. Was kann da schief gehen?

      Einiges kann da schief gehen. Wenn Experimente keine zweckdienlichen Daten ergeben, wenn es keine Evidenz gibt für die Behauptungen — dann zieht man zurück.

      We are, unblushingly, scientists first. The work we seek to support and encourage must be nothing less than replicable, cumulative, and objective (…) If empirical research fails to confirm the usefulness of the positions we advance, we hope to have the resilience to admit defeat and bow out with good grace.

      Seligman & Csíkszentmihályi 200113

      Nicht so Seligman und seine steil wachsende Anhängerschaft. Wenn es beginnt zu laufen, mehr Gas geben!

      Ab 2000 und über drei Jahre sammelte eine weltweite Gruppe, was in der Menschheitsgeschichte über Glück und Glücklicherwerden bekannt war. Auf den Schultern von Riesen stehen18 war die Idee. Texte von Konfuzius und Sokrates, Whitman, Freud, Maslow, zeitgenössische Einsichten aus den Sozialwissenschaften bis zu Graffiti und Grußkarten. Ein Panoptikum aller Elemente und Werkzeuge des Glücks.6 2004 wurde ‘Character Strengths and Virtues’ (CSV) – Charakterstärken und -tugenden19 — auf mehr als 800 Seiten ein best-of von allem, was zum Glück bekannt ist. Die Gliederung geschieht in sechs Kerntugenden (virtues) Weisheit, Mut, Menschlichkeit, Gerechtigkeit, Mäßigung, Transzendenz. Daraus abgeleitet werden 24 Stärken (strengths), u.a. Tapferkeit, Bescheidenheit, Ausdauer, Vitalität, Neugier, soziale Intelligenz, Spiritualität, Selbstkontrolle, Führungsqualität und, nach offenbar intensiver Debatte der Redaktionsgruppe, auch Humor.

      Teil des Buches ist ein Selbsttest als Online-Fragebogen ‘Values in Action (VIA)’, heute ‘VIA Inventory of Strengths (VIA-IS)’. Mit 240 Fragen werden individuelle Stärken gemessen und auf einer 5-stufigen Skala angeordnet. Die Ergebnisse sollen helfen, bessere Selbstkenntnis und persönliche Entwicklungsperspektiven zu geben. Je höher der Wert, um so mächtiger die individuelle Stärke. Nach der Sicht der Positiven Psychologie gilt es diese Stärken zu stärken statt Schwächen zu kompensieren. Das VIAS ist angelegt als konkrete Rezeptsammlung zum Glücklicherwerden, als Kochbuch zur Salutogenese, als Gegenmodell zur Katalogisierung von Schwächen und Krankheiten in DSM und IDC. Mehr als 11 Millionen Menschen haben VIA-IS durchlaufen. Kostenlos kann man das auf einem von der Uni Zürich betriebenen Portal und gleich Dutzende weitere Selbsttests absolvieren. Zur Auswahl stehen neben vielen weiteren der Satisfaction-With-Life-Fragebogen (SWL) für die subjektive Zufriedenheit mit dem eigenen Leben, der Wellbeing Index (IWI) mit nationalen Gegebenheiten oder der Orientations-to-Happiness-Fragebogen (OTH) zu Lebensstilen.

      Methodische Kritik an VIA gab und gibt es in hinreichender Menge und Tiefe. Uneinheitliche Faktorenanalysen zur Trennschärfe und Kritik zur Testkonstruktion, -validität und fehlende kulturellen Übertragbarkeit werden angeführt. Die (Charakter-)Stärken seien überlappend oder unscharf mit den Tugenden korreliert, Faktorenanalysen liefen auf weniger als die sechs postulierten Tugenden hinaus usw. usf. Es gibt erstaunlich wenig nachlaufende Forschung bzw. Forschungsergebnisse zu den Grundlage der (VIA-) Klassifizierung, etwa zur Frage, ob alle Charakterstärken tatsächlich moralisch wertvoll sind oder ob selektive Charakterstärken auch komplett unausgeprägt sein können. Verändern sich subjektive Stärken im Lebenslauf? VIA-IS gibt eine Test-Retest Korrelation nach vier Monaten mit größer als 70% an. Das heisst: macht Mensch den gleichen Test nach vier Monaten erneut, dann haben 70% das gleiche Ergebnis. In der Testkonstruktion gelten Werte ab 70% als akzeptabel, ab 80% als gut. Hier kann jede·r den VIA-IS selbst ausprobieren — und am Besten mehrfach im Abstand von ein paar Monaten. Den ersten Durchlauf bedienen Sie aufrichtig und antworten wie Sie es als richtig empfinden. Bei weiteren Durchläufen versuchen Sie, Ihre Antworten so zu wählen, dass ein idealisiertes Selbstbild entsteht, also so, wie Sie gerne wären.

      Kommt der Test zu unterschiedlichen Ergebnissen?

      Woraus ‘Happiness’ sich zusammensetzt (angeblich)

      In einem häufig zitierten Artikel argumentieren Sonja Lyubomirsky und Co-Autoren, dass 50 Prozent der Varianz menschlichen Glücks auf die subjektive Genetik zurückzuführen sind (set point), 10 Prozent auf die Umstände und 40 Prozent auf Faktoren, die der Einzelne selbst kontrollieren kann, also auf selbst getroffene Entscheidungen.20

      Im Handumdrehen wurde ein plakativer Kuchen daraus, der die Zusammensetzung von Glück erstmals restlos klärte:

      determinants of happiness
      So einfach funktioniert “Glück”? Verblüffend trivial!

      Dieser Mut machende ‘happiness pie’ verbreitete sich viral und elektrisierte ‘Life Coaches’ wie einschlägige Medien. Lyubomirsky wurde zum Happiness-Promi und durch Talkshows und Konferenzen gereicht.

      Eine Glücksformel! Endlich!

      Mit Lyubomirskys Papier argumentierte Seligman umgehend, dass ganz normale Menschen signifikant glücklicher werden könnten weil man nun ja wisse, wie Glück sich zusammensetze! Tatsächlich ist die von Seligmann konstruierte Glücksformel eine simple Summandenkette, eher ein Formelchen:

      H = S + C + V

      • H = Happiness
      • S = set point als genetische Ausstattung, mit der man geboren wird
      • C = Circumstances, Lebensumstände
      • V = subjektive Entscheidungen, individuelle Kontrolle, volitional activities

      Mit den sonnigen Prognosen setzten sich erst 2020 ein Beitrag in einem peer-reviewed Journal etwas kritischer auseinander. Dieser fand erst einmal erhebliche statistische Probleme. nur 5% Varianz der ‘chronical happiness’ kann aktiv, subjektiv beeinflusst werden?

      Among others, ’there is only very limited evidence to place the figure for the heritability of well-being as low as (precisely) 50%. Consequently, there is little reason to believe that 40% is a reliable estimate of the variance in chronic happiness attributable to intentional activity — for example, if Lyubomirsky et al. had chosen a different (but, in our view, at least equally plausible) set of estimates, they might just as easily have concluded that as little as [5 percent] of variance in chronic happiness can be attributed to volitional activities.21

      Hoppsa: nur 5% der Varianz des ‘bleibenden Glücks’ können auf freiwillige Aktivitäten zurückgeführt werden. Gemeint sind hier die Interventionen und Selbst-Übungen aus dem Repertoire der Positiven Psychologie, die täglichen Hausaufgaben. 5% wirksamer Einfluss ist nun eher übersichtlich wenig — aber immerhin ein Befund. Da hätte es keinen Kuchen gebraucht, ein Glückskeks hätte gereicht. Ein sehr kleiner.

      Die ‘critical positivity ratio’ als kleiner Schmetterling

      Die Seligman Inc. versuchte immer wieder, aus den dünn belegten Postulaten der Positiven Psychologie kommerzialisierbare Angebote zu entwickeln. Nach allen zugänglichen empirischen Daten sind die beiden grössten Angebote der Positiven Psychologie, das ‘Penn Resilience Program’ (PRP) und das ‘Strath Haven Positive Psychology Curriculum’ bestenfalls unwirksam. Vielleicht sind wenigstens die kleinen Interventionen tauglich und führen zu mehr Glück, Happiness oder wenigstens subjective well-being?

      Die Broaden-and-Build-Theorie von Barbara Fredrickson hingegen ist in der Psychologie gut empirisch belegt und anerkannt. Sie besagt, dass positive Emotionen wie Freude, Interesse oder Dankbarkeit den Denk- und Handlungsspielraum erweitern und dadurch langfristig persönliche Ressourcen wie Resilienz, soziale Bindungen und psychisches Wohlbefinden aufbauen. Ein breites Denk- und Handlungsrepertoire wiederum stärkt die Widerstandsfähigkeit gegen künftige emotionale Rückschläge.22·23·24·25 Die Häufigkeiten und Intensitäten positiver/negativer Emotionen sollten also einen Unterschied zum subjektiven Glück machen. 

      (…) a universal-invariant ratio between positive to negative emotions that serves as a unique tipping point between flourishing and languishing in individuals, marriages, organizations, and other human systems across all cultures and times.26

      Die ‘critical positivity ratio’ behauptet also, es gäbe ein … »universelles, kulturunabhängiges und unveränderliches Verhältnis zwischen positiven und negativen Emotionen und einen Wendepunkt zwischen dem Gedeihen oder Erlahmen von Individuen, Ehen, Organisationen und anderen menschlichen Systemen (…)«, also ein universell geltendes ‘Gesetz’ und damit einen Durchbruch der Glücksforschung der Positiven Psychologie.

      Our discovery of the critical 2.9 positivity ratio may represent a breakthrough. 26

      Um einen Durchbruch zu melden muss man sich schon sehr sicher sein, dass alles zueinander passt. Bei einem Verhältnis von mehr als (aufgerundet) drei positiven zu einer negativen Emotion blüht der Mensch auf, bei kleineren Werten droht ein freudloses Dahinvegetieren?27

      ρ = 28, σ = 10, β = 8/3

      Zur Visualisierung bediente sich Fredrickson bei einem mathematischen Modell aus der Meterologie. Die Animation zeigt einen sogenannten Lorenz Attraktor, ein »(…) vereinfachtes mathematisches Modell für die atmosphärische Konvektion von Luftströmungen. Das ist komplizierte mathematische Materie und eher ausserhalb psychologischer Kompetenzen. Für bestimmte Parameter und Anfangsbedingungen zeigt es chaotische Lösungen.« Stark verkürzt beschreibt dieses Modell einer Fluiddynamik, dass bei jedem physikalischen System ohne perfekte Kenntnis der Ausgangsbedingungen eine winzige Störung (etwa durch den Flügelschlag eines Schmetterlings, wie romantisch!) die Vorhersage des künftigen Verlaufs immer versagen wird. Von diesem 3:1-Verhältnis des ge-hijackten Lorenz-Attraktors wurde behauptet, es sei ebenjener, der die genauen emotionalen Koordinaten identifiziert, die ‘aufblühende’ von ‘verkümmernden’ Menschen unterscheide. Die Prüfung haben andere kompetent erledigt. Atmosphärische Konvektion hat tatsächlich mit einer ‘critical positivity ratio’ rein gar nichts zu tun. Die ‘bahnbrechende’ Erkenntnis beruht auf Arbeiten von Losada (1999)28 und Losada und Heaphy (2004)29, in denen die Lorenz-Differentiale aus der Fluiddynamik ‘angewandt’ wurden, um die Veränderungen der menschlichen Emotionen über die Zeit zu beschreiben.

      So einfach geht Glück: 3:1

      In dichter Folge wurde dieses dann aufgerundete 3:1-Verhältnis im Range eines positiv-psychologischen Naturgesetzes betrachtet und breitflächig medial verbreitet: hat man dreimal mehr positive als negative Emotionen, dann läuft das Leben! Ein Schmetterling ist für die Kommerzialisierung noch um einiges besser als süße Katzenbilder: erst die mediale Multiplikation hält gute-Nachrichten-Maschinen am Laufen. Stutzig macht die Verkürzung eines komplexen Zusammenhanges auf eine einzige Zahl, eine Zahl mit erstaunlicher Präzision. Alles, was Leben ausmacht, Liebe, Glück, Gelingen, Enttäuschungen, Scheitern, Sorgen, Zufall, Umwelt, Kultur, Gene … all das schnurrt zusammen auf die Zahl 2,9013, aufgerundet 3. Ein Lorenz-Graph wie der oben gezeigte wurde mitsamt der Glücksthese irgendwann in den 2010er Jahren in einem Postgraduiertenkurs für angewandte Positive Psychologie in London gezeigt. Blöd nur, dass Nick Brown dabei war seinen Master zu machen. Brown stand anders als seine Kommilitonen nicht am Beginn einer Berufslaufbahn sondern am Ende: er war frühpensioniert und unabhängig, hatte nichts zu verlieren. Nick Brown sezierte das positiv-psychologische Tanzkärtchen, rechnete nach und kam zum Ergebnis, nun … zu keinem Ergebnis. Ein Hoax. Der ganze Schmetterlingsdings ist an den Haaren herbeigezogen, erfunden.

      the existence of a critical minimum positivity ratio of 2.9013 is entirely unfounded — Nick Brown, 201630

      Das Papier von Fredrickson und Losada26 und die vermeintlich universelle positivity ratio wurde da schon seit 11 Jahren intensiv zitiert, kommerziell vermarktet. ‘Ausgeschlachtet’ könnte man sagen. An Schmetterlingen ist nur nicht so arg viel dran. 

      In Selbsthilfebüchern, -kursen, positivem Coaching und Vorträgen steckt jedoch eine Menge Geld, das nach neuen Zielen sucht:

      Both Seligman and Fredrickson are hired speakers. One website lists Seligman’s booking fee at between $30,000 and $50,000 an engagement. In this new science of happiness, it seemed that all the leading proponents were happy. — Anthony 2014 27

      Ordentliche Tarife für gute Arbeit sind unverdächtig. Medienstars, gut verdrahtete Prominente und Politiker spielen in derselben Liga. Bei jenen fragt auch kaum jemand nach der Substanz weil es nicht darum geht, was gesagt wird, sondern wer spricht — bei Wissenschaftlern ist das eher selten. Insbesondere, wenn die Aussagen substanzlos sind. Es ist nicht so, dass die Ungereimtheiten niemandem zuvor aufgefallen wäre. Es wollte nur niemand hören und dann womöglich zurückrudern. Die Datengrundlage für Fredricksons 3:1-Schmetterling war etwa die qualitative Analyse einer Reihe von einstündigen Sitzungen in einer Laborumgebung mit genau acht Personen. Die führten Gespräche berichteten von ihren subjektiven Erfahrungen. Auch mit positiv-wohlwollendem Blick ist das kein belastbares Datenfundament für einen ‘Durchbruch’.24

      (Die ganze, lesenswerte und überaus unterhaltsame Geschichte ist in einem langen Artikel des Guardian aufgezeichnet.)

      Dass die Mathematik hinter dem Schmetterlingsmodell nicht stimmt, akzeptierte Barbara Fredrikson. Verstanden habe sie das ohnehin nicht. Ihre Theorie der ‘critical positivity ratio’ hält sie weiterhin aufrecht, die empirischen Belege seien noch viel stärker als ehedem.25·27 Das führt zu einer kuriosen Situation. Eine fundamentale, nicht verhandelbare Eigenschaft wissenschaftlichen Arbeitens ist die Selbstkorrektur bei Irrtümern. Bei der ‘critical positivity ratio’ handelt es sich offenkundig um einen Irrweg. Selbstkorrektur geschieht nicht — im Gegenteil wird das empirisch nicht Bewiesene als Glaubenssatz weiter propagiert.27

      … but social psychology is full of theorising and much of it goes unquestioned. — Nick Brown

      Kann es denn sein, dass die berühmteren Vertreter der Positiven Psychologie gar nicht wissenschaftlich arbeiten …?

      Science is when you change your mind. Religion is when you won’t. — Rob England 🦓 (@rob_england, 20.12.21) twitter

      We all follow what we believe.
      We run external information through our belief system.
      Sometimes that information changes our belief system.
      Other times it reinforces our belief system. — Eb (@eikonne, 18.12.21) Twitter

      Die Programme der Positiven Psychologie sind untauglich.

      Im ‘Strath Haven Positive Psychology Curriculum’, ein ‘Positive Education Program to Promote Wellbeing in Schools’, das ursprünglich für eine High School in einem Vorort von Philadelphia pilotiert wurde, war das Ziel …

      1. “to help students identify their signature character strengths and”
      2. “to increase students’ use of these strengths in day-to-day life”

      Martin Seligman behauptete, dass das Programm “Charakterstärken, Beziehungen und Sinnhaftigkeit aufbaut, positive Emotionen erhöht und negative Emotionen reduziert”.31 Der Pilot des SHPPC kostete fast 3 Millionen Dollar, die in einer kontrolliert randomisierten Studie validiert werden sollte. Die Ergebnisse wurden 2009 im ‘Oxford Review of Education’ publiziert32, allerdings fehlten prüfbare Daten, wie sie mit der Veröffentlichung von Forschungsergebnissen international üblich sind. Auch die publizierte Auswertung des Department of Education (DoE 2010) kommt zu dem lapidaren Ergebnis “students’ outcomes were not affected”. Brachte also keine erwünschte Verhaltensänderung.

      Das ‘Penn Resilience Program’ (PRP) ist ein weiteres prominentes Programm der Positiven Psychologie. Es soll Kindern und Jugendlichen helfen, grundlegende kognitive Verhaltensprinzipien besser zu verstehen, einschließlich der potenziellen Gefahren negativer Selbstgespräche (“Ich habe den Test nicht bestanden; ich bin wirklich nichts wert”) und katastrophaler Gedanken (“Meine Mutter sollte eigentlich schon zu Hause sein; sie muss in einen schrecklichen Unfall verwickelt gewesen sein”). Ziel des PRP ist es, gesunden jungen Menschen kognitive Gewohnheiten und Fähigkeiten zu vermitteln, die langfristig Depressionen und Angstzuständen vorbeugen. PRP wird in Gruppen von sechs bis 15 Schülern im Laufe von etwa 20 Stunden durchgeführt. Das PRP hat auch Varianten, die sich an Gruppen von Kindern und Jugendlichen richten, die bereits Warnzeichen für psychische Erkrankungen zeigen, also nicht mehr als ‘normal’ oder unauffällig gelten können. Die Effektivität des PRP wurde danach peer-reviewed und fand keine Wirksamkeit.33 Ein weiterer Review fasst hart und herzlich zusammen: “No evidence of PRP in reducing depression or anxiety and improving explanatory style was found (…) The large scale roll-out of PRP cannot be recommended.”34 Das PRP wurde und wird weiterhin und weltweit von tausenden Schulen gekauft und eingesetzt35. Warum, wenn es keine nachweisbare Wirkung gibt?

      Im Jahresbericht 2018 des von Martin Seligman gegründeten Positive Psychology Center (PPC) an der University of Pennsylvania steht etwa, dass ein Zweijahresvertrag des US-Justizministeriums gewonnen wurde um das PRP für ‘law-enforcement personnel’ zu adaptieren. Polizisten, Sicherheitskräfte. Auch werden Verträge aufgeführt um Gleiches u.a. für die medizinischen Fakultäten der Universitäten Yale und Penn anzubieten. Der grösste Kunde Seligmans Positive Psychology Center ist das US-Militär: 15% der Veteranen im aktiven Kriegseinsatz zeigen PTSD-Symptome. Das US-Militär hat damit ein offenes Problem.35 2010 gewann das PPC ohne Ausschreibung einen 31-Millionen-Dollar Vertrag für eine adaptierte Version des PRP, um dem PTSD-Syndrom (post traumatic stress disorder) und der häufig einhergehende Selbstmordgefahr von Soldat·innen zu begegnen. Doch auch für die Behandlung posttraumatischer Stressstörungen fällt der PRP als Instrument aus — weil er nie für diese Zwecke konstruiert wurde sondern zur kognitiven Stärkung von Schülern und Jugendlichen — und obwohl er ebenda keinerlei nachweisbaren Nutzen bringt.

      “Much of PTSD consists of symptoms whose prevention is not addressed by the PRP, or indeed anything else that comes under the umbrella of positive psychology.”30

      ”It’s difficult for someone untrained in a given area to evaluate claims within that area, even if they are otherwise quite competent.”10

      Die kommerziell vermarkteten Instrumente der Positiven Psychologie scheinen untauglich, die zu Grunde liegenden Daten brüchig, die Evidenzen gering bis ausbleibend. Es ist der Anschein wissenschaftlicher Fundierung, unter deren Mantel der versprochene Nutzen gerne geglaubt wird. In den wissenschaftlichen Grundlagen schwächelt also die positive Psychologie. 

      Die Untersuchungsergebnisse, heisst es9

      1. beruhen auf Selbstaussagen
      2. sind extrapoliert aus korrelativen statt experimentellen Daten
      3. basieren auf kurzfristigen statt längsschnittlichen Untersuchungen
      4. werden vermarktet weit jenseits der wissenschaftlich vertretbaren Stichhaltigkeit

      Martin Seligman und Mihály Csíkszentmihályi argumentierten 2001 und zu Beginn der aufstrebenden Positiven Psychologie noch herzhafter:

      “We are, unblushingly, scientists first. The work we seek to support and encourage must be nothing less than replicable, cumulative, and objective“ (…) If empirical research fails to confirm the usefulness of the positions we advance, we hope to have the resilience to admit defeat and bow out with good grace .”13

      “Wenn du verloren hast, dann gib es zu und gehe erhobenen Hauptes” steht da. Es wäre dann vielleicht so weit?

      * * *


      Das Bild des Glückskuchen stammt aus Wikimedia Commons.


      1. Blickhan, D. and Eid, M. (2018) Positive Psychologie – ein Handbuch für die Praxis. 2., überarbeitete Auflage. Paderborn: Junfermann Verlag (Reihe Fachbuch). ↩︎
      2. Carr, A. (2004) Positive Psychology. London: Brunner-Routledge. ↩︎
      3. Hefferon, K. and Boniwell, I. (2011) Positive psychology: theory, research and applications. 1. publ. Maidenhead: McGraw-Hill, Open Univ. Press. ↩︎
      4. Rose, N. (2021) Management-Coaching und Positive Psychologie Stärken stärken, sinnvoll wachsen. Haufe-Lexware GmbH & Co. KG. ↩︎
      5. Ehrenreich, B. (2009) Bright-sided: how the relentless promotion of positive thinking has undermined America. New York: Picador. URL (Accessed: 5 November 2021). ↩︎
      6. Gibbon, P. (2020) ‘Martin Seligman and the Rise of Positive Psychology’, HUMANITIES. URL ↩︎
      7. Gutkin, L. (2021) ‘Positive Psychology, or Positively BS?’, Positive Psychology, or Positively BS?, June. URL ↩︎
      8. Lazarus, R.S. (2003) ‘Does the Positive Psychology Movement Have Legs?’, Psychological Inquiry, 14(2), pp. 93–109. DOI ↩︎
      9. Schein, M. (2018) ‘Positive Psychology Is Garbage (And Why You Should Follow Its Founder’s Lead)’, 5 July. URL ↩︎
      10. Singal, J. (2021b) The quick fix: why fad psychology can’t cure our social ills. First edition. New York: Farrar, Straus and Giroux. ↩︎
      11. Majumdar, Anjali, Satishchandra Kumar, and Anuradha J. Bakshi. “The Hope Circuit: A Psychologist’s Journey from Helplessness to Optimism.” British Journal of Guidance & Counselling 47, no. 2 (March 4, 2019): 263–64. DOI; auf S. 246 zur kommerziellen Erfindung der Positiven Psychologie ↩︎
      12. Seligman, M.E.P. 2011. Flourish: A Visionary New Understanding of Happiness and Well-Being. 1. Free Press hardcover ed. New York, NY: Free Press. S 13 das wörtliche Zitat zur Finanzierung der Forschungen ↩︎
      13. Seligman, M.E.P. and Csikszentmihalyi, M. (2001) ‘“Positive psychology: An introduction”: Reply.’, American Psychologist, 56(1), pp. 89–90. DOI. ↩︎
      14. Csíkszentmihályi, Mihaly. Flow and the foundations of positive psychology. New York: Springer, 2014. (Im Vorwort auf xxii sind die Bedenken formuliert, mangels robuster Forschungsergebnissen ungedeckt voranzuschreiten) ↩︎
      15. Seligman, M.E.P. 2013. Authentic Happiness: Using the New Positive Psychology to Realize Your Potential for Lasting Fulfillment. Atria paperback ed. New York, NY: Atria Paperback. ↩︎
      16. Skillicorn, J. (2020). Healing Depression Without Medication: A Psychiatrist’s Guide to Balancing Mind, Body, and Soul. North Atlantic Books. ↩︎
      17. Diese große Metastudie zur Wirkung von Antidepressiva lief über sechs Jahre und verglich bis dahin unveröffentlichte Daten aus 522 Studien mit über 116.000 Teilnehmern zu einundzwanzig verschiedenen Medikamenten: Cipriani, A., Furukawa, T. A., Salanti, G., Chaimani, A., Atkinson, L. Z., Ogawa, Y., Leucht, S., Ruhe, H. G., Turner, E. H., Higgins, J. P. T., Egger, M., Takeshima, N., Hayasaka, Y., Imai, H., Shinohara, K., Tajika, A., Ioannidis, J. P. A., & Geddes, J. R. (2018). Comparative efficacy and acceptability of 21 antidepressant drugs for the acute treatment of adults with major depressive disorder: A systematic review and network meta-analysis. The Lancet, 391(10128), 1357–1366. DOI ↩︎
      18. Das Zitat ‘Auf den Schultern von Riesen stehen’ stammt von Johannes von Salisbury. ↩︎
      19. Peterson, C., & Seligman, M. E. P. (2004). Character strengths and virtues: A handbook and classification. American Psychological Association ; Oxford University Press. ↩︎
      20. Lyubomirsky, S., Sheldon, K.M. and Schkade, D. (2005) ‘Pursuing Happiness: The Architecture of Sustainable Change’, Review of General Psychology, 9(2), pp. 111–131. Available at: https://doi.org/10.1037/1089–2680.9.2.111. ↩︎
      21. Brown, N.J.L. and Rohrer, J.M. (2020) ‘Easy as (Happiness) Pie? A Critical Evaluation of a Popular Model of the Determinants of Well-Being’, Journal of Happiness Studies, 21(4), pp. 1285–1301. DOI ↩︎
      22. Fredrickson, B.L. (1998) ‘What Good Are Positive Emotions?’, Review of General Psychology, 2(3), pp. 300–319. DOI ↩︎
      23. Fredrickson, B.L. (2001) ‘The role of positive emotions in positive psychology: The broaden-and-build theory of positive emotions.’, American Psychologist, 56(3), pp. 218–226. URL ↩︎
      24. Fredrickson, B.L. (2004) ‘The broaden–and–build theory of positive emotions’, Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences. Edited by F.A. Huppert, N. Baylis, and B. Keverne, 359(1449), pp. 1367–1377. Available at: https://doi.org/10.1098/rstb.2004.1512. ↩︎
      25. Fredrickson, B.L. (2013) ‘Updated thinking on positivity ratios.’, American Psychologist, 68(9), pp. 814–822. URL ↩︎
      26. Fredrickson, B.L. and Losada, M.F. (2005) ‘Positive Affect and the Complex Dynamics of Human Flourishing.’, American Psychologist, 60(7), pp. 678–686. DOI ↩︎
      27. Anthony, A. (2014) ‘The British amateur who debunked the mathematics of happiness’, 19 January. URL (Accessed: 21 December 2021). ↩︎
      28. Losada, M. (1999) ‘The complex dynamics of high performance teams’, Mathematical and Computer Modelling, 30(9–10), pp. 179–192. DOI ↩︎
      29. Losada, M. and Heaphy, E. (2004) ‘The Role of Positivity and Connectivity in the Performance of Business Teams: A Nonlinear Dynamics Model’, American Behavioral Scientist, 47(6), pp. 740–765. DOI ↩︎
      30. Brown, N.J.L. et al. (2016) ‘More Questions than Answers: Continued Critical Reanalysis of Fredrickson et al.’s Studies of Genomics and Well-Being’, PLOS ONE. Edited by N.R. Smalheiser, 11(6), p. e0156415. DOI ↩︎
      31. “builds character strengths, relationships, and meaning, as well as raises positive emotion and reduces negative emotion.” ↩︎
      32. Seligman, M.E.P. et al. (2009) ‘Positive education: positive psychology and classroom interventions’, Oxford Review of Education, 35(3), pp. 293–311. DOI. ↩︎
      33. Brunwasser, S.M., Gillham, J.E. and Kim, E.S. (2009) ‘A meta-analytic review of the Penn Resiliency Program’s effect on depressive symptoms.’, Journal of Consulting and Clinical Psychology, 77(6), pp. 1042–1054. DOI ↩︎
      34. Bastounis, A. et al. (2016) ‘The effectiveness of the Penn Resiliency Programme (PRP) and its adapted versions in reducing depression and anxiety and improving explanatory style: A systematic review and meta-analysis’, Journal of Adolescence, 52, pp. 37–48. DOI ↩︎
      35. Singal, J. (2021a) Positive Psychology Goes to War – How the Army adopted an untested, evidence-free approach to fighting PTSD, The Chronicle of Higher Education. URL. ↩︎
    • Generation X·Y·Z? Gibt es nicht.

      Es gibt keinen empirischen Unterschied zwischen Lebenszielen, Sorgen oder gesellschaftlichem und politischem Engagement der Generation X, Y oder Z. Sozialwissenschaftlich existieren nur minimale Unterschiede zum Einstellungswandel der Gesamtgesellschaft: die Einstellung der gesamten Gesellschaft entwickelt sich, Geburtskohorten haben einen marginalen Einfluß.

      Etwas, das es nicht gibt, macht ordentlich Wind: auf Millenials, die um die Jahrtausendwende herum Geborenen angepasste Recruitingmassnahmen, auf die Generation Smartphone zugeschnittene Arbeitsplätze und meterweise Managementratgeber … um ein Phantom zu bedienen? Der Soziologe Martin Schröder hat genauer hingesehen und nachgerechnet. Seit 1984 befragt das Deutsche Institut für Wirtschaftsforschung jährlich 12.000 Privathaushalte und veröffentlicht die Ergebnisse im „Sozio-ökonomischen Panel“ (SOEP). Wenn es unterschiedliche Einstellungen in Geburtskohorten gibt, dann müssten sie dort zu finden sein.

      »Es gibt Einstellungsunterschiede, die sich in der gesamten Gesellschaft breit machen, aber die erfassen alle Generationen gleichermaßen. « — Martin Schröder, Soziologe

      Auch die SHELL Jugendstudie geht davon aus, dass gesellschaftliche Ereignisse während der Jugendzeit alle 15 Jahre eine neue Generation hervorbringen, die angeblich mit lebenslang klar abgrenzbaren Einstellungsmustern gemeinsam älter werden. Alles Unfug, sagt Schröder — und er hat harte, öffentliche Daten zum Beleg, die allen anderen auch zur Verfügung stehen. Jedoch prüfte Schröder (2018) diese acht Hypothesen auf Evidenz:

      »Nimmt man diese Beschreibungen ernst, müsste sich die Generation Y relativ zu vorherigen Generationen und besonders zur Generation X insofern signifikant unterscheiden, als dass ihr …

      • Selbstverwirklichung und
      • Berufserfolg besonders wichtig sind; sie müsste
      • eine niedrige Zukunftszuversicht aufweisen,
      • hohe Sorgen um die eigene Arbeitsplatzsicherheit und die
      • eigene wirtschaftliche Situation haben, verbunden mit
      • niedrigem Politikinteresse und
      • niedrigem politischem und gesellschaftlichem Engagement.

      Aufgrund der Charakteristika vorheriger Generationen sollte sie außerdem den Wert einer glücklichen Ehe oder Partnerschaft weniger betonen als die sogenannte skeptische Nachkriegsgeneration, jedoch mehr als die sogenannten ̓68er.« Um es zu einem Ende zu bringen: die Generationen XYZ gibt es in den Daten nicht.

      »Das periodische Ausrufen neuer Generationen mit unterschiedlichen Einstellungsmustern illustriert die Konstruktion gesellschaftlicher Mythen und nicht tatsächlicher Generationenunterschiede.« — Martin Schröder, Soziologe

      Nebenbei entdeckte Schröder haufenweise Zirkelschlüsse: Medien und Marketer beziehen sich auf recht weiche Aussagen aus der Forschung, die sich auf Medien/Marketer beziehen. Eine weitere Echokammer also. Die mühsamere Auseinandersetzung mit den Längsschnittdaten ist weit weniger beliebt.

      Deutschlandfunk Nova hat ein 7min-Interview dazu.

      * * *


      Advertising World. (1993). Generation Y. Advertising World, 64(36), 16. 

      Krauter, R. (11.5.2018). Mythos Generationsunterschiede – “Alle Leute verändern mit zunehmendem Alter ihre Einstellungen.” Deutschlandfunk. URL 

      Meschkat, S. (11.2.2018). Kaum Unterschiede zwischen dem, was wir “Generation” nennen. Deutschlandfunk Nova. URL 

      Schröder, M. (2018). Der Generationenmythos. KZfSS Kölner Zeitschrift für Soziologie und Sozialpsychologie, 70(3), 469–494. DOI 

      Schröder, M. (31.1.2018). „Generationsunterschiede? Bilden wir uns ein!“. Philipps-Universität Marburg. URL