digitalien.org — Stefan Knecht

Lesehinweis: Produktion vs KonsumIch bin kein aktiv oder experimentell Forschender sondern Wissenschaftskonsument. Das ist ein Unterschied: ich produziere kein neues Wissen sondern trage zusammen, was an Informationen zugänglich ist, gliedere ein wenig und finde manchmal Verbindungen und biete darauf Interpretationen an — also: meine Deutungen. Jede:r findet seine und vielleicht andere. Dazu muss man Informationen suchen wollen. Darüberhinaus muss man weiters über verschiedene Interpretationen gepflegt debattieren wollen. Zwischen Daten, Informationen, Wissen und Kompetenz gibt es einen Unterschied, der in der Guglhupf-Analogie behandelt ist.

Wissen, Glauben und Schrödingers Kühlschrank

Wissenschaft beruht auf Belegen und Kontrollen, nicht auf Glauben oder Vertrauen: man stellt eine Theorie auf und versucht sie mit empirischem Vorgehen zu belegen. Instrumente, Versuchsaufbau, alle Randbedingungen und die gewonnenen Daten mitsamt der angewendeten Statistik sind transparent. So können andere alles nachvollziehen und prüfen. Wissenschaft ist logische Analyse.
»Man muss eben kühne Vermutungen anstellen und dann prüfen, so wird man weiterkommen.« — Karl Popper[1] [2]
Schrödingers[3] Kühlschrank[4] illustriert das amüsant:
Wenn ich sage »Im Kühlschrank ist Bier!«, dann den Kühlschrank öffne um meine Aussage zu überprüfen, betreibe ich eine Vorform von Wissenschaft. Wenn ich hingegen sage »Im Kühlschrank ist Bier!« aber nicht nachsehe, weil ich glaube, dass welches da ist, dann ist das Religion. Sage ich aber »Im Kühlschrank ist Bier!«, sehe nach entdecke aber kein Bier, schliesse die Tür und behaupte weiter, es sei Bier im Kühlschrank, dann ist das Esoterik. Wenn kein Bier im Kühlschrank ist, ich die Milch rausnehme und sage »Das wirkt wie Bier! Immerhin stand da mal Bier daneben!« — dann ist es Homöopathie.
Eine gute Theorie ist in der Realität prüfbar und ermöglicht Problemlösung in der Praxis, »erklärt Phänomene (…) und bietet Strukturwissen über die Vielfalt des von ihnen erfassten Phänomenbereiches.«[1][5]
»Es gibt nichts praktischeres als eine gute Theorie.«[6]

Statt Vertrauen und Glauben: prüfbare Mechanismen und evidente Zusammenhänge

Abseits vom Bier im Kühlschrank verhält sich Wissenschaft also wie ein Puzzle aus unbekannt vielen Teilen, bei dem die Vorlage verloren gegangen ist — es gibt nur einen momentanen Zustand, kein Zielbild. Jede Studie betrachtet einen kleinen Ausschnitt eines ‘Phänomenbereiches’, wiederholt und prüft ein vorheriges Experiment. Evidenz entsteht, wenn viele methodisch saubere und unabhängig geprüfte Studien ähnliche Ergebnisse und Interpretationen ergeben. Diese Evidenz hält nur so lange, bis neue Ergebnisse auftauchen und man die Interpretation aktualisieren und vielleicht auch anpassen wird.
Wissenschaft liefert durch kontrollierbare Methoden verlässlichere Erkenntnisse als die Esoterik oder Anthroposophie (…) stellt Zusammenhänge her und zeigt Mechanismen auf, die ein immer besseres Verständnis der Dinge ermöglichen (…) das über bloßes Fühlen, Meinen und Wollen, Spekulieren und Phantasieren hinaus geht (…) weil es prüfbar und rational nachvollziehbar ist.[1][7](…) anders als Immunisierung und Dogmatismus, die wir in den Pseudowissenschaften finden.[1][8]
»Auch die Astrologie macht differenzierte Voraussagen. Sie hat aber kein Instrumentarium, um in der Erkenntnis weiter zu kommen, wenn sich eine Voraussage als falsch erweist.«[1] [9]

Intuition? Auch OK! Muss nur prüfbar sein.

»Die von Metaphysikern als Erkenntnisquelle besonders betonte Intuition wird von der wissenschaftlichen Weltauffassung nicht (…) abgelehnt. Wohl aber wird eine nachträgliche rationale Rechtfertigung jeder intuitiven Erkenntnis angestrebt und gefordert. Dem Suchenden sind alle Mittel erlaubt; das Gefundene aber muß der Nachprüfung standhalten[10] ein Zitat aus dem Manifest des ’Wiener Kreises’ von 1929. Intuitive wie wissenschaftliche Aussagen sind umso verlässlicher, je häufiger sie in Prüfungen bewährten und je genauer zufällige Einflüsse[11] bekannt sind. Wenn etwa in der Organisationsforschung intuitive Konzepte nicht objektiv-unabhängig prüfbar sind, dann immunisieren sie sich gegen jedwede Prüfung wie Kritik.

Veröffentlicht wir das Neue, seltener leider die fehlgeschlagene Replikation

Die globale Währung einer Wissenschaftskarriere ist der impact factor, die Anzahl Veröffentlichungen in renommierten Journalen und wie oft die eigenen Ergebnisse von anderen zitiert werden. Ein Nicht-Replizieren-Können ist keine Nachricht sondern langweilig, fällt unter den Tisch und bringt weder Ruhm noch Reichweite. Wenngleich die Information, dass eine Studie nicht wiederholt werden konnte so wichtig und informativ ist wie die Replikation. Vielleicht ist am Original nicht viel dran, vielleicht waren andere Zufälle oder Manipulationen am Werk und die Ableitungen sind nicht haltbar? Publication Bias[12] und Aufmerksamkeitsknappheit machen das Ringen um Evidenzen nicht einfacher: menschliche Aufmerksamkeit ist endlich und bevorzugt das Spektakuläre vor dem Alltäglichen. Was lauter schreit, wird eher gehört. »Mann beisst Hund« ist eine Meldung, »Hund beisst Mann« nicht. Es sei denn, der Hund ist selten oder der Mann prominent. Bei der Planung, Durchführung und Auswertung besonders sozialwissenschaftlicher Studien müssen von den Forschenden viele individuelle Entscheidungen getroffen und dokumentiert werden. Der Vergleich scheinbar ähnlicher Studien ist nicht nur schwierig sondern trägt auch zu einer schlechteren Reproduzierbarkeit bei: je mehr menschliche Entscheidung und Interpretation in ein Forschungsthema fließen, desto weniger objektiv und sachlich werden die Ergebnisse sein.[13][14]

Konsensdiskriminierung, False Balance und die Autoritätsfalle

Die Wissenschaftsjournalistin Mai Thi Nguyen-Kim fasst drei wesentliche kognitive Fehlleistungen in der öffentlich-medialen Wahrnehmung zusammen: Konsensdiskriminierung ist die Unterrepräsentierung eines bestehenden, wissenschaftlichen Konsens. Das rührt aus dem Mangel, sich mit Grundlagen und Methoden zu beschäftigen. So ist das schonungslose Auseinandernehmen und Hinterfragen ein wichtiger und normaler Teil des wissenschaftlichen Diskurses und des peer reviews.[13][15] False Balance ist eine mediale Inszenierung, bei der eine Stimme des wissenschaftlichen Konsens mit einer Außenseitermeinung kontrastiert wird. In der Pandemiedebatte war das als Folge eines immanenten journalistischen Webfehlers[16] laufend zu beobachten. Die Autoritätsfalle ist der Fehlschluss, eine Professorin mit zwei Doktortiteln — ohne sich mit ihren Aussagen kritisch auseinanderzusetzen — für vertrauenswürdiger oder verlässlicher zu halten als eine hinreichend informierte Person ohne akademische Titel.[13][17]

Missverständnisse über wissenschaftlichen Konsens

Wissenschaftlicher Konsens ist keine diskursive Aushandlung sondern die Evidenz der ‘Mehrheit’ vorliegender Daten. Es geht nicht um die Anzahl Studien zu einer Frage oder um Mächtigkeit oder Volumen erhobener Daten sondern um deren methodische Konsistenz. Die Beweislast liegt damit bei demjenigen, der dem wissenschaftlichen Konsens widerspricht. Je stärker der Widerspruch, desto stärker müssen die Methoden sein, mit denen man den Widerspruch belegt. Wissenschaftlicher Konsens verändert sich also mit neuen evidenten Erkenntnissen, die beobachtbare Phänomene besser erklären als zuvor.[13] [18]
»Wenn sich die Fakten ändern, ändere ich meine Meinung. Und Sie, was machen Sie?«​ — John Maynard Keynes[19]

* * *


  1. Fink, Helmut. 2022. ‘Was ist eine gute Theorie?’ mp3. Kortizes-Podcast #46. Zugriff am 3.1.2022.  ↩
  2. bei 23:00  ↩
  3. Bei Schrödingers Katze geht es um eine Kritik an einer frühen Fassung der Quantenmechanik. Wikipedia: In einer Kiste befinden sich eine Katze, ein radioaktives Präparat, ein Detektor für die beim Zerfall erzeugte Strahlung und eine tödliche Menge Gift, die bei Ansprechen des Detektors freigesetzt wird. Das Paradoxon besteht erstens darin, dass in dem Gedankenexperiment eine Katze in einen Zustand gebracht wird, in dem sie (nach der Kopenhagener Deutung) gleichzeitig „lebendig“ und „tot“ ist. Zweitens würde, ebenfalls nach der Kopenhagener Deutung, dieser unbestimmte Zustand so lange bestehen bleiben, bis er von einem Beobachter untersucht wird. Dann erst würde die Katze auf einen der Zustände „lebendig“ oder „tot“ festgelegt. Beides widerspricht der Anschauung und Alltagserfahrung mit makroskopischen Dingen.  ↩
  4. Schrödingers Kühlschrank stammt von Holger Röpke und mit Sicherheit vor 2018. Ein ordentliches Zitat ist das somit nicht. Auch die URL auf Google+ geht ins Leere: Google hat das an sich brauchbar gute G+ abgestellt — ein Jammer.  ↩
  5. bei 00:02:40  ↩
  6. mehrere Zuschreibungen: Lewin, Kant oder Einstein (also muss es verflixt schlau sein)  ↩
  7. bei 00:00:40  ↩
  8. bei 35:15  ↩
  9. bei 26:20  ↩
  10. Neurath, Otto, Rudolf Carnap and Hans Hahn. 1929. ‘Wissenschaftliche Weltauffassung. Der Wiener Kreis’; Zitat auf Seite 307  ↩
  11. Der Pufall steckt im p-Wert: Ein Signifikanz- oder p-Wert von 0,05 oder 5% entspricht einer Wahrscheinlichkeit von 1 in 20, dass also im Schnitt jeder zwanzigste Test einer Intervention »statistisch signifikant« wird. Etwas erscheint wirksam, geschieht tatsächlich aber zufällig: je grösser der p-Wert, desto größer der Einfluss des Zufalls. Die 5%-Signifikanz ist eine Vereinbarung der scientific community, wie »Norden ist oben« oder »rechts/links«. Ebenso könnte man sich auf 1% oder 2,746% als Signifikanzniveau einigen. Noch arger: Signifikanz ist recht umstandslos manipulierbar um gemessene Daten nachträglich einer Hypothese gefügiger machen. Das ist unlauter, geschieht aber, um Ergebnisse publizieren zu können. Für schockartige Ernüchterung, siehe → Replikationskrise[20]
  12. Werden nur signifikante Ergebnisse veröffentlicht, so wird das Gleichgewicht zugunsten positiver Ergebnisse verschoben. Das nicht-Replizieren-können eines Experimentes erhält weniger Aufmerksamkeit und Reichweite als die Verstärkung des bekannten (und meist erwünschten) Ergebnisses.  ↩
  13. Nguyen-Kim, Mai Thi, and Ivonne Schulze. 2021. Die kleinste gemeinsame Wirklichkeit: wahr, falsch, plausibel?: die größten Streitfragen wissenschaftlich geprüft. Originalausgabe. München: Droemer.  ↩
  14. Zitat ab Seite 35  ↩
  15. Zitat ab Seite 335  ↩
  16. ’Web’ von Weben, nicht dieses Internetz: bei knapper Aufmerksamkeit bringt Skandalisierung zuverlässig mehr Aufmerksamkeit als nüchterne Kritik. Drostens legendärer Satz »Ich habe Besseres zu tun.« ist eine schlüssige Reaktion, wenn es um die Sache geht und nicht um mediale Reichweite.  ↩
  17. Zitat ab Seite 335, leicht adaptiert  ↩
  18. zitiert ab S. 229  ↩
  19. Chamberland, M. 2016. Von Eins bis Neun. Große Wunder hinter kleinen Zahlen – Über 100 mathematische Exkursionen für Neugierige und Genießer. Heidelberg/Berlin (Springer). Zitat Seite 191  ↩