ZOE
Zeitschrift Organisations Entwicklung
Stand: April 2018

In 'Meine Akten' einfügen

ZOE vom 15.04.2018, Heft 02, Seite 35 - 37, ZOE1267411
OrganisationsEntwicklung > Reflexion > Aufsatz

Schreckgespenst Algorithmen

Das Ende der wissenschaftlichen Theorie? Eine Betrachtung

Prof. Dr. Johannes Binswanger

Prof. Dr. Johannes Binswanger

Ordentlicher Professor an der Universität Sankt Gallen. Kontakt: johannes.binswanger@unisg.ch

Bei besonders komplexen Systemen müssen wir uns bisweilen von der Idee lösen, durch schieres Nachdenken und die Anwendung von Theorien kausale Zusammenhänge entdecken zu können, und die Algorithmen alleine arbeiten lassen. Doch wenn theoretische Modelle weniger gut in der Lage sind, verlässliche Analyseraster bereitzustellen als dies lernfähige datengetriebene Algorithmen tun, was ist dann noch der Mehrwert von Theorie?

Algorithmen und Machine Learning sind in aller Munde. Eine weitverbreiteten Vorstellung ist, dass ein Algorithmus selbst lernt, welche Faktoren die verlässlichsten Prognosefaktoren sind und so aktueller und passender ist als herkömmliche Theorien bzw. Modelle mit ihren (oft literaturgestützten) Schlüsselvariablen. Vollziehen wir diese potenziell dramatische Entwicklung an einem Beispiel nach: Wir fragen uns, welche Faktoren eine treibende Kraft nicht-kommerzieller Raumfahrt sind (gemessen an der Anzahl nicht-kommerzieller Trägerraketen, die in den Raum gesendet werden). Sie fragen sich vermutlich, warum wir nun gerade diese abgefahrene Forschungsfrage betrachten? Der Grund ist, dass datengetriebene Algorithmen eine faszinierende Antwort auf diese Frage gefunden haben: die Anzahl der in den USA vergebenen Doktorate in Soziologie!

Sicher wären Sie mit literaturgestützter Theorie zu anderen Faktoren gekommen. Vielleicht zweifeln Sie sogar an dieser faszinierenden Einsicht. Falls Sie Zweifel haben, betrachten Sie Abbildung 1. Die Soziologiedoktorate erklären die Trägerraketenentwicklung in geradezu phantastischer Weise, sie machen tatsächlich alle Berge und Täler der Raumfahrtaktivität fast deckungsgleich mit!

Abbildung 1: Weltweite Starts von nicht-kommerziellen Weltraumraketen korrelieren mit Doktoraten in Soziologie in den USA

Natürlich werden einige von Ihnen zu zweifeln beginnen: Handelt es sich hier tatsächlich um einen robusten Zusammenhang? Gute Machine-Learning-Algorithmen sind darauf trainiert, robuste Zusammenhänge zu finden – so auch hier. Nehmen wir an, wir verwenden in der obigen Grafik nur die Daten der Jahre 1997 bis 2003, um den Algorithmus den Zusammenhang zwischen Soziologiedoktoraten und Trägerraketen zu «lehren». Würde der Algorithmus dadurch eine gute Prognosekraft für die Jahre nach 2003 aufweisen? Die Antwort ist ganz offensichtlich: ja. Der Zusammenhang ist ordentlich robust über die Zeit hinweg. Somit hat der Algorithmus tatsächlich den Robustheitstest bestanden!

Was haben wir also gesehen? Vielleicht erklärt sich der dargestellte Zusammenhang damit, dass beide Variablen von der Konjunktur der US-Wirtschaft und damit der Größe des US-Staatshaushaltes beeinflusst sind. Theoriegestütztes Nachdenken (oder ganz einfach auch gesunder Menschenverstand) lässt uns schnell erkennen, dass wir es hier mit einer Korrelation von zwei Größen zu tun haben, die nicht auf einen Kausalzusammenhang zurückzuführen ist. Genau dies trifft im Moment auf einen sehr großen Teil des sogenannten Machine-Learning-Paradigmen zu. Maschinen lernen ganz einfach, mittels Algorithmen diverse «Muster» in Daten zu erkennen. Doch sie sind blind gegenüber dem Unterschied zwischen Kausalität und Korrelation. Theorie- und modellgestützte Datenanalyse hingegen zielt auf Kausalität ab − und hat somit den Algorithmen potenziell etwas Wichtiges voraus.

Betrachten wir nun zwei Themenbereiche, die der Welt des Managements etwas näherliegen als die Weltraumfahrt: Erstens, wie steht es mit dem Zusammenhang von Corporate Social Responsibility (CSR) und der Profitabilität einer Firma? Zweitens, wie verändert sich die Nachfrage nach den eigenen Produkten mit einer Preiserhöhung?

Es gibt glühende Befürworter von CRS, die gerne aufzeigen, dass Firmen, welche CRS-Programme implementieren, auch ZOE 02/2018 S. 36eine höhere Profitabilität ausweisen. Algorithmen hätten keine Mühe, dieses Muster mit einer passenden Stichprobe von Firmen nachzuvollziehen. Ist CSR also der Schüssel zur Profitabilität? Bevor Sie bei derartigen Fragen eine datenbasierte und Algorithmen-unterstützte Schlussfolgerung ziehen, sollten Sie noch einmal das theoretische Denken einschalten. Es gibt den Anstoß, eine Anzahl fast schon leicht nörglerischer Fragen zu stellen: Zeigen die Daten denn wirklich, dass CSR-Programme zu einer höheren Rentabilität führen? Oder ist die Korrelation von beiden Variablen mit der Hypothese vereinbar, dass es tendenziell eher erfolgreiche Firmen mit einer hohen Profitabilität sind, die CSR-Programme starten, weil sie es sich leisten können? Sind die Firmen, die wir in unserer Stichprobe betrachten, in Märkten tätig, in denen Konsumenten ganz besonders auf ethische Aspekte sensibilisiert sind? Und wie weit sind diese Erkenntnisse so auf Firmen in anderen Geschäftsfeldern übertragbar? Praktisch keiner der bestehenden Algorithmen des maschinellen Lernens gibt uns zuverlässige Hinweise zu den Antworten auf diese Fragen. Hier müssen Menschen ihren Kopf einschalten und «theoretisch» über diesen Fragen brüten. Ergo: Es wäre sinnvoll, neben den Algorithmen noch einmal selbst mit der theoretischen Brille auf die Daten zu schauen, um die zugrundeliegenden Kausalzusammenhänge zu identifizieren.

Hinsichtlich des Effektes einer Preiserhöhung beispielsweise, nehmen wir einmal an, dass ein Algorithmus aufgespürt hat, dass es einen sehr stabilen Zusammenhang zwischen hohen Übernachtungszahlen und hohen Preisen in der Hotelbranche gibt. Falls Sie algorithmusgläubig sind, würden Sie nun als Hotelmanager Ihre Zimmerpreise erhöhen und so Ihre Profitabilität steigern. Aber dazu werden Sie sich kaum von einem Algorithmus verführen lassen; denn Sie wissen etwas, was der Algorithmus potenziell nicht weiß: hohe Preise gehen deswegen mit hohen Übernachtungszahlen einher, weil die Preise in der Hauptsaison dank der dann großen Nachfrage erhöht werden können. Der Grund für die Korrelation ist also ein dritter Faktor: die (saisonal bedingte) Nachfrage. Natürlich würde ein Algorithmus potenziell diese als weiteren relevanten Faktor identifizieren und damit würde die irreführende direkte Korrelation von hohen Preisen und hohen Hotelbettenauslastungen verschwinden. Doch darauf können wir (zumindest beim gegenwärtigen Stand der Algorithmentechnik) leider nicht immer zählen. Bei allem technischen Fortschritt braucht es kritische Fragen der menschlichen Intelligenz, um sicherzugehen, dass ein Algorithmus uns nicht dazu verführt, die Preise zu erhöhen, um die Nachfrage zu steigern.

In beiden skizzierten Beispielen können die richtigen Schlussfolgerungen nur mit Hilfe einer kausalen Analyse gezogen werden. Recht viele Akademiker, tendenziell vor allem auch in den Geistes- und Sozialwissenschaften, vertreten die Ansicht, dass über die erwähnten Beispiele hinaus ausschließlich theoriegestützte Kausalzusammenhänge wahren Erkenntnisgewinn bedeuten und somit von praktischem Nutzen sind. Manche dynamischen Systeme sind so komplex, dass wir in absehbarer Zeit keine Hoffnung haben, die zugrundeliegenden Kausaleffekte identifizieren zu können, auch wenn die Kausalitätsfrage im Prinzip sinnvoll wäre. In diesem Fall ist eine Algorithmengetriebene Analyse u. U. schlichtweg die beste oder einzige Analyseoption, die überhaupt zur Verfügung steht. Beispiele hierfür sind biologische Systeme, z. B. im molekularbiologischen Bereich und bei genetischen Analysen. Aber auch die Makroökonomie ist ein äußerst komplexes System; und vielleicht trifft dies in bestimmten Aspekten sogar für eine Unternehmung zu. Im Fachjargon nennt man die algorithmenge‐ZOE 02/2018 S. 37triebene Analyse von komplexen System «Blackboxing». Es sei wiederholt und betont, dass in sehr komplexen Systemen dies u. U. die beste vorhandene Methode sein kann, selbst dann, wenn einige der entdeckten Zusammenhänge vom Typ «Soziologiedoktorate und Raumfahrt» sein werden.

Der Abschluss dieser Betrachtung soll den relativen Nutzen sowohl von Kausalzusammenhängen, als auch Korrelationen anhand des Beispiels einer medizinischen Diagnose erhellen: Stellen Sie sich vor, Sie haben bestimmte Beschwerden mit bestimmten Symptomen, die mit Hilfe einer korrekten Diagnose, aber auch nur mit einer korrekten Diagnose, geheilt werden können. Sie haben die Wahl zwischen zwei Untersuchungsmethoden:

  • Methode A: Sie hat die größte Chance, die richtigen kausalen Faktoren hinter den Symptomen zu identifizieren;

  • Methode B: Sie hat die größte Chance hat, die richtige Diagnose zu stellen.

Eingefleischte Kausalitätsverfechter haben oft Mühe, hier überhaupt den Unterschied zu sehen. Wie kann eine Methode, die nicht die Kausalfaktoren identifiziert, überhaupt eine größere Chance haben, die richtige Diagnose zu stellen? Zugegeben, das Beispiel ist hypothetisch, aber durchaus nicht realitätsfern.

Eine «korrekte» Diagnose bedeutet nicht dasselbe wie eine «kausalitätsgestützte» Diagnose. Ein Symptom und eine Krankheit können z. B. die gleiche kausale Ursache haben. Beispielsweise können ein Hautausschlag und eine ernsthaftere Krankheit beide durch eine Schwächung des Immunsystems bedingt sein. Klarerweise ist der Ausschlag dann nicht die Ursache der eigentlichen Erkrankung, sondern nur eine «Begleiterscheinung». Dennoch können gerade Begleiterscheinungen sehr zuverlässige Diagnosehilfen sein, selbst wenn sie nur auf Korrelationen beruhen und das Krankheitsbild in seinen wahren Ursachen medizinisch vielleicht sogar noch teilweise unerforscht ist, also noch keine kausalen Modelle zur Verfügung stehen! Ich persönlich würde übrigens Methode B wählen.

Wenn es hingegen darum geht, erfolgreiche Therapien zu entwickeln, dürfen wir hoffen, dass ein genaues Verständnis der kausalen Faktoren und eine entsprechende Theorie sehr hilfreich sind. Dennoch wurden in der Praxis schon einige wirksame Therapien gegen Krankheiten entwickelt, bevor deren Kausalität genau verstanden wurde. Viele traditionelle Heilmethoden wirken effektiv gegen eine Krankheit, weil schlicht und einfach die Erfahrung gezeigt hat, dass sie wirken. Die Medizin hat es mit dem äußerst komplexen System des menschlichen Körpers zu tun, wo die Entdeckung echter Kausalzusammenhänge oft nur langsam vorankommt. Es ist nun mal nicht einfach, den kausalen Einfluss eines einzelnen Gens unter einer Menge von 20.000 Genen nachzuweisen – insbesondere dann, wenn zwischen den verschiedenen Genen wiederum komplexe Wechselwirkungen bestehen. Es ist kein Zufall, dass Algorithmen-getriebenes «Blackboxing» in der Molekularbiologie besonders häufig zum Einsatz kommt.

Zurück in die Welt der Unternehmen. Auch hier kann es sein, dass bestimmte Managementpraktiken einfach «funktionieren», obwohl man nicht genau versteht, was die kausalen Faktoren dahinter genau sind. Da auch eine Organisation ein sehr komplexes System sein kann, können hier Algorithmen u. U. einen wertvollen Beitrag leisten, um Zusammenhänge zu identifizieren, deren Kausalität unklar ist, aber deren Kenntnis zur effektiven Lösung von Problemen substanziell beitragen kann. Dies geschieht dann ähnlich einer Diagnose oder Therapie in der Medizin, die jenseits des Verständnisses der involvierten Kausalfaktoren stattfindet.

Die vielgescholtenen Algorithmen haben also durchaus Potenzial, in verschiedensten Feldern zu wichtigen Erkenntnissen hinzuleiten, oder zumindest zu nützlichem Wissen und hilfreichen Erkenntnissen in der Praxis zu führen. Zugleich bergen sie immer das Risiko, den Zusammenhang von Raketen und Soziologiedoktoraten zu »erklären». Genau deshalb sollte man Algorithmen, wenn immer möglich, nicht unbeaufsichtigt lassen! Die Algorithmen sind Freunde der Erkenntnissuchenden, aber man sollte sie an der Leine halten, mag es auch eine lange Leine sein – namentlich ist es die Leine des theorie- und modellgestützten Nachdenkens.

Haben wir es mit besonders komplexen Systemen zu tun, so müssen wir uns bisweilen von der Idee, durch schieres Nachdenken und die Anwendung von Theorien kausale Zusammenhänge entdecken zu können, lösen und die Algorithmen alleine arbeiten lassen. Wann welche Vorgehensweise angebracht ist, diese Unterscheidung muss für viele Fragen des Managements immer wieder neu getroffen werden.

Literatur

Top