Personalisierung von «Was wäre wenn?»-Fragen

Autor
Dr. Michael Knaus
Universität St. Gallen

Wir beschäftigen uns damit, wie «Was wäre wenn?»-Fragen in Zeiten von «Big Data» besser beantwortet werden können. Solche Fragen stellen sich bei jeder Entscheidung und sind für eine einzelne Entscheidung unmöglich zu beantworten, da wir nie wissen werden, was im Falle einer anderen Entscheidung wirklich passiert wäre. In den vergangenen Jahrzehnten gab es grosse Fortschritte darin, zumindest die Durchschnittseffekte von Entscheidungen zu untersuchen. Dank neuer Methoden und Daten sind wir aber seit kurzem in der Lage personalisierte Effekte systematisch zu analysieren.

Eine unbeantwortbare Frage

«Was wäre wenn?» – Diese Frage stellen wir uns häufig im Grossen wie im Kleinen vor und gerne auch nach Entscheidungen aller Art. Das verzwickte an dieser Frage ist jedoch, dass wir niemals wissen werden, wie sich die Welt entwickelt hätte, wäre eine einzelne Entscheidung anders ausgefallen.

Was passiert im Durchschnitt? – Der Wert von Experimenten

Trotzdem ist es für Entscheidungsträger essentiell die Effekte von unterschiedlichen Entscheidungen zu verstehen. Deshalb wurden in der Vergangenheit Methoden entwickelt, um zumindest zu verstehen, welche Effekte verschiedene Entscheidungen im Durchschnitt haben. Ein essentielles Werkzeug sind dabei Experimente, die man häufig aus der Erprobung von neuen Medikamenten in der Medizin kennt. Vergleicht man eine zufällig ausgewählte Gruppe an Patienten, die das neue Medikament erhält, mit einer andere zufälligen Gruppe, die ein Placebomedikament erhält, so kann man den durchschnittlichen Effekt des neuen Medikaments bestimmen. Was jedoch verborgen bleibt, ist der individuelle Effekt eines einzelnen Patienten, da wir ihn lediglich entweder mit Medikament oder Placebo beobachten und nie erfahren werden, wie sich seine Gesundheit entwickelt hätte, wäre er zufällig in der anderen Gruppe gelandet. Trotzdem kann der Durchschnittseffekt genutzt werden, um die Entscheidung zu treffen, ob das Medikament verwendet werden sollte.

Durchschnittseffekte ohne Experimente

Oftmals ist es aus ethischen oder praktischen Gründen nicht möglich, Entscheidungen zufällig zu treffen, um an die Durchschnittseffekte zu gelangen. In den vergangenen Jahrzehnten wurden deshalb Methoden entwickelt und verfeinert, die es erlauben, auch ohne das aktive Eingreifen in Entscheidungsprozesse Durchschnittseffekte zu analysieren. Ein konkretes Beispiel aus unserem Projekt «Causal Analysis with Big Data» im NFP75 befasst sich z.B. mit den Effekten von Programmen, die Arbeitslosen in der Schweiz helfen sollen, schneller einen Job zu finden. Die Entscheidung zur Teilnahme an solch einem Programm ist keineswegs zufällig und wird oft von Sachbearbeitern getroffen. Um den Durchschnittseffekt zu erhalten, müssen dann Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern mit statistischen Methoden herausgerechnet werden. Hierzu verfügen wir über anonymisierte Daten von Arbeitslosen mit detaillierten Informationen über ihren bisherigen Werdegang. Die grossen Datenmengen, die uns hierfür zur Verfügung stehen, zeichnen sich deshalb weniger durch eine grosse Anzahl an beobachteten Arbeitslosen aus (diese sind in der Schweiz zum Glück relativ rar), sondern durch die Menge an Informationen, die wir aus administrativen Datenquellen über sie erhalten können. Die Durchschnittseffekte, die wir dabei berechnen, sind meist negativ und zeigen zum Beispiel, dass Arbeitslose in den Programmen erst später wieder eine Arbeit finden als vergleichbare Nicht-Teilnehmer. Diese negativen Durchschnittseffekte sind weltweit dokumentiert und kommen daher, dass Arbeitslose in einem Programm weniger intensiv auf Jobsuche sind als Nicht-Teilnehmer.

Personalisierte Effekte

Durch die bessere Datenbasis in vielen Bereichen und neuen Methoden, die vor allem auf Grund der verbesserten Computerleistung anwendbar sind, wurden in den letzten Jahren vermehrt Anstrengungen unternommen, um personalisierte Effekte statt Durchschnittseffekte zu analysieren. Ein Durchschnitt kann viele interessante Nuancen verdecken. Beispielsweise kann es so aussehen, als hätte eine gewisse Entscheidung keinen Effekt im Durchschnitt, aber es gibt eine Gruppe, die von der Entscheidung profitiert, und eine andere Gruppe, die darunter leidet. Ziel der neuen Methoden ist es dabei die verfügbaren Informationen zu verwenden um herauszufinden, welche Entscheidung für eine Person mit gewissen Eigenschaften die bessere ist.

Nehmen wir als Beispiel einen Basis-Computerkurs für Arbeitslose. Für einen ehemaligen Arbeiter, der gerade von einer Maschine ersetzt wurde und kaum Computerkenntnisse vorweisen kann, ist solch ein Kurs sehr sinnvoll, während ein IT-Spezialist, dessen Start-up gerade pleite gegangen ist, in solch einem Kurs lediglich seine Zeit und Steuergelder verschwendet.

Ziel unserer Forschung ist es, verschiedene Machine-Learning-Methoden in der Praxis zu erproben und weiterzuentwickeln, die es erlauben, solche personalisierten Effekte zu untersuchen. Diese können dann von Entscheidungsträgern genutzt werden, um aus verfügbaren und möglicherweise grossen Datensätzen personalisierte Empfehlungen abzuleiten.

Auf der methodischen Ebene geht es uns darum, so genannte Machine-Learning-Methoden, die zur Vorhersage von bestimmten Ergebnissen in verschiedenen Bereichen sehr erfolgreich verwendet werden, so zu modifizieren, dass sie nicht die Ergebnisse vorhersagen, sondern die Grösse der Effekte von bestimmten Entscheidungen auf die Ergebnisse. Anstatt vorherzusagen, mit welcher Wahrscheinlichkeit ein Arbeitsloser innerhalb eines Jahres eine neue Arbeit findet, was Standard-Machine-Learning-Methoden sehr gut können, geht es also darum vorherzusagen, wie eine gewisse Entscheidung die Wahrscheinlichkeit verändert, dass er eine neue Arbeit findet. Diese Änderung der Wahrscheinlichkeit hängt dann von beobachteten Charakteristiken ab und es kann individuell entschieden werden, ob eine Entscheidung für oder gegen eine bestimmte Massnahme getroffen werden sollte, je nachdem ob der personalisierte Effekt positiv oder negativ ist.

Keine Zauberei, aber trotzdem grosses Potenzial

Dabei können alle Methoden der Welt das fundamentale Problem nicht lösen, dass wir niemals wissen werden, ob die empfohlene Entscheidung für das einzelne Individuum nun tatsächlich die bessere Entscheidung war oder ob das Ergebnis von einer anderen Entscheidung doch besser gewesen wäre. So gesehen basieren die Entscheidungen immer auf personalisierten Durchschnittseffekten und die «Was wäre wenn?»-Frage bleibt leider – oder zum Glück – auf der individuellen Ebene weiterhin unbeantwortet. Trotzdem hat die Personalisierung das Potenzial, Entscheidungen z.B. in der Medizin, der Wirtschaft oder der Politik datengestützt zu verbessern. Grosse Online-Konzerne nutzen diese Art von Personalisierung bereits exzessiv. Wir arbeiten daran praktikable Methoden zu identifizieren, weiterzuentwickeln und zu lehren, um diese Möglichkeiten auch anderen Forschern und Anwendern zur Verfügung zu stellen.

Zum Projekt

Weiterführende Links