Big Data in Sozialwissenschaften

Die Entstehung von Data Science als interdisziplinäres Feld

Autor
Philippe Saner
Universität Luzern

Gespräch mit einem der Forschenden im NPF75-Projekts «Der Umgang mit Big Data: Methoden für eine Soziologie des 21. Jahrhunderts».

Was können Sie uns zum Stand Ihres Projekts erzählen?

Mein Projekt ist Teil des Projektes «Facing Big Data: Methods and Tools for a 21st Century Sociology» (Prof. Sophie Mützel, PhD) im Rahmen des NFP 75 Big Data. Ich untersuche darin das entstehende Feld der Datenwissenschaften oder Data Science, also eines interdisziplinären Wissensgebiets, das sich mit der Erhebung, Auswertung oder Visualisierung grosser Datenmengen beschäftigt. Der Beruf Data Scientist wurde vor ein paar Jahren als «the sexiest job of 21st century» propagiert und seither wird regelmässig vor einem gravierenden Fachkräftemangel in diesem Bereich gewarnt. Gemeinhin werden Datenwissenschaften als ein interdisziplinäres Gebiet beschrieben, das Fähigkeiten in Statistik, Informatik, Maschinellem Lernen, Mathematik und Engineering sowie gute Programmierkenntnisse erfordert.

Mein Forschungsinteresse liegt darin, wie die Datenwissenschaften durch unterschiedliche Verständnisse in gesellschaftlichen Bereichen wie der Wirtschaft, Wissenschaft und Politik geprägt werden. Dazu untersuche ich erstens Stellenausschreibungen für Data Scientists im Schweizer Arbeitsmarkt, wie sie spezifische Profile von datenbezogenen Professionen schaffen. Zweitens schaue ich mir Studiengänge an Schweizer Universitäten und Hochschulen an, und wie sie dieses heterogene Wissensfeld in Studieninhalte übersetzen und so die kommende Generation der DatenwissenschaftlerInnen ausbilden. Ergänzend habe ich qualitative Interviews mit ProfessorInnen und Forschenden über ihre eigenen Perspektiven zu Data Science durchgeführt. Schliesslich schaue ich mir drittens politische Berichte und Dokumente an, die Szenarien für die weitere Entwicklung der Datenwissenschaften sowohl in der Wissenschaft als auch im wirtschaftlichen Bereich skizzieren.

Die Erhebung der Daten habe ich mittlerweile abgeschlossen und arbeite nun daran, die vielfältigen Daten mithilfe von qualitativen und quantitativen Analysemethoden auszuwerten, die Ergebnisse zu verschriftlichen und meine Dissertation fertigzustellen.

Wie steht es mit ersten Resultaten?

Die Analyse zeigt, dass die Akteure sehr unterschiedliche Perspektiven darauf formulieren, was für sie Data Science ausmacht. Auf diese Weise eröffnen sie einen Raum zwischen ihren eigenen etablierten Feldern, der durch Vielstimmigkeit gekennzeichnet ist, und tragen so zum Verständnis und der Weiterentwicklung der Datenwissenschaften als einem heterogenen, interdisziplinären Gegenstand bei. Insofern lassen sich die Datenwissenschaften weder auf eine bestimmte Disziplin noch auf einen gesellschaftlichen Bereich reduzieren.

Die Analyse der Stellenanzeigen für Data Scientists macht deutlich, dass im Arbeitsmarkt Fachexpertise und soziale Kompetenzen prioritär sind, interessanterweise noch vor den methodisch-technischen Skills; letzteren wird vor allem in der Wissenschaft hohe Bedeutung zugeschrieben. Dies verweist zum einen auf die hohe Nachfrage nach entsprechenden Kompetenzen im Arbeitsmarkt, zum anderen aber auch auf die Bedeutung ökonomischer Begriffe und Deutungen innerhalb von Data Science.

Im Bereich der Tertiärbildung zeigt sich eine Zweiteilung: Die existierenden Curricula in Datenwissenschaften sind sehr stark durch die Informatik und ihre Ausbildungstradition geprägt. Sie weisen einen hohen Anteil verpflichtender technisch-methodischer Veranstaltungen im Kernbereich auf, ergänzt durch fachliche Wahlmodule sowie praxisorientierte Kurse. Die zweite wichtige Verankerung sind Business Schools bzw. wirtschaftswissenschaftliche Fakultäten, die eine methodische Ausbildung in Statistik und Datenmanagement mit einer Fachexpertise mit Anwendungsgebieten wie Finance, Marketing oder Management verknüpfen.

Schliesslich kommt den Datenwissenschaften in der politischen Diskussion mehr zu als «nur» der Status eines neuen interdisziplinären Wissensgebietes: Sie werden als grundlegende «Basiswissenschaft» gerahmt, um globale Herausforderungen und Probleme in der Zukunft zu bearbeiten. Zusammen mit anderen Wissensgebieten wie künstlicher Intelligenz oder Robotik gelten sie als zentrale Faktoren für die «Wettbewerbsfähigkeit» nicht nur von Forschung und Bildung, sondern auch der schweizerischen Wirtschaft. Die Investitionen des Bundes in Forschungsprogramme und Initiativen, aber auch einzelner Kantone, Universitäten und Hochschulen setzen insofern Anreize für andere Akteure, ebenfalls in diesen interdisziplinären Bereich zu investieren.

Stichwort «Technologietransfer»: Wer wären aus Ihrer Sicht mögliche Nutzer Ihres Projekts? Wer könnte davon profitieren?

Als Forscher, der primär mit qualitativen Daten und Analysemethoden arbeitet, versuche ich, die Ergebnisse in die jeweiligen Untersuchungsfelder zurück zu spiegeln, nicht zuletzt um sie dadurch besser zu validieren. Insofern profitieren in erster Linie die Akteure in den genannten drei Untersuchungsfeldern davon. Ein vertieftes Verständnis darüber, wie ein neues Wissensgebiet sich über bestimmte Bereiche hinweg formiert, kann allgemein dazu beitragen, die Schnittstellen und Übergänge von einem Bereich in den nächsten besser zu kennen und zu optimieren.

Big Data ist ein sehr vager Begriff. Können Sie uns erklären, was Big Data für Sie bedeutet?

Zunächst kann man festhalten, dass Big Data häufig als Bezeichnung für «grosse Datenmengen» verwendet wird, wobei oft unklar bleibt, was «gross» in diesem Zusammenhang bedeutet. Es existiert eine Vielzahl unterschiedlicher Definitionen, die bestimmte Aspekte hervorheben und andere weniger und sich nicht selten gar widersprechen. Mir scheint wichtig, dass der Fokus nicht ausschliesslich auf technische Aspekte (wie Volumen, Geschwindigkeit oder Strukturiertheit) der Daten gelegt wird, sondern ebenso auf die sozialen, politischen oder ökonomischen Bedingungen, unter denen sie produziert und bearbeitet werden, sowie die rechtlichen und ethischen Implikationen berücksichtigt, die damit einhergehen. Insofern plädiere ich für eine holistische Perspektive auf das Phänomen.

Meine Forschung zeigt, dass der Begriff in den letzten Jahren an Bedeutung verloren hat. So stiegen bspw. im Arbeitsmarkt Inserate zu Big Data zunächst stark an, sind allerdings nun seit rund zwei Jahren rückläufig. Dies zeigt sich bspw. auch durch eine einfache Suchanfrage bei Google Trends: Vergleicht man die verwandten Suchbegriffe «Big Data», «Data Science», «Artificial Intelligence» und «Machine Learning», die alle in den letzten zehn Jahren eine Konjunktur erfahren haben, wird deutlich, dass der Begriff vor 2012 quasi unbekannt war, dann sehr rasch an Bedeutung gewann und zwischen 2012 und 2017 einen Höchststand erfuhr.

Mittlerweile verzichten Unternehmen und Organisationen aber zunehmend auf den Begriff und verwenden andere Kategorien, wie Data Science oder Machine Learning, nicht zuletzt infolge der zunehmend negativ konnotierten öffentlichen Wahrnehmung von Big Data im Nachgang zu staatlichen und privaten Überwachungs- und Spionageaffären («Big Brother»). Auch an Universitäten und Hochschulen wird der Begriff nach einer anfänglichen Euphorie zunehmend seltener verwendet. Für Studiengangbezeichnungen bspw. haben sich Data Science oder (Applied) Data Analytics durchgesetzt.

Nichtsdestotrotz bietet gerade die Mehrdeutigkeit und Vagheit eines Konzeptes wie Big Data ein verbindendes Element: Es erlaubt Akteuren unterschiedlicher Felder, sich strategisch darauf zu beziehen, und trägt somit zur Koordination von Wissenschaft, Wirtschaft und Politik in einem neuen, noch unterbestimmten Gegenstandsbereich bei.

Zum Projekt

Weiterführende Links