Big Data in Sozialwissenschaften

Big Data in der Praxis: Soziologie, Datenjournalismus und -wissenschaften

Autorin
Prof. Sophie Mützel
Universität Luzern

Gespräch mit der Projektleiterin des NFP75-Projekts «Der Umgang mit Big Data: Methoden für eine Soziologie des 21. Jahrhunderts».

Was sind die Hauptaussagen aus eurem Projekt „Der Umgang mit Big Data: Methoden für eine Soziologie des 21. Jahrhunderts“?

Methoden, Werkzeuge und Fähigkeiten sind zentral für die Entwicklung wissenschaftlicher Disziplinen, seien dies nun neue oder auch bestehende. Das Erlernen und Training von Methoden spielt nicht nur für die Ausbildung kompetenter Praktikerinnen und Praktiker eine entscheidende Rolle, sondern auch für die Entwicklung einer disziplinären und professionellen Identität.

Wie unsere Forschungen zu den Entwicklungen in den Datenwissenschaften und im Datenjournalismus gezeigt haben, sind vielfältige Expertisen und ein Arbeiten über disziplinäre und professionale Grenzen hinweg wichtig für Innovationen. Methoden, Werkzeuge und auch Visualisierungen sind so ein Teil von transversalen Fähigkeiten, die den Austausch und die Weiterentwicklung von Wissensfeldern über diese Grenzen hinweg ermöglichen.

Methoden, Werkzeuge und Fähigkeiten sind wichtig. Sie allein reichen aber nicht aus, um die Herausforderungen und Chancen des digitalen Zeitalters zu bewältigen. Erkenntnisse darüber, wie das Soziale strukturiert ist, wie algorithmisch gewonnene Muster in Daten inhaltlich interpretiert werden können, die z.B. aus sozialen Interaktionen online gewonnen wurden, und wie strukturelle, datensatzimmanente Verzerrungen behoben werden können, können nur in transdisziplinären Ansätzen gewonnen werden, die sozial- und geisteswissenschaftliches Wissen mit technischem zusammenbringen. Wir sehen hier die Soziologie in der wichtigen Funktion der Übersetzerin zwischen Daten, Analysen, Interpretationen und möglichen Auswirkungen.

Welche Implikationen sehen Sie?

Die Datenwissenschaften sind ein interdisziplinäres Feld zwischen Industrie, Wirtschaft, Politik und Wissenschaft, in dem transversale Fähigkeiten gefragt sind. Auch der Datenjournalismus ist stark interdisziplinär und verbindet eine Vielfalt von Expertisen. Daraus ergibt sich folgende Implikation: Die Entstehung von Feldern muss als eine interdisziplinäre Entwicklung gesehen werden, die auf einer Vielfalt von Expertisen und mit Akteuren beruht, die miteinander konkurrieren, aber auch kollaborativ arbeiten können.

Welche Empfehlungen habt ihr?

Aufgrund der sich ändernden Daten und Methoden erfordern die neuen notwendigen Fähigkeiten eine Anpassung der Fachbereiche sowie die Förderung und Verbesserung von transversalen Fähigkeiten. Abhilfe für den Mangel an Daten-, Visualisierungs- und Modellierungskompetenz sowie rechnergestütztem Denken sollten allerdings nicht nur Programme in den Ingenieurwissenschaften und der Informatik entwickeln und vermitteln. Vielmehr erfordern Big Data und die zu ihrer Analyse benötigten Methoden transversale Fähigkeiten, die sich über disziplinäre Grenzen hinweg bewegen. Soziologische Expertise, z.B. zur Strukturierung des Sozialen, zu den Fallstricken von eingeschriebenen Verzerrungen in Datensätzen und zu der Interpretation von identifizierten Mustern, kann hier insbesondere als brückenbauend zwischen den Disziplinen wirken.

Eine weitere Empfehlung ist die weitere Förderung von offenem Wissen und der gemeinsamen Nutzung von Daten. Dabei geht es nicht nur um den offenen Zugang zu Publikationen und der Verfügbarkeit von Datensätzen in Repositorien, sondern um die umfassende Idee der gemeinsamen Nutzung von Wissen für die Wissenschaft. Dem sollten Entscheidungsträgerinnen und Entscheidungsträger besondere Aufmerksamkeit schenken.

Speziell für die Sozialwissenschaften?

Für Sozialwissenschaftlerinnen und Sozialwissenschaftler besteht ein anhaltendes Problem darin, den Zugang zu Social-Media-Daten zu erhalten, wenn sie nicht zu den Forschungsteams grosser Tech-Unternehmen gehören. Twitter bietet Forschenden API-Zugang, Facebook gibt nur sehr begrenzt Datensätze zu ausgewählten Themen für die Forschung frei. Doch insgesamt ist die Zusammenarbeit mit den Unternehmen mühsam. Der Datenzugang hängt oft von privilegierten Positionen innerhalb der Unternehmen oder dem Zugang zu ihnen ab. Einige Sozialwissenschaftlerinnen und Sozialwissenschaftler, die an aktuellen Datensätzen interessiert sind, suchen nach Workarounds in experimentellen Settings oder entwickeln ihre eigene Software, um Online-Daten zu sammeln. Hier könnten Richtlinien den Forschenden helfen, Zugang zu Daten in Archiven und Unternehmen zu erhalten.

Zum Projekt

Die Dissertation «Daten. Wissenschaft. Gesellschaft», mit welcher Philippe Saner den Bereich Datenwissenschaften des NPF75-Projekts abdeckt, wurde mit dem Ulrich-Teichler-Preis 2021 der Gesellschaft für Hochschulforschung (GfHf) ausgezeichnet. GfHf-Vorstandsmitglied und Jury-Vorsitzender Dr. Roland Bloch vom Zentrum für Schul- und Bildungsforschung der Martin-Luther-Universität Halle-Wittenberg würdigte Saners Dissertation an der Online-Preisverleihung mit den folgenden Worten: «Die Arbeit behandelt mit der Entstehung des Feldes der Datenwissenschaften in der Schweiz ein hochaktuelles Thema, das an der Schnittstelle von Hochschul- und Wissenschaftsforschung angesiedelt ist. Philippe Saner tut dies ausgesprochen spannend, sorgfältig und innovativ.»

Weiterführende Links