Big Data: Anwendungen

Big-Data-Anwendungen eröffnen Chancen in zahlreichen Bereichen. Ihre Entwicklung ist jedoch mit erheblichem Aufwand verbunden: dem Aufbau von Partnerschaften mit Interessengruppen, der technischen und rechtlichen Sicherung des Zugangs zu Daten, der Entwicklung nützlicher Analysemodelle und der Benutzendenvalidierung.

Das NFP 75 hat Anwendungen auf der Grundlage von Big Data in Bereichen wie Gesundheit, Nachhaltigkeit, Sozioökonomie und wissenschaftliche Forschung hervorgebracht. Dies stellt nur einen kleinen Teil der Bereiche dar, die Big-Data-Anwendungen erforschen oder mit ihnen arbeiten. Sie reichen von traditionellen datenintensiven Bereichen wie Bankwesen, Marketing und Gesundheit bis hin zu neuen Gebieten wie Landwirtschaft, Journalismus oder politischer Entscheidungsfindung.

Die vom Programm geförderten Projekte haben bestehende Methodologien verbessert, neue, auf bereichsspezifische Big-Data-Anwendungen ausgerichtete Methoden, entwickelt und den potenziellen Mehrwert für Gesellschaft und Wirtschaft hervorgehoben. Beispiele sind die Entwicklung von Strategien für die personalisierte Medizin, eine intelligentere Verkehrsplanung, der integrierte Einsatz erneuerbarer Energien und eine klarere Einschätzung der Auswirkungen sozioökonomischer Massnahmen.

Die verschiedenen Anwendungen des NFP 75 haben unterschiedliche Entwicklungsstadien erreicht, von ersten Modellen über Prototypen bis hin zu vollwertigen Systemen. Diese Vielfalt spiegelt die Möglichkeiten und Herausforderungen bei der Entwicklung praktischer Big-Data-Anwendungen im Allgemeinen wider.

Gesundheits­versorgung verbessern und personalisieren

Zahlreiche neue Ansätze sollen die Gesundheitsversorgung auf die spezifischen Merkmale und Bedürfnisse von Einzelpersonen und Bevölkerungsgruppen zuschneiden. Big-Data-Anwendungen können potenziell einen erheblichen Einfluss auf die Gesundheitsforschung, -bildung und -versorgung haben und über medizinische Einrichtungen hinaus bis in Wohnungen der Menschen reichen.

Förderung der Nachhaltigkeit

Der Umbau zu nachhaltigen Gesellschaften erfordert die Optimierung der Wechselwirkungen zwischen den zahlreichen Komponenten von Energie-, Transport-, Versorgungs- oder Lebensmittelsystemen.

Besseres Verständnis sozioökonomischer Wechselwirkungen

Die Tatsache, dass immer mehr Daten gesammelt werden, bietet viele Möglichkeiten für neue Anwendungen, die dabei helfen, politische Massnahmen zu evaluieren, zu orientieren und möglicherweise zu verbessern.

Beschleunigung der Forschung

Big Data fördert auch Innovation, indem es in der Grundlagenforschung eine immer wichtigere Rolle spielt. Dies zeigt sich vor allem in sehr grossen internationalen Kooperationen wie dem CERN in Genf, in Astronomieprojekten, der Erdbeobachtung mittels Satelliten oder der Genomik.

Kernaussagen

Vorsicht vor dem Hype

Die Berichterstattung in den Medien, durch Industrie und Think-Tanks kann den Eindruck erwecken, dass Big Data ein magisches Werkzeug sei: Finden Sie einfach die Daten, fügen Sie ein wenig maschinelles Lernen hinzu, trainieren Sie die Algorithmen, erstellen Sie eine Anwendung und schon sind Sie bereit, Geschäftspraktiken und ganze Branchen völlig zu verändern. Diese allzu simple Sichtweise übersieht zahlreiche Hürden konzeptioneller, technischer, rechtlicher, organisatorischer und kollaborativer Art.

Die Entwicklung einer Big-Data-Anwendung erfordert einen immensen Aufwand in vielen Schritten: den Aufbau von Partnerschaften mit Interessengruppen; das Recherchieren und Identifizieren geeigneter Datenquellen; das Bewerten der Datenqualität, ihre sichere Speicherung; die Vorbereitung der Daten für die Analyse; geeignete Algorithmen finden und anpassen oder neue entwickeln; ihre Performanz und Zuverlässigkeit prüfen, Schnittstellen zur Verwendung der Ergebnisse schaffen; und schliesslich die neue Anwendung in bestehende Arbeitsabläufe integrieren.

Immer wenn Big Data übermässig gefeiert wird, werden sehr tiefgehende, wenn auch scheinbar offensichtliche Fragen verschleiert. Existieren die Daten überhaupt? Sind sie zugänglich? Sind sie mit Metadaten richtig beschrieben? Können die Privatsphäre gewahrt und die Vorschriften eingehalten werden? Brauchen die Endnutzer:innen die beabsichtigte Anwendung tatsächlich? Solche Fragen müssen von Anfang an berücksichtigt werden, um den Umfang der anstehenden Arbeit realistisch einschätzen zu können.

Ist Ihr Bereich reif für Big Data?

Big-Data-Anwendungen können relativ effizient entwickelt werden, wenn sie auf bestehenden Prototypen aufbauen (Potenzial erneuerbarer Energien, Optimierung der Verkehrssysteme) oder wenn qualitativ hochwertige und standardisierte Daten vorliegen,- wie in den Bereichen Wetter, Kartographie und Biologie (Sonneneruptionen, Big Data Genetik). In den Fällen können sich Datenwissenschaftler:innen hauptsächlich auf technische Fragen konzentrieren, z.B. auf den Aufbau einer Pipeline für den Datenzugriff in Echtzeit, die Entwicklung von Algorithmen oder auf die Schaffung benutzerfreundlicher interaktiver Schnittstellen. Die Projekte des NFP 75 erbrachten eine Reihe wichtiger Fortschritte bei der Konzeption, Umsetzung und Bewertung praktischer Ansätze für das Data Engineering, einschliesslich Datenmanagement, Analytik, Visualisierung, Bewertung, Prüfung, Integration und Mining.

Umgekehrt ist es viel schwieriger, Big-Data-Anwendungen in Bereichen zu entwickeln, die weniger digitalisiert sind, denen eine Datenkultur fehlt und die dem Austausch von Daten abgeneigt oder darin ungeübt sind (Pig Data, Mapping globaler Innovation). In solchen Fällen ist ein erheblicher Zeit- und Arbeitsaufwand erforderlich, um nicht-technische Hürden zu überwinden, z. B. den Aufbau von Partnerschaften zwischen Akteur:innen, die nicht an eine gemeinsame Nutzung von Daten gewöhnt sind. Die Verfügbarkeit und die Qualität der Daten müssen frühzeitig bewertet werden, was möglicherweise zu einem Überdenken des Anwendungsbereichs führt.

Big Data verlangt nach Interdisziplinarität

Die Verwaltung von Datensätzen im Petabyte-Massstab erfordert viel Zeit, Arbeitskraft und gemeinsame Anstrengungen, um zahlreiche technische und sozialrechtliche Herausforderungen zu lösen. Der Aufbau einer Anwendung, die etwas bewirkt, erfordert in der Regel einen interdisziplinären Ansatz, bei dem sich die verschiedenen Interessengruppen frühzeitig mit allen potenziellen Problemen und Fragen befassen, einschliesslich der Frage, wie die geplante Lösung von den Endnutzer:innen verwendet werden soll (Pig Data, Hochwassererkennung). Wissenschaftler:innen, Expert:innen aus den entsprechenden Fachgebieten und Partner:innen aus Industrie oder Verwaltung müssen zusammenarbeiten, um sicherzustellen, dass qualitativ hochwertige Daten erfasst und gemeinsam genutzt werden und dass die Anwendungen den Bedürfnissen der vorgesehenen Nutzer:innen entsprechen. Die Forschenden des NFP 75 haben neue Wege einer effektiven Interaktion mit verschiedenen Interessengruppen erforscht. Die frühzeitige Einbeziehung von Nutzer:innen verbessert das Design von Anwendungen (Hochwassererkennung). Diese Art von Erfahrung stellt sicher, dass die akademische Forschung bei Bedarf in der Lage ist, schnell praktische Anwendungen zu entwickeln.

Die Welt ist unordentlicher als Trainingsdaten

Algorithmen maschinellen Lernens können mit potenziell schwerwiegenden Folgen versagen, wenn es beispielsweise um Gesundheit oder autonomes Fahren geht. Dies ist ein Problem des überwachten Lernens, wenn die Algorithmen mit unvollständigen, ungenauen oder zu homogenen Trainingsdaten gefüttert werden. Eine Hinwendung zu sparsamerem unüberwachtem Lernen könnte zu robusteren Systemen führen (Hochwassererkennung).

Von Anfang an auf den Datenschutz achten

Fragen im Zusammenhang mit Datenschutz und Regulierung müssen sorgfältig behandelt werden, insbesondere bedürfen sie der Hilfe von Rechtsexpert:innen. Privacy-by-Design-Ansätze sollten so früh wie möglich in Betracht gezogen und umgesetzt werden. Dies erfordert eine sorgfältige Berücksichtigung übergreifender Prinzipien wie Zweckbindung, Transparenz und Verhältnismässigkeit, sowie Datenminimierung, Datengenauigkeit und Datenschutz (Intensivstationen, Digitale Zwillingsstädte). Der Austausch von Erfahrungen innerhalb und zwischen verschiedenen Bereichen hilft bei der Entwicklung von Best Practices.