Aufnahme der Sonne während einer Eruption (Quelle: SDO/AIA)

Sonneneruptionen besser verstehen mit Machine Learning

Autor
Dr. Cédric Huwyler
Fachhochschule Nordwestschweiz

Gespräch mit einem der Verantwortlichen des NPF75-Projekts «Automatische Analyse von Sonneneruptionen».

Welche Ziele verfolgen Sie mit Ihrem Projekt, und was haben Sie bereits realisiert?

Mit unserem Projekt möchten wir ein besseres physikalisches Verständnis für Sonneneruptionen erreichen, indem wir die Mittel von Big Data und Machine Learning in den wissenschaftlichen Prozess einbinden. Dieses Verständnis soll ultimativ dazu dienen, Frühwarnsysteme für Sonneneruptionen zu verbessern, da Sonneneruptionen unsere Navigations- und Kommunikationssysteme sowie Stromnetze stören und im schlimmsten Fall ausfallen lassen können.

Die Methoden des Machine Learning finden seit einigen Jahren vermehrt Verwendung in der Astrophysik und stellen einen interessanten neuen Forschungszweig dar. Trotz seiner vielen Erfolge kann Machine Learning den wissenschaftlichen Prozess jedoch lange noch nicht ersetzen: üblicherweise geben Machine-Learning-Algorithmen nur sehr wenig über ihre «innere Denkweise» preis und wir müssen das System hinter den gemachten Vorhersagen oft als «Black Box» betrachten. Wir arbeiten daher an Verfahren, welche die notwendige Komplexität erreichen, aber gleichzeitig das Zustandekommen ihrer Resultate für die Sonnenphysiker in unserer Gruppe möglichst transparent lassen. Ebenfalls ist es hilfreich, wenn bereits vorhandenes Wissen der Sonnenphysik als a-priori-Information miteinbezogen werden kann. Wir haben bereits zwei solcher Ansätze entwickelt: Der erste kommt von algorithmisch eher einfacher Seite (k-means) [1] und ist daher auch recht einfach zu verstehen. Der zweite Ansatz ist komplexer (Fouriertransformation in neuronalen Netzen) [2], berücksichtigt aber die Tatsache, dass physikalische Vorgänge oft im Frequenzraum einfacher zu verstehen sind.

Worauf sind Sie und das Team besonders stolz?

Mit der Anwendung von Machine Learning auf simultane Spektral- und Bildaufnahmen der Sonne betreten wir Neuland, vor allem auch weil wir die Physik hinter den während Sonneneruptionen beobachteten Spektren selbst noch nicht genau verstehen. Das ist sehr herausfordernd, weil wir dadurch den Algorithmen nur beschränkt Lernbeispiele geben können und uns vor allem auf so genanntes Unsupervised Learning beschränken müssen.

Trotzdem haben wir seit dem Start unseres Projekts im Juli 2017 bereits zwei Artikel publiziert, zwei Vorträge an Sonnenphysik-Konferenzen gehalten, zwei Poster präsentiert und Ende November einen weiteren Vortrag an einer Machine-Learning-Konferenz gehalten. Zusätzlich haben wir eine Funktionsbibliothek in Python entwickelt, die eine effiziente Prozessierung der verwendeten Satellitendaten erlaubt [3]. Wir können bereits ein für die Fachwelt sehr nützliches wissenschaftliches Resultat vorweisen: Unsere Analysen lassen darauf schliessen, dass die zugrundeliegende Physik in der von uns analysierten Schicht der Chromosphäre wohl unabhängig von der Intensitätsskala für alle Sonneneruptionen praktisch gleich ist (die Strahlungsintensität der grössten Eruptionen ist bis zu 10’000 mal grösser als die der kleinsten Eruptionen) [1].

Welche Veränderungen bewirkt Ihr Projekt?

Die Methoden des Machine Learning halten in den letzten Jahren vermehrt Einzug in die Welt der Grundlagenforschung. Das führt zwangsläufig zu Konflikten mit der «traditionellen» Forschungsmethodik, die zu Recht nach wie vor datenbasierte Erkenntnisse theoretisch untermauert haben möchte. Wir möchten diese Konflikte angehen und Methoden entwickeln, die den Forschungsprozess und die Entwicklung entsprechender Modelle unterstützen und von beiden Seiten akzeptierbar sind. Als Beispiel haben wir einen datenbasierten Klassifikationsalgorithmus für die aus Sonneneruptionen beobachteten Emissionsspektren entwickelt [1], der in der Sonnenphysik-Community auf breites Interesse stösst, insbesondere weil unter anderem auch Sonnenphysiker dahinterstecken und die «Revolution» aus den eigenen Reihen kommt.

Was bedeutet das NFP 75 für Sie?

Das NFP 75 ermöglicht uns eine institutionsübergreifende Zusammenarbeit zwischen einer Universität und einer Fachhochschule, die auf eine andere Weise nicht so einfach zu finanzieren wäre. Damit können wir unseren interdisziplinären Ansatz verwirklichen, indem wir Anwendung und Theorie, also Sonnenphysik, Machine Learning, Software und Infrastruktur zusammenbringen. Diese Zusammenarbeit ist einzigartig und gegenseitig sehr stimulierend für uns.

Was würde fehlen, wenn es Ihr Projekt nicht gäbe?

Die Sonnenphysik ist im Besitz einer Unmenge von Daten, vor allem in Form von Bildern. Diese Daten können nicht mehr von einzelnen Menschen durchforstet werden und Algorithmen, die diesen Prozess durchführen können, sind unverzichtbar geworden.

Unser Projekt bringt ein Stück mehr Intelligenz in diese Algorithmen und es ist insbesondere einzigartig, dass wir Algorithmen entwickeln, deren Inneres möglichst erklärbar bleiben soll und die somit nicht nur einfach Vorhersagen machen, sondern auch Wege zur Interpretierbarkeit ihrer Resultate aufzeigen.

Eine Nahaufnahme der Sonne (links), über die wir unsere Klassifikation von beobachteten UV-Spektren in der Chromosphäre (rechts) als farbige Punkte gelegt haben.

Zum Projekt

Weiterführende Links