Computergestützte Chemie: die Entdeckung neuer Moleküle

Autor
Prof. Helmut Harbrecht
Universität Basel

Gespräch mit dem Projektleiter des NFP75-Projekts.

Was war das Ziel Ihres Projekts?

Es ist sehr zeitaufwendig und deshalb teuer, neue Materialien für die chemischen Industrie bzw. neue Wirkstoffe für den pharmazeutischen Bereich zu synthetisieren und zu testen. Dieser Aufwand könnte erheblich reduziert werden, wenn es möglich wäre, die Komplexität chemischer Verbindungen zu kontrollieren. Ziel dieses Projekts war es, ein hocheffizientes Verfahren zu entwickeln, mit dem sich die Eigenschaften von chemischen Verbindungen vorhersagen lassen. Effizient bedeutet in diesem Zusammenhang, dass die Eigenschaften einer beliebigen chemischen Verbindung nach einer extrem kurzen Berechnungszeit mit grosser Genauigkeit vorhergesagt werden können.

Resultate?

Die Errungenschaften im Rahmen unseres Projekts bestehen aus drei Teilen. Im ersten Teil haben wir Trainings- und Testdaten erstellt. Alle Datensätze wurden veröffentlicht und für wissenschaftliche Zwecke zur Verfügung gestellt. Im zweiten Teil ging es um Modelle für maschinelles Lernen mit Quanten, die mehrere Fidelitäten von Quantenreferenzdaten mit unterschiedlichem Rechenaufwand und unterschiedlicher Genauigkeit verwenden. Wir konnten die sogenannte Lernkurve erheblich verbessern, was bedeutet, dass unser Quanten-Maschinenlernmodell jetzt viel leistungsfähiger ist. Der dritte Teil bestand aus den mathematischen Grundlagen und der Entwicklung von numerischen Methoden für Big-Data-Probleme. Diese Erkenntnisse tragen dazu bei, maschinelle Lernmodelle weiter zu verbessern.

Hat Ihr Projekt Auswirkungen auf die Gesellschaft und gibt es Empfehlungen?

Da chemische Verbindungen keine Persönlichkeitsrechte besitzen, hat das vorliegende Projekt keine Auswirkungen auf die Gesellschaft. Dennoch hätte es wirtschaftliche Auswirkungen, da die Vorhersage chemischer Verbindungen möglich und viel billiger wird.

Stichwort «Technologietransfer»: Wer könnte Ihrer Meinung nach von diesem Projekt profitieren?

Dieses Projekt gibt experimentellen Chemikerinnen und Chemikern ein neues Instrument an die Hand, das sie bei Identifizierung, Design, Synthese und Charakterisierung neuer und interessanter Verbindungen durch unmittelbare Vorhersagen unterstützen kann. Darüber hinaus führt der Erfolg eines solchen Modells zu einem besseren quantitativen Verständnis der Beziehung zwischen chemischen Strukturen und ihren Eigenschaften. Alle unsere Erkenntnisse und Ergebnisse wurden veröffentlicht und sind somit für alle zugänglich.

Big Data ist ein sehr vager Begriff. Können Sie uns erklären, was Big Data für Sie bedeutet?

Im vorliegenden Projekt entspricht «Big Data» dem Raum aller chemischen Verbindungen. Im Prinzip können wir jede gewünschte Verbindung berechnen, aber es ist unmöglich, alle Verbindungen zu berechnen. Daher haben wir ein Modell für maschinelles Lernen entwickelt, das einen schnellen Zugriff auf alle Verbindungen ermöglicht. Da es so viele chemische Verbindungen gibt, brauchen wir eine effiziente Strategie, um die Trainingssätze auf intelligente Weise auszuwählen. Es stellte sich heraus, dass die Berechnung geeigneter Trainingsdatensätze der Engpass in diesem Projekt ist. Dies ist ein völlig anderer Aufbau als bei anderen Big-Data-Problemen, bei denen bereits eine grosse Menge an Daten zur Verfügung steht, die gelernt werden sollen.

Zum Projekt

Weiterführende Links