BioSODA: An intuitive search function for bioinformatics databases

BioSODA: Eine intuitive Suchfunktion für Bioinformatik-Datenbanken

Autor
Prof. Kurt Stockinger
Zürcher Hochschule für Angewandte Wissenschaften

Gespräch mit dem Verantwortlichen des NPF75-Projekts «BioSODA: Eine intuitive Suchfunktion für Bioinformatikdatenbanken».

Welche Ziele verfolgen Sie mit Ihrem Projekt, und was haben Sie bereits realisiert?

Komplexe Bioinformatikdatenbanken enthalten enormes Wissen, das nur mit tiefgreifendem technischen Know-how abgerufen werden kann. Das Ziel dieses Projekts ist die Entwicklung einer intuitiven, einfachen Suchfunktion, mit der neue Korrelationen in den verfügbaren Daten identifiziert werden können. Die Grundidee besteht darin, eine natürlichsprachige Anfrage eines Wissenschaftlers automatisch in eine Datenbankabfragesprache zu übersetzen und aussagekräftige Ergebnisse zu liefern.

Wir haben bereits drei verschiedene Bioinformatikdatenbanken integriert und eine Reihe von Beispielabfragen entwickelt, die Wissenschaftler als Grundlage für die Erkundung der Datenbanken nutzen können.

Worauf sind Sie und Ihr Team besonders stolz?

Das Projekt ist sehr komplex, da die Anwendung ein breites Spektrum von Disziplinen von der Biologie bis zur Informatik abdeckt. Es ist uns gelungen, einen erfolgreichen Prototyp der datenbankübergreifenden Suche zu erstellen, der unsere Stärken in beiden Bereichen nutzt und sinnvolle biologische Fragen in Form von Ontologien und strukturierten, datenbankübergreifenden Schemaabfragen definiert.

Welche Veränderungen bewirkt Ihr Projekt?

Im derzeitigen Stand ist die Abfrage von Bioinformatikdatenbanken für nichttechnische Experten sehr schwierig und auf Grund ihrer Vielzahl in jedem Fall zeitaufwendig. Unser Projekt wird einen sehr wichtigen Beitrag leisten, damit Wissenschaftler diese Daten ohne technische Hürden leicht abfragen können.

Was bedeutet das NFP 75 für Sie?

NFP 75 ist eine sehr gute Gelegenheit, interdisziplinäre, angewandte Forschung durchzuführen, die grosse potentielle Auswirkungen auf die Informatik, die Biologie und verwandte Gebiete hat.

Was würde fehlen, wenn es Ihr Projekt nicht gäbe?

Die grossen Mengen von Bioinformatikdatenbanken nicht effizient abfragen zu können, ist so, als würde man ein Flugzeug kaufen und es nicht fliegen können, da die Piloten nicht verstehen, wie man mit der Technologie des Flugzeugs umgeht. Unser Ziel ist es, diese Situation zu vermeiden und so vielen Wissenschaftlern wie möglich zu ermöglichen, «ihre biologischen Flugzeuge zu fliegen».

In beiden Fällen sind die Sicherheitslücken sowohl für die Betreiber der sozialen Netzwerke als auch für die angemeldeten Nutzerinnen und Nutzer und nicht zuletzt für viele Big-Data-Anwender gravierend.

[1] de Farias, T. M., Chiba, H., & Fernández-Breis, J. T. Leveraging logical rules for efficacious representation of large orthology datasets. In Proceedings of the 10th International Semantic Web Applications and Tools for Healthcare and Life Sciences (SWAT4HCLS) Conference, available online at http://ceur-ws.org/Vol-2042/paper36.pdf, last accessed: 2018-09-20 , 2017.

[2] Sima, A. C., Stockinger, K., de Farias, T. M., Gil, M., Semantic Integration and Enrichment of Heterogeneous Biological Databases, To appear in Evolutionary Genomics: Statistical and Computational Methods, 2nd Edition, Springer.

Zum Projekt

Weiterführende Links