Chimie computationnelle: découverte de nouvelles molécules

Auteur
Prof. Helmut Harbrecht
Université de Bâle

Entretien avec le responsable du projet PNR 75.

Quel était l’objectif de votre projet?

La synthèse et le test de nouveaux matériaux dans l’industrie chimique ou de nouveaux principes actifs dans le secteur pharmaceutique prennent beaucoup de temps et coûtent cher. Maîtriser la complexité des liaisons chimiques permettrait de réduire sensiblement ces dépenses. Le projet visait à développer un procédé très efficace permettant de prédire les propriétés des liaisons chimiques. Dans ce contexte, «efficace» signifie que les propriétés de n’importe quelle liaison chimique peuvent être prédites avec une grande précision après un temps de calcul extrêmement court.

Quels résultats ont été obtenus?

Trois parties constituaient les achèvements dans le cadre de notre projet. Dans la première partie, nous avons créé des données de formation et de test. Tous les ensembles de données ont été publiés et mis à disposition à des fins scientifiques. La deuxième partie concernait les modèles d’apprentissage automatique quantique qui utilisent des données de référence quantiques à fidélité multiple et à coût et précision de calcul variables. Nous avons pu améliorer considérablement la «courbe d’apprentissage», ce qui signifie que notre modèle d’apprentissage automatique quantique est désormais plus performant. La troisième partie était consacrée aux fondements mathématiques et au développement de méthodes numériques pour les problèmes de Big Data. Ces découvertes contribuent à améliorer encore les modèles d’apprentissage automatique.

Votre projet a-t-il un impact sur la société et propose-t-il des recommandations?

Comme les liaisons chimiques ne sont pas liées aux droits de la personnalité, le présent projet n’a aucun impact sur la société. Néanmoins, il pourrait avoir un impact économique, car la prévision des liaisons chimiques devient possible et beaucoup moins chère.

Mot-clé «Transfert de technologie»: Selon vous, qui sont les utilisateurs potentiels de votre projet? Qui pourrait en bénéficier?

Ce projet fournit aux chimistes expérimentaux un nouvel outil qui pourra les aider, grâce à des prévisions instantanées, à identifier, concevoir, synthétiser et caractériser de nouveaux composés intéressants. De plus, le succès d’un tel modèle implique une meilleure compréhension quantitative des relations entre les structures chimiques et leurs propriétés. Toutes nos conclusions et tous nos résultats ont été publiés et sont donc accessibles à tous.

La notion de «Big Data» est très vague. Pouvez-vous nous expliquer ce qu’elle signifie pour vous?

Dans le présent projet, la notion de «Big Data» correspond à l’espace des liaisons chimiques. En principe, nous pouvons calculer chaque connexion souhaitée, mais il est impossible de calculer toutes les connexions. Nous avons donc développé un modèle d’apprentissage automatique permettant d’accéder rapidement à toutes les connexions. Comme il existe de nombreuses liaisons chimiques, nous avions besoin d’une stratégie efficace pour choisir intelligemment les ensembles d’apprentissage. Il s’est avéré que le calcul d’ensembles de données d’apprentissage appropriés était le goulot d’étranglement de ce projet. Il s’agit d’une structure totalement différente de celle utilisée pour d’autres problèmes de Big Data où l’on dispose déjà d’une grande quantité de données qu’il faut apprendre.

A propos du projet

Liens supplémentaires