Une gigantesque base de données de blocs de construction aidera l’intelligence artificielle à découvrir de nouveaux organocatalyseurs

[ad_1]

Les chercheurs ont construit une base de données publique de 4000 organocatalyseurs dérivés expérimentalement. La base de données contient également plusieurs milliers de fragments moléculaires et de structures combinatoirement enrichies basées sur les entrées dérivées expérimentalement. Il « représente les premières étapes vers une cartographie étendue de l’espace organocatalyseur avec une grande diversité chimique », déclare Clémence Corminboeuf, co-créatrice de la base de données de l’EPFL. Les chercheurs pourront utiliser la base de données du référentiel de structures organiques pour la catalyse, connue sous le nom d’Oscar, «pour former des modèles d’apprentissage automatique et prédire les propriétés de nouveaux catalyseurs», commente Simone Gallarati, membre de l’équipe EPFL. L’équipe espère également que la base de données servira de point de départ aux chimistes organiques qui conçoivent de nouveaux catalyseurs.

Lors de la curation d’Oscar, le groupe Corminboeuf a développé une stratégie générale pour collecter, fragmenter et réassembler les structures afin de générer des milliers de nouveaux composés. Cette approche basée sur les fragments combine différents motifs de catalyseurs existants avec différents lieurs pour créer un large ensemble de structures qui n’ont peut-être pas été étudiées expérimentalement auparavant. Robert Paton, de la Colorado State University, aux États-Unis, et membre du Center for Computer Assisted Synthesis, déclare que « la capacité de prédire ou d’étudier des structures qui n’ont pas encore été synthétisées va être très excitante ».

Graphiques avec des points colorés qui représentent différents catalyseurs

Ces dernières années ont vu un mouvement vers la science ouverte et le partage de données. Alors que certains chercheurs craignent d’être récupérés, la plupart voient les avantages, y compris les informations basées sur des données anciennes et nouvelles, la validation croisée et la transparence. La création de bases de données complètes et personnalisées est essentielle pour développer des outils basés sur les données dans la catalyse et d’autres domaines chimiques. Ainsi, dans le but d’améliorer le partage de données dans la chimie catalytique, les conservateurs d’Oscar ont rendu les structures et les propriétés des catalyseurs accessibles au public sur Materials Cloud. « L’ensemble du domaine va être accéléré par l’accès à des données de haute qualité et je pense que c’est ce que cette équipe a fait », déclare Paton.

Avec Oscar donnant désormais accès aux éléments constitutifs des organocatalyseurs, Corminboeuf déclare qu’ils « prévoient de les utiliser avec des modèles génératifs moléculaires, en particulier des algorithmes génétiques, pour découvrir de nouvelles molécules aux propriétés cibles souhaitables ». «Au cours de ces expériences évolutives, nous pouvons trouver les meilleures combinaisons de fragments qui produisent des organocatalyseurs meilleurs et plus efficaces», ajoute-t-elle.

L’équipe de l’EPFL suggère que leur base de données aidera non seulement à établir des méthodes d’optimisation des réactions basées sur les données en synthèse organique, mais que la stratégie générale utilisée pour la gérer aidera ceux qui construisent des bases de données auparavant indisponibles.

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*