Ces protéines accordables pourraient être utilisées pour créer de nouveaux matériaux avec des propriétés mécaniques spécifiques, comme la ténacité ou la flexibilité


  • FrançaisFrançais


  • Suivez-nous sur notre page Facebook et notre canal Telegram


    Les chercheurs du MIT utilisent l’intelligence artificielle pour concevoir de nouvelles protéines qui vont au-delà de celles trouvées dans la nature.

    Ils ont développé des algorithmes d’apprentissage automatique qui peuvent générer des protéines avec des caractéristiques structurelles spécifiques, qui pourraient être utilisées pour fabriquer des matériaux ayant certaines propriétés mécaniques, comme la rigidité ou l’élasticité. De tels matériaux d’inspiration biologique pourraient potentiellement remplacer des matériaux fabriqués à partir de pétrole ou de céramique, mais avec une empreinte carbone beaucoup plus faible.

    Les chercheurs du MIT, du MIT-IBM Watson AI Lab et de l’Université Tufts ont utilisé un modèle génératif, qui est le même type d’architecture de modèle d’apprentissage automatique utilisé dans les systèmes d’IA comme DALL-E 2. Mais au lieu de l’utiliser pour générer des images à partir d’invites en langage naturel, comme le fait DALL-E 2, ils ont adapté l’architecture du modèle afin qu’il puisse prédire les séquences d’acides aminés des protéines qui atteignent des objectifs structurels spécifiques.

    Dans un article à paraître dans Chimie, les chercheurs démontrent comment ces modèles peuvent générer des protéines réalistes, mais nouvelles. Les modèles, qui apprennent les relations biochimiques qui contrôlent la formation des protéines, peuvent produire de nouvelles protéines qui pourraient permettre des applications uniques, explique l’auteur principal Markus Buehler, professeur d’ingénierie Jerry McAfee et professeur de génie civil et environnemental et de génie mécanique.

    Par exemple, cet outil pourrait être utilisé pour développer des revêtements alimentaires inspirés des protéines, qui pourraient garder les produits frais plus longtemps tout en étant sans danger pour les humains. Et les modèles peuvent générer des millions de protéines en quelques jours, offrant rapidement aux scientifiques un portefeuille de nouvelles idées à explorer, ajoute-t-il.

    “Lorsque vous pensez à concevoir des protéines que la nature n’a pas encore découvertes, il s’agit d’un espace de conception si vaste que vous ne pouvez pas simplement le trier avec un crayon et du papier. Vous devez comprendre le langage de la vie, la façon dont les acides aminés sont codés par l’ADN, puis s’assemblent pour former des structures protéiques. Avant l’apprentissage en profondeur, nous ne pouvions vraiment pas faire cela », explique Buehler, qui est également membre du MIT-IBM Watson AI Lab.

    Rejoindre Buehler sur le papier sont l’auteur principal Bo Ni, un post-doc au Laboratoire de Buehler pour la mécanique atomistique et moléculaire; et David Kaplan, professeur d’ingénierie de la famille Stern et professeur de bio-ingénierie à Tufts.

    Adapter de nouveaux outils à la tâche

    Les protéines sont formées par des chaînes d’acides aminés, pliées ensemble en motifs 3D. La séquence d’acides aminés détermine les propriétés mécaniques de la protéine. Alors que les scientifiques ont identifié des milliers de protéines créées par l’évolution, ils estiment qu’un nombre énorme de séquences d’acides aminés restent à découvrir.

    Pour rationaliser la découverte de protéines, les chercheurs ont récemment développé des modèles d’apprentissage en profondeur capables de prédire la structure 3D d’une protéine pour un ensemble de séquences d’acides aminés. Mais le problème inverse – prédire une séquence de structures d’acides aminés qui répondent aux objectifs de conception – s’est avéré encore plus difficile.

    Un nouvel avènement de l’apprentissage automatique a permis à Buehler et ses collègues de relever ce défi épineux : les modèles de diffusion basés sur l’attention.

    Les modèles basés sur l’attention peuvent apprendre des relations à très longue portée, ce qui est essentiel pour développer des protéines, car une mutation dans une longue séquence d’acides aminés peut faire ou défaire toute la conception, explique Buehler. Un modèle de diffusion apprend à générer de nouvelles données grâce à un processus qui consiste à ajouter du bruit aux données d’apprentissage, puis à apprendre à récupérer les données en supprimant le bruit. Ils sont souvent plus efficaces que d’autres modèles pour générer des données réalistes de haute qualité qui peuvent être conditionnées pour répondre à un ensemble d’objectifs cibles afin de répondre à une demande de conception.

    Les chercheurs ont utilisé cette architecture pour construire deux modèles d’apprentissage automatique qui peuvent prédire une variété de nouvelles séquences d’acides aminés qui forment des protéines qui répondent aux objectifs de conception structurelle.

    “Dans l’industrie biomédicale, vous ne voudrez peut-être pas d’une protéine totalement inconnue car vous ne connaissez pas ses propriétés. Mais dans certaines applications, vous voudrez peut-être une toute nouvelle protéine similaire à celle que l’on trouve dans la nature, mais qui ne quelque chose de différent. Nous pouvons générer un spectre avec ces modèles, que nous contrôlons en réglant certains boutons », explique Buehler.

    Les modèles de repliement communs des acides aminés, connus sous le nom de structures secondaires, produisent différentes propriétés mécaniques. Par exemple, les protéines avec des structures en hélice alpha produisent des matériaux extensibles tandis que celles avec des structures en feuillets bêta produisent des matériaux rigides. La combinaison d’hélices alpha et de feuilles bêta peut créer des matériaux extensibles et solides, comme la soie.

    Les chercheurs ont développé deux modèles, l’un qui opère sur les propriétés structurelles globales de la protéine et l’autre qui opère au niveau des acides aminés. Les deux modèles fonctionnent en combinant ces structures d’acides aminés pour générer des protéines. Pour le modèle qui fonctionne sur les propriétés structurelles globales, un utilisateur entre un pourcentage souhaité de différentes structures (40 % d’hélice alpha et 60 % de feuille bêta, par exemple). Ensuite, le modèle génère des séquences qui répondent à ces objectifs. Pour le deuxième modèle, le scientifique spécifie également l’ordre des structures d’acides aminés, ce qui donne un contrôle beaucoup plus fin.

    Les modèles sont connectés à un algorithme qui prédit le repliement des protéines, que les chercheurs utilisent pour déterminer la structure 3D de la protéine. Ensuite, ils calculent ses propriétés résultantes et les comparent aux spécifications de conception.

    Des conceptions réalistes mais novatrices

    Ils ont testé leurs modèles en comparant les nouvelles protéines à des protéines connues qui ont des propriétés structurelles similaires. Beaucoup avaient un certain chevauchement avec des séquences d’acides aminés existantes, environ 50 à 60 % dans la plupart des cas, mais aussi des séquences entièrement nouvelles. Le niveau de similitude suggère que bon nombre des protéines générées sont synthétisables, ajoute Buehler.

    Pour s’assurer que les protéines prédites sont raisonnables, les chercheurs ont essayé de tromper les modèles en saisissant des cibles de conception physiquement impossibles. Ils ont été impressionnés de voir qu’au lieu de produire des protéines improbables, les modèles ont généré la solution synthétisable la plus proche.

    “L’algorithme d’apprentissage peut détecter les relations cachées dans la nature. Cela nous donne la confiance nécessaire pour dire que tout ce qui ressort de notre modèle est très probablement réaliste”, déclare Ni.

    Ensuite, les chercheurs prévoient de valider expérimentalement certaines des nouvelles conceptions de protéines en les fabriquant en laboratoire. Ils souhaitent également continuer à augmenter et à affiner les modèles afin de pouvoir développer des séquences d’acides aminés répondant à davantage de critères, tels que les fonctions biologiques.

    “Pour les applications qui nous intéressent, comme la durabilité, la médecine, l’alimentation, la santé et la conception de matériaux, nous allons devoir aller au-delà de ce que la nature a fait. Voici un nouvel outil de conception que nous pouvons utiliser pour créer des solutions potentielles qui pourrait nous aider à résoudre certains des problèmes de société les plus urgents auxquels nous sommes confrontés », déclare Buehler.

    Cette recherche a été soutenue, en partie, par le MIT-IBM Watson AI Lab, le département américain de l’agriculture, le département américain de l’énergie, le bureau de recherche de l’armée, les instituts nationaux de la santé et le bureau de la recherche navale.

    Houssen Moshinaly

    Rédacteur en chef d'Actualité Houssenia Writing. Rédacteur web depuis 2009.

    Blogueur et essayiste, j'ai écrit 9 livres sur différents sujets comme la corruption en science, les singularités technologiques ou encore des fictions. Je propose aujourd'hui des analyses politiques et géopolitiques sur le nouveau monde qui arrive. J'ai une formation de rédaction web et une longue carrière de prolétaire.

    Pour me contacter personnellement :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *