Une analyse informatique révèle que de nombreuses séquences répétitives sont partagées entre les protéines et sont similaires dans les espèces, des bactéries aux humains


  • FrançaisFrançais



  • Environ 70 % de toutes les protéines humaines comprennent au moins une séquence constituée d’un seul acide aminé répété plusieurs fois, avec quelques autres acides aminés saupoudrés. Ces « régions de faible complexité » se retrouvent également dans la plupart des autres organismes.

    Les protéines qui contiennent ces séquences ont de nombreuses fonctions différentes, mais les biologistes du MIT ont maintenant trouvé un moyen de les identifier et de les étudier en tant que groupe unifié. Leur technique leur permet d’analyser les similitudes et les différences entre les LCR de différentes espèces, et les aide à déterminer les fonctions de ces séquences et les protéines dans lesquelles elles se trouvent.

    Grâce à leur technique, les chercheurs ont analysé toutes les protéines présentes dans huit espèces différentes, des bactéries aux humains. Ils ont découvert que même si les LCR peuvent varier entre les protéines et les espèces, ils partagent souvent un rôle similaire : aider la protéine dans laquelle ils se trouvent à rejoindre un assemblage à plus grande échelle tel que le nucléole, un organite présent dans presque toutes les cellules humaines.

    « Au lieu d’examiner des LCR spécifiques et leurs fonctions, qui peuvent sembler distinctes parce qu’elles sont impliquées dans des processus différents, notre approche plus large nous permet de voir des similitudes entre leurs propriétés, ce qui suggère que les fonctions des LCR ne sont peut-être pas si disparates après tout. « , déclare Byron Lee, un étudiant diplômé du MIT.

    Les chercheurs ont également trouvé des différences entre les LCR de différentes espèces et ont montré que ces séquences LCR spécifiques à l’espèce correspondent à des fonctions spécifiques à l’espèce, telles que la formation de parois cellulaires végétales.

    Lee et l’étudiant diplômé Nima Jaberi-Lashkari sont les principaux auteurs de l’étude, qui paraît aujourd’hui dans eVie. Eliezer Calo, professeur adjoint de biologie au MIT, est l’auteur principal de l’article.

    Étude à grande échelle

    Des recherches antérieures ont révélé que les LCR sont impliqués dans une variété de processus cellulaires, y compris l’adhésion cellulaire et la liaison à l’ADN. Ces LCR sont souvent riches en un seul acide aminé tel que l’alanine, la lysine ou l’acide glutamique.

    Trouver ces séquences puis étudier leurs fonctions individuellement est un processus qui prend du temps, c’est pourquoi l’équipe du MIT a décidé d’utiliser la bioinformatique – une approche qui utilise des méthodes informatiques pour analyser de grands ensembles de données biologiques – pour les évaluer en tant que groupe plus large.

    « Ce que nous voulions faire, c’est prendre du recul et au lieu de regarder les LCR individuellement, essayer de les examiner tous et voir si nous pouvions observer certains modèles à plus grande échelle qui pourraient nous aider à comprendre ce que le ceux qui ont des fonctions assignées font, et nous aident également à en savoir un peu plus sur ce que font ceux qui n’ont pas de fonctions assignées », dit Jaberi-Lashkari.

    Pour ce faire, les chercheurs ont utilisé une technique appelée matrice dotplot, qui est un moyen de représenter visuellement des séquences d’acides aminés, pour générer des images de chaque protéine étudiée. Ils ont ensuite utilisé des méthodes informatiques de traitement d’images pour comparer des milliers de ces matrices en même temps.

    En utilisant cette technique, les chercheurs ont pu catégoriser les LCR en fonction des acides aminés les plus fréquemment répétés dans le LCR. Ils ont également regroupé les protéines contenant la LCR en fonction du nombre de copies de chaque type de LCR trouvé dans la protéine. L’analyse de ces traits a aidé les chercheurs à en savoir plus sur les fonctions de ces LCR.

    À titre de démonstration, les chercheurs ont choisi une protéine humaine, connue sous le nom de RPA43, qui possède trois LCR riches en lysine. Cette protéine est l’une des nombreuses sous-unités qui composent une enzyme appelée ARN polymérase 1, qui synthétise l’ARN ribosomique. Les chercheurs ont découvert que le nombre de copies de LCR riches en lysine est important pour aider la protéine à s’intégrer dans le nucléole, l’organite responsable de la synthèse des ribosomes.

    Assemblages biologiques

    Dans une comparaison des protéines trouvées dans huit espèces différentes, les chercheurs ont découvert que certains types de LCR sont hautement conservés entre les espèces, ce qui signifie que les séquences ont très peu changé au cours des échelles de temps évolutives. Ces séquences ont tendance à se trouver dans des protéines et des structures cellulaires qui sont également hautement conservées, comme le nucléole.

    « Ces séquences semblent être importantes pour l’assemblage de certaines parties du nucléole », explique Lee. « Certains des principes connus pour être importants pour l’assemblage d’ordre supérieur semblent être en jeu car le nombre de copies, qui pourrait contrôler le nombre d’interactions qu’une protéine peut faire, est important pour que la protéine s’intègre dans ce compartiment. »

    Les chercheurs ont également trouvé des différences entre les LCR observés dans deux types différents de protéines impliquées dans l’assemblage du nucléole. Ils ont découvert qu’une protéine nucléolaire connue sous le nom de TCOF contient de nombreux LCR riches en glutamine qui peuvent aider à échafauder la formation d’assemblages, tandis que les protéines nucléolaires avec seulement quelques-uns de ces LCR riches en acide glutamique pourraient être recrutées comme clients (protéines qui interagissent avec l’échafaudage ).

    Une autre structure qui semble avoir de nombreux LCR conservés est le speckle nucléaire, qui se trouve à l’intérieur du noyau cellulaire. Les chercheurs ont également trouvé de nombreuses similitudes entre les LCR qui sont impliqués dans la formation d’assemblages à plus grande échelle tels que la matrice extracellulaire, un réseau de molécules qui fournit un support structurel aux cellules des plantes et des animaux.

    L’équipe de recherche a également trouvé des exemples de structures avec des LCR qui semblent avoir divergé entre les espèces. Par exemple, les plantes ont des séquences LCR distinctives dans les protéines qu’elles utilisent pour échafauder leurs parois cellulaires, et ces LCR ne sont pas observées dans d’autres types d’organismes.

    Les chercheurs prévoient maintenant d’étendre leur analyse LCR à d’autres espèces.

    « Il y a tellement de choses à explorer, car nous pouvons étendre cette carte à pratiquement toutes les espèces », déclare Lee. « Cela nous donne l’opportunité et le cadre pour identifier de nouveaux assemblages biologiques. »

    La recherche a été financée par le National Institute of General Medical Sciences, le National Cancer Institute, le Ludwig Center du MIT, une subvention de formation prédoctorale des National Institutes of Health et les Pew Charitable Trusts.

    N'oubliez pas de voter pour cet article !
    1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (No Ratings Yet)
    Loading...
    mm

    La Rédaction

    L'équipe rédactionnelle

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.