Les scientifiques utilisent les mathématiques pour augmenter la précision des résultats d’analyse de données pour la recherche biomédicale


  • FrançaisFrançais



  • Kyoto-Depuis que les scientifiques ont cartographié pour la première fois le génome humain complet, l’attention s’est maintenant tournée vers la question de savoir comment les cellules utilisent cette copie maîtresse des instructions génétiques. On sait que lorsque les gènes sont activés, des parties des séquences d’ADN du noyau cellulaire sont copiées dans des molécules en forme de chaîne plus courtes, l’ARN, qui délivrent les molécules essentielles à la survie et aux fonctions spécifiques aux cellules.

    Comprendre les profils des ARN dans une cellule peut montrer quels gènes sont actifs et permettre aux chercheurs de spéculer sur ce que fait la cellule. La technologie de mesure de l’ARN par séquenceur d’ADN massivement parallèle, le RNA-sequencing, est devenue une technique standard au cours de la dernière décennie. Plus récemment, des progrès technologiques rapides permettent le séquençage d’ARN au niveau d’une seule cellule à partir de milliers de cellules en parallèle, accélérant les progrès des sciences biomédicales. Mais la quantification des ARN à partir d’un si petit matériau pose de grands défis techniques. Même avec un équipement de pointe, les données produites à partir des données de séquençage d’ARN unicellulaire contiennent d’importantes erreurs de détection, y compris ce que l’on appelle «l’effet d’abandon». De plus, même de petites erreurs dans les calculs pour un grand nombre de gènes peuvent rapidement s’additionner, de sorte que toute information utile est perdue parmi le bruit du signal.

    Maintenant, une équipe de l’Institut universitaire de Kyoto pour l’étude avancée de la biologie humaine (WPI-ASHBi) a développé une nouvelle méthode mathématique qui peut éliminer le bruit et ainsi permettre l’extraction de signaux clairs à partir de données de séquençage d’ARN unicellulaire. La nouvelle méthode réduit avec succès le bruit d’échantillonnage aléatoire dans les données pour permettre une compréhension précise et complète de l’activité d’une cellule. La recherche a récemment été publiée dans la revue Alliance des sciences de la vie.

    L’auteur principal de l’article, Yusuke Imoto de l’ASHBi, explique : « Chaque gène représente une dimension différente dans les données de séquençage de l’ARN, ce qui signifie que des dizaines de milliers de dimensions doivent être collectées sur plusieurs cellules et analysées. Même le moindre bruit dans une dimension peut avoir un impact majeur sur les analyses de données en aval, de sorte que des signaux potentiellement importants sont perdus. C’est pourquoi nous appelons cela la « malédiction de la dimensionnalité ».

    Pour briser la malédiction de la dimensionnalité, l’équipe de Kyoto a développé une nouvelle méthode de réduction du bruit, RECODE – qui signifie « résolution de la malédiction de la dimensionnalité » – pour supprimer le bruit d’échantillonnage aléatoire des données de séquençage d’ARN unicellulaire. RECODE applique des théories statistiques de haute dimension pour obtenir des résultats précis, même pour les gènes exprimés à des niveaux très bas.

    Tout d’abord, l’équipe a testé sa méthode sur les données d’une population cellulaire largement bien étudiée, le sang périphérique humain. Ils ont confirmé que RECODE supprime avec succès la malédiction de la dimensionnalité pour révéler des modèles d’expression pour des gènes individuels proches de leurs valeurs attendues.

    Ensuite, comparé à d’autres méthodes d’analyse de pointe, RECODE a surpassé la concurrence en donnant des représentations beaucoup plus fidèles de l’activation des gènes. De plus, RECODE est plus simple à utiliser que les autres méthodes, sans s’appuyer sur des paramètres ni utiliser l’apprentissage automatique pour que les calculs fonctionnent.

    Enfin, l’équipe a testé RECODE sur un ensemble de données complexe provenant de cellules d’embryons de souris contenant de nombreux types de cellules différents avec des modèles d’expression génique uniques. Alors que d’autres méthodes ont brouillé les résultats, RECODE a clairement résolu les niveaux d’expression génique, même pour les types de cellules rares.

    Imoto conclut : « L’analyse des données de séquençage d’ARN unicellulaire reste techniquement difficile et est une technique en développement, mais notre algorithme RECODE est une étape vers la capacité de révéler les véritables comportements des structures unicellulaires. Avec notre contribution, le séquençage d’ARN unicellulaire l’analyse des données pourrait devenir un outil de recherche puissant avec des implications massives dans de nombreux domaines biologiques. » Un autre auteur de premier plan, Tomonori Nakamura, biologiste de l’ASHBi et du Hakubi Center for Advanced Study de l’Université de Kyoto, ajoute : « En libérant le véritable pouvoir du séquençage d’ARN unicellulaire, RECODE permettra aux chercheurs de découvrir des types de cellules rares non identifiés, conduisant à la le développement et l’établissement du nouveau domaine de recherche en sciences fondamentales ainsi que la recherche sur les applications cliniques et la découverte de médicaments. »

    Les programmes de calcul RECODE (code Python/R, application bureautique) sont disponibles sur GitHub (https://github.com/yusuke-imoto-lab/RECODE).

    Source de l’histoire :

    Matériaux fourni par Université de Kyoto. Remarque : Le contenu peut être modifié pour le style et la longueur.

    N'oubliez pas de voter pour cet article !
    1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (No Ratings Yet)
    Loading...
    mm

    La Rédaction

    L'équipe rédactionnelle

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.