Un système d’extraction automatique d’informations pour les articles scientifiques sur le COVID-19 —

par Houssen Moshinaly · 31 mars 2022

Suivez-nous sur notre page Facebook et notre canal Telegram

La communauté mondiale de la recherche en biosanté déploie des efforts considérables pour générer des connaissances sur le COVID-19 et le SRAS-CoV-2. En pratique, cet effort se traduit par une production massive et très rapide de publications scientifiques, ce qui rend difficile la consultation et l’analyse de toutes les informations. C’est pourquoi les experts et les instances décisionnelles doivent être dotés de systèmes d’information leur permettant d’acquérir les connaissances dont ils ont besoin.

C’est précisément ce qui a été exploré dans le projet de chercheurs VIGICOVID mené par le Centre HiTZ de l’UPV/EHU, le groupe NLP & IR de l’UNED et l’Unité Intelligence Artificielle et Technologies du Langage d’Elhuyar, grâce au financement du Fondo Supera COVID-19 accordé par la CRUE. Dans l’étude, sous la coordination du groupe de recherche UNED, ils ont créé un prototype pour extraire des informations par le biais de questions et réponses en langage naturel à partir d’un ensemble mis à jour d’articles scientifiques sur COVID-19 et SARS-CoV-2 publiés par la communauté mondiale de la recherche. .

“Le paradigme de la recherche d’informations est en train de changer grâce à l’intelligence artificielle”, a déclaré Eneko Agirre, responsable du centre HiTZ de l’UPV/EHU. “Jusqu’à présent, lors de la recherche d’informations sur Internet, une question était saisie et la réponse devait être recherchée dans les documents affichés par le système. Cependant, conformément au nouveau paradigme, les systèmes qui fournissent la réponse directement sans aucun besoin lire l’intégralité du document sont de plus en plus répandus.”

Dans ce système, “l’utilisateur ne demande pas d’informations à l’aide de mots-clés, mais pose directement une question”, explique Xabier Saralegi, chercheur chez Elhuyar. Le système recherche les réponses à cette question en deux temps : “Dans un premier temps, il récupère les documents pouvant contenir la réponse à la question posée en utilisant une technologie qui combine des mots-clés avec des questions directes. C’est pourquoi nous avons exploré les architectures neuronales”, a ajouté le Dr. Saralegi. Des architectures neuronales profondes alimentées par des exemples ont été utilisées : “Cela signifie que les modèles de recherche et les modèles de réponse aux questions sont entraînés au moyen de l’apprentissage automatique en profondeur.”

Une fois l’ensemble des documents extraits, ils sont retraités par un système de questions-réponses afin d’obtenir des réponses précises : « Nous avons construit le moteur qui répond aux questions ; lorsque le moteur reçoit une question et un document, il est capable pour détecter si oui ou non la réponse est dans le document, et si c’est le cas, il nous dit exactement où elle se trouve », a expliqué le Dr Agirre.

Un prototype facilement commercialisable

Les chercheurs sont satisfaits des résultats de leurs recherches : “Parmi les techniques et les évaluations que nous avons analysées dans nos expérimentations, nous avons retenu celles qui donnent au prototype les meilleurs résultats”, précise le chercheur d’Elhuyar. Une base technologique solide a été établie et plusieurs articles scientifiques sur le sujet ont été publiés. “Nous avons trouvé une autre façon d’effectuer des recherches chaque fois que des informations sont nécessaires de toute urgence, ce qui facilite le processus d’utilisation des informations. Au niveau de la recherche, nous avons montré que la technologie proposée fonctionne et que le système donne de bons résultats”, a déclaré Agirre. souligné.

“Notre résultat est un prototype d’un projet de recherche fondamentale. Ce n’est pas un produit commercial”, a souligné Saralegi. Mais de tels prototypes peuvent être modélisés facilement en peu de temps, ce qui signifie qu’ils peuvent être commercialisés et mis à la disposition de la société. Ces chercheurs soulignent que l’intelligence artificielle permet de mettre à disposition des outils de plus en plus puissants pour travailler avec de grandes bases documentaires. “Nous progressons très rapidement dans ce domaine. De plus, tout ce qui est étudié peut facilement arriver sur le marché”, conclut le chercheur UPV/EHU.

Source de l’histoire :

Matériaux fourni par Université du Pays Basque. Remarque : Le contenu peut être modifié pour le style et la longueur.