samedi , 18 novembre 2017

Quand la mouche à fruits donne des leçons aux moteurs de recherche

Une étude a analysé le cerveau de la mouche à fruits afin de déterminer comment elle reconnait des odeurs. La méthode qu’elle utilise est supérieure, sous certaines conditions, à la recherche de similarité qui est la principale méthode utilisée par les moteurs de recherche.


Quand la mouche à fruits donne des leçons aux moteurs de recherche
Chaque jour, les sites Web que vous visitez et les applications que vous utilisez traitent d’énormes ensembles de données pour trouver des éléments qui se ressemblent. Des produits similaires à vos achats antérieurs, des chansons qui ressemblent aux mélodies que vous avez aimées, des visages similaires aux personnes que vous avez identifiées sur les photos. Toutes ces tâches sont connues sous le nom de recherches de similarité et la capacité de réaliser ces correspondances massives de manière efficace et rapide a été un défi permanent pour les informaticiens.

Du moteur de recherche au cerveau de la mouche à fruits

Désormais, les scientifiques de Salk et de l’Université de Californie à San Diego ont découvert que le cerveau de la mouche à fruits possède une méthode élégante et efficace pour effectuer des recherches de similarité. Pour les mouches, cela les aide à identifier les odeurs les plus proches à celles qu’elles ont rencontrées auparavant afin qu’elles sachent réagir à l’odeur. De nouveaux détails sur l’approche computationnelle des recherches de similarité sur les odeurs, décrite dans la revue Science, pourraient éclairer les algorithmes informatiques pour les moteurs de recherche dans le futur.1

C’est un problème qui concerne toutes les entreprises technologiques qui utilisent un moteur de recherche et c’est donc quelque chose que les informaticiens étudient depuis des années selon Saket Navlakha, professeur adjoint au laboratoire de biologie intégrative de Salk et auteur principal du nouveau papier. Désormais, nous avons cette nouvelle approche des recherches de similarité grâce à la mouche.

La façon dont la plupart des systèmes de données informatisés catégorisent les éléments, des chansons aux images, pour optimiser les recherches de similarité consiste à réduire la quantité d’informations associées à chaque élément. Ces systèmes attribuent des hachages à chaque élément de sorte que des éléments similaires sont plus susceptibles d’être affectés au même hachage ou à un hachage similaire par rapport à 2 éléments très différents. Les hachages sont une sorte de raccourci numérique, par exemple, vous avez une URL entière telle que exemple.com/categorie/article et son raccourci en bit.ly qui sera donc sa version hashée. Quand on attribue des hachages de cette manière, alors on le connait comme le hachage sensible à la localité pour les informaticiens. Pendant la recherche d’éléments similaires, un programme recherche les similarités rapidement dans les hachages plutôt que dans les éléments d’origine.

Navlakha discutait avec son collègue Charles Stevens, professeur au Laboratoire de neurobiologie moléculaire de Salk et co-auteur du nouveau papier, qui avait étudié l’olfaction à la mouche quand le premier réalisa que les mouches, et tous les animaux étaient constamment confrontés à des recherches de similarité. Il a donc commencé à analyser la littérature sur les circuits du cerveau derrière l’olfaction de la mouche pour comprendre comment elles identifient les odeurs similaires.

La mouche à fruits voit grand pour analyser les odeurs

Dans la nature, vous n’allez pas rencontrer la même odeur à chaque fois, car chaque odeur s’accompagne de fluctuations selon Navlakha. Mais si vous sentez quelque chose que vous avez déjà associé à un comportement, alors vous devez être en mesure d’identifier cette similitude et de vous rappeler de ce comportement. Donc, si une mouche à fruits sait que l’odeur d’une banane pourrie indique que c’est l’heure de manger, alors elle doit réagir de la même façon lorsqu’elle rencontre une odeur très similaire même si elle n’a jamais ressenti cette odeur auparavant.

Une illustration du cerveau de la mouche à fruits quand elle effectue une recherche de similarité - Crédit : Salk Institute

Une illustration du cerveau de la mouche à fruits quand elle effectue une recherche de similarité – Crédit : Salk Institute

Navlakha et ses collaborateurs ont analysé la littérature qui a révélé que lorsque les mouches des fruits sentent d’abord une odeur, 50 neurones s’activent dans une combinaison unique à cette odeur. Mais plutôt que de hacher cette information en réduisant le nombre de hashs associés à l’odeur, comme le feraient nos moteurs de recherche actuels, les mouches font le contraire. Elles augmentent la dimension. Les 50 neurones initiaux mènent à 2 000 neurones en augmentant l’entrée de sorte que chaque odeur a une empreinte encore plus distincte parmi ces 2 000 neurones. Le cerveau stocke ensuite seulement 5 % de ces 2 000 neurones avec l’activité supérieure comme le hachage pour cette odeur. Le paradigme tout entier permet au cerveau d’analyser les similitudes de manière plus performante par rapport à la méthode de hachage selon Navlakha.

Imaginons que vous avez un groupe de personnes regroupées par leurs relations et ils sont réunis dans une salle bondée selon ce chercheur. Ensuite, vous prenez les mêmes personnes et les mêmes relations, mais vous les dispersez sur un terrain de football. Le résultat est qu’il sera beaucoup plus facile de voir la structure des relations et de tracer des limites entre les groupes dans l’espace élargi par rapport à l’espace bondé. C’est exactement ce que font les mouches des fruits.

Utiliser la nature pour créer les algorithmes du futur

Navlakha et ses collaborateurs n’ont pas révélé le mécanisme par lequel les mouches stockent des informations sur les odeurs, car c’était déjà disponible dans la littérature, mais ils sont les premiers à analyser comment ce processus maximise la vitesse et l’efficacité des recherches de similarité. Quand ils ont appliqué le processus à 3 ensembles de données standard que les informaticiens utilisent pour tester les algorithmes de moteur de recherche, alors ils ont constaté que l’approche de la mouche améliorait les performances. Ils pensent que cette approche pourrait améliorer les algorithmes de recherche dans le futur.

Des éléments de cette approche avaient été utilisés par le passé par des informaticiens, mais l’évolution les a réunis de manière unique selon Navlakha. Les collaborateurs de Navlakha estiment que l’étude est parmi les premières à faire de tels parallèles concrets entre les circuits neuronaux du cerveau et les algorithmes de traitement de l’information utilisés en informatique.

Au cours des 20 dernières années, je me suis intéressé aux projections aléatoires, qui sont un élément essentiel du hachage sensible à la localité pour la recherche de similarité, qui s’applique aux algorithmes fonctionnant sur des ordinateurs selon Sanjoy Dasgupta, professeur d’informatique et d’ingénierie et premier auteur du nouveau document. Il ne m’est jamais venu à l’esprit que des opérations similaires puissent exister dans la nature. Un rêve partagé par les neurobiologistes et les informaticiens est de comprendre la méthode de calcul de notre cerveau pour que nous puissions adapter ses méthodes dans les moteurs de recherche selon Stevens. Notre papier fournit une preuve à l’appui que ce rêve peut devenir une réalité. Et on peut juste imaginer les performances, car si le cerveau d’une mouche à fruits est plus performant qu’un moteur de recherche actuel, alors le cerveau humain pourrait donner pas mal de leçons aux informaticiens.

Sources

1.
A neural algorithm for a fundamental computing problem. Science. http://dx.doi.org/10.1126/science.aam9868.
N'oubliez pas de voter :
1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (3 votes, average: 3,67 out of 5)
Loading...

Faites un don sur notre page Patreon

Quelle est la fiabilité de cette information ou étude ?

Aucun avis particulier

A propos de Jacqueline Charpentier

mm

Ayant fait une formation en chimie, il est normal que je me sois retrouvée dans une entreprise d’emballage. Désormais, je publie sur des médias, des blogs et des magazines pour vulgariser l’actualité scientifique et celle de la santé.

Répondre

Votre adresse email ne sera pas publiée. Les champs obligatoires sont marqués d'une étoile *

*

Timber by EMSIEN 3 Ltd BG