Llama 3 et Meta AI : le choc des titans de l'IA est lancé par Meta
Les principaux points-clés :
- Meta a lancé Meta AI, un nouvel assistant basé sur Llama 3, présenté comme supérieur à ChatGPT
- Meta AI vise à aider les utilisateurs dans leur quotidien et la recherche d’informations
- Il est intégré aux applis de Meta et utilise Bing pour extraire du contenu web
- Meta AI permet aussi la génération d’images quasiment en temps réel
- Des modèles Llama 3 plus massifs jusqu’à 400 milliards de paramètres sont à venir
En plus de dévoiler Llama 3, Meta a également lancé Meta AI, une nouvelle version de son assistant IA basé sur ce modèle de langage de pointe. Selon l’entreprise, il s’agit du principal assistant IA gratuit au monde, probablement parce que Llama 3 surpasse GPT-3.5 qui alimente le ChatGPT gratuit.
Meta AI vise à aider les utilisateurs à organiser leur vie quotidienne et accéder à l’information sans changer d’appli, d’après Meta. Il peut les assister pour des tâches comme planifier un dîner entre amis en recommandant des restaurants, trouver des concerts ou les aider à étudier.
Disponible également sur ordinateur via meta.ai avec des fonctionnalités typiques de chatbot, Meta AI se positionne clairement comme un concurrent direct de ChatGPT et Gemini Advanced.
Meta AI, un outil de recherche intégré
Meta AI est intégré dans les fonctions de recherche de Facebook, Instagram, WhatsApp et Messenger, permettant aux utilisateurs d’accéder à des informations en temps réel issues du web et des plateformes de Meta.
Par exemple, pour planifier un voyage au ski dans un groupe WhatsApp, Meta AI peut rechercher des vols de New York vers le Colorado directement dans Messenger et trouver les weekends les moins fréquentés, selon Meta.
L’entreprise utilise l’algorithme de recherche Bing pour intégrer du contenu web pertinent dans le chatbot. Une capacité également présente sur ChatGPT (via Bing) et Gemini Advanced (via Google).
Meta AI est aussi disponible en scrollant sur le flux Facebook, où il peut fournir des informations supplémentaires sur le contenu existant.
La génération d’images quasiment en temps réel
Avec sa fonctionnalité Imagine, Meta AI accélère la génération d’images, initialement lancée en version bêta sur WhatsApp et sur meta.ai aux États-Unis. Au fur et à mesure de la frappe, une image apparaît et évolue à chaque lettre.
Les images générées sont plus nettes, de meilleure qualité et mieux adaptées à l’invite textuelle qu’auparavant, affirme Meta. Meta AI peut aussi retravailler des images dans un nouveau style ou les convertir en GIF animés.
Meta AI est désormais accessible dans les applis Facebook, Instagram, WhatsApp et Messenger, ainsi que sur meta.ai. Outre les États-Unis, le lancement a lieu dans plus d’une douzaine de pays dont l’Australie, le Canada, le Ghana, la Jamaïque, le Malawi, la Nouvelle-Zélande, le Nigéria, le Pakistan, Singapour, l’Afrique du Sud, l’Ouganda, la Zambie et le Zimbabwe.
Aux États-Unis, l’assistant est également disponible pour les lunettes intelligentes Meta Smart Glasses de Ray-Ban et le sera bientôt pour Meta Quest, a annoncé Meta.
L’entraînement massif de Llama 3
Cette hausse des performances s’explique en partie par un énorme accroissement des données d’entraînement : Llama 3 a été pré-entraîné sur plus de 15 billions de jetons provenant exclusivement de sources publiques. Ce jeu de données est sept fois plus volumineux que celui de Llama 2 et contient quatre fois plus de code. Plus de 5 % des données ne sont pas en anglais, couvrant une trentaine de langues – même si Meta ne s’attend pas encore aux mêmes performances dans ces langues qu’en anglais.
Sur le plan architectural, Meta se base sur le transformateur decoder-only et utilise un tokeniseur plus efficient comptant 128 000 jetons dans son vocabulaire. Cependant, les deux premiers modèles n’ont pour l’instant qu’une fenêtre de contexte de 8 000 jetons. La date de coupure des connaissances est mars 2023 pour Llama 3 8B, et décembre 2023 pour Llama 70B.
Garder un contrôle sur Llama 3
Afin d’utiliser Llama 3 de manière sûre et responsable, Meta propose plusieurs nouveaux outils, dont des versions actualisées de Llama Guard et Cybersec Eval, ainsi que le nouveau Code Shield, qui sert de garde-fou pour empêcher la génération de code dangereux par les modèles de langage.
Des modèles Llama 3 plus grands et plus puissants à venir
Llama 3 ne s’arrête pas aux modèles dévoilés aujourd’hui : Meta poursuivra le développement et publiera d’autres modèles dotés de nouvelles fonctionnalités comme le multilinguisme, une fenêtre de contexte plus longue et des capacités globales renforcées dans les mois à venir. D’après Meta, les plus grands modèles de Llama 3 compteront plus de 400 milliards de paramètres et sont encore en cours d’entraînement.
Meta prévoit également de publier un article de recherche détaillé une fois l’entraînement de Llama 3 terminé. Le modèle le plus massif pourrait atteindre le niveau de GPT-4, selon certains benchmarks préliminaires partagés par Meta à partir d’un instantané récent du modèle 400B.
Les modèles Llama 3 seront bientôt disponibles sur AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM et Snowflake, avec une prise en charge des plateformes matérielles d’AMD, AWS, Dell, Intel, NVIDIA et Qualcomm. Ils peuvent également être téléchargés depuis la page Llama 3 de Meta.
Commentaires
Enregistrer un commentaire