Meta dévoile Llama 4, sa nouvelle génération de modèles d’IA

Publié le 14 avril 2025

Avec une architecture multimodale et plus efficace, les modèles Llama 4 s’inscrivent dans une stratégie offensive de Meta face à la concurrence américaine et chinoise dans l’IA générative.

Meta vient de lancer Llama 4, une nouvelle série de modèles d’intelligence artificielle qui alimente désormais son assistant Meta AI dans des applications comme WhatsApp, Messenger ou Instagram. Cette nouvelle génération comprend trois modèles — Scout, Maverick et Behemoth — dont deux sont déjà disponibles en open access pour les développeurs. Le troisième, Llama 4 Behemoth, est toujours en cours d’entraînement mais promet des performances inédites dans le domaine des grands modèles de langage.

Une architecture plus efficiente pour des modèles plus puissants

Tous les modèles de la série Llama 4 reposent sur une architecture de type "mixture of experts" (MoE), une nouveauté pour Meta. Ce type d’architecture divise les traitements en sous-tâches attribuées à des « experts » spécialisés, ce qui permet d’optimiser l’utilisation des ressources tout en conservant de hautes performances. Le modèle Scout, par exemple, dispose de 109 milliards de paramètres totaux, mais seulement 17 milliards sont activés à chaque requête. Il peut fonctionner sur une seule puce Nvidia H100, ce qui le rend particulièrement accessible pour les développeurs.

Le modèle Maverick, plus avancé, est destiné à des usages plus généralistes, comme les assistants conversationnels ou la génération de texte. Il active lui aussi 17 milliards de paramètres par tâche, répartis sur 128 experts, et nécessite une infrastructure plus robuste de type Nvidia DGX. Quant à Behemoth, il affiche 288 milliards de paramètres actifs et près de 2 000 milliards au total, avec 16 experts mobilisables selon les tâches.

Une réponse directe à la montée en puissance des modèles chinois

L’annonce de Llama 4 intervient alors que la concurrence s’intensifie, notamment du côté des grands groupes technologiques chinois. Depuis le début de l’année, des modèles comme DeepSeek ont réussi à se positionner face aux leaders occidentaux, en particulier grâce à une maîtrise du coût d’inférence et à une efficacité énergétique accrue. Tencent, Baidu et Alibaba ont multiplié les annonces, intégrant notamment DeepSeek dans WeChat ou revendiquant des performances supérieures aux modèles d'OpenAI sur certains cas d’usage.

Meta se positionne directement face à cette offensive. Le groupe affirme que ses modèles surpassent les dernières versions de Gemini de Google, les modèles Mistral 3.1 ou encore GPT-4o d’OpenAI sur plusieurs benchmarks, en particulier sur le raisonnement, la compréhension d’images, la traduction et les contextes longs. Scout dispose ainsi d’une fenêtre de contexte de 10 millions de tokens, une des plus larges du marché, permettant d’analyser de très longs documents ou d’interpréter des images dans des contextes complexes.

Un élargissement des cas d’usage et un recentrage sur la neutralité

Meta ne se contente pas d’améliorer les performances techniques. La série Llama 4 a été conçue pour élargir la couverture thématique des modèles. Contrairement aux générations précédentes, Llama 4 répond à un éventail plus large de questions dites « sensibles », notamment en matière politique ou sociale. La firme met en avant un modèle « plus équilibré » qui refuserait moins souvent de répondre, tout en restant factuel et utile.

Ces ajustements interviennent alors que le débat sur les biais perçus dans les modèles d’IA prend de l’ampleur. Plusieurs proches de l’administration Trump, dont Elon Musk ou David Sacks, ont accusé les chatbots de censurer certaines opinions politiques. En réponse, les principaux acteurs du secteur, dont Meta, cherchent à élargir les réponses possibles tout en maintenant une forme de neutralité algorithmique.

Une accessibilité encadrée

Malgré son positionnement affiché comme « open-source », la licence des modèles Llama reste encadrée. Les entreprises disposant de plus de 700 millions d’utilisateurs mensuels doivent obtenir une autorisation de Meta pour utiliser les modèles, et les entités domiciliées dans l’Union européenne ne sont pas autorisées à les distribuer ou les exploiter commercialement, probablement en raison des exigences réglementaires du cadre européen sur l’IA.

Ces restrictions soulignent l’ambiguïté de l’open source dans le domaine des modèles de fondation : les géants technologiques souhaitent bénéficier de l’effet d’écosystème tout en conservant un contrôle sur l’usage commercial de leurs technologies.

Une offensive qui se poursuivra à LlamaCon

Meta prévoit de détailler sa feuille de route IA lors de la conférence LlamaCon, prévue le 29 avril. Au programme : annonces de nouveaux outils, évolution de l’architecture MoE, et élargissement de l’accès aux capacités multimodales. À ce jour, les fonctions liées aux images et vidéos de Llama 4 ne sont activées qu’aux États-Unis et uniquement en anglais, mais Meta a annoncé vouloir les étendre à d’autres marchés dans les mois à venir.

Avec Llama 4, Meta entend reprendre l’avantage dans la bataille des modèles de fondation face à OpenAI, Google, Anthropic, mais aussi aux nouveaux venus chinois. Entre montée en puissance technologique, repositionnement politique et encadrement réglementaire, la nouvelle génération de modèles de Menlo Park ambitionne de s’imposer comme une plateforme centrale de l’IA générative à l’échelle mondiale.

Articles populaires