Quoi de neuf dans l’IA #4 : Veo 3

Publié le 5 juin 2025

Google dévoile au mois de mai Veo 3, un générateur de vidéos IA capable de produire des images cohérentes, des dialogues synchronisés et des bandes-son complètes à partir de simples instructions textuelles.

Avec le lancement de Veo 3, Google propose une avancée marquante dans l’univers des modèles de génération vidéo. Présenté lors de la conférence Google I/O le 20 mai, ce nouvel outil ne se contente plus de produire des clips visuellement réalistes : il génère également un environnement sonore complet, incluant musique, bruitages et dialogues parfaitement synchronisés avec les mouvements des lèvres.

Disponible aux États-Unis pour les abonnés à l’offre Ultra de Gemini (249,99 $ par mois), Veo 3 est également accessible via la plateforme Vertex AI et via Flow, l’interface de création vidéo orientée professionnels. Google vient d’étendre sa disponibilité à plus de 70 pays.

Audio natif, personnages persistants et caméra cinématographique

Veo 3 transforme une simple consigne écrite en un clip immersif de plusieurs secondes, intégrant des sons ambiants et des dialogues naturels. À la différence d’autres outils comme Sora (OpenAI), Veo intègre l’audio dès la phase de génération, évitant le recours à une postproduction séparée. À l’heure actuelle, seule la langue anglaise est officiellement prise en charge.

Le système introduit également une gestion précise des mouvements de caméra : travellings fluides, zooms dynamiques ou plans fixes cinématographiques peuvent être spécifiés dans les prompts. Autre nouveauté : la cohérence visuelle est assurée d’un plan à l’autre, avec des personnages et objets qui conservent leur apparence sur plusieurs scènes.

Un outil conçu pour les créateurs exigeants

L’interface Flow permet de piloter la création d’un film en renseignant les décors, styles ou actions attendues. Les utilisateurs peuvent ajuster leurs clips a posteriori via des instructions supplémentaires, afin de modifier la structure, le style ou la dynamique des scènes générées. Il est même possible d’utiliser son propre visage ou sa propre voix comme référence.

Les utilisateurs de l’offre Gemini Pro disposent de crédits mensuels limités pour tester l’outil (1 000 crédits, deux vidéos par génération), tandis que les abonnés Ultra peuvent accéder à un quota étendu (jusqu’à 125 générations par mois).

Des premières créations déjà virales

Depuis son lancement, Veo 3 a généré un flux constant de vidéos partagées sur YouTube, X ou Instagram. L’un des exemples les plus diffusés est le court-métrage Influenders, réalisé par Yonatan Dor avec le studio The Dor Brothers. Entièrement produit avec Veo 3, le film combine dialogues, effets visuels et ambiance post-apocalyptique. D’autres créateurs ont réalisé des films où des journalistes virtuels s’adressent à la caméra ou des scènes de rue saisissantes de réalisme.

Si certains clips conservent encore des signes reconnaissables de génération IA — mouvements de caméra abrupts, textures légèrement artificielles —, la progression est nette par rapport aux générations précédentes. Les erreurs fréquentes sur l’anatomie ou les expressions ont largement disparu.

Des garde-fous intégrés mais des risques persistants

Google insiste sur les protections intégrées à Veo 3. Tous les contenus générés contiennent un filigrane numérique invisible (SynthID), conçu pour garantir leur traçabilité. Une version visible du filigrane est également ajoutée sur les vidéos exportées. Des outils de détection associés sont en cours de déploiement auprès de testeurs.

L’entreprise affirme vouloir promouvoir une utilisation responsable de ses modèles, en collaboration avec les artistes et les créateurs. Des réalisateurs comme Darren Aronofsky ont été associés au développement de Veo 3 afin d’en faire un outil de création visuelle, mais son potentiel d’usage détourné — notamment pour la désinformation — reste un sujet de vigilance.

Un tournant pour la production vidéo

En ajoutant le son à l’image et en facilitant la mise en scène, Google place Veo 3 au centre des outils de narration audiovisuelle générative. Alors que le coût des effets spéciaux et de l’animation reste un frein pour de nombreux créateurs, la promesse de Veo est d’ouvrir l’accès à une production de qualité professionnelle avec une simple consigne écrite.

Si les limites techniques existent encore, la rapidité de l’évolution suggère qu’un premier long-métrage intégralement généré par IA pourrait voir le jour plus tôt qu’anticipé. Pour les créateurs, l’ère du tournage sans caméra a peut-être déjà commencé.

Articles populaires