Lumiere de Google rapproche la vidéo IA du réel à l'irréel

Le nouveau modèle d’IA de génération vidéo de Google, Lumiere, utilise un nouveau modèle de diffusion appelé Space-Time-U-Net, ou STUNet, pour créer des vidéos. Ce modèle détermine où se trouvent les éléments dans une vidéo (espace) et comment ils se déplacent et changent simultanément (temps). Contrairement aux méthodes traditionnelles qui rassemblent des images fixes pour créer une vidéo, Lumiere crée la vidéo en un seul processus.

Lumiere commence par créer un cadre de base à partir de l’invite donnée. Ensuite, il utilise le modèle STUNet pour approximer le mouvement des objets dans cette image et créer d’autres images qui s’enchaînent les unes avec les autres, créant ainsi l’apparence d’un mouvement fluide. Lumiere génère également 80 images, contre 25 pour les méthodes précédentes telles que Stable Video Diffusion.

La génération de vidéos par l’IA a évolué rapidement ces dernières années, passant d’une apparence étrange à une apparence presque réaliste. Lumiere entre sur le marché déjà occupé par des concurrents tels que Runway, Stable Video Diffusion et Meta’s Emu. Runway, par exemple, a lancé Runway Gen-2 l’année dernière, permettant de créer des vidéos plus réalistes.

Google a publié des extraits et des invites sur le site Lumiere pour permettre aux utilisateurs de comparer les résultats avec d’autres plateformes, telles que Runway. Les résultats montrent que certaines vidéos générées par Lumiere ont une touche d’artificialité, mais certaines scènes, comme celle d’une tortue se déplaçant dans l’eau, sont impressionnantes et ressemblent à de vraies images. Dans certains cas, les vidéos générées par Lumiere peuvent être confondues avec des CGI (Computer Generated Imagery).

Contrairement à d’autres modèles qui utilisent des images clés pour créer des vidéos, Lumiere se concentre sur le mouvement lui-même et prédit où le contenu généré devrait se trouver à un moment donné dans la vidéo. Google a progressivement développé des modèles d’IA plus avancés et s’est tourné vers une approche multimodale, notamment avec son modèle de langage Gemini qui permettra à terme la génération d’images.

Lumiere permettra également d’autres fonctionnalités telles que la génération d’images en vidéo, la génération stylisée pour créer des vidéos dans un style spécifique, les cinémagraphes qui animent uniquement une partie de la vidéo, et l’inpainting pour masquer une zone de la vidéo et en changer la couleur ou le motif.

Cependant, Google reconnaît également les risques d’utilisation abusive de cette technologie pour créer du contenu faux ou nuisible. Ils soulignent l’importance de développer et d’appliquer des outils de détection des préjugés et des utilisations malveillantes afin d’assurer la sécurité et l’équité dans l’utilisation de cette technologie. Les détails sur la manière dont cela sera réalisé n’ont pas été donnés dans l’article.

Dassault Systèmes et Apple : Une nouvelle ère pour la conception 3D industrielle

Helio Water : Un accès à l’eau potable pour tous

Clear Hydrogen: Une révolution énergétique en marche

Moteur à air comprimé : Fonctionnement et avancées

Le « Super Égout » de Londres : Une révolution souterraine pour la Tamise

Moteur à air comprimé : Fonctionnement et avancées

Des briques en verre recyclé pour des constructions durables

Secteur de la santé : des plastiques biodégradables pour un avenir plus durable

Lumiere de Google rapproche la vidéo IA du réel à l’irréel

Dans cette catégorie

Microsoft Teams prend désormais en charge les réunions 3D et VR

GM et Honda unissent leurs forces pour fabriquer des piles à combustible à hydrogène pour « divers produits »

Le nombre d’abonnés Peacock augmentent significativement

Surprise ! Google Chrome devient natif pour Windows sur Arm

Microsoft explique comment des hackers russes ont espionné ses dirigeants

Ceci pourrait vous plaire

Switch 2 : toutes les infos et rumeurs sur la prochaine console de Nintendo

La quête d’un Internet plus rapide avec le L4S

Comment investir dans l’intelligence artificielle

Est-ce un iPhone ou une Rolex? Apparemment les deux !

Comment les câbles à fibres optiques ont aidé les chercheurs à écouter les baleines

Lumiere de Google rapproche la vidéo IA du réel à l’irréel

LAISSER UNE REPONSE Annuler réponse

Calendrier 2025 gratuit sous Excel et en PDF avec vacances scolaires et jours fériés

Outils internationaux/Convertisseurs

Les sites équivalents au bon coin en Europe et dans le monde