Style urbain nocturne à Tokyo, avec une femme élégante dans une rue animée et illuminée.

OpenAI présente SORA, l'intelligence artificielle qui crée des vidéos époustouflantes !

avatar mince de catherine
L'outil vous permet de transformer des commandes textuelles en vidéos d'une durée maximale de 60 secondes. Les résultats finaux sont incroyables. Regarder!

Dans un monde où la créativité rencontre la technologie de pointe, OpenAI, une fois de plus, surprend avec sa dernière innovation : le SORA. Cette nouvelle avancée en matière d’intelligence artificielle promet de révolutionner la manière de créer des vidéos, en offrant un outil capable de transformer des invites textuelles en expériences visuelles surprenantes.

Avec une capacité impressionnante à restituer des scènes détaillées, depuis un monde de récifs coralliens sur papier jusqu'aux mammouths laineux dans une prairie enneigée, le SORA est prêt à impressionner et à inspirer.

Comment fonctionne SORA ?

Une femme élégante déambule dans une rue illuminée d'une ville japonaise la nuit, mettant en valeur le néon, la mode urbaine, la technologie et la culture pop.
L'IA qui réalise des vidéos impressionne par sa richesse de détails (Image : OpenAI)

On connaissait déjà des modèles d'intelligence artificielle qui créaient des images assez surprenantes à partir de textes, comme ce fut le cas avec DALL-E, Par exemple. Cependant, nous sommes maintenant confrontés à quelque chose d'un peu plus impactant avec le SORA.

Bien qu'il existe déjà d'autres types de projets d'IA qui convertissent du texte en vidéo, SORA se distingue par sa capacité impressionnante à créer des images photoréalistes et à produire des clips plus longs, jusqu'à une minute. Contrairement aux modèles concurrents qui ne génèrent que de courts extraits de vidéo, la nouvelle IA a le potentiel de créer des récits plus complexes et plus engageants.

La société de développement garantit que le SORA est capable de créer des vidéos d'une durée allant jusqu'à une minute sans perte de qualité visuelle et en restant fidèle aux paramètres définis par la commande de l'utilisateur. C'est le gros détail qui fait toute la différence.

Mais il est important de se rappeler que le OpenAI distribue toujours l'outil à certains créateurs et experts en sécurité sélectionnés pour évaluer les vulnérabilités possibles. L'objectif est de le rendre accessible à un public plus large dans un avenir proche.

Exemples

D'après le message d'introduction de OpenAI, la nouvelle IA pour les vidéos a la capacité de créer «Scènes complexes avec plusieurs personnages, mouvements spécifiques et détails précis de l'environnement et des personnages« . De plus, elle peut aussi comprendre comment les objets «interagir dans le monde réel" et aussi "Interprétez avec précision les accessoires, générant des personnages attachants qui expriment des émotions vives« . Un autre détail très important est la génération d'une vidéo basée sur une image statique, en plus du remplissage des images manquantes dans une vidéo existante ou de la possibilité de l'étendre.

Même si certaines vidéos peuvent encore révéler des indices typiques générés par l’IA, le OpenAI affirme que le SORA "peut avoir des difficultés à simuler avec précision la physique d’une scène complexe« . Cependant, dans l’ensemble, les résultats sont assez impressionnants. Avec une description très détaillée, il est possible que Sora dépasse les attentes, comme ce fut le cas dans la vidéo ci-dessous.

D'après l'exemple publié par OpenAi, voici le résultat avec l'invite "La scène animée présente un gros plan d'un petit monstre à fourrure agenouillé à côté d'une bougie rouge fondante. Le style artistique est 3D et réaliste, en mettant l’accent sur l’éclairage et la texture. L’ambiance du tableau est celle de l’émerveillement et de la curiosité, alors que le monstre regarde la flamme avec les yeux écarquillés et la bouche ouverte. Sa pose et son expression transmettent un sentiment d'innocence et de jeu, comme si elle explorait le monde qui l'entoure pour la première fois. L’utilisation de couleurs chaudes et d’un éclairage spectaculaire renforce encore l’atmosphère chaleureuse de l’image."

Les chercheurs derrière le SORA Ils n'ont pas révélé combien de temps il faut pour rendre les vidéos, mais ils suggèrent que le processus est relativement rapide, comparable à une pause collation. Si les exemples présentés sont révélateurs du potentiel de l’outil, on peut s’attendre à une révolution dans la manière de produire et de consommer les contenus audiovisuels.

En pensant à un récif de corail, il est possible d’obtenir un résultat comme celui-ci à partir d’une simple invite comme «un monde de récifs coralliens magnifiquement rendu sur papier, rempli de poissons colorés et de créatures marines"

Bill Peebles, membre de l'équipe de recherche, note en outre que SORA a créé un récit cohérent grâce à ses angles de caméra et à son timing. Il dit qu'il y a plusieurs changements de scène, tous générés par le modèle en une seule itération, c'est-à-dire que personne ne demande au modèle de le faire, il le fait simplement automatiquement.

Un autre bon exemple est la description de « Plusieurs gigantesques mammouths laineux s’approchent, piétinant une prairie enneigée. Leurs longs manteaux laineux se balancent doucement dans le vent pendant qu'ils marchent, des arbres couverts de neige et des montagnes aux sommets enneigés spectaculaires en arrière-plan, la lumière de l'après-midi avec des nuages ​​​​légers et un soleil haut au loin crée une lueur chaleureuse, la vue basse de la caméra est époustouflante, capturant le gros mammifère à fourrure avec une belle photographie et une belle profondeur de champ » et vous obtenez ceci :

Impacts des IA qui génèrent des vidéos

Clavier d'ordinateur avec symbole de cryptomonnaie sur fond numérique, technologie, innovation, monnaies numériques, blockchain, marché financier.
Les nouveaux modèles d’intelligence artificielle présentent des avantages et des inconvénients (Image : WIRED)

Alors que les visuels fournis par la nouvelle IA OpenAI sont certes impressionnants, c'est dans leurs capacités inattendues que réside leur véritable surprise. Piloté par une version du modèle de diffusion utilisé par l'imageur DE-3, avec le moteur à transformateur du GPT-4, un SORA cela va au-delà de la simple satisfaction des exigences des invites, révélant une compréhension émergente de la grammaire cinématographique.

Il faut tenir compte du fait qu'il est soumis à des restrictions de contenu en matière de violence, de pornographie, d'appropriation non autorisée d'identités ou de styles d'artistes connus. En outre OpenAI s'engage à fournir aux téléspectateurs un moyen d'identifier clairement le contenu généré par SORA tel que créé par l’intelligence artificielle. Récemment, le chanteur Taylor Swift a été confronté à des conflits d'image liés à ce type de scénario négatif avec deepfakes sur internet.

Mais la vérité est que même si l’IA pour la vidéo est une grande nouveauté, elle n’est pas encore parfaite. Malgré son impact positif, la technologie reste confrontée à des défis. Un exemple en est la question de la sécurité et de la véracité, en plus de la violation du droit d'auteur par le contenu produit.

La solution à la désinformation nécessitera non seulement une action de notre part, mais également une compréhension collective de la société et l’adaptation des médias sociaux.

Aditya Ramesh, chef d'équipe Dall-E

Cependant, l’intelligence artificielle qui génère des vidéos continue d’être considérée comme un complément possible à différentes situations. Il ne s’agit pas de l’envisager comme un substitut, mais de savoir l’utiliser de manière stratégique. La production cinématographique, par exemple, peut tirer parti de la technologie pour transformer les scénarios de manière pratique. Deuxième Bill Peebles, « pour produire un film professionnel, il faut du matériel coûteux. Ce modèle permettra aux utilisateurs quotidiens des médias sociaux de créer du contenu de haute qualité.

TRIO Showmetech

Découvrez ceci et d’autres actualités sur Showmetech TRIO, votre trio d’actualités hebdomadaire :

Voir aussi

Gemini remplace Bard en tant que principal assistant d'intelligence artificielle de Google. Voir comment utiliser

Fontes: WIRED, The Verge

Texte relu par : Pedro Bomfim


En savoir plus sur Showmetech

Inscrivez-vous pour recevoir nos dernières actualités par email.

Laisser un commentaire
Related posts