Sora, le nouvel outil d’Open AI qui transforme les textes en vidéos
Open AI, la société à l’origine de Chat GPT et de DALL-E, vient de dévoiler Sora, un outil révolutionnaire qui permet de créer des vidéos réalistes à partir de simples requêtes textuelles. Cette innovation représente un pas de géant dans le domaine de l’intelligence artificielle, qui connaît un essor fulgurant face à la concurrence des géants du numérique.
Sora est le fruit de recherches antérieures menées par Open AI sur les programmes DALL-E et GPT, qui sont capables respectivement de générer des images et des textes à partir de mots-clés. Sora va plus loin en combinant ces deux capacités pour produire des vidéos d’une durée maximale d’une minute, tout en respectant la qualité visuelle et la demande de l’utilisateur.
Selon Open AI, Sora peut créer des scènes complexes comprenant plusieurs personnages, des types spécifiques de mouvements et des détails précis. Sora peut également animer une image fixe ou enrichir une vidéo existante.
Pour le moment, Sora n’est accessible qu’à un nombre limité de créateurs de contenu, dans le cadre d’une phase expérimentale. Open AI a toutefois partagé quelques exemples de vidéos créées par Sora sur sa plateforme, en réponse aux suggestions des utilisateurs.
On peut y voir, entre autres, deux chiens se battant dans la neige dans une région montagneuse, un animal hybride mi-canard mi-dragon volant au coucher du soleil avec un hamster sportif sur son dos, ou encore une personne mangeant un biscuit sans laisser de traces de morsure.
Open AI affirme que Sora constitue la base de programmes capables de comprendre et de simuler le monde réel, ce qui est une étape importante vers l’intelligence artificielle générale, un système très autonome dont les capacités dépassent celles des humains dans la plupart des tâches économiquement rentables.
Open AI reconnaît toutefois que Sora présente encore des défauts, tels que la confusion entre la gauche et la droite ou le manque de continuité visuelle entre les scènes. La société assure qu’elle travaille à améliorer le modèle actuel et qu’elle accorde une grande importance à la question de la sécurité.
Open AI souhaite également impliquer les décideurs politiques, les enseignants et les artistes du monde entier pour comprendre leurs préoccupations et identifier les cas d’utilisation positifs de cette nouvelle technologie.
Sora n’est pas le seul outil de ce type sur le marché. Des groupes comme Meta, Google ou Runway AI ont déjà développé des applications similaires, appelées text-to-video, qui visent à innover dans le domaine de la création de contenu.