EXCLUSIF : Luma lance des agents d'IA créatifs alimentés par ses nouveaux modèles « Unified Intelligence »

La startup de génération vidéo IA Luma a lancé jeudi Luma Agents, conçus pour gérer le travail créatif de bout en bout sur le texte, l'image, la vidéo et l'audio. Les agents Luma sont alimentés par la famille de modèles Unified Intelligence de la startup, avec une architecture formée sur un seul système de raisonnement multimodal.

Les agents Luma sont présentés comme une nouvelle façon de travailler pour les agences de publicité, les équipes marketing, les studios de design et les entreprises. Luma affirme que ses agents sont capables de planifier et de générer du texte, des images, des vidéos et de l'audio tout en se coordonnant avec d'autres modèles d'IA, notamment Ray 3.14 de Luma, Veo 3 et Nano Banana Pro de Google, Seedream de ByteDance et les modèles vocaux d'ElevenLabs.

Les agents de Luma sont construits sur le modèle Uni-1 de la startup, le premier de sa famille de modèles d'IA Unified Intelligence. Il a été formé à l'audio, à la vidéo, à l'image, au langage et au raisonnement spatial, selon Amit Jain, PDG et co-fondateur de Luma.

Jain a déclaré à TechCrunch que le modèle Uni-1 peut « penser en langage, imaginer et restituer en pixels ou en images… nous l'appelons « intelligence en pixels ». » D'autres capacités de sortie comme l'audio et la vidéo viendront dans les versions ultérieures du modèle, a-t-il ajouté.

« Nos clients n'achètent pas l'outil ; ils refont la façon dont leurs affaires sont menées », a déclaré Jain.

Crédits images :Luma IA

Luma a déjà commencé à déployer sa nouvelle plateforme agent auprès de clients existants, notamment les agences de publicité mondiales Publicis Groupe et Serviceplan, ainsi que pour des marques comme Adidas, Mazda et la société saoudienne d'IA Humain.

Jain a déclaré que les agents Luma changent la donne car ils peuvent maintenir un contexte persistant entre les actifs, les collaborateurs et les itérations créatives. Ils peuvent également évaluer et affiner les résultats, améliorant ainsi leurs propres résultats grâce à une autocritique itérative, selon Jain.

Ce type de capacité de vérification de votre travail est ce qui a rendu les agents de codage si utiles, a déclaré Jain. « Vous avez besoin de cette capacité pour évaluer votre travail, le corriger et effectuer cette boucle jusqu'à ce que la solution soit bonne et précise. »

Jain a déclaré que le flux de travail actuel pour l'utilisation des outils d'IA dans des environnements créatifs n'offre pas la même accélération des avantages que les gens de l'industrie créative attendent de l'IA. Au lieu de cela, cela ressemble plutôt à : « Voici 100 modèles. Apprenez à les inciter », a-t-il déclaré.

Il a déclaré que ce qui différenciait les agents Luma, c'est que vous n'aviez pas besoin de faire des allers-retours pour chaque itération sur une image ou une idée : le système génère à la place de grands ensembles de variations et permet aux utilisateurs d'orienter la conversation.

« Avec l'intelligence unifiée, parce que ces modèles comprennent en plus d'être capables de générer, nous sommes en mesure de construire un système capable d'effectuer ce type de travail de bout en bout », a déclaré Jain.

Prenons, par exemple, un architecte humain qui conçoit un bâtiment. En traçant les lignes, ils créent une représentation mentale interne de la structure, de la lumière, de la dynamique spatiale et de l'expérience vécue. Selon Jain, c’est le même principe sur lequel repose l’intelligence unifiée.

Jain a déclaré que le système pourrait accélérer considérablement les flux de travail créatifs. Lors d'une démonstration, il a montré comment un brief de 200 mots et l'image d'un produit (un tube de rouge à lèvres) ont amené le système à générer diverses idées d'emplacements, de modèles et de couleurs pour une campagne publicitaire.

Dans un autre exemple, Luma Agents a transformé la campagne publicitaire d'une marque d'une valeur de 15 millions de dollars sur un an en plusieurs publicités localisées pour différents pays en 40 heures pour moins de 20 000 dollars, en passant avec succès les contrôles de qualité et d'exactitude internes de la marque, a déclaré Jain.

Bien que Luma Agents soit désormais accessible au public via l'API, Jain a déclaré que la startup prévoyait de déployer l'accès progressivement pour garantir que les utilisateurs maintiennent un accès fiable et évitent les interruptions de flux de travail.

A lire également