D-ID, la startup basée à Tel Aviv mieux connue pour être la technologie derrière ces vidéos virales de photos de famille animées, apporte sa technologie vidéo IA à une nouvelle application mobile, lancée aujourd’hui. Initialement disponible sous forme de plate-forme Web, Creative Reality Studio de D-ID permet aux utilisateurs de télécharger une image fixe et un script, puis de les transformer en vidéo générée par l’IA. La technologie peut être utilisée pour créer des représentations numériques d’eux-mêmes, de personnages historiques, de personnages fictifs, de présentateurs ou d’ambassadeurs de marque.
Les premiers cas d’utilisation ciblés par l’entreprise concernaient la formation et l’éducation en entreprise, la communication interne et externe des entreprises, ainsi que le marketing et les ventes de produits, a précédemment rapporté TechCrunch.
Désormais disponible sur mobile, les utilisateurs téléchargeront l’application D-ID depuis l’App Store ou Google Play, puis créeront un compte ou se connecteront, s’ils sont déjà enregistrés. Sur l’écran de sélection, vous pouvez soit choisir une « personne numérique » prédéfinie fournie par D-ID, soit télécharger une image à partir de la photothèque de votre téléphone. Vous saisirez ensuite le texte que vous souhaitez que la personne numérique dise, en choisissant parmi 119 langues, ainsi que parmi les options de voix masculines et féminines. Vous pouvez également choisir le ton du discours : joyeux, excité, amical, plein d’espoir, journal télévisé, triste, criant, terrifié, hostile, chuchotant et autres.
Crédits images : A FAIT
Pour fonctionner, D-ID exploite un mélange de technologies d’IA propriétaires et open source pour alimenter ses plates-formes, déclare Gil Perry, PDG de D-ID.
« À la base se trouve un modèle fondamental capable de générer des images vidéo basées sur une entrée audio. Tous ses produits sont alimentés par son API robuste avec la capacité de restituer la vidéo à une vitesse de 100 FPS, la meilleure du secteur, quatre fois plus rapide que le rendu en temps réel », dit-il.
« Le public principal est constitué de passionnés d’IA, mais cela convient à tous ceux qui souhaitent publier des vidéos mettant en vedette des personnes numériques, qu’il s’agisse de versions d’elles-mêmes ou de toute personne qu’ils peuvent imaginer – personnages historiques, personnages fictifs, ancêtres, etc. », explique Perry. « L’application permet de générer des vidéos en déplacement, réduisant ainsi les coûts de production à grande échelle et offrant la flexibilité nécessaire pour produire des vidéos n’importe où. »

Crédits images : A FAIT
Les vidéos peuvent durer jusqu’à 10 minutes et sont soumises aux mêmes politiques de modération que la version Web, ce qui signifie que la société s’efforce de garantir que la technologie n’est pas utilisée pour des deepfakes qui propagent des campagnes de désinformation et de désinformation. La société s’est également engagée à respecter les droits d’auteur, à adhérer aux réglementations en matière d’IA et à ne pas sciemment concéder sa technologie sous licence à ce qu’elle appelle des « domaines litigieux », notamment les partis politiques, les éditeurs de matériel pornographique, les organisations terroristes et les fabricants d’armes à feu.
Avant le lancement mobile, la version de bureau de Creative Reality Studio a enregistré 60 000 nouvelles inscriptions par jour, avec plus de 150 millions de vidéos déjà réalisées à l’aide de la plateforme, nous dit Perry. De plus, l’API du service compte plus de 200 000 utilisateurs.
Avec son arrivée sur mobile, D-ID est en mesure d’atteindre un marché plus large, y compris les utilisateurs mobiles d’abord ou uniquement mobiles. Cela inclut à la fois les utilisateurs existants qui souhaitent utiliser une version allégée du studio pour les appareils mobiles, ainsi que les nouveaux utilisateurs du grand public, y compris les consommateurs.
Le nouveau service mobile sera basé sur un abonnement, avec des forfaits commençant à 5,99 $ par mois. Les utilisateurs déjà abonnés à la version de bureau peuvent conserver leurs forfaits existants. Un essai gratuit de 14 jours est également disponible.
Bien que son siège soit à Tel Aviv, D-ID dispose d’employés sur d’autres marchés autour de son travail, ce qui lui permet de poursuivre ses opérations pendant la guerre entre Israël et le Hamas.
« Nos équipes en Israël et dans le monde entier s’efforcent d’assurer le plus haut niveau d’assistance et de service », déclare Perry. « Il convient de noter que notre équipe en Ukraine opère avec une diligence accrue, en signe de grande solidarité avec la situation en Israël », ajoute-t-il.

Crédits images : A FAIT
D-ID a levé une série B de 25 millions de dollars l’année dernière, suite au lancement de son projet Deep Nostalgia et de son spin-off, LiveStory. Ces deux projets impliquaient l’animation de photos historiques de membres de la famille, ces dernières ajoutant de l’audio. Les vidéos sont devenues virales alors que les gens utilisaient cette technologie pour créer des photos parlantes d’êtres chers ou d’ancêtres perdus depuis longtemps. Depuis lors, D-ID travaille également à la création d’une interface photoréaliste pour ChatGPT ainsi que pour son logiciel Creative Reality Studio, dans le cadre de ses efforts plus larges de développement d’IA.