Diffusion stable

Stability AI, la société qui finance le développement de systèmes open source de génération de musique et d’images comme Dance Diffusion et Stable Diffusion, a annoncé aujourd’hui qu’elle a levé 101 millions de dollars lors d’un cycle de financement mené par Coatue et Lightspeed Venture Partners avec la participation d’O’Shaughnessy Ventures LLC. La tranche valorise l’entreprise à 1 milliard de dollars après l’argent, selon une source de Bloomberg, et intervient alors que la demande de génération de contenu alimentée par l’IA s’accélère.

Stability AI est une idée originale du PDG Emad Mostaque. Diplômé d’Oxford avec une maîtrise en mathématiques et en informatique, il a été analyste dans divers fonds spéculatifs avant de passer à des travaux plus publics. Mostque a cofondé et démarré Stability AI en 2020, motivé à la fois par une fascination personnelle pour l’IA et par ce qu’il a qualifié de manque d ‘«organisation» au sein de la communauté de l’IA open source.

« Personne n’a le droit de vote à l’exception de nos employés – pas de milliardaires, de gros fonds, de gouvernements ou de quiconque contrôlant l’entreprise ou les communautés que nous soutenons. Nous sommes complètement indépendants », a déclaré Mostaque à TechCrunch dans une précédente interview. « Nous prévoyons d’utiliser notre calcul pour accélérer l’IA fondamentale open source. »

Stability AI dispose d’un cluster de plus de 4 000 GPU Nvidia A100 fonctionnant dans AWS, qu’il utilise pour former des systèmes d’IA, y compris Stable Diffusion. C’est assez coûteux à entretenir – Business Insider rapporte que les dépenses d’exploitation et de cloud de Stability AI ont dépassé 50 millions de dollars. Mais Mostaque a affirmé à plusieurs reprises que la R&D de l’entreprise lui permettrait de former des modèles plus efficacement à l’avenir.

Le travail de l’entreprise n’a pas échappé à la controverse, il convient de le noter. La version open source de Stable Diffusion a été utilisée pour créer du contenu répréhensible comme la violence graphique et les deepfakes pornographiques et non consensuels de célébrités. Et Getty Images a interdit le téléchargement de contenu généré par des systèmes comme Stable Diffusion, par crainte de litiges en matière de propriété intellectuelle. (Stable Diffusion a été formé sur un ensemble de données qui comprend des œuvres protégées par le droit d’auteur – et même des dossiers médicaux privés.)

Stability AI a même fait l’objet d’une récente lettre critique de la représentante de la Chambre des États-Unis Anna G. Eshoo (D-CA) au conseiller à la sécurité nationale (NSA) et au Bureau de la politique scientifique et technologique, dans laquelle elle a exhorté la NSA et l’OSTP à s’attaquer à la publication de « modèles d’IA dangereux » qui « ne modèrent pas le contenu créé sur leurs plateformes ».

Un collage d’images réalisé par Stable Diffusion.

Jusqu’à présent, Stability AI a adopté une approche largement non interventionniste de la modération, y compris des outils de filtrage avec le package open source Stable Diffusion, mais permettant aux utilisateurs et aux entreprises de déployer le système comme ils le souhaitent tant qu’ils respectent les termes de la licence de l’entreprise. « Un pourcentage de personnes sont simplement désagréables et bizarres, mais c’est l’humanité », a déclaré Mostaque dans une précédente interview. « En effet, nous pensons que cette technologie sera répandue, et l’attitude paternaliste et quelque peu condescendante de nombreux aficionados de l’IA est malavisée de ne pas faire confiance à la société. »

Stability AI prévoit de gagner de l’argent en formant des modèles « privés » pour les clients et en agissant comme une couche d’infrastructure générale. Il propose également une plate-forme et une API, DreamStudio, à travers lesquelles ses modèles peuvent être consultés par des utilisateurs individuels. « sur tous les canaux ».

Pendant ce temps, la version open source de Stable Diffusion a été téléchargée plus de 200 000 fois, selon un communiqué de presse publié par Stability AI ce matin.

Selon Mostaque, le capital du cycle de financement soutiendra le déploiement de versions personnalisées de Stable Diffusion pour les utilisateurs à plus grande échelle et l’investissement dans plus de puissance de supercalcul. Il sera également utilisé pour embaucher plus de personnes, Mostaque affirmant qu’il s’attend à passer de 100 à environ 300 employés au cours de la prochaine année.

Stability AI a récemment embauché plusieurs personnalités de premier plan, faisant appel à des chercheurs de Google Brain et le futuriste et conférencier public Daniel Jeffries.

Au-delà de Stable Diffusion, Stability AI prétend avoir d’autres projets commercialisables en cours, y compris des modèles d’IA pour générer de l’audio, du langage, de la « 3D » et même de la vidéo. L’un d’entre eux est Dance Diffusion, un algorithme et un ensemble d’outils qui peuvent générer des clips de musique en s’entraînant sur des centaines d’heures de chansons existantes.

Sri Viswanath, associé général de Coatue, a déclaré dans un communiqué : « Chez Coatue, nous pensons que les technologies d’IA open source ont le pouvoir de libérer la créativité humaine et d’atteindre un bien plus large. Stability AI est une grande idée qui rêve au-delà des applications immédiates de l’IA. Nous sommes ravis de faire partie du voyage de Stability AI, et nous avons hâte de voir ce que le monde crée avec la technologie de Stability AI.

A lire également