Génération d'images synthétiques de défauts de résine dans le bois

Les données sont à peu près essentielles lorsqu'il s'agit de former des systèmes d'IA, mais accéder à suffisamment de données pour produire des produits de qualité à la hauteur de leurs promesses constitue un défi majeur, même pour les entreprises les plus riches.

C’est un problème qu’Advex AI cherche à résoudre, en utilisant l’IA générative et des données synthétiques pour « résoudre le problème des données », comme le dit l’entreprise. Plus précisément, Advex permet aux clients de former leurs systèmes de vision par ordinateur à l'aide d'un petit échantillon d'images, Advex générant des milliers de « fausses » images à partir de cet échantillon.

Aujourd'hui marque le lancement officiel d'Advex à TechCrunch Disrupt 2024 sur la scène Startup Battlefield, bien qu'il ait déjà sécurisé une poignée de clients grâce à sa phase furtive. Cela inclut ce qu'il appelle « sept grandes » entreprises clientes, qu'il dit ne pas être libre de divulguer. TechCrunch peut également révéler que la startup basée à San Francisco a levé 3,6 millions de dollars de financement, dont la majeure partie est venue via une tranche d'amorçage de 3,1 millions de dollars en décembre dernier, avec des bailleurs de fonds notables tels que Construct Capital, Pear VC et Emerson Collective de Laurene Powell Jobs.

Le PDG Pedro Pachuca a lancé Advex avec son co-fondateur CTO Qasim Wani il y a un peu plus d'un an, et l'entreprise compte six employés. Il est remarquable qu'une startup aussi svelte ait déjà fait son entrée dans l'industrie avec de vrais clients payants, Pachuca attribuant au moins une partie de cela à son expérience, ainsi qu'à un bon réseautage à l'ancienne et à des contacts froids. En effet, Pachuca était auparavant chercheur en apprentissage automatique à Berkeley, puis a rejoint l'équipe de recherche de Google Brain avant de fusionner avec DeepMind.

« Si le retour sur investissement [return on investment] cela a du sens, ils le feront [customers] faites-nous un peu confiance », a déclaré Pachuca. « J'ai fait beaucoup de recherches dans ce domaine – avoir déjà travaillé chez Google Brain me donne un peu de crédibilité. Mais au début, c'était des e-mails froids, et cela nous a valu nos deux premiers gros clients. Ensuite, il y a eu les conférences, c'est pour ça que j'y vais autant !

Pachuca était sur le point de se rendre en Europe juste après avoir conclu son entretien avec TechCrunch, où il prévoyait d'assister à diverses réunions et conférences, notamment la Conférence européenne sur la vision par ordinateur (ECCV) à Milan (Italie) et Vision à Stuttgart (Allemagne).

« Il y a beaucoup de conférences en Europe », a déclaré Pachuca. « Nous allons à l'ECCV pour apprendre et embaucher, en gros », a ajouté Pachuca. « Et Vision est davantage du côté industriel, donc nous sommes là pour vendre. »

Les clients potentiels incluent les anciens développeurs de systèmes de vision industrielle, à l'instar de Cognex ou Keyence, qui s'efforcent de renforcer leurs produits avec une meilleure IA. Mais d'un autre côté, Advex pourrait vendre directement aux entreprises utilisatrices finales, telles que les constructeurs automobiles ou les entreprises de logistique qui construisent leurs propres outils en interne.

Par exemple, un constructeur automobile pourrait avoir besoin d’apprendre à son système de vision par ordinateur à reconnaître les défauts dans le matériau de ses sièges d’auto. Cependant, même si l’entreprise pouvait accéder à des centaines d’images distinctes, le fait est qu’il n’y a pas deux défauts identiques. Ainsi, au lieu de cela, le fabricant peut télécharger une douzaine de photos de sièges déchirés, Advex extrapolant à partir de cela pour générer des milliers de photos de sièges « défectueux » afin de créer un pool de données de formation beaucoup plus vaste et diversifié.

La même chose peut s'appliquer à presque tous les secteurs manufacturiers, du pétrole et du gaz aux meubles en bois : il s'agit de réduire le temps et les coûts de collecte de données en créant artificiellement des images de formation.

Génération d'images synthétiques de défauts de résine dans le bois. Crédits images :Advexe

Les données synthétiques ne sont bien sûr pas un concept nouveau, mais avec la révolution de l'IA qui bat son plein, les entreprises cherchent à combler les lacunes en matière de données. Cela inclut des domaines tels que les études de marché, où les échantillons d'enquête peuvent être trop petits, ainsi que les données informatiques. comme nous le voyons avec Advex, parmi d'autres startups soutenues par du capital-risque telles que Synthesis AI et Parallel Domain.

D’une manière générale, Advex traite deux types de modèles. Le modèle déployé sur le site du client, celui que les propres images du client entraînent, n'est qu'un « élément open source standard », comme le dit Pachuca. « C'est parce qu'ils doivent être petits, et nous ne pensons pas non plus que les gains viennent de l'architecture du modèle, mais d'une formation sur les bonnes données », a-t-il déclaré.

Mais la véritable sauce secrète réside dans le modèle de diffusion exclusif de l'entreprise, similaire à quelque chose comme Midjourney ou Dall-E, et c'est ce qui est utilisé pour créer les données synthétiques. « Celui-là est personnalisé et très compliqué – c'est là que nous mettons tous nos efforts », a ajouté Pachuca.

Même si l'accent mis par Advex sur la fabrication constitue un moyen de se différencier, c'est vraiment l'approche du modèle de diffusion qui permet à l'entreprise de se démarquer.

En comparaison avec d'autres techniques de simulation et de modélisation, telles que celles alignées sur les moteurs de jeu/physique (par exemple Unity), Pachuca affirme que l'utilisation de la diffusion signifie qu'aucune configuration n'est requise et que la génération ne prend que quelques secondes par paire image/étiquette – et en plus, c'est beaucoup plus proche. aux données réelles.

« Nous ne créons pas seulement des images, nous créons les images que vous n'avez pas – en essayant spécifiquement de comprendre ce qui manque et en le créant », a déclaré Pachuca. « Et cette partie de 'ce qui manque' est vraiment difficile et très invisible, mais c'est l'une des plus grandes innovations que nous ayons faites. »

A lire également