Galilée

Galileo, une startup lançant une plate-forme pour le développement de modèles d’IA, a annoncé aujourd’hui avoir levé 18 millions de dollars lors d’un tour de table de série A dirigé par Battery Ventures avec la participation de The Factory, Walden Catalyst, FPV Ventures, le co-fondateur de Kaggle Anthony Goldbloom et d’autres investisseurs providentiels. . Le nouvel argent porte le total de la société à 23,1 millions de dollars et sera affecté à la croissance des équipes d’ingénierie et de mise sur le marché de Galileo et à l’expansion de la plate-forme principale pour prendre en charge de nouvelles modalités de données, a déclaré le PDG Vikram Chatterji à TechCrunch par e-mail.

Alors que l’utilisation de l’IA devient plus courante dans l’entreprise, la demande de produits facilitant l’inspection, la découverte et la correction des erreurs critiques de l’IA augmente. Selon une enquête récente (de la communauté MLOps), 84,3 % des scientifiques des données et des ingénieurs en apprentissage automatique déclarent que le temps nécessaire pour détecter et diagnostiquer les problèmes avec un modèle est un problème pour leurs équipes, tandis que plus d’un sur quatre (26,2 %) admet qu’il leur faut une semaine ou plus pour détecter et résoudre les problèmes.

Certains de ces problèmes incluent des données mal étiquetées, où les étiquettes utilisées pour former un système d’IA contiennent des erreurs, comme une image d’un arbre étiqueté par erreur « plante d’intérieur ». D’autres concernent la dérive des données ou le déséquilibre des données, qui se produit lorsque les données évoluent pour rendre un système d’IA moins précis (pensez à un modèle boursier formé sur des données pré-pandémiques) ou que les données ne sont pas suffisamment représentatives d’un domaine (par exemple, un système de données ensemble de portraits a plus de personnes à la peau claire que de personnes à la peau foncée).

La plate-forme de Galileo vise à systématiser les pipelines de développement de l’IA au sein des équipes à l’aide d’« enregistreurs automatiques » et d’algorithmes qui mettent en évidence les problèmes de rupture du système. Conçu pour être déployé dans un environnement sur site, Galileo scale à travers le flux de travail de l’IA – du pré-développement à la post-production – ainsi que des modalités de données non structurées comme le texte, la parole et la vision.

En science des données, les données « non structurées » font généralement référence aux données qui ne sont pas organisées selon un modèle ou schéma de données prédéfini, comme les factures ou les données de capteur. Atindriyo Sanyal, le deuxième cofondateur de Galileo, affirme que les processus basés sur des scripts Excel et Python pour garantir que des données de qualité sont introduites dans les modèles sont manuels, sujets aux erreurs et coûteux.

Une capture d’écran de Galileo Community Edition. Crédits image : Galilée

« Lorsqu’ils inspectent leurs données avec Galileo, les utilisateurs découvrent instantanément la longue traîne des erreurs de données telles que les données mal étiquetées, les langues sous-représentées [and] des données inutiles sur lesquelles ils peuvent immédiatement agir dans Galileo en supprimant, en réétiquetant ou en ajoutant des données similaires supplémentaires de la production », a déclaré Sanyal à TechCrunch dans une interview par e-mail. « Il était essentiel pour les équipes que Galileo prenne en charge les workflows de données d’apprentissage automatique de bout en bout – même lorsqu’un modèle est en production, Galileo informe automatiquement les équipes des dérives de données et met en évidence les données les plus précieuses avec lesquelles s’entraîner ensuite. »

L’équipe cofondatrice de Galileo a passé plus d’une décennie à créer des produits d’apprentissage automatique, où ils disent avoir relevé les défis du développement de systèmes d’IA de première main. Chatterji a dirigé la gestion des produits chez Google AI, tandis que Sanyal a dirigé l’ingénierie de la division AI d’Uber et a été l’un des premiers membres de l’équipe Siri chez Apple. Le troisième co-fondateur de Galileo, Yash Sheth, est un autre vétéran de Google, ayant précédemment dirigé l’équipe de la plate-forme de reconnaissance vocale de l’entreprise.

La plate-forme de Galileo appartient à la catégorie en plein essor des logiciels connus sous le nom de MLOps, un ensemble d’outils permettant de déployer et de maintenir des modèles d’apprentissage automatique en production. C’est très demandé. Selon une estimation, le marché des MLOps pourrait atteindre 4 milliards de dollars d’ici 2025.

Il ne manque pas de startups à la recherche de l’espace, comme Comet, qui a levé 50 millions de dollars en novembre dernier. Les autres fournisseurs bénéficiant du soutien de VC incluent Arize, Tecton, Diveplane, Iterative et InfuseAI basé à Taiwan.

Mais bien qu’il ait été lancé il y a quelques mois à peine, Galileo a des clients payants allant des startups « à forte croissance » aux entreprises du Fortune 500, affirme Sanyal. « Nos clients utilisent Galileo tout en créant des applications d’apprentissage automatique telles que la détection des discours haineux, la détection de l’intention de l’appelant dans les centres de contact et l’amélioration de l’expérience client grâce à l’IA conversationnelle », a-t-il ajouté.

Sanyal s’attend à ce que le lancement de l’offre gratuite de Galileo – Galileo Community Edition – stimule davantage les inscriptions. L’édition communautaire permet aux scientifiques des données travaillant sur le traitement du langage naturel de créer des modèles d’apprentissage automatique à l’aide de certains des outils inclus dans la version payante, a déclaré Sanyal.

« Avec Galileo Community Edition, n’importe qui peut s’inscrire gratuitement, ajouter quelques lignes de code lors de la formation de son modèle avec des données étiquetées ou lors d’une exécution d’inférence avec des données non étiquetées pour inspecter, trouver et corriger instantanément les erreurs de données, ou sélectionner les bonnes données pour label next en utilisant la puissante interface utilisateur de Galileo », a-t-il ajouté.

Sanyal a refusé de partager les chiffres de revenus lorsqu’on lui a demandé. Mais il a noté que l’effectif de Galileo, basé à San Francisco, est passé de 14 personnes en mai à « plus de » 20 personnes à ce jour.

A lire également