Cette startup de stockage de données distribué veut s'attaquer au Big Cloud

L’explosion des entreprises d’IA a poussé la demande de puissance de calcul à de nouveaux extrêmes, et des entreprises comme CoreWeave, Together AI et Lambda Labs ont capitalisé sur cette demande, attirant d’immenses attentions et capitaux pour leur capacité à offrir une capacité de calcul distribuée.

Mais la plupart des entreprises stockent toujours leurs données auprès des trois grands fournisseurs de cloud, AWS, Google Cloud et Microsoft Azure, dont les systèmes de stockage ont été conçus pour conserver les données à proximité de leurs propres ressources de calcul, et non sur plusieurs cloud ou régions.

« Les charges de travail et l'infrastructure d'IA modernes choisissent l'informatique distribuée plutôt que le grand cloud », a déclaré à TechCrunch Ovais Tariq, co-fondateur et PDG de Tigris Data. « Nous voulons offrir la même option pour le stockage, car sans stockage, le calcul n'est rien. »

Tigris, fondée par l'équipe qui a développé la plate-forme de stockage d'Uber, construit un réseau de centres de stockage de données localisés qui, selon elle, peuvent répondre aux besoins de calcul distribué des charges de travail d'IA modernes. La plate-forme de stockage native IA de la startup « évolue avec votre calcul, [allows] données [to] se réplique automatiquement là où se trouvent les GPU, prend en charge des milliards de petits fichiers et fournit un accès à faible latence pour les charges de travail de formation, d'inférence et d'agent », a déclaré Tariq.

Pour faire tout cela, Tigris a récemment levé un tour de table de série A de 25 millions de dollars dirigé par Spark Capital et auquel ont participé des investisseurs existants, dont Andreessen Horowitz, a appris TechCrunch en exclusivité. La startup va à l’encontre des opérateurs historiques, que Tariq appelle « Big Cloud ».

Ovais Tariq, PDG de Tigris, dans un centre de données Tigris en VirginieCrédits images :Données sur le Tigre

Tariq estime que ces opérateurs historiques proposent non seulement un service de stockage de données plus coûteux, mais également moins efficace. AWS, Google Cloud et Microsoft Azure facturent historiquement des frais de sortie (appelés « taxe cloud » dans le secteur) si un client souhaite migrer vers un autre fournisseur de cloud, ou télécharger et déplacer ses données s'il souhaite, par exemple, utiliser un GPU moins cher ou former des modèles simultanément dans différentes parties du monde. Pensez-y comme si vous deviez payer un supplément à votre salle de sport si vous voulez arrêter d'y aller.

Selon Batuhan Taskaya, responsable de l'ingénierie chez Fal.ai, l'un des clients de Tigris, ces coûts représentaient autrefois la majorité des dépenses cloud de Fal.

Au-delà des frais de sortie, Tariq affirme qu'il existe toujours un problème de latence avec les grands fournisseurs de cloud. « Les frais de sortie ne sont qu'un symptôme d'un problème plus profond : un stockage centralisé qui ne peut pas suivre le rythme d'un écosystème d'IA décentralisé et à haut débit », a-t-il déclaré.

La plupart des plus de 4 000 clients de Tigris sont comme Fal.ai : des startups d'IA générative qui créent des modèles d'images, de vidéos et de voix, qui ont tendance à avoir de grands ensembles de données sensibles à la latence.

« Imaginez parler à un agent IA qui fait de l'audio local », a déclaré Tariq. « Vous voulez la latence la plus faible. Vous voulez que votre calcul soit local, à proximité, et vous voulez que votre stockage soit également local. »

Les grands cloud ne sont pas optimisés pour les charges de travail d'IA, a-t-il ajouté. La diffusion d’ensembles de données massifs à des fins de formation ou l’exécution d’inférences en temps réel dans plusieurs régions peuvent créer des goulots d’étranglement de latence, ralentissant les performances du modèle. Mais le fait de pouvoir accéder au stockage localisé signifie que les données sont récupérées plus rapidement, ce qui signifie que les développeurs peuvent exécuter des charges de travail d'IA de manière fiable et plus rentable à l'aide de cloud décentralisés.

« Tigris nous permet d'adapter nos charges de travail dans n'importe quel cloud en fournissant un accès au même système de fichiers de données depuis tous ces endroits sans facturer la sortie », a déclaré Fal's Taskaya.

Il existe d'autres raisons pour lesquelles les entreprises souhaitent disposer de données plus proches de leurs options de cloud distribué. Par exemple, dans des domaines hautement réglementés comme la finance et la santé, l’un des principaux obstacles à l’adoption des outils d’IA est que les entreprises doivent garantir la sécurité des données.

Une autre motivation, explique Tariq, est que les entreprises souhaitent de plus en plus posséder leurs données, soulignant comment Salesforce a empêché plus tôt cette année ses concurrents en matière d'IA d'utiliser les données Slack. « Les entreprises sont de plus en plus conscientes de l'importance des données, de la manière dont elles alimentent les LLM et l'IA », a déclaré Tariq. « Ils veulent avoir plus de contrôle. Ils ne veulent pas que quelqu'un d'autre ait le contrôle. »

Avec ces nouveaux fonds, Tigris a l'intention de continuer à construire ses centres de stockage de données pour répondre à la demande croissante – Tariq affirme que la startup a connu une croissance 8 fois supérieure chaque année depuis sa création en novembre 2021. Tigris possède déjà trois centres de données en Virginie, Chicago et San Jose, et souhaite poursuivre son expansion aux États-Unis ainsi qu'en Europe et en Asie, notamment à Londres, Francfort et Singapour.

A lire également