Qdrant, une startup de base de données vectorielles open source, veut aider les développeurs d'IA à exploiter les données non structurées

Pour beaucoup, ChatGPT et le train de battage publicitaire de l’IA générative signalent l’arrivée de l’intelligence artificielle dans le courant dominant. Mais s’il n’est guère question d’un changement sismique au cours des six derniers mois en termes de sensibilisation du public, la demande croissante d’IA pourrait dépasser l’infrastructure nécessaire pour alimenter la myriade de cas d’utilisation qui émergent – et c’est quelque chose que la startup allemande Qdrant est cherche à s’adresser.

Fondée à Berlin en 2021, Qdrant cible les développeurs de logiciels d’IA avec un moteur de recherche vectoriel open source et une base de données pour les données non structurées, qui fait partie intégrante du développement d’applications d’IA, en particulier en ce qui concerne l’utilisation de données en temps réel qui n’ont pas été classés ou étiquetés.

Pour aider à approfondir sa technologie dans la sphère commerciale, Qdrant a annoncé aujourd’hui un financement de démarrage de 7,5 millions de dollars de l’investisseur principal Unusual Ventures, avec la participation de 42cap, IBB Ventures et une poignée d’investisseurs providentiels, dont le co-fondateur de Cloudera, Amr Awadallah. Cela s’ajoute aux 2 millions d’euros (2,2 millions de dollars) de financement de pré-amorçage que Qdrant a levés l’année dernière.

Non structuré

Les bases de données vectorielles, pour les non-initiés, sont conçues pour stocker de telles données non structurées, telles que des images, des vidéos et du texte, permettant aux personnes (et aux systèmes) de rechercher du contenu non étiqueté, ce qui est particulièrement important pour étendre les cas d’utilisation de grands modèles de langage (LLM) tels que comme GPT-4 (qui alimente ChatGPT).

Selon Gartner, les données non structurées constituent jusqu’à 90 % des nouvelles données générées dans l’entreprise et croissent trois fois plus vite que l’équivalent structuré. Dans le même temps, la grande majorité des projets de recherche et développement (R&D) sur l’IA n’arrivent jamais en production, ce qui, selon le PDG et co-fondateur de Qdrant, Andre Zayarni, est dû au manque d’outils appropriés – en fin de compte, être capable de connecter un LLM aux données non structurées en temps réel peut ouvrir une multitude d’opportunités à quiconque cherche à créer des applications d’IA plus utiles.

« Les bases de données vectorielles sont l’extension naturelle de leurs capacités (LLM) », a expliqué Zayarni à TechCrunch. « La plus grande limitation de GPT est qu’il ne ‘connaît’ que les événements qui se sont produits avant le moment où le modèle a été formé, mais s’il est connecté à une base de données vectorielle, la ‘mémoire’ virtuelle d’un LLM peut être étendue avec le temps réel et données du monde réel.

Les investisseurs ont également pris note. L’année dernière, une proposition similaire à Qdrant appelée Pinecone a rapporté 28 millions de dollars, bien que Zayarni considère la fondation open source de Qdrant comme un argument de vente majeur pour les clients potentiels.

« Les ingénieurs font confiance à l’open source, et il sera difficile pour les logiciels propriétaires de rivaliser sur ce marché s’il existe un produit OSS avec une offre similaire, voire meilleure », a déclaré Zayarni.

Il existe déjà d’autres acteurs open source, bien sûr, comme Zilliz, une startup commercialisant la base de données vectorielles open source Milvus et qui a levé 60 millions de dollars l’année dernière. Et plus tôt ce mois-ci, Chroma a obtenu un financement de démarrage de 18 millions de dollars pour développer sa base de données de vecteurs open source « native de l’IA ».

Le fait que Qdrant ait maintenant levé 7,5 millions de dollars en financement de démarrage est quelque peu révélateur de la tête des investisseurs en ce moment – ​​toute technologie qui promet d’aider à faire progresser l’IA et l’apprentissage automatique, et d’étendre ses capacités à tous les développeurs, est clairement une proposition attrayante.

Zayarni a déclaré que Qdrant a passé la majeure partie d’un mois à peaufiner son pitch-deck pour son cycle de financement de démarrage, et a reçu sa première feuille de conditions le deuxième jour après l’envoi de sa plate-forme, qui a été suivie d’une autre feuille de conditions deux jours après ce.

« Nous avions plus de 20 VC intéressés – presque tous voulaient nous rejoindre plus tard en tant que co-investisseurs – et nous aurions très probablement reçu plus d’offres », a déclaré Zayarni. « Mais l’expérience approfondie d’Unusual Ventures avec OSS (logiciel open source) et son modèle de partenaire opérationnel actif au lieu d’un simple investisseur étaient incroyablement attrayants pour nous, nous avons donc décidé de les accompagner. »

Les nouvelles de financement d’aujourd’hui surviennent quelques mois après que Qdrant a lancé son offre de cloud géré, qui est conçue pour aider les développeurs grâce à des déploiements en un clic, des mises à niveau de version automatisées, des sauvegardes et une interface d’administration de base de données qui sera bientôt lancée.

Avec sa nouvelle injection de liquidités, Zayarni a déclaré que Qdrant travaille également sur un produit d’entreprise qui peut être hébergé sur site ou dans un cloud privé, qu’il prévoit de lancer plus tard cette année.

A lire également