Les entreprises et les gouvernements recherchent des outils pour exécuter l’IA localement dans le but de réduire les coûts de l’infrastructure cloud et de renforcer les capacités souveraines. Quadric, une startup de puces IP fondée par des vétérans de la première société minière de Bitcoin 21E6, tente d'alimenter ce changement, en s'étendant au-delà de l'automobile vers les ordinateurs portables et les appareils industriels, avec sa technologie d'inférence sur l'appareil.
Cette expansion porte déjà ses fruits.
Quadric a enregistré entre 15 et 20 millions de dollars de revenus de licences en 2025, contre environ 4 millions de dollars en 2024, a déclaré le PDG Veerbhan Kheterpal (photo ci-dessus, au centre) à TechCrunch dans une interview. La société, basée à San Francisco et possédant un bureau à Pune, en Inde, vise jusqu'à 35 millions de dollars cette année pour développer une activité d'IA sur appareil basée sur des redevances. Cette croissance a stimulé l'entreprise, dont la valorisation post-monétaire se situe désormais entre 270 et 300 millions de dollars, contre environ 100 millions de dollars dans sa série B 2022, a déclaré Kheterpal.
Cela a également contribué à attirer des investisseurs vers l’entreprise. Quadric a annoncé la semaine dernière un tour de table de série C de 30 millions de dollars mené par le fonds ACCELERATE, géré par BEENEXT Capital Management, portant son financement total à 72 millions de dollars. Cette augmentation intervient alors que les investisseurs et les fabricants de puces cherchent des moyens de transférer davantage de charges de travail d'IA de l'infrastructure cloud centralisée vers des appareils et des serveurs locaux, a déclaré Kheterpal à TechCrunch.
De l'automobile à tout
Quadric a débuté dans l'automobile, où l'IA intégrée aux appareils peut alimenter des fonctions en temps réel telles que l'assistance à la conduite. Kheterpal a déclaré que la diffusion des modèles basés sur des transformateurs en 2023 a poussé l'inférence dans « tout », créant une forte inflexion commerciale au cours des 18 derniers mois, alors que de plus en plus d'entreprises tentent d'exécuter l'IA localement plutôt que de s'appuyer sur le cloud.
« Nvidia est une plate-forme solide pour l'IA des centres de données », a déclaré Kheterpal. « Nous cherchions à créer une infrastructure similaire à celle de CUDA ou programmable pour l'IA sur appareil. »
Contrairement à Nvidia, Quadric ne fabrique pas lui-même de puces. Au lieu de cela, il autorise l'IP du processeur d'IA programmable, que Kheterpal a décrit comme un « plan » que les clients peuvent intégrer dans leur propre silicium, ainsi qu'une pile logicielle et une chaîne d'outils pour exécuter des modèles, y compris la vision et la voix, sur l'appareil.
Les clients de la startup comprennent des imprimantes, des voitures et des ordinateurs portables IA, notamment Kyocera et le fournisseur automobile japonais Denso, qui fabrique des puces pour les véhicules Toyota. Les premiers produits basés sur la technologie Quadric devraient être commercialisés cette année, à commencer par les ordinateurs portables, a déclaré Kheterpal à TechCrunch.
Néanmoins, Quadric regarde désormais au-delà des déploiements commerciaux traditionnels et se tourne vers les marchés en explorant des stratégies d'« IA souveraine » pour réduire la dépendance à l'égard des infrastructures basées aux États-Unis, a déclaré Kheterpal. La startup explore des clients en Inde et en Malaisie, a-t-il ajouté, et compte le PDG de Moglix, Rahul Garg, comme investisseur stratégique qui l'aide à façonner son approche « souveraine » en Inde. Quadric emploie près de 70 personnes dans le monde, dont une quarantaine aux États-Unis et une dizaine en Inde.
Cette poussée est motivée par le coût croissant de l'infrastructure d'IA centralisée et la difficulté rencontrée par de nombreux pays pour construire des centres de données à grande échelle, a déclaré Kheterpal, suscitant davantage d'intérêt pour les configurations « d'IA distribuée » où l'inférence s'exécute sur des ordinateurs portables ou de petits serveurs sur site dans les bureaux plutôt que de s'appuyer sur des services basés sur le cloud pour chaque requête.
Le Forum économique mondial a souligné ce changement dans un article récent, à mesure que l’inférence de l’IA se rapproche des utilisateurs et s’éloigne des architectures purement centralisées. De même, EY a déclaré dans un rapport de novembre que l’approche souveraine de l’IA a gagné du terrain à mesure que les décideurs politiques et les groupes industriels font pression pour des capacités nationales d’IA couvrant le calcul, les modèles et les données, plutôt que de s’appuyer entièrement sur des infrastructures étrangères.
Pour les fabricants de puces, le défi est que les modèles d’IA évoluent plus rapidement que les cycles de conception matérielle, a déclaré Kheterpal. Il a fait valoir que les clients ont besoin d'un processeur IP programmable capable de suivre le rythme des mises à jour logicielles plutôt que d'exiger des refontes coûteuses à chaque fois que les architectures passent des anciens modèles axés sur la vision aux systèmes actuels basés sur des transformateurs.
Quadric se présente comme une alternative aux fournisseurs de puces tels que Qualcomm, qui utilise généralement sa technologie d'IA dans ses propres processeurs, ainsi qu'aux fournisseurs IP comme Synopsys et Cadence, qui vendent des blocs moteurs de traitement neuronal. Kheterpal a déclaré que l'approche de Qualcomm peut enfermer les clients dans son propre silicium, alors que les fournisseurs IP traditionnels proposent des blocs moteurs que de nombreux clients trouvent difficiles à programmer.
L'approche programmable de Quadric permet aux clients de prendre en charge de nouveaux modèles d'IA via des mises à jour logicielles plutôt que de reconcevoir le matériel, ce qui donne un avantage dans un secteur où le développement de puces peut prendre des années, alors que les architectures de modèles changent aujourd'hui en quelques mois.
Néanmoins, Quadric en est encore au début de sa construction, avec une poignée de clients signés jusqu'à présent et une grande partie de son potentiel de croissance à long terme dépend de la transformation des accords de licence actuels en expéditions à gros volume et en redevances récurrentes.
