Viso envisage le no-code pour l'avenir de la vision par ordinateur et obtient un financement à grande échelle

La vision par ordinateur est devenue monnaie courante dans d’innombrables secteurs, mais les méthodes de création et de contrôle de ces modèles visuels d’IA ne sont pas si simples. Viso construit une plate-forme de bout en bout avec peu ou pas de code qui permet aux entreprises de déployer leur propre pile de vision par ordinateur, et elles viennent de récolter 9 millions de dollars pour évoluer.

Il existe bien sûr des tonnes de modèles et de services de vision par ordinateur, mais beaucoup correspondent en quelque sorte à la description de « modèle en tant qu’API ». Supposons que vous souhaitiez reconnaître une personne et évaluer si elle est debout ou assise, afin de pouvoir déterminer l’achalandage d’une gare ou d’un restaurant.

Il existe des options entièrement conçues pour la reconnaissance de personnes et de poses, mais elles peuvent ne pas correspondre à votre cas d’utilisation ou à votre modèle de sécurité, ou elles sont trop coûteuses à mettre à l’échelle. Créer le vôtre est une option, mais l’expertise requise pour former et déployer des modèles de CV modernes n’est pas triviale : à moins que vous n’ayez le temps et l’argent nécessaires pour constituer une véritable équipe, cela peut être hors de votre portée.

C’est le type de situation à laquelle Viso veut remédier, en fournissant une plate-forme permettant de créer votre propre modèle de CV de niveau entreprise sans y consacrer le temps et les ressources que cela prend souvent.

« Au début du cycle d’adoption, les entreprises ont recours à l’achat/à la location de systèmes de vision par ordinateur préfabriqués. Cependant, ils doivent à terme rassembler toutes les initiatives de vision par ordinateur (rationalisation), les intégrer et les personnaliser en profondeur, et également les « s’approprier » car les données sont sensibles et la technologie a une valeur stratégique. C’est pourquoi les entreprises de ces secteurs commencent à embaucher des ingénieurs en IA », a expliqué Gaudenz Boesch, co-fondateur et co-PDG de Viso.

Exemples d’applications de vision par ordinateur basées sur Viso.

Mais contrairement à de nombreux autres besoins au niveau de l’entreprise, la vision par ordinateur ne dispose pas d’une « infrastructure spécialisée » pour la construire et la déployer efficacement.

« Les entreprises doivent le construire à partir de zéro, en essayant d’assembler une pléthore de plates-formes logicielles et matérielles (caméras, serveurs) déconnectées à travers l’organisation », a-t-il poursuivi. Cela nécessite à son tour une expertise dans de nombreux domaines qui devient rapidement trop coûteuse.

L’approche de Viso semblera probablement familière à quiconque a utilisé des outils sans code dans d’autres contextes. Il s’agit d’une série de modules, à la fois prédéfinis et personnalisables, qui permettent à un utilisateur de sélectionner, former et déployer des modèles de vision par ordinateur selon ses besoins.

Une vue du processus de création de modèle.

Bien sûr, vous aurez toujours besoin d’un certain niveau d’expertise : quel modèle de reconnaissance d’objets doit-il exécuter ? Où les données de formation seront-elles conservées ? Comment l’inférence est-elle gérée ? Mais une poignée d’ingénieurs peuvent faire bien plus de travail, et le tout au même endroit plutôt que disséminés dans une douzaine d’outils, d’API et de blocs-notes de code.

Viso dit que c’est de bout en bout, et cela ne semble pas exagéré. La vision par ordinateur nécessite d’abord des données, des processus de formation, puis la mise en œuvre, l’hébergement, le travail de conformité, etc. – et cela semble vraiment être une solution « de la soupe aux noix » qui met tout cela au même endroit :

C’est une grande liste !

Donc, si vous fabriquiez ce «détecteur occupé» plus tôt, vous pourriez éventuellement y arriver avec rien d’autre qu’une centaine d’heures de séquences et en ressortir une semaine ou deux plus tard avec un produit complet. Cela comprendrait l’analyse de bas niveau et le stockage des données brutes, l’annotation et l’étiquetage, la formation et les tests du modèle de base, l’intégration du produit, le déploiement en ligne ou hors ligne, l’analyse, les mises à jour et les sauvegardes, ainsi que l’accès et la sécurité… le tout sans quitter Viso, et probablement sans toucher aux touches point-virgule ou crochet. (Il existe diverses études de cas ici.)

Bien qu’il existe d’autres plates-formes de vision par ordinateur, Boesch a déclaré qu’aucune n’était « conçue pour gérer des applications de vision par ordinateur très complexes à grande échelle et les maintenir en continu », se concentrant plutôt sur une poignée de tâches de la liste ci-dessus. Viso vise à prendre en charge autant de modèles et de méthodes, de matériel et de cas d’utilisation que possible, tout en garantissant que le client s’approprie le résultat final.

N’étant pas moi-même développeur, je ne peux pas dire à quel point différents cas d’utilisation pourraient être difficiles ou faciles, mais il existe certainement un attrait fondamental (comme en témoigne la popularité d’autres outils low-code et de bout en bout) à utiliser des plates-formes moins nombreuses et plus complètes plutôt que de rassembler une série de plates-formes déconnectées.

Les investisseurs de Viso semblent le penser, et la société a levé 9,2 millions de dollars en financement de démarrage, dirigé par Accel et avec la participation de divers investisseurs providentiels. Il est intéressant de noter que l’entreprise a démarré depuis sa création en 2018 en Suisse.

Boesch a déclaré que l’explosion de la demande a poussé l’entreprise à procéder à cette augmentation, ce qui, selon les termes de l’entreprise AI, est assez modeste par rapport aux produits proposés et aux clients existants. Il a déclaré que Viso a déjà été adopté par plusieurs grandes entreprises, dont Pricewaterhouse Cooper, DHL et Orange, et a connu une croissance de nouveaux clients multipliée par 6 depuis 2022.

A lire également