Tout ce que vous savez sur la vision par ordinateur pourrait bientôt être faux

Ubicept veut que la moitié des caméras du monde voient les choses différemment

La vision par ordinateur pourrait être beaucoup plus rapide et meilleur si nous ignorons le concept d’images fixes et analysons directement le flux de données d’une caméra. C’est du moins la théorie sous laquelle fonctionne la toute nouvelle idée originale du laboratoire MIT Media, Ubicept.

La plupart des applications de vision par ordinateur fonctionnent de la même manière : une caméra prend une image (ou une série rapide d’images, dans le cas de la vidéo). Ces images fixes sont transmises à un ordinateur, qui effectue ensuite l’analyse pour déterminer ce qu’il y a dans l’image. Cela semble assez simple.

Mais il y a un problème : ce paradigme suppose que la création d’images fixes est une bonne idée. En tant qu’humains habitués à voir de la photographie et de la vidéo, cela peut sembler raisonnable. Les ordinateurs s’en moquent, cependant, et Ubicept pense qu’il peut rendre la vision par ordinateur bien meilleure et plus fiable en ignorant l’idée des cadres.

L’entreprise elle-même est une collaboration entre ses co-fondateurs. Sebastian Bauer est PDG de l’entreprise et postdoctorant à l’Université du Wisconsin, où il travaillait sur les systèmes lidar. Tristan Swedish est désormais CTO d’Ubicept. Avant cela, il était assistant de recherche et titulaire d’une maîtrise et d’un doctorat. étudiant au MIT Media Lab pendant huit ans.

« Il y a 45 milliards de caméras dans le monde, et la plupart d’entre elles créent des images et des vidéos qui ne sont pas vraiment regardées par un humain », a expliqué Bauer. « Ces caméras sont principalement destinées à la perception, pour que les systèmes prennent des décisions en fonction de cette perception. Pensez à la conduite autonome, par exemple, comme un système où il s’agit de reconnaissance des piétons. Il y a toutes ces études qui sortent qui montrent que la détection des piétons fonctionne très bien en plein jour mais particulièrement mal en basse lumière. D’autres exemples sont les caméras pour le tri industriel, l’inspection et l’assurance qualité. Toutes ces caméras sont utilisées pour la prise de décision automatisée. Dans des pièces suffisamment éclairées ou à la lumière du jour, elles fonctionnent bien. Mais dans des conditions de faible luminosité, en particulier en cas de mouvement rapide, des problèmes surgissent.

La solution de l’entreprise consiste à contourner le « image fixe » comme source de vérité pour la vision par ordinateur et à mesurer à la place les photons individuels qui frappent directement un capteur d’imagerie. Cela peut être fait avec un réseau de diodes à avalanche à photon unique (ou un réseau SPAD, entre amis). Ce flux brut de données peut ensuite être introduit dans un réseau de portes programmables sur le terrain (FPGA, un type de processeur super spécialisé) et analysé plus en détail par des algorithmes de vision par ordinateur.

La société nouvellement fondée a présenté sa technologie au CES de Las Vegas en janvier et a des projets assez audacieux pour l’avenir de la vision par ordinateur.

« Notre vision est d’avoir la technologie sur au moins 10 % des caméras au cours des cinq prochaines années et sur au moins 50 % des caméras au cours des 10 prochaines années », a projeté Bauer. « Lorsque vous détectez chaque photon individuel avec une résolution temporelle très élevée, vous faites du mieux que la nature vous permet de faire. Et vous voyez les avantages, comme les vidéos de haute qualité sur notre page Web, qui font simplement exploser tout le reste.

TechCrunch a vu la technologie en action lors d’une récente démonstration à Boston et a voulu explorer comment la technologie fonctionne et quelles sont les implications pour la vision par ordinateur et les applications d’IA.

Une nouvelle forme de vision

Les appareils photo numériques fonctionnent généralement en saisissant une exposition d’une seule image en « comptant » le nombre de photons qui frappent chacun des pixels du capteur sur une certaine période de temps. À la fin de la période de temps, tous ces photons sont multipliés ensemble, et vous avez une photographie fixe. Si rien dans l’image ne bouge, cela fonctionne très bien, mais la chose « si rien ne bouge » est une mise en garde assez importante, surtout en ce qui concerne la vision par ordinateur. Il s’avère que lorsque vous essayez d’utiliser des caméras pour prendre des décisions, tout bouge tout le temps.

Bien sûr, avec les données brutes, la société est toujours en mesure de combiner le flux de photons dans des images, ce qui crée une vidéo magnifiquement nette sans flou de mouvement. Peut-être plus excitant, se passer de l’idée de cadres signifie que l’équipe d’Ubicept a pu prendre les données brutes et les analyser directement. Voici un exemple de vidéo de la différence spectaculaire que cela peut faire dans la pratique :

A lire également

Start-up

General Atlantic investit 100 millions de dollars supplémentaires dans PhonePe

ParL'équipe rédactionnelle 12 avril 202312 avril 2023

General Atlantic a versé 100 millions de dollars supplémentaires dans PhonePe, trois mois après avoir dirigé un investissement de 350 millions de dollars dans la startup indienne de la fintech qui a jusqu’à présent levé 750 millions de dollars dans le cadre d’un cycle de financement en cours. PhonePe, soutenu par Walmart, a divulgué mercredi…

Start-up

Assured Allies obtient 42,5 millions de dollars de série B pour aider les Américains à « vieillir avec succès »

ParL'équipe rédactionnelle 7 mars 2023

Assured Allies, une société insurtech axée sur l’épargne-retraite, a annoncé aujourd’hui la clôture d’un financement de série B de 42,5 millions de dollars. C’est une taille de série B assez importante compte tenu de l’environnement difficile de collecte de fonds pour les entreprises d’insurtech noté par plusieurs de mes collègues dans des histoires récentes. Par…

Start-up

Stability AI se lance dans le jeu de la génération vidéo

ParL'équipe rédactionnelle 22 novembre 202322 novembre 2023

Des startups d’IA qui ne sont pas Il semblerait qu’OpenAI se déconnecte cette semaine – s’en tenant à ses feuilles de route de produits même si la couverture du chaos chez OpenAI domine les ondes. Voir : Stability AI, qui a annoncé cet après-midi Stable Video Diffusion, un modèle d’IA qui génère des vidéos en…

Start-up

Les fondateurs actifs font de bons investisseurs, mais font-ils de bons VC ?

ParL'équipe rédactionnelle 16 mai 202316 mai 2023

L’expérience de l’opérateur a devenu critique dans le capital-risque au cours des dernières années. Les sociétés de capital-risque financières pure-play perdent la faveur des startups par rapport aux investisseurs qui apportent une expérience de construction en plus de leur argent. Mais tous les antécédents d’exploitation ne sont pas également utiles. Si un VC a de…

Start-up

CoPilot, une application d’entraînement qui met en relation les utilisateurs avec des coachs fitness à distance, lève 6,5 millions de dollars

ParL'équipe rédactionnelle 5 octobre 20235 octobre 2023

Copilote, une application de formation numérique qui met en relation les utilisateurs avec des entraîneurs de fitness individuels à distance, a levé 6,5 millions de dollars dans le cadre d’un financement de série A-1 dirigé par Jackson Square Ventures. L’application, qui a vu plus de 1,5 million d’entraînements effectués sur la plateforme, met en relation…

Start-up

Converge Bio lève 25 millions de dollars, soutenu par Bessemer et les dirigeants de Meta, OpenAI, Wiz

ParL'équipe rédactionnelle 13 janvier 202613 janvier 2026

L’intelligence artificielle évolue rapidement vers la découverte de médicaments alors que les sociétés pharmaceutiques et biotechnologiques cherchent des moyens de réduire de plusieurs années les délais de R&D et d’augmenter les chances de succès dans un contexte de hausse des coûts. Plus de 200 startups sont désormais en compétition pour intégrer l’IA directement dans les…