Semron

Une nouvelle startup basée en Allemagne, Semron, développe ce qu’elle décrit comme des puces « à l’échelle 3D » pour exécuter des modèles d’IA localement sur les smartphones, les écouteurs, les casques VR et autres appareils mobiles.

Co-créées par Kai-Uwe Demasius et Aron Kirschen, diplômés en ingénierie de l’Université de technologie de Dresde, les puces de Semron utilisent des champs électriques pour effectuer des calculs au lieu de courants électriques – le support des processeurs conventionnels. Cela permet aux puces d’atteindre une efficacité énergétique plus élevée tout en réduisant les coûts de fabrication pour les produire, affirme Kirschen.

« En raison d’une pénurie attendue de ressources de calcul pour l’IA, de nombreuses entreprises dont le modèle commercial repose sur l’accès à de telles capacités risquent leur existence – par exemple, les grandes startups qui forment leurs propres modèles », a déclaré Kirschen à TechCrunch dans une interview par courrier électronique. « Les caractéristiques uniques de notre technologie nous permettront d’atteindre le prix des puces actuelles pour les appareils électroniques grand public, même si nos puces sont capables d’exécuter une IA avancée, ce que d’autres ne sont pas. »

Les puces de Semron – pour lesquelles Demasius et Kirschen ont déposé un premier brevet en 2016, quatre ans avant de fonder Semron – exploitent un composant quelque peu inhabituel connu sous le nom de « memcapacitor », ou condensateur avec mémoire, pour exécuter des calculs. La majorité des puces informatiques sont constituées de transistors qui, contrairement aux condensateurs, ne peuvent pas stocker d’énergie ; ils agissent simplement comme des interrupteurs « marche/arrêt », soit en laissant passer un courant électrique, soit en l’arrêtant.

Les memcapacitors de Semron, fabriqués à partir de matériaux semi-conducteurs conventionnels, fonctionnent en exploitant un principe connu en chimie sous le nom de blindage de charge. Les memcondensateurs contrôlent un champ électrique entre une électrode supérieure et une électrode inférieure via une « couche de protection ». La couche de protection, quant à elle, est contrôlée par la mémoire de la puce, qui peut stocker les différents « poids » d’un modèle d’IA. (Les poids agissent essentiellement comme des boutons dans un modèle, manipulant et ajustant ses performances au fur et à mesure qu’il s’entraîne et traite les données.)

L’approche du champ électrique minimise le mouvement des électrons au niveau de la puce, réduisant ainsi la consommation d’énergie et de chaleur. Semron vise à exploiter les propriétés de réduction de chaleur du champ électrique pour placer jusqu’à des centaines de couches de condensateurs mems sur une seule puce, augmentant ainsi considérablement la capacité de calcul.

« Nous utilisons cette propriété pour déployer plusieurs centaines de fois plus de ressources de calcul sur une zone de silicium fixe », a ajouté Kirschen. « Pensez-y comme à des centaines de chips dans un seul paquet. »

Dans une étude de 2021 publiée dans la revue Electronique naturelle, des chercheurs de Semron et de l’Institut Max Planck de physique des microstructures ont réussi à former un modèle de vision par ordinateur à des efficacités énergétiques supérieures à 3 500 TOPS/W, soit 35 à 300 fois supérieures aux techniques existantes. TOPS/W est une mesure un peu vague, mais ce qu’il faut retenir est que les condensateurs mémoire peuvent conduire à des réductions spectaculaires de la consommation d’énergie lors de la formation des modèles d’IA.

Aujourd’hui, Semron n’en est qu’à ses débuts, qui, selon Kirschen, est au stade du « pré-produit » et a des revenus « négligeables » à démontrer. Souvent, la partie la plus difficile de la montée en puissance d’un démarrage de puces est la fabrication de masse et l’atteinte d’une clientèle significative – mais pas nécessairement dans cet ordre.

Ce qui rend les choses plus difficiles pour Semron est le fait qu’il fait face à une forte concurrence dans les entreprises de puces personnalisées comme Kneron, EnCharge et Tenstorrent, qui ont collectivement levé des dizaines de millions de dollars en capital-risque. EnCharge, comme Semron, conçoit des puces informatiques qui utilisent des condensateurs plutôt que des transistors, mais en utilisant une architecture de substrat différente.

Semron, cependant, qui compte un effectif de 11 personnes et prévoit d’augmenter d’environ 25 personnes d’ici la fin de l’année, a réussi à attirer des financements auprès d’investisseurs tels que Join Capital, SquareOne, OTB Ventures et Onsight Ventures. À ce jour, la startup a levé 10 millions d’euros (~10,81 millions de dollars).

Georg Stockinger, partenaire de SquareOne, a déclaré par e-mail :

« Les ressources informatiques deviendront le « pétrole » du 21e siècle. Alors que de grands modèles de langage gourmands en infrastructures conquièrent le monde et que la loi de Moore atteint les limites de la physique, un énorme goulot d’étranglement dans les ressources informatiques façonnera les années à venir. Un accès insuffisant à l’infrastructure informatique ralentira considérablement la productivité et la compétitivité des entreprises et des États-nations entiers. Semron sera un élément clé dans la résolution de ce problème en fournissant une nouvelle puce révolutionnaire intrinsèquement spécialisée dans le calcul des modèles d’IA. Il rompt avec le paradigme informatique traditionnel basé sur les transistors et réduit d’au moins 20 fois les coûts et la consommation d’énergie pour une tâche informatique donnée.

A lire également