Flow affirme qu'il peut multiplier par 100 la puissance de n'importe quel processeur avec sa puce associée et un peu d'huile de coude

Une startup finlandaise appelée Flow Computing fait l'une des affirmations les plus folles jamais entendues dans l'ingénierie du silicium : en ajoutant sa puce compagnon exclusive, n'importe quel processeur peut instantanément doubler ses performances, les augmentant jusqu'à 100 fois avec des ajustements logiciels.

Si cela fonctionne, cela pourrait aider l’industrie à répondre à la demande insatiable de calcul des fabricants d’IA.

Flow est une spin-out de VTT, une organisation de recherche financée par l'État finlandais qui ressemble un peu à un laboratoire national. La technologie de puce qu'elle commercialise, qu'elle a baptisée Parallel Processing Unit, est le résultat de recherches effectuées dans ce laboratoire (bien que VTT soit un investisseur, la propriété intellectuelle appartient à Flow).

Cette affirmation, Flow est le premier à l’admettre, est risible à première vue. Vous ne pouvez pas simplement extraire comme par magie des performances supplémentaires des processeurs dans toutes les architectures et bases de code. Si tel est le cas, Intel ou AMD ou quiconque l'aurait fait il y a des années.

Mais Flow a travaillé sur quelque chose qui a était théoriquement possible – c'est juste que personne n'a été capable d'y parvenir.

Les unités centrales de traitement ont parcouru un long chemin depuis les débuts des tubes à vide et des cartes perforées, mais à certains égards fondamentaux, elles sont toujours les mêmes. Leur principale limitation est qu’en tant que processeurs série plutôt que parallèle, ils ne peuvent faire qu’une seule chose à la fois. Bien sûr, ils commutent cette chose un milliard de fois par seconde sur plusieurs cœurs et voies – mais ce sont autant de moyens de s'adapter à la nature à voie unique du processeur. (Un GPU, en revanche, effectue simultanément de nombreux calculs connexes mais est spécialisé dans certaines opérations.)

« Le processeur est le maillon le plus faible de l'informatique », a déclaré Timo Valtonen, co-fondateur et PDG de Flow. « Il n'est pas à la hauteur de sa tâche et cela devra changer. »

Les processeurs sont devenus très rapides, mais même avec une réactivité de l'ordre de la nanoseconde, il y a énormément de gaspillage dans la façon dont les instructions sont exécutées simplement en raison de la limitation de base selon laquelle une tâche doit être terminée avant le démarrage de la suivante. (Je simplifie ici, n'étant pas moi-même un ingénieur en puces.)

Ce que Flow prétend avoir fait, c'est supprimer cette limitation, transformant le processeur d'une rue à une voie en une autoroute à plusieurs voies. Le processeur est toujours limité à effectuer une tâche à la fois, mais le PPU de Flow, comme on l'appelle, effectue essentiellement une gestion du trafic à l'échelle de la nanoseconde pour déplacer les tâches vers et hors du processeur plus rapidement qu'auparavant.

Considérez le processeur comme un chef travaillant dans une cuisine. Le chef ne peut travailler que très vite, mais que se passerait-il si cette personne avait un assistant surhumain qui échangeait les couteaux et les outils entre et hors des mains du chef, nettoyait les plats préparés et mettait de nouveaux ingrédients, supprimant toutes les tâches qui ne sont pas de véritables tâches de chef ? Le chef n’a encore que deux mains, mais il peut désormais travailler dix fois plus vite.

Graphique (dans le journal, note) montrant les améliorations d'une puce améliorée par FPGA PPU par rapport aux puces Intel non modifiées. L'augmentation du nombre de cœurs PPU améliore continuellement les performances.
Crédits images : Calcul de flux

Ce n'est pas une analogie parfaite, mais cela vous donne une idée de ce qui se passe ici, du moins d'après les tests internes et les démos de Flow avec l'industrie (et ils discutent avec tout le monde). Le PPU n'augmente pas la fréquence d'horloge et ne pousse pas le système d'une autre manière qui entraînerait un excès de chaleur ou de puissance ; en d’autres termes, on ne demande pas au chef de hacher deux fois plus vite. Il utilise simplement plus efficacement les cycles CPU déjà en cours.

Ce genre de chose n'est pas nouveau, dit Valtonen. « Cela a été étudié et discuté dans le monde universitaire de haut niveau. Vous pouvez déjà faire de la parallélisation, mais cela casse le code existant, et c'est alors inutile.

Cela pourrait donc être fait. Cela ne pourrait tout simplement pas être fait sans réécrire tout le code du monde à partir de zéro, ce qui en fait un échec. Un problème similaire a été résolu par une autre société informatique nordique, ZeroPoint, qui a atteint des niveaux élevés de compression de mémoire tout en préservant la transparence des données avec le reste du système.

En d’autres termes, la grande réussite de Flow n’est pas la gestion du trafic à grande vitesse, mais plutôt le fait de le faire sans avoir à modifier le code du processeur ou de l’architecture testée. Cela semble un peu déséquilibré de dire que du code arbitraire peut être exécuté deux fois plus rapidement sur n'importe quelle puce sans aucune modification au-delà de l'intégration du PPU avec la puce.

C'est là que réside le principal défi du succès de Flow en tant qu'entreprise : contrairement à un produit logiciel, la technologie de Flow doit être incluse au niveau de la conception de la puce, ce qui signifie qu'elle ne fonctionne pas de manière rétroactive, et la première puce dotée d'un PPU serait nécessairement un long chemin à parcourir. en bas de la route. Flow a montré que la technologie fonctionne dans les configurations de test basées sur FPGA, mais les fabricants de puces devraient engager beaucoup de ressources pour constater les gains en question.

L'équipe fondatrice de Flow, de gauche à droite : Jussi Roivainen, Martti Forsell et Timo Valtonen.
Crédits images : Calcul de flux

L'ampleur de ces gains, et le fait que les améliorations du processeur ont été itératives et fractionnaires au cours des dernières années, pourraient bien inciter ces fabricants de puces à frapper à la porte de Flow de manière assez urgente. Si vous pouvez vraiment doubler vos performances en une génération avec un seul changement de disposition, c'est une évidence.

D'autres gains de performances proviennent de la refactorisation et de la recompilation du logiciel pour mieux fonctionner avec le combo PPU-CPU. Flow affirme avoir constaté des augmentations allant jusqu'à 100 fois avec un code modifié (mais pas nécessairement entièrement réécrit) pour tirer parti de sa technologie. La société travaille à proposer des outils de recompilation pour simplifier cette tâche pour les fabricants de logiciels qui souhaitent optimiser les puces compatibles Flow.

L'analyste Kevin Krewell de Tirias Research, qui a été informé de la technologie de Flow et considéré comme un point de vue extérieur sur ces questions, était plus préoccupé par l'adoption par l'industrie que par les fondamentaux.

Il a souligné, à juste titre, que l'accélération de l'IA constitue actuellement le plus grand marché, quelque chose qui peut être ciblé avec du silicium spécial comme le populaire H100 de Nvidia. Même si un processeur accéléré par le PPU entraînerait des gains à tous les niveaux, les fabricants de puces ne voudront peut-être pas trop faire bouger les choses. Et il y a simplement la question de savoir si ces entreprises sont prêtes à investir des ressources importantes dans une technologie largement non éprouvée alors qu'elles ont probablement un plan quinquennal qui serait bouleversé par ce choix.

La technologie de Flow deviendra-t-elle un composant indispensable pour tous les fabricants de puces, le catapultant vers la fortune et l'importance ? Ou les fabricants de puces aux petits budgets décideront-ils de maintenir le cap et de continuer à tirer des rentes du marché informatique en croissance constante ? Probablement quelque part entre les deux – mais il est révélateur que, même si Flow a réalisé ici une prouesse d’ingénierie majeure, comme toutes les startups, l’avenir de l’entreprise dépend de ses clients.

Flow sort tout juste de la furtivité, avec 4 millions d'euros (environ 4,3 millions de dollars) de financement de pré-amorçage dirigé par Butterfly Ventures, avec la participation de FOV Ventures, Sarsia, Stephen Industries, Superhero Capital et Business Finland.

A lire également