Les modèles d’IA sont appliqués à tous les ensembles de données possibles, mais leurs résultats sont incohérents. Cela est vrai dans le monde médical comme partout ailleurs, mais une start-up appelée Piramidal pense avoir une valeur sûre avec un modèle fondamental pour l’analyse des données d’imagerie cérébrale.
Les cofondateurs Dimitris Sakellariou et Kris Pahuja ont observé que la technologie de l’électroencéphalographie (EEG), bien qu’utilisée dans pratiquement tous les hôpitaux, est fragmentée entre de nombreux types d’appareils et nécessite des connaissances spécialisées pour l’interpréter. Un logiciel capable de signaler systématiquement des schémas inquiétants, indépendamment de l’heure, du lieu ou du type d’équipement, pourrait améliorer les résultats pour les personnes atteintes de troubles cérébraux, tout en allégeant la charge de travail des infirmières et des médecins surchargés de travail.
« Dans l'unité de soins intensifs neurologique, les infirmières surveillent le patient et recherchent des signes sur l'EEG. Mais parfois, elles doivent quitter la chambre, et il s'agit de conditions aiguës », explique Pahuja. Une lecture ou une alarme anormale peut signifier un épisode épileptique, un accident vasculaire cérébral ou autre chose. Les infirmières n'ont pas cette formation, et même les médecins spécialistes peuvent reconnaître l'un mais pas l'autre.
Les deux hommes ont créé l'entreprise après avoir travaillé pendant des années sur la faisabilité des outils informatiques en neurologie. Ils ont découvert qu'il existe un moyen d'automatiser l'analyse des données EEG qui est bénéfique pour les soins, mais qu'il n'existe pas de moyen simple de déployer cette technologie là où elle est nécessaire.
« J’ai de l’expérience dans ce domaine, et je me suis assis à côté de neurologues au bloc opératoire pour comprendre exactement pourquoi ces ondes cérébrales sont utiles et comment nous pouvons construire des systèmes informatiques pour les identifier », a déclaré Sakellariou. « Elles sont utiles dans de nombreux contextes, mais chaque fois que vous utilisez un appareil EEG, vous devez reconstruire tout le système pour ce problème spécifique. Vous devez obtenir de nouvelles données, vous devez faire annoter les données par des humains à partir de zéro. »
Ce serait déjà assez difficile si tous les systèmes EEG, toutes les configurations informatiques des hôpitaux et tous les formats de données étaient identiques, mais ils varient considérablement dans les éléments les plus élémentaires, comme le nombre d'électrodes sur la machine et leur emplacement.
Les fondateurs de Piramidal croient — et prétendent savoir, bien que l'aboutissement de leur travail ne soit pas encore publié — qu'un modèle fondamental pour les lectures EEG pourrait permettre de détecter des modèles d'ondes cérébrales vitaux dès le départ plutôt qu'après des mois d'études.
Pour être clair, il ne s'agit pas d'une plateforme médicale à tout faire. Un modèle analogue pourrait être la série Llama de Meta, qui propose des modèles (relativement) ouverts, qui prennent en charge les dépenses initiales liées à la création de la capacité fondamentale de compréhension du langage. Que vous créiez un chatbot de service client ou un ami numérique, c'est à vous de décider, mais aucun des deux ne fonctionne sans la capacité fondamentale de comprendre le langage humain.
Mais les modèles d’IA ne se limitent pas au langage : ils peuvent être formés pour travailler sur la dynamique des fluides, la musique, la chimie, etc. Pour Piramidal, le « langage » est l’activité cérébrale, telle que lue par les EEG, et le modèle résultant serait théoriquement capable de comprendre et d’interpréter les signaux provenant de n’importe quelle configuration, de n’importe quel nombre d’électrodes ou de modèle de machine, et de n’importe quel patient.
Personne n’en a encore construit un – du moins, pas publiquement.
Bien qu'ils aient pris soin de ne pas exagérer leurs progrès actuels, Sakellariou et Pahuja ont déclaré : « Nous avons construit le modèle de base, nous avons mené nos expériences dessus et nous sommes maintenant en train de produire la base de code pour qu'elle soit prête à être mise à l'échelle avec des milliards de paramètres. Il ne s'agit pas de recherche : depuis le premier jour, il s'agit de construire le modèle. »
La première version de production de ce modèle sera déployée dans les hôpitaux au début de l'année prochaine, a déclaré Pahuja. « Nous travaillons sur quatre projets pilotes à partir du premier trimestre ; tous les quatre seront testés dans l'unité de soins intensifs et tous les quatre souhaitent co-développer avec nous. » Ce sera une précieuse preuve de concept que le modèle fonctionne dans les diverses circonstances présentées par toute unité de soins. (Bien entendu, la technologie de PIramidal ira au-delà de toute surveillance que les patients recevraient normalement.)
Le modèle de base devra encore être peaufiné pour certaines applications, un travail que Pahuja a déclaré qu'ils effectueraient eux-mêmes dans un premier temps ; contrairement à de nombreuses autres sociétés d'IA, ils n'ont pas l'intention de construire un modèle de base et de percevoir ensuite des frais sur l'utilisation des API. Mais ils ont clairement indiqué que le modèle était toujours incroyablement précieux en l'état.
« Il n’existe aucun modèle formé à partir de zéro qui puisse faire mieux qu’un modèle pré-entraîné comme le nôtre ; un démarrage à chaud ne peut qu’améliorer les choses », a déclaré Sakellariou. « C’est toujours le plus grand modèle EEG qui ait jamais existé, infiniment plus grand que tout ce qui existe. »
Pour aller de l'avant, Piramidal a besoin de deux choses essentielles à toute entreprise d'IA : de l'argent et des données. La première est lancée, avec un tour de financement de 6 millions de dollars codirigé par Adverb Ventures et Lionheart Ventures, avec la participation de Y Combinator et d'investisseurs providentiels. Cet argent servira à couvrir les coûts de calcul (énormes pour la formation des modèles) et à recruter du personnel.
En ce qui concerne les données, ils en ont suffisamment pour former leur premier modèle de production. « Il s'avère qu'il existe beaucoup de données open source, mais beaucoup de données open source cloisonné « Nous avons donc entrepris de regrouper et d'harmoniser ces données dans un grand magasin de données intégré. »
Les partenariats avec les hôpitaux devraient toutefois fournir des données de formation précieuses et volumineuses, des milliers d’heures de formation. Ces sources et d’autres pourraient contribuer à élever la prochaine version du modèle au-delà des capacités humaines.
« Nous pouvons dès à présent aborder en toute confiance cet ensemble de modèles définis que les médecins recherchent, a déclaré Sakellariou. Mais un modèle plus vaste nous permettra de repérer des modèles plus petits que ceux que l’œil humain peut détecter de manière cohérente et empirique. »
C'est encore loin, mais des capacités surhumaines ne sont pas une condition préalable à l'amélioration de la qualité des soins. Les projets pilotes en unité de soins intensifs devraient permettre d'évaluer et de documenter la technologie de manière beaucoup plus rigoureuse, à la fois dans la littérature scientifique et probablement dans les salles de réunion des investisseurs.