Une startup relativement nouvelle appelée EvolutionaryScale a obtenu une énorme tranche d'argent pour construire des modèles d'IA capables de générer de nouvelles protéines pour la recherche scientifique.
EvolutionaryScale a annoncé mardi avoir levé 142 millions de dollars lors d'un tour de table dirigé par l'ancien PDG de GitHub, Nat Friedman, Daniel Gross et Lux Capital, avec la participation d'Amazon et de NVentures, la branche de capital-risque de Nvidia. La startup a également publié ESM3, un modèle d’IA qu’elle décrit comme un « modèle frontière » pour la biologie – un modèle capable de créer des protéines destinées à être utilisées dans la découverte de médicaments et la science des matériaux.
« ESM3 fait un pas vers un avenir de la biologie où l'IA est un outil pour concevoir à partir des principes premiers, de la même manière que nous concevons des structures, des machines et des micropuces et écrivons des programmes informatiques », a déclaré Alexander Rives, co-fondateur et scientifique en chef d'EvolutionaryScale. une déclaration.
Rives, avec Tom Sercu et Sal Candido, ont commencé à développer des modèles d'IA génératifs pour explorer les protéines alors qu'ils travaillaient au laboratoire de recherche en IA de Meta, FAIR, en 2019. Après la dissolution de leur équipe, Rives, Sercu et Candido ont quitté Meta pour continuer à développer leur travail. avait commencé.
Caractériser les protéines peut révéler les mécanismes d'une maladie, y compris les moyens de la ralentir ou de l'inverser, tout en créer les protéines peuvent conduire à des classes entièrement nouvelles de médicaments, d’outils et de produits thérapeutiques. Mais le processus actuel de conception de protéines en laboratoire est coûteux, tant du point de vue informatique que des ressources humaines.
Concevoir une protéine implique de trouver une structure qui pourrait vraisemblablement effectuer une tâche à l’intérieur du corps ou d’un produit, puis trouver une séquence protéique – la séquence d’acides aminés qui composent une protéine – susceptible de se « replier » dans la structure. Les protéines doivent se plier correctement en formes tridimensionnelles afin de remplir leur fonction prévue.
Entraîné sur un ensemble de données de 2,78 milliards de protéines, ESM3 peut « raisonner sur » la séquence, la structure et la fonction des protéines, explique Rives, permettant au modèle de générer de nouvelles protéines – à la manière d'AlphaFold de Google DeepMind. EvolutionaryScale rend le modèle complet de 98 milliards de paramètres disponible pour une utilisation non commerciale via sa plate-forme de développement cloud Forge et publie une version plus petite du modèle pour une utilisation hors ligne.
EvolutionaryScale affirme avoir utilisé ESM3 pour générer une nouvelle variante de protéine fluorescente verte (GFP), responsable de l'éclat des méduses et des couleurs luminescentes des coraux. Un article préimprimé sur le site Web de l'entreprise détaille son travail.
« Nous travaillons là-dessus depuis longtemps et nous sommes ravis de le partager avec la communauté scientifique et de voir ce qu'elle en fait », a déclaré Rives.
EvolutionaryScale n'est bien sûr pas un organisme de bienfaisance. La société, qui emploie environ 20 personnes, a déclaré à TechCrunch qu'elle prévoyait de gagner de l'argent grâce à une combinaison de partenariats, de frais d'utilisation et de partage des revenus. EvolutionaryScale pourrait par exemple travailler avec des sociétés pharmaceutiques pour intégrer ESM3 dans leurs flux de travail, ou partager les revenus avec des chercheurs pour des découvertes révolutionnaires commercialisées à l'aide d'ESM3.
À cette fin, EvolutionaryScale indique qu'elle proposera bientôt ESM3 et ses dérivés à certains clients AWS via la plate-forme de développement SageMaker AI du fournisseur de cloud, la plate-forme Bedrock AI et le service HealthOmics. ESM3 sera également disponible pour certains clients utilisant les microservices NIM de Nvidia, pris en charge par une licence logicielle d'entreprise Nvidia.
EvolutionaryScale indique que les clients AWS et Nvidia pourront affiner ESM3 en utilisant leurs propres données.
Il faudra peut-être un certain temps avant qu'EvolutionaryScale ne réalise des bénéfices. Dans le pitch deck de l'entreprise, dont Forbes a réussi à obtenir une copie en août dernier, EvolutionaryScale a souligné à plusieurs reprises qu'il pourrait falloir une décennie pour que les modèles d'IA générative aident à concevoir des thérapies. La société devra également faire face à la concurrence de la spin-off de DeepMind, Isomorphic Labs, qui a déjà des contrats avec de grandes sociétés pharmaceutiques, ainsi que d'Insitro, les sociétés cotées en bourse Recursion et Inceptive.
Le grand pari d'EvolutionaryScale consiste à étendre sa formation de modèles pour incorporer des données au-delà des protéines et créer un modèle d'IA à usage général pour les applications biotechnologiques.
« Le rythme incroyable des nouvelles avancées en matière d'IA est motivé par des modèles de plus en plus grands, des ensembles de données de plus en plus volumineux et une puissance de calcul croissante », a déclaré un porte-parole d'EvolutionaryScale. « La même chose est vraie en biologie. Dans le cadre de ses recherches menées au cours des cinq dernières années, l’équipe ESM a exploré la mise à l’échelle en biologie. Nous constatons qu’à mesure que les modèles linguistiques évoluent, ils développent une compréhension des principes sous-jacents de la biologie et découvrent la structure et la fonction biologiques.
Tout cela semble extrêmement ambitieux à ce journaliste, mais avoir des investisseurs aux poches profondes va sûrement aider.