Coval évalue les agents IA vocaux et de chat comme les voitures autonomes

Quel est le point commun entre les agents vocaux IA et les voitures autonomes ? Leurs performances peuvent être évaluées de la même manière, affirme Brooke Hopkins, ancien responsable technique chez Waymo. Coval, la nouvelle startup de Hopkins, cherche justement à faire cela.

« Quand j'ai quitté Waymo, j'ai réalisé que bon nombre de ces problèmes que nous avions chez Waymo étaient exactement ceux auxquels le reste de l'industrie de l'IA était confronté », a déclaré Hopkins (photo ci-dessus au centre) à TechCrunch. « Mais tout le monde disait qu'il s'agissait d'un nouveau paradigme, que nous devions proposer des pratiques de test à partir des premiers principes et que, fondamentalement, nous devions tous tout recréer. Et j'ai regardé cela et j'ai dit, attendez, nous avons passé les 10 dernières années à conduire de manière autonome pour trouver comment faire cela.

En 2024, elle a décidé de lancer Coval, une plate-forme qui crée des simulations pour les agents IA vocaux et de chat qui testent et évaluent la façon dont ils effectuent des tâches de la même manière que Hopkins a testé les voitures autonomes chez Waymo. Coval peut exécuter des milliers de simulations simultanément, comme demander à l'agent de faire une réservation de restaurant ou de demander à l'agent de répondre à une question du service client posée de manière indirecte.

La technologie de Coval évalue les agents sur un ensemble général de mesures, mais les entreprises peuvent également personnaliser ce qu'elles recherchent et utiliser Coval pour continuer à évaluer les régressions. Les utilisateurs peuvent également récupérer ces données et les informations qu'ils en tirent, et les transmettre à leurs clients finaux, soit pour une démonstration, soit comme outil de surveillance pour montrer à leurs clients que l'agent fonctionne comme prévu.

« L'un des principaux obstacles à l'adoption d'agents par les entreprises est qu'elles soient convaincues qu'il ne s'agit pas simplement d'une démonstration de fumée et de miroirs », a déclaré Hopkins. « Choisir entre les fournisseurs est une tâche très compliquée pour ces dirigeants, car il est tout simplement très difficile de savoir ce que vous demandez ou comment prouver que ces agents font ce que vous attendez. Et cela donne donc à nos entreprises la capacité de vraiment le montrer et de le démontrer.

Hopkins a vraiment formulé l'idée derrière Coval lors du lot Y Combinator Summer 2024 avant de lancer le produit publiquement en octobre 2024. Elle a déclaré que la demande avait été forte et est devenue explosive au cours des deux derniers mois, les clients se demandant à quelle vitesse ils peuvent obtenir leurs agents. évalué.

La startup basée à San Francisco annonce maintenant un tour de table de 3,3 millions de dollars dirigé par MaC Venture Capital avec la participation de Y Combinator et General Catalyst. La startup utilisera le capital pour constituer son équipe d’ingénierie et travailler à l’adéquation produit-marché. Hopkins a ajouté que la société s'efforcera également à l'avenir de permettre à ses utilisateurs d'évaluer d'autres types d'agents d'IA, tels que les agents Web.

Coval entre en scène alors que l’élan – et le battage médiatique – autour des agents d’IA semblent être à un niveau record. Les leaders de la technologie d'entreprise comme Marc Benioff ont fait l'éloge (et commercialisé) la technologie en affirmant que Salesforce déploiera plus d'un milliard de ses agents IA d'ici l'année prochaine. Selon certaines rumeurs, OpenAI publierait très prochainement sa version d'un agent IA.

De nombreuses startups sont également en train de construire dans cet espace. Il y avait plus de 100 startups créant des agents d’IA dans les seules trois cohortes 2024 de Y Combinator. Certaines startups d’agents d’IA ont également décroché d’importantes levées de fonds en capital-risque. L’un d’entre eux, /dev/agents, a levé un tour de table de 55 millions de dollars pour une valorisation de 500 millions de dollars en novembre 2024, moins d’un an après sa création.

Cet élan signifie qu'il est probable qu'un plus grand nombre d'entreprises chercheront également de l'aide pour évaluer leurs agents. Hopkins a déclaré que Coval avait de bonnes chances de se démarquer du peloton car, contrairement aux inévitables nouveaux entrants, Coval a une longueur d'avance.

« Je pense que ce qui nous démarque vraiment, c'est que je travaille dans ce domaine depuis une demi-décennie et que j'ai construit ces systèmes à maintes reprises », a-t-elle déclaré. « Nous avons construit plusieurs itérations et nous avons vu comment elles échouent et comment elles évoluent et nous intégrons les mêmes concepts dans Coval et tous ces apprentissages. »

A lire également