SLAIT passe de la traduction de la langue des signes à des cours interactifs alimentés par l'IA

Des millions de personnes utilisent la langue des signes, mais les méthodes d’enseignement de cette compétence complexe et subtile n’ont pas évolué aussi rapidement que celles des langues écrites et parlées. SLAIT School vise à changer cela avec un tuteur interactif alimenté par la vision par ordinateur, permettant aux aspirants locuteurs d’ASL de pratiquer à leur propre rythme, comme dans toute autre application d’apprentissage des langues.

SLAIT a débuté en 2021 en tant que traducteur IA en langue des signes (d’où son nom) : un outil de chat vidéo et de traduction en temps réel qui pourrait reconnaître les signes les plus courants et aider un locuteur ASL à communiquer plus facilement avec quelqu’un qui ne connaît pas la langue. Mais les premiers succès ont ralenti lorsque l’équipe a réalisé qu’elle avait besoin de plus de temps, d’argent et de données qu’elle n’était susceptible d’en obtenir.

« Nous avons obtenu d’excellents résultats au début, mais après plusieurs tentatives, nous avons réalisé qu’à l’heure actuelle, il n’y avait tout simplement pas assez de données pour fournir une traduction complète », a expliqué Evgeny Fomin, PDG et co-fondateur de SLAIT. « Nous n’avions aucune opportunité d’investissement, aucune chance de trouver nos supporters, car nous étions bloqués sans lancement de produit – nous étions dans les limbes. Le capitalisme… est dur.

« Mais ensuite, nous avons pensé, que pouvons-nous faire avec la technologie que nous avons obtenue grâce à la R&D ? Nous avons réalisé que nous devions trouver une solution éducative, car pour l’éducation, notre technologie est définitivement assez bonne », a-t-il poursuivi. Non pas qu’il y ait des normes inférieures pour les personnes qui apprennent, mais la fluidité et la subtilité d’une langue des signes fluide et mature sont des ordres de grandeur plus difficiles à saisir et à traduire qu’un ou deux mots à la fois.

« Nous avons trouvé un gars extrêmement talentueux (CTO Nikita Nikitin) qui nous a aidés à développer un produit, et nous avons créé l’école SLAIT. Et maintenant, nous avons nos premiers clients et une certaine traction !

Les cours de langue des signes en ligne existants (voici une liste solide si vous êtes curieux) sont généralement assez traditionnels. Vous avez des conférences et des démonstrations, des listes de vocabulaire et des illustrations, et si vous payez en ligne, vous pouvez demander à quelqu’un de revoir votre travail par vidéo. C’est de haute qualité et une grande partie est gratuite, mais ce n’est pas le genre d’expérience interactive que les gens attendent d’applications comme Duolingo.

SLAIT School utilise une version mise à jour de la technologie de reconnaissance gestuelle qui a alimenté l’application de démonstration du traducteur pour fournir un retour instantané sur les mots et les phrases. Voyez-le sous forme de vidéo, puis essayez-le jusqu’à ce que vous l’obteniez. Actuellement, c’est uniquement pour les navigateurs de bureau, mais l’équipe prévoit également une application mobile.

« Nous avons une certaine marge d’amélioration, mais c’est exactement ce que nous avions prévu de livrer. Les étudiants peuvent accéder à la plate-forme, pratiquer, faire des signes, interagir avec le tuteur AI, et cela leur coûte le même prix qu’une heure avec un tuteur en personne », a déclaré Fomin. « Les applications mobiles que nous visons à faire gratuitement. »

Les utilisateurs peuvent faire les premières leçons afin de voir que le système fonctionne, puis c’est 39 $ par mois, 174 $ par semestre et 228 $ par an. Le prix peut sembler élevé par rapport aux applications linguistiques à grande échelle prises en charge par le capital et d’autres modèles commerciaux, mais Fomin a souligné qu’il s’agit d’une catégorie nouvelle et spéciale, et que les tuteurs du monde réel sont leur principal concurrent.

Crédits image : École SLAIT

« Nous communiquons activement avec les utilisateurs et essayons de trouver les meilleurs prix et le modèle économique qui rendent les plans d’abonnement abordables. Nous aimerions vraiment rendre la plate-forme gratuite, mais jusqu’à présent, nous n’avons pas encore trouvé d’opportunité pour cela. Parce qu’il s’agit d’un produit de niche… nous avons juste besoin de créer un modèle économique stable qui fonctionnera en général », a-t-il déclaré.

La traction est également un volant d’inertie pour la technologie et le contenu de l’entreprise. En collectant des informations (avec un consentement explicite, qu’il dit que la communauté est très heureuse de fournir), ils peuvent élargir et améliorer le programme et continuer à affiner leur moteur de reconnaissance gestuelle.

« Nous voyons deux directions pour la croissance », a déclaré Fomin. « La première consiste à couvrir davantage de groupes linguistiques, comme la langue des signes britannique et la langue des signes japonaise. Nous aimerions également rendre le programme plus adaptatif ou proposer un programme pour les signes médicaux et scientifiques. Si nous avons suffisamment d’investissements pour nous développer et évoluer, nous pouvons être une plate-forme de premier plan à l’échelle mondiale pour automatiser la conversation avec le médecin en langue des signes.

Après cela, il a dit : « Peut-être que nous pouvons enfin développer un traducteur. Nous pouvons franchir cette barrière !

A lire également