La prochaine frontière pour les modèles de grands langues (LLMS), l'une des technologies clés qui sous-tendent le boom des outils d'IA génératrices, pourrait être géographique. Lundi, la startup de l'IA basée à Paris Mistral – qui est en lice pour rivaliser avec Anthropic and Openai, basée aux États-Unis – publie un modèle un peu différent de son LLM habituel.
Nommé Mistral Saba, le nouveau modèle formé sur mesure est conçu pour aborder une géographie spécifique: les pays de parlant arabe. L'objectif de Mistral Saba est d'exceller dans les interactions arabes.
Mistral Saba est un modèle relativement petit avec 24 milliards de paramètres. Pour rappel, moins de paramètres conduisent généralement à de meilleures performances avec une latence plus faible. Mais plus de paramètres signifie généralement des réponses plus intelligentes, même si ce n'est pas une corrélation linéaire.
Mistral Saba est comparable en taille à Mistral Small 3, son modèle général à usage général. Mais, selon les propres tests de Mistral, Mistral Saba fonctionne bien mieux que Mistral Small 3 lors de la gestion du contenu arabe.
En tant qu'effet secondaire intéressant, en raison de la pollinisation croisée culturelle entre le Moyen-Orient et l'Asie du Sud, Saba fonctionne également bien avec les langues d'origine indienne, par Mistral – en particulier les langues d'origine indienne du sud, telles que le tamoul et le malayalam.
Le nouveau modèle représente une décision stratégique intéressante pour le géant français de l'IA, montrant un accent accru sur le Moyen-Orient. Mistral a déclaré qu'il s'attend à ce que le modèle l'aide à gagner du terrain parmi les clients de la région.
En tant que modèle standard, Mistral Saba pourrait être utilisé pour le soutien conversationnel ou la génération de contenu en arabe qui semble plus naturel et pertinent. Il peut également être utilisé comme base pour certains modèles affinés pour des cas d'utilisation interne, a indiqué la société.
La semaine dernière, Mistral a utilisé le Sommet AI Action pour démontrer qu'il devient sérieux dans les affaires. Bien que la société ait déjà collecté de grandes sommes d'investisseurs internationaux, bon nombre de ses bailleurs de fonds étrangers sont basés aux États-Unis – des investisseurs tels que Lightspeed Venture Partners, Andreessen Horowitz et Salesforce Ventures.
En raison du paysage géopolitique changeant, Mistral pourrait potentiellement accueillir les investisseurs du Moyen-Orient dans son prochain tour de financement. Ce serait un moyen de collecter plus d'argent pour rester pertinent dans la course d'IA à un niveau technique, tout en se positionnant comme l'alternative internationale aux sociétés d'IA américaines et chinoises. Le nouveau modèle de Mistral, Saba, pourrait donc contribuer à cet effort de collecte de fonds potentiel.
Mistral Saba est accessible via l'API de Mistral. Il peut également être déployé sur site, ce qui pourrait être un argument de vente fort pour les entreprises travaillant dans des industries sensibles, telles que l'énergie, la finance ou les soins de santé.
En raison des racines européennes de l'entreprise, depuis la sortie du modèle d'origine Mistral 7B de poids ouvert, il a souvent réitéré qu'il prenait au sérieux le support multi-langues. La libération de Saba est une continuation de ce positionnement. Et Mistral a déclaré qu'il tournera son attention vers d'autres langues régionales sur la route.
