La fonderie d'OpenAI permettra aux clients d'acheter un calcul dédié pour exécuter ses modèles d'IA

OpenAI lance discrètement une nouvelle plate-forme de développement qui permet aux clients d’exécuter les nouveaux modèles d’apprentissage automatique de l’entreprise, comme GPT-3.5, sur une capacité dédiée. Dans les captures d’écran de la documentation publiée sur Twitter par utilisateurs avec un accès anticipé, OpenAI décrit l’offre à venir, appelée Foundry, comme « conçue pour les clients de pointe exécutant des charges de travail plus importantes ».

« [Foundry allows] inférence à grande échelle avec un contrôle total sur la configuration du modèle et le profil de performance », lit-on dans la documentation.

Si l’on en croit les captures d’écran, Foundry – à chaque lancement – fournira une « allocation statique » de capacité de calcul (peut-être sur Azure, la plate-forme de cloud public préférée d’OpenAI) dédiée à un seul client. Les utilisateurs pourront surveiller des instances spécifiques avec les mêmes outils et tableaux de bord qu’OpenAI utilise pour créer et optimiser des modèles. De plus, Foundry fournira un certain niveau de contrôle de version, permettant aux clients de décider de passer ou non à des versions de modèles plus récentes, ainsi qu’un réglage « plus robuste » pour les derniers modèles d’OpenAI.

Foundry offrira également des engagements de niveau de service, par exemple une disponibilité et une assistance technique dans le calendrier. Les locations seront basées sur des unités de calcul dédiées avec des engagements de trois mois ou d’un an ; l’exécution d’une instance de modèle individuelle nécessitera un nombre spécifique d’unités de calcul (voir le tableau ci-dessous).

Les instances ne seront pas bon marché. L’exécution d’une version allégée de GPT-3.5 coûtera 78 000 $ pour un engagement de trois mois ou 264 000 $ pour un engagement d’un an. Pour mettre cela en perspective, l’un des supercalculateurs de dernière génération de Nvidia, la station DGX, coûte 149 000 $ par unité.

Les utilisateurs de Twitter et de Reddit aux yeux d’aigle ont remarqué que l’un des modèles de génération de texte répertoriés dans le tableau des prix des instances avait une fenêtre de contexte de 32 000 max. (La fenêtre de contexte fait référence au texte que le modèle considère avant de générer du texte supplémentaire ; des fenêtres de contexte plus longues permettent au modèle de « se souvenir » de plus de texte essentiellement.) GPT-3.5, le dernier modèle de génération de texte d’OpenAI, a une fenêtre de contexte de 4k max, suggérant que ce nouveau modèle mystérieux pourrait être le GPT-4 tant attendu – ou un tremplin vers celui-ci.

OpenAI subit une pression croissante pour réaliser des bénéfices après un investissement de plusieurs milliards de dollars de Microsoft. La société s’attend à gagner 200 millions de dollars en 2023, une somme dérisoire par rapport aux plus de 1 milliard de dollars qui ont été investis jusqu’à présent dans la startup.

Les coûts de calcul sont en grande partie à blâmer. La formation de modèles d’IA à la pointe de la technologie peut coûter jusqu’à des millions de dollars, et leur fonctionnement n’est généralement pas beaucoup moins cher. Selon le co-fondateur et PDG d’OpenAI, Sam Altman, il en coûte quelques centimes par chat pour exécuter ChatGPT, le chatbot viral d’OpenAI – un montant non négligeable étant donné que ChatGPT comptait plus d’un million d’utilisateurs en décembre dernier.

Dans le cadre de la monétisation, OpenAI a récemment lancé une version « pro » de ChatGPT, ChatGPT Plus, à partir de 20 $ par mois et s’est associée à Microsoft pour développer Bing Chat, un chatbot controversé (c’est un euphémisme) qui a retenu l’attention du grand public. Selon à Semafor et The Information, OpenAI prévoit d’introduire une application mobile ChatGPT à l’avenir et d’apporter son IA technologie linguistique dans les applications Microsoft telles que Word, PowerPoint et Outlook.

Par ailleurs, OpenAI continue de rendre sa technologie disponible via le service Azure OpenAI de Microsoft, une plate-forme de service de modèles axée sur les entreprises, et de maintenir Copilot, un service de génération de code premium développé en partenariat avec GitHub.

L'équipe rédactionnelle

L'équipe rédactionnelle de Soutenons Nos Entreprises est composée de professionnels passionnés par le monde de l'entrepreneuriat et du business. Nos rédacteurs et journalistes chevronnés s'engagent à fournir des actualités pertinentes sur les grandes entreprises mondiales et à partager des conseils précieux pour les entrepreneurs et les start-up. Ensemble, nous nous efforçons de soutenir et d'informer nos lecteurs sur les enjeux économiques actuels.

Entrepreneunariat

Un guide pour les femmes sur la façon de s'habiller pour impressionner sur le lieu de travail

ParL'équipe rédactionnelle 31 octobre 202431 octobre 2024

En tant que femme sur le lieu de travail, la frontière est très fine entre être à la mode et ne pas s'habiller convenablement pour le lieu de travail. Lorsque vous construisez votre garde-robe professionnelle, il est important que vous compreniez les choses à faire et à ne pas faire pour réussir. 1. Investissez dans…

Start-up

General Atlantic envisage d’augmenter sa participation dans l’insurtech Acko soutenue par Amazon

ParL'équipe rédactionnelle 20 octobre 2022

General Atlantic est en pourparlers pour investir environ 50 millions de dollars dans Acko, ont déclaré à TechCrunch deux sources proches du dossier, doublant son pari sur l’insurtech indienne à un moment où la plupart des investisseurs traitent avec prudence les opportunités d’investissement. L’investisseur en actions de croissance basé à New York se positionne pour…

Start-up

La start-up « Wallet-as-a-Service » Ansa lève 14 millions de dollars auprès d'investisseurs féminins en tête

ParL'équipe rédactionnelle 30 avril 202430 avril 2024

Ansa, une startup qui aide les commerçants à développer et à proposer des portefeuilles virtuels de marque, a levé un financement de série A de 14 millions de dollars, a déclaré la société en exclusivité à TechCrunch. Renegade Partners a dirigé le dernier financement d'Ansa, qui comprenait la participation des bailleurs de fonds existants Bain…

Start-up

Les revenus d’Amplitude montrent ce que vous devez déclarer pour survivre sur le marché actuel

ParL'équipe rédactionnelle 4 novembre 2022

Le fédéral américain La réserve a de nouveau augmenté le prix de l’argent hier. Les investisseurs s’attendaient à cette décision, mais les actions ont plongé après que la Fed a refusé de dire aux investisseurs qu’elle avait l’intention de ralentir le rythme auquel elle augmenterait les taux d’intérêt à l’avenir, comme certains l’avaient espéré. Alors…

Start-up

Start-up : Trois raisons de privilégier un secrétariat indépendant

ParL'équipe rédactionnelle 6 juin 202411 juin 2025

Imaginons la situation suivante : vous venez tout juste de lancer votre start-up et les demandes sont bien plus élevées que ce que vous imaginiez. Si cela est bien sûr très positif, cela signifie aussi que vous avez beaucoup plus de tâches administratives à gérer. Entre la rédaction des devis et le suivi des clients,…

Start-up

Les fondateurs noirs ont reçu 0,13 % du capital au troisième trimestre

ParL'équipe rédactionnelle 21 octobre 202321 octobre 2023

Les fondateurs noirs ont levé 0,13 % de tous les capitaux alloués aux startups américaines au troisième trimestre, selon Crunchbase. Cela représente environ 39,7 millions de dollars sur 29,9 milliards de dollars. Ce chiffre représente une baisse massive d’une année sur l’autre. Au troisième trimestre 2022, les fondateurs noirs ont levé 1 milliard de dollars…

A lire également