Deep Cogito émerge de la furtivité avec des modèles hybrides de «raisonnement»

Une nouvelle entreprise, Deep Cogito, est sortie de la furtivité avec une famille de modèles d'IA disponibles ouvertement qui peuvent être commutés entre les modes de «raisonnement» et de non-saison.

Des modèles de raisonnement comme O1 d'Openai ont montré une grande promesse dans des domaines comme les mathématiques et la physique, grâce à leur capacité à se vérifier efficacement en travaillant sur des problèmes complexes étape par étape. Ce raisonnement a cependant un coût: un calcul et une latence plus élevés. C'est pourquoi des laboratoires comme Anthropic recherchent des architectures de modèle «hybrides» qui combinent des composants de raisonnement avec des éléments standard et non renvoyants. Les modèles hybrides peuvent rapidement répondre à des questions simples tout en passant du temps supplémentaire compte tenu des requêtes plus difficiles.

Tous les modèles Deep Cogito, appelés Cogito 1, sont des modèles hybrides. Cogito affirme qu'ils surpassent les meilleurs modèles ouverts de la même taille, y compris les modèles de Meta et Chinese IA Startup Deepseek.

«Chaque modèle peut répondre directement […] ou se réflexion sur l'auto-réflexion avant de répondre (comme les modèles de raisonnement) », a expliqué la société dans un article de blog. »[All] ont été développés par une petite équipe en environ 75 jours. »

Les modèles Cogito 1 varient de 3 milliards de paramètres à 70 milliards de paramètres, et Cogito dit que des modèles allant jusqu'à 671 milliards de paramètres les rejoindront dans les semaines et les mois à venir. Les paramètres correspondent à peu près aux compétences de résolution de problèmes d'un modèle, avec plus de paramètres étant généralement meilleurs.

Cogito 1 n'a pas été développé à partir de zéro, pour être clair. Deep Cogito s'est construit sur les modèles QWEN d'Open Llama de Meta et Alibaba pour créer les siens. La société affirme qu'elle a appliqué de nouvelles approches de formation pour stimuler les performances des modèles de base et permettre un raisonnement dépensable.

Selon les résultats de la référence interne de Cogito, le plus grand modèle Cogito 1, Cogito 70b, avec le raisonnement surpasse le modèle de raisonnement R1 de Deepseek sur quelques mathématiques et évaluations du langage. Cogito 70B avec raisonnement désactivé éclipse également le modèle LLAMA 4 Scout récemment publié de META sur LiveBench, un test d'IA à usage général.

Chaque modèle Cogito 1 est disponible pour télécharger ou utiliser via des API sur les feux d'artifice des fournisseurs de cloud AI et ensemble AI.

Les performances de Cogito 1 par rapport aux autres modèles d'IA populaires disponibles populairesCrédits d'image:Cogito profond

«Actuellement, nous sommes encore aux premiers stades de [our] Courbe de mise à l'échelle, n'ayant utilisé qu'une fraction de calcul généralement réservée au modèle traditionnel de modèle de grande langue / formation continue « , a écrit Cogito dans son article de blog. » Pour aller de l'avant, nous étudions les approches complémentaires post-formation pour l'auto-amélioration. «

Selon les documents déposés auprès de California State, Deep Cogito, basé à San Francisco, a été fondé en juin 2024. La page LinkedIn de la société répertorie deux cofondateurs, Drishan Arora et Dhruv Malhotra. Malhotra était auparavant chef de produit chez Google AI Lab Deepmind, où il a travaillé sur la technologie de recherche générative. Arora était ingénieur logiciel principal chez Google.

Deep Cogito, dont les bailleurs de fonds incluent South Park Commons, selon PitchBook, vise ambitieusement à construire une «superintelligence générale». Les fondateurs de l'entreprise comprennent l'expression signifiant l'IA qui peut effectuer des tâches mieux que la plupart des humains et «découvrir des capacités entièrement nouvelles que nous n'avons pas encore imaginées».

L'équipe rédactionnelle

L'équipe rédactionnelle de Soutenons Nos Entreprises est composée de professionnels passionnés par le monde de l'entrepreneuriat et du business. Nos rédacteurs et journalistes chevronnés s'engagent à fournir des actualités pertinentes sur les grandes entreprises mondiales et à partager des conseils précieux pour les entrepreneurs et les start-up. Ensemble, nous nous efforçons de soutenir et d'informer nos lecteurs sur les enjeux économiques actuels.

Start-up

Doorstead ferme à 21,5 millions de dollars pour vous assurer que vous avez toujours un locataire pour votre bien locatif

ParL'équipe rédactionnelle 7 janvier 20237 janvier 2023

Doorstead, une startup de gestion immobilière qui offre des loyers «garantis» aux propriétaires, a levé 21,5 millions de dollars dans le cadre d’une ronde de financement de série B. Ryan Waliany et Jennifer Bronzo ont lancé Doorstead en 2019, testant initialement son modèle de fixation des prix des propriétés locatives sur Craigslist. Au fil du…

Start-up

Les startups créent des entreprises à partir d’outils DevOps pour les plateformes de vente existantes

ParL'équipe rédactionnelle 24 septembre 2022

Le marché en croissance pour les outils de vente a donné naissance à une curieuse industrie artisanale : les startups DevOps ciblant spécifiquement les logiciels utilisés dans les fonctions de vente et de marketing. (Ici, « DevOps » fait référence à des outils qui automatisent les processus entre les équipes de développement de logiciels et les équipes…

Start-up

Dark Space construit un gant de boxe propulsé par une fusée pour pousser les débris hors de l'orbite

ParL'équipe rédactionnelle 17 avril 202417 avril 2024

Basé à Paris Espace sombre s'attaque au double problème des débris et des conflits en orbite avec sa plate-forme mobile conçue pour lancer, s'attacher et finalement désorbiter des objets non coopératifs dans l'espace. Le PDG de Dark, Clyde Laheyne, a déclaré que la société avait pour objectif de devenir « l'équipe SWAT de l'espace »….

Start-up

Systemiq obtient 70 millions de dollars pour financer les fondateurs de la technologie climatique en phase de démarrage

ParL'équipe rédactionnelle 15 juillet 20229 octobre 2022

Systemiq Capitalun bailleur de fonds des start-ups de technologie climatique en phase de démarrage, affirme avoir obtenu 70 millions de dollars pour lancer son deuxième fonds. Le VC basé à Londres vise à lever jusqu’à 130 millions de dollars de plus; cela marquerait une avancée considérable pour l’entreprise, qui affirme avoir acheminé 30 millions de…

Start-up

Comment Up.Labs fait le lien entre le capital-risque et les accélérateurs

ParL'équipe rédactionnelle 1 décembre 20221 décembre 2022

Un élément de la L’apothéose du capital-risque de 2021 qui ne reçoit pas assez d’attention est le capital-risque d’entreprise. CVC a explosé l’année dernière, ce qui a conduit TechCrunch à interroger un certain nombre d’investisseurs CVC en août dernier pour mieux comprendre la tendance. Comme pour les autres formes de capital-risque, CVC en a retiré…

Start-up

Les investisseurs sont optimistes pour 2024

ParL'équipe rédactionnelle 6 janvier 2024

Bon retour et bienvenue en 2024 ! Nous commençons l’année sur une bonne note : après une année 2023 médiocre, les investisseurs sont optimistes quant à la reprise des activités de sortie en 2024. Certains pensent que les activités de fusions et acquisitions vont monter en flèche, tandis que d’autres pensent que nous verrons le marché…

A lire également