OpenAI annonce un nouvel «agent» d'IA conçu pour aider les gens à mener des recherches complexes approfondies à l'aide de Chatgpt, la plate-forme Chatbot alimentée par l'IA de l'entreprise.
De manière appropriée, cela s'appelle Deep Research.
Openai a déclaré dans un article de blog publié dimanche que cette nouvelle capacité avait été conçue pour «les personnes qui font des connaissances intensives dans des domaines tels que la finance, la science, les politiques et l'ingénierie et ont besoin d'une recherche approfondie, précise et fiable». Il pourrait également être utile, a ajouté la société, pour tous ceux qui effectuent des «achats qui nécessitent généralement des recherches minutieuses, comme les voitures, les appareils électroménagers et les meubles».
Fondamentalement, la recherche profonde de Chatgpt est destinée aux cas où vous ne voulez pas seulement une réponse ou un résumé rapide, mais vous devez plutôt considérer assidûment les informations à partir de plusieurs sites Web et autres sources.
Openai a déclaré que cela mettait des recherches approfondies à la disposition des utilisateurs de ChatGpt Pro aujourd'hui, limitée à 100 requêtes par mois, avec le support pour plus et les utilisateurs de l'équipe qui viennent ensuite, suivis de l'entreprise. (Openai cible un déploiement plus dans environ un mois, a déclaré la société.) C'est un lancement géo-ciblé; Openai n'avait aucun calendrier de libération à partager pour les clients de Chatgpt au Royaume-Uni, en Suisse et dans le domaine économique européen.
Pour utiliser Chatgpt Deep Research, vous sélectionnez simplement la «recherche profonde» dans le compositeur, puis entrerez une requête, avec la possibilité de joindre des fichiers ou des feuilles de calcul. (C'est une expérience Web uniquement pour l'instant, avec l'intégration des applications mobiles et de bureau à venir plus tard ce mois .
Actuellement, les résultats de Chatgpt Deep Research sont uniquement en texte. Mais Openai a déclaré qu'il avait l'intention d'ajouter des images embarquées, des visualisations de données et d'autres sorties «analytiques» bientôt. La feuille de route est également la possibilité de connecter des «sources de données plus spécialisées», notamment des ressources «basées sur l'abonnement» et des ressources internes, a ajouté OpenAI.
La grande question est, à quel point la recherche profonde est-elle précise? L'IA est imparfaite, après tout. Il est sujet aux hallucinations et à d'autres types d'erreurs qui pourraient être particulièrement nocifs dans un scénario de «recherche profonde». C'est peut-être pourquoi Openai a déclaré que chaque sortie de recherche profonde de Chatgpt sera «entièrement documentée, avec des citations claires et un résumé de [the] penser, faciliter la référence et vérifier facilement les informations. »
Le jury est expliqué si ces atténuations seront suffisantes pour lutter contre les erreurs de l'IA. La fonctionnalité de recherche Web d'OpenAAI alimentée par AI dans Chatgpt, la recherche Chatgpt, ne fait pas rarement des gaffes et donne de mauvaises réponses aux questions. Les tests de TechCrunch ont révélé que la recherche ChatGpt a produit des résultats moins utiles que la recherche Google pour certaines requêtes.
Pour renforcer la précision de Deep Research, OpenAI utilise une version spéciale de son modèle d'IA «raisonnement» O3 récemment annoncé qui a été formé par l'apprentissage du renforcement sur les «tâches réelles nécessitant une utilisation du navigateur et du python». Le renforcement de l'apprentissage «enseigne» essentiellement un modèle via des essais et des erreurs pour atteindre un objectif spécifique. À mesure que le modèle se rapproche de l'objectif, il reçoit des «récompenses» virtuelles qui, idéalement, l'améliorent à la tâche à l'avenir.
OpenAI a affirmé que, grâce au modèle O3 affiné, la recherche profonde peut effectuer des recherches en plusieurs étapes, revenir en arrière et réagir aux informations en temps réel, générer des graphiques et citer spécifiquement des «centaines» de sources et de passages.
« [This] Version du prochain modèle Openai O3 [is] Optimisé pour la navigation Web et l'analyse des données », a déclaré Openai dans le blog. « [I]T exploite le raisonnement pour rechercher, interpréter et analyser des quantités massives de texte, d'images et de PDF sur Internet, pivotant si nécessaire en réaction à l'information qu'il rencontre […] Le modèle est également en mesure de parcourir les fichiers téléchargés par l'utilisateur, de tracer et d'itérer sur des graphiques à l'aide de l'outil Python, d'intégrer les graphiques et les images générés à partir de sites Web dans ses réponses et citer des phrases ou des passages spécifiques à partir de ses sources. »

La société a déclaré avoir testé Chatgpt Deep Research en utilisant le dernier examen de l'humanité, une évaluation qui comprend plus de 3 000 questions de niveau expert dans une variété de domaines académiques. Le modèle O3 alimentant la recherche profonde a atteint une précision de 26,6%, ce qui pourrait ressembler à une note défaillante – mais le dernier examen de l'humanité a été conçu pour être plus difficile que les autres repères pour rester en avance sur les progrès du modèle. Selon OpenAI, le modèle de recherche en profondeur O3 a été en avance sur la pensée Gemini (6,2%), Grok-2 (3,8%) et le propre GPT-4O d'OpenAI (3,3%).
Pourtant, Openai note que la recherche profonde de Chatgpt a des limites, faisant parfois des erreurs et des inférences incorrectes. Des recherches approfondies peuvent avoir du mal à distinguer les informations faisant autorité des rumeurs, a déclaré la société, et ne parvient souvent pas à transmettre lorsqu'elle est incertaine de quelque chose – et elle peut également faire des erreurs de mise en forme dans les rapports et les citations.
Pour quiconque s'inquiète de l'impact de l'IA génératif sur les étudiants, ou sur quiconque essaie de trouver des informations en ligne, ce type de sortie approfondie et bien cité semble probablement plus attrayant qu'un résumé de chatbot trompeusement simple sans citations. Mais nous verrons si la plupart des utilisateurs soumettront réellement la sortie à une analyse réelle et à la double vérification, ou s'ils le traitent simplement comme un texte plus professionnel à copier-coller.
Et si tout cela semble familier, Google a en fait annoncé une fonctionnalité d'IA similaire avec exactement le même nom il y a moins de deux mois.
