Bloomberg veut créer le ChatGPT de la finance

Le géant de l’information économique et financière a bâti sa propre intelligence artificielle générative sur la base d’actualités et de données qu’il a collectées.
IA semi-conducteurs microprocesseurs puces  technologie numérique informatique digitalisation
Bloomberg s'appuiera sur une gamme de documents financiers en anglais, incluant des actualités, des déclarations, des communiqués de presse, des documents récupérés sur le web et des médias sociaux  -  AdobeStock

La frénésie autour des agents conversationnels commence à infuser dans l’univers de l’information financière. Bloomberg a tiré le premier en annonçant, en fin de semaine dernière, travailler à son propre modèle d’intelligence artificielle (IA) générative, qui peut créer des contenus (texte, code, image ou son) en s’appuyant sur des données existantes.

L’agence de presse et d’information financière a fait son annonce quelques semaines après celles autour de ChatGPT, porté par la start-up OpenAI et Microsoft, puis celle du projet Bard d’Alphabet (Google), qui avaient déjà alimenté une certaine fébrilité.

L’initiative de Bloomberg apparaît logique. La société, qui a développé avec succès ses activités dans les services aux professionnels des marchés financiers et l’information financière, est fondamentalement une société de gestion de données (datas).

D’après le document de recherche détaillant le développement de BloombergGPT, écrit par les chercheurs de l’entreprise et de l’université Johns Hopkins, ce nouveau modèle d’IA générative reposera sur le grand modèle de langage (LLM, programme capable de générer des réponses à des questions formulées en langage courant) développé par Bloomberg. Le groupe affirme que son IA générative surpasse les modèles comparables d’IA dans le domaine de la finance.

La valeur ajoutée de Bloomberg, sa masse de données financières

La première version du modèle a été nourrie par une vaste masse de données (documents financiers, actualités, dépôts, communiqués de presse, médias sociaux) tirés des archives de Bloomberg.

De fait, l’activité historique de collecte d’informations et données financières du groupe, créé en 1981, a permis de nourrir l’IA générative d’un ensemble de 363 milliards de tokens (unités de base du texte ou du code qu’une IA LLM utilise pour traiter et générer du langage). Ce à quoi s’ajoutent des données publiques, pour aboutir à un vaste corpus de formation comprenant plus de 700 milliards de tokens. Soit bien plus que GPT-3, le modèle de langage d’OpenAI publié en 2020, qui avait été entraîné sur environ 500 milliards de tokens.

Les données spécifiques à l’entreprise, nommées FinPile, consistent en «une gamme de documents financiers en anglais, incluant des actualités, des déclarations, des communiqués de presse, des documents récupérés sur le web, et des médias sociaux tirés des archives de Bloomberg». Le corpus inclut aussi les documents déposés auprès de la SEC, le gendarme financier américain, les transcriptions de Bloomberg TV, les données de la Fed, et «d’autres données pertinentes pour les marchés financiers». Il est également formé sur des sources d’information autres que Bloomberg.

Quels usages en fera Bloomberg ? Il ne le précise pas encore, mais esquisse quelques pistes. BloombergGPT devrait pouvoir effectuer des tâches similaires à celles de ChatGPT, ainsi que des tâches plus étroitement liées aux besoins de Bloomberg, comme «améliorer les tâches financières (comme les comptes de résultats, ndlr), la reconnaissance des entités nommées, la classification des actualités et la réponse aux questions, entre autres».

A lire aussi: Google et Microsoft nourrissent une nouvelle fièvre boursière autour de l’IA

Un évènement L’AGEFI

Plus d'articles du même thème

ETF à la Une

Contenu de nos partenaires

A lire sur ...