OpenAI a récemment dévoilé son nouveau programme, OpenAI Data Partnerships, visant à collaborer avec des organisations pour constituer des ensembles de données publics et privés destinés à l'entraînement des modèles d'intelligence artificielle (IA). Dans un billet de blog, OpenAI explique que ce programme vise à "permettre à davantage d'organisations de contribuer à l'avenir de l'IA" et à "bénéficier de modèles plus utiles". L'objectif déclaré est de lutter contre les lacunes et les biais présents dans les ensembles de données actuels.
Le programme prévoit la création de deux types d'ensembles de données : un ensemble de données open source accessible au public pour l'entraînement des modèles d'IA, et des ensembles de données privés destinés à l'entraînement de modèles d'IA propriétaires.
OpenAI, créateur du populaire chatbot ChatGPT, connu pour générer des textes à partir de simples indications, se base sur des modèles de langage volumineux entièrement entraînés sur des données open source disponibles sur Internet. Cette nouvelle initiative pourrait permettre à l'entreprise de produire des données d'entraînement plus nuancées, adoptant un style plus conversationnel.
Le programme prévoit la création de deux types d'ensembles de données : un ensemble de données open source accessible au public pour l'entraînement des modèles d'IA, et des ensembles de données privés destinés à l'entraînement de modèles d'IA propriétaires.
OpenAI, créateur du populaire chatbot ChatGPT, connu pour générer des textes à partir de simples indications, se base sur des modèles de langage volumineux entièrement entraînés sur des données open source disponibles sur Internet. Cette nouvelle initiative pourrait permettre à l'entreprise de produire des données d'entraînement plus nuancées, adoptant un style plus conversationnel.