OpenAI, la start-up derrière ChatGPT et Dall-E, est confrontée à une action collective aux États-Unis, rapporte le Washington Post. L'objectif de cette procédure est de demander des dommages et intérêts pour les milliers d'internautes dont les commentaires sur les réseaux sociaux ou les articles de blog ont été utilisés par les modèles de langage d'OpenAI sans autorisation.
Jusqu'à présent, OpenAI avait été attaqué principalement sur des questions de droit d'auteur et de protection des données personnelles. Cependant, cette affaire concerne spécifiquement les données extraites du Web et mises en ligne par des particuliers, telles que les commentaires sur les réseaux sociaux, les articles de blog ou les articles de Wikipédia. L'utilisation de ces données à des fins d'entraînement de l'IA est considérée comme problématique et violerait les droits de millions d'internautes, explique Ryan Clarkson, l'avocat en charge de l'affaire.
OpenAI, qui n'a pas commenté les demandes des journalistes, n'a pas divulgué les types de données utilisées dans son dernier modèle, GPT-4. Cependant, il est connu que les versions précédentes ont incorporé des pages de Wikipédia, des articles de presse et des commentaires provenant des réseaux sociaux. Il en va de même pour Bard, développé par Google, ainsi que pour d'autres concurrents dans le domaine.
Jusqu'à présent, OpenAI avait été attaqué principalement sur des questions de droit d'auteur et de protection des données personnelles. Cependant, cette affaire concerne spécifiquement les données extraites du Web et mises en ligne par des particuliers, telles que les commentaires sur les réseaux sociaux, les articles de blog ou les articles de Wikipédia. L'utilisation de ces données à des fins d'entraînement de l'IA est considérée comme problématique et violerait les droits de millions d'internautes, explique Ryan Clarkson, l'avocat en charge de l'affaire.
OpenAI, qui n'a pas commenté les demandes des journalistes, n'a pas divulgué les types de données utilisées dans son dernier modèle, GPT-4. Cependant, il est connu que les versions précédentes ont incorporé des pages de Wikipédia, des articles de presse et des commentaires provenant des réseaux sociaux. Il en va de même pour Bard, développé par Google, ainsi que pour d'autres concurrents dans le domaine.