Nl

TECH

Plus de 50% des contenus sur Internet produits par l'IA ?

Jeudi 25 Janvier 2024

Pierre-Nicolas Schwab l’expliquait lors de son intervention au congrès de BAM : les IA génératives allaient polluer l’Internet avec des contenus le plus souvent de mauvaise qualité.

Une étude menée par des chercheurs du laboratoire d’intelligence artficielle d’Amazon Web Services (AWS) confirme cette prédiction. Ils constatent qu’une quantité “choquante” du Web est déjà constituée de contenu de mauvaise qualité généré et traduit par l’IA.

L’étude estime en effet que 57,1% des textes sur Internet ont été produits et ensuite traduits par des IA. A noter que le scope porte sur les seuls contenus hébergés par AWS, ce qui représente quand même 34% du total.

Cette ‘’pollution’’ de l’Internet pose de sérieux problèmes aux géants de la Tech mêmes s’ils en sont également responsables en tant que développeurs d’IA. Google tout d’abord qui fait face à une avalanche de contenus générés par l’IA et doit faire le tri avant de proposer ses réponses sur son moteur de recherche et sur Google News ; Amazon ensuite qui propose sur son site des produits dont le titre est "I cannot fulfill this request it goes against OpenAI use policy".

Sans compter l’explosion des livres produits par l’IA qui a obligé le champion de l’e-commerce à modifier ses règles sur son service d’autopublication Kindle Direct Publishing. Amazon fait aujourd’hui la différence entre des ouvrages entièrement rédigés par l’IA et les auteurs qui ont été "assistés" par l’IA. A l'exemple de l’écrivaine japonaise Rie Kudan, récente lauréate de l’équivalent japonais du prix Goncourt, et qui a reconnu avoir été aidée par l’IA pour rédiger son livre, non sans susciter quelques remous dans le monde de l’édition…

Même si elle reste à confirmer, cette dégradation des contenus sur Internet impactera directement la qualité des productions des IA génératives. Ce qui explique pourquoi les principaux acteurs négocient en ce moment avec les éditeurs de presse pour s’assurer de data set qualitatifs.

Archive / TECH