TECH

Colgate teste des consommateurs virtuels: quand l'IA remplace les focus groups, par Diederick Legrain (AI-Shift)

Jeudi 23 Octobre 2025

Une étude menée conjointement par PyMC Labs et Colgate-Palmolive démontre que des "consommateurs synthétiques" générés par intelligence artificielle peuvent reproduire avec une fidélité de 90% les résultats d'enquêtes réelles sur l'intention d'achat.

Cette recherche s'appuie sur 57 études de concepts produits d'hygiène personnelle menées auprès de 9.300 consommateurs américains.

L'échec de l'approche directe

La méthode la plus intuitive consiste à demander à l'IA de répondre directement par un chiffre de 1 à 5 sur une échelle de Likert. Les chercheurs ont créé des personas dotés d'attributs démographiques (âge, genre, revenu, localisation) et leur ont présenté des concepts produits.

Les résultats se sont révélés décevants. Les modèles GPT-4o et Gemini-2.0 produisaient des distributions irréalistes, se repliant massivement vers la note 3 (neutre), alors que dans les données réelles, les notes 4 et 5 dominaient. GPT-4o atteignait une similarité distributionnelle de seulement 0,26 avec les données réelles (sur une échelle de 0 à 1).

La solution : le Semantic Similarity Rating

Les chercheurs ont développé une approche alternative baptisée "Semantic Similarity Rating" (SSR). Au lieu d'imposer une réponse chiffrée, ils demandent d'abord à l'IA de formuler librement son intention d'achat.

Exemple de réponse : "Je suis assez intéressé. Si ça fonctionne bien et que ce n'est pas trop cher, je pourrais l'essayer."

Cette réponse textuelle est ensuite convertie en vecteur mathématique et comparée à six ensembles de déclarations de référence, chacune correspondant à un niveau de l'échelle de Likert. Cette comparaison génère une distribution de probabilités sur les cinq points de l'échelle.
Avec SSR, GPT-4o a atteint une similarité distributionnelle de 0,88 et Gemini-2.0 de 0,80. Surtout, la corrélation entre concepts a représenté 90% de la fiabilité maximale observable entre deux panels humains réels.

Les attributs démographiques sont cruciaux

La performance dépend fortement des informations démographiques fournies. Les données réelles montraient que les participants plus jeunes et plus âgés exprimaient une intention d'achat plus faible que les quadragénaires. GPT-4o a reproduit fidèlement ce pattern. De même, les personas avec contraintes budgétaires affichaient une intention réduite, pattern correctement capturé par les deux modèles.

L'expérience contrôle menée avec Gemini-2.0 sans aucune information démographique est révélatrice : bien que les distributions restaient réalistes (similarité de 0,91), la corrélation entre concepts s'est effondrée à 50% contre 92% avec démographie. Sans persona détaillé, l'IA évalue tous les produits positivement de manière générique.

Des feedbacks qualitatifs plus riches

Les consommateurs synthétiques produisent spontanément des justifications détaillées, contrairement aux participants humains qui fournissent généralement des réponses brèves. Exemple : "La facilité d'utilisation et la sécurité sont attrayantes, mais je voudrais en savoir plus sur son efficacité et ses éventuels effets secondaires."

Les chercheurs notent également que les consommateurs synthétiques exploitent une gamme plus large de l'échelle d'évaluation, suggérant un biais de positivité réduit par rapport aux humains.

Les limites identifiées

La méthode SSR repose sur des déclarations de référence soigneusement élaborées, optimisées manuellement pour ces 57 études. Leur performance sur d'autres domaines reste incertaine.

Tous les attributs démographiques ne sont pas reproduits avec la même fidélité. Le genre, la région et l'ethnicité montrent des résultats moins convaincants que l'âge et le revenu.

Plus fondamentalement, la validité dépend du domaine étudié. Les auteurs expliquent que la méthode fonctionne sur les produits d'hygiène personnelle car les modèles ont été exposés à d'abondantes discussions sur ces catégories dans leur corpus d'entraînement. Pour des domaines où cette connaissance est absente, la méthode pourrait produire des hallucinations.

Enfin, les consommateurs synthétiques reproduisent des intentions déclarées, pas les comportements d'achat réels avec leurs contingences budgétaires, culturelles et contextuelles.

Les auteurs concluent qu'aucun entraînement spécifique n'a été nécessaire, rendant la méthode largement applicable. Ils notent que les consommateurs synthétiques pourraient augmenter ou partiellement remplacer les panels humains, mais que la généralisation à d'autres domaines reste à démontrer.

Daily	Freemium access
5 x week	MM e - News
1 x week	MM Brunch
1 x week	MM Tech
10 x year	MM Best of Research
10 x year	MM Blue
4 x year	MM Magazine (digital)

Colgate teste des consommateurs virtuels: quand l'IA remplace les focus groups, par Diederick Legrain (AI-Shift)

Archive / TECH

OpenAI teste le CPC sur ChatGPT

Quelle sera la ligne de conduite de John Ternus à l'égard de la pub?

Cloud souverain européen : Proximus parmi les quatre fournisseurs retenus

Brand Safety : Google veut passer des mots-clés à l'intention

Rossel dévoile une offre dédiée à la visibilité des marques dans les IA génératives

La CE veut contraindre Google à partager ses données de search

SoMe: l'émergence des plateformes alternatives

Inku : la marque d'abord, la production ensuite

L'IA à un point de bascule ?, par Patrick Steinfort (MM)

De $100 millions à $100 milliards de revenus pubs pour OpenAI ?

Apple accélère sur les lunettes connectées dopées à l'IA

Playar : "La réalité augmentée transforme le storytelling en story living"

Muse Spark, la nouvelle tentative IA de Meta

Canva accélère son développement

Cloudflare et GoDaddy entendent aider les éditeurs à filtrer les bots IA

Premiers pas d'OpenAI dans le domaine des médias

TikTok Shop bientôt en Belgique ?

OpenAI accélère sur la pub

Azerion renforce les capacités de sa DMP

ShowHeroes devient partenaire commercial de Titan OS en Belgique

Des impacts attendus de l'AI Search pour les éditeurs

Bienvenue dans la Token economy, par Patrick Steinfort (MM)

Digital Consumer Trends : au-delà des chiffres avec Vincent Fosty et Matthieu Fontaine (Deloitte)

Gaetan Godart (Programmads) : "Notre métier, c'est d'orchestrer la complexité adtech"

La valse des modèles

Publicité dans ChatGPT : ce que les marques n'ont pas encore compris, par Gérald Claessens (Knewledge)

SXSW 2026: l'année de l'IA, par Maarten De Maayer (Publicis)

Une étude d'Anthropic interroge 81.000 utilisateurs

Gemini s'invite sur DV360

Plan.Net recrute des co‑workers IA

Google facilite la portabilité des données des agents conversationnels vers Gemini

Deuxième édition de l'observatoire de la haine en ligne

ChatGPT ajuste sa stratégie e-commerce

Douche froide pour Proxistore : la cour d'appel révoque l'astreinte de Google

Deloitte adoube MentionLab

Colruyt collabore avec Adhese pour son Retail Media

Sora : trois petits tours et puis s'en va...

Mistral propose une taxe IA pour soutenir la création

AI, No Shortcut, par Matthieu Vercruysse (Publicis Groupe)

The Trade Desk : "Nous souhaitons poursuivre le dialogue avec Publicis"

Le GEA, nouvelle frontière publicitaire?

Carl Maas (Adobe) : "Pour qu'ils passent à la phase de conversion, la marque doit inciter les consommateurs à rester sur son site"

MM Tech Club - Brand vs Performance : un dilemme stratégique au coeur du débat

Trop d'IA tue l'IA, par Patrick Steinfort (MM)

Un nouveau départ pour l'IAB Belgium soutenu par BAM

Beam 2.0 connecte les entreprises aux experts en IA

Les "world models" sont-ils la nouvelle frontière de l'IA ?

Amazon développe son emprise sur l'e-commerce

LinkedIn s'invite dans les réponses des agents conversationnels

AI5050 se penche sur le fonctionnement réel de l'IA en entreprise

Matt Brittin, de Google à la BBC ?

2026, le tournant de l'IA au travail, par David Grunewald (Pluginto.ai)

Seedtag lance Liz Agent

Vincent Delmotte (Azerion) : "Le local doit cesser d'être un discours et redevenir un réflexe d'investissement"

Droit d'auteur et IA : le Parlement européen se prononce pour renforcer la protection des médias

ShowHeroes reprend Traffective

Anthropic propose une nouvelle méthode pour évaluer l'impact de l'IA sur l'emploi

OpenAI freine sur l'e-commerce

OpenAI en discussion avec The Trade Desk?

La publicité agentique du point de vue des annonceurs : entre effets d'annonce et réalités du terrain

Sébastien Scarmure (Elia) : "Le réseau électrique n'est plus seulement un maillage de câbles et de pylônes, c'est un système piloté par la donnée"

Adomate, la data au service de la performance créative

Time To Change, par Patrick Steinfort (MM)

We-R, entre innovation produit et reconnaissance internationale

AEO : votre site ne suffit plus. Voici où se joue vraiment la partie, par Sabrina Bulteau (PingPrime.ai)

De la relativité des chiffres LinkedIn

OpenAI vs Anthropic

Koah, une place de marché publicitaire pour les IA conversationnelles

Avec Nano banana 2, Google enfonce le clou

SPUR entend définir les normes et les infrastructures qui permettent aux éditeurs et aux plateformes d'IA de développer leurs activités

L'Autorité belge de la Concurrence ouvre une instruction à l'égard de Google dans le secteur de l'adtech

Perplexity lance son assistant Computer

Adobe analyse l'impact de l'IA sur les consommateurs et les entreprises

WPP et Adobe renforcent leur partenariat

Google Vids propose des avatars animés et la prise en charge du français

Advertising Intelligence : qui dominera la pub à l'ère de l'IA?

DeepL prêche pour sa chapelle : 71% des entreprises prévoient d'automatiser leurs processus de traduction en 2026

MM Tech Club - Souveraineté numérique et Cybersécurité : un panel exceptionnel pour un sujet stratégique