Nl

TECH

Google sort (enfin) de l'ombre de ChatGPT, par Nicolas Bataille

Mercredi 28 Février 2024

Google sort (enfin) de l'ombre de ChatGPT, par Nicolas Bataille

En ce début 2024, je constate que le G de GAFAM hésite, tergiverse même et se positionne presque comme un challenger dans l’IA, ce à quoi Google ne nous a pas vraiment habitués.
DeepMind, LaMDA, PaLM, Bard, Gemini 1.0, Lumiere, MusicLM, Gemini 1.5 Pro, et tout récemment Gemma ! Je dois dire que, même en baignant quotidiennement dedans, ce n’est pas facile de suivre leur programme de releases.

En plus, ils ont dû gérer quelques bad buzz suite à la démo truquée de Gemini 1.0 et tout récemment suite à la génération de portraits ne correspondant pas à la réalité historique (ou quand l’IA applique certains principes du wokisme).

Mais malgré ce dernier couac au démarrage, la semaine dernière, l’annonce par Google de la sortie de leur IA la plus aboutie, "Gemini Pro 1.5", a fait l’effet d’une bombe. Enfin !

Il faut dire que Gemini 1.5 Pro, le ChatGPT boosté à l’epo, est l’interface IA de langage la plus puissante, la plus rapide et la plus "intelligente" au monde. Elle analyse et elle répond plus vite, et avec plus de précision, que toutes les autres solutions existantes.

Il existe deux produits Gemini sur le marché actuellement : Gemini 1.0 et Gemini 1.5 Pro.
Ce dernier n’est encore disponible qu'auprès d'un petit nombre de power-users qui partagent leurs tests sur les réseaux. Gemini 1.0 est quant à lui accessible publiquement, en version gratuite ou en version complète avec un abonnement similaire à ChatGPT4 (20 euros/mois).

Mais quelle est la différence majeure entre les deux, et pourquoi parle-t-on enfin de positionnement de leader sans comparaison dans le secteur ?

C’est essentiellement une histoire de Tokens et donc de contexte.
Un token est une unité d'information de base dans un modèle de langage. Il peut s'agir d'un mot, d'un caractère, d'une phrase ou d'une séquence de caractères.

Les tokens sont utilisés pour représenter le langage dans un format compréhensible par les machines. Constitutifs des LLM, ils permettent aux modèles d'apprendre et de comprendre notre langage, et sont donc un élément clé de leur puissance.

Avec une puissance de calculs et donc d’analyse de contexte neuf fois supérieure à ChatGPT4 (1M de tokens), les performances de Gemini 1.5 Pro ont impressionné tout le secteur.

Notamment quand dans cette démo, Gemini 1.5 arrive à analyser un film muet de 44' en entier et à retrouver en quelques secondes un timestamp de n’importe quel passage décrit en texte ou même en simple dessin.
Lorsqu’on est à la tête d’un écosystème tel que celui d’Alphabet, les avantages concurrentiels se situent aussi dans certaines fonctionnalités qui relient les plateformes de Google entre elles.
Notamment avec le search !

Même si le concept peut paraître farfelu voire dystopique (vérifier avec Google ce que l’IA de Google a pondu comme réponse), cela reste un plus permettant un accès aux sources “humaines” et une vérification interne au texte généré via le search de Google.com.
Enfin, la stratégie qui consiste à tout relier avec la suite Google reste selon moi la meilleure façon de “câliner” ses utilisateurs et de les garder ou de les rendre fidèles. Tout comme tente de le faire Microsoft avec Copilot (OpenAI) au sein de sa suite Office.

Ces fonctionnalités alimentées par l'IA comprennent de nouvelles façons de générer, résumer et réfléchir à du texte avec l'IA dans Google Docs, la possibilité de générer des e-mails complets dans Gmail en partant de brefs points clés de l'utilisateur, la capacité de produire des images, des sons et des vidéos générées par l'IA pour illustrer des présentations dans Slides…

Mais au final, à force de vouloir être partout, tout le temps, Google ne se mord-t-il pas la queue ? Google ne cannibalise-t-il pas une bonne partie de sa plus grosse source de revenus qu’est le Search Engine Marketing ?

Pourquoi ferais-je une recherche Google si j’ai mes réponses dans Gemini, gratuitement, sans adwords?

En bref, ne soyons pas trop naïfs et posons-nous la bonne question : est-ce que la pub viendra un jour se coller aux résultats pondus par une IA comme dans le Search ?

La semaine prochaine, je vous parlerai de son !
Musique, bande son, voix off... La génération par Intelligence artificielle est arrivée jusqu’à nos oreilles et des leaders tels que ElevenLabs et Synthesia se détachent rapidement.

Archive / TECH