En fait, Gemini 3 ressemble moins à un changement de version et plus à un redémarrage pur et simple de tout le système. Ici, Google ne peaufine pas les détails, mais revoit carrément les capacités de base du modèle. Sundar Pichai parle même d’une nouvelle ère de l’IA – une formulation à laquelle on n’adhère pas forcément, mais qui montre à quel point Google prend cette mise à jour au sérieux.

Ce que Google entend par « plus intelligent »

Le modèle doit avant tout être nettement plus performant en matière de raisonnement logique. Google décrit cela avec le mot-clé « PhD-Level Reasoning ». Qu’il s’agisse de langage marketing ou non, l’exigence est claire en tout cas. Les questions complexes, les processus scientifiques et les argumentations imbriquées doivent appeler des réponses plus structurées, plus précises et sans phrases inutiles.

À cela s’ajoute le fait que Gemini 3 est pour la première fois entièrement multimodal. Le texte, les images, les vidéos et l’audio ne sont plus traités séparément, mais évalués dans une étape de modélisation commune. Les exemples pratiques vont de la numérisation et de la traduction d’une recette manuscrite à l’analyse d’un mouvement sportif par vidéo. La multimodalité que Google promet depuis longtemps semble ainsi plus tangible qu’auparavant.

En outre, Gemini 3 dispose d’une fenêtre contextuelle nettement plus grande. Le modèle peut classer des quantités de données beaucoup plus importantes sans perte d’informations. Ces données peuvent consister en des matériaux de recherche complets, de longues vidéos ou du code volumineux. Pour vous, cela signifie moins de répétitions et une conservation prolongée des contextes.

Gemini 3 Pro : le nouveau roi dans l’arène des benchmarks

Dans les benchmarks, Google se montre comme d’habitude très sûr de lui. Gemini 3 se place en tête de la LM Arena, décroche de nouveaux records de valeurs dans les tests multimodaux comme MMMU-Pro et fournit de solides résultats de codage dans SWE-bench. La progression fulgurante effectuée dans le cadre du test MathArena-Apex est particulièrement frappante, puisque le modèle atteint 23,4 %. Cela représente un écart considérable par rapport aux résultats précédents.

Übersicht von verschiedenen KI-Benchmark-Tests, die Gemini mit der Konkurrenz vergleichen.
Dans de nombreux tests, Gemini a pu progresser de manière significative ! Source de l'image : Google

En même temps, les premiers tests donnent une image différenciée : le prix de l’API devrait se situer plutôt dans le haut de gamme et certains utilisateurs font état de taux d’hallucination occasionnellement plus élevés. La puissance est donc abondante, mais pas sans effets secondaires.

Nouvelles fonctionnalités : des mises en page de magazines jusqu’aux agents

Avec Gemini 3, Google introduit plusieurs nouveaux concepts d’interaction. Outre les réponses classiques, l’entreprise teste dans les Gemini Labs des UI dites « génératives ». La mise en page visuelle transpose les contenus dans le style d’un magazine, tandis que la Dynamic View génère même de petites mini-applications interactives à partir d’une requête.

Le nouveau mode Deep Think prolonge le temps de calcul afin d’analyser plus précisément les tâches exigeantes. Pour le moment, cette option apparaît uniquement pour les abonnements Ultra et, pour l’instant, elle est indisponible en France.

L’agent Gemini est un aspect particulièrement important. Il peut prendre en charge de manière autonome des processus composés de plusieurs niveaux. Cela peut aller de la planification de voyage à l’organisation de différents services en passant par le classement des e-mails. Vous gardez le contrôle, mais la direction est claire : à l’avenir, c’est l’IA qui doit gérer activement les processus de travail. Cette fonctionnalité sera également lancée de manière exclusive et uniquement aux États-Unis.

Google pense aussi aux développeurs

Parallèlement, Google met en place une infrastructure plus large pour les développeurs :

  • AI Studio : Gemini 3 Pro gratuit pour les développeurs.
  • Gemini CLI : accès au terminal pour des tests et des automatisations rapides.
  • Antigravity : une nouvelle plateforme spécialement conçue pour les agents IA.
  • Vertex AI : Gemini pour les entreprises et les flux de travail productifs.

Il est ainsi clair que Google a pour but la création de quelque chose de plus important qu’un simple modèle purement grand public.

En ce qui concerne la disponibilité, la version preview de Gemini 3 Pro est déjà utilisable, surtout aux États-Unis et dans les niveaux tarifaires correspondants. La recherche Google de cette zone géographique utilise également le modèle à base d’IA dans un premier temps. Deep Think suivra dans les semaines à venir. Les développeurs peuvent déjà tester Gemini 3 Pro dans AI Studio, via la CLI et dans Vertex AI. Vous pouvez d’ores et déjà vous rendre sur le site Google AI Studio si vous souhaitez découvrir gratuitement ce que Gemini 3 Pro a dans le ventre.

La contre-attaque de Google

Gemini 3 constitue moins une simple mise à jour et plus l’envoi d’un signal stratégique. Un signal indiquant de manière claire que Google veut à nouveau être perçu comme un leader en matière d’innovation. Et le moins que l’on puisse dire, c’est que le coup d’envoi est réussi. Plus de multimodalité, une fenêtre contextuelle massive et les premières fonctions d’agent montrent la direction prise. C’est-à-dire la volonté de s’éloigner du simple système de dialogue pour aller vers de véritables assistants numériques.

Gemini 3 n’est bien sûr pas encore parfait. Mais il redéfinit les attentes du public envers les modèles d’IA modernes. Et il rend la course à l’IA de 2025 nettement plus passionnante que beaucoup ne l’auraient supposé. Après un laps de temps pendant lequel Google semblait être à la traîne dans le domaine, les Californiens dictent à nouveau la cadence. Du moins, pour le moment.