Files
wiki/entities/gemini-2-5-pro.md
2026-06-12 19:26:55 +02:00

3.7 KiB

title, created, updated, type, tags, sources, confidence, contested
title created updated type tags sources confidence contested
Gemini 2.5 Pro 2026-06-11 2026-06-11 entity
model
architecture
agent
multimodal
https://ai.google.dev/gemini-api/docs/models/gemini-2.5-pro
https://docs.cloud.google.com/gemini-enterprise-agent-platform/models/gemini/2-5-pro
https://cloud.google.com/gemini-enterprise-agent-platform/generative-ai/pricing
https://blog.google/innovation-and-ai/models-and-research/google-deepmind/gemini-model-thinking-updates-march-2025/
https://blog.google/innovation-and-ai/models-and-research/google-deepmind/google-gemini-updates-io-2025/
medium false

Gemini 2.5 Pro

Modèle propriétaire de Google DeepMind, lancé d'abord en preview en mars 2025 puis stabilisé en juin 2025. Gemini 2.5 Pro est positionné comme le modèle Gemini le plus avancé pour le raisonnement, le codage, l'analyse multimodale et les workflows agentiques à long contexte.

Spécifications

Champ Valeur
Éditeur Google DeepMind / Google AI
Identifiant API gemini-2.5-pro
Statut Stable / GA depuis le 17 juin 2025
Fenêtre de contexte 1 048 576 tokens en entrée
Sortie max 65 536 tokens
Modalités Texte, image, audio, vidéo, PDF → texte
Cutoff de connaissance Janvier 2025
Outils function-calling, structured outputs, code execution, file search, search grounding, URL context, Google Maps grounding
Tarification standard $1.25/M tokens en entrée jusqu'à 200k, puis $2.50; sortie $10/M puis $15 au-delà de 200k

Architecture

  • Type : modèle propriétaire de type transformer-architecture avec raisonnement explicite de la famille Gemini 2.5.
  • Contexte long : conçu pour ingérer de grands corpus, dépôts de code, documents PDF et séquences multimodales longues.
  • Raisonnement : Google le présente comme un thinking model avec contrôle de budget de réflexion côté API.
  • Agentique : support natif de function-calling, des sorties structurées, de l'usage d'outils et des intégrations proches de mcp-protocol.
  • Multimodalité : accepte nativement texte, image, audio et vidéo, tout en restant centré sur une sortie textuelle exploitable dans des pipelines, RAG et embeddings.

Performances

  • Au lancement de Gemini 2.5, Google a communiqué 63.8% sur SWE-Bench Verified avec un setup agentique personnalisé.
  • Lors des mises à jour de mai 2025, Google a aussi mis en avant une progression forte sur WebDev Arena, avec un gain de +147 Elo sur la version antérieure.
  • À I/O 2025, Google indiquait que 2.5 Pro menait WebDev Arena avec 1415 Elo et restait en tête sur LMArena.
  • Google met également en avant des performances de pointe sur le long context et la compréhension vidéo, notamment 84.8% sur VideoMME pour la version I/O.
  • Le modèle est surtout visé pour le codage complexe, les agents outillés, l'analyse documentaire longue et les cas d'usage concurrençant claude-4, gpt-5 et qwen-3-7.

Licence & Disponibilité

  • Licence : propriétaire, poids non ouverts.
  • Disponibilité : Gemini API, Google AI Studio, Vertex AI / Agent Platform, Gemini app.
  • Versions : alias stable gemini-2.5-pro; release GA annoncée le 17 juin 2025.
  • Fonctions supportées : Batch API, context caching, priority inference, file search, grounding web/cartes; Live API non supportée sur cette variante texte.
  • Cycle de vie : documentation Google Cloud indiquant une disponibilité "not before October 16, 2026" pour l'arrêt minimalement envisagé.

Pages Liées

claude-4 gpt-5 qwen-3-7 mcp-protocol function-calling transformer-architecture embeddings