✨ Gemini 2.5 Pro

Modèle propriétaire de Google DeepMind, lancé d'abord en preview en mars 2025 puis stabilisé en juin 2025. Gemini 2.5 Pro est positionné comme le modèle Gemini le plus avancé pour le raisonnement, le codage, l'analyse multimodale et les workflows agentiques à long contexte.

Spécifications

Champ	Valeur
Éditeur	Google DeepMind / Google AI
Identifiant API	`gemini-2.5-pro`
Statut	Stable / GA depuis le 17 juin 2025
Fenêtre de contexte	1 048 576 tokens en entrée
Sortie max	65 536 tokens
Modalités	Texte, image, audio, vidéo, PDF → texte
Cutoff de connaissance	Janvier 2025
Outils	function-calling, structured outputs, code execution, file search, search grounding, URL context, Google Maps grounding
Tarification standard	$1.25/M tokens en entrée jusqu'à 200k, puis $2.50; sortie $10/M puis $15 au-delà de 200k

Architecture

Type : modèle propriétaire de type transformer-architecture avec raisonnement explicite de la famille Gemini 2.5.
Contexte long : conçu pour ingérer de grands corpus, dépôts de code, documents PDF et séquences multimodales longues.
Raisonnement : Google le présente comme un thinking model avec contrôle de budget de réflexion côté API.
Agentique : support natif de function-calling, des sorties structurées, de l'usage d'outils et des intégrations proches de mcp-protocol.
Multimodalité : accepte nativement texte, image, audio et vidéo, tout en restant centré sur une sortie textuelle exploitable dans des pipelines, RAG et embeddings.

Performances

Au lancement de Gemini 2.5, Google a communiqué 63.8% sur SWE-Bench Verified avec un setup agentique personnalisé.
Lors des mises à jour de mai 2025, Google a aussi mis en avant une progression forte sur WebDev Arena, avec un gain de +147 Elo sur la version antérieure.
À I/O 2025, Google indiquait que 2.5 Pro menait WebDev Arena avec 1415 Elo et restait en tête sur LMArena.
Google met également en avant des performances de pointe sur le long context et la compréhension vidéo, notamment 84.8% sur VideoMME pour la version I/O.
Le modèle est surtout visé pour le codage complexe, les agents outillés, l'analyse documentaire longue et les cas d'usage concurrençant claude-4, gpt-5 et qwen-3-7.

Licence & Disponibilité

Licence : propriétaire, poids non ouverts.
Disponibilité : Gemini API, Google AI Studio, Vertex AI / Agent Platform, Gemini app.
Versions : alias stable gemini-2.5-pro; release GA annoncée le 17 juin 2025.
Fonctions supportées : Batch API, context caching, priority inference, file search, grounding web/cartes; Live API non supportée sur cette variante texte.
Cycle de vie : documentation Google Cloud indiquant une disponibilité "not before October 16, 2026" pour l'arrêt minimalement envisagé.

Pages Liées

claude-4 gpt-5 qwen-3-7 mcp-protocol function-calling transformer-architecture embeddings

3.7 KiB Raw Permalink Blame History