Files
wiki/entities/gemini-2-5-pro.md
T
2026-06-12 19:26:55 +02:00

56 lines
3.7 KiB
Markdown

---
title: Gemini 2.5 Pro
created: 2026-06-11
updated: 2026-06-11
type: entity
tags: [model, architecture, agent, multimodal]
sources:
- https://ai.google.dev/gemini-api/docs/models/gemini-2.5-pro
- https://docs.cloud.google.com/gemini-enterprise-agent-platform/models/gemini/2-5-pro
- https://cloud.google.com/gemini-enterprise-agent-platform/generative-ai/pricing
- https://blog.google/innovation-and-ai/models-and-research/google-deepmind/gemini-model-thinking-updates-march-2025/
- https://blog.google/innovation-and-ai/models-and-research/google-deepmind/google-gemini-updates-io-2025/
confidence: medium
contested: false
---
# ✨ Gemini 2.5 Pro
Modèle propriétaire de Google DeepMind, lancé d'abord en preview en mars 2025 puis stabilisé en juin 2025. **Gemini 2.5 Pro** est positionné comme le modèle Gemini le plus avancé pour le raisonnement, le codage, l'analyse multimodale et les workflows agentiques à long contexte.
## Spécifications
| Champ | Valeur |
|:---|:---|
| Éditeur | Google DeepMind / Google AI |
| Identifiant API | `gemini-2.5-pro` |
| Statut | Stable / GA depuis le 17 juin 2025 |
| Fenêtre de contexte | 1 048 576 tokens en entrée |
| Sortie max | 65 536 tokens |
| Modalités | Texte, image, audio, vidéo, PDF → texte |
| Cutoff de connaissance | Janvier 2025 |
| Outils | [[function-calling]], structured outputs, code execution, file search, search grounding, URL context, Google Maps grounding |
| Tarification standard | $1.25/M tokens en entrée jusqu'à 200k, puis $2.50; sortie $10/M puis $15 au-delà de 200k |
## Architecture
- **Type** : modèle propriétaire de type [[transformer-architecture]] avec raisonnement explicite de la famille Gemini 2.5.
- **Contexte long** : conçu pour ingérer de grands corpus, dépôts de code, documents PDF et séquences multimodales longues.
- **Raisonnement** : Google le présente comme un *thinking model* avec contrôle de budget de réflexion côté API.
- **Agentique** : support natif de [[function-calling]], des sorties structurées, de l'usage d'outils et des intégrations proches de [[mcp-protocol]].
- **Multimodalité** : accepte nativement texte, image, audio et vidéo, tout en restant centré sur une sortie textuelle exploitable dans des pipelines, RAG et [[embeddings]].
## Performances
- Au lancement de Gemini 2.5, Google a communiqué **63.8% sur SWE-Bench Verified** avec un setup agentique personnalisé.
- Lors des mises à jour de mai 2025, Google a aussi mis en avant une progression forte sur **WebDev Arena**, avec un gain de **+147 Elo** sur la version antérieure.
- À I/O 2025, Google indiquait que 2.5 Pro menait **WebDev Arena** avec **1415 Elo** et restait en tête sur **LMArena**.
- Google met également en avant des performances de pointe sur le **long context** et la **compréhension vidéo**, notamment **84.8% sur VideoMME** pour la version I/O.
- Le modèle est surtout visé pour le codage complexe, les agents outillés, l'analyse documentaire longue et les cas d'usage concurrençant [[claude-4]], [[gpt-5]] et [[qwen-3-7]].
## Licence & Disponibilité
- **Licence** : propriétaire, poids non ouverts.
- **Disponibilité** : Gemini API, Google AI Studio, Vertex AI / Agent Platform, Gemini app.
- **Versions** : alias stable `gemini-2.5-pro`; release GA annoncée le **17 juin 2025**.
- **Fonctions supportées** : Batch API, context caching, priority inference, file search, grounding web/cartes; **Live API non supportée** sur cette variante texte.
- **Cycle de vie** : documentation Google Cloud indiquant une disponibilité "**not before October 16, 2026**" pour l'arrêt minimalement envisagé.
## Pages Liées
[[claude-4]] [[gpt-5]] [[qwen-3-7]] [[mcp-protocol]] [[function-calling]] [[transformer-architecture]] [[embeddings]]