El gigante estadounidense Google presentó el martes la nueva versión de su herramienta de inteligencia artificial (IA), Gemini, con el objetivo declarado de liderar la reñida carrera por esta tecnología.

Gemini 3 fue promocionada por sus creadores como el “mejor modelo del mundo” para interpretar y procesar datos de texto, imágenes, audio y vídeo, y como un potente “agente” digital capaz de crear aplicaciones a demanda.

“Este es nuestro modelo más inteligente”, dijo Koray Kavukcuoglu, jefe de inteligencia artificial de Google, en una sesión informativa con periodistas.

“Nos gusta pensar que ayudará a todos a dar vida a cualquier idea que tengan”, agregó.

El nuevo modelo de IA estará disponible en la versión actualizada de la aplicación Gemini, para la cual Google afirma tener 650 millones de usuarios mensuales, mientras que más de dos mil millones de personas acceden a ella mensualmente por defecto a través del motor de búsqueda, según Kavukcuoglu.

“Gemini ha establecido un nuevo ritmo en términos de actualización de modelos, pero también al ponerlos a disposición de las personas más rápido que nunca”, insistió, “lo entregamos muy rápidamente y aprendimos durante todo el proceso”.

La versión anterior, Gemini 2.0, fue presentada en febrero pasado.

Sorprendido por la aparición del ChatGPT de la start-up OpenAI, y ridiculizado por errores iniciales de la primera versión de su IA generativa Gemini a finales de 2023, Google ha avanzado considerablemente desde entonces, convirtiéndose en un actor importante en la inteligencia artificial orientada al consumidor.

Pocos meses después del lanzamiento de la primera versión de Gemini, el grupo de Mountain View, California, presentó AI Overviews, una función integrada en su motor de búsqueda Google Search que generó burlas después de recomendar hacer pizza con pegamento y comer una roca al día en respuesta a consultas.

Sin embargo, Google mejoró rápidamente la calidad de su herramienta de IA, y según el vicepresidente de producto del grupo, Robby Stein, la integración de Gemini 3 en su motor de búsqueda representará un “avance formidable”.

Rendimiento revolucionario y razonamiento de vanguardia

Gemini 3 Pro establece nuevos estándares en la industria de la IA, alcanzando la cima del LMArena Leaderboard con una puntuación histórica de 1501 Elo. El modelo demuestra capacidades de razonamiento a nivel de doctorado, obteniendo puntuaciones sobresalientes en pruebas de referencia extremadamente desafiantes como Humanity’s Last Exam (37.5% sin uso de herramientas) y GPQA Diamond (91.9%).

En matemáticas, Gemini 3 Pro establece un nuevo estado del arte con 23.4% en MathArena Apex. Más allá del texto, redefine el razonamiento multimodal con 81% en MMMU-Pro y 87.6% en Video-MMMU, mientras que logra un 72.1% en SimpleQA Verified, demostrando gran progreso en precisión factual.

Gemini 3 Deep Think: Razonamiento potenciado

El modo Gemini 3 Deep Think lleva las capacidades del modelo a un nivel aún más alto, ofreciendo un cambio radical en razonamiento y comprensión multimodal. En pruebas, Deep Think supera el ya impresionante rendimiento de Gemini 3 Pro en Humanity’s Last Exam (41.0% sin herramientas) y GPQA Diamond (93.8%). Además, alcanza un sin precedentes 45.1% en ARC-AGI-2, demostrando su capacidad para resolver desafíos novedosos.

Aprender cualquier cosa con comprensión multimodal avanzada

Gemini 3 fue construido desde el inicio para sintetizar información sobre cualquier tema a través de múltiples modalidades, incluyendo texto, imágenes, video, audio y código. Con su razonamiento de vanguardia, comprensión visual y espacial, rendimiento multilingüe líder y ventana de contexto de 1 millón de tokens, el modelo ayuda a los usuarios a aprender de formas personalizadas.

Las aplicaciones prácticas incluyen descifrar y traducir recetas manuscritas en diferentes idiomas para crear libros de cocina familiares, generar código para tarjetas interactivas o visualizaciones a partir de documentos académicos y vídeos educativos, o analizar vídeos de partidos deportivos para generar planes de entrenamiento personalizados.

El Modo IA en la Búsqueda de Google ahora utiliza Gemini 3 para permitir nuevas experiencias de interfaz de usuario generativa, como diseños visuales inmersivos y herramientas y simulaciones interactivas, todo generado completamente al vuelo según la consulta del usuario.

Construir cualquier cosa: Excelencia en codificación

Gemini 3 es el mejor modelo de codificación vibe y codificación agente que Google ha construido, haciendo que sus productos sean más autónomos y aumentando la productividad de los desarrolladores. Lidera el WebDev Arena leaderboard con una impresionante puntuación de 1487 Elo y obtiene 54.2% en Terminal-Bench 2.0, que prueba la capacidad de uso de herramientas de un modelo para operar una computadora a través de terminal. También supera ampliamente a 2.5 Pro en SWE-bench Verified (76.2%), un punto de referencia que mide los agentes de codificación.

El modelo es excepcional en la generación zero-shot y maneja instrucciones y prompts complejos para renderizar interfaces de usuario web más ricas e interactivas. Los desarrolladores pueden construir con Gemini 3 en Google AI Studio, Vertex AI, Gemini CLI, y en plataformas de terceros como Cursor, GitHub, JetBrains, Manus y Replit.

Google Antigravity: Nueva Plataforma de Desarrollo Agente

Google introduce Antigravity, su nueva plataforma de desarrollo agente que permite a los desarrolladores operar a un nivel superior orientado a tareas. Utilizando las capacidades avanzadas de razonamiento, uso de herramientas y codificación agente de Gemini 3, Antigravity transforma la asistencia de IA de una herramienta en el kit de un desarrollador a un socio activo.

Los agentes en Antigravity han sido elevados a una superficie dedicada y tienen acceso directo al editor, terminal y navegador, permitiéndoles planificar y ejecutar autónomamente tareas de software complejas de principio a fin mientras validan su propio código. La plataforma también incluye el modelo Gemini 2.5 Computer Use para control del navegador y Nano Banana (Gemini 2.5 Image), el modelo de edición de imágenes mejor calificado.

Planificar cualquier cosa con agentes mejorados

Gemini 3 demuestra capacidades mejoradas de planificación a largo plazo, encabezando el leaderboard en Vending-Bench 2, que prueba la planificación de horizontes más largos mediante la gestión de un negocio simulado de máquinas expendedoras. Gemini 3 Pro mantiene un uso consistente de herramientas y toma de decisiones durante un año completo de operación simulada, generando mayores retornos sin desviarse de la tarea.

Esto significa que Gemini 3 puede ayudar mejor a realizar tareas cotidianas combinando un razonamiento más profundo con un uso de herramientas mejorado y más consistente, navegando por flujos de trabajo complejos de múltiples pasos de principio a fin, como reservar servicios locales u organizar la bandeja de entrada de correo electrónico. Los suscriptores de Google AI Ultra pueden probar estas capacidades agentes en la aplicación Gemini con Gemini Agent.

Seguridad y responsabilidad

Gemini 3 es el modelo más seguro de Google hasta la fecha y ha sido sometido al conjunto más completo de evaluaciones de seguridad de cualquier modelo de IA de Google. El modelo muestra una sycophancy reducida, mayor resistencia a inyecciones de prompts y protección mejorada contra el uso indebido mediante ciberataques.

Además de las pruebas internas para los dominios críticos en el Marco de Seguridad Fronterizo de Google, la compañía se ha asociado con expertos líderes mundiales en la materia, ha proporcionado acceso anticipado a organismos como el UK AISI y ha obtenido evaluaciones independientes de expertos de la industria como Apollo, Vaultis y Dreadnode.

Disponibilidad

A partir de hoy, Gemini 3 comienza a implementarse en múltiples plataformas:

Para usuarios generales: disponible en la aplicación Gemini y para suscriptores de Google AI Pro y Ultra en Modo IA en la Búsqueda

Para desarrolladores: disponible en la API de Gemini en AI Studio, Google Antigravity (la nueva plataforma de desarrollo agente) y Gemini CLI

Para empresas: disponible en Vertex AI y Gemini Enterprise

El modo Gemini 3 Deep Think estará disponible para suscriptores de Google AI Ultra en las próximas semanas, después de evaluaciones de seguridad adicionales y aportes de probadores de seguridad. Google planea lanzar modelos adicionales a la serie Gemini 3 pronto para expandir las capacidades de IA.

Impacto y adopción

Desde el inicio de la era Gemini hace casi dos años, el impacto ha sido significativo: AI Overviews cuenta con 2 mil millones de usuarios mensuales, la aplicación Gemini supera los 650 millones de usuarios por mes, más del 70% de los clientes de Cloud de Google utilizan su IA, y 13 millones de desarrolladores han construido con sus modelos generativos.

Gemini 3 representa la culminación de generaciones anteriores: Gemini 1 introdujo avances en multimodalidad nativa y ventana de contexto largo, mientras que Gemini 2 estableció las bases para capacidades agentes y empujó las fronteras en razonamiento y pensamiento, llevando a que Gemini 2.5 Pro encabezara LMArena durante más de seis meses. Con Gemini 3, Google entrega su modelo más inteligente que combina todas las capacidades de Gemini para permitir a los usuarios dar vida a cualquier idea.