Gemini 3.0 ya está aquí, y el nuevo IDE antigravedad de Google podría ser el verdadero asesino del cursor.

Gemini 3.0 por fin está aquí, pero la mayor sorpresa no es el modelo en sí, sino el nuevo IDE Antigravity de Google.

Mientras todos especulaban sobre los datos de lanzamiento y observaban a OpenAI luchar con las actualizaciones de GPT-5 y a Anthropic celebrar las últimas victorias de Claude, Google acaba de lanzar lo que podría ser su lanzamiento de IA más significativo hasta el momento.

Honestamente, este nuevo IDE de Google nos ha tomado a muchos por sorpresa.

He estado siguiendo los lanzamientos de inteligencia artificial de Google desde que se lanzó Gemini a fines de 2023.

Gemini 3 combina razonamiento de última generación con algo que Google nunca había hecho antes: enviar un modelo completamente nuevo al buscador desde el primer día.

Además, construyeron una nueva plataforma de codificación agentica llamada Google Antigravity que compite directamente con herramientas como Cursor 2.0.

Gemini 3 Pro obtiene 1501 puntos en LMArena, superando los 1451 de su predecesor y todos los demás modelos Frontier disponibles actualmente.

Demuestra un razonamiento de nivel de doctorado en todos los puntos de referencia y procesos académicos, manejando hasta un millón de tokens de contexto en una sola conversación.

Pero la verdadera historia no es sólo un mejor rendimiento.

Así es como Google está reinventando lo que puede hacer un modelo de IA - desde generar interfaces visuales interactivas sobre la marcha hasta construir de forma autónoma aplicaciones completas mientras prueba su propio código.

En este desglose, cubro:

Qué es Gemini 3 y en qué se diferencia de las versiones anteriores
Google Antigravity y el nuevo enfoque de codificación agentica
Interfaz de usuario generativa y por qué es importante para los desarrolladores
Números de referencia reales y cómo se comparan
Lo que esto significa para el panorama de la IA en este momento

Vamos a entrar en materia.

¿Qué es Gemini 3 Pro?

Gemini 3 es el último modelo base de Google, lanzado hoy en versión preliminar pública en la aplicación Gemini, AI Studio, Vertex AI y, por primera vez, en la Búsqueda de Google.

Google lo llama su “modelo más inteligente” que le ayuda a “dar vida a cualquier idea”.

El lanzamiento incluye dos versiones:

Gemini 3 Pro : disponible ahora para todos. Razonamiento de vanguardia, comprensión multimodal y capacidades avanzadas de codificación.

Gemini 3 Deep Think : el modo de razonamiento mejorado llegará a los suscriptores de Google AI Ultra en las próximas semanas después de pruebas de seguridad adicionales.

Fundación Técnica

Gemini 3 Pro utiliza una arquitectura dispersa de mezcla de expertos con más de 1 billón de parámetros.

En lugar de activar todo el modelo para cada consulta, enruta las entradas a subredes especializadas. Solo los expertos relevantes se ejecutan en cada momento .

En una empresa con 1000 empleados, no se convoca a todos a cada reunión. Cada equipo se encarga de problemas específicos.

Gemini 3 funciona de la misma manera, dirigiendo las preguntas a las redes de expertos adecuadas según la tarea.

Esto da como resultado menores costos computacionales y al mismo tiempo mantiene un rendimiento de nivel frontera.

Capacidades básicas

Ventana de contexto : 1 millón de tokens (aproximadamente 700.000 palabras o alrededor de 10 novelas completas en una sola conversación).
Procesamiento multimodal : maneja texto, imágenes, audio, video y código simultáneamente.
Generación de salida : hasta 64.000 tokens por respuesta.
Fecha límite de conocimiento : enero de 2025.

Disponibilidad de Gemini 3

A partir de hoy, puedes acceder a Gemini 3 a través de:

Aplicación Gemini : acceso gratuito para todos los usuarios
Google AI Studio : acceso gratuito para desarrolladores con generosos límites de tarifa
Vertex AI : Implementación empresarial
Gemini CLI : interfaz de línea de comandos para desarrolladores
Modo IA en la búsqueda : disponible para los suscriptores de Google AI Pro y Ultra
Google Antigravity : nueva plataforma de desarrollo de agentes (más información a continuación)

El modelo también está integrado con plataformas de terceros como Cursor, GitHub Copilot, JetBrains y Replit.

Cómo funciona

Google diseñó Gemini 3 para comprender el contexto y la intención mejor que los modelos anteriores.

Obtienes lo que necesitas con menos indicaciones. El modelo entiende lo que pides.

Está diseñado para “captar la profundidad y los matices”, ya sea percibiendo pistas sutiles en una idea creativa o separando capas superpuestas de un problema complejo.

El enfoque de entrenamiento incluyó documentos web, repositorios de código, imágenes, archivos de audio, video y datos sintéticos generados por otros sistemas de IA.

Google filtró todo en busca de calidad y seguridad, eliminando contenido pornográfico, material violento y cualquier cosa que viole las leyes de seguridad infantil.

El entrenamiento se realizó en las unidades de procesamiento tensorial de Google utilizando el software JAX y ML Pathways.

Modo de pensamiento profundo de Géminis 3

Este modo de razonamiento mejorado impulsa aún más las capacidades de Gemini 3 en los problemas más desafiantes.

Mejoras en el rendimiento académico:

El último examen de la humanidad : 41,0 % (frente al 37,5 % del Gemini 3 Pro estándar)
GPQA Diamante : 93,8% (frente al 91,9%)
ARC-AGI-2 : 45,1 % con ejecución de código, lo que demuestra una novedosa capacidad para resolver problemas

El modo Deep Think se implementará primero para los evaluadores de seguridad y luego para los suscriptores de Google AI Ultra en las próximas semanas.

El enfoque por fases le da a Google tiempo para recopilar comentarios y garantizar que las capacidades de razonamiento mejoradas funcionen bien a gran escala.

Google Antigravity: la plataforma de desarrollo agéntico

Google lanzó Antigravity junto con Gemini 3, y representa un replanteamiento completo de cómo los desarrolladores escriben código.

Antigravity es una plataforma de desarrollo agente que permite a los desarrolladores operar en un nivel orientado a tareas en lugar de enterrarse en detalles de implementación.

Disponible hoy como vista previa pública gratuita para macOS, Windows y Linux.

Acabo de descargarlo y actualmente lo estoy probando para darle un informe completo en el próximo artículo sobre su rendimiento.

Cómo funciona

En esencia, Antigravity es una experiencia de IDE de IA familiar.

Pero los agentes han sido elevados a una superficie dedicada con acceso directo a tres componentes críticos:

Editor — Escritura y modificación de código
Terminal : ejecución de comandos y operaciones del sistema
Navegador : pruebas, validación y uso de la computadora

Los agentes ahora pueden planificar y ejecutar de forma autónoma tareas de software complejas de extremo a extremo mientras validan su propio código.

Tú actúas como arquitecto. Los agentes se encargan de la implementación.

Soporte multimodelo

La antigravedad no está limitada a los modelos de Google.

Los desarrolladores pueden elegir entre:

Gemini 3 Pro : el modelo más reciente y potente de Google
Claude Sonnet 4.5 — El principal modelo de razonamiento de Anthropic
GPT-OSS : modelos de peso abierto de OpenAI

Google ofrece límites de velocidad generosos para el uso de Gemini 3 Pro, que se actualizan cada cinco horas para evitar abusos.

El acceso a otros modelos depende de los límites de capacidad y velocidad.

Enfoque centrado en el agente

Otras herramientas de programación priorizan los archivos y carpetas. Navegas por directorios, abres archivos, editas código y cambias de contexto constantemente.

La antigravedad invierte este modelo.

La interfaz se centra en los agentes y su trabajo, no en la exploración de archivos. Si lo prefiere, puede cambiar a la vista tradicional del editor, pero la configuración predeterminada prioriza al agente.

Los agentes comunican su trabajo mediante artefactos detallados. Se ve lo que planean, lo que construyen y cómo lo prueban.

Esto eleva todos los aspectos del desarrollo:

Construyendo funciones desde cero
Iteración y diseño de la interfaz de usuario
Corrección de errores y depuración
Investigación y generación de informes
Desarrollo de aplicaciones de extremo a extremo

Ejecución autónoma de tareas

Los agentes antigravedad no solo generan código.

Ejecutan flujos de trabajo completos.

Un flujo típico:

Describe lo que quieres construir
El agente analiza los requisitos y crea un plan
El agente escribe el código en varios archivos
El agente prueba la aplicación en el navegador.
El agente identifica problemas e itera
El agente valida el resultado final
Usted revisa y aprueba

Todo el proceso lo gestiona el agente, que mantiene el contexto en el editor, la terminal y el navegador simultáneamente.

Integración del uso de la computadora

Antigravity viene estrechamente acoplado con el modelo de uso de computadora Gemini 2.5 para el control del navegador.

Esto significa que los agentes pueden:

Abrir e interactuar con navegadores web
Haga clic en los botones y complete formularios
Navegar por interfaces complejas
Pruebe los cambios de la interfaz de usuario en tiempo real
Depurar problemas del lado del cliente
Validar flujos de usuarios

El navegador no solo sirve para ver resultados. Es una herramienta activa que el agente utiliza para verificar su funcionamiento.

Creado para la confianza y la autonomía

Google diseñó Antigravity en torno a tres principios fundamentales:

Confianza : los agentes proporcionan contexto a nivel de tarea y artefactos verificables para que usted sepa exactamente qué se está construyendo y por qué.
Autonomía : los agentes trabajan independientemente pero permanecen bajo su control y guía en todo momento.
Comentarios : los informes de progreso detallados y la generación de artefactos lo mantienen informado durante todo el proceso de desarrollo.

Esto representa un cambio completo en la forma en que creamos software.

En lugar de escribir usted mismo cada línea de código, usted opera en un nivel estratégico más alto mientras los agentes manejan la implementación táctica.

Rendimiento de codificación de Vibe

Google afirma que Gemini 3 es su "mejor modelo de codificación de vibraciones hasta la fecha".

Los números lo respaldan:

WebDev Arena : 1487 Elo (encabeza la clasificación)
Terminal-Bench 2.0 : 54,2 % (capacidad de uso de la herramienta de prueba a través del terminal)
SWE-bench verificado : 76,2 % (mide el rendimiento del agente de codificación)

Estos puntos de referencia ponen a prueba la capacidad del modelo para comprender la intención del desarrollador, escribir código funcional y resolver problemas de ingeniería de software del mundo real.

Antigravity hace que estas capacidades sean accesibles a través de una interfaz limpia que no requiere de grandes conocimientos de IA para su uso efectivo.

Experiencia de usuario temprana

Los desarrolladores que prueban Antigravity informan un flujo de trabajo diferente al de la codificación tradicional.

En lugar de: “Déjame escribir esta función, probarla, depurarla, refactorizarla…”

Obtienes: "Necesito una aplicación de seguimiento de vuelos con actualizaciones en tiempo real y una interfaz de usuario limpia", y el agente la crea mientras tú te concentras en decisiones de nivel superior.

El agente planifica, codifica la aplicación y valida la ejecución de forma independiente mediante pruebas basadas en navegador.

Revisas el trabajo, ofreces retroalimentación y guías la dirección. El agente gestiona los detalles de la implementación.

Integración de interfaz de usuario generativa y búsqueda desde el primer día

Gemini 3 presenta algo que Google llama “interfaces generativas”: IA que genera tanto contenido como experiencias de usuario completas en respuesta a cualquier solicitud.

Herramientas interactivas, visualizaciones y aplicaciones creadas sobre la marcha.

Dos modos de interfaz de usuario generativa

Google lanzó dos enfoques experimentales en la aplicación Gemini:

Vista dinámica : Gemini 3 diseña y codifica una respuesta interactiva totalmente personalizada para cada indicación.

El sistema entiende que explicar el microbioma a un niño de 5 años requiere contenidos y características diferentes que explicárselo a un adulto.

Crear una galería de publicaciones en redes sociales para una empresa requiere una interfaz muy diferente a la de planificar un próximo viaje.

Diseño visual : crea una vista envolvente estilo revista, completa con fotos y módulos interactivos.

La diferencia clave: Visual Layout genera controles deslizantes, casillas de verificación y otros filtros que le permiten personalizar aún más sus resultados.

Si preguntas cómo planificar un viaje de tres días a Roma, no obtendrás sólo un itinerario de texto.

Obtendrás un diseño visual con widgets interactivos, opciones para explorar diferentes escenarios, imágenes, tablas e información estructurada que puedes manipular directamente.

Cómo funciona detrás de escena

Gemini 3 aprovecha varias capacidades para crear estas interfaces:

Acceso a herramientas : búsqueda web, generación de imágenes, procesamiento de datos
Instrucciones del sistema : pautas detalladas que cubren objetivos, planificación, ejemplos, especificaciones técnicas, formato, manuales de herramientas y prevención de errores comunes.
Posprocesamiento : validación y refinamiento de la salida para abordar posibles problemas

Todo el sistema está guiado por instrucciones cuidadosamente elaboradas que ayudan al modelo a comprender no solo qué generar, sino también cómo estructurar la experiencia para lograr la máxima utilidad.

Ejemplos

Google demostró varios casos de uso:

Calculadora de préstamos interactiva : pregunte sobre las tasas hipotecarias y obtenga una calculadora funcional con tasas de interés ajustables y controles deslizantes para el pago inicial.
Simulaciones de Física : ¿Quieres aprender conceptos de física? Consigue una simulación interactiva que puedes manipular para comprender los principios.
Galería Van Gogh : solicite contexto sobre la obra de Van Gogh y reciba una explicación colorida basada en imágenes para cada pintura, con un contexto de vida entretejido en todas partes.

Cada interfaz está diseñada a medida para esa consulta específica, no se extrae de plantillas.

Acceso e integración para desarrolladores

Gemini 3 Pro ya está disponible a través de:

Google AI Studio : acceso gratuito para desarrolladores con generosos límites de velocidad
Vertex AI : Implementación e integración empresarial
API de Gemini : acceso directo a la API para crear aplicaciones
Firebase AI Logic : admite la gran mayoría de las capacidades de Gemini 3 para el desarrollo de aplicaciones

Plataformas de terceros que ya integran Gemini 3:

Cursor (IDE de codificación)
Copiloto de GitHub
IDE de JetBrains
Replit
Manus
Cline

La API incluye nuevas funciones específicas de Gemini 3:

Niveles de pensamiento : control más granular sobre la profundidad del razonamiento
Parámetros de resolución de medios : mejor control sobre el procesamiento de imágenes y videos
Validación más estricta : validación mejorada para firmas de pensamiento
Herramientas Bash : herramienta bash del lado del cliente para la navegación del sistema de archivos local y las operaciones del sistema, además de una herramienta bash del lado del servidor para la generación de código en varios idiomas.
Salidas estructuradas : la conexión a tierra con la búsqueda de Google y el contexto de URL ahora se pueden combinar con salidas estructuradas.

Cronograma de implementación

Disponible ahora:

Aplicación Gemini (todos los usuarios)
Modo IA en la búsqueda (suscriptores Pro y Ultra)
Google AI Studio (desarrolladores)
Vertex AI (empresas)
CLI de Gemini (desarrolladores)
Google Antigravity (vista previa gratuita)

Muy pronto:

Gemini 3 Deep Think (Suscriptores Ultra, después de las pruebas de seguridad)
Acceso gratuito al modo IA en EE. UU. (con límites más bajos que los de pago)
Selección automática de modelos en Búsqueda (enrutamiento de consultas complejas a Gemini 3)
Modelos adicionales de la serie Gemini 3

Google dice que planea lanzar más modelos de la familia Gemini 3 pronto, ampliando lo que se puede hacer con el sistema.

Puntos de referencia de rendimiento y competencia

Gemini 3 Pro supera a Gemini 2.5 Pro en todos los principales puntos de referencia de inteligencia artificial que probó Google.

Razonamiento e inteligencia

Clasificación de LMArena : 1501 Elo (puntuación revelación, líder de la clasificación). Líder anterior: Gemini 2.5 Pro con 1451 Elo.
El Último Examen de la Humanidad : 37,5 % sin usar herramientas (frente al 21,6 % de Gemini 2.5 Pro). Este punto de referencia evalúa el razonamiento académico de nivel de doctorado en múltiples disciplinas.
GPQA Diamante : 91,9 % (demuestra conocimientos científicos de nivel de posgrado)
MathArena Apex : 23,4 % (nuevo estado del arte para modelos de frontera en matemáticas)

Comprensión multimodal

MMMU-Pro : 81% (puntuación destacada en razonamiento multimodal)
Vídeo-MMMU : 87,6% (comprensión y análisis de vídeo)
ARC-AGI-2 : 31,1 % frente al 4,9 % de Gemini 2.5 Pro (juegos de razonamiento visual)

La brecha entre ARC y AGI-2 es enorme. Gemini 3 resuelve problemas de razonamiento visual que los modelos anteriores siempre superaban.

Codificación y desarrollo

WebDev Arena : 1487 Elo (encabeza la clasificación)
Terminal-Bench 2.0 : 54,2 % (prueba el funcionamiento del ordenador mediante terminal)
SWE-bench verificado : 76,2 % (mide la capacidad del agente de codificación para resolver problemas reales de GitHub)

Planificación a largo plazo

Vending-Bench 2 : Encabeza la clasificación en tareas de planificación a largo plazo. Este punto de referencia evalúa si la IA puede mantener una toma de decisiones consistente durante operaciones extensas.

Gemini 3 Pro gestionó un negocio simulado de máquinas expendedoras durante un año completo sin desviarse de la tarea, generando mayores retornos que los modelos de la competencia.

Exactitud fáctica

SimpleQA verificado : 72,1 % (prueba la precisión de los hechos y las tasas de alucinaciones)

Esto representa un avance importante en uno de los mayores problemas de los modelos lingüísticos de gran tamaño: la creación de información.

Cómo se compara con la competencia

Gemini 3 Pro se lanza a un campo abarrotado de modelos fronterizos:

OpenAI GPT-5 y 5.1 — Lanzamiento en agosto de 2025, actualización en noviembre. OpenAI afirma tener 800 millones de usuarios semanales de ChatGPT, pero el lanzamiento en agosto fue considerado decepcionante.
Anthropic Claude Sonnet 4.5 y Opus 4 : fuertes capacidades de razonamiento, populares entre desarrolladores y empresas.
xAI Grok 4.1 : lanzado en noviembre de 2025, promete muchas menos alucinaciones que las versiones anteriores.

Los puntajes de referencia sugieren que Gemini 3 Pro es líder en razonamiento y tareas multimodales, aunque el desempeño en el mundo real varía según el caso de uso.

La arquitectura de mezcla de expertos le otorga a Gemini 3 una ventaja de eficiencia sobre modelos densos como GPT y Claude.

Pero la verdadera ventaja competitiva podría ser la distribución.

La ventaja de escala de Google

Panorama general de la IA: 2 mil millones de usuarios al mes
Aplicación Gemini: 650 millones de usuarios activos mensuales (frente a los 700 millones de usuarios semanales de ChatGPT)
Google Cloud AI: utilizado por más del 70 % de los clientes de la nube
Ecosistema de desarrolladores: 13 millones de desarrolladores que crean con modelos de Gemini

Google puede implementar Gemini 3 en Búsqueda, Gmail, Docs, YouTube, Android y docenas de otros productos que miles de millones de personas ya usan a diario.

Actualmente, ninguna otra empresa de IA tiene esta ventaja de distribución.

Limitaciones de Gemini 3.0

Google reconoció varias limitaciones en su tarjeta modelo:

Alucinaciones : Géminis 3 aún puede generar información incorrecta presentada como un hecho
Lentitud ocasional : puede ocurrir al procesar consultas complejas
Confusión de contexto : las conversaciones muy largas pueden hacer que uno pierda de vista los detalles anteriores.
Límites de seguridad : la política de uso prohibido bloquea actividades peligrosas, riesgos de seguridad, contenido sexualmente explícito, violencia, discursos de odio y desinformación.

El modelo se sometió a las evaluaciones de seguridad más completas de Google hasta la fecha, con pruebas de UK AISI, Apollo, Vaultis, Dreadnode y otros evaluadores independientes.

Gemini 3 muestra una menor adulación, una mayor resistencia a las inyecciones inmediatas y una protección mejorada contra el uso indebido mediante ciberataques en comparación con las versiones anteriores.

Reflexiones finales

Google ejecutó este lanzamiento de una manera diferente a los lanzamientos anteriores.

Gemini 3 Pro supera casi todos los puntos de referencia e introduce nuevas capacidades como la interfaz de usuario generativa y la experiencia de desarrollo centrada en el agente en Antigravity.

Pero el movimiento estratégico es enviarlo a todas partes a la vez.

Si bien OpenAI tuvo una recepción decepcionante con GPT-5 y Anthropic celebró el amor de Claude por los desarrolladores, Google tiene la ventaja de dominar la distribución.

La antigravedad desafía a Cursor y otras herramientas de codificación agéntica. La interfaz de usuario generativa convierte las respuestas de la IA en aplicaciones interactivas.

Llevamos dos años en la era Gemini, y Google parece estar tomando la delantera; el tiempo lo dirá. Si me he olvidado de algo, háganlo saber en los comentarios.

Gracias por leer Código en Casa.