El 20 de mayo de 2025, durante el evento anual Google I/O, Sundar Pichai y su equipo no solo presentaron novedades: lanzaron un manifiesto de cómo será el futuro digital. Con la inteligencia artificial generativa como núcleo, Google ha elevado Gemini a la categoría de sistema operativo de la IA, integrándolo de forma transversal en productos, dispositivos y experiencias.
Gemini 2.5 Pro y Gemini Flash: velocidad y contexto
Google anunció dos nuevos modelos que actualizan su familia Gemini:
- Gemini 2.5 Pro: el modelo principal para tareas complejas, más contextual y preciso que sus predecesores. Supera en benchmarks a GPT-4 en razonamiento lógico, codificación y comprensión multimodal.
- Gemini Flash: modelo más ligero y rápido, diseñado para tareas en tiempo real y móviles, con alto rendimiento a bajo coste computacional.
Ambos ya están disponibles en Gemini Advanced y a través de la API de Vertex AI.
Project Astra: la IA que ve, oye y responde en tiempo real
Uno de los anuncios estrella fue Project Astra, un agente de inteligencia artificial multimodal capaz de:
- Interpretar imágenes y sonidos en tiempo real.
- Responder preguntas sobre el entorno (por ejemplo, “¿dónde dejé mis gafas?”).
- Recordar interacciones pasadas y ofrecer contexto persistente.
La demo en vídeo mostró cómo Astra funciona como un copiloto del mundo físico, anticipando una era de IA verdaderamente conversacional y ubicua.
Imagen 3 / Imagen 4, Veo y Lyria: creatividad generativa sin límites
Google también reforzó su apuesta por la IA creativa:
- Imagen 3 (y avances hacia Imagen 4): generación de imágenes ultrarrealistas con control por estilo y composición.
- Veo: generación de vídeo HD con mayor coherencia entre fotogramas. Ideal para creadores, publicidad y educación.
- Lyria 2: generación de música con control de armonía, instrumentación y emociones.
- TextFX / MusicFX / Instrument Playground: herramientas interactivas para escritores, músicos y creativos.
Gemini en el ecosistema Google
Google ha incorporado Gemini como asistente inteligente en:
- Android: reemplaza a Assistant y funciona como copiloto del sistema.
- Chrome: Gemini ayuda a escribir, resumir, investigar o automatizar tareas web.
- Gmail, Docs, Sheets, Slides y Calendar: Gemini organiza, redacta, resume y programa de forma colaborativa.
- Google Search: las búsquedas se enriquecen con resúmenes, contexto y herramientas interactivas.
- Google Meet y Live: traducción simultánea, asistentes inteligentes y copiloto en reuniones.
Project Turing & Mariner: agentes autónomos personalizados
- Turing permite crear agentes especializados con contexto, historial y funciones específicas.
- Mariner planifica tareas complejas (como un viaje), buscando, decidiendo y ejecutando acciones con autonomía.
Gemini en Realidad Extendida
Google presentó una demo de gafas de realidad mixta equipadas con Gemini. Estas gafas pueden:
- Detectar elementos del entorno.
- Traducir en tiempo real.
- Guiar al usuario con información visual superpuesta.
Esto refuerza su alianza con Samsung y Qualcomm, y anticipa la llegada de Android XR como plataforma estándar para realidad extendida.
Seguridad, gobernanza y uso responsable
Google reafirmó su compromiso con una IA segura y responsable, destacando:
- Auditorías externas de sus modelos.
- Etiquetado de contenido generado por IA.
- Herramientas para identificar deepfakes.
No obstante, las preguntas éticas y políticas (privacidad, soberanía digital, sesgo algorítmico) siguen sobre la mesa.
Reflexión final
Google ha puesto sobre la mesa una nueva capa de software global: la IA como interfaz, como plataforma y como asistente personalizado. Este movimiento no solo impacta al consumidor final, sino a toda la industria tecnológica, educativa y creativa.
El nuevo reto no es solo aprender a usar la IA, sino aprender a convivir con agentes que aprenden de nosotros.
¿Están las empresas, instituciones y profesionales preparados para una inteligencia que ya no espera instrucciones, sino que actúa por iniciativa propia?