Resumen de anuncios de Google I/O 2025: Innovaciones en Gemini AI y Más

Google I/O 2025 nos dejó una oleada de novedades revolucionarias en el mundo de la inteligencia artificial, especialmente centradas en los avances de la familia Gemini de Google DeepMind. A continuación, te presentamos un resumen completo y detallado de los principales anuncios y actualizaciones que marcarán la pauta en la tecnología AI para todo el 2025.

Actualizaciones en Gemini AI: Gemini 2.5 Pro y Flash para Todos

23629258 a481 4165 a7c1 03b451e5ab31 272

Google oficializó la llegada de Gemini 2.5 Pro y Flash, modelos de inteligencia artificial con capacidad multimodal que ahora incluyen:

Salida nativa de audio: Las respuestas no solo se generan en texto, sino que ahora pueden expresarse con voz natural, incluyendo matices como susurros, emociones y cambios de acento.
Mejora en el razonamiento: Los modelos ahora tienen una capacidad superior para entender y resolver problemas complejos con mayor precisión.
Disponibilidad general: La versión Flash está disponible para todos los usuarios desde ya, mientras que la Pro llegará en general availability a inicios de junio de 2025.

Este avance hace que Gemini sea mucho más accesible y útil en aplicaciones cotidianas y profesionales.

2. Modo “Deep Think” para Razonamiento Profundo

Captura de pantalla 2025 05 20 a las 21.31.27

Uno de los anuncios más destacados fue la introducción del modo Deep Think en Gemini 2.5 Pro, una funcionalidad experimental que permite al modelo:

Evaluar múltiples hipótesis en paralelo para encontrar la solución óptima.
Resolver problemas matemáticos y lógicos de alta complejidad, obteniendo puntuaciones sobresalientes en pruebas como el Olympiad Matemático de Estados Unidos 2025 (49.4%) y LiveCodeBench.
Funcionar con “presupuestos de pensamiento” adaptables, balanceando velocidad y exactitud.

Aunque esta función estará inicialmente disponible solo para testers de confianza mediante la API, abre la puerta hacia un AI capaz de “reflexionar” como un experto humano.

3. Capacidades nativas de salida de audio

Gemini 2.5 incorpora una avanzada salida nativa de audio que revoluciona la interacción con AI:

Soporte en más de 24 idiomas con cambio dinámico entre ellos.
Personalización total de la voz: desde tonos emocionales hasta estilos dramáticos.
Detección del estado emocional del usuario para respuestas más empáticas.
Filtrado de ruido de fondo y reconocimiento de dirección de la conversación.
Capacidad de generar voces duales para diferentes perfiles en una misma interacción.

Estas mejoras hacen que la experiencia conversacional con AI sea mucho más humana, natural e inmersiva.

4. Project Mariner: IA Autónoma para Uso en Navegadores Web

Captura de pantalla 2025 05 20 a las 21.37.27

Google DeepMind presentó Project Mariner, un agente basado en Gemini 2.0 capaz de interactuar directamente con la web de manera autónoma para completar tareas complejas, tales como:

Automatización de compras en línea, reservas y búsqueda integral de información.
Comunicación visual mediante clics, desplazamientos y escritura en el navegador.
Adaptación a cambios imprevistos en páginas web.
Evaluación sobresaliente en el benchmark WebVoyager con 83.5% de éxito en tareas reales.

Aunque actualmente limitado a testers confiables, Project Mariner es una muestra de cómo la IA puede simplificar y potenciar acciones cotidianas en internet.