
¡Asombroso! Gemini Live: El futuro aterrador de los móviles que ven por ti
2025-04-08
Autor: Manuel
En diciembre de 2024, OpenAI revolucionó el mundo de la inteligencia artificial lanzando una característica increíble: ChatGPT se dotó de "ojos" capaces de ver e interpretar el entorno en tiempo real. La demostración fue impresionante; la aplicación, a través de la cámara, pudo reconocer cada objeto a su paso. ¡Y lo hizo con una rapidez asombrosa!
Pero las sorpresas no terminaron ahí. A principios de 2025, Google presentó su propia competencia, Gemini Live, una función que lleva el concepto de la visión artificial a otro nivel. Están disponibles para los usuarios de Google Pixel 9 y Samsung Galaxy S25, siempre que estén dispuestos a pagar por una suscripción Advanced. ¿Valdrá la pena la inversión?
Tuve la oportunidad de probar esta función en un Google Pixel 9 Pro, y puedo afirmar que es tan asombroso como imaginas. ¿Cómo funciona? La interfaz es muy amigable: solo necesitas abrir la aplicación y acceder al modo avanzado de voz tocando el ícono en la esquina inferior derecha.
Una vez dentro de Gemini Live, te toparás con dos accesos directos: uno que brinda acceso a la cámara y otro que permite leer en tiempo real lo que aparece en tu pantalla. Así es, ¡Gemini puede leer todo lo que visualizas!
En el modo cámara, Gemini escanea el entorno y lo reconoce todo, desde el tipo de planta en tu casa hasta el modelo de tus gadgets, sin que tú tengas que proporcionarle información. Además, puedes hacerle preguntas y actúa como una guía, traductor e incluso un profesor. Lo más impresionante es su capacidad para resolver problemas matemáticos o psicotécnicos y explicar cada paso del proceso.
Sin embargo, el modo de pantalla plantea preocupaciones de privacidad. Aunque Gemini puede leer y responder preguntas sobre el contenido que aparece en tu dispositivo, esta función podría ser menos útil que Google Lens, que ya proporciona información de manera rápida y efectiva. Aun así, demuestra el potencial ilimitado de Gemini.
Es importante recordar que la IA, aunque impresionante, no siempre es infalible. Por ejemplo, Gemini pudo identificar mi computadora en un plano general, pero al hacer un acercamiento directo, no la reconoció. Al preguntarle si era un Mac Mini M1 o M4, acertó con el M1, pero comete errores en la lectura de otros datos, lo que sugiere que es necesario supervisarla de cerca para obtener los mejores resultados.
Un área de mejora es el estilo de conversación de Gemini. A menudo, sus respuestas terminan con una pregunta, lo que puede resultar molesto, especialmente en el modo de visión. Esto interrumpe el flujo de la conversación y puede desviar la atención del usuario.
A pesar de estas limitaciones, la visión de Gemini Live es simplemente genial y podría redefinir la interacción entre humanos y máquinas. ¿Te atreverías a dar un paso adelante y permitir que tu móvil te vea? ¡El futuro está aquí, pero puede que no sea como lo esperabas!