¡ChatGPT se vuelve más inteligente! Ahora puede 'ver' el mundo en tiempo real y llevar la inteligencia artificial al siguiente nivel
2024-12-12
Autor: Carmen
Imagina un futuro donde la inteligencia artificial no solo te escucha, sino que también puede ver lo que hay a tu alrededor. ¡Ese futuro ya está aquí! A más de una década del estreno de la película 'Her', que vislumbraba un mundo donde los asistentes virtuales eran casi humanos, OpenAI ha dado un paso gigante hacia esa realidad con las nuevas funciones de ChatGPT.
Ahora, ChatGPT tiene la capacidad de utilizar nuestra cámara en el nuevo modo de voz avanzado, gracias a su última actualización del modelo multimodal GPT-4o. Esto significa que el famoso chatbot no solo escuchará nuestras instrucciones, sino que también 'verá' directamente nuestro entorno, procesando imágenes y datos en tiempo real. Con esto, las posibilidades de interacción aumentan exponencialmente. Además, se planea que la opción de compartir pantalla esté disponible, permitiendo que el modelo obtenga información en tiempo real de las aplicaciones que estemos utilizando.
La funcionalidad de procesamiento de video en tiempo real es una revolución. Activar esta capacidad en nuestros dispositivos será tan sencillo como actualizar la aplicación, abrirla y pulsar el botón en la esquina superior derecha para ingresar al modo de voz avanzado. Desde ahí, podremos elegir entre la cámara delantera o trasera y empezar a explorar un nuevo mundo de posibilidades.
Durante una demostración hace apenas unos días, un miembro del equipo de OpenAI pidió a ChatGPT que le indicara cómo preparar café utilizando un filtro. Impresionantemente, el modelo pudo identificar cada objeto en la mesa y guiar al usuario a través del proceso sin problemas de latencia. La rapidez y precisión con la que detectó los elementos son un indicativo del avance tecnológico alcanzado.
OpenAI ha compartido múltiples escenarios en los que esta funcionalidad será útil: desde ayudar a los niños con problemas de matemáticas hasta jugar simples juegos como piedra, papel o tijera. Uno de los ejemplos más destacados fue el de ChatGPT interactuando con un perro, lo que resalta el potencial de la inteligencia artificial para enriquecer nuestras vidas cotidianas. Y no solo eso, las nuevas capacidades de accesibilidad permitirán a las personas con discapacidades tener descripciones de su entorno en un lenguaje más comprensible.
La empresa anunció que esta revolucionaria función estará disponible en los próximos días para usuarios de ChatGPT Plus y Pro, lo que abre un mundo de oportunidades para aquellos que desean explorar el potencial de la IA. Sin embargo, aquellos en Europa tendrán que esperar un poco más debido a regulaciones, lo que ha generado expectativas y algunas preocupaciones sobre el lanzamiento en el continente.
Sam Altman, CEO de OpenAI, señaló en un mensaje reciente que algunos productos pueden entrar al mercado europeo más tarde de lo esperado y reafirmó el compromiso de la compañía de cumplir con las regulaciones necesarias. "Queremos ofrecer nuestros productos en Europa, pero también debemos considerar las normativas locales", explicó.
Con estas innovaciones, OpenAI no muestra signos de desacelerar y continúa liderando el camino hacia un futuro donde la inteligencia artificial no solo es capaz de comprender el lenguaje humano, sino también de interactuar con el mundo de una manera nunca antes vista. ¡Prepárense para un futuro con IA que no solo escuche, sino que vea y comprenda!