OpenAI presentó una importante actualización para las versiones móviles de ChatGPT, la cual permite que el modelo interactúe con su entorno en tiempo real mediante audio y visión, como si tuviera “ojos”. Esta función, lanzada inicialmente en mayo de 2024, ya está disponible para los usuarios con perfiles Plus.
Funcionalidad de visión y audio en ChatGPT
La nueva funcionalidad permite que los usuarios interactúen con el modelo ChatGPT 4o utilizando la cámara de su dispositivo móvil. A través de esta herramienta, se pueden realizar preguntas relacionadas con lo que la aplicación está “viendo”, ya sea un objeto, un animal o un lugar.
¿Cómo se activa?
- Accede al modelo ChatGPT 4o desde la aplicación móvil.
- Selecciona el modo de voz y, posteriormente, el ícono de cámara.
- La cámara principal del dispositivo capturará imágenes en tiempo real, permitiendo una interacción directa con el entorno.
La función también admite el uso del micrófono, lo que posibilita mantener una conversación fluida sobre lo visible. En caso de inactividad, la aplicación ofrecerá comentarios automáticos sobre lo que detecta.
Características adicionales
- Cambio entre la cámara principal y la frontal.
- Compatibilidad con la opción de compartir pantalla del móvil.
- Advertencia: Los usuarios deben evitar mostrar información sensible, como contraseñas o datos personales visibles en pantalla.
Limitaciones y disponibilidad
Por ahora, esta función está disponible exclusivamente en el modelo ChatGPT 4o y solo para dispositivos móviles. Su implementación en versiones de escritorio, como Windows, está prevista para el futuro, así como su ampliación a otros modelos y dispositivos.
OpenAI o3: El próximo avance en inteligencia artificial
Además de esta funcionalidad, OpenAI anunció el lanzamiento de o3, un modelo avanzado que permitirá realizar tareas más complejas, como la creación de scripts en Python y la generación de interfaces visuales. Este modelo, diseñado para tareas de razonamiento superior, será lanzado a inicios de 2025.
ChatGPT sigue avanzando para convertirse en una herramienta más interactiva y adaptable, ofreciendo funciones que revolucionan la manera en que los usuarios interactúan con la inteligencia artificial en sus dispositivos.