OpenAI lanza actualización que permite razonamiento en tiempo real con audio y visión

OpenAI presentó una importante actualización para las versiones móviles de ChatGPT, la cual permite que el modelo interactúe con su entorno en tiempo real mediante audio y visión, como si tuviera “ojos”. Esta función, lanzada inicialmente en mayo de 2024, ya está disponible para los usuarios con perfiles Plus.

Funcionalidad de visión y audio en ChatGPT

La nueva funcionalidad permite que los usuarios interactúen con el modelo ChatGPT 4o utilizando la cámara de su dispositivo móvil. A través de esta herramienta, se pueden realizar preguntas relacionadas con lo que la aplicación está “viendo”, ya sea un objeto, un animal o un lugar.

¿Cómo se activa?

Accede al modelo ChatGPT 4o desde la aplicación móvil.
Selecciona el modo de voz y, posteriormente, el ícono de cámara.
La cámara principal del dispositivo capturará imágenes en tiempo real, permitiendo una interacción directa con el entorno.

La función también admite el uso del micrófono, lo que posibilita mantener una conversación fluida sobre lo visible. En caso de inactividad, la aplicación ofrecerá comentarios automáticos sobre lo que detecta.

Características adicionales

Cambio entre la cámara principal y la frontal.
Compatibilidad con la opción de compartir pantalla del móvil.
Advertencia: Los usuarios deben evitar mostrar información sensible, como contraseñas o datos personales visibles en pantalla.

Limitaciones y disponibilidad

Por ahora, esta función está disponible exclusivamente en el modelo ChatGPT 4o y solo para dispositivos móviles. Su implementación en versiones de escritorio, como Windows, está prevista para el futuro, así como su ampliación a otros modelos y dispositivos.

OpenAI o3: El próximo avance en inteligencia artificial

Además de esta funcionalidad, OpenAI anunció el lanzamiento de o3, un modelo avanzado que permitirá realizar tareas más complejas, como la creación de scripts en Python y la generación de interfaces visuales. Este modelo, diseñado para tareas de razonamiento superior, será lanzado a inicios de 2025.

ChatGPT sigue avanzando para convertirse en una herramienta más interactiva y adaptable, ofreciendo funciones que revolucionan la manera en que los usuarios interactúan con la inteligencia artificial en sus dispositivos.

OpenAI lanza actualización que permite razonamiento en tiempo real con audio y visión

Funcionalidad de visión y audio en ChatGPT

¿Cómo se activa?

Características adicionales

Limitaciones y disponibilidad

OpenAI o3: El próximo avance en inteligencia artificial

Lo Más Visto

Subsidio DS1: Claves para Postular en el Segundo Llamado Nacional

Gobierno inicia negociación clave por reajuste a sector público

Beneficio por Años Cotizados: Montos y quiénes lo recibirán desde 2026

Bono Base Familiar: Requisitos del beneficio que entrega $58 mil promedio

Dato Útil

Pronóstico del Tiempo en Santiago: 6 de diciembre

Pronóstico del Tiempo en Santiago: 24 de noviembre

Pronóstico del Tiempo en Santiago: 18 de noviembre

Pronóstico del Tiempo en Santiago: Lunes 1 de Diciembre

Actualidad

Funcionalidad de visión y audio en ChatGPT

¿Cómo se activa?

Relacionados

Características adicionales

Limitaciones y disponibilidad

OpenAI o3: El próximo avance en inteligencia artificial

Relacionados

Lo Más Visto

Dato Útil

Actualidad

Noticias Relacionadas