Abre los ojos, ChatGPT: el modelo ahora puede analizar el mundo a través de la cámara del smartphone

Abre los ojos, ChatGPT: el modelo ahora puede analizar el mundo a través de la cámara del smartphone

Después de 7 meses de promesas, OpenAI ha lanzado una función muy esperada.

image

La empresa OpenAI ha presentado una nueva versión de ChatGPT que es capaz de percibir y analizar videos en tiempo real. Desde la primera demostración de esta función han pasado siete meses, y ahora finalmente está disponible para los usuarios.

En la versión actualizada del Advanced Voice Mode, los desarrolladores han añadido visión por computadora. Ahora, los usuarios con suscripciones a ChatGPT Plus, Team y Pro pueden enfocar la cámara de su smartphone en cualquier objeto, y la inteligencia artificial lo analizará al instante, comentará lo observado y responderá preguntas relacionadas.

El modelo también "entiende" todo lo que sucede en la pantalla del dispositivo. Los usuarios pueden mostrarle a ChatGPT cualquier menú de configuración o problema matemático, y la IA ayudará a resolverlo mientras observa las acciones de la persona.

Para activar el modo visual, primero hay que presionar el ícono del micrófono junto a la barra de chat, y luego seleccionar el ícono de video en la esquina inferior izquierda. Si deseas mostrar el contenido de la pantalla al bot, basta con abrir el menú de tres puntos y elegir la función de demostración.

El presidente de OpenAI, Greg Brockman, demostró recientemente las nuevas capacidades de ChatGPT en el programa "60 minutos" de CNN. El presentador Anderson Cooper dibujó en una pizarra partes del cuerpo humano, mientras el chatbot comentaba en tiempo real su ubicación y precisión anatómica, ofreciendo consejos para mejorar los dibujos.

Sin embargo, el sistema aún no es perfecto. Durante la misma demostración, ChatGPT no pudo resolver un problema sencillo de geometría. Es evidente que, por ahora, no se puede confiar al 100% en sus respuestas, y los algoritmos necesitan mejoras.

A la empresa ya le tomó bastante tiempo llevar esta tecnología a un estado funcional. En abril, OpenAI prometió lanzar la actualización "en unas pocas semanas", pero alcanzar el nivel de calidad necesario resultó ser mucho más complicado.

En otoño, la empresa lanzó el modo de voz sin la funcionalidad visual. Antes de la actualización de diciembre, el equipo de OpenAI se centró en hacer que las funciones de voz estuvieran disponibles para los usuarios de los países de la Unión Europea.

La nueva función aún no está disponible en todas partes. Los clientes corporativos de ChatGPT Enterprise y las instituciones educativas tendrán que esperar hasta enero. Para los usuarios de la UE, Suiza, Islandia, Noruega y Liechtenstein, las fechas de lanzamiento aún no se han definido, ya que la empresa todavía no ha decidido cuándo lanzará la función en esos países.

Otros gigantes tecnológicos tampoco se quedan atrás. Google ya ha comenzado a probar Project Astra, su sistema de análisis de video para dispositivos Android. Meta* también está desarrollando tecnologías similares para sus productos.

Para la temporada navideña, los desarrolladores de ChatGPT han preparado otra sorpresa: el modo "Santa Mode" (modo Santa). Cualquier usuario puede hacer que el bot hable con la voz de Santa Claus simplemente presionando el ícono de un copo de nieve junto al campo de mensajes.

¿Tu Wi-Fi doméstico es una fortaleza o una casa de cartón?

Descubre cómo construir una muralla impenetrable