¿Puede la IA leer pensamientos? Los modelos LLM dominan la teoría de la mente

17:35 / 21.05.2024

Un nuevo estudio ha mostrado cómo GPT-4 y Llama 2 se acercan a la inteligencia humana.

La investigación ha revelado que los grandes modelos de lenguaje pueden imitar la capacidad de comprender el estado mental de otras personas, conocida como teoría de la mente. Este descubrimiento fue realizado por un equipo de científicos del Centro Médico de Hamburgo-Eppendorf en Alemania.

Los científicos realizaron pruebas exhaustivas de varios modelos de lenguaje, incluyendo GPT-4 de OpenAI y Llama 2-70b de Meta*, así como de 1,907 personas. Las pruebas incluían cinco tareas típicas de la teoría de la mente:

Comprensión de insinuaciones: A los participantes se les presentaron situaciones en las que debían reconocer significados ocultos o mensajes implícitos. Ironía: Los participantes debían determinar cuándo lo dicho implicaba un significado opuesto. Errores sociales: Las tareas incluían situaciones en las que alguien cometía un error social accidentalmente, y se debía determinar si lo había notado. Creencias falsas: Las pruebas evaluaban si los participantes podían entender que una persona podía tener una percepción incorrecta de una situación (por ejemplo, dónde alguien buscaba un objeto que había sido movido en su ausencia). Historias complejas: Los participantes analizaban historias con situaciones complicadas donde los personajes mentían, manipulaban o no se entendían entre sí. GPT-4 mostró resultados comparables a los humanos en las pruebas de creencias falsas e incluso superó a los humanos en tareas de ironía, insinuaciones e historias complejas. Sin embargo, no se desempeñó tan bien en la prueba de errores sociales.

El modelo Llama-2, por otro lado, mostró buenos resultados en las pruebas de creencias falsas, pero tuvo un desempeño inferior en las tareas de ironía, insinuaciones e historias complejas, mientras que tuvo un mejor desempeño en los errores sociales.

Los investigadores enfatizan que los resultados no prueban la existencia de la teoría de la mente en los modelos de lenguaje. Simplemente, muestran que los modelos pueden exhibir un comportamiento similar al humano en tales tareas. Algunos expertos llaman a interpretar los resultados con cautela y advierten sobre posibles riesgos y conclusiones erróneas.

Cabe recordar que el cofundador de Ethereum, Vitalik Buterin, afirmó que GPT-4 superó con éxito la prueba de Turing. Según el estudio, las personas confundieron a GPT-4 con un ser humano en el 56% de los casos. Buterin destacó la importancia del logro, señalando que superar la prueba de Turing es un hito significativo que confirma los avances en el campo de la IA.

Además, recientemente, los científicos han declarado que existen muchas teorías contradictorias sobre cómo y dónde surge la conciencia en el cerebro. Están considerando la posibilidad de combinar diversas teorías, sugiriendo que la conciencia puede explicarse a través de conexiones neuronales locales y globales.

Онлайн

ИЮНЯ

16:20

Product Backstage*: безопасная разработка и защита контейнеров

17 июня обсудим обновления PT Application Inspector, PT BlackBox и безопасность контейнеров.

Зарегистрироваться

Реклама. 18+. АО «Позитив Текнолоджиз», ИНН 7718668887 · *Продуктовое закулисье

Noticias sobre el tema

Revisa los chats de tu hijo. Ahora el peligro no son las personas, sino la inteligencia artificial

¿Pensabas que el problema eran los hackers? En realidad estaba en la arquitectura. Microsoft acaba de cambiarla y ya está preparada para los ataques cuánticos

¿Puede la IA leer pensamientos? Los modelos LLM dominan la teoría de la mente

Noticias sobre el tema

Revisa los chats de tu hijo. Ahora el peligro no son las personas, sino la inteligencia artificial

¿Pensabas que el problema eran los hackers? En realidad estaba en la arquitectura. Microsoft acaba de cambiarla y ya está preparada para los ataques cuánticos

De JavaScript a esteganografía en un solo ataque. Los ciberdelincuentes crearon un sistema "invisible" para distribuir malware

1 millón de tokens: Claude Sonnet 4 obtiene “memoria” suficiente para un repositorio de código completo

El teorema de Nyquist-Shannon contra Google: matemáticos descubren cómo vulnerar Gemini a través de los píxeles

Tres meses para despedirse de 23H2: Microsoft sugiere amablemente que ha llegado el momento de actualizar

La era de los clics llega a su fin: Windows prepara una interfaz que siempre te escuchará

Millones de usuarios instalan virus siguiendo las “recomendaciones” de ChatGPT

15 países: un único estándar. Google introduce licencias para aplicaciones de criptomonedas