Muy pronto todo el mundo podrá comprender los pensamientos de un perro.
Investigadores de la Universidad de Michigan, el Instituto Nacional de Astrofísica de México y el Instituto de Óptica y Electrónica están utilizando modelos de inteligencia artificial para descifrar el lenguaje de los perros. Un nuevo estudio presentado en una conferencia internacional demuestra cómo los modernos modelos de IA pueden ayudar a las personas a comprender a los animales.
Rada Mihalcea, directora del Laboratorio de IA de la Universidad de Michigan, destacó la importancia de esta investigación: «Sabemos poco sobre los animales con los que compartimos este mundo. Los avances en IA pueden revolucionar nuestra comprensión de la comunicación animal».
Para el estudio se utilizó el modelo de vanguardia de reconocimiento de voz Wav2Vec2, capaz de detectar emociones, género y raza de un perro por su ladrido. Se utilizaron dos conjuntos de datos diferentes para entrenar y comparar: uno entrenado exclusivamente con ladridos de perros y otro con habla humana y luego ajustado con ladridos.
El modelo preentrenado con 1000 horas de grabaciones de habla humana mostró mejores resultados. Después de ajustarlo con un conjunto de datos que incluía vocalizaciones de 74 perros (42 chihuahuas, 21 pudeles franceses y 11 schnauzers), pudo identificar emociones con 62% de precisión, raza con 62%, género con 69% y perros individuales en un grupo con 50% de precisión.
Estos resultados superan los del modelo entrenado solo con ladridos de perros, lo que sugiere que los sonidos y patrones descubiertos en el habla humana pueden sentar las bases para comprender a los animales.
Estudios previos han mostrado que las vocalizaciones de monos y perrillos de las praderas se pueden predecir por el contexto. Los investigadores creen que los ladridos de los perros también están estrechamente relacionados con el contexto.
En este estudio, las emociones de los perros incluyeron ladridos agresivos, ladridos normales, chillidos negativos y gruñidos. Aunque los perros experimentan muchas más emociones, estos fueron los sonidos representados en el conjunto de datos.
Mihalcea señaló: «Al utilizar modelos de procesamiento del habla entrenados de forma nativa en el habla humana, nuestra investigación abre una nueva ventana sobre cómo se pueden utilizar las tecnologías existentes para comprender los matices de los ladridos de los perros».