Las manipulaciones de citas revelan una economía clandestina de artículos.
La comunidad científica moderna enfrenta un nuevo problema: las manipulaciones de metadatos destinadas a aumentar artificialmente el número de citas. El problema se ha convertido en objeto de investigación por parte de científicos que han descubierto el mecanismo de aumento oculto de citas a través de las llamadas "citas encubiertas".
Las citas en trabajos científicos siguen estándares estrictos: cada referencia incluye título, nombres de autores, año de publicación, nombre de la revista o conferencia y números de página. Esta información se almacena como metadatos, no visibles en el texto del artículo, pero se asignan a un identificador digital único (DOI). Las citas en publicaciones científicas permiten a los autores justificar la elección de la metodología o presentar resultados de investigaciones anteriores, destacando el carácter iterativo y colaborativo de la ciencia.
Sin embargo, en el curso de la investigación se descubrió que algunos autores deshonestos añaden citas adicionales, invisibles en el texto, pero presentes en los metadatos de los artículos. Como resultado, el número de citas para algunos investigadores o revistas aumenta drásticamente, aunque las citas no se mencionen realmente en los artículos.
La investigación comenzó con una publicación en el sitio PubPeer, donde los científicos discuten y analizan publicaciones. El autor de la publicación notó una discrepancia: un artículo en la revista Hindawi, que sospechaba de fraude debido a frases poco naturales, tenía muchas más citas que descargas, lo cual es extremadamente inusual.
Los autores del artículo se desviaron de los términos establecidos, lo que desconcertó a los científicos. Esto suele ocurrir debido a intentos de evitar el plagio mediante el uso de software de parafraseo.
La publicación atrajo la atención de varios investigadores. Utilizando sistemas de búsqueda científica, los científicos encontraron artículos que citaban el artículo original. Google Scholar no encontró ninguna cita, mientras que Crossref y Dimensions sí lo hicieron. La diferencia radica en que Google Scholar se basa principalmente en el texto del artículo para extraer citas, mientras que Crossref y Dimensions utilizan los metadatos proporcionados por los editores.
Para comprender la magnitud de las manipulaciones, los investigadores estudiaron tres revistas científicas publicadas por Technoscience Academy, responsables de artículos con citas sospechosas. La investigación constó de tres etapas:
En las revistas publicadas por Technoscience Academy, al menos el 9% de las citas registradas resultaron ser encubiertas. Las citas adicionales estaban presentes solo en los metadatos, distorsionando el recuento de citas y dando a algunos autores una ventaja injusta. También se perdieron algunas citas legítimas que no estaban presentes en los metadatos.
Además, las citas ocultas beneficiaron enormemente a algunos investigadores. Por ejemplo, un científico asociado con Technoscience Academy obtuvo más de 3,000 citas ilegales adicionales. Algunas revistas del mismo editor se beneficiaron de un par de cientos de citas encubiertas adicionales.
Crossref (izquierda) proporciona una lista de 47 citas (mostradas del 0 al 9). Las citas del 6 al 46 son encubiertas. Dimensions (derecha) enumera 13 citas, ninguna de las cuales aparece en el artículo original.
El número de citas influye en la financiación de investigaciones, promociones académicas y clasificaciones de instituciones. Las manipulaciones de citas pueden conducir a injusticias basadas en datos falsos. Además, el descubrimiento cuestiona la integridad de los sistemas de medición del impacto científico, lo cual ha sido motivo de preocupación entre los investigadores.
Para combatir estas prácticas, los investigadores proponen varias medidas:
La investigación reveló por primera vez manipulaciones de metadatos y discute su impacto en la evaluación de los investigadores. Se subraya que confiar excesivamente en métricas para evaluar a los científicos, su trabajo y su impacto puede ser fundamentalmente erróneo. Esta confianza fomenta prácticas de investigación cuestionables, incluyendo la formulación de hipótesis después de conocer los resultados, la segmentación de publicaciones (salami slicing), la manipulación de datos y el plagio.
Aunque los metadatos problemáticos y las citas encubiertas han sido corregidos, como suele ocurrir en las correcciones científicas, las medidas podrían haberse tomado demasiado tarde.