El riesgo de las herramientas antiplagio y los detectores de inteligencia artificial: "Dan muchos falsos positivos"
Hace años los profesores sabían leer un texto de su alumno y decir: "Esto no es suyo". En la actualidad, a medida que se propagan las posibilidades de falsear trabajos, emerge una carrera para luchar precisamente contra estas falsedades. Entretanto, la evidencia demuestra que en el uso de herramientas de antiplagio y detección de contenido generado por IA, hay un creciente número de falsos positivos y falsos negativos, tal y como reconoce la propia Turnitin —una de las herramientas por excelencia en el ámbito académico—.
Universidades como la de Vanderbilt (Nashville, Estados Unidos) ya han decidido dejar de usarlas "por causar más daño que bien". Por otro lado, el Centro para la Excelencia Docente de la Universidad de Kansas recomienda que si se siguen utilizando se deberían usar simultáneamente otras, además de hacer comparaciones, ya que los detectores "proporcionan información, pero no son una crítica fiable del trabajo".
El impacto en los estudiantes
Un estudiante de salud pública en la Universidad de Buffalo, ante una experiencia en la que se marcó falsamente su trabajo como "generado por IA", quiso exponer hace un par de meses su preocupación a través de la red social Reddit. "La universidad abrió una investigación por falta de honestidad académica basándose únicamente en ese cálculo", denunciaba. Se puso en contacto con estudiantes que habían tenido situaciones similares y quedaron sorprendidos porque su centro de estudios no dio posibilidad de apelar una vez el sistema sentenció que sus trabajos no eran propios, a pesar de que sí lo eran. Los estudiantes de Buffalo comenzaron una firma en Change.org de la que ya llevan más de 1200 para dejar atrás esa forma de "calificar" los trabajos.
Y una polla como una olla. Me tiene hartísime esta mierda. No he usado IA para nada. Y me consta que le está pasando a más gente. Nos están retrasando las entregas o haciéndonos pagar extra por un programa antiplagio que falla más que una escopeta de feria. A pastar. pic.twitter.com/Uc9qh4VzX6
— Aitor García (any/all pronouns) (@abeingbehaving) June 30, 2025
Una "ciencia" en pañales
La ciencia detrás de estas herramientas se basa en el análisis de patrones lingüísticos: estructura sintáctica, complejidad léxica, repetición de frases, entre otras. No obstante, es algo que aún está en pañales y no es fiable. Casos tan paradigmáticos como de GPTZero son una muestra de ello, pues llegó incluso a marcar como "generada por IA" la Constitución de los Estados Unidos. El idioma es otra barrera, pues en trabajos escritos en inglés si el texto no está elaborado por hablantes nativos es más probable que se den falsos positivos. Para más inri, un análisis del columnista Fowler en The Washington Post asegura que detectar contenido generado no es sencillo y que su porcentaje de error es preocupante. En una prueba que hizo, descubrió que Turnitin falló en tres de cada dieciséis situaciones. Con otro detector de la empresa OpenIA —la de ChatGPT— el error de muestras ascendió a ocho de cada dieciséis.
Aunque las herramientas antiplagio pueden resultar útiles para cruzarlas entre sí, están lejos de ser infalibles. La combinación de falsos resultados —tanto positivos como negativos— y sus consecuencias convierten el uso en un problema ético incluso para el profesorado. Está claro que la solución no pasa por abandonarlos, pero sí por mejorarlos y ser conscientes de sus riesgos. Prohibir el uso de IA, tanto para el alumnado como para el profesorado, lamentablemente sería comparable a intentar que desaparezcan las calculadoras, pero ceder por completo el poder de decisión a otra inteligencia artificial sería un acto irresponsable contra la educación.