ESCUELA DE DOCTORADO

 
Tesis Doctorales de la Universidad de Alcalá
PROPUESTA METODOLÓGICA PARA EL ANÁLISIS Y CLASIFICACIÓN AUTOMÁTICA DE CONTENIDOS DE CIBERMERCADOS NEGROS EN REDES DE ANONIMIZACIÓN.
Autor/aPrado Sánchez, Víctor Pablo
DepartamentoCiencias de la Computación
Director/aDomínguez Díaz, Adrián
Codirector/aMartínez Herraiz, José Javier
Fecha de depósito12-02-2026
Periodo de exposición pública12 a 26 de febrero de 2026
Fecha de defensaSin especificar
ModalidadPresencial
ProgramaIngeniería de la Información y del Conocimiento (RD 99/2011)
Mención internacionalNo
ResumenLa Dark Web constituye un entorno digital altamente dinámico y opaco, donde proliferan cibermercados negros y actividades ilícitas que representan un reto significativo para la ciberseguridad y la inteligencia digital. El análisis y clasificación automática de estos contenidos resulta esencial, pero se ve limitado por la escasez de datos etiquetados, la evolución constante del lenguaje criminal y la ambigüedad semántica inherente a estos dominios. En este contexto, los Grandes Modelos de Lenguaje (LLMs) emergen como una alternativa prometedora gracias a su capacidad de generalización semántica y su uso bajo enfoques zero-shot, sin necesidad de entrenamiento supervisado. Esta tesis doctoral propone y valida un protocolo metodológico reproducible para la evaluación de LLMs comerciales en tareas de clasificación automática de contenidos ilícitos en la Dark Web. A través de un compendio de tres artículos científicos, se analiza de forma progresiva la viabilidad del enfoque zero-shot, la estabilidad y reproducibilidad de los modelos generativos, la coherencia intermodelo y su alineación con el juicio humano. Los experimentos se realizan sobre el dataset CoDA, empleando condiciones experimentales controladas y métricas tanto de rendimiento técnico como de fiabilidad estadística y acuerdo semántico. Los resultados muestran que los LLMs pueden alcanzar niveles elevados y estables de rendimiento (F1), así como una alta coherencia entre modelos y un grado de acuerdo con anotaciones humanas comparable al observado entre expertos. En conjunto, la tesis aporta un marco metodológico sólido y replicable que permite evaluar de forma rigurosa el uso de LLMs en dominios sensibles, sentando las bases para aplicaciones futuras de inteligencia artificial generativa en la ciberseguridad y el análisis automatizado de la Dark Web.