Escuela de Doctorado - UAH

ESCUELA DE DOCTORADO

Tesis Doctorales de la Universidad de Alcalá

PROPUESTA METODOLÓGICA PARA EL ANÁLISIS Y CLASIFICACIÓN AUTOMÁTICA DE CONTENIDOS DE CIBERMERCADOS NEGROS EN REDES DE ANONIMIZACIÓN.
Autor/a	Prado Sánchez, Víctor Pablo
Departamento	Ciencias de la Computación
Director/a	Domínguez Díaz, Adrián
Codirector/a	Martínez Herraiz, José Javier
Fecha de depósito	12-02-2026
Periodo de exposición pública	12 a 26 de febrero de 2026
Fecha de defensa	Sin especificar
Modalidad	Presencial
Programa	Ingeniería de la Información y del Conocimiento (RD 99/2011)
Mención internacional	No
Resumen	La Dark Web constituye un entorno digital altamente dinámico y opaco, donde proliferan cibermercados negros y actividades ilícitas que representan un reto significativo para la ciberseguridad y la inteligencia digital. El análisis y clasificación automática de estos contenidos resulta esencial, pero se ve limitado por la escasez de datos etiquetados, la evolución constante del lenguaje criminal y la ambigüedad semántica inherente a estos dominios. En este contexto, los Grandes Modelos de Lenguaje (LLMs) emergen como una alternativa prometedora gracias a su capacidad de generalización semántica y su uso bajo enfoques zero-shot, sin necesidad de entrenamiento supervisado. Esta tesis doctoral propone y valida un protocolo metodológico reproducible para la evaluación de LLMs comerciales en tareas de clasificación automática de contenidos ilícitos en la Dark Web. A través de un compendio de tres artículos científicos, se analiza de forma progresiva la viabilidad del enfoque zero-shot, la estabilidad y reproducibilidad de los modelos generativos, la coherencia intermodelo y su alineación con el juicio humano. Los experimentos se realizan sobre el dataset CoDA, empleando condiciones experimentales controladas y métricas tanto de rendimiento técnico como de fiabilidad estadística y acuerdo semántico. Los resultados muestran que los LLMs pueden alcanzar niveles elevados y estables de rendimiento (F1), así como una alta coherencia entre modelos y un grado de acuerdo con anotaciones humanas comparable al observado entre expertos. En conjunto, la tesis aporta un marco metodológico sólido y replicable que permite evaluar de forma rigurosa el uso de LLMs en dominios sensibles, sentando las bases para aplicaciones futuras de inteligencia artificial generativa en la ciberseguridad y el análisis automatizado de la Dark Web.

Escuela de Doctorado de la Universidad de Alcalá

Universidad de Alcalá - Directorio - Mapa web - Protección de datos