ESCUELA DE DOCTORADO

 
Tesis Doctorales de la Universidad de Alcalá
MACHINE LEARNING APPROACHES IN PREDICTION PROBLEMS WITH HUMAN ACTIVITY PATTERNS
Autor/aTorres López, Ricardo
DepartamentoTeoría de la Señal y Comunicaciones
Director/aSalcedo Sanz, Sancho
Codirector/aPérez Aracil, Jorge
Fecha de defensa10-06-2024
CalificaciónSobresaliente cum laude
ProgramaTecnologías de la Información y las Comunicaciones (RD 99/2011)
Mención internacionalNo
ResumenEn la vida real existen muchos sucesos que, sin ser actividades exclusivamente humanas, tienen patrones influidos por el comportamiento humano: el tráfico, la predicción de bienes de consumo, asistencia a eventos o cualquier otra actividad ligada a los horarios de la sociedad. Hacer predicciones en este tipo de problemas suele ser complejo y con unas características propias en cada caso. La importancia de conocer con precisión el momento en el que se toman las muestras y la existencia de variables exógenas añaden una complejidad adicional. Por ejemplo, no es lo mismo predecir el número de usuarios del transporte público que los ingresos en las urgencias de un hospital y cómo influye en cada caso, si ese día es festivo o no, si llueve, o si coincide con un evento deportivo importante en la ciudad. Ante esta diversidad de problemas y situaciones es importante contar con unas técnicas que sean suficientemente flexibles para adaptarse a toda la información disponible y heterogénea. En este sentido, las aproximaciones basadas en Aprendizaje Automático han demostrado ser una buena solución para la creación de este tipo de modelos. En esta tesis, recogemos la aplicación de diferentes algoritmos de Aprendizaje Automático (Machine Learning) y Aprendizaje Profundo (Deep Learning) a nueve problemas reales de regresión, con el fin de predecir series temporales de sucesos influidos por el comportamiento humano. Con el fin de mejorar la calidad de las predicciones y facilitar la comprensión de los factores relevantes de cada problema, se han diseñado y aplicado unos métodos de Selección de Características (Feature Selection). Además, predecir un paso hacia adelante (lo que va a ocurrir la hora siguiente, o el día siguiente) no siempre es suficiente en los problemas reales. Por ejemplo, en el caso del número de ingresos a las Urgencias de un Hospital, donde la asignación de especialistas y recursos es crítica, las predicciones deberían hacerse para periodos de tiempo superiores. Por este motivo, hemos trabajado también unos escenarios de predicción más largos: con varios pasos hacia delante, mediante la construcción de modelos independientes para cada paso. Finalmente, en el último capítulo se ha implementado una estrategia de segmentación de casos, en base a posibles y diferentes escenarios de entrada con el fin de obtener una precisión superior de las predicciones y una comprensión mayor del proceso analizado. Esta metodología de Machine Learning es conocida como Ensemble Regression y ha ganado popularidad en los últimos años. Los resultados obtenidos en la elaboración de esta tesis han sido publicados en tres revistas científicas Q1 indexadas en el Journal Citation Report (JCR).