ESCUELA DE DOCTORADO

 
Tesis Doctorales de la Universidad de Alcalá
MACHINE LEARNING REGRESSION AND CLASSIFICATION ALGORITHMS FOR ENVIRONMENTAL PROBLEMS
Autor/aCastillo Botón, Carlos
DepartamentoTeoría de la Señal y Comunicaciones
Director/aSalcedo Sanz, Sancho
Codirector/aGutiérrez Peña, Pedro Antonio
Fecha de depósito16-02-2026
Periodo de exposición pública17 de febrero a 2 de marzo de 2026
Fecha de defensaSin especificar
ModalidadPresencial
ProgramaTecnologías de la Información y las Comunicaciones (RD 99/2011)
Mención internacionalNo
ResumenEsta tesis explora la aplicación de técnicas de modelado predictivo para abordar aspectos diversos de la gestión y la predicción ambiental, como la visibilidad en entornos de alto riesgo y el nivel de agua acumulada en un embalse. La primera tarea de investigación se centra en el análisis y la predicción del nivel de agua en un embalse utilizado para el consumo de agua y la generación de energía. Este problema se ha abordado como una tarea de predicción a corto plazo, utilizando múltiples modelos de regresión mediante ML --aprendizaje automático (ML)-- y diversas técnicas de tratamiento de datos. Se ha introducido una estrategia novedosa que tiene en cuenta las variaciones estacionales de las variables ambientales a lo largo de las distintas estaciones del año. Este enfoque demuestra la eficacia del ML para la predicción a corto plazo y la importancia de modelar los diferentes patrones estacionales. En resumen, este estudio demuestra la eficacia de estos enfoques computacionales para mejorar la gestión de los recursos hídricos, en particular para infraestructuras que tienen dos objetivos contrapuestos (consumo de agua y generación de energía) y pueden ser propensas al estrés hidrológico durante largos periodos del año. En la segunda tarea de investigación, se explora el uso de algoritmos de ML para la predicción de eventos de niebla. El estudio utiliza mediciones de visibilidad adquiridas en la estación meteorológica de Mondoñedo en Galicia, España, una zona conocida por los frecuentes eventos de baja visibilidad causados por la niebla orográfica. La investigación aborda el problema de la predicción tanto como una tarea de regresión ---predicción exacta de la visibilidad en metros--- como una tarea de clasificación ---umbralización de los valores de visibilidad y separación en clases. El estudio compara diversos modelos y técnicas de ML. Los hallazgos clave incluyen una evaluación de la sensibilidad del modelo a la estandarización y normalización de las variables de entrada, y, lo que es más importante, un estudio de las técnicas de rebalanceo para el problema de clasificación, que es altamente desbalanceado. Los resultados proporcionan información sobre cuáles son las mejores formulaciones del problema y cuáles son las técnicas de ML más eficaces para la predicción de eventos de baja visibilidad. Sintetizando estas dos áreas de investigación distintas pero complementarias, esta tesis contribuye a una comprensión holística de la gestión ambiental y soluciones climáticas basada en datos y en algoritmos de ML. Ambos trabajos presentados subrayan la importancia del tratamiento y procesamiento de datos junto con la selección de modelos adecuados; a parte, en el segundo también muestra los diferentes enfoques (regresión, clasificación o clasificación ordinal) para un mismo problema. Juntos, destacan el potencial del análisis computacional, las técnicas de procesamiento de datos y el Aprendizaje Automático en la predicción de fenómenos ambientales para construir métodos de predicción más resistentes que se adapten mejor a los problemas presentados por los datos y escenarios del mundo real.