Tesis Doctorales de la Universidad de Alcalá |
DEVELOPMENT OF NEW DATA-DRIVEN FRAMEWORKS BASED ON FEATURE SELECTION, ENSEMBLE LEARNING AND EXPLAINABLE ARTIFICIAL INTELLIGENCE FOR IMPROVING AND UNDERSTANDING EXTREME METEOROLOGICAL EVENTS PREDICTIONS. | Autor/a | Peláez Rodríguez, César | Departamento | Teoría de la Señal y Comunicaciones | Director/a | Salcedo Sanz, Sancho | Directores/as | Jiménez Fernández, Silvia; Deo, Ravinesh C | Fecha de depósito | 29-07-2025 | Periodo de exposición pública | 30 de julio a 10 de septiembre de 2025 | Fecha de defensa | Sin especificar | Modalidad | Presencial | Programa | Tecnologías de la Información y las Comunicaciones (RD 99/2011) | Mención internacional | Solicitada | Resumen | En las últimas décadas, la capacidad de anticipar las condiciones meteorológicas se ha convertido en un componente crítico de la infraestructura de la sociedad moderna. Las predicciones meteorológicas no solo ayudan en la gestión de emergencias, sino que también desempeñan un papel fundamental en sectores económicos como la energía, la agricultura, el transporte y el turismo. La integración reciente de la Inteligencia Artificial y el Aprendizaje Automático en las aplicaciones meteorológicas ofrece una perspectiva complementaria a los modelos tradicionales. Entre estas técnicas basadas en datos, se resuelven problemas de clasificación, regresión, clustering o detección de valores atípicos, emergiendo como una herramienta poderosa para comprender y predecir fenómenos meteorológicos.
Un área particularmente desafiante y crítica dentro de la predicción meteorológica es la predicción de eventos extremos, como olas de calor, inundaciones, sequías y tormentas. Estos fenómenos tienen importantes consecuencias sociales, económicas y ambientales. Sin embargo, los complejos factores físicos que los impulsan y su evolución bajo el cambio climático, junto con su rareza y falta de repetitividad intrínseca, hacen que sean difíciles de modelar con precisión. Entre los principales desafíos se encuentran la escasez y el desbalance de los datos, así como la dificultad para extrapolar valores extremos.
Esta tesis doctoral aborda dichos desafíos proponiendo un enfoque basado en el desarrollo de algoritmos de IA para la predicción y el análisis de eventos meteorológicos extremos. El trabajo se desarrolla en torno a tres pilares metodológicos principales: algoritmos de selección de características, aprendizaje por ensamblaje y técnicas de Inteligencia Artificial Explicable.
En primer lugar, se aplican algoritmos de selección de características para identificar las variables predictivas más relevantes a partir de grandes conjuntos de datos meteorológicos. Esta etapa es fundamental no solo para mejorar el rendimiento y la eficiencia de los modelos, sino también para obtener información sobre los factores físicos que dan lugar a los eventos extremos. Mediante técnicas de optimización heurística, la tesis explora la selección de predictores óptimos en diferentes escalas espaciales y temporales.
En segundo lugar, se emplea el aprendizaje por ensamblaje para mejorar el rendimiento predictivo mediante la combinación de múltiples modelos de ML. Este enfoque contribuye a reducir la varianza y el sesgo, aumenta la robustez del modelo y resulta especialmente adecuado para conjuntos de datos desbalanceados y ruidosos. En el marco de este trabajo, se han desarrollado nuevos métodos de ensamblado que han sido aplicados a diversos problemas de predicción de eventos extremos, obteniendo resultados significativamente mejores.
En tercer lugar, la tesis pone énfasis en la importancia de la interpretabilidad de los modelos mediante la aplicación de técnicas de XAI. A diferencia de los modelos opacos tipo caja negra, los métodos explicables ofrecen transparencia y permiten la integración del conocimiento físico con los conocimientos derivados de los datos. Esto resulta crucial en el ámbito de la ciencia climática, donde comprender las relaciones causales detrás de las predicciones mejora tanto el conocimiento científico como la confianza en los sistemas de IA. En esta línea, se han propuesto enfoques basados en lógica difusa y extracción de reglas inductivas, que permiten construir modelos precisos pero también interpretables.
Las contribuciones de esta tesis se alinean con los objetivos del grupo de investigación GHEODE de la Universidad de Alcalá, que se centra en la optimización heurística y las aplicaciones de la IA. |
|