ESCUELA DE DOCTORADO

 
Tesis Doctorales de la Universidad de Alcalá
APPLICATION OF MACHINE LEARNING TECHNIQUES FOR THE PREDICTION OF EXTREME WIND SPEED EVENTS
Autor/aVega Bayo, Marta
DepartamentoTeoría de la Señal y Comunicaciones
Director/aSalcedo Sanz, Sancho
Codirector/aPérez Aracil, Jorge
Fecha de depósito29-07-2025
Periodo de exposición pública30 de julio a 10 de septiembre de 2025
Fecha de defensaSin especificar
ModalidadPresencial
ProgramaTecnologías de la Información y las Comunicaciones (RD 99/2011)
Mención internacionalNo
ResumenLa predicción de Eventos de Viento Extremo, aunque es esencial para la gestión segura y eficiente de parques eólicos, es altamente compleja debido a que se trata de eventos extremadamente raros. El objetivo de esta Tesis es la predicción de Eventos de Viento Extremo usando algoritmos de aprendizaje máquina que utilizan como predictores series temporales de viento previo y de variables meteorológicas del entorno. El primer pilar de la Tesis aborda la predicción de viento de intensidad extremadamente alta (≥ 25m/s), puesto que en tales circunstancias es necesario parar los aerogeneradores por motivos de seguridad. El método propuesto para predecir estos eventos consiste en usar clasificadores de aprendizaje máquina: Máquinas Vector Soporte, Bbosques aleatorios, Perceptrones Multicapa, redes de memoria a cortolargo plazo (LSTM) y redes convolucionales de una dimensión. Para abordar el reto de escasez de datos de la clase positiva y de desbalanceo extremo entre clases, el método propuesto consiste en emplear técnicas de aumento de datos para añadir al dataset de entrenamiento nuevas muestras sintéticas de eventos de viento ≥ 25m/s. En concreto, se propone probar y evaluar tanto, técnicas de aumentación de datos tradicionales (random oversampling, SMOTE y deformación de series temporales), como IA generativa novedosa (Autoencoders Variables (VAE) y modelos basados en VAEs, como los VAEs Condicionales (CVAE), y los VAEs con información de clases (CIVAE), que tienen una arquitectura modificada para tener en cuenta la etiqueta de cada muestra). El método propuesto se ha analizado y aplicado en un caso de estudio real basado en datos de un parque eólico en España. Los resultados confirman la viabilidad del método propuesto, incluso sin aplicar técnicas de aumento de datos. En cuantoa las técnicas de aumento de datos, los resultados confirman los beneficios y valor del método propuesto: con el ratio de oversampling correcto, casi todas las técnicas de aumento de datos dan lugar a mejoras con casi todos los clasificadores. CVAE con LSTM da lugar a una mejora del 7.94%. Además, los resultados confirman los beneficios y ventajas de usar VAEs y, especialmente, VAEs con arquitecturas modificadas, en lugar de usar técnicas tradicionales de aumento de datos. Para todos los clasificadores, la mejor técnica de aumento de datos es casi siempre CVAE o CIVAE. El segundo pilar de esta Tesis aborda la predicción de cuatro clases de viento definidas teniendo en cuenta la curva de potencia de las turbinas, y siendo una de las clases viento ≥ 20m/s. El método propuesto para predecir estas clases de viento consiste en usar dos nuevos clasificadores ordinales: MLP-CLM, basado en el modelo de enlace acumulado, y MLP-T, basado en etiquetado suave usando distribuciones triangulares. Los resultados demuestran la viabilidad y alto rendimiento, así como superioridad en comparación con otros clasificadores nominales y ordinales probados, de los dos nuevos clasificadores ordinales propuestos, y especialmente, de MLP-CLM, tanto al predecir clases de viento, como al predecir, en concreto, viento ≥ 20m/s. El tercer pilar de esta Tesis aborda la predicción de ráfagas de viento, definidas como fuertes aumentos repentinos de la velocidad del viento, seguidos rápidamente de fuertes descensos bruscos(o viceversa). El método propuesto en para predecir ráfagas consiste en utilizar Clasificadores de Series Temporales Multivariables, como NNED, NNDWT, QUANT, RSTD, TSF, MiniROQUET, FreshPRINCE, Hydra e HydraMR, con largas series temporales como predictores, y combinando undersampling y oversampling. Los resultados demuestran que el predictor de persistente es incapaz de predecir las ráfagas; mientras que, con el método propuesto, es posible predecir algunos de estos eventos.