Tesis Doctorales de la Universidad de Alcalá |
CONTRIBUCIONES A LOS SISTEMAS INTELIGENTES DE VIDEOVIGILANCIA DE BAJO COSTE, EN TIEMPO REAL Y A SU DESPLIEGUE INDUSTRIAL | Autor/a | Cob Parro, Antonio Carlos | Departamento | Electrónica | Director/a | Losada Gutiérrez, Cristina | Codirector/a | Marrón Romera, Marta | Fecha de depósito | 23-04-2025 | Periodo de exposición pública | 24 de abril a 9 de mayo de 2025 | Fecha de defensa | Sin especificar | Programa | Electrónica: Sistemas Electrónicos Avanzados. Sistemas Inteligentes (RD 99/2011) | Mención internacional | No | Resumen | Esta tesis se centra en el análisis de la inteligencia artificial (IA) aplicada a la videovigilancia, abordando tanto la arquitectura de la IA como la infraestructura para su despliegue en sistemas productivos. Basada en cuatro artículos publicados en revistas indexadas en el JCR y dos contribuciones a congresos, la tesis se presenta por compendio, y se organiza en dos líneas de investigación: el desarrollo de arquitecturas de IA y su despliegue eficiente.
En la primera línea, se desarrollaron arquitecturas con vectores ultraligeros para la detección de personas, reconocimiento de acciones y análisis de multitudes. Se propone una solución que combina MobileNet-SSD y un banco de filtros de Kalman para una detección en tiempo real con una precisión de hasta el 87.82% en el conjunto EPFL. Para el reconocimiento de acciones humanas, se diseñó una arquitectura con redes neuronales recurrentes (LSTMs) alimentadas por vectores ultraligeros extraídos de MobileNetV2-SSD, logrando más del 98% de precisión en conjuntos de datos tradicionales y hasta un 96.34% en escenarios más complejos. Además, se propuso un enfoque de reconocimiento de acciones en multitudes utilizando flujo óptico denso y aprendizaje profundo, con una precisión media entre 91% y 98.61%.
Además, se diseñaron dos nuevos conjuntos de datos orientados a entornos reales, GBA y GSMADC, para entrenar los modelos. GBA abarca tanto estampidas como reconocimiento de acciones, mientras que GSMADC se centra en un escenario real en un ferry.
La segunda línea de investigación se enfoca a optimizar el despliegue de estos modelos utilizando computación en el borde (edge computing). Se empleó una plataforma embebida UpSquared2 con una VPU Myriad-X, lo que permitió reducir el tiempo de procesamiento de MobileNet-SSD a 8.71 ms, un 64% menos que en un procesador estándar. Esta mejora posibilitó el procesamiento simultáneo de hasta 12 flujos de vídeo en tiempo real. Además, se integraron estrategias basadas en MLOps para garantizar escalabilidad, integración continua y gestión segura de datos, con un bajo consumo energético en comparación con las GPUs.
La validación experimental en diversos escenarios demuestra que es posible implementar sistemas de videovigilancia inteligentes, robustos y precisos, operando en tiempo real con un bajo coste computacional y energético. Estos avances establecen un nuevo referente en el campo del reconocimiento de acciones humanas y en multitudes, y abren posibilidades para la implementación industrial de sistemas de videovigilancia basados en IA, adaptables a entornos con recursos limitados y exigentes en latencia y eficiencia energética. |
|