Tesis Doctorales de la Universidad de Alcalá |
SEGMENTACIÓN SEMÁNTICA INTERACTIVA EN IMÁGENES DE LAPAROSCOPIA MEDIANTE REDES NEURONALES PROFUNDAS.
INTERACTIVE SEMANTIC SEGMENTATION IN LAPAROSCOPIC IMAGES WITH DEEP NEURAL NETWORKS. | Autor/a | Monasterio Expósito, Leticia | Departamento | Electrónica | Director/a | Pizarro Pérez, Daniel | Codirector/a | Macías Guarasa, Javier | Fecha de defensa | 24-11-2023 | Calificación | Sobresaliente cum laude | Programa | Electrónica: Sistemas Electrónicos Avanzados. Sistemas Inteligentes (RD 99/2011) | Mención internacional | No | Resumen | La segmentación semántica juega un papel fundamental como tarea previa en diversas aplicaciones de Visión por Computador, como el procesamiento de imágenes, el seguimiento o tracking, el registro de imágenes y la reconstrucción. Además, esta disciplina tiene aplicaciones en diversos campos como el procesamiento de imágenes industriales, la visión robótica, los vehículos autónomos y, en particular, en la imagen médica. Esta tesis se centra en la segmentación semántica en imágenes médicas, poniendo un énfasis especial en los sistemas de Cirugía Mínimamente Invasiva guiados por Realidad Aumentada (AR), para los cuales la segmentación semántica es una etapa clave de pre- procesamiento. Los principales desafíos a los que se enfrenta este campo son la falta de conjuntos de datos grandes y variados, y la tremenda variabilidad entre diferentes pacientes. Abordar estos problemas mediante la creación de conjuntos de datos adecuados y métodos basados en aprendizaje profundo es una tarea difícil debido a la limitada disponibilidad de pacientes y la naturaleza laboriosa de la anotación manual realizada por expertos. Para superar estos desafíos, esta tesis investiga una metodología de entrenamiento de métodos de segmentación semántica basados en redes neuronales profundas que mejora la generalización mediante un método nuevo de aumento de datos etiquetados. Este método se basa en el uso de técnicas artificiales de empeoramiento de las etiquetas para el entrenamiento de una red discriminadora. Dicha red es luego utilizada para mejorar el entrenamiento de la red de segmentación. El método propuesto se adapta al entrenamiento de redes neuronales de segmentación del estado del arte y se somete a una experimentación rigurosa para validar su efectividad. Además, en una segunda contribución, se explora el uso de la segmentación interactiva para aprovechar el conocimiento del experto y mejorar los resultados. Para ello, se ha diseñado un método interactivo de corrección de la segmentación que se basa en el uso de mapas de guiado que acumulan toda la información de interacciones anteriores y son utilizados como entradas auxiliares de la red de segmentación. Nuestro enfoque se evalúa ampliamente en conjuntos de datos de imágenes médicas, demostrando su eficacia y potencial para el avance en el campo de la segmentación semántica, particularmente en el contexto de los sistemas de Cirugía Mínimamente Invasiva guiados por Realidad Aumentada. |
|