Un método mejora la comprensión de los movimientos humanos percibidos por una cámara de seguridad

20/07/2022
El artículo Human Activity Recognition by Sequences of Skeleton Features utiliza la estimación de la pose del esqueleto humano como un método de extracción de características para la detección de actividad en imágenes de cámaras de vídeo. El uso de este método permite la detección de actividades de múltiples personas en la misma escena, así como la detección de caídas y el reconocimiento de actividad a partir de secuencias de vídeo RGB estimando la pose de una persona en toda la secuencia. El profesor de la UNED Ernesto Fábregas Acosta es uno de los autores.

 

El artículo, publicado en Sensors, se planteó como hipótesis de la investigación que es posible mejorar los resultados de la detección de caídas a través de cámaras de vídeo si se utiliza un método de detección de esqueletos en dichas imágenes.

 

El profesor contratado doctor de la ETSI Informática de la UNED, Ernesto Fábregas Acosta explica que “la principal contribución de este trabajo es utilizar la estimación de la pose del esqueleto humano como un método de extracción de características para la detección de actividad en imágenes de cámaras de vídeo”. Así, el uso de esqueletos permite representar las articulaciones del cuerpo humano, estimando correctamente la pose de una persona, lo que permite detectar una caída o reconocer correctamente una actividad diaria.

 

El uso de este método -explica el profesor- permite la detección de actividades de múltiples personas en la misma escena. “El algoritmo también es capaz de clasificar actividades de múltiples cuadros, precisamente para aquellas que necesitan más de un cuadro para ser detectadas. El método se evalúa con el conjunto de datos público UP-FALL y se compara con algoritmos similares que utilizan el mismo conjunto de datos”.

 

En opinión de Fábregas, las conclusiones de este trabajo son “muy relevantes” porque “propone y prueba un método para la detección de caídas y el reconocimiento de actividad a partir de secuencias de vídeo RGB estimando la pose de una persona en toda la secuencia”.

 

“El vector de funciones se implementa utilizando funciones de esqueleto que contienen información sobre la pose de la persona contenida en el vídeo. La propuesta fue evaluada utilizando la base de datos UP-Fall a través de cinco modelos de aprendizaje automático (RF, SVM, MLP, KNN y AdaBoost), con los cuales se demostró un buen desempeño del método, que superó a otros sistemas de detección de caídas y reconocimiento de actividad referenciados en el estado del arte”, señala Fábregas.  

 

“Además, el uso de secuencias temporales de estos esqueletos permite reducir significativamente la confusión entre clases al reconocer correctamente actividades muy similares. Por otro lado, se muestra que, al diseñar el vector de características a partir de secuencias de esqueletos, es posible reducir la cantidad de datos utilizando solo algunos de los esqueletos sin disminuir el rendimiento del sistema”.

 

Para trabajos futuros, el grupo de investigadores pretende probar la propuesta en vídeos reales. Solo se han probado en conjuntos de datos creados en el laboratorio y bajo ambientes controlados. Además, se debe considerar la construcción de un sistema de reconocimiento de actividad de varias personas en un mismo vídeo y se considerará el desarrollo de un algoritmo para el seguimiento de una o más personas en diferentes escenas. Dicho algoritmo podría reconocer todas las actividades realizadas y buscar o crear conjuntos de datos para el reconocimiento de actividades con múltiples personas y múltiples cámaras en diferentes escenas”, explica el profesor.

 

UNED

 

Comunicación UNED

Edición web: Rafael Carretero del Puerto

UNED

 

C/ Bravo Murillo, 38, 3ª planta. 28015 Madrid
comunicacion@adm.uned.es
uned.es