2023, Número 3
Análisis de componentes principales para la identificación de variables sensibles en la ejecución del gesto motor y desarrollo de una red neuronal artificial como herramienta auxiliar en la clasificación del rendimiento deportivo en taekwondoínes elite de la Ciudad de México
Idioma: Español
Referencias bibliográficas: 13
Paginas: 91-101
Archivo PDF: 313.96 Kb.
RESUMEN
Introducción: la clasificación deportiva es una tarea diaria en la vida del atleta. Es importante relacionar el resultado de las pruebas realizadas a un taekwondoín con la eficiencia de la ejecución de su gesto motor fundamental, la patada, que representa 80% de la actividad en competencia. Objetivo: contar con una herramienta que permita identificar y clasificar, utilizando las variables más sensibles (antropométricas y fisiológicas) y relacionarlas con la eficiencia deportiva de una muestra de taekwondoínes de la CDMX. Material y métodos: estudio transversal descriptivo para el análisis de 202 variables obtenidas de 74 evaluaciones para identificar aquéllas de mayor variabilidad que permitan la estratificación de la población utilizando análisis de componentes principales y su clasificación en cuatro niveles de aptitud, utilizando una red neuronal artificial. Resultados: se obtienen 19 parámetros que representan más de 50% de la información contenida en los datos que representan a la población de estudio y se establecen límites con significancia estadística que permiten caracterizar a los atletas identificando debilidades y fortalezas. Se obtuvo una eficiencia de clasificación de 87.5%. Conclusión: el uso de tecnologías en el análisis de datos y clasificación basados en inteligencia artificial es una propuesta diferente que busca emular el trabajo realizado por los entrenadores en el proceso de clasificación de los deportistas.INTRODUCCIóN
Tres rounds de 2 minutos, con un minuto de descanso entre cada asalto es la dinámica de la competencia de un taekwondoín. En esos minutos de combate el atleta debe ser eficiente en la ejecución de gestos motores para lograr el rendimiento deportivo; que es evaluado como el logro de objetivos alcanzados y los recursos utilizados en la tarea. Es reflejo de un compromiso entre capacidades físicas,1 psicológicas2 y nutricionales.3 Cada disciplina deportiva exige diferentes perfiles para lograr el éxito; son características que pueden ser agrupadas en parámetros antropométricos,4 fisiológicos5 y cinemáticos.6 Las habilidades son otro aspecto importante en los objetivos de un atleta, siendo parámetros que posterior a una intervención pueden mejorar.7 La clasificación de un deportista es un proceso complejo y en ocasiones subjetivo. En el deporte, la clasificación no sólo responde a aspectos de seguridad, sino también al principio de competición justa,8 por lo cual se definen y agrupan aquellos parámetros, la edad, por ejemplo, que permitan establecer categorías en la búsqueda de una competencia en igualdad de condiciones. Las variables de clasificación más reportadas en la literatura y que describen el perfil de un taekwondoín son: un porcentaje medio de grasa corporal de aproximadamente 7.5 ± 1.5% para los atletas masculinos y femeninos internacionales, una potencia anaeróbica pico para competidores masculinos, categoría internacional de 11.8 ± 2.0 W/kg y femeninos entre 10.2 ± 2.5 W/kg, un VO2max de atletas internacionales masculinos y femeninos que oscila entre 55.8 ± 3.9, y otras como la fuerza, velocidad, agilidad y flexibilidad.9
Aún con las descripciones mencionadas son los equipos técnicos y entrenadores los que identifican las potencialidades y debilidades en los atletas en la ejecución deportiva. Ante la capacidad tecnológica actual con la que se pueden utilizar diversos tipos de sensores y registrar un mayor número de parámetros de diferentes pruebas, surge la necesidad de proponer algoritmos que puedan procesar esta cantidad de datos, pero sobre todo integrar y ponderar cada prueba para identificar potencialidades y debilidades de manera similar a la tarea de los entrenadores. En el campo de la inteligencia artificial es donde se reportan diversas propuestas para esta tarea, que van desde la enseñanza de la práctica deportiva,10 hasta el análisis de la ejecución de la patada,11 la clasificación de diversos tipos de patada,12 pero sobre todo las potenciales aplicaciones que podrán desarrollarse.13
Para poder relacionar los resultados de las evaluaciones con la ejecución de la patada es necesario el uso de herramientas tecnológicas, desarrollar algoritmos capaces de aprender relaciones no lineales en los datos, con la capacidad para aprender patrones y relaciones complejas. Estas herramientas son útiles para clasificar a un deportista en diferentes niveles de aptitud física debido a su capacidad de aprendizaje, extracción automática de características, manejo de datos complejos, adaptabilidad y escalabilidad. Esto permite una clasificación novedosa, precisa y automatizada en comparación con otros enfoques.
En el presente trabajo se propone la utilización de dos algoritmos para el manejo de datos obtenidos de diversas pruebas realizadas a taekwondoínes elite de la Ciudad de México. El primero, el análisis de componentes principales (PCA, por sus siglas en inglés), para la identificación de los parámetros con más variabilidad que permitan caracterizar al taekwondoín; y el segundo, la arquitectura de una red neuronal artificial (RNA) que integre los datos obtenidos por el PCA, pondere los resultados de las pruebas y clasifique al atleta en cuatro niveles de aptitud física: óptima, buena, promedio y mejorable.
MATERIAL Y MéTODOS
Se trata de un estudio transversal descriptivo que se basa en el uso de algoritmos para el procesamiento de datos basados en inteligencia artificial. La muestra está conformada por 43 atletas mexicanos, 31 de los deportistas cuentan con 5 a 7.7 años de práctica, 10 deportistas con una experiencia entre 7.7 y 10.4 años de práctica y dos deportistas con más de 10 años de experiencia, 11 de ellos con experiencia en olimpiadas nacionales y participando en los primeros lugares. El resto se distingue en competencias estatales, nacionales e internacionales. A estos deportistas se les realizaron 74 evaluaciones (algunos cuentan con dos evaluaciones). Todos ellos afiliados a la Asociación Capitalina de Taekwondo, A.C. de la Ciudad de México y a quienes se les explicó detalladamente los propósitos de las pruebas. Se obtuvo asentimiento y consentimiento informado y fueron integrados al protocolo registrado ante el Comité de Investigación y Ética del Instituto Nacional de Rehabilitación "Luis Guillermo Ibarra Ibarra" (INR LGII) en la Ciudad de México (INR 13/20 AC).
PRUEBAS
Cada evaluación realizada a los atletas está compuesta por seis pruebas: análisis de composición corporal por bioimpedancia eléctrica, valoración isocinética de la fuerza muscular de tren inferior, determinación de potencia anaeróbica (salto vertical), determinación de la coordinación y equilibrio y finalmente determinación de los tiempos de reacción-decisión. Todas las pruebas se realizaron por la mañana y en la secuencia mencionada, con intervalos de recuperación, además se realizaron pruebas complementarias y de seguridad de acuerdo con los criterios de la Subdirección de Medicina del Deporte del INR LGII.
El equipo que se utilizó para la prueba de composición corporal es el INBODY 370s, el tiempo de la evaluación es de 15 segundos, durante los cuales se registran 18 parámetros.
La valoración isocinética es una prueba que permite evaluar la fuerza máxima que produce la musculatura en la articulación de la rodilla en todo el rango de movimiento y se utilizó un dinamómetro electrónico BIODEX, modelo System 4 Pro. El protocolo se realiza a velocidades angulares de 30, 60 y 90°/seg para determinar fuerza, trabajo y potencia. Se registran 18 parámetros por cada atleta.
La potencia aeróbica es la capacidad que tiene un atleta para realizar actividades físicas intermitentes y de alta intensidad. Para su medición se hace uso de una plataforma de contacto MICHECEVI. El protocolo utilizado exige que el atleta realice 10 saltos continuos sin parar realizando su máximo esfuerzo. Se registran ocho parámetros por cada atleta.
Para la prueba de coordinación y equilibrio, se utilizó el sistema NeuroCom® Balance Master que proporciona una evaluación del control sensorial y voluntario del equilibrio motor. Ésta es una de las pruebas más exigentes, con duración aproximada de 30 minutos, y consta de cinco etapas en las que se cuantifica: 1) la capacidad del atleta de mantener la bipedestación; 2) cómo se desplaza el centro de gravedad del atleta en plataforma firme y posteriormente en plataforma inestable; 3) la influencia de los órganos sensoriales sobre el equilibrio estático de manera unilateral; 4) la velocidad de balanceo; y 5) la capacidad del atleta de mover el centro de gravedad voluntariamente. Los resultados de esta prueba se registran utilizando 128 parámetros por atleta.
Los tiempos de reacción-decisión se evaluaron en el Laboratorio de Análisis de Movimiento y Rehabilitación del INR LGII. Se ejecutaron diversos gestos motores que corresponden a la patada en un espacio libre donde la zona de impacto consistió en una estructura diseñada específicamente para la prueba. Se montaron dos cojines de contacto a dos alturas diferentes y con soportes laterales para colocar 4 pods, elementos funcionales de la plataforma de estimulación visual-motora (T-sensors. Therapy and Testing Medical Technologies®, México).
Se evaluaron diferentes estilos de patadas: Cut (patada recta), Chigo chagui (patada circular descendente), Dollyo chagui (patada lateral superior) y Pi chagui (patada lateral inferior). Las patadas se realizaron con ambas piernas en seis ocasiones cada una, con tiempos de descanso entre 20 y 30 segundos entre repeticiones.
Se evaluaron dos tipos de estímulo con cada tipo de patada y con cada pierna: 1) estímulo visual no condicionado, se generó un estímulo visual al sitio que previamente se indicaba al atleta (arriba o abajo) y a partir del cual debía realizar la patada. 2) Estímulo visual condicionado, prueba en la que se generó el estímulo visual de forma aleatoria y dependiendo del sitio donde encendiera el pod (arriba o abajo) se ejecutaba la patada. Los resultados de la prueba se registran utilizando 30 parámetros por cada atleta.
1. Análisis de componentes principales
Los resultados de las cinco pruebas realizadas en cada evaluación del atleta suman un total de 202 parámetros. Todos estos valores con la característica común de estar altamente correlacionados entre sí (positiva o negativamente).
Esta condición en los datos es denominada multicolinealidad y, aunque algunos autores definen que esto se presenta por experimentos mal diseñados, suele observarse con datos utilizados para definir estados de salud. Una técnica para poder abordar esta característica de los datos es el PCA, el cual es un algoritmo de aprendizaje no supervisado cuyo objetivo es identificar estructuras no observadas en los datos. Su uso también es recomendado cuando se tienen más variables que tamaño de muestra. Su aplicación se basa en la rotación y proyección de datos con la finalidad de reducir dimensiones. El algoritmo toma un numero n de dimensiones (parámetros) e identifica las principales fuentes de variabilidad. Cada una de las cinco pruebas es procesada utilizando la técnica PCA e implementada usando el software RStudio (R Core Team 2022). Se seleccionan los parámetros de la primera dimensión y que representan más de 50% de la información, los resultados de cada prueba son almacenados en lo que se denomina como vector de características, conformado por los parámetros más sensibles de cada una de las cinco pruebas realizadas al atleta.
2. Red neuronal artificial
La clasificación del rendimiento y técnica deportiva debe estar representada por parámetros cuantitativos y cualitativos. Esta ponderación la realizan los entrenadores, quienes además de valores objetivos agregan datos como experiencia, competencias ganadas, estado psicológico, estrés y otras. Existen pocos ejemplos en la literatura que utilicen una batería de prueba tan diversa como la que se presenta en este trabajo y para poder integrarlos se propone el uso de una RNA. Su nombre proviene de su símil con el funcionamiento de una neurona biológica y está estructurada por tres capas: entrada, oculta y de salida. Se utilizan varias neuronas interconectadas y con un proceso iterativo (aprendizaje supervisado), se ajustan los pesos sinápticos, y se establece una relación entre los valores de entrada y los valores de salida. La arquitectura de la RNA utilizada es un perceptrón multicapa con tipo de conexión recurrente y totalmente conectada. El tipo de aprendizaje es por retropropagación Levenberg-Marquardt. Los conjuntos de entrenamiento y prueba tienen una proporción 75/25. El número de neuronas en la capa de entrada es de 28 para la arquitectura de las mujeres y de 36 para la de hombres con tres capas intermedias y cuatro neuronas en la capa de salida, cada una relacionada con los cuatro niveles de clasificación propuestos: óptimo, bueno, promedio y mejorable. El procesamiento se ha implementado utilizando el software MATLAB© (The MathWorks, Inc.). La eficiencia de la arquitectura de la RNA se logra cuando se clasifica correctamente al menos a 85% de los atletas y para validar los resultados se utilizó la matriz de confusión.
ANáLISIS ESTADíSTICO
Para evaluar la normalidad de las variables se utiliza la prueba Shapiro-Wilk. Para los cambios intragrupo se utilizó la prueba t pareada para muestras independientes y la prueba de U de Mann-Whitney. Para diferenciar los cuatro niveles de clasificación en cada una de las evaluaciones se utiliza la prueba no paramétrica de Kruskal-Wallis asumiendo que los datos no siguen una distribución normal. Aun cuando esta prueba puede manejar muestras de diferentes tamaños todas tuvieron la misma longitud. En todos los casos, el nivel de significancia fue determinado por p < 0.05.
RESULTADOS
La edad promedio de los participantes fue de 16.5 ± 1.8 años y para realizar el análisis de los datos la muestra se dividió en dos grupos, el primero conformado por 17 mujeres con 28 evaluaciones y el segundo compuesto por 26 hombres y 36 evaluaciones. Los atletas evaluados tienen perfiles similares en cada uno de los grupos, como se presentan en la Tabla 1.
El análisis de componentes principales realizado en R consta de cinco etapas: 1) normalización de los datos; 2) cálculo de los valores PCA para cuantificar como aportan las dimensiones y el porcentaje de varianza de cada parámetro; 3) análisis de contribución de cada uno de los parámetros que componen la prueba (Figura 1A); 4) la variable más sensible se divide en cuatro grupos utilizando el método k-medias (Figura 1B); y 5) se realiza prueba estadística para validar las diferencias entre los grupos propuestos (Figura 1C).
Los parámetros con más variabilidad y que permiten establecer cuatro grupos con significancia estadística en la primera dimensión son: a) para el análisis de composición corporal son tres: masa grasa segmental derecha, izquierda y masa musculo esquelética; b) para la valoración isocinética de la fuerza son cuatro: valor real de flexores y extensores tanto derechos como izquierdos; c) con respecto a la determinación de potencia anaeróbica son cuatro: potencia absoluta y relativa expresada en el valor máximo y promedio; d) en la determinación de la coordinación y equilibrio se seleccionan cuatro parámetros de la etapa Weight Bearing-Squat a 30 y 60 grados en lado izquierdo y derecho; y finalmente e) la determinación de los tiempos de reacción-decisión, en donde se seleccionan la patada Cut izquierda y derecha con estímulo condicionado y la patada Chigo chagui izquierda y derecha con estímulo no condicionado. Con esto el vector de características queda conformado por 19 parámetros provenientes de las cinco pruebas de cada evaluación de los atletas.
Con el agrupamiento utilizando el método k-medias se establecen valores máximos y mínimos dentro de cada una de las opciones de clasificación propuestas: óptimo, bueno, promedio y mejorable. Este proceso permite establecer los límites para clasificar a los taekwondoínes en cuatro niveles de aptitud física. En la Tabla 2 se reportan los límites obtenidos por PCA para las pruebas de análisis de composición corporal por bioimpedancia eléctrica, valoración isocinética de la fuerza muscular de tren inferior y determinación de potencia anaeróbica (salto vertical). En la Tabla 3 se reportan los límites obtenidos por PCA para las pruebas de determinación de la coordinación y equilibrio y finalmente determinación de los tiempos de reacción-decisión.
Los valores de las Tablas 2 y 3 componen los elementos de entrada de la red neuronal artificial. La red se entrena para clasificar a los atletas en cuatro niveles de aptitud; óptimo, que son los valores máximos encontrados en la muestra de taekwondoínes en el protocolo. Posteriormente el nivel bueno y promedio como etapas intermedias y finalmente, en la muestra estudiada, el nivel mejorable que serían los atletas que tiene los resultados más bajos en las pruebas.
La integración de los parámetros en la RNA para la clasificación del atleta es similar al trabajo realizado por el equipo de entrenadores. No es necesario que un atleta obtenga todos los resultados de sus pruebas en el nivel óptimo para tener un rendimiento deportivo y técnico alto. Se implementan dos arquitecturas de RNA, una para procesar los resultados de las mujeres y otra para los hombres. Para validar la arquitectura se utiliza la proporción 75/25, 20 registros para entrenar y ocho para prueba en el grupo de las mujeres y 27 para entrenar y nueve para prueba en el grupo de hombres. Para validar a la RNA se utilizan parámetros de atletas que no han sido procesados en ninguna ocasión por la arquitectura desarrollada. Utilizando la matriz de confusión se reporta una clasificación correcta de 87.5%. La velocidad con la que se ejecuta la patada es un parámetro relacionado con la eficiencia del gesto deportivo. Se utilizó este valor para comparar la clase asignada por la RNA a cada atleta y su velocidad de patada registrada. En la Tabla 4 se presentan ejemplos de la asignación de clases (óptimo, bueno, promedio y mejorable) en los rangos establecidos por PCA. Los números en las celdas representan el identificador del atleta y su posición en la tabla el resultado obtenido para cada uno de los cuatro niveles posibles. La clasificación por la RNA se representa en la tabla con un código de color en la celda de cada atleta, se observa que para la asignación de clase no es necesario que todos los parámetros estén en el mismo rango en las cinco pruebas realizadas. Finalmente, en la columna asignada a la velocidad promedio (evaluación cinemática independiente a las pruebas realizadas) se observa que aquellos atletas que tienen velocidades mayores se relacionan con resultados de las pruebas en las clases óptimo y bueno. De manera contraria, aquellos atletas con velocidades bajas en la ejecución de la patada son asignados a las clases promedio y mejorable.
DISCUSIóN
En este estudio se clasificó en cuatro niveles de aptitud física a 43 atletas de élite a partir de cinco evaluaciones deportivas. De estas pruebas se obtuvieron 202 variables; la técnica PCA permitió reducirlas a 19 parámetros para representar el conjunto de datos con aquéllos de mayor aporte. Con la implementación de una arquitectura RNA se logró una clasificación con una eficiencia de 87.5%. El análisis presentado también permitió identificar las áreas de oportunidad de mejora para los deportistas.
La clasificación deportiva es un proceso continuo, donde el principal objetivo es identificar potencialidades y debilidades del atleta, por parte de los entrenadores. La literatura se enfoca especialmente en agrupar las variables de clasificación en parámetros antropométricos, fisiológicos y cinemáticos; pero son pocos los trabajos que estudian la interacción de estos con la ejecución del gesto motor fundamental del deportista.
En el entrenamiento diario, todo empieza con la búsqueda de talentos en edades tempranas, a los cinco años los niños manifiestan de 20 a 40% de las habilidades motrices que desarrollarán, mientras que las niñas 40 a 60%. En esta etapa una de las variables más utilizadas es la altura, continuando con su crecimiento, entre 11 y 14 años la capacidad aeróbica ya puede ser evaluada, así como el salto vertical y flexiones. De acuerdo con algunas investigaciones la maduración está relacionada con el aumento de fuerza en hombres y una mayor cantidad de grasa en mujeres.
Para evaluar esta maduración se establecen relaciones de las capacidades motrices con la escala de Tanner, en donde efectivamente en las fases III y IV se establecen mejores resultados que en aquellos jóvenes que se encuentran en fase II. Sin embargo, variables como los años de práctica del deporte no permiten establecer una diferencia con esta escala. Para poder competir en igualdad de condiciones es utilizada la edad como categoría de clasificación, pero no es una medida justa ya que la velocidad o ritmo de maduración es diferente para cada joven, en ocasiones un joven de 10 años puede tener un desarrollo similar de alguien con mayor edad.
Por ello, es necesario contar con herramientas que permitan ponderar los resultados de diferentes pruebas objetivamente. El análisis por PCA es útil especialmente en casos con colinealidad de los datos, sobre todo cuando se trata de variables relacionadas con el desempeño. Además, permite establecer rangos estadísticamente significativos seleccionando aquellos parámetros con mayor variabilidad, lo que da como resultado la posibilidad de economizar en el análisis de datos. Asimismo, el análisis PCA utilizando el método k-medias permite caracterizar a los atletas, al asignar los resultados de las pruebas en cuatro posibles niveles de aptitud. En este trabajo se logra reducir el número de parámetros procesados, de 202 a 19, mientras siguen siendo representativos del total de los valores. No se eliminan los aportes de las demás variables, ya que se utilizan las proyecciones en la primera dimensión, asegurando que esta representa más de 50% de la información de todas las variables. Parte de los retos de este análisis es la homogeneidad de la población analizada (Tabla 1). Por lo que era necesario encontrar un parámetro que permitiera caracterizar a los taekwondoínes identificando las variables sensibles en la disciplina deportiva.
El resultado de la clasificación de la RNA es producto de la integración de los resultados de las cinco pruebas realizadas a los 43 atletas, de manera similar al proceso que realizan los entrenadores (Figura 2). Se diseñaron dos arquitecturas de la RNA, una para mujeres y una para hombres, identificando erróneamente sólo uno de cada ocho registros analizados.
El análisis de datos utilizando algoritmos de inteligencia artificial es una herramienta útil en el procesamiento de grandes cantidades de datos. Las diferentes técnicas nos permiten identificar estructuras en los mismos que no son evidentes. La experiencia aquí presentada puede ser utilizada en diversas disciplinas deportivas.
CONCLUSIONES
Se desarrolló un sistema que permite la identificación de los parámetros principales que definen una población que comparte características, lo que dificulta su estratificación. Se proponen rangos para la clasificación en cuatro niveles de aptitud para 19 parámetros que se obtienen de las cinco pruebas realizadas de los atletas. Su aplicación permite identificar debilidades y fortalezas, y la posibilidad de desarrollar intervenciones para fortalecer el rendimiento deportivo.
AGRADECIMIENTOS
Los autores desean agradecer a la Secretaría de Educación, Ciencia, Tecnología e Innovación de la Ciudad de México (SECTEI) por su apoyo con el proyecto SECTEI/214/219.
REFERENCIAS (EN ESTE ARTÍCULO)
Dharmmesta RA, Jaya IGP, Rizal A, Istiqomah. Classification of foot kicks in taekwondo using SVM (support vector machine) and KNN (K-nearest neighbors) algorithms. 2022 IEEE International Conference on Industry 4.0, Artificial Intelligence, and Communications Technology (IAICT). Bali, Indonesia: 2022. pp. 36-41.
AFILIACIONES
1 Medicina del Deporte. Instituto Nacional de Rehabilitación "Luis Guillermo Ibarra Ibarra". CDMX, México.
2 Laboratorio de Análisis de Movimiento e Ingeniería de Rehabilitación. Instituto Nacional de Rehabilitación "Luis Guillermo Ibarra Ibarra". CDMX, México.
CORRESPONDENCIA
Gabriel Vega-Martínez. E-mail: gvega@inr.gob.mx; gvegam@outlook.comRecibido: 12 de Diciembre de 2022. Aceptado: 19 de Julio de 2023