2022, Número 6
Reproducibilidad y validez de mediciones radiográficas para el cálculo de índices morfométricos de fémur proximal predictivos de fracturas de cadera
Idioma: Español
Referencias bibliográficas: 29
Paginas: 352-358
Archivo PDF: 216.89 Kb.
RESUMEN
Estudio transversal-retrospectivo con 120 radiografías pélvicas anteroposteriores. Se tomaron ocho mediciones por tres evaluadores en dos tiempos para calcular índices morfológico cortical (IMC), corticometafisario (ICM) y corticodiafisario (ICD). Se evaluó la reproducibilidad intra e interobservador con el método de Bland-Altman y se predijo la ocurrencia de fracturas comparando puntos de corte entre evaluadores maximizando sensibilidad/especificidad. La proporción de medidas fuera de ± 2 DE fue similar para diámetros/corticales (~5%), pero superó 1 mm en algunas corticales, representando 10-20% de distancias < 1 cm. El punto de corte fluctuó de 2.45 a 2.53 para IMC (3% diferencia), de 0.37 a 0.41 para ICD (12%) y de 0.23 a 0.33 para ICM (44%).INTRODUCCIóN
En traumatología y ortopedia existen diferentes mediciones, índices-indicadores y clasificaciones radiográficas empleadas para predecir riesgos, caracterizar padecimientos, formular tratamientos y pronosticar el éxito de intervenciones médicas o quirúrgicas.1,2,3 Sin embargo, no siempre es fácil obtener mediciones reproducibles que garanticen la confiabilidad de dichas categorizaciones,4,5 es decir, que las mediciones realizadas no siempre generan el mismo valor en diferentes momentos por uno (reproducibilidad intraobservador) o más evaluadores (reproducibilidad interobservador).6 Y aunque una buena reproducibilidad no garantiza la validez de mediciones e índices/indicadores derivados de éstas, una mala reproducibilidad sí constituye un serio problema de validez.7
Para hacer el diagnóstico de osteopenia u osteoporosis y evaluar el riesgo de fracturas se emplea la densitometría ósea como técnica estándar.8 Debido al costo del equipo requerido, dicha técnica no suele estar disponible en centros de atención primaria, por lo que los médicos en estos sitios habitualmente valoran el riesgo de fracturas radiográficamente.9 De este modo, para mejorar el valor diagnóstico de la inspección visual se han propuesto índices basados en mediciones radiográficas que permiten predecir el riesgo de fracturas.10,11,12
En el caso de las fracturas de cadera, la radiografía simple anteroposterior (AP) de pelvis permite realizar diversas mediciones para calcular índices de riesgo predictivos incluyendo el morfológico cortical, el corticometafisario y el corticodiafisario, que indirectamente valoran la calidad ósea y la morfología del fémur proximal que se modifican con la edad,12 ya que cambios en la amplitud del canal femoral han sido relacionadas con la densidad mineral ósea.13
Lo anterior es importante porque las fracturas osteoporóticas representan un serio problema de salud pública.14 Sólo en Estados Unidos ocurren más de dos millones de estas fracturas cada año, que se traducen en cerca de 500,000 ingresos hospitalarios,15 con las de cadera se representa 15% del total.16 Dichas fracturas resultan en 50% de pacientes con imposibilidad de deambular sin apoyo y otro 20-30% que muere dentro del año posterior a la fractura.17 Además, impactan negativamente la calidad de vida de los pacientes, en particular los de edad avanzada, con altas tasas de complicaciones posteriores y mortalidad asociada;18 cuando ocurren en población joven, generalmente se relacionan con traumatismos de alta energía.15
En este contexto, el presente estudio tuvo por objetivo evaluar la reproducibilidad intra e interobservador de mediciones estandarizadas radiográficas AP de pelvis empleadas para la construcción de índices morfométricos de fémur proximal potencialmente predictivos de fracturas de cadera.
MATERIAL Y MéTODOS
Diseño de estudio: estudio transversal analítico retrospectivo para la evaluación de la reproducibilidad intra e interobservador de mediciones radiográficas de fémur proximal.
Lugar de estudio: Departamento de Imagenología del Hospital Christus Muguerza del Parque de Chihuahua, ubicado en la capital del estado homónimo del norte de México. Se trata de un centro privado con 64 camas de hospital y 15 de terapia intensiva donde se hospitalizan cerca de 9,000 pacientes cada año. En este hospital, anualmente, se realizan cerca de 100 cirugías de cadera.
Población de estudio: fueron elegibles todas las radiografías de pacientes de más de 30 años de edad en quienes se tomó una radiografía simple AP de pelvis, normal o con fractura de cadera intra o extracapsular, realizadas con buena técnica radiográfica y que estaban disponibles en la base de datos del sistema electrónico del departamento de imagenología del hospital durante el año 2020. Las radiografías con prótesis de cadera, con errores de captura de datos demográficos o con técnica radiográfica deficiente fueron excluidas. Las observaciones fueron dicotomizadas según la presencia de fractura de cadera.
De las 350 radiografías AP de pelvis disponibles, sólo 120 (34.3%) cumplieron los criterios de inclusión; 23.1% (n = 81) de las radiografías fueron excluidas por mala técnica radiográfica (p. ej. pelvis rotada, visualización de la articulación de cadera incompleta y artefactos en la imagen); 9.7% (n = 34) tuvo datos de identificación incompletos o ausentes; 16.6% (n = 58) provenían de casos con prótesis de cadera y 16.3% (n = 57) eran pacientes menores de 30 años.
De las 120 radiografías seleccionadas para el análisis, 41 (34.2%) fueron de hombres y 79 (65.8%) de mujeres. De estos pacientes, 12 (29.3%) hombres y 30 (38%) mujeres presentaron una fractura de cadera.
Mediciones radiográficas: se midieron los diámetros CD y AB requeridas para el cálculo del índice morfológico cortical (IMC: CD/AB); el diámetro C y las corticales A y B fueron empleadas para calcular el índice corticometafisario (ICM: A+B/C); y el diámetro Z y las corticales X y Y se usaron para el cálculo del índice corticodiafisario (ICD: X+Y/Z).
Las ocho mediciones (CD, AB, C, A, B, Z, X, Y) fueron realizadas por tres evaluadores en dos tiempos diferentes con un intervalo de dos semanas entre mediciones. Los evaluadores fueron médicos especialistas en traumatología y ortopedia conocedores del uso de los índices referidos.
Las radiografías AP se realizaron colocando el foco del rayo en la sínfisis del pubis usando 77 KVp y 8 mAs. Se emplearon dos equipos de rayos X para las tomas radiográficas (Siemens Axiom Icons R100® y Siemens Axiom Icons R200®). Para visualizar las imágenes radiográficas y realizar las mediciones con una precisión de 0.01 mm se empleó el programa Carestream Vue Motion® haciendo un acercamiento de 100% en la proyección.
Estandarización de evaluadores: los tres evaluadores participantes fueron estandarizados en la técnica de medición radiográfica para reducir errores en el cálculo de los índices como se ilustra en la Figura 1 y se detalla a continuación:
Índices morfológico cortical (IMC): a) trazo de una línea longitudinal en el centro de la cavidad medular correspondiente al eje anatómico femoral, b) identificación del punto más alto del trocánter menor, c) trazo de línea perpendicular (90°) a la porción externa de la cortical lateral, d) al nivel de la línea trazada en el paso anterior se traza una línea entre ambas porciones externas de la cortical medial y lateral para medir el diámetro CD, e) se traza una línea perpendicular hacia la cortical medial distales del centro del diámetro CD y f) sobre esa última línea se mide el ancho del canal endomedular a 70 mm para obtener el diámetro AB.
Índice corticometafisiario (ICM): a) trazo de una línea longitudinal en el centro de la cavidad medular correspondiente al eje anatómico femoral, b) identificación de la base del trocánter menor, c) trazo de línea perpendicular (90°) al eje femoral y medición del diámetro C comprendida entre las corticales externas de la cortical medial y lateral, d) medición de la cortical medial A y lateral B al nivel de la base del trocánter menor.
Índice corticodiafisiario (ICD): se siguen los mismos pasos que en el ICM, pero las mediciones se realizan a 20 mm distales a la base del trocánter menor para obtener el diámetro Z entre las corticales externas de la cortical medial y lateral y las mediciones de la cortical medial X y lateral Y.
Análisis estadístico: la reproducibilidad intra e interobservador de las mediciones requeridas para calcular los índices radiográficos fue evaluada mediante el método de Bland-Altman para variables continuas.19,20 Se evaluó la reproducibilidad intraobservador con las dos medidas realizadas por cada evaluador. Para la reproducibilidad interobservador se emplearon los promedios de las dos mediciones realizadas por cada evaluador.
Se calculó la media y desviación estándar (DE) de la diferencia en milímetros entre las mediciones, así como los límites superior e inferior a ± 2 DE de la media de las diferencias y se calculó la proporción de mediciones fuera de estos límites.
Para evaluar el impacto práctico de las mediciones realizadas por los evaluadores, se emplearon curvas ROC para valorar el desempeño predictivo de los índices en la ocurrencia de fracturas de cadera. De este modo, se establecieron y compararon los puntos de corte resultantes, así como las áreas bajo la curva obtenidas para cada evaluador para los tres índices maximizando la sensibilidad (Se) y especificidad (Sp).
Consideraciones éticas: el protocolo del estudio fue revisado y aprobado por el Comité de Ética e Investigación del Hospital Christus Muguerza de Chihuahua (ID: HCMP-CEI-0931052021R). También recibió el permiso para la extracción y uso de la información por parte de las autoridades hospitalarias. No se obtuvo consentimiento informado dado que el estudio se basó en el análisis de datos secundarios.
RESULTADOS
La Tabla 1 muestra la reproducibilidad intraobservador para las dos medidas efectuadas por los tres evaluadores independientes. Los cálculos se subdividen en mediciones de diámetros óseos (CD, AB, C, Z) y anchuras corticales (A, B, X, Y). Se observó que la media de la diferencia entre las dos mediciones para los diámetros fluctuó entre 0.01 y 0.33 mm en el evaluador 1, entre 0.00 y 0.25 mm en el evaluador 2 y entre -0.02 y -0.18 en el evaluador 3; para las mediciones corticales, las diferencias fueron de -0.10 a 0.25 mm, de 0.04 a -0.19 mm y de 0.28 a 0.49 mm, respectivamente. Dentro de los diámetros, el CD fue el que tuvo mayor rango de variación a ± 2 DE, superando los 4 mm en los tres evaluadores y el Z el que tuvo la menor variación con cerca de 3 mm. Para las corticales, no hubo un patrón claro de variación en los rangos, aunque la medición A tendió a tener el mayor rango con 3-4 mm. Para los diámetros, el porcentaje de medidas fuera de ± 2 DE alcanzó 6.7 y 7.5% para la medición AB en los evaluadores 1 y 2, respectivamente, y de 6.7% para la medición C en el evaluador 3. Para las corticales, las mediciones con mayores porcentajes fueron la A con 6.7% en el evaluador 1, la B con 6.7% en el evaluador 2 y la Y en el evaluador 3 con 5.8%.
La Tabla 2 muestra la reproducibilidad interobservador del promedio de las dos mediciones efectuadas por los tres evaluadores independientes. Los cálculos se subdividen en mediciones de diámetros óseos (CD, AB, C, Z) y espesores corticales (A, B, X, Y). Se observó que la media de la diferencia entre las dos mediciones para los diámetros fluctuó de -0.28 a 0.61 mm entre el evaluador 1 y 2, de 0.56 a 1.17 mm entre el evaluador 1 y 3 y de -0.16 a 1.46 entre el evaluador 2 y 3; para las mediciones corticales, las diferencias fueron de 0.56 a 1.31 mm, de -0.07 a -0.68 mm y de 0.77 a 1.99 mm, respectivamente. Dentro de los diámetros, el CD fue el que tuvo el mayor rango de variación a ± 2 DE, superando los 6 mm en los tres evaluadores y el AB el que tuvo la menor variación superando los 5 mm. Para las corticales, no hubo un patrón claro de variación en los rangos, aunque la medición A tendió a tener el mayor rango con 3-5 mm. Para los diámetros, el porcentaje de medidas fuera de ± 2 DE alcanzó 6.7% para la medición CD y C entre los evaluadores 1 y 2. Para las corticales, las mediciones con mayores porcentajes fueron la X y Y con 6.7% entre el evaluador 2 y 3, la A con 5.8 % entre el evaluador 1 y 3, y la X y Y entre los evaluadores 1 y 2 con 5.8%.
La Figura 2 ilustra gráficas distintivas del análisis Bland-Altman para reproducibilidad interobservador. Se muestran los promedios de las mediciones de los observadores en los ejes horizontales y las diferencias de las medidas de cada observador en los ejes verticales. Las líneas superior e inferior representan los límites a ± 2 DE, mientras que la línea central representa la media de las mediciones. En la gráfica A se ve el diámetro CD entre el evaluador 1 y 2, con el porcentaje más alto (6.7%) de todas las observaciones fuera de los límites establecidos (rango 9.52 mm). La grafica B muestra la cortical X entre el evaluador 1 y el 3 con el porcentaje de observaciones fuera de límite más bajo de 1.7% (rango 3.24 mm). La gráfica C representa el diámetro CD entre los evaluadores 2 y 3 con un porcentaje fuera de los límites de 4.2% (rango 6.43 mm). Finalmente, la gráfica D representa la cortical A entre los evaluadores 2 y 3 con un porcentaje fuera de los límites de 4.2% (rango 5.64 mm).
Por último, la Tabla 3 muestra los puntos de corte para cada uno de los índices de cada evaluador maximizando la Se y Sp en la predicción dicotómica de fracturas de cadera en adultos mayores de 30 años. De acuerdo con las mediciones promedio de cada evaluador, los puntos de corte para los tres índices serían: evaluador 1, IMC ≤ 2.45, ICM ≤ 0.26 e ICD ≤ 0.39; evaluador 2, IMC ≤ 2.53, ICM ≤ 0.23 e ICD ≤ 0.37; y evaluador 3, IMC ≤ 2.50, ICM ≤ 0.33 e ICD ≤ 0.41.
DISCUSIóN
El objetivo de este estudio fue evaluar la reproducibilidad intra e interobservador de mediciones radiográficas estandarizadas para la construcción de índices morfométricos de fémur proximal predictivos de fracturas de cadera.
Para evaluar la relevancia de las diferencias observadas, es importante tener en cuenta que la variación absoluta entre las mediciones guarda relación con la distancia ósea medida, es decir, que mientras que los diámetros pueden alcanzar 3-5 cm, las corticales difícilmente superan 1-1.5 cm. Así pues, uno podría esperar mayor diferencia absoluta en los diámetros (CD, C, Z y AB) que en las corticales (A, B, X, Y). Por eso llamó la atención que la variación absoluta en mm entre las mediciones fuera similar en los diámetros y las corticales medidas por los evaluadores 1 y 2, e incluso mayor en las corticales medidas por el evaluador 3. De hecho, la máxima variación intraobservador registrada para un diámetro fue para el diámetro C con 0.33 mm (evaluador 1), mientras que la máxima diferencia para una cortical fue de 0.49 mm (evaluador 3), lo que apunta hacia la necesidad de medir con mayor precisión las distancias corticales.
Por otra parte, la relevancia de cuantificar el porcentaje fuera de ± 2 DE fue para poder distinguir las mediciones que tuvieron mayor variabilidad en términos comparativos. Para la reproducibilidad intraobservador, se observó una proporción de medidas fuera de ± 2 DE similar para los tres evaluadores, tanto para diámetros como para corticales, con porcentajes que fluctuaron entre 2.5% (cortical A, evaluador 3) y 7.5% (diámetro AB, evaluador 2), con un promedio de 5% de medidas fuera de ± 2 DE tanto para diámetros como para corticales, lo que podría considerarse como un porcentaje relativamente bajo y aceptable.
En cuanto a la reproducibilidad interobservador, llamó la atención que el porcentaje de medidas por debajo o encima de ± 2 DE fuera algo menor que en la intraobservador, promediando 4.5 y 4.7% para diámetros y corticales, respectivamente, cuando se esperaría una menor diferencia en esta última por tratarse del mismo evaluador. Esto puede deberse en parte a que se empleó el promedio de las dos mediciones de cada observador para el cómputo de la variabilidad intraobservador, reduciendo posibles errores. Las diferencias observadas en las tres comparaciones efectuadas mostraron porcentajes aceptables por fuera de ± 2 DE, fluctuando entre 1.7 y 6.7%. En relación con la variación absoluta entre las mediciones de evaluadores, se observó una mayor diferencia que en las mediciones intraobservador, con varias que superaron 1 mm y con una comparación que alcanzó los 1.99 mm (cortical A, evaluador 2 vs 3). También para la reproducibilidad interobservador se observaron mayores diferencias absolutas en las corticales que en los diámetros. La interpretación de estas diferencias es más relevante, pues diferencias de 1-2 mm se podría llegar a representar de 10-20% de la distancia de alguna cortical que mida 1 cm o menos.
Para valorar la repercusión de las diferencias en las mediciones entre evaluadores para los tres índices de riesgo predictivos de fracturas de cadera calculados, se calculó el desempeño diagnóstico de dichos índices maximizando la Se y Sp para determinar y comparar los puntos de corte obtenidos por evaluador para cada índice. Con Se entre 61.5-70.5% y Sp de 61.9% se obtuvieron puntos de corte de entre 2.45 (evaluador 1) y 2.53 (evaluador 2) para el IMC, que reflejan una diferencia relativa de tan sólo 3% [(2.45-2.53)/2.45] entre el menor y mayor punto de corte. Para el ICD, esta diferencia fue de 12.8% [(0.37-0.41)/0.37]. Sin embargo, para el ICM las diferencias fueron notablemente mayores, con puntos de corte entre 0.23 y 0.33, lo que indica una diferencia relativa de 44% [(0.23-0.33)/0.23], lo cual implica un problema para el uso de este índice. Es importante notar que las diferencias en los puntos de corte observados entre evaluadores e índices reflejan las discordancias en las medidas corticales (A, B, X y Y), ya que el numerador del cociente para el ICD y el ICM está basado en mediciones corticales [ICM = (A+B)/C; ICD = (X+Y)/Z].
El limitado valor de los índices dependientes de mediciones corticales para relacionar la morfometría con osteoporosis en fracturas de cadera derivados de mediciones radiográficas de pelvis, en sustitución de la densitometría ósea,4,10,12,21,22,23,24,25 coincide con la baja correlación (r) reportada para ambos índices (ICM = 0.32, ICD = 0.42).10
En relación con la reproducibilidad de índices, un estudio usó las radiografías AP y lateral de 101 pacientes para evaluar la reproducibilidad de la clasificación cualitativa de Dorr mediante dos mediciones de tres cirujanos de cadera expertos y tres cirujanos de cadera junior. Los índices medidos incluyeron la relación canal-calcar, el índice cortical y el Canal Flare Index. Los coeficientes de kappa para la reproducibilidad intraobservador para los tres cirujanos junior fue de 0.36, 0.62 y 0.65, mientras que la de los expertos fue de 0.70, 0.86 y 0.87; por su parte, la interobservador mostró coeficientes de 0.32 entre los juniors y de 0.52 entre los expertos.6 Sin embargo, la reproducibilidad se evaluó para los índices y no para cada una de las mediciones continuas que integran los índices cuantitativos aquí presentados.
La principal limitación técnica referida por los evaluadores tuvo que ver con la calidad de las radiografías, ya que la identificación de los márgenes corticales fue esencial para determinar el sitio en que debía colocarse el cursor. En algunas radiografías, la penetración de los rayos X afectó la calidad de la imagen y la determinación de dichos bordes, algo que no ocurre con el uso de la tomografía computarizada.26,27 Establecer con certeza las referencias anatómicas (trocánter menor, eje anatómico del fémur) para la toma de las mediciones fue también problemático; por ejemplo, medir con exactitud la angulación a 90° (precisión de 0.1°) para obtener el eje anatómico del fémur fue especialmente difícil.
La falta de reproducibilidad de los índices cualitativos a partir de radiografías AP de pelvis para asociar la morfometría osteoporótica con fracturas de cadera de pelvis, en sustitución de la densitometría ósea, ha llevado a buscar índices cuantitativos que mejoren la reproducibilidad y faciliten su valor predictivo en centros de atención médica primaria.6,28,29 En este sentido, los resultados de este estudio destacan la buena reproducibilidad intra e interobservador, así como el aceptable desempeño del IMC que se traduce en valores de Se y Sp de entre 60 y 70%.
AGRADECIMIENTOS
Se agradece a Noel García González y Fernando González González, especialistas en traumatología y ortopedia, por su participación como evaluadores.
REFERENCIAS (EN ESTE ARTÍCULO)
Lozada Balderrama V, Alberto Infante OZ, Silva Escobedo JG, Velasco Leija A. Correlación radiológica entre el índice corticodiafisario y la densidad mineral ósea en el diagnóstico de la osteoporosis. Acta Ortop Mex. 2007; 21: 77-84. Available in: https://www.medigraphic.com/pdfs/ortope/or-2007/or072g.pdf
Roberto Mora Zamarripa, Verduzco Rodriguera JJ, López Taylor J, Jáuregui Ulloa E, Cardona Muñoz I. Índice de Singh y morfológico-cortical en población adulta aparentemente sana, en deportistas y en individuos sedentarios. Acta Ortop Mex. 2001; 15: 186-8. Available in: https://www.medigraphic.com/pdfs/ortope/or-2001/or014g.pdf
Jensen T, Hansen M, Jensen KE, Podenphant J, Hansen TM, Hyldstrup L. Comparison of dual X-ray absorptiometry (DXA), digital X-ray radiogrammetry (DXR), and conventional radiographs in the evaluation of osteoporosis and bone erosions in patients with rheumatoid arthritis. Scand J Rheumatol. 2005; 34: 27-33. Available in: https://doi.org/10.1080/03009740510017986
AFILIACIONES
1 Departamento de Investigación en Salud, Hospital Christus Muguerza del Parque, Universidad de Monterrey, Chihuahua, Chihuahua, México.
2 Laboratorio de Medicina Molecular, Unidad de Medicina y Ciencias de la Salud, Universidad Autónoma de Zacatecas, México.
Financiamiento: no se obtuvo financiamiento para la realización de este estudio.
NIVEL DE EVIDENCIA
IIICORRESPONDENCIA
Prof. Joel Monárrez-Espino. E-mail: joel.monarrez@christus.mx - joel.monarrez@udem.eduRecibido: 03-03-2023. Aceptado: 07-04-2023.