2020, Número 08
<< Anterior Siguiente >>
Ginecol Obstet Mex 2020; 88 (08)
Las falacias de la p y significación estadística
Niz-Ramos J
Idioma: Español
Referencias bibliográficas: 25
Paginas: 536-541
Archivo PDF: 222.76 Kb.
RESUMEN
Antecedentes: El valor de p es el método más empleado para estimar la significación
estadística de cualquier hallazgo; sin embargo, en los últimos años se ha
intensificado su debate al respecto, debido a la baja credibilidad y reproducibilidad
de diversos estudios.
Objetivo: Describir el estado actual del concepto del valor de p y la significación
estadística (prueba de significación de la hipótesis nula [por sus siglas en inglés:
Null
Hypothesis Significance Testing: NHST]), especificar los problemas más importantes
y puntualizar las soluciones propuestas para la mejor utilización de los conceptos.
Metodología: Se llevó a cabo la búsqueda bibliográfica en MEDLINE y Google
Scholar, con los términos: “NHST”, “Statistical significance; P value” en idioma inglés
y español, de 2018-2019, limitándose a la selección de artículos publicados entre
2005 y 2019, mediante la revisión de tipo narrativo con búsqueda manual; sobre todo
estudios de metodología.
Resultados: La búsqueda global reportó 1411 artículos: 875 de
PubMed y 536 de
Google Scholar. Se excluyeron 817 por duplicación, 155 sin acceso completo y 414
ensayos clínicos (sin metodología estadística); los 25 restantes fueron el motivo del
análisis.
Conclusiones: El concepto del valor de p no es simple, tiene varias falacias y malas
interpretaciones que deben considerarse para evitarlas en lo posible. Se recomienda
no usar el término “estadísticamente significativo” o “significativo”, sustituir el umbral
de 0.05 por 0.005, informar valores de p precisos y con IC95%, riesgo relativo, razón
de momios, tamaño del efecto o potencia y métodos bayesianos.
REFERENCIAS (EN ESTE ARTÍCULO)
Gigerenzer, G.,et al. Surrogate science: The idol of a universal method for scientific inference. Journal of Management, 2015;41:421-440. doi: 10.1177/0149206314547522
Molina Arias M. ¿Qué significa realmente el valor de p?. Rev Pediatr Aten Primaria. 2017 Dic; 19( 76 ): 377-381. Disponible en: http://scielo.isciii.es/scielo.php?script=sci_ arttext&pid=S1139-76322017000500014&lng=es
Bertolaccini L, et al. Are the fallacies of the P value finally ended? J Thorac Dis. 2016 Jun;8(6):1067-8. DOI:10.21037/ jtd.2016.04.48
Nuzzo R. Scientific method: statistical errors. Nature. 2014;506:150-2. http://ns.leg.ufpr.br/lib/exe/fetch.php/ disciplinas:ce008:506150a.pdf
Trafimow, D, et al. Editorial, Basic and Applied Social Psychology, 2015;37:1, 1-2, DOI: 10.1080/01973533.2015.1012991
Wasserstein,R. et al. The ASA Statement on p-Values: Context, Process, and Purpose, The American Statistician, 2016;70:2, 129-133, https://doi.org/10.1080/00031305 .2016.1154108
Lambdin C. Significance tests as sorcery: Science is empirical significance tests are not. Theory & Psychology, 2012; 22(1):67–90.http://psychology.okstate.edu/faculty/jgrice/ psyc5314/SignificanceSorceryLambdin2012.pdf
Jiroutek MJ, Turner JR. Buying a significant result:Do we need to reconsider the role of the P value. Clin Hypertens. 2017;19:919–921. https://onlinelibrary.wiley.com/doi/ epdf/10.1111/jch.13021
Badenes-Ribera L, et al. Errores de interpretación de los valores p entre psicólogos profesionales españoles. International Journal of Developmental and Educational Psychology, 2017;2:551-559. https://www.redalyc.org/ pdf/3498/349853220053.pdf
Kühberger A. et all. The significance fallacy in inferential statistics. BMC Res Notes. 2015;17;8:84. https://doi. org/10.1186/s13104-015-1020-4.
Goodman S. A. Dirty Dozen: Twelve P-Value Misconceptions. Semin Hematol 2008;45:135-140. doi:10.1053/j. seminhematol.2008.04.003
Greenland S, et al, Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol 2016;31:337–350. DOI 10.1007/s10654-016-0149-3
Ioannidis JP. Contradicted and Initially Stronger Effects in Highly Cited Clinical Research. JAMA. 2005;294(2):218-228. doi:10.1001/jama.294.2.218
Palmer, A., et al. Recommendations for the use of statistics in clinical and health psychology. Clínica y Salud, 2013;24:47-54. http:// dx.doi.org/10.5093/cl2013a6
Lytsy P, P in the right place: Revisiting the evidential value of P-values. J Evid Based Med. 2018 Nov;11(4):288-291. doi: 10.1111/jebm.12319.
Baker, M.1,500 scientists lift the lid on reproducibility. Nature, 2016;533(7604), 452–454. doi:10.1038/533452ª
Wasserstein, R L et al. Moving to a World Beyond “p < 0.05” The American Statistician, 2019;73:sup1, 1-19, DOI: 10.1080/00031305.2019.1583913
Molina Arias, M. El significado de los intervalos de confianza. Pediatría Atención Primaria, 2013;15(57), 91-94. https:// dx.doi.org/10.4321/S1139-76322013000100016
Morey, R.D., et al. The fallacy of placing confidence in confidence intervals. Psychon Bull Rev 2016;23, 103–123. https://doi.org/10.3758/s13423-015-0947-8.
Esarey, J. Lowering the threshold of statistical significance to p< 0.005 to encourage enriched theories of politics. The Political Methodologist, 2017, https://thepoliticalmethodologist. com/2017/08/07/in-support-of-enrichedtheories- of-politics-a-case-for-lowering-the-threshold-ofstatistical- significance-to-p-0-005/
Benjamin, D. J., et al. Redefine Statistical Significance, Nature Human Behaviour, 2018,2, 6–10. https://doi. org/10.1038/s41562-017-0189-z
Hurlbert, S., et al. “Coup de Grâce for a Tough Old Bull: ‘Statistically Significant’ Expires,” The American Statistician, 2019;73. https://doi.org/10.1080/00031305.2018 .1543616
Blakeley B. et al. Abandon Statistical Significance, The American Statistician, 2019;73: sup1, 235-245, DOI: 10.1080 / 00031305.2018.1527253
Harrington D. New Guidelines for Statistical Reporting in the Journal. N Engl J Med 2019; 381:285-286 DOI: 10.1056/ NEJMe1906559
Davidson, A. Embracing uncertainty: The days of statistical significance are numbered. Pediatr Anaesth, 2019;29: 978- 980. doi:10.1111/pan.13721