2016, Número 2
<< Anterior Siguiente >>
Revista Cubana de Informática Médica 2016; 8 (2)
Metodología multi-modal en relaciones cuantitativas estructura-actividad
Cabrera-Leyva L, Madera QJC, García-Jacas CR, Marrero-Ponce Y
Idioma: Español
Referencias bibliográficas: 9
Paginas: 197-205
Archivo PDF: 207.72 Kb.
RESUMEN
Los estudios QSAR definidos en la literatura están basados en enfoques uni-modales, dejando de analizar conjuntos de datos que contienen distintas informaciones químicas. En esta investigación se propone aplicar por primera vez y analizar el comportamiento del enfoque multi-modal en el desarrollo de estudios QSAR. Para este fin se utilizó una base de compuestos con actividad hepatotóxica, a partir de la cual se construyeron cuatro modalidades considerando distintos descriptores moleculares basados en diversas teorías y enfoques. Se desarrollaron varios modelos usando los enfoques uni-modales y multi-modales utilizando algoritmos de clasificación reportados en la literatura e implementados en el lenguaje R. Los parámetros de cada uno de los algoritmos se optimizaron con el procedimiento "parametertuningwithrepeatedgrid-searchcross-validation", mientras la validación de dichos modelos se realizó mediante validación cruzada de 10 pliegues con 10 repeticiones. Estadísticamente se comprobó que el enfoque multimodal mejora el desempeño de los modelos predictivos comparado con algunos de los modelos derivados de los conjuntos de datos con modalidades individuales.
REFERENCIAS (EN ESTE ARTÍCULO)
Marrero Y, Santiago O-M, López Y-M, Barigye S-J, Torrens F. "Derivatives in discrete mathematics: a novel graph-theoretical invariant for generating new 2/3D molecular descriptors. I. Theory and QSPR application". Journal of computer-aided molecular design. vol. 26, pp. 1229-1246, 2012.
Ray B, Henaff M, Ma S, Efstathiadis E, Peskin E-R, Picone M, Poli T, Aliferis C-F, Statnikov A. "Information content and analysis methods for Multi-Modal High-Throughput Biomedical Data". Scientific reports. vol. 4, 2014.
Liew C-Y, Lim Y-C, Yap C-W. "Mixed learning algorithms and features ensemble in hepatotoxicity prediction". Journal of computer-aided molecular design. vol. 25, pp. 855-871, 2011.
Mauri A, Consonni V, Pavan M, Todeschini R. "Dragon software: An easy approach to molecular descriptor calculations". Match. vol. 56, pp. 237-248, 2006.
Yap CW. "PaDEL?descriptor: An open source software to calculate molecular descriptors and fingerprints". Journal of computational chemistry. vol. 32, pp. 1466-1474, 2011.
García C. R, Marrero Y, Ponce L, Barigye S. J, Valdés J. R, Contreras E. "QuBiLS?MIDAS: A parallel free?software for molecular descriptors computation based on multilinear algebraic maps". Journal of computational chemistry. vol. 35, pp. 1395-1409, 2014.
Krstajic D, Buturovic L. J, Leahy D. E, Thomas S. "Cross-validation pitfalls when selecting and assessing regression and classification models". Journal of cheminformatics. vol. 6, pp. 1-15, 2014.
Alcalá J, Fernández A, Luengo J, Derrac J, García S, Sánchez L, Herrera F. "Keel data-mining software tool: Data set repository, integration of algorithms and experimental analysis framework". Journal of Multiple-Valued Logic and Soft Computing. vol. 17, pp. 255-287, 2010.
Sheskin D. "Handbook of parametric and nonparametric statistical procedures, chapman & hall". presented at the CRC, 2003.