GARCIA FERNANDO
Congresos y reuniones científicas
Título:
Aplicación del Aprendizaje Automático para la predicción de los gustos básicos de moléculas
Lugar:
Bahía Blanca
Reunión:
Congreso; XLIX Coloquio Argentino de Estadística; 2022
Resumen:
El objetivo de este trabajo es la aplicación del aprendizaje automático para el estudio de 2944 compuestos químicos de la base de datos ChemTastesDB, los que se encuentran agrupados en cinco gustos básicos (dulce, amargo, umami, agrio y salado) y cuatro clases adicionales (insípido, no dulce, multigusto y misceláneo). Inicialmente, se aplicó el aprendizaje no supervisado de la incrustación de vecinos estocásticos distribuidos en t (t-SNE) junto con 166 claves moleculares del sistema de acceso molecular (MACCS) como forma de representación molecular para construir el espacio químico del gusto. Posteriormente, se utilizó el aprendizaje supervisado para desarrollar modelos predictivos para los cinco gustos básicos y modelos para las clases dulce/amargo, dulce/no dulce y amargo/no amargo; utilizando las 166 MACCS, 1024 huellas dactilares moleculares de conectividad ampliada (ECFPs) y 4176 descriptores moleculares independientes de la conformación. Con las MACCS y las ECFPs, se han desarrollado modelos de clasificación basados en similitudes locales de los k-vecinos más cercanos (kNN), N-vecinos más cercanos (N3) y los vecinos más cercanos agrupados (BNN); mientras que con los descriptores moleculares se han aplicado los bosques aleatorios (RF) y el análisis discriminante de mínimos cuadrados parciales (PLSDA). Para la validación externa de los modelos, la base de datos se dividió de forma proporcional a la numerosidad de las clases en grupos de calibración y predicción en una relación 70/30. El desempeño de los modelos se ha cuantificado mediante la tasa de aciertos (NER). El mejor modelo para los cinco gustos básicos es ECFPs-N3 (NERcal = 0.852 y NERpred = 0.876); mientras que Descriptores-RF es el mejor modelo para las clases dulce/amargo (NERcal = 0.998 y NERpred = 0.914), dulce/no dulce (NERcal = 0.997 y NERpred = 0.853) y amargo/no amargo (NERcal = 0.999 y NERpred = 0.898).