BALZARINI MONICA GRACIELA
Congresos y reuniones científicas
Título:
Análisis de interacción de factores clasificatorios de una población en base a las distancias moleculares entre sus individuos
Autor/es:
BRUNO, C.; BALZARINI, M.
Reunión:
Congreso; 2° Encuentro Iberoamericano de Biometría y V Reunión de la Región Centroamericana y del Caribe de la Sociedad Internacional de Biometría; 2009
Institución organizadora:
Sociedad Internacional de Biometría y Sociedad Centroamericana y del Caribe de Biometría
Resumen:
Para estudiar la estructura genética de una población de individuos, es común expresar la diversidad genómica total (expresada por los distintos haplotipos moleculares) como la suma de componentes de variabilidad entre y dentro de grupos de individuos conformados por algún factor de clasificación. Generalmente, se atribuye una proporción aditiva de la variabilidad total a cada uno de los factores individuales presentes en el diseño del estudio. Dada la naturaleza booleana multidimensional de la información provista por los haplotipos moleculares, el análisis es esencialmente multivariado. Debido a la dimensionalidad de los datos genómicos, las sumas de cuadrados (SC) para el análisis de las fuentes de variación se obtienen a partir de las distancias entre los pares de muestras individuales y no a partir de los datos originales provistos por los marcadores moleculares. Debido a relaciones entre SC y sumas de distancias al cuadrado, la SC asociada con cualquier término de un modelo lineal puede ser calculada directamente a partir de una matriz de distancias. Estos cálculos se construyen generalmente desde la matriz de distancias Euclídeas (al cuadrado) (aunque en algunas aplicaciones se han utilizado medidas de distancias alternativas) y se usan para contrastar hipótesis sobre variabilidad entre y dentro de grupos en estructuras jerárquicas (anidadas) de factores. Sin embargo, existen situaciones donde los factores producen clasificaciones cruzadas de los individuos y por tanto es de interés probar la significancia de la interacción entre ellos. En este trabajo se postula y evalúa una nueva prueba estadística para la interacción entre factores en el caso de diseños a dos vías de clasificación con estructura ortogonal, FIDA (Factor Interaction from Distance Analysis). FIDA es de naturaleza no-paramétrica, no demanda la elección de un método de permutación para hallar la significancia y goza de las propiedades del test no paramétrico de Kruskal-Wallis ya que se basa en la aplicación del mismo sobre el valor absoluto de residuos de distancias entre y dentro los grupos formados por ambos factores. El algoritmo comprende: cálculo de la matriz de distancia y partición de la misma en bloques de distinto tipos de distancia, posterior cálculo de residuos y análisis de varianza no-paramétrico sobre esos residuos. FIDA, es una prueba específica de interacción y no del efecto de factores principales. En los diseños con factores cruzados se recomienda analizar primero las interacciones y luego los efectos principales siempre y cuando la interacción no haya sido estadísticamente significativa ya que una interacción alta podría enmascarar efectos principales de uno o ambos factores. En este trabajo se ilustra la aplicación de FIDA a distintos conjuntos de datos moleculares simulados para poner de manifiesto la potencia de la prueba.