Taller Análisis de Correspondencias
Tome la base de datos “participantes_en_mercados_campesinos.csv” para realizar este taller. Esta BD contiene información categórica de los participantes en mercados campesinos de la ciudad de Medellín, de la cual se espera encontrar analisis de relacionamientos que permitan describir la dinámica de estos mercados.
Punto 1: Análisis de correspondencias simple.
Realice un análisis de corresponcias simple para las variables “tipo” y “corregimiento_o_barrio”, con ello queremos describr las similitudes encontradas para los tipos de productores y las zonas donde se producen los productos de los mercados campesinos. Para ello puede seguir el siguiente derrotero:
Cree una tabla de contingencias, para las frecuencias de cada atributo en las dos varaibles y grafíquela.
Realice el test de independencia para la tabla de contingencia.
Si el test de independencia indica relación entre las variables, ajuste un análisis de correspondecia con la librería FactoMiner con la función
CA(tabla de contingencias)
. Este ajuste relizará automáticmente todos los cálculos necesarios para hallar las contribuciones.Extraiga las contribuciones por filas y columnas, lo cual podrá hacerlo por medio de
fviz_contrib(salida AC, choice, axes = 1)
, el argumentochoice=col
extraería las contribuciones por columna, ychoice=row
extraería las filas. conserve el argumentoAxes=1
, que indica la dimensión que se está graficandoMuestre en un gráfico de sedimentación los aportes de cada atributo por fila y columna a las dimensiones. Esto lo puede realizar con la función
fviz_contrib(salida AC, choice , axes = 1)
también puede cambiar el argumentochoice
. Puede extraer los valores numéricos de las contribuciones con la instrucción$row$contrib
para filas y$col$contrib
para las columas; aplicado al objeto salidad del analisis de correspondencias.Ubique las nuevas coordenadas en un Biplot y explique que informacón puede interpretarse tanto del biplot como de las contribuciones.
Interprete los resultados.
Tome en cuenta que el biplot mostrará las correlaciones pertenecientes a cada categoría y su relación con cada dimensión e individuos.
Punto 2: Análisis de correspondencias Múltiple.
De la misma BD, analice una reducción de dimensionalidad para las siguientes varibales: “tipo”, “corregimiento_o_barrio”, “sexo”, “tipo_de_inscripción”, con el fin de encontrar los grupos o dimensiones que mejor representen la información. Para hacer el análisis realice lo siguiente:
Cree una tabla de contingencias, para las frecuencias de cada atributo en las varaibles.
Realice la prueba de independencia de la tabla contingencia para determinar si existen o no asociaciones para cada par de variables.
Ajuste el análisis de correspondencias, recuerde que por ser múltiple, debe ser basado en la matriz de “BURT”, por lo que a la función
MCA()
, debe contar con el argumentomethod ="BURT"
.Realice un gráfico de sedimentación que explique la cantidad de dimensiones óptima para este conjunto de datos, esto lo puede realizar por medio de la función:
fviz_screeplot(Salida AC, addlabels = TRUE)
Ubique los individuos en un biplot de la primera y segunda dimensión para poder encontrar grupos y relaciones entre ellos. Esto lo puede hacer con la función `fviz_screeplot(CA_multiple, addlabels = TRUE)``
Interprete los resultados.