Taller 1: análisis gráfico
La finalidad de este taller es analizar información a partir gráficos,
haciendo uso de la librería ggPlot2
de R
. El ejercicio consiste
en realizar gráficos que contengan información que permitan responder
preguntas acerca del comportamiento de las variables estudiadas, por
tanto, se solicita que todos los gráficos sean bien presentados, con la
información correcta y con buena ortografía, por esto, se debe hacer uso
de títulos, subtítulos y leyendas. Además, todas las preguntas deben
tener su respectivo análisis que complemente la información presentada
en el gráfico.
Base de datos:
Estados Financieros Individuales del año 2020 extraídos de Supersociedades.
Archivo de la BD: Estados_financieros_Supersociedades2020.csv
Variables:
Actividad: de acuerdo con el código CIIU solo para empresas con cultivos. Es la actividad económica.
Departamento: ubicación del registro de la empresa.
Ingresos: ingresos por actividades de operación.
Utilidad Operacional: EBIT del período.
Costos financieros: se puede asumir como los intereses financieros que se pagan por las deudas.
Utilidad neta: utilidad neta del período.
Activos: Total de Activos del período.
Pasivos: Total Pasivos del período.
Ganancias acumuladas: cuenta del Patrimonio con la que podemos identificar si la empresa ha tenido pérdidas en períodos anteriores.
Punto 1:
Realice un gráfico Boxplot que permita conocer el comportamiento de los
Ingresos, por cada actividad económica. Utilice una paleta
personalizada, créela como un vector de seis colores diferentes. Puede
tomar los colores de: https://r-charts.com/es/colores/
Además,
utilice el tema Theme_minimal()
.
Realice un informe detallado de la información que presenta el gráfico.
Punto 2:
Realice un gráfico de dispersión y analice qué impactos o relacionamiento tienen las variables de Activos e Ingresos, sepárelos por actividad económica y clasifique por departamentos.
Responda:
¿Para alguna actividad agrícola, la inversión que se hace en Activos tiene algún impacto sobre los Ingresos?
¿Existe alguna actividad agrícola predominante en algún departamento?
Punto 3:
Realice un gráfico con varias variables, que permita conocer la
correlación numérica y el gráfico de dispersión entre las variables
Ingresos, Costos financieros y Pasivos. Adicionalmente, la forma de los
puntos de los gráficos de dispersión debe ser diferentes para cada
actividad económica (puede usar GGpairs
, que con el argumento
mapping =
puede agregar estéticas del gráfico). Analice lo que esto
significa para las empresas.
Punto 4:
Realice un Heatmap entre las actividades y los departamentos, que
muestren las ganancias acumuladas. Para ello, puede guiarse de la
página: https://r-charts.com/es/correlacion/mapa-calor-ggplot2/
.
Indique cuál es el sector que menos ganancias acumula.
Punto 5:
Compare por actividad agrícola, la relación que existe entre la utilidad operacional y los costos financieros, utilizando el gráfico de puntos para cada actividad, separe en dos conjuntos los valores donde la utilidad operacional es mayor que los costos financieros; trace una línea de 45 grados con el fin de representar esta frontera. Con ello analice las actividades económicas que se encuentran con problemas de solvencia.
Puede hacer los gráficos de forma individual y mostrarlos en uno solo
con la función: grid.arrange()
Nota 1: cuando se clasifican los datos dentro de aes()
por
color =
, shape =
, fill =
, etc. se puede hacer la
clasificación con condiciones, por ejemplo, Utilidad Operacional >
Costos financieros.
Nota 2: las líneas rectas con la ecuación pendiente-intercepto se pueden
agregar con geom_abline()
.
Nota 3: en el análisis financiero la solvencia se puede analizar con la relación entre la utilidad operacional y los costos financieros. Si los costos financieros son mayores que la utilidad operacional significa que la operación de la compañía no logra generar suficiente beneficio para cumplir con sus obligaciones financieras.