Gráficos en R

datos = read.csv("Datos.csv", sep = ";", dec = ",", header = T)
datos
A data.frame: 8 × 5
NombreEdadGéneroPesoEstrato
<fct><int><fct><dbl><int>
Ángela 22F 62.53
José 10M 75.84
Juan 15M 54.43
Manuela35F 73.63
Maribel50F 70.05
Antonio45M180.04
Alicia 1F 15.71
Luis 32M103.55

Histograma:

Función hist()

Por defecto muestra la frecuencia muestra la cantidad de elementos.

hist(datos$Peso)
../../_images/output_3_0.png

Argumentos:

  • breaks = - número que da la cantidad de celdas.

  • freq =- Valor logical: si es TRUE (por defecto) la frecuencia muestra la cantidad de elementos (conteo). Si es FALSE la frecuencia muestra las probabilidades (frecuencia relativa), es la densidad de los resultados. El área del histograma es 1,0.

hist(datos$Peso, breaks = 10, freq = T) # Por conteo (por defecto)
../../_images/output_5_01.png
hist(datos$Peso, breaks = 10, freq = F) # Frecuencia relativa
../../_images/output_6_02.png

Densidad:

Se agrega una línea de código con la densidad de la distribución de la variable:

lines(density(datos de la variable)).

hist(datos$Peso,
     breaks = 10,
     main = "Distribución del Peso",
     freq = F,
     xlab = "Peso",
     ylab = "Frecuencia relativa",
     xlim = c(5,130),
     ylim =c (0,0.030),
     col = "blue",
     border = "white")
lines(density(datos$Peso), col="black", lwd=5) # Densidad
../../_images/output_8_01.png

La curva de la distribución normal se agrega con:

curve(dnorm(x, mean=mean(datos de la variable), sd=sd(datos de la variable)), add=TRUE)

hist(datos$Peso,
     breaks = 10,
     main = "Distribución del Peso",
     freq = F,
     xlab = "Peso",
     ylab = "Frecuencia relativa",
     xlim = c(5,130),
     ylim =c (0,0.030),
     col = "blue",
     border = "white")
curve(dnorm(x, mean=mean(datos$Peso), sd=sd(datos$Peso)),
      add=TRUE, col="red", lwd=3)
../../_images/output_10_03.png

Agregar líneas:

Útiles para mostrar la media de los datos.

Se agrega una línea de código con:

abline(), argumento v para líneas verticales y h para horizontales.

hist(datos$Peso,
     breaks = 10,
     main = "Distribución del Peso",
     freq = F,
     xlab = "Peso",
     ylab = "Frecuencia relativa",
     xlim = c(5,130),
     ylim =c (0,0.030),
     col = "blue",
     border = "white")
abline(v = mean(datos$Peso), lwd=5, lty=2, col="darkturquoise")
../../_images/output_12_04.png

Boxplot (diagrama de caja y bigotes):

Función boxplot()

Útiles para analizar los datos e identificar datos atípicos ( outliers ).

Boxplot

Boxplot

Diagrama

Diagrama

boxplot(datos$Peso)
../../_images/output_16_02.png
boxplot(datos$Peso,
        main = "Peso",
        ylab = "Peso",
        col = "deepskyblue",
        border = "black")
../../_images/output_17_02.png

Agregar puntos:

Se agrega una línea de código con la función points()

boxplot(datos$Peso,
        main = "Peso",
        ylab = "Peso",
        xlab = "Género",
        col = "deepskyblue",
        border = "black")
points(mean(datos$Peso), pch = 3, lwd = 5, bg = "pink")
../../_images/output_19_03.png

Clasificar los datos:

Las variable inicial se puede clasificar en función de otra utilizando el símbolo ~

boxplot(datos$Peso ~ datos$Género,
        main = "Peso según género",
        ylab = "Peso",
        xlab = "Género",    # se agrega el nombre de la X
        col = "deepskyblue",
        border = "black")
../../_images/output_21_04.png

Cambiar la etiqueta de la variable X:

Se cambia con el argumento names y se ingresan los nombres en un vector.

boxplot(datos$Peso ~ datos$Género,
        main = "Peso según género",
        ylab = "Peso",
        xlab = "Género",
        col = "deepskyblue",
        border = "black",
        names = c("Mujeres", "Hombres"))
../../_images/output_23_05.png

Gráfico horizontal:

Agregar en la función boxplot() el argumento horizontal = T

boxplot(datos$Peso ~ datos$Género,
        main = "Peso según género",
        ylab = "Peso",
        xlab = "Género",
        col = "deepskyblue",
        border = "black",
        names = c("Mujeres", "Hombres"),
        horizontal = T)
../../_images/output_25_02.png

Diagrama de barras:

Función barplot()

Primero se debe obtener la tabla de frecuencias así con la función table()

table(datos$Estrato)
1 3 4 5
1 3 2 2
barplot(table(datos$Estrato))
../../_images/output_29_02.png

Barras horizontales:

Se agrega el argumento horiz = T

barplot(table(datos$Estrato), horiz = T)
../../_images/output_31_02.png

Gráfico de Pie o sectores:

Función pie

Primero se debe obtener la tabla de frecuencias así con la función table()

pie(table(datos$Estrato))
../../_images/output_33_02.png