Gráficos en R
datos = read.csv("Datos.csv", sep = ";", dec = ",", header = T)
datos
Nombre | Edad | Género | Peso | Estrato |
---|---|---|---|---|
<fct> | <int> | <fct> | <dbl> | <int> |
Ángela | 22 | F | 62.5 | 3 |
José | 10 | M | 75.8 | 4 |
Juan | 15 | M | 54.4 | 3 |
Manuela | 35 | F | 73.6 | 3 |
Maribel | 50 | F | 70.0 | 5 |
Antonio | 45 | M | 180.0 | 4 |
Alicia | 1 | F | 15.7 | 1 |
Luis | 32 | M | 103.5 | 5 |
Histograma:
Función hist()
Por defecto muestra la frecuencia muestra la cantidad de elementos.
hist(datos$Peso)
![../../_images/output_3_0.png](../../_images/output_3_0.png)
Argumentos:
breaks =
- número que da la cantidad de celdas.freq =
- Valorlogical
: si esTRUE
(por defecto) la frecuencia muestra la cantidad de elementos (conteo). Si esFALSE
la frecuencia muestra las probabilidades (frecuencia relativa), es la densidad de los resultados. El área del histograma es 1,0.
hist(datos$Peso, breaks = 10, freq = T) # Por conteo (por defecto)
![../../_images/output_5_01.png](../../_images/output_5_01.png)
hist(datos$Peso, breaks = 10, freq = F) # Frecuencia relativa
![../../_images/output_6_02.png](../../_images/output_6_02.png)
Densidad:
Se agrega una línea de código con la densidad de la distribución de la variable:
lines(density(datos de la variable))
.
hist(datos$Peso,
breaks = 10,
main = "Distribución del Peso",
freq = F,
xlab = "Peso",
ylab = "Frecuencia relativa",
xlim = c(5,130),
ylim =c (0,0.030),
col = "blue",
border = "white")
lines(density(datos$Peso), col="black", lwd=5) # Densidad
![../../_images/output_8_01.png](../../_images/output_8_01.png)
La curva de la distribución normal se agrega con:
curve(dnorm(x, mean=mean(datos de la variable), sd=sd(datos de la variable)), add=TRUE)
hist(datos$Peso,
breaks = 10,
main = "Distribución del Peso",
freq = F,
xlab = "Peso",
ylab = "Frecuencia relativa",
xlim = c(5,130),
ylim =c (0,0.030),
col = "blue",
border = "white")
curve(dnorm(x, mean=mean(datos$Peso), sd=sd(datos$Peso)),
add=TRUE, col="red", lwd=3)
![../../_images/output_10_03.png](../../_images/output_10_03.png)
Agregar líneas:
Útiles para mostrar la media de los datos.
Se agrega una línea de código con:
abline()
, argumento v
para líneas verticales y h
para
horizontales.
hist(datos$Peso,
breaks = 10,
main = "Distribución del Peso",
freq = F,
xlab = "Peso",
ylab = "Frecuencia relativa",
xlim = c(5,130),
ylim =c (0,0.030),
col = "blue",
border = "white")
abline(v = mean(datos$Peso), lwd=5, lty=2, col="darkturquoise")
![../../_images/output_12_04.png](../../_images/output_12_04.png)
Boxplot (diagrama de caja y bigotes):
Función boxplot()
Útiles para analizar los datos e identificar datos atípicos ( outliers ).
![Boxplot](../../_images/Boxplot1.png)
Boxplot
![Diagrama](../../_images/Diagrama_de_caja1.jpg)
Diagrama
boxplot(datos$Peso)
![../../_images/output_16_02.png](../../_images/output_16_02.png)
boxplot(datos$Peso,
main = "Peso",
ylab = "Peso",
col = "deepskyblue",
border = "black")
![../../_images/output_17_02.png](../../_images/output_17_02.png)
Agregar puntos:
Se agrega una línea de código con la función points()
boxplot(datos$Peso,
main = "Peso",
ylab = "Peso",
xlab = "Género",
col = "deepskyblue",
border = "black")
points(mean(datos$Peso), pch = 3, lwd = 5, bg = "pink")
![../../_images/output_19_03.png](../../_images/output_19_03.png)
Clasificar los datos:
Las variable inicial se puede clasificar en función de otra utilizando
el símbolo ~
boxplot(datos$Peso ~ datos$Género,
main = "Peso según género",
ylab = "Peso",
xlab = "Género", # se agrega el nombre de la X
col = "deepskyblue",
border = "black")
![../../_images/output_21_04.png](../../_images/output_21_04.png)
Cambiar la etiqueta de la variable X:
Se cambia con el argumento names
y se ingresan los nombres en un
vector.
boxplot(datos$Peso ~ datos$Género,
main = "Peso según género",
ylab = "Peso",
xlab = "Género",
col = "deepskyblue",
border = "black",
names = c("Mujeres", "Hombres"))
![../../_images/output_23_05.png](../../_images/output_23_05.png)
Gráfico horizontal:
Agregar en la función boxplot()
el argumento horizontal = T
boxplot(datos$Peso ~ datos$Género,
main = "Peso según género",
ylab = "Peso",
xlab = "Género",
col = "deepskyblue",
border = "black",
names = c("Mujeres", "Hombres"),
horizontal = T)
![../../_images/output_25_02.png](../../_images/output_25_02.png)
Diagrama de barras:
Función barplot()
Primero se debe obtener la tabla de frecuencias así con la función
table()
table(datos$Estrato)
1 3 4 5
1 3 2 2
barplot(table(datos$Estrato))
![../../_images/output_29_02.png](../../_images/output_29_02.png)
Barras horizontales:
Se agrega el argumento horiz = T
barplot(table(datos$Estrato), horiz = T)
![../../_images/output_31_02.png](../../_images/output_31_02.png)
Gráfico de Pie o sectores:
Función pie
Primero se debe obtener la tabla de frecuencias así con la función
table()
pie(table(datos$Estrato))
![../../_images/output_33_02.png](../../_images/output_33_02.png)