Ciencia de Datos Programación

Principales Gráficos en R

10 DIC., 2024

//

15 min. de Lectura

En R, hay varios gráficos y visualizaciones que son ampliamente utilizados para analizar y presentar datos. A continuación, se presentan algunos de los principales gráficos, junto con una breve descripción y ejemplos de código.

Gráfico de DispersiónScatter Plot

Un gráfico de dispersión es una visualización que muestra la relación entre dos variables cuantitativas. Cada punto en el gráfico representa un par de valores (x, y) de las dos variables que se están comparando. Este tipo de gráfico es útil para identificar patrones, tendencias, y posibles correlaciones entre las variables.

Características Clave:

  • Ejes: La variable independiente se coloca en el eje x (horizontal) y la variable dependiente en el eje y (vertical).
  • Puntos: Cada punto en el gráfico representa un registro en el conjunto de datos.
  • Tendencias: Permite observar si hay una relación lineal, no lineal, o si no hay relación entre las variables.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de dispersión
plot(mtcars$wt, mtcars$mpg,
     main="Gráfico de Dispersión: Peso vs. Millas por Galón",
     xlab="Peso (miles de libras)",
     ylab="Millas por Galón",
     col="blue",
     pch=19)  # pch=19 para puntos sólidos
hist

HistogramaHist

Un histograma es una representación gráfica de la distribución de una variable cuantitativa. Divide el rango de los datos en intervalos (o "bins") y cuenta cuántos datos caen en cada intervalo. Los histogramas son útiles para visualizar la forma de la distribución, detectar sesgos, y observar la presencia de valores atípicos.

Características Clave:

  • Ejes: El eje x muestra los intervalos de la variable, mientras que el eje y muestra la frecuencia (número de casos) o densidad (proporción de casos) en cada intervalo.
  • Barras: Cada barra del histograma representa la cantidad de datos en un intervalo específico. Las barras son adyacentes, lo que indica que los intervalos son continuos.
  • Forma de la distribución: Permite observar si la distribución es normal, sesgada, bimodal, etc.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un histograma
hist(mtcars$mpg,
     main="Histograma de Millas por Galón",
     xlab="Millas por Galón",
     ylab="Frecuencia",
     col="lightblue",
     border="black",
     breaks=10)  # Número de intervalos
hist

Gráfico de BarrasBar Plot

Un gráfico de barras es una representación gráfica que muestra la frecuencia o la cantidad de categorías en un conjunto de datos. Es útil para comparar diferentes grupos o categorías y visualizar la magnitud de cada uno.

Características Clave:

  • Ejes: El eje x generalmente representa las categorías, mientras que el eje y muestra la frecuencia o la cantidad asociada a cada categoría.
  • Barras: Cada barra representa una categoría y su altura indica la magnitud o frecuencia. Las barras pueden ser verticales u horizontales.
  • Comparación: Permite comparar fácilmente la cantidad de diferentes categorías.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de barras
barplot(table(mtcars$cyl),
        main="Gráfico de Barras: Frecuencia de Cilindrada",
        xlab="Número de Cilindros",
        ylab="Frecuencia",
        col="lightblue",
        border="black")
barras

Gráfico de LíneasLine Plot

Un gráfico de líneas es una visualización utilizada para mostrar la tendencia de una variable a lo largo del tiempo o en relación con otra variable. Es especialmente útil para representar series temporales y observar cambios o patrones.

Características Clave:

  • Ejes: El eje x generalmente representa el tiempo o una variable independiente, mientras que el eje y muestra los valores de la variable dependiente.
  • Líneas: Los puntos de datos están conectados por líneas, lo que permite ver fácilmente la tendencia general.
  • Tendencias: Ayuda a identificar tendencias, picos, y caídas en los datos.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de líneas
plot(mtcars$wt, mtcars$mpg,
     type="o",  # 'o' para puntos y líneas
     main="Gráfico de Líneas: Peso vs. Millas por Galón",
     xlab="Peso (miles de libras)",
     ylab="Millas por Galón",
     col="blue",
     pch=19)  # pch=19 para puntos sólidos
lineas

Gráfico de PuntosDot Plot

Un gráfico de puntos (o dot plot) es una visualización que muestra la distribución de una variable a través de puntos. Es útil para representar la frecuencia de categorías o la relación entre dos variables, y permite observar patrones y agrupaciones en los datos.

Características Clave:

  • Ejes: El eje x muestra los valores de la variable, mientras que el eje y puede representar la frecuencia o simplemente la categoría.
  • Puntos: Cada punto representa un valor en el conjunto de datos. Los puntos pueden apilarse en la misma posición para mostrar múltiples observaciones.
  • Comparación: Permite comparar diferentes categorías o grupos de manera efectiva.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de puntos
dotchart(mtcars$mpg, labels=row.names(mtcars),
         main="Gráfico de Puntos de Millas por Galón",
         xlab="Millas por Galón",
         col="lightblue",
         pch=19)  # pch=19 para puntos sólidos
scatter

Gráfico de DensidadDensity Plot

Un gráfico de densidad es una representación gráfica que muestra la distribución de una variable cuantitativa de manera suave. En lugar de mostrar las frecuencias absolutas como un histograma, el gráfico de densidad muestra la estimación de la función de densidad de probabilidad de la variable. Esto ayuda a visualizar la forma de la distribución y a identificar patrones y tendencias.

Características Clave:

  • Curva suave: A diferencia de un histograma, que puede ser abrupto debido a la elección de intervalos, el gráfico de densidad utiliza una función de suavizado.
  • Áreas bajo la curva: El área total bajo la curva es igual a 1, lo que permite interpretar la densidad como probabilidades.
  • Comparación: Se pueden superponer múltiples gráficos de densidad para comparar diferentes grupos o categorías.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de densidad
plot(density(mtcars$mpg),
     main="Gráfico de Densidad de Millas por Galón",
     xlab="Millas por Galón",
     ylab="Densidad",
     col="blue",
     lwd=2)  # lwd=2 para aumentar el grosor de la línea
densidad

Gráfico de CorrelaciónCorr Plot

Un gráfico de correlación es una visualización que muestra la relación entre dos o más variables cuantitativas. Este tipo de gráfico es útil para identificar la dirección y la fuerza de la relación entre las variables, así como para detectar patrones y posibles correlaciones.

Características Clave:

  • Puntos de datos: Cada punto en el gráfico representa un par de valores de las variables que se están comparando.
  • Tendencia: La dirección de la tendencia (ascendente o descendente) indica la naturaleza de la correlación (positiva o negativa).
  • Fuerza de la correlación: La cercanía de los puntos a una línea imaginaria sugiere la fuerza de la relación.

Código en R:


# Cargar los datos
data(mtcars)

# Crear un gráfico de dispersión para visualizar la correlación
plot(mtcars$wt, mtcars$mpg,
     main="Gráfico de Correlación: Peso vs. Millas por Galón",
     xlab="Peso (miles de libras)",
     ylab="Millas por Galón",
     col="blue",
     pch=19)  # pch=19 para puntos sólidos
# Agregar una línea de regresión
abline(lm(mpg ~ wt, data=mtcars), col="red", lwd=2)  # lm() para ajustar la regresión lineal
corr

Gráfico de PastelPie Chart

Un gráfico de pastel (o pie chart) es una visualización que muestra la proporción de diferentes categorías en un conjunto de datos. Cada segmento del pastel representa una categoría y su tamaño es proporcional a la cantidad o frecuencia de esa categoría respecto al total.

Características Clave:

  • Segmentos: Cada segmento representa una categoría, y su área es proporcional a su frecuencia o cantidad.
  • Porcentajes: A menudo, se incluyen etiquetas de porcentaje para mostrar la proporción de cada categoría respecto al total.
  • Visualización simple: Es útil para mostrar la composición de un conjunto de datos de manera visualmente atractiva.

Código en R:


# Cargar los datos
data(mtcars)

# Calcular las frecuencias
cylinder_counts <- table(mtcars$cyl)

# Crear un gráfico de pastel
pie(cylinder_counts,
    main="Gráfico de Pastel: Número de Cilindros",
    col=rainbow(length(cylinder_counts)),  # Colores para cada segmento
    labels=paste0(round(100 * cylinder_counts / sum(cylinder_counts), 1), "%"))  # Etiquetas de porcentaje
pie
Share:

Comentarios (0)

Accede para comentar

Sin comentarios

También te puede interesar

26 NOV., 2024 Conceptos Básicos de Data Science

Principales conceptos de ciencia de datos

3 DIC., 2024 Comandos Básicos de Git

Lista de los principales comando de git

Bonnie image
José Elías Romero Guanipa
Autor
logo

©2024 ViveBTC