Diagramas de dispersión en R

Los diagramas de dispersión (también conocidos como gráficos de dispersión o scatter plots en inglés) son una herramienta visual poderosa en R y en el análisis de datos en general. Estos gráficos se utilizan para representar la relación entre dos variables numéricas y ayudan a identificar patrones, tendencias y relaciones entre ellas. Aquí tienes una lección básica sobre cómo crear y utilizar gráficos de dispersión en R.


Preparar tus datos

Lo primero que necesitas es tener tus datos listos. Asegúrate de tener dos variables numéricas que desees comparar o explorar su relación.


Crear un Gráfico de Dispersión en R

Usaremos la función plot() para crear un gráfico de dispersión básico. Aquí tienes un ejemplo sencillo:

# Crear datos de ejemplo
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 3, 6, 5)

# Crear un gráfico de dispersión
plot(x, y)

En este ejemplo, hemos creado dos vectores x e y como nuestros datos. Luego, usamos la función plot(x, y) para crear el gráfico de dispersión. El eje x representará los valores en el vector x, y el eje y representará los valores en el vector y.

Crear diagrama de dispersión en R

Personalizar el Gráfico de Dispersión en R

Puedes personalizar tu gráfico de dispersión de varias formas, como agregar etiquetas a los ejes, cambiar los colores y los símbolos, y agregar títulos. Aquí tienes un ejemplo con personalización:

# Crear un gráfico de dispersión personalizado
plot(x, y, 
     main="Gráfico de Dispersión Personalizado",  # Título principal
     xlab="Variable X",  # Etiqueta del eje x
     ylab="Variable Y",  # Etiqueta del eje y
     col="blue",         # Color de los puntos
     pch=19)              # Símbolo de los puntos

En este ejemplo, hemos agregado un título al gráfico con main, etiquetas a los ejes x e y con xlab e ylab, cambiado el color de los puntos a azul con col, y utilizado el símbolo «19» para los puntos con pch.

Crear gráfico de dispersión en R personalizado

Interpretar el Gráfico de Dispersión

Una vez que tengas tu gráfico de dispersión, puedes comenzar a interpretar los datos. Observa la dispersión de los puntos en el gráfico. Si los puntos están dispersos al azar, puede indicar una falta de relación. Si los puntos forman una tendencia, podría indicar una relación lineal o no lineal entre las variables.


Agregar una Línea de Regresión

Si sospechas que hay una relación lineal entre tus variables, puedes agregar una línea de regresión al gráfico con la función abline():

# Agregar una línea de regresión
plot(x, y, main="Gráfico de Dispersión con Línea de Regresión", xlab="Variable X", ylab="Variable Y")
abline(lm(y ~ x), col="red")  # Agregar una línea de regresión lineal

En este ejemplo, hemos utilizado abline(lm(y ~ x), col=»red») para agregar una línea de regresión lineal que mejor se ajusta a los datos.

Añadir linea regresión gráfico de dispersión en R

Los gráficos de dispersión son una herramienta esencial en el análisis exploratorio de datos y pueden proporcionar información valiosa sobre la relación entre dos variables. Experimenta con diferentes personalizaciones y técnicas de análisis según tus necesidades específicas.