Diagrama de dispersión con Python

Para crear un diagrama de dispersión en Python, utilizaremos la biblioteca Matplotlib. Primero, asegúrate de tener Matplotlib instalado. Si aún no lo tienes, puedes instalarlo usando el siguiente comando:

pip install matplotlib

Cómo crear un diagrama de dispersión en Python

Puedes revisar el siguiente ejemplo para crear un diagrama de dispersión:


import matplotlib.pyplot as plt

# Datos de ejemplo
x = [1, 2, 3, 4, 5, 6]
y = [5, 7, 8, 12, 9, 11]

# Crear el diagrama de dispersión
plt.scatter(x, y)

# Agregar etiquetas a los ejes
plt.xlabel('Eje X')
plt.ylabel('Eje Y')

# Agregar título al gráfico
plt.title('Diagrama de Dispersión')

# Mostrar el gráfico
plt.show()

En este ejemplo, hemos creado un diagrama de dispersión utilizando dos listas de datos x e y. Los puntos en el gráfico representan los valores de (x, y) de cada par de puntos en las listas. Luego, hemos agregado etiquetas a los ejes y un título al gráfico antes de mostrarlo.

Este es el resultado:

diagrama de dispersión

Puedes personalizar el gráfico agregando más detalles, como colores, tamaños de puntos, leyendas, etc., utilizando las funciones proporcionadas por Matplotlib.


Distribuciones Aleatorias de Datos en Machine Learning

En el campo del Machine Learning, trabajar con conjuntos de datos que contienen miles o incluso millones de valores es una tarea común. Sin embargo, en muchas ocasiones, los datos del mundo real pueden ser limitados o insuficientes para probar algoritmos de manera efectiva. En tales casos, la generación de valores aleatorios se convierte en una herramienta valiosa.

Como ya exploramos en capítulos anteriores, NumPy, una potente biblioteca de Python, nos ofrece herramientas para crear y manipular datos de manera eficiente. En este contexto, crearemos dos matrices, cada una repleta de 1000 números generados aleatoriamente, siguiendo una distribución normal.

La primera matriz estará caracterizada por una media de 5.0 y una desviación estándar de 1.0. En contraste, la segunda matriz presentará una media de 10.0 y una desviación estándar de 2.0. Estos datos aleatorios pueden ser fundamentales para experimentar con algoritmos y modelos en el mundo del Machine Learning.

import numpy as np
import matplotlib.pyplot as plt

# Generar 1000 datos aleatorios de una distribución normal con media 5 y desviación estándar 1
x = np.random.normal(5.0, 1.0, 1000)

# Generar 1000 datos aleatorios de una distribución normal con media 10 y desviación estándar 2
y = np.random.normal(10.0, 2.0, 1000)

# Crear un gráfico de dispersión (scatter plot) de los datos generados
plt.scatter(x, y)

# Mostrar el gráfico
plt.show()

Este sería el resultado del ejemplo anterior: