En este tutorial, aprenderemos cómo trabajar con la distribución normal utilizando NumPy y cómo visualizarla para comprender mejor sus propiedades.
La distribución normal, también conocida como distribución gaussiana, es una de las distribuciones de probabilidad más importantes en estadísticas y probabilidad. Se caracteriza por tener una forma de campana simétrica y se utiliza ampliamente en análisis estadísticos y modelado de datos debido a su presencia en muchos fenómenos naturales y sociales.
Importar NumPy y Matplotlib
Antes de comenzar, asegúrate de tener NumPy y Matplotlib instalados. Puedes instalarlos utilizando pip si aún no lo has hecho:
pip install numpy matplotlib
Ahora, importemos estas bibliotecas en nuestro código:
import numpy as np import matplotlib.pyplot as plt
Generar Datos de Distribución Normal
Para generar datos de una distribución normal, utilizamos la función numpy.random.normal(). Esta función toma tres argumentos principales: la media (mu), la desviación estándar (sigma) y el número de datos que deseamos generar.
# Parámetros de la distribución normal mu = 0 # Media sigma = 1 # Desviación estándar num_datos = 1000 # Número de datos a generar # Generar datos de distribución normal datos_normal = np.random.normal(mu, sigma, num_datos)
Visualizar la Distribución Normal
La mejor manera de comprender una distribución es visualizarla. Utilizaremos Matplotlib para crear un histograma y una gráfica de densidad de probabilidad (PDF) de nuestros datos de distribución normal.
# Configurar título y etiquetas plt.title('Distribución Normal') plt.xlabel('Valores') plt.ylabel('Densidad de Probabilidad') # Mostrar leyenda plt.legend() # Mostrar la gráfica plt.show()
Interpretar la Visualización
En la visualización resultante, notarás que el histograma muestra la distribución de los datos generados, mientras que la curva negra representa la Función de Densidad de Probabilidad (PDF) de la distribución normal. La PDF es una representación suave de cómo se distribuyen los datos.
Puedes experimentar con diferentes valores de media (mu) y desviación estándar (sigma) para ver cómo afectan la forma de la distribución.