Tutorial sobre Distribución Normal (Gaussiana) con NumPy

En este tutorial, aprenderemos cómo trabajar con la distribución normal utilizando NumPy y cómo visualizarla para comprender mejor sus propiedades.

La distribución normal, también conocida como distribución gaussiana, es una de las distribuciones de probabilidad más importantes en estadísticas y probabilidad. Se caracteriza por tener una forma de campana simétrica y se utiliza ampliamente en análisis estadísticos y modelado de datos debido a su presencia en muchos fenómenos naturales y sociales.


Importar NumPy y Matplotlib

Antes de comenzar, asegúrate de tener NumPy y Matplotlib instalados. Puedes instalarlos utilizando pip si aún no lo has hecho:

pip install numpy matplotlib

Ahora, importemos estas bibliotecas en nuestro código:

import numpy as np
import matplotlib.pyplot as plt

Generar Datos de Distribución Normal

Para generar datos de una distribución normal, utilizamos la función numpy.random.normal(). Esta función toma tres argumentos principales: la media (mu), la desviación estándar (sigma) y el número de datos que deseamos generar.

# Parámetros de la distribución normal
mu = 0    # Media
sigma = 1  # Desviación estándar
num_datos = 1000  # Número de datos a generar

# Generar datos de distribución normal
datos_normal = np.random.normal(mu, sigma, num_datos)

Visualizar la Distribución Normal

La mejor manera de comprender una distribución es visualizarla. Utilizaremos Matplotlib para crear un histograma y una gráfica de densidad de probabilidad (PDF) de nuestros datos de distribución normal.

# Configurar título y etiquetas
plt.title('Distribución Normal')
plt.xlabel('Valores')
plt.ylabel('Densidad de Probabilidad')

# Mostrar leyenda
plt.legend()

# Mostrar la gráfica
plt.show()

Interpretar la Visualización

En la visualización resultante, notarás que el histograma muestra la distribución de los datos generados, mientras que la curva negra representa la Función de Densidad de Probabilidad (PDF) de la distribución normal. La PDF es una representación suave de cómo se distribuyen los datos.

Puedes experimentar con diferentes valores de media (mu) y desviación estándar (sigma) para ver cómo afectan la forma de la distribución.