Distribución Binomial

La distribución binomial es una distribución estadística que se caracteriza por su enfoque en eventos discretos o categóricos. Este tipo de distribución se utiliza para modelar situaciones en las que el resultado es binario o categórico, como lanzar una moneda, donde solo hay dos resultados posibles: cara o cruz.

La distribución binomial se rige por tres parámetros clave:

  • n - Número de Ensayos: Representa el número total de intentos o ensayos realizados. Por ejemplo, si estamos lanzando una moneda 10 veces, n sería igual a 10.
  • p - Probabilidad de Ocurrencia: Este parámetro denota la probabilidad de que ocurra un evento específico en cada intento. Siguiendo con el ejemplo de lanzar una moneda justa, la probabilidad de que salga cara o cruz en cada lanzamiento es del 50%, por lo que p sería 0.5.
  • Tamaño de la Muestra: Este se refiere a la forma en que se devuelve la información. Puede ser una sola puntuación que represente el recuento total de éxitos en los ensayos, o puede ser una matriz que detalle los resultados de cada ensayo individualmente.

La característica distintiva de la distribución binomial es su naturaleza discreta. Esto significa que se utiliza para describir eventos que tienen un conjunto específico de resultados posibles y no admiten valores intermedios. En otras palabras, es ideal para situaciones en las que los resultados se pueden clasificar claramente en categorías, como "éxito" o "fracaso", "positivo" o "negativo", o "aprobado" o "reprobado".

En contraste, las distribuciones continuas, como la distribución normal, se utilizan para describir eventos en los que los resultados pueden tomar una amplia gama de valores y no están limitados a categorías discretas. Por ejemplo, la altura de las personas es una variable continua, ya que puede variar en incrementos infinitesimales, como 180 cm, 180.1 cm, 180.11 cm, y así sucesivamente.


Visualización de Distribución Binomial

Una forma común de visualizar la distribución binomial es a través de un histograma o un gráfico de barras que muestra la probabilidad de obtener diferentes cantidades de éxitos en los ensayos. Aquí hay un ejemplo práctico utilizando NumPy y Matplotlib:

import numpy as np
from scipy.stats import binom
import matplotlib.pyplot as plt

# Parámetros de la distribución binomial
n = 10  # Número de ensayos
p = 0.3  # Probabilidad de éxito en un solo ensayo

# Calcular la probabilidad de exactamente k éxitos
k = 3
probabilidad_k = binom.pmf(k, n, p)

print(f'La probabilidad de {k} éxitos en {n} ensayos es {probabilidad_k:.4f}')

# Crear un gráfico de barras que muestra la probabilidad de k éxitos
k_valores = np.arange(0, n + 1)
probabilidades = binom.pmf(k_valores, n, p)

plt.bar(k_valores, probabilidades)
plt.xlabel('Número de Éxitos')
plt.ylabel('Probabilidad')
plt.title('Distribución Binomial')
plt.show()

Este código genera 1000 muestras de una distribución binomial con n=10 y p=0.3, y luego crea un histograma para visualizar la distribución de probabilidad.

Resultado:

La probabilidad de 3 éxitos en 10 ensayos es 0.2668

Diferencia entre Distribución Normal y Binomial

La principal diferencia entre la distribución normal y la distribución binomial radica en la naturaleza de los datos que modelan:

  • Distribución Normal (Gaussiana): Modela datos continuos y es apropiada cuando se trabaja con variables aleatorias que pueden tomar cualquier valor real. Tiene una forma de campana simétrica y está completamente definida por su media (μ) y su desviación estándar (σ).
  • Distribución Binomial: Modela datos discretos y se utiliza cuando se están realizando un número fijo de ensayos independientes con dos resultados posibles (éxito o fracaso) en cada ensayo. Está completamente definida por el número de ensayos (n) y la probabilidad de éxito en un solo ensayo (p).

En resumen, la distribución normal es adecuada para variables continuas, mientras que la distribución binomial se utiliza para contar el número de éxitos en un número fijo de ensayos discretos. Ambas distribuciones son fundamentales en estadísticas y tienen aplicaciones en una amplia gama de campos.


visualizar los datos de la distribución binomial en Python

Para visualizar los datos de una distribución binomial en Python, puedes utilizar bibliotecas como Matplotlib. Aquí tienes un ejemplo de cómo hacerlo:

import numpy as np
from scipy.stats import binom
import matplotlib.pyplot as plt

# Parámetros de la distribución binomial
n = 10  # Número de ensayos
p = 0.3  # Probabilidad de éxito en un solo ensayo

# Crear un conjunto de valores k
k_valores = np.arange(0, n + 1)

# Calcular las probabilidades correspondientes a cada valor de k
probabilidades = binom.pmf(k_valores, n, p)

# Crear un gráfico de barras para visualizar la distribución
plt.bar(k_valores, probabilidades)
plt.xlabel('Número de Éxitos')
plt.ylabel('Probabilidad')
plt.title('Distribución Binomial')
plt.show()

En este código:

  • Importamos las bibliotecas necesarias: numpy para crear un conjunto de valores de k, scipy.stats para calcular las probabilidades de la distribución binomial y matplotlib.pyplot para crear el gráfico.
  • Definimos los parámetros de la distribución binomial, como el número de ensayos (n) y la probabilidad de éxito en un solo ensayo (p).
  • Creamos un conjunto de valores de k utilizando np.arange(0, n + 1), que representa el número de éxitos en la distribución.
  • Calculamos las probabilidades correspondientes a cada valor de k utilizando binom.pmf(k_valores, n, p).
  • Finalmente, creamos un gráfico de barras que muestra el número de éxitos en el eje x y la probabilidad en el eje y. Esto nos permite visualizar la distribución binomial.

Ejecutando este código, podrás ver una representación gráfica de la distribución binomial con los parámetros dados. Puedes ajustar n y p para explorar diferentes distribuciones binomiales.