Percentiles en Python

En estadísticas y análisis de datos, los percentiles son medidas que dividen una distribución de datos en 100 partes iguales. Cada percentil representa un valor por debajo del cual se encuentra un cierto porcentaje de los datos. Por ejemplo, el percentil 50 (también conocido como la mediana) divide los datos en dos partes iguales, donde el 50% de los datos están por debajo del valor del percentil 50 y el otro 50% están por encima.

Por ejemplo, digamos que tenemos una matriz de las edades de todas las personas que viven en una calle.

Edades = [5, 31, 43, 48, 50, 41, 7, 11, 15, 39, 80, 82, 32, 2, 8, 
6, 25, 36, 27, 61, 41, 31]

¿Cuál es el percentil 75? La respuesta es 43, lo que significa que el 75% de las personas tienen 43 años o menos.

En Python, hay varias formas de calcular percentiles utilizando diferentes bibliotecas, como NumPy y pandas. Aquí hay ejemplos de cómo calcular percentiles usando ambas bibliotecas:


Percentiles con NumPy

El módulo NumPy tiene un método para encontrar el percentil especificado. Use el método NumPy percentile() para encontrar los percentiles:

import numpy as np

data = [23, 45, 56, 12, 67, 34, 55, 21]

# Calcular el percentil 25
percentile_25 = np.percentile(data, 25)

# Calcular el percentil 50 (mediana)
percentile_50 = np.percentile(data, 50)

# Calcular el percentil 75
percentile_75 = np.percentile(data, 75)

print("Percentil 25:", percentile_25)
print("Percentil 50 (Mediana):", percentile_50)
print("Percentil 75:", percentile_75)

Percentiles con pandas


import pandas as pd

data = [23, 45, 56, 12, 67, 34, 55, 21]

# Crear un DataFrame con los datos
df = pd.DataFrame(data, columns=['valor'])

# Calcular el percentil 25
percentile_25 = df['valor'].quantile(0.25)

# Calcular el percentil 50 (mediana)
percentile_50 = df['valor'].quantile(0.50)

# Calcular el percentil 75
percentile_75 = df['valor'].quantile(0.75)

print("Percentil 25:", percentile_25)
print("Percentil 50 (Mediana):", percentile_50)
print("Percentil 75:", percentile_75)

Ambos ejemplos proporcionan resultados similares, y puedes elegir la biblioteca que mejor se adapte a tus necesidades y preferencias. Calcular percentiles es útil para comprender la distribución de tus datos y analizar la dispersión y concentración de valores en un conjunto de datos.