Квантиль — это числовая характеристика распределения, которая показывает значение, ниже которого находится определённая доля данных.
Формально, для случайной величины (X) и числа :
То есть (q) — это вероятность, а — соответствующее значение.
Примеры:
- Медиана — квантиль 0.5, половина значений меньше неё
- Первый квартиль — квантиль 0.25, 25% значений меньше
- Третий квартиль — квантиль 0.75, 75% значений меньше
Использование в NumPy:
import numpy as np
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
median = np.quantile(data, 0.5) # 5
q1 = np.quantile(data, 0.25) # 3
q3 = np.quantile(data, 0.75) # 7Зачем нужны квантильные характеристики:
- Описывают распределение без предположений о форме
- Устойчивы к выбросам (в отличие от среднего)
- Позволяют строить коробчатые диаграммы (boxplot)
- Помогают оценить разброс, асимметрию, экстремальные значения
Коротко:
квантиль — это значение, которое делит распределение таким образом, что заданная доля данных находится ниже него; медиана и квартиль — частные случаи.