Квантиль — это числовая характеристика распределения, которая показывает значение, ниже которого находится определённая доля данных.

Формально, для случайной величины (X) и числа :

То есть (q) — это вероятность, а — соответствующее значение.

Примеры:

  • Медиана — квантиль 0.5, половина значений меньше неё
  • Первый квартиль — квантиль 0.25, 25% значений меньше
  • Третий квартиль — квантиль 0.75, 75% значений меньше

Использование в NumPy:

import numpy as np
 
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
 
median = np.quantile(data, 0.5)   # 5
q1 = np.quantile(data, 0.25)     # 3
q3 = np.quantile(data, 0.75)     # 7

Зачем нужны квантильные характеристики:

  • Описывают распределение без предположений о форме
  • Устойчивы к выбросам (в отличие от среднего)
  • Позволяют строить коробчатые диаграммы (boxplot)
  • Помогают оценить разброс, асимметрию, экстремальные значения

Коротко:
квантиль — это значение, которое делит распределение таким образом, что заданная доля данных находится ниже него; медиана и квартиль — частные случаи.