Максимум выборки не распределён нормально, даже если исходные элементы имеют нормальное распределение. Причина в том, что операции над экстремальными значениями меняют распределение кардинально.
Основные моменты:
- Максимум — нелинейная функция элементов
Ни сумма, ни среднее не используются. Центральная предельная теорема действует только для **сумм или средних**, а не для экстремальных статистик.
2. Поведение хвостов определяет распределение
- Для нормального распределения хвосты убывают экспоненциально быстро
- Вероятность экстремальных значений мала, поэтому максимум сильно смещён относительно среднего
- Асимптотика при
- Нормализация среднего → нормальное распределение
- Нормализация максимума → распределение Гумбеля (тип I)
- То есть максимум «собирает» вероятности из верхнего хвоста, что даёт совсем другую форму
- Характерные особенности распределения максимума
- Ассиметрия: максимум не симметричен, чаще ближе к верхней границе
- Тяжёлый хвост: вероятность больших значений выше, чем для нормали
- Сдвиг с ростом n: среднее максимума растёт с размером выборки
Пример на Python:
import numpy as np
samples = np.random.normal(0, 1, size=(10000, 1000))
maxima = samples.max(axis=1) # максимум в каждой строке
import matplotlib.pyplot as plt
plt.hist(maxima, bins=50, density=True)
plt.show()– Гистограмма ассиметричная, пик сдвинут вправо
– Форма не похожа на нормальное распределение
Коротко:
максимум не нормален, потому что он зависит только от крайних значений выборки, а центральная предельная теорема применима только к суммам или средним, а не к экстремальным статистикам.