Эмпирическое распределение — это распределение, которое строится на основе фактических наблюдаемых данных. Оно показывает, как часто встречаются различные значения в выборке, без предположений о теоретической форме распределения.
Главные моменты:
- Связь с выборкой
- Эмпирическое распределение формируется из конкретных наблюдений:
X1,X2,…,Xn - Для каждого значения или интервала вычисляется относительная частота (доля элементов).
- Отличие от теоретического распределения
- Теоретическое распределение описывает случайную величину через формулы (например, нормальное с μ и σ).
- Эмпирическое — построено на реальных данных, отражает выборочные свойства, включая выбросы и аномалии.
- Связь с гистограммой
- Гистограмма — это визуальная форма эмпирического распределения, где столбцы показывают частоты значений в интервалах.
Пример на Python с NumPy:
import numpy as np
data = np.array([1,2,2,3,3,3,4,4,5])
# уникальные значения и их частоты
values, counts = np.unique(data, return_counts=True)
relative_freq = counts / counts.sum()
print(values) # [1 2 3 4 5]
print(relative_freq) # [0.111 0.222 0.333 0.222 0.111]Особенности:
- Можно использовать для любых данных — дискретных или непрерывных (с разбиением на интервалы).
- Позволяет оценивать свойства выборки (среднее, дисперсию, асимметрию).
- Базируется только на наблюдениях, поэтому может отличаться от теоретического распределения.
Коротко:
эмпирическое распределение — это распределение случайной величины, построенное на реальных данных, показывающее фактические частоты или вероятности наблюдаемых значений.