Эмпирическое распределение — это распределение, которое строится на основе фактических наблюдаемых данных. Оно показывает, как часто встречаются различные значения в выборке, без предположений о теоретической форме распределения.

Главные моменты:

  1. Связь с выборкой
  • Эмпирическое распределение формируется из конкретных наблюдений:
    X1​,X2​,…,Xn​
  • Для каждого значения или интервала вычисляется относительная частота (доля элементов).
  1. Отличие от теоретического распределения
  • Теоретическое распределение описывает случайную величину через формулы (например, нормальное с μ и σ).
  • Эмпирическое — построено на реальных данных, отражает выборочные свойства, включая выбросы и аномалии.
  1. Связь с гистограммой
  • Гистограмма — это визуальная форма эмпирического распределения, где столбцы показывают частоты значений в интервалах.

Пример на Python с NumPy:

import numpy as np
 
data = np.array([1,2,2,3,3,3,4,4,5])
 
# уникальные значения и их частоты
values, counts = np.unique(data, return_counts=True)
relative_freq = counts / counts.sum()
 
print(values)          # [1 2 3 4 5]
print(relative_freq)   # [0.111 0.222 0.333 0.222 0.111]

Особенности:

  • Можно использовать для любых данных — дискретных или непрерывных (с разбиением на интервалы).
  • Позволяет оценивать свойства выборки (среднее, дисперсию, асимметрию).
  • Базируется только на наблюдениях, поэтому может отличаться от теоретического распределения.

Коротко:
эмпирическое распределение — это распределение случайной величины, построенное на реальных данных, показывающее фактические частоты или вероятности наблюдаемых значений.