Эмпирическое распределение📚

Эмпирическое распределение — это распределение, которое строится на основе фактических наблюдаемых данных. Оно показывает, как часто встречаются различные значения в выборке, без предположений о теоретической форме распределения.

Главные моменты:

Связь с выборкой

Эмпирическое распределение формируется из конкретных наблюдений:
X1,X2,…,Xn
Для каждого значения или интервала вычисляется относительная частота (доля элементов).

Отличие от теоретического распределения

Теоретическое распределение описывает случайную величину через формулы (например, нормальное с μ и σ).
Эмпирическое — построено на реальных данных, отражает выборочные свойства, включая выбросы и аномалии.

Связь с гистограммой

Гистограмма — это визуальная форма эмпирического распределения, где столбцы показывают частоты значений в интервалах.

Пример на Python с NumPy:

import numpy as np
 
data = np.array([1,2,2,3,3,3,4,4,5])
 
# уникальные значения и их частоты
values, counts = np.unique(data, return_counts=True)
relative_freq = counts / counts.sum()
 
print(values)          # [1 2 3 4 5]
print(relative_freq)   # [0.111 0.222 0.333 0.222 0.111]

Особенности:

Можно использовать для любых данных — дискретных или непрерывных (с разбиением на интервалы).
Позволяет оценивать свойства выборки (среднее, дисперсию, асимметрию).
Базируется только на наблюдениях, поэтому может отличаться от теоретического распределения.

Коротко:
эмпирическое распределение — это распределение случайной величины, построенное на реальных данных, показывающее фактические частоты или вероятности наблюдаемых значений.

База знаний

Проводник

Эмпирическое распределение

Вид графа

Обратные ссылки