Распределение Пуассона — это дискретное распределение случайной величины, которое описывает число событий, происходящих за фиксированный интервал времени или пространства, если события происходят независимо и с постоянной средней интенсивностью.
Формально:
P(X = k) = (λ^k * e^(-λ)) / k!
где:
– k = 0, 1, 2, … — количество событий
– λ > 0 — среднее число событий за интервал (математическое ожидание и дисперсия равны λ)
– e ≈ 2.71828 — основание натурального логарифма
Свойства:
- Дискретность: случайная величина принимает только неотрицательные целые значения.
- Однопараметричность: всё распределение определяется λ.
- Математическое ожидание и дисперсия равны λ:
E[X] = λ, Var(X) = λ
Примеры применения:
– число звонков в колл-центр за час
– количество ошибок на странице кода
– число клиентов, пришедших в магазин за фиксированное время
– редкие события в больших системах
Генерация в NumPy:
import numpy as np
lambda_ = 3
samples = np.random.poisson(lam=lambda_, size=10)
print(samples)Интерпретация:
– если λ = 3, то в среднем за интервал будет происходить 3 события
– конкретная выборка может содержать 0, 1, 2, 3, … событий
Особенности:
– подходит для редких, редких и независимых событий
– при больших λ распределение Пуассона приближается к нормальному (N(λ, λ))
– одно из фундаментальных распределений в статистике и теории вероятностей
Коротко:
распределение Пуассона моделирует количество редких независимых событий за фиксированный интервал и полностью задаётся средним числом событий λ.