Распределение Пуассона — это дискретное распределение случайной величины, которое описывает число событий, происходящих за фиксированный интервал времени или пространства, если события происходят независимо и с постоянной средней интенсивностью.

Формально:

P(X = k) = (λ^k * e^(-λ)) / k!

где:
k = 0, 1, 2, … — количество событий
λ > 0 — среднее число событий за интервал (математическое ожидание и дисперсия равны λ)
e ≈ 2.71828 — основание натурального логарифма

Свойства:

  1. Дискретность: случайная величина принимает только неотрицательные целые значения.
  2. Однопараметричность: всё распределение определяется λ.
  3. Математическое ожидание и дисперсия равны λ:
E[X] = λ, Var(X) = λ

Примеры применения:

– число звонков в колл-центр за час
– количество ошибок на странице кода
– число клиентов, пришедших в магазин за фиксированное время
– редкие события в больших системах

Генерация в NumPy:

import numpy as np
 
lambda_ = 3
samples = np.random.poisson(lam=lambda_, size=10)
print(samples)

Интерпретация:
– если λ = 3, то в среднем за интервал будет происходить 3 события
– конкретная выборка может содержать 0, 1, 2, 3, … событий

Особенности:

– подходит для редких, редких и независимых событий
– при больших λ распределение Пуассона приближается к нормальному (N(λ, λ))
– одно из фундаментальных распределений в статистике и теории вероятностей

Коротко:
распределение Пуассона моделирует количество редких независимых событий за фиксированный интервал и полностью задаётся средним числом событий λ.