Линейная модель📚

Линейная модель — это модель, которая описывает зависимость целевой переменной (y) от признаков x_1, x_2, …, x_p как линейную комбинацию признаков:

y \approx w_{1} x_{1} + w_{2} x_{2} + ... + w_{p} x_{p} + b

где:

$w_{i}$ — коэффициенты модели (веса)
$b$ — смещение (bias, intercept)

Линейная регрессия — частный случай линейной модели, используемый для прогноза непрерывной целевой переменной.

Математически:

\overset{y}{^} = Xw + b

$X$ — матрица признаков (n_samples, n_features)
$w$ — вектор весов (n_features,)
$\overset{y}{^}$ — предсказания модели (n_samples,)

Принцип работы:

На обучающей выборке подбираются веса (w) и смещение (b), чтобы минимизировать функцию потерь.
Обычно используют среднеквадратичную ошибку (MSE):

MSE = \frac{1}{n} i = 1 \sum n (y_{i} - \overset{y}{^}_{i})^{2}

Особенности линейной модели:

Простая и интерпретируемая
Признаки должны быть сравнимы по масштабу (стандартизация улучшает обучение)
Чувствительна к коррелированным признакам
Работает лучше, когда зависимость целевой переменной от признаков почти линейная

Пример в Python:

from sklearn.linear_model import LinearRegression
 
model = LinearRegression()
model.fit(X, y)        # X — признаки, y — целевая переменная
y_pred = model.predict(X)

Коротко:
линейная модель выражает зависимость целевой переменной как линейную комбинацию признаков, а линейная регрессия использует это для прогноза непрерывных значений.

База знаний

Проводник

Линейная модель

Вид графа

Обратные ссылки