Линейная модель — это модель, которая описывает зависимость целевой переменной (y) от признаков x_1, x_2, …, x_p как линейную комбинацию признаков:
где:
- — коэффициенты модели (веса)
- — смещение (bias, intercept)
Линейная регрессия — частный случай линейной модели, используемый для прогноза непрерывной целевой переменной.
Математически:
- — матрица признаков
(n_samples, n_features) - — вектор весов
(n_features,) - — предсказания модели
(n_samples,)
Принцип работы:
- На обучающей выборке подбираются веса (w) и смещение (b), чтобы минимизировать функцию потерь.
- Обычно используют среднеквадратичную ошибку (MSE):
Особенности линейной модели:
- Простая и интерпретируемая
- Признаки должны быть сравнимы по масштабу (стандартизация улучшает обучение)
- Чувствительна к коррелированным признакам
- Работает лучше, когда зависимость целевой переменной от признаков почти линейная
Пример в Python:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X, y) # X — признаки, y — целевая переменная
y_pred = model.predict(X)Коротко:
линейная модель выражает зависимость целевой переменной как линейную комбинацию признаков, а линейная регрессия использует это для прогноза непрерывных значений.