mean(axis=0) — это операция вычисления среднего по столбцам матрицы, то есть среднего значения каждого признака.
Контекст:
– матрица данных X имеет форму (n_samples, n_features)
– признаки хранятся в столбцах
Что делает axis=0:
– агрегирование идёт вдоль строк
– каждая колонка обрабатывается независимо
– результат — вектор длины n_features
Пример:
import numpy as np
X = np.array([
[1, 10],
[3, 20],
[5, 30]
])
mu = X.mean(axis=0)Результат:
mu = [3., 20.]
Интерпретация:
– 3 — среднее первого признака
– 20 — среднее второго признака
Связь с масштабированием:
X_centered = X - X.mean(axis=0)– из каждого столбца вычитается его среднее
– каждый признак центрируется независимо
Почему именно axis=0:
– axis=0 соответствует оси объектов
– усреднение «схлопывает» объекты
– признаки остаются как независимые координаты
Для сравнения:
X.mean(axis=1)– среднее по строкам
– усреднение признаков внутри одного объекта
– редко используется при масштабировании
Коротко:
mean(axis=0) вычисляет среднее значение каждого признака (столбца), и это базовая операция для центрирования и стандартизации данных.