mean(axis=0) — это операция вычисления среднего по столбцам матрицы, то есть среднего значения каждого признака.

Контекст:

– матрица данных X имеет форму (n_samples, n_features)
– признаки хранятся в столбцах

Что делает axis=0:

– агрегирование идёт вдоль строк
– каждая колонка обрабатывается независимо
– результат — вектор длины n_features

Пример:

import numpy as np
 
X = np.array([
    [1, 10],
    [3, 20],
    [5, 30]
])
 
mu = X.mean(axis=0)

Результат:

mu = [3., 20.]

Интерпретация:

3 — среднее первого признака
20 — среднее второго признака

Связь с масштабированием:

X_centered = X - X.mean(axis=0)

– из каждого столбца вычитается его среднее
– каждый признак центрируется независимо

Почему именно axis=0:

axis=0 соответствует оси объектов
– усреднение «схлопывает» объекты
– признаки остаются как независимые координаты

Для сравнения:

X.mean(axis=1)

– среднее по строкам
– усреднение признаков внутри одного объекта
– редко используется при масштабировании

Коротко:
mean(axis=0) вычисляет среднее значение каждого признака (столбца), и это базовая операция для центрирования и стандартизации данных.