1. NumPy как основа
1.1 Теория
- Что такое numpy.ndarray
- Отличия ndarray от Python list
- Понятие формы массива (shape)
- Размерность массива (ndim)
- Количество элементов (size)
- Векторизация как концепция
- Broadcasting: идея и назначение
1.2 Код
- Создание массива через np.array
- Получение shape, ndim, size
- Арифметика над массивами без циклов
- Пример broadcasting при вычитании вектора из матрицы
2. Создание массивов и матриц
2.1 Теория
2.2 Код
3. Индексация и оси
3.1 Теория
- Индексация элементов массива
- Срезы массивов
- Понятие осей (axis)
- Что означает axis=0
- Что означает axis=1
3.2 Код
- Срезы от индекса 1 до предпоследнего
- Работа с подматрицами из двумерного массива, исключая первую и последнюю строки и столбцы
- Агрегации с sum(axis=…)
- Агрегации с mean(axis=…)
- Агрегации с std(axis=…)
4. Векторизация и булевы маски
4.1 Теория
4.2 Код
5. Случайные величины и распределения
5.1 Теория
- Случайная величина
- Нормальное распределение
- Параметры μ и σ
- Распределение Пуассона
- Параметр λ
- Дискретные и непрерывные распределения
5.2 Код
6. Гистограммы
6.1 Теория
- Что такое гистограмма
- Эмпирическое распределение
- Влияние числа bins
- Переглаживание и шум
- Квантиль как характеристика распределения
6.2 Код
7. Матрица Вигнера
7.1 Теория
- Симметричная матрица
- Зачем используется X + X.T
- Нормировка на sqrt(2n)
- Поведение статистик при росте n
7.2 Код
8. Экстремальные статистики
8.1 Теория
- Максимум как статистика
- Экстремальные распределения
- Почему максимум не нормален
- Зависимость максимума от размера выборки
- Квантиль как устойчивая мера
8.2 Код
9. Частотные представления данных
9.1 Теория
9.2 Код
10. Масштабирование признаков
10.1 Теория
- Признак как столбец матрицы
- Стандартизация (Z-score)
- Зачем масштабировать признаки
- Деление на ноль и числовая стабильность
10.2 Код
11. Wine dataset
11.1 Теория
11.2 Код
12. Линейная регрессия
12.1 Теория
- Линейная модель
- Метод наименьших квадратов
- Интерпретация a1
- Интерпретация a0
- Ограничения линейной модели
12.2 Код
- Средние значения
- Формула коэффициента наклона
- Формула свободного члена
- Реализация без
sklearn
13. Diabetes dataset
13.1 Теория
- Целевая переменная
- Признак BMI
- Связь признака и отклика
- Ограничения одномерной модели
13.2 Код
load_diabetes- Выбор признака по имени
- Scatter + линия регрессии
- Сортировка
xдля визуализации