Введение
Учащиеся познакомятся с основами машинного обучения, охватывающими как теоретические аспекты, так и практическое применение алгоритмов для анализа данных, и получат знания о различных типах обучения для реализации на практике.
Начало формы
Задача этого курса
Обучение самостоятельному разработыванию планов решения задач, формулировке и проверке гипотез, анализу результатов и их представлению руководству.
Изучение методов чтения данных в различных форматах с помощью Python и SQL, написание запросов к API, а также приемы получения, очистки и сохранения данных.
Проведение разведочного анализа данных и использование Excel для аналитических задач. Освоение визуализации данных в Power BI и программирования на Python и SQL.
Знакомство с процессами работы с моделями данных, включая сбор данных, построение моделей, их валидацию и мониторинг результатов.
Изучение алгоритмов машинного обучения как с учителем, так и без него. Практика в решении задач регрессии, классификации и кластеризации. Создание первых моделей машинного обучения.
Навыки создания репозиториев и управления версиями кода, отслеживание изменений и использование инструментов для совместной работы над проектами.
Целевая аудитория
Этот курс нацелен на начинающих аналитиков данных, IT-специалистов и студентов технических специальностей, желающих освоить анализ данных, программирование, машинное обучение и управление проектами в сфере IT. Подходит для тех, кто стремится работать с большими объемами данных и использовать современные инструменты для их анализа и визуализации.
Онлайн-обучение | Обучение в классе |
|
|
|
|
|
|
|
|
|
|
|
|
Месяц 1 |
Введение в курс. Основы NumPy |
|
Неделя 1 |
Установка Anaconda, Python, Jupyter Notebook Настройка среды разработки Этапы работ по машинному обучению |
|
Неделя 2-3 |
Основы машинного обучения Линейная алгебра для машинного обучения Подготовка данных для машинного обучения Задача регрессии и линейная регрессия Классификация и логистическая регрессия Метрики бизнеса Бутстреп в машинном обучении Сбор данных |
|
Неделя 4 |
Обзор раздела про NumPy Массивы NumPy Индексация и выбор данных из массивов NumPy Операции в NumPy |
|
Месяц 2 |
Базовый SQL |
|
Неделя 5-6 |
Базы данных Срезы данных Группировка и сортировка Связи и объединения таблиц |
|
Неделя 7-8 |
Подзапросы Схемы данных PySpark Распределённые системы. Структуры данных в PySpark SQL-запросы в PySpark |
|
Месяц 3 |
Pandas |
|
Неделя 9-10 |
Выборка данных по условию (Conditional Filtering) Полезные методы - Apply для одной колонки Отсутствующие данные (missing data) – Обзор Отсутствующие данные (missing data) - Операции в Pandas Агрегация данных GROUP BY - Часть 1 Агрегация данных GROUP BY - Часть 2 - Мульти-индекс Объединение датафреймов – Конкатенация Объединение датафреймов - Inner Merge Объединение датафреймов - Left и Right Merge Объединение датафреймов - Outer Merge Методы Pandas для текста Методы Pandas для даты и времени |
|
Неделя 11-12 |
Input/Output в Pandas - CSV-файлы Input/Output в Pandas - HTML-таблицы Input/Output в Pandas - Excel-файлы Input/Output в Pandas - SQL базы данных Input/Output в Pandas - SQL базы данных Сводные таблица в Pandas Проверочные упражнения по Pandas |
|
Месяц 4 |
Matplotlib |
|
Неделя 13-14 |
Обзор раздела про Matplotlib Основы Matplotlib Объект Figure - принципы работы Объект Figure - код в Python |
|
Неделя 15-16 |
Объект Figure – параметры Стилизация Matplotlib: легенды Стилизация Matplotlib: цвета и стили Дополнительные материалы по Matplotlib |
|
Месяц 5 |
Seaborn |
|
Неделя 17-18 |
Обзор раздела про Seaborn Scatterplots - Графики рассеяния (диаграммы рассеяния) Distribution Plots - Часть 1 - Типы графиков Distribution Plots - Часть 2 - Код в Python Categorical Plots - Статистики по категориям - Типы графиков Categorical Plots - Статистики по категориям - Код в Python |
|
Неделя 19-20 Неделя 21 |
Categorical Plots - Статистики по категориям - Код в Python Categorical Plots - Распределения по категориям - Типы графиков Categorical Plots - Распределения по категориям - Код в Python Графики сравнения - Типы графиков Графики сравнения - Код в Python Seaborn Grid Матричные графики |
|
Месяц 6 |
Машинное обучение для текстов и временные ряды |
|
Неделя 22-23 |
Векторизация слов Лемматизация. Регулярные выражения. Векторизация слова. TF-ID. Языковые представления Эмбединги. Word2vec. BERT. |
|
Неделя 24-26 |
Временные ряды Анализ временных рядов Временные ряды. Ресемплирование. Скользящее среднее. Тренды и сезонность. Стационарные ряды. Разности временного ряда. Прогнозирование временных рядов Задача прогнозирования. Качество прогноза. Создание признаков. Обучение модели. |
Информация в разработке
Информация в разработке