Введение
На курсе Вы познакомитесь с основными направлениями Data Science. Узнаете, какие задачи решают дата-аналитики, дата-инженеры и специалисты по машинному обучению.
Задача этого курса
Целевая аудитория
Молодые, мотивированные на обучение, мужчины и женщины 18-45 лет, преимущественно имеют высшее или неоконченное высшее образование и ставят перед собой цель получить новые знания для смены вида деятельности или работы и зарабатывать больше. Уже имеют некоторый опыт работы, работают по найму или фрилансерами.
Онлайн-обучение | Обучение в классе |
|
|
|
|
|
|
|
|
|
|
|
|
Месяц 1 |
Введение в теорию вероятностей |
||
Неделя 1-2 |
С чего начинается работа с данными. Business understanding Научитесь общаться с заказчиками: выявлять потребности, собирать и документировать требования, проводить интервью. Data Understanding: Введение и Excel Узнаете, как работать с табличными данными, познакомитесь с базовыми аналитическими и математическими функциями программы. |
||
Неделя 3 |
Алгоритмы Подробнее узнаете о списках в Python, познакомитесь с концепцией big О, которая поможет оценивать сложность алгоритмов. Получите представление о том, как работают бинарный поиск и сортировка. А ещё — освоите несколько полезных приёмов работы со строками. |
||
Неделя 4 |
Функции Узнаете, зачем программисты помещают код в функции. Научитесь принимать параметры и возвращать значения из функций. |
||
Домашнее задание |
Отработка компетенций из теоретического блока. Выполнение тестов по темам модуля для закрепления знаний |
||
Месяц 2 |
Случайные события |
||
Неделя 5-6 |
Структуры данных Списки — не единственный способ хранить наборы данных в Python. В модуле вы узнаете о словарях, кортежах, множествах и поймете, для каких задач подходит каждая структура данных. Чтение файлов в Python и командной строке Научитесь открывать и читать файлы с помощью Python, работать в командной строке и подключать сторонние библиотеки. |
||
Неделя 7-8 |
Библиотека pandas Освоите важную для дата-сайентиста библиотеку Pandas, научитесь читать файлы в разных форматах и кодировках. Получение данных с помощью АРІ Узнаете, как получить данные от удаленного сервера при помощи АРІ- запросов, перевести их в нужный формат и сохранить результат в Pandas. Познакомитесь с Git. |
||
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
||
Месяц 3 |
Случайная величина. Дискретные распределения |
||
Неделя 9-10 |
Modeling Узнаете про основные задачи этапа моделирования в машинном обучении и аналитике. Научитесь формулировать и проверять гипотезы. Машинное обучение Узнаете, как ставится задача машинного обучения, как происходит обучение модели с учителем и без. Будете использовать древесные модели для решения задачи классификации. |
||
Неделя 11-12 |
Линейные модели и нейронные сети Построите простой линейный классификатор и логистическую регрессию, обучите модели на данных, сделаете выводы. Научитесь подгружать готовые нейронные сети и делать на них прогнозы. Метрики в аналитике Познакомитесь с классификациями метрик и научитесь правильно определять их полезность для конкретной задачи бизнеса. |
||
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
||
Месяц 4 |
Непрерывные распределения. Общие сведения. |
||
Неделя 13-16 |
Маркетинговая аналитика Узнаете, какие метрики используются в маркетинговой аналитике. Научитесь проводить анализ выручки компании, строить воронку продаж. Продуктовая аналитика Поймёте, в чём отличие метрик продукта от метрик роста, что такое когортный анализ, как он помогает объяснить динамику выручки и предсказать будущее для бизнеса. Введение в Python Поймёте, зачем вообще дата-сайентисту нужен Python. Напишете первую программу. Освоите работу с функцией print. Переменные и типы данных Узнаете, какие типы данных есть в Python, научитесь работать с переменными и оператором ввода input. |
||
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
||
Месяц 5 |
Основные виды непрерывных распределений |
||
Неделя 17-18 -19 |
Условия Изучите основы работы с оператором іг, научитесь писать последовательные и вложенные условия, упрощать сложные выражения. Циклы Познакомитесь с циклами for, while, операторами continue и pass. Узнаете, как работать с параметрами функции range(): start, stop, step. Базы данных Научитесь подключаться к базам данных и работать с ER-диаграммами. Язык запросов SQL Освоите язык запросов SQL, будете уметь фильтровать данные, объединять таблицы и выгружать данные в файл. Power BI Познакомитесь с инструментом Power BI, который позволяет использовать любые источники данных для анализа. Научитесь визуализировать данные: строить таблицы, диаграммы, гистограммы. |
||
Неделя 20 |
Data Preparation Узнаете, какие бывают виды распределений, поймёте разницу между дискретными и непрерывными переменными. Разведочный анализ данных: Data cleaning & Data Visualization Научитесь находить пропущенные значения, неинформативные данные, выявлять аномалии и выбросы при помощи визуализации на matplotlib. |
||
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
||
Месяц 6 |
Статистические тесты |
||
Неделя 21-22 |
Разведочный анализ данных: Feature Engineering Будете генерировать дополнительные признаки и делать выводы о том, какие атрибуты полезны в построении модели. Modeling: заключение Построите несложные модели машинного обучения в Azure и аналитические в Power BI. Evaluation Научитесь оценивать качество работы модели. Познакомитесь с методиками проверки результатов моделирования в аналитике и машинном обучении. |
||
Неделя 23-24 |
Алгоритмы и структуры данных. Часть 2 Освоите продвинутые структуры данных: очереди, стеки и деки. Deployment Познакомитесь с основными этапами внедрения модели — ETL, подробнее разберете понятия Big Data, Data Lake и Data Warehouse. |
||
Неделя 25-26 |
Модель API Узнаете, как развернуть проект на удалённом сервере и обернуть в API, чтобы отправлять запросы напрямую модели. Мониторинг моделей Научитесь собирать метрики моделей и строить дашборды в Grafana. Airflow Узнаете, как устроены и работают пайплайны. |
||
Домашняя работа |
Выполнение тестов по темам модуля для закрепления знаний и типовые задачи на расчет вероятностей. Задачи присылаются преподавателю на проверку |
Информация в разработке
Информация в разработке