About this Course
4.8
1,423 ratings
212 reviews
Обучение на размеченных данных или обучение с учителем – это наиболее распространенный класс задач машинного обучения. К нему относятся те задачи, где нужно научиться предсказывать некоторую величину для любого объекта, имея конечное число примеров. Это может быть предсказание уровня пробок на участке дороги, определение возраста пользователя по его действиям в интернете, предсказание цены, по которой будет куплена подержанная машина. В этом курсе вы научитесь формулировать и, конечно, решать такие задачи. В центре нашего внимания будут успешно применяемые на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Особый акцент мы сделаем на такой мощной технике как построение композиций, которая позволяет существенно повысить качество отдельных алгоритмов и широко используется при решении прикладных задач. В частности, мы узнаем про случайные леса и про метод градиентного бустинга. Построение предсказывающих алгоритмов — это лишь часть работы при решении задачи анализа данных. Мы разберемся и с другими этапами: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества....
Globe

100% online courses

Start instantly and learn at your own schedule.
Calendar

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Clock

Approx. 43 hours to complete

Suggested: 8 hours/week...
Comment Dots

Russian

Subtitles: Russian...

Skills you will gain

Random ForestPython ProgrammingMachine LearningSupervised Learning
Globe

100% online courses

Start instantly and learn at your own schedule.
Calendar

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Clock

Approx. 43 hours to complete

Suggested: 8 hours/week...
Comment Dots

Russian

Subtitles: Russian...

Syllabus - What you will learn from this course

Week
1
Clock
9 hours to complete

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 videos (Total 82 min), 8 readings, 8 quizzes
Video13 videos
Как устроена специализация, и зачем ее проходить3m
МФТИ1m
Знакомство с машинным обучением11m
Обучение на размеченных данных5m
Обучение без учителя5m
Признаки в машинном обучении8m
Линейные модели в задачах регрессии9m
Обучение линейной регрессии6m
Градиентный спуск для линейной регрессии7m
Стохастический градиентный спуск4m
Линейная классификация6m
Функции потерь в задачах классификации6m
Reading8 readings
Формат специализации и получение сертификата10m
Немного о Yandex10m
МФТИ10m
Forum&Chat10m
Слайды к лекциям10m
Конспект10m
Слайды к лекциям10m
Конспект10m
Quiz6 practice exercises
Основные термины в машинном обучении6m
Типы задач в машинном обучении6m
Машинное обучение: задачи и признаки12m
Линейная регрессия4m
Градиентный спуск4m
Линейные модели8m
Week
2
Clock
9 hours to complete

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 videos (Total 126 min), 9 readings, 8 quizzes
Video14 videos
Регуляризация7m
Оценивание качества алгоритмов7m
Сравнение алгоритмов и выбор гиперпараметров4m
Метрики качества в задачах регрессии10m
Метрики качества классификации4m
Точность и полнота8m
Объединение точности и полноты5m
Качество оценок принадлежности классу12m
Встроенные датасеты. Sklearn.datasets15m
Кросс-валидация. Sklearn.cross_validation9m
Линейные модели. Sklearn.linear_model. Классификация10m
Линейные модели. Sklearn.linear_model. Регрессия7m
Метрики качества. Sklearn.metrics13m
Reading9 readings
Слайды к лекциям10m
Конспект10m
Слайды к лекциям10m
Конспект10m
Встроенные датасеты. Sklearn.datasets (ipython notebook)10m
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10m
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10m
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10m
Метрики качества. Sklearn.metrics (ipython notebook)10m
Quiz6 practice exercises
Проблема переобучения6m
Проблема переобучения и борьба с ней10m
Как измерить качество алгоритма?6m
Метрики качества10m
Встроенные датасеты и кросс-валидация8m
Введение в scikit-learn10m
Week
3
Clock
7 hours to complete

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 videos (Total 97 min), 8 readings, 7 quizzes
Video14 videos
Метод максимального правдоподобия4m
Регрессия как максимизация правдоподобия2m
Регрессия как оценка среднего4m
Регуляризация8m
Задача оценивания вероятностей и логистическая регрессия8m
Масштабирование признаков6m
Спрямляющие пространства5m
Работа с категориальными признаками4m
Несбалансированные данные5m
Многоклассовая классификация4m
Подбор параметров по сетке. Sklearn.grid_search9m
Задача: bike sharing demand15m
Задача: bike sharing demand. Продолжение13m
Reading8 readings
Слайды к лекциям10m
Конспект10m
Слайды к лекциям10m
Конспект10m
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10m
Задача Bike Sharing Demand (ipython notebook)10m
Задача Bike Sharing Demand. Продолжение (ipython notebook)10m
Практика Machine Learning10m
Quiz6 practice exercises
Метод максимального правдоподобия6m
Линейные модели: статистический взгляд14m
Линейные модели: подготовка признаков6m
Линейные модели: практические аспекты6m
Подбор параметров по сетке6m
Анализ данных в scikit-learn12m
Week
4
Clock
10 hours to complete

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 videos (Total 114 min), 10 readings, 8 quizzes
Video17 videos
Обучение решающих деревьев6m
Критерии информативности7m
Критерии останова и стрижка деревьев4m
Решающие деревья и категориальные признаки8m
Решающие деревья в sklearn10m
Композиции деревьев6m
Смещение и разброс9m
Случайные леса6m
Трюки со случайными лесами4m
Случайные леса в sklearn7m
Композиции простых алгоритмов5m
Градиентный бустинг7m
Борьба с переобучением в градиентном бустинге6m
Градиентный бустинг для регрессии и классификации4m
Градиентный бустинг над решающими деревьями5m
Градиентный бустинг в XGBoost5m
Reading10 readings
Решающие деревья в sklearn (ipython notebook)10m
Слайды к лекциям10m
Конспект10m
Случайные леса в sklearn (ipython notebook)10m
Слайды к лекциям10m
Конспект10m
XGBoost10m
Градиентный бустинг в XGBoost (ipython notebook)10m
Слайды к лекциям10m
Конспект10m
Quiz6 practice exercises
Построение решающих деревьев8m
Решающие деревья14m
Бэггинг6m
Композиции и случайные леса8m
Обучение композиций и градиентный бустинг4m
Градиентный бустинг: обучение и практические аспекты8m
4.8
Direction Signs

71%

started a new career after completing these courses
Briefcase

83%

got a tangible career benefit from this course
Money

33%

got a pay increase or promotion

Top Reviews

By ZAJul 21st 2017

Курс просто фантастика. Отличное преподавание, много нового. Столько что еще переваривать и переваривать. Немного сжата последняя неделя и на нейронные сети нужно больше времени. Спасибо.

By ADApr 29th 2018

Хороший курс, много времени уделено объяснению теории. На мой взгляд - лучше параллельно читать с "The elements of statistical learning", там некоторые моменты подробнее объясняются.

Instructors

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

About Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

About Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

About the Машинное обучение и анализ данных Specialization

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Frequently Asked Questions

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

More questions? Visit the Learner Help Center.