Chevron Left
Back to Введение в машинное обучение

Введение в машинное обучение, National Research University Higher School of Economics

4.6
1,711 ratings
331 reviews

About this Course

Не так давно получил распространение термин «большие данные», обозначивший новую прикладную область — поиск способов автоматического быстрого анализа огромных объёмов разнородной информации. Наука о больших данных ещё только оформляется, но уже сейчас она очень востребована — и в будущем будет востребована только больше. С её помощью можно решать невероятные задачи: оценивать состояние печени по кардиограмме, предсказывать зарплату по описанию вакансии, предлагать пользователю музыку на основании его анкеты в интернете. Большими данными может оказаться что угодно: результаты научных экспериментов, логи банковских транзакций, метеорологические наблюдения, профили в социальных сетях — словом, всё, что может быть полезно проанализировать. Самым перспективным подходом к анализу больших данных считается применение машинного обучения — набора методов, благодаря которым компьютер может находить в массивах изначально неизвестные взаимосвязи и закономерности. На факультете компьютерных наук ВШЭ и в Школе анализа данных есть люди, активно использующие машинное обучение и разрабатывающие новые подходы к нему. Именно они — преподаватели этого курса. Вы изучите основные типы задач, решаемых с помощью машинного обучения — в основном речь пойдёт о классификации, регрессии и кластеризации. Узнаете об основных методах машинного обучения и их особенностях, научитесь оценивать качество моделей — и решать, подходит ли модель для решения конкретной задачи. Наконец, познакомитесь с современными библиотеками, в которых реализованы обсуждаемые модели и методы оценки их качества. Для работы мы будем использовать реальные данные из реальных задач. Краткая программа курса: Неделя 1. Введение. Примеры задач. Логические методы: решающие деревья и решающие леса. Неделя 2. Метрические методы классификации. Линейные методы, стохастический градиент. Неделя 3. Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации. Неделя 4. Линейная регрессия. Понижение размерности, метод главных компонент. Неделя 5. Композиции алгоритмов, градиентный бустинг. Нейронные сети. Неделя 6. Кластеризация и визуализация. Частичное обучение. Неделя 7. Прикладные задачи анализа данных: постановки и методы решения. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах. Для выполнения практических заданий потребуются базовые навыки программирования. Очень желательно знать Python. Задания рассчитаны на использование этого языка и его библиотек numpy, pandas и scikit-learn. Чтобы успешно завершить курс, нужно набрать проходную сумму баллов за тесты и практические задания, а также выполнить финальный проект, посвящённый решению прикладной задачи анализа данных. Мы уверены, что этот курс будет полезен каждому, кто хочет постичь искусство предсказательного моделирования и освоить интеллектуальный анализ данных....
Filter by:

316 Reviews

By Sergey Berezhnoy

Dec 06, 2018

Нет возможности поставить 4.5, поэтому ставлю 5.

Плюсы:

+ даётся много математики за происходящим

+ курс предполагает достаточно объёмные имеющиеся знания (не тратится время на объяснения азов)

+ рассмотрено много методов

+ материалы курса объяснены просто и доходчиво

+ даётся много практических рекомендаций или замечаний

+ субъективный плюс: заставил много гуглить и разбираться с API

Минус один, субъективный: практические задания сильно оторваны от материалов лекций. В видео рассказывается о множестве методов и внутренней логике их работы, практическое задание сводится к вызову библиотечных методов для одного метода. Только в одном задании пришлось имплементировать градиентный спуск руками, остальные задания (кроме финального) сводились к минимальной пред-обработке данных и вызову методов API.

Финальное задание крутое. Ещё понравилась возможность посмотреть на решения однокурсников и кое-чему научиться.

Мои исходные данные: подзабытые фрагментарные знания математики из университета, многолетний опыт программирования (но не на питоне), полное незнание методов машинного обучения. Мне курс очень хорошо зашёл, рекомендую.

By Anton Kasenkov

Nov 26, 2018

для начала - очень неплохой курс, рекомендую

By Федоров Павел Андреевич

Nov 25, 2018

Неплохой курс, но теория не сильно соотносится с практикой. Не понимаю зачем было во 'введение' впихивать так много математики, которая только запутает новичка. Практические задачки интересные и не сложные, если знаком с Pandas и NumPy.

By Pavel Bulachkin

Nov 20, 2018

Memorable

Everything is perfect

By Sergey Yanzin

Nov 19, 2018

Очень хороший курс для стартового уровня. По окончании курса обретаемого уровня хватает для участия в некоторых соревнованиях Kaggle. Хорошие преподаватели, спокойный темп - я успевал за выходные. Рекомендую!

By Ekaterina Avdeeva

Nov 13, 2018

В курсе много внимания уделяется теории, лекции мне понравились. Видно, что преподавателям интересен предмет и что они хорошо в нём разбираются. Теория опирается на математический анализ, линейную алгебру, теорию вероятностей и другие разделы вузовской математики, так что этот курс для тех, кто довольно много изучал математику в университете.

Мне кажется, перед прохождения этого круса нужно познакомиться с алгоритмами машинного обучения на более поверхностном уровне, на каких-то частных примерах, потому что здесь сразу даются концепции в очень общем виде и сразу может быть непонятно - это вообще как и зачем используется. Программирование практически полностью оставлено на самостоятельное изучение, так что перед началом курса лучше познакомиться с библиотеками для анализа данных на используемом языке программирования (например, для Python это pandas, sklearn и тд), иначе может быть очень тяжело.

То есть этот курс хоть и "введение", но не совсем для новичков.

By Идрисов Руслан Рафаэлевич

Oct 29, 2018

Всё очень понравилось, много практических задач, охватывающих различные ситуации в машинном обучении, где какой классификатор применять, какие бывают признаки, как с ними работать и мн. др. Перед курсом советую подтянуть линейную алгебру, чтобы не ставить постоянно на паузу лекцию и не гуглить. Теория в курсе мощная.

By Buzikov Maxim

Oct 20, 2018

Отличный вводный курс. Вполне можно пройти за 2 недели. Интересный финальный проект.

By Stepan TOLKACHEV

Oct 20, 2018

Курс познакомил меня с основами машинного обучения. Видеолекции, правда, сильно ужаты. Иногда приходится по несколько раз пересматривать. Из-за этого желательно ознакомится параллельно с другими курсами (например с этим https://yandexdataschool.ru/edu-process/courses/machine-learning#item-1). Несмотря на то, что Питон я начал изучать здесь, то оценки времени выполнения достаточно адекватные (больше заданного времени у меня ушло на выполнение первого задания и итогового).

By Sander Tedesco

Oct 16, 2018

Курс выпустили и бросили.

Лекции идут в режиме "галопом по Европам".

Основной "преподаватель" экает каждые две секунды.

Задачи не были адаптированы под более свежие версии sklearn (уж такую мелочь можно было и предусмотреть), которые выдают гораздо более качественные результаты (в одной задаче улучшение качества выборки на старом sklearn в ответе в 4 раза хуже, чем в моем решении на свежей версии пакета). Так как необходимая для воспроизведения результатов версия пакета отсутствует в описании курса - это большой минус.

Из плюсов - качественная практика, задания плавно нарастают по сложности и супер-сложных моментов нет.