About this Course
1,901 recent views

100% online

Start instantly and learn at your own schedule.

Flexible deadlines

Reset deadlines in accordance to your schedule.

Intermediate Level

Approx. 21 hours to complete

Suggested: 9 hours/week...

Russian

Subtitles: Russian

Skills you will gain

Data ModelingRegression ValidationR ProgrammingLinear RegressionStatistics

100% online

Start instantly and learn at your own schedule.

Flexible deadlines

Reset deadlines in accordance to your schedule.

Intermediate Level

Approx. 21 hours to complete

Suggested: 9 hours/week...

Russian

Subtitles: Russian

Syllabus - What you will learn from this course

Week
1
3 hours to complete

Корреляционный анализ. Простая линейная регрессия

Мы начнем разговор о методах численного описания связей между количественными величинами с коэффициентов ковариации и корреляции, которые позволяют оценить силу и направление связи. Затем вы узнаете, какую дополнительную информацию о связях можно получить, построив линейную модель зависимости между величинами. Вы научитесь интерпретировать коэффициенты регрессии и узнаете, когда и как можно использовать линейные модели для предсказаний на новых данных. К концу этого модуля вы научитесь подбирать уравнение линейной модели и строить ее график с доверительной областью....
14 videos (Total 97 min), 2 readings, 1 quiz
14 videos
Пример - размер мозга и IQ8m
Взаимосвязи между явлениями8m
Ковариация и корреляция9m
Тестирование статистической значимости коэффициента корреляции4m
Корреляционный анализ в R4m
Модели как отражение взаимосвязи6m
Простая линейная регрессия9m
Метод наименьших квадратов10m
Подбор коэффициентов линейной регресии в R6m
Стандартные ошибки коэффициентов регрессии7m
Доверительные интервалы коэффициентов и доверительная зона регрессии6m
Использование регрессии для предсказаний9m
Что мы знаем и что будет дальше3m
2 readings
Обзор курса10m
Материалы: Корреляционный анализ. Простая линейная регрессия10m
Week
2
3 hours to complete

Проверка значимости и валидности линейных моделей

Построить линейную модель и записать ее уравнение - это только самое начало анализа. В этом модуле вы узнаете, как описывать результаты регрессионного анализа: как проверить статистическую значимость модели в целом или ее коэффициентов, оценить качество подгонки. У линейных моделей (вернее, у статистических тестов, которые для них используются), как у любого метода, есть свои ограничения. Вы узнаете, что это за ограничения и откуда они возникают. Графические методы диагностики, которыми мы будем пользоваться, универсальны для разных линейных моделей - больше практики поможет вам увереннее принимать решения. Разобравшись со всем этим, вы сможете написать на языке R полный скрипт для подбора, диагностики и представления результатов простой линейной регрессии....
13 videos (Total 89 min), 1 reading, 1 quiz
13 videos
Тестирование значимости коэффициентов регрессии при помощи t-теста7m
Тестирование значимости модели при помощи F критерия8m
Качество подгонки модели4m
Не стоит обольщаться. Зачем нужна диагностика моделей4m
Разновидности остатков6m
Влиятельные наблюдения и как с ними бороться8m
Линейность связи8m
Независимость наблюдений10m
Нормальное распределение остатков6m
Постоянство дисперсии остатков5m
Анализ остатков в R10m
Что мы знаем и что будет дальше3m
1 reading
Материалы: Проверка значимости и валидности линейных моделей10m
Week
3
3 hours to complete

Краткое введение в мир линейной алгебры

В этом модуле мы с вами погрузимся в самое сердце линейных моделей. Для этого вам придется изучить или вспомнить основы линейной алгебры. Мы обсудим разновидности матриц, способы их создания в R и основные операции с ними. Все это нам понадобится, чтобы разобраться, как устроена линейная регрессия изнутри. Вы узнаете, что такое модельная матрица, научитесь записывать уравнение линейной регрессии в виде матриц и находить его коэффициенты. Вы своими глазами увидите хэт-матрицу, которая позволяет получать предсказанные значения, и даже сможете ее вычислить вручную. Наконец, вы научитесь рассчитывать остаточную дисперсию, вариационно-ковариационную матрицу и использовать все это для того, чтобы строить доверительную зону регрессии. Потом эти знания помогут вам разобраться с устройством более сложных моделей: с дискретными предикторами, с другими распределениями остатков, с иным устройством вариационно-ковариационной матрицы....
11 videos (Total 81 min), 1 reading, 1 quiz
11 videos
Разновидности матриц3m
Основные действия с матрицами7m
Основы матричного умножения9m
Умножение двух матриц10m
Решение систем уравнений при помощи матриц12m
Линейная регрессия в матричном виде7m
Вычисление остатков в матричном виде5m
Строим график модели вручную6m
Доверительная зона регрессии в матричном виде10m
Что мы знаем и что будет дальше2m
1 reading
Материалы: Краткое введение в мир линейной алгебры10m
Week
4
3 hours to complete

Множественная линейная регрессия

Чаще всего связи между величинами устроены сложнее, чем это можно описать при помощи простой линейной регрессии. Множественная линейная регрессия используется, чтобы описать, как переменная-отклик зависит от нескольких предикторов. С появлением в модели множества предикторов у линейной регрессии появляется новое условие применимости - требование отсутствия мультиколлинеарности. В этом модуле вы узнаете, как можно выявить мультиколлинеарность и избежать ее. Наконец, нередко во множественных моделях переменных больше, чем это можно изобразить на плоскости, поэтому мы научим вас простым приемам, которые помогут создавать информативные графики даже в таком случае....
12 videos (Total 93 min), 1 reading, 1 quiz
12 videos
Пример - маркер рака простаты3m
Протокол анализа данных7m
Разведочный анализ в R17m
Модель множественной линейной регрессии и ее интерпретация11m
Мультиколлинеарность и другие условия применимости15m
Взаимодействия предикторов3m
Сравнение влияния отдельных предикторов7m
Качество подгонки модели множественной линейной регрессии3m
Визуализация модели: один предиктор10m
Визуализация модели: два предиктора5m
Что мы знаем и что будет дальше1m
1 reading
Материалы: Множественная линейная регрессия10m
Week
5
4 hours to complete

Сравнение линейных моделей

Множественные линейные модели подобны конструктору: более сложные модели можно разбирать на части и упрощать. Вы узнаете, как сравнение вложенных моделей при помощи частного F-теста используется при проверке значимости отдельных предикторов или их групп. Более сложные модели лучше описывают исходные данные, но избыточное усложнение опасно, т.к. такие модели начинают давать плохие предсказания на новых данных. При помощи частных F-тестов можно упрощать модели, постепенно исключая незначимые предикторы. Упрощенные модели легче использовать для интерпретации и представления результатов. Все, что вы успели узнать о линейной регрессии, вы сможете применить, выполнив проект по анализу данных, где нужно будет корректно построить оптимальную множественную линейную модель и представить ее результаты в отчете, написанном при помощи rmarkdown и knitr....
9 videos (Total 55 min), 1 reading, 2 quizzes
9 videos
Полные, уменьшенные и вложенные модели3m
Частный F-критерий6m
I и II типы сумм квадратов9m
Зачем бывает нужно упрощать модели7m
Упрощение моделей при помощи частных F-тестов6m
Диагностика финальной модели7m
Визуализация финальной модели6m
Что мы знаем и что будет дальше2m
1 reading
Материалы: Сравнение линейных моделей10m

Instructors

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

About Saint Petersburg State University

Санкт-Петербургский государственный университет (СПбГУ) — старейший вуз России, основанный в 1724 году. Университет сегодня — научный, образовательный и культурный центр мирового значения, неизменно входящий во все международные рейтинги вузов. В номинации взаимодействие с работодателями QS Graduate Employability 2018 СПбГУ занимает 20 место среди 400 ведущих вузов мира и является лучшим в России. В настоящее время СПбГУ реализует 418 образовательных программ, включающих самые современные направления подготовки и специальности. Сертификат об успешном окончании представленных онлайн-курсов дает 5 дополнительных баллов при поступлении на программы магистратуры и аспирантуры СПбГУ. St Petersburg University is the oldest university in Russia, founded in 1724. The University today is a world-class research, educational and cultural centre which is always included in all international rankings of world universities. St Petersburg University was ranked 20th in QS Graduate Employability Ranking 2018 among 400 leading universities in the world and is the best in Russia. At present, St Petersburg University offers 418 academic programmes, including the most advanced areas and fields of study. The certificate of successful completion of offered online courses gives five additional points when applying for master’s and doctoral programmes at St Petersburg University....

About the Просто о статистике (с использованием R) Specialization

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Frequently Asked Questions

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

More questions? Visit the Learner Help Center.