0:00
[МУЗЫКА]
[МУЗЫКА] Рассмотрим
альтернативный метод сравнения двух групп по
выраженности признака, который производится в ранговых шкалах.
Разумеется, мы можем этот метод применять и на метрических шкалах,
особенно в тех случаях, когда мы не может применять t-критерий Стьюдента.
Собственно говоря, задачи, при которых используется критерий,
критерия U-Манна-Уитни, вы можете видеть сейчас на экране.
Подобный критерий, критерий U-Манна-Уитни, он значительно проще,
на самом деле, чем критерий t-Стьюдента, но имеет ряд особенностей.
В частности, одна из особенностей — это расчетная формула.
Вернее, даже две расчетные формулы.
Поскольку критерий Манна-Уитни парный, симметричный,
и он рассчитывается отдельно для каждой выборки.
Для одной группы, которую мы сравниваем,
и для второй группы — свой критерий Манна-Уитни.
Обращаю внимание на формулировку нашей статистической гипотезы.
Мы видим, что она идентична той, которую мы рассматривали в предыдущем примере,
когда говорили о t-критерии Стьюдента.
Мы только должны помнить, что при расчетах
U-критерия Манна-Уитни нам необходимо применять ранговые шкалы.
Если мы используем какие-то иные шкалы, метрические,
то нам обязательно нужно преобразовывать их.
В частности, на следующем слайде вы видите результат возможного преобразования.
Когда у нас изначально в таблице исходных данных используется метрическая шкала,
для того чтобы применять расчеты по U-критерию Манна-Уитни,
нам нужно проделать промежуточный расчет, преобразовать нашу метрическую шкалу в
ранговую, и только после этого полученную ранговую шкалу разделить в
таблице для расчетов вручную отдельно для одной группы, отдельно для другой группы.
Теперь поговорим об ограничениях применения критерия Манна-Уитни.
Эти ограничения довольно-таки необычные,
поэтому мы поговорим о них немножко подробнее.
Итак, первое ограничение — это отсутствие повторяющихся рангов.
Подобного рода условие обычно выполняется на маленьких выборках,
когда выборки не очень большие.
Повторяющиеся ранги сильно мешают точным расчетам критерия,
и если повторяющихся рангов становится больше, чем половина всех встречающихся
случаев, то применение U-критерия Манна-Уитни уже нецелесообразно,
поскольку точность расчетов значительно снижается.
Как можно исправить подобного рода ситуацию?
Разумеется, изначально вы можете применять высокоточные измерения,
то есть применять такой, такие единицы измерения,
при которых каждому нашему случаю будет присваиваться уникальное значение.
Например, когда вы измеряете рост людей,
вы можете пользоваться не шкалой в сантиметрах, а шкалой в миллиметрах.
В этом случае объем выборки может расти значительно, много,
и повторяющихся при этом значений будет не так много.
Поговорим о втором ограничении нашего критерия Манна-Уитни.
Оно касается того, что это критерий парный,
симметричный, соответственно, мы можем выбирать только одно из значений.
Почему мы можем это делать?
Обратим внимание, что, как мы уже говорили выше,
этот критерий рассчитывается отдельно для каждой из выборок, для одной и второй.
Меняться он может, соответственно, от минимальных до максимальных значений, и
при этом нужно учитывать, что достоверное различие будет получаться в тех случаях,
если разница между нашими значениями критерия будет очень большая, огромная.
То есть по одной нашей выборке мы будем получать минимальное значение критерия,
а по второй — максимальное.
Если же мы в процессе расчетов получаем значения критерия близкие,
похожие друг на друга, другими словами, у нас выборки сильно похожи друг на друга,
и достоверную разницу между ними мы, скорее всего, не обнаружим.
Ну а поскольку критерии симметричны,
то мы можем выбирать какое-то одно из значений критерия.
Традиционно для построения таблиц критических значений
U-критерия Манна-Уитни использовались минимальные значения.
И поэтому, для того чтобы выяснять, достоверен наш критерий или не достоверен,
нам необходимо из двух полученных расчетов критерия выбирать
наименьший и именно его сопоставлять с критическими значениями.
Наконец, третья особенность применения U-критерия Манна-Уитни,
она вытекает из второй особенности, эта особенность заключается в том,
что нас интересует, чем меньше значение критерия, тем лучше.
Другими словами, в отличие от других, непарных и несимметричных критериев,
значения минимальных U-критериев.
То есть чем меньше значение критерия, тем, как правило,
он достовернее при прочих равных всех условиях.
Теперь рассмотрим все эти рассуждения непосредственно на задаче.
Профессор Абрикосов изучает уровень выраженности тревожности в двух группах
спортсменов, тренирующихся по двум разным системам подготовки, группа 1 и группа 2.
Необходимо проверить гипотезу о различиях в уровне выраженности тревожности
спортсменов, тренировавшихся в группах 1 и 2.
При этом предположения о нормальности распределения и однородности
дисперсий не выполняются.
Ошибка α установлена на уровне в 0,05.
Ясно видно, что в условии задачи нам не позволяют применять t-критерий Стьюдента,
соответственно, мы можем применить альтернативу t-критерию Стьюдента,
а именно U-критерий Манна-Уитни.
Обращаем внимание на наши гипотезы.
Видим, что по форме гипотез они практически идентичны гипотезам,
которые мы применяли при t-критерии Стьюдента, при расчете того критерия.
Однако нужно учитывать одну важную особенность: при
применении U-критерия Манна-Уитни мы не пользуемся средними значениями.
Соответственно, мы не производим сопоставления средних.
Мы с вами говорили о том, что на распределениях ненормального вида
нежелательно вообще рассчитывать средние значения,
поскольку это может быть некорректным.
Соответственно, можно применять замену средним значениям, а это, если вы помните,
медианы, или конкретно в этом случае при применении U-критерия это суммы рангов.
В зависимости от того, что вам удобнее, и что предполагается использовать
вашими отчетами, вы можете применять один или второй вариант.
Как правило, удобнее применять медианы.
Произведем расчет нашего U-критерия Манна-Уитни.
На первом этапе мы производим ранжирование наших измерений.
Поскольку изначально в таблице исходных данных применялась метрическая шкала,
нам необходимо ранжировать наши измерения.
Мы производим это на всей нашей выборке целиком, на обеих группах,
производим сплошное ранжирование,
начиная от минимальных значений признака до максимальных.
На втором этапе мы производим расчет сумм рангов отдельно для каждой выборки,
отдельно для каждой группы.
И уже после этого на третьем этапе производим
расчет U-критерия Манна-Уитни по уже известной нам формуле,
подставляя в нее полученные только что суммы рангов для каждой из наших выборок.
Рассчитав значения U-критерия Манна-Уитни, мы выясняем,
какое из двух полученных значений наименьшее, и именно это наименьшее
значение сопоставляем с критическими значениями в таблице.
При это убеждаемся, что, к сожалению к нашему,
наше значение эмпирического значения критерия выше, чем критические
значения U-Манна-Уитни, а мы помним о том, что оно должно быть маленьким, небольшим.
Другими словами, мы не смогли преодолеть установленный нами
уровень ошибки α первого рода в 0,05.
P-уровень значимости для нашего критерия больше этого значения α,
соответственно, мы не вправе отклонить нулевую гипотезу о том,
что значения выраженности признака в наших группах достоверно различаются.
Другими словами, они очень сильно похожи.
На экране вы видите результаты наших расчетов и выводы.
Прежде всего обращаем внимание на диаграмму.
На ней представлены медианы, рассчитанные по двум нашим группам.
По таблице исходных данных это возможно делать.
Мы видим, что в целом вроде бы различия имеются, однако подсчеты,
которые мы с вами произвели, оценка достоверности нашего сравнительного
критерия U-Манна-Уитни не позволяет нам говорить, что эта разница достоверна.
Другими словами, мы, к сожалению,
не можем подтвердить достоверность разницы и принять альтернативную гипотезу.
Вы видите на своих экранах краткий вывод,
также можете видеть и полный содержательный вывод.
Уровни выраженности тревожности спортсменов групп 1 и
2 статистически достоверно не различаются.
И здесь же, в этом выводе, мы приводим числовые данные,
подтверждающие этот вывод.
Мы произвели с вами расчеты U-критерия Манна-Уитни вручную.
Как видите, применение этого критерия при расчетах вручную относительно несложное,
в некоторых случаях его даже применять проще и рассчитывать проще,
чем те t-критерии Стьюдента,
особенно если вы это проделываете на небольших по численности выборках.
Однако для упрощения расчетов, для автоматизации расчетов
вы можете пользоваться специализированными статистическими пакетами.
Примеры алгоритмов применения этих пакетов вы можете найти в книге,
ссылку на которую вы видите на экране.