[БЕЗ ЗВУКА] В этом видео мы разберемся
еще с одним способом формализации понятия корреляции — корреляцией Спирмена.
Коэффициент корреляции Спирмена — это мера силы монотонной взаимосвязи между двумя
случайными величинами.
Для того чтобы ее посчитать, вам нужно взять вашу выборку пар (X1,
X2), превратить наблюдение в каждой из подвыборок в ранги и уже на этих
рангах посчитать значение коэффициента корреляции Пирсона.
Именно за счет вот этого рангового преобразования мы получаем, что корреляция
Спирмена устойчива к любой монотонной взаимосвязи между X1 и X2, поскольку
ранговое преобразование превращает любую монотонную взаимосвязь в линейную.
Корреляция Спирмена наследует часть свойств корреляции Пирсона.
Так, она точно так же меняется от −1 до 1,
где крайние значения отрезка соответствуют идеальной,
в данной случае монотонной, взаимосвязи между нашими случайными величинами,
а 0 — полному отсутствию монотонной взаимосвязи между ними.
Если у вас есть выборка пар (X1,
X2) — вот так считается выборочный коэффициент корреляции Спирмена.
В данном случае формулу выборочной корреляции Пирсона можно немного
упростить, поскольку мы заранее знаем,
чему равны средние ранги в наших выборках и чему равны их дисперсии.
Давайте воспроизведем эксперименты с облаками точек,
которые мы делали для корреляции Пирсона и посмотрим,
какие из свойств корреляции Спирмена отличны от того, что мы видели раньше.
Корреляция Спирмена примерно так же реагирует на сжатие и размывание
облака точек на диаграмме рассеяния, как корреляция Пирсона.
Мы видим, что крайние случаи идеальной линейной взаимосвязи соответствуют −1 и 1,
а в середине мы получаем значения коэффициента корреляции, близкие к 0.
Что-то более интересное мы получаем в эксперименте,
когда мы наше облако точек загибаем.
Мы видим, что пока зависимость между X1 и X2 остается монотонной,
значение коэффициента корреляции Спирмена не убывает.
Однако потом, когда мы начинаем постепенно превращать наше облако точек в параболу,
значение выборочного коэффициента корреляции Спирмена постепенно
превращается в 0.
Корреляция Спирмена не обнаруживает взаимосвязи между X1 и X2,
отличные от монотонных.
Это можно заметить и на следующих примерах.
Когда у нас между X1 и X2 есть какие-то сложные функциональные взаимосвязи,
корреляция Спирмена все равно остается равной 0,
поскольку они далеки от монотонных.
Гораздо более интересные результаты мы получаем в эксперименте с выбросами.
Когда мы из нашего облака точек с сильной отрицательной корреляцией начинаем пять
точек выдвигать в правый верхний угол диаграммы рассеяния, значение коэффициента
корреляции Спирмена сначала немного уменьшается, однако как только эти пять
точек оказываются за пределами диапазона изменений случайных величин в нашем
основном облаке, значение коэффициента корреляции Спирмена меняться перестает.
Как бы далеко мы их не отодвигали, мы не сможем получить большую положительную
корреляцию, как в случае с корреляцией Пирсона.
Это говорит о том, что коэффициент корреляции Спирмена гораздо более к
выбросам устойчив, то есть небольшое количество точек с огромными значениями
признаков очень слабо влияют на выборочное значение нашего коэффициента корреляции.
В следующем видео мы разберемся с тем,
как оценивать корреляцию между бинарными случайными величинами.