Рассмотренные выше показатели оценки степени тесноты корреляционной связи между признаками являются обоснованными лишь в условиях нормального или близкого к нормальному распределению признаков в изучаемой совокупности. Кроме того, как видно из рассмотренных выше формул, для расчета величины r или необходимо знать численные значения факторного и результативного признаков. В некоторых же случаях мы можем изучать также признаки, которые не поддаются четкому численному выражению. Эти обстоятельства заставляют пробегать к использованию так называемых непараметрических методов оценки тесноты связи. Основой непараметрических методов является принцип нумерации вариант (индивидуальных значений) статистического ряда. Значения признака располагаются по возрастанию (или убыванию). Каждой единице такого ряда присваивается порядковый номер в ряду. Причем номер первый получает наименьшая (или, наоборот, наибольшая) варианта, номер второй получает следующая по величине варианта и т.д. Эти порядковые номера индивидуальных значений (вариант) изучаемого признака, расположенные в ряду в порядке возрастания или убывания своей величины, называются рангами. Затем ранги (порядковые номера) индивидуальных значений факторного признака располагают в порядке возрастания (убывания) и с ними сопоставляются соответствующие ранги (порядковые номера) индивидуальных значений результативного признака. Для повторяющихся индивидуальных значений признака ранг определяется как средняя арифметическая соответствующих номеров. Например, если одинаковые по величине значения признака занимают в ранжированном ряде третье и четвертое места, то ранг (порядковый номер) для каждого из них будет равен . Наличие связи между признаками в данном случае можно получить, если сопоставить последовательность взаимного расположения рангов факторного и результативного признаков. Если с возрастанием величины рангов факторного признака х соответствующие им величины рангов результативного признака у обнаруживают тенденцию к увеличению, можно сделать вывод о наличии прямой (положительной) связи. Если же с увеличением рангов факторного признака ранги результативного признака уменьшаются, то это свидетельствует о возможном наличии между изучаемыми признаками обратной связи. Из многочисленных непараметрических методов оценки степени тесноты связи наибольшее применение в статистическом анализе корреляционной зависимости нашли коэффициенты корреляции рангов, разработанные К. Спирмэном и М. Кендэлом. Коэффициент корреляции рангов Спирмэна может быть выведен из формулы линейного коэффициента корреляции. Имеет следующий вид:
,
где - коэффициент корреляции рангов Спирмэна, - разность между величинами рангов в изучаемых рядах; n – количество показателей (рангов) в ряде. Коэффициент корреляции рангов может варьировать в пределах от +1 (при наличии прямой связи) до –1 (при наличии обратной связи). Рассмотрим пример.
Пример. а)
Ранги 1-го ряда 1 2 3 4 5 Соответствующие им ранги результативного признака 5 4 3 2 1 Разность между рангами -4 -2 0 2 4
. б)
Ранги факторного признака 1 2 3 4 5 Соответствующие им ранги результативного признака 1 2 3 4 5 Разность между рангами 0 0 0 0 0
.
Коэффициент корреляции рангов Кендэла определяется по формуле
, где .
Для вычисления находят два слагаемых P и Q по ряду рангов результативного признака. При определении слагаемого Р нужно последовательно установить сколько рангов находящихся справа от рассматриваемого ранга имеют величину, превышающую данный ранг. Суммируя полученные таким образом числа, получают слагаемое Р. Следовательно слагаемое Р может рассматриваться как мера соответствия последовательности рангов переменной у последовательности рангов переменной х. Необходимо учесть, что ряд рангов переменной х приводится к ряду натуральных чисел. Одинаковые значения признака получают следующие по порядку порядковые номера. Аналогично ранжируются значения ряда у. Второе слагаемое Q также определяется по ряду признака у, но как степень несоответствия последовательности рангов признака у последовательности рангов признака-фактора х. Чтобы определить Q последовательно подсчитывается сколько рангов, находящихся справа от рассматриваемого ранга меньше по величине. Такие величины берутся со знаком минус. Коэффициент корреляции рангов Кендэла также изменяется в пределах от –1 до +1 и равен нулю при отсутствии связи между данными признаками. По нашим примерам имеем: а) . . , т.к. . б) . . . . При достаточно большом числе наблюдений между коэффициентами корреляции рангов Спирмэна и коэффициентами корреляции рангов Кендэла существует следующее соответствие
.
Из этих двух видов коэффициентов корреляции рангов коэффициент Кендэла теоретически обоснован более глубже: существует его распределение для различных n и тем самым имеется возможность проверки его существенности. Примеры на ранговые корреляции
Пример 1. Оценить тесноту связи между экспертными оценками шансов депутатов на этапе предвыборной компании и результатами выборов в городскую Думу.
Порядковый номер кандидата в депутаты Ранг кандидатов по оценке экспертов Ранг депутатов по числу поданных голосов на выборах Разность рангов 1 7 5 2 4 2 4 6 2 4 3 1 2 1 1 4 3 7 4 16 5 10 8 2 4 6 5 3 2 4 7 9 10 1 1 8 2 1 1 1 9 8 9 1 1 10 6 4 2 4 Итого - - - 40
Решение. Расчет коэффициента рангов Спирмэна .
Можно предположить наличие достаточно тесной прямой зависимости между оценками экспертов аналитического центра на стадии предвыборной компании и результатами выборов.
Пример 2. По данным примера 1 определить величину коэффициента корреляции рангов Кендэла.
Решение. Упорядочить ранги по х
Экспертные оценки (х) 1 2 3 4 5 6 7 8 9 10 Результат выборов (у) 2 1 7 6 3 4 5 9 10 8