Статистическое исследование зависимости между качественными признаками
Для исследования зависимости между качественными признаками могут быть использованы методы группировки, методы дисперсионного анализа, коэффициенты ранговой корреляции и специфические показатели степени тесноты связи между качественными признаками (коэффициент ассоциации, коэффициент контингенции и др.). При этом следует иметь в виду, что коэффициент ассоциации и коэффициент контингенции применимы для оценки степени тесноты связи только между альтернативными признаками. Здесь полезно вспомнить, что именно такие качественные признаки характерны экономическим явлениям и процессам. Коэффициент ассоциации вычисляется по следующей формуле
.
Параметры a, b, c, d определяются построением так называемой таблицы «четырех полей». Рассмотрим пример. Необходимо выявить существует ли связь между выполнением норм выработки рабочими предприятия и техническим уровнем их обучения. Исходные данные:
Группа рабочих Число рабочих мест, чел выполняющих и перевыполняющих норму не выполняющие норму Всего 1. Прошедшие техническое обучение 112 19 131 2. Не прошедшие техническое обучение 15 52 67 Итого 127 71 198
Представим эту таблицу в форме «таблицы четырех полей»
a b a+b c d c+d a+c b+d
Для нашего примера имеем . Можно говорить о наличии весьма тесной прямой связи между данными качественными признаками. Если , то коэффициент ассоциации равен нулю. Практически считается, что величина свидетельствует о наличии связи между изучаемыми качественными признаками. Недостатком является то, что если хотя бы один из четырех показателей «таблицы четырех полей» равен нулю (т.е. отсутствует), то , что дает преувеличенное представление о степени тесноты связи между изучаемыми качественными признаками. Коэффициент контингенции дает более точную оценку степени тесноты связи и вычисляется также на основании данных «таблицы четырех полей» по формуле
.
По вышеприведенным данным величина составляет
.
Следует иметь в виду, что всегда меньше . Практически наличие связи между изучаемыми альтернативными признаками считается подтвержденным при величине не ниже 0,3. Для использования коэффициентов корреляции рангов необходимо признаки, хотя и качественные, упорядочить, например, по балловым (бальным) оценкам. Как пример такого подхода можно вспомнить уровень квалификации работников. Для оценки степени тесноты связи между несколькими качественными признаками при использовании рангов применяется коэффициент конкордации , вычисляемый по формуле
,
где m – число факторов (признаков); n – число ранжируемых единиц; S – сумма квадратов степеней рангов. Если обозначить ранг i-го фактора у j-й единицы, то величина S будет равна .
Рассмотрим вычисление коэффициента конкордации на учебном примере.
Пример. По приведенным в таблице данным оценить множественную связь
Порядковый номер предприятия Ранг по показателю Уровня рентабельности Уровня качества Уровня спроса