Часто ее наличие пытаются оценить на глаз с помощью графиков. Однако даже если и удается определить сам факт коррелятивной взаимосвязи, то степень ее остается неизвестной. Корреляционный анализ призван количественно выразить связь и определить ее достоверность. Конструкция коэффициента корреляции в своей основе имеет линейную математическую модель (метод наименьших квадратов). Поэтому единичное значение коэффициент корреляции принимает лишь тогда, когда все точки графика зависимости переменных лежат на одной прямой линии. Во всех остальных случаях он будет отличаться от единицы. Способ вычисления коэффициента корреляции показан на примере исследования зависимости между живым весом коров и их приплода (кг) (табл. 8.3, стр.176). Рассчитываются квадраты вариант и их произведения, а также суммы значений, их квадратов, произведений, другие вспомогательные величины: Cxy = Σ(x∙y)–(Σx)∙(Σy)/n = 103144–3150∙224/ 7 = 2344 Cy = Σy²–(Σy)²/n = 7330–224²/ 7 = 162, Cx = Σx²–(Σx)²/n = 1453158–3150²/ 7 = 35658. Затем вычисляется коэффициент корреляции: = 0.975, его ошибка:
и критерий Стьюдента, проверяющий нулевую гипотезу Но: "коэффициент корреляции достоверно от нуля не отличается", r = 0. Tr = r/ mr = 0.975/ 0.099 = 9.84. То, что эта величина значительно превышает табличную (для уровня значимости α = 0.05 и числе степеней свободы df = п–2 = 5 T(0.05,5) = 2.57), говорит о высокой статистической значимости полученного коэффициента корреляции. По таблице 6П можно определить уровень значимости коэффициента корреляции. Полученное значение критерия Tr = 9.84 превышает порог даже для уровня значимости α = 0.001, т. е. шанс ошибочного заключения даже ниже 1 на 1000, иначе вероятность справедливости заключения очень высока, P>0.999. Оценить достоверность отличия коэффициента корреляции от нуля можно и не прибегая к вычислению ошибки и критерия Стьюдента. Для этого служит специальная таблица 16П, в которой указаны минимальные значимые значения коэффициента корреляции при разных объемах выборок и уровне значимости. Чтобы полученный коэффициент корреляции можно было считать достоверным, он должен превышать табличное значение при данном n. В нашем случае (n = 7, α = 0.05) достоверно уже значение r = 0.666, полученный коэффициент корреляции (r = 0.975) превышает табличное, следовательно, также значим. Доверительный интервал для нашего случая (r = 0.975, α = 0.05, п = 7, df = п–2 = 5, T(0.05,5) = 2.57) рассчитывается так. Преобразуем r: = 2.184724 (по таблице 14П z = 2.0923). Ошибка составит = 0.5. Определяем верхнюю границу: maxz = z+T(α,df)∙mz = 2.09+2.57∙0.5 = 3.375, нижнюю границу: minz = z+T(α,df)∙mz = 2.09–2.57∙0.5 = 0.805. Обратное преобразование (по табл. 15П) дает: maxr ≈ 1.00, minr ≈ 0.67. Истинный коэффициент корреляции находится в диапазоне от r = 0.67 до r = 1.00. В среде Excel существует несколько путей поиска корреляций. Отдельный коэффициент корреляции между двумя переменными проще всего определить с помощью статистической функции = КОРРЕЛ(диапазонX;диапазонY). Аналогичный результат дает регрессионный анализ с помощью макроса, вызываемого командой меню Сервис\ Анализ данных\ Регрессия. Когда изучаются два признака, Множественный R на самом деле является парным коэффициентом корреляции между ними. Для расчета корреляций между несколькими переменными можно использовать программу, вызываемую командой меню Сервис\ Анализ данных\ Корреляция. Результатом ее работы оказывается матрица коэффициентов корреляции.
Ви переглядаєте статтю (реферат): «Техника расчета линейного коэффициента корреляции» з дисципліни «Введення в кількісну біологію»