Как показано в приведенном выше примере, важнейшей особенностью корреляци онных исследований является возможность при наличии сильной корреляции стро ить предположения о будущем поведении. Корреляция между двумя переменными дает возможность на основании значений одной из них предсказать значения дру гой. Это несложно показать на примере со средними баллами. Если вы знаете, что время, посвященное учебе, и средний балл коррелируют, и я скажу вам, что некто занимается 45 часов в неделю, вы сможете безошибочно предсказать относительно высокий средний балл для такого студента. Аналогично высокий средний балл по зволит вам предсказать время, уделяемое учебе. Как вы узнаете позднее в этой главе, корреляционные исследования обеспечивают базу для построения предположений по результатам психологических тестов. Построение предположений на основании корреляционных исследований называется регрессионным анализом. На рис. 9.7 представлен график рассеяния для: а) времени, посвященного учебе и среднего балла и б) бесполезно потраченного времени и среднего балла, но на этот раз на каждом графике отображена линия регрессии, которая используется для построения предположений. Линию регрессии также называют «оптимальной ли нией»: она представляет собой наилучший из возможных способов обобщения то чек графика рассеяния. Это значит, что абсолютные значения расстояний по вер тикали между каждой точкой графика и линией регрессии минимальны. Корреляция и регрессия: основы 3 2 1 Рис. 9.7. Графики рассеяния с линиями регрессии Линия регрессии рассчитывается по той же формуле, по которой в школе вы строили прямую по заданным координатам X и Y: где а — это точка, в которой прямая пересекает ось Y(т. е. отрезок, отсекаемый на оси Y), a b — это угол наклона прямой, или ее относительная крутизна. X — это известная величина, а Y— величина, которую вы пытаетесь предсказать. Зная 1) силу корреляции и 2) стандартное отклонение для коррелирующих переменных, можно вычислить величину b, а зная 1) значение b и 2) средние значения корре лирующих переменных, можно найти а. В приложении С на конкретном приме ре показано, как вычислять эти значения и подставлять их в уравнение регрессии. В регрессионном анализе для предсказания значения Y(например, среднего бал ла) на основании значения X (например, времени, посвященного учебе) используется уравнение регрессии. У иногда называют критериальной переменной, а X — предик- торной переменной. Однако для построения точных предположений корреляция должна быть значительно выше нуля. Чем выше корреляция, тем ближе будут точки графика рассеяния к линии регрессии и тем больше будет уверенность в том, что ваши предположения верны. Таким образом, отмеченная ранее проблема ограничения диа пазона, которая снижает корреляцию, также снижает достоверность предсказаний. 3 2 2 Глава 9. Корреляционные исследования Из рис. 9.7 также видно, как строить предположения с помощью линии регрес сии. Поскольку между временем, отведенным на учебу, и средним баллом суще ствует взаимосвязь, можно спросить, какой средний балл стоит ожидать у студен та, который проводит за учебой по 40 часов в неделю. Чтобы представить процесс наглядно, проведем пунктирную линию от оси X к линии регрессии, а затем повер нем влево на 90° и проведем линию до пересечения с осью Y. Значение точки на оси У и будет предполагаемым значением (помните, что правильность предполо жения зависит от силы корреляции). Таким образом, по времени учебы, равному 40 часам, можно предсказать средний балл, равный 3,5, а по бесполезно потрачен ным 40 часам — средний балл чуть выше 2,1. С помощью формулы регрессии мож но вычислить более точные значения: 3,48 и 2,13 соответственно, и сделать более точные предсказания. Еще раз см. приложение С. Будьте уверены, что регрессионный анализ применяется в большинстве иссле дований, о которых вы узнаете из средств массовой информации. К примеру, вам может встретиться отчет об исследовании «факторов риска для инфаркта», в кото ром на основании значимой корреляции, скажем между курением и сердечными заболеваниями, сделан вывод, что у людей, злоупотребляющих курением, больше вероятность развития сердечно-сосудистых заболеваний, чем у некурящих. Это зна чит, что курение является основанием для предсказания развития болезней серд ца. На основании другого исследования, посвященного изучению «портрета же стокого супруга (супруги)», может быть сделан вывод о том, что вероятность по явления подобного поведения увеличивается, если виновник — безработный. Это следует из наличия корреляции между безработицей и склонностью к оскорби тельному поведению. На основании наличия корреляции с помощью регрессион ного анализа, зная первое, можно сделать предположение насчет второго. Последнее замечание по поводу регрессионного анализа касается и практиче ской, и этической сторон дела. Предположения могут распространяться только на тех людей, чьи оценки попадают в диапазон, на котором основана корреляция. Например, если уравнение регрессии, предсказывающее хорошую успеваемость в колледже, основано на исследовании, проведенном с участием белых испытуемых, живущих в провинции, принадлежащих к среднему классу и имеющих оценки, ва рьирующиеся от 1000 до 1400, то на основании этого уравнения нельзя предсказать успеваемость других абитуриентов, не принадлежащих к данной популяции.
Ви переглядаєте статтю (реферат): «Регрессионный анализ: построение предположений» з дисципліни «Дослідження в психології: методи і планування»