Если вы пользуетесь пакетом статистических программ SPSS или SAS, практически лю бой анализ будет включать нахождение стандартного отклонения. Кроме того, большин ство калькуляторов способны к вычислению основных статистических функций, в том числе стандартного отклонения. Поэтому вам, может быть, не придется подсчитывать на бумаге. Однако у вас может оказаться устаревший калькулятор или увлеченный препода ватель, который будет разделять мои представления о том, что подсчет вручную дает более глубокое понимание происходящего. Есть два способа вычислить стандартное отклонение. Первый — использовать так называемую «формулу отклонения». Внимательно изучив ее, вы лучше поймете суть стандартного отклонения, которое по определению является при близительной характеристикой средней величины отклонения каждой оценки от средне го арифметического. Ниже показано, как найти стандартное отклонение для 20 оценок, по лученных при исследовании памяти. Шаг 1 Вычислите среднее арифметическое: Шаг 2 Вычислите оценки отклонения, каждую возведите в квадрат и найдите их сумму. Оценки отклонения (х малое) находятся вычитанием среднего арифме тического из каждой оценки (Xбольшое). Таким образом,х- Х- X. Возведе ние в квадрат предотвращает появление отрицательных чисел: Шаг 3 Вычислите стандартное отклонение (СО): По формуле отклонения найти стандартное отклонение довольно просто, но для калькуля тора она не совсем подходит. Более простой способ — использовать так называемую фор мулу для вычислений, которая математически равнозначна формуле отклонения. Она име- ет следующий вид] Статистический анализ 155 а вычисления проходят следующим образом: ШагЗ Разделите значение, полученное на шаге 2, на (п-\): Шаг 4 Чтобы получить стандартное отклонение, найдите квадратный корень значе ния, полученного на шаге 3: Одной из характеристик изменчивости является дисперсия. Дисперсия пред ставляет собой число, получаемое в ходе вычисления стандартного отклонения, сразу перед нахождением квадратного корня (3,27 для оценок исследования памя ти). Это число редко попадает в отчеты, включающие описание данных, так как оно отражает измеряемую величину, возведенную в квадрат (например, «количество запомненных слов в квадрате»). Однако оно находится в центре вероятно самой известной в психологии процедуры статистики вывода — «дисперсионного анали за». О нем рассказывается в главах 7 и 8, а также более подробно в приложении С. Общая тенденция и изменчивость — это универсальные характеристики, исполь зуемые при любом описании данных, но исследователи также изучают и весь набор оценок в целом. Простой просмотр данных малоэффективен, но есть и другие спосо бы организации оценок, с помощью которых можно получить значимую картину результатов. Один из способов представления данных — это гистограмма. Гисто грамма представляет собой график, показывающий, сколько раз встречается каждая оценка в данном наборе, или, при большом количестве оценок, частоту появления оценок в пределах определенного интервала. Чтобы построить гистограмму, необ ходимо предварительно построить частотное распределение — таблицу, в которой указывается, сколько раз встречается каждая оценка. Частотное распределение оце нок, полученных при исследовании памяти, имеет следующий вид: Оценка 14 15 16 Частота 1 3 2 Частота, обозначенная звездочками * *** ** 1 5 6 Глава 4, Измерения, выборка и обработка данных 17 18 19 20 21 5 4 3 1 1 ***** * * * * *** * * Построив таблицу частотного распределения, несложно начертить гистограмму. На оси X графика отметьте сами оценки, а на оси Υ — частоту их появления, а затем постройте соответствующие столбцы графика. Результат должен выглядеть, как показано на рис. 4.6. Обратите внимание, что если взять столбец со звездочками из частотного распределения и повернуть его на 90°, результат будет такой же, как на рис. 4.6. Рис. 4.6. Гистограмма оценок, полученных по тесту памяти Также следует отметить, что гистограмма выступает вверх в районе середины и уплощается по краям, что приблизительно соответствует распределению оценок для целой популяции, а не только для 20 человек из описанного выше примера. Распределение оценок для популяции представляет собой известную колокообраз- ную кривую, называемую нормальной кривой, или нормальным распределением. Вы уже встречались с ней; она представлена на рис. 4.7. Рис. 4.7. Нормальная кривая Статистический анализ 1 5 7 Так же как кривая, построенная для оценок исследования памяти, нормальная кривая представляет собой частотное распределение. Но в отличие от первой она является нереальным (или «эмпирическим») распределением оценок конкретной выборки, а гипотетическим (или «теоретическим») распределением оценок, которые могут получить члены популяции, если все они примут участие в исследовании. Среднее арифметическое, медиана и мода находятся точно в центре нормального распределения. Важнейшая особенность статистического анализа частотного распре деления заключается в том, что если эмпирическое распределение оценок сходно с нормальным распределением, то математические характеристики последнего мож но использовать для построения выводов о первом. Обратите внимание, что на нормальной кривой, показанной на рис. 4.7, я отме тил по два стандартных отклонения с обеих сторон от среднего арифметического. Математические характеристики кривой таковы, что около 68% всех оценок для популяции лежат в интервале между двумя первыми стандартными отклонения ми, а около 95% — между вторыми. Очевидно, что оценок, попавших за пределы вторых стандартных отклонений, немного — всего 5% от общего количества. Все эти явления можно назвать «статистически значимыми». Запомните данные харак теристики распределения, мы к ним очень скоро вернемся. Кроме частотного распределения и гистограммы есть еще один способ ото бражения набора данных, который позволяет выявить их особенности. Это ме тод стебля и листа (Turkey, 1977). Чаще всего его используют, когда набор оце нок так велик, что частотное распределение или гистограмма были бы очень громоздкими. Например, если вы протестировали 20 испытуемых на застенчи вость и полученные ими оценки варьируются от 10 до 70, простое частотное рас пределение, подобное построенному для данных исследования памяти, будет огромным, а ось X гистограммы будет в милю длиной. Проблему можно решить сгруппировав данные по интервалам (10-19,20-29,30-39 и т. д.). Каждый стол бец диаграммы будет отралсать количество оценок в пределах определенного интервала. Обратите внимание, что подобная группировка данных приводит к потере некоторой информации. Если шесть человек при тестировании на за стенчивость получат оценки между 30 и 39, то все, что вы увидите после такого обобщения, — это один столбец, отображающий частоту, равную шести, и вы не будете знать, какую оценку получил каждый из шести участников. Организо вав данные методом стебля и листа, вы сможете получить эту информацию. Ме тод состоит в следующем. Предположим, что при тестировании на застенчи вость 20 человек получены следующие оценки (я выделил жирным шрифтом шесть оценок в пределах от 30 до 39): 49 36 41 36 43 22 64 68 47 67 33 39 43 32 37 46 41 61 49 43 1 5 8 Глава 4. Измерения, выборка и обработка данных В методе стебля и листа с двухзначными числами «листом» будет наименьший разряд (разряд единиц), а «стеблем» — наибольший (разряд десятков). Таким об разом, для первого числа (49) , стеблем будет число 4, а листом число 9. Для числа 36 стебель равен 3, а лист — 6. Для организации стеблей и листов по одноименно му методу сначала требуется расположить числа в порядке возрастания, как вы де лали при нахождении медианы (числа от 30 до 39 выделены жирным шрифтом). Получаем: 22 32 33 36 36 37 39 41 41 43 43 43 46 47 49 49 61 64 67 68 Далее поместите стебли в левый столбец таблицы, а листы в соответствующие ряды правого столбца, как показано ниже: Стебли 2 3 4 5 6 Листы 2 236679 113336799 1478 Повернув таблицу влево на 90° и представив, как заполняются цветом цифры листов, образуя столбцы, вы получите аналог гистограммы для сгруппированных данных. Но обратите внимание, что по сравнению с обычной гистограммой метод стебля и листа обладает заметным преимуществом. На гистограмме, к примеру, в интервале 30-39 будет изображен один столбец, достигающий по шкале У отмет ки 6. В таблице, построенной методом стебля и листа, вы не только увидите «высо ту» оценок в интервале, но также сможете изучать сами оценки. Кроме того, метод стебля и листа позволяет обнаружить оценки, относительно далеко отстоящие от остальных. В приведенном выше примере отсутствие оценок в интервале 50-59 сразу заметно, а четыре оценки в интервале 60-69 выделяются и несколько отсто ят от остальных. В статьях, посвященных результатам исследований, полученных с помощью описательной статистики, встречается три способа представления данных. Во- первых, если необходимо представить лишь несколько чисел (например, значе ния среднего арифметического и стандартного отклонения для двух экспери ментальных групп), можно использовать повествовательное изложение результа тов. Во-вторых, значения среднего арифметического и стандартного отклонения можно представить в виде таблицы, а в третьих — наглядно в виде графика. Как строить таблицы и графики, соответствующие стандартам АРА, вы узнаете из приложения А, в котором приведен пример отчета об исследовании. Также, не которую информацию о построении графиков можно найти в главах 7 и 8. Эти ческий аспект статистического анализа и построения графиков освещается во вставке 4.3.
Ви переглядаєте статтю (реферат): «Вычисление стандартного отклонения» з дисципліни «Дослідження в психології: методи і планування»