В обыденном сознании статистика ассоциируется с «наукой о цифрах», призванной отвечать только на один вопрос: сколько. В самых общих чертах задачи статистики — организация сбора, обработки и анализа информации, а также разработка методов этой работы. Анализ — это прежде всего сравнение, сопоставление статистических данных. 597
Статистика, которую можно квалифицировать как количественную социальную науку, имеет на вооружении мощные инструменты сбора, измерения и анализа эмпирических данных (статистической информации). Научное определение термина «статистическая информация» — совокупность количественных характеристик социально-экономических явлений и процессов, полученных в результате статистического наблюдения и их обработки соответствующими методами. Чтобы статистической информацией можно было эффективно пользоваться, она должна соответствовать определенным требованиям — быть достоверной, полной, обоснованной, сопоставимой и своевременной. Объекты статистического наблюдения — общественные явления и процессы — никогда не используются в сыром, необработанном виде. Их переводят на категориальный язык статистики и лишь потом с ними совершают расчетные манипуляции. Основными категориями, при помощи которых в статистике описываются эмпирические данные, выступают: статистическая совокупность, признак, показатель, вариация, система показателей. Статистическая совокупность — это множество объектов (единиц, фактов, случаев и т.д.) одного и того же вида, подвергаемых статистическому изучению. Объекты, которые образуют совокупность, называются элементами совокупности. Элементы, множество которых образует изучаемую статистикой совокупность, называют ее единицами. Примерами совокупности являются: количество студентов конкретного вуза, множество предприятий одной отрасли производства, представители одной национальности, множество натуральных чисел и т.д. Множество (совокупность) обозначается прописной буквой, а их элементы строчными. Если «а» есть элемент совокупности (множества) А, то в математике используется запись «а»е А. Если «в» не является элементом совокупности А, то пишут «в»е А. Принадлежность к одному и тому же виду свидетельствует о том, что элементы статистической совокупности однородны. Таково обязательное требование статистики. Без него невозможно провести ни одного измерения, ни одного расчета или группировки. Заработная плата должна измеряться только в рублях или долларах, но не в том и другом одновременно, и уж никак не в чайниках или отпечатанных книгах, которыми в 1990-е расплачивались убыточные предприятия в России. Общее число единиц совокупности называют ее объемом. Признаки, принимающие различные значения или видоизменения у отдельных единиц совокупности, называются варьирующими, а отдельные их значения или видоизменения — вариантами. Варьирующие признаки подразделяются на атрибутивные (качественные) и количественные. 598 Признак называется атрибутивным, если отдельные его значения (варианты) выражаются в виде состояния или свойств, присущих явлению. К таким признакам относятся: профессия (врач, токарь, сварщик, швея и т.п.), отраслевая принадлежность предприятий (тяжелое машиностроение, легкая промышленность, сельское хозяйство) и др. Признак называется количественным, если отдельные его значения (варианты) выражаются в виде чисел. По характеру варьирования количественные признаки подразделяются на дискретные и непрерывные. Дискретными называются количественные признаки, могущие принимать только вполне определенные значения, между которыми не могут появиться промежуточные значения. Варианты дискретных признаков обычно выражаются в виде целых чисел (например, число членов семьи). Количественные признаки, которые могут в определенных пределах принимать любые значения, как целые, так и дробные, называются непрерывными. Такими признаками являются, например, возраст, стаж работы, вес поезда, скорость движения и т.п. Средством получения статистической информации выступает статистическое наблюдение, которое проводится на основе программы и плана, включающих программно-методологические и организационные вопросы. Статистическим наблюдением называется процесс сбора, группировки, обработки и анализа статистической информации. Можно выделить еще несколько основных источников получения статистической информации: отчетность, таблицы (сводные, групповые и комбинационные), представляющие результаты статистических группировок, а также обобщающие показатели. Отчетность — предусмотренная действующим законодательством форма организации статистического наблюдения за деятельностью предприятий и организаций, при которой органы государственной статистики получают информацию в виде установленных отчетных документов (форм отчетности), утвержденных Министерством финансов РФ и Госкомстатом РФ, подписанных лицами, ответственными за достоверность сведений. К числу главных методов получения данных относятся непосредственное наблюдение, документальное наблюдение и опрос. В основе статистических исследований всегда лежит массовое наблюдение фактов. Чем больше объем наблюдаемых единиц, тем ближе полученные данные к реально действующей закономерности, определяющей поведение изучаемой совокупности. Когда нет возможности обследовать всю совокупность, организуют так называемое выборочное наблюдение. Большинство социально-экономических явлений носит вероятностный характер. В статистике вероятность — это отношение количества благоприятных исходов к общему количеству возможных исходов. Царством вероятностей и случайных величин заведует закон больших чисел и, как производное от него, нормальное распределение. Для более точного и полного описания массовых явлений используются такие статистические показатели, как средние величины и показатели вариации. Средняя величина — это обобщающая характеристика изучаемого признака совокупности, она отражает то общее, что присуще всем единицам данной совокупности. Выбор вида средней величины и способов расчета зависит от целей анализа и характеристик совокупности. Средние используются как для сравнения различных совокупностей между собой, так и для ана- 599 лиза изменений одной и той же совокупности во времени. Показатели вариации описывают разброс значений совокупности. Основные показатели вариации — это размах вариации, дисперсия и коэффициент вариации. Полезную информацию для социолога дает анализ и сравнение средних величин и показателей вариации. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%. Над статистическими данными осуществляют две процедуры, которые называют предварительной обработкой, — сводку и группировку. Они проводятся
для упорядочения данных и подготовки их к последующему анализу. Статистическая сводка — это научно организованная обработка материалов наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов и других показателей. Распределение элементов по соответствующим группам представляет собой процесс классификации, т.е. отнесение того или иного элемента к определенному классу на основе соответствующих критериев или параметров. Так группируют отрасли промышленного производства исходя из их особенностей (металлургия черная, цветная). Группировку понимают как упорядочение данных по какому-либо статистическому признаку. Выбор признака для классификации и группировки осуществляется в соответствии с целями и гипотезами исследования. Группировка может проводиться на основе выделения номинальных групп (по полу, уровню квалификации, национальности и т.д.) или по какому-либо возрастающему или убывающему количественному признаку (например, по уровню заработной платы: от 1 до 10 минимальных размеров оплаты труда, от 11 до 20, от 21 до 30 и т.д.). Важнейшим приемом приведения исходных материалов к удобному для сравнения виду является расчленение разнородных величин на однородные. Выделив в разнородной совокупности признак, характеризующий тот или иной социальный объект, однородные типы и группы в ряде структурных частей этого объекта, можно сравнивать типы или группы друг с другом. Признак (свойство объекта), по которому проводится группировка, называется группировочным признаком, или основанием группировки. В качестве основных принципов процедуры группировки выступают: расчленение разнородных явлений на однородные; нахождение общих и однотипных явлений; определение признаков, по которым следует разграничивать типы; определение интервалов перехода от одного типа к другому. В социологических исследованиях применяются самые разные виды группировки: 1) группировка при помощи простого суммирования однородных признаков, благодаря чему определяются абсолютные числа и проявления в изучаемой совокупности; 2) ранжирование, т.е. группировка изучаемых единиц совокупности в зависимости от возрастания или убывания изучаемого признака; 3) группировка на основе логически выделенных признаков при помощи заранее разработанной порядковой или интервальной шкалы, каждый 600 интервал которой выражает уровень или степень проявления изучаемого признака; 4) табулирование, т.е. построение статистических таблиц, графиков (в социологических исследованиях оно является наиболее распространенным). Самым простым способом группировки является группировка путем простого суммирования однородных признаков. В то же время этот вид группировки служит основным звеном для перехода от абсолютных чисел к относительным (процентам, средним величинам и т.д.), являющимся основными характеристиками группировки. Достаточно проста группировка при помощи ранжирования, которое позволяет выявить динамику изучаемого признака в различных совокупностях. Группировка на основе логически выделенного одного или нескольких признаков отличается от предыдущих группировок тем, что предполагает глубокий теоретический, т.е. содержательный, анализ особенностей изучаемых социальных явлений. Поэтому главное значение здесь приобретает правильный выбор группировочных признаков4. Чаще всего применяются такие признаки, как пол, возраст, образование, классовая принадлежность и т.п. Результат группировки единиц наблюдения по одному какому-либо признаку называется статистическим рядом. Распределение частот признака в совокупности называется вариационным рядом. Группировка, или расчленение совокупности данных на однородные группы, выступает стартовой площадкой для последующею использования множества самых разнообразных и интересных статистических методов, в том числе корреляционного и дискриминантного. Группировку можно рассматривать как первый шаг к дискриминантному анализу, который исследует различия между группами. С его помощью можно установить, в частности, различия между тремя группами людей, выбравших определенную профессию (например, юрист, физик, инженер), основываясь на их успехах в школе по определенным дисциплинам. Такой метод объясняет выбор профессии успехами по определенным предметам. Изучая социально-экономические явления, статистика использует абсолютные и относительные величины. Абсолютные величины — это именованные числа. Каждая из них обязательно имеет единицу измерения: штуки, тонны, метры, рубли, киловатты, годы и пр. Единицы измерения подразделяются на натуральные, стоимостные и др. По способу выражения размеров изучаемых явлений абсолютные величины подразделяются на индивидуальные и суммарные, которые представляют собой один из видов обобщающих величин. Иногда одна натуральная единица измерения недостаточна для характеристики изучаемого явления, в подобных случаях используют вторую единицу в сочетании с первой. Поэтому в практике натуральные единицы измерения могут быть составными. Так, трудовые затраты в торговле измеряются числом работников и количеством человеко-часов (чел./ч), человеко-дней (чел./дней), работа транспорта выражается в тонно-километрах (т/км). Относительные величины показывают отношения между абсолютными величинами, они представляют собой частное от деления двух статистических величин и характеризуют количественное соотношение между ними. Наиболее распространенный тип относительных величин — проценты. Относительные величины значительно облегчают сравнение и анализ статистических данных. Словарь прикладной социологии / [Сост. К.В. Шульга; Редкол.: Г.П. Давидкж (отв. ред.) и др.]-Минск: Изд-во «Университетское», 1984. С. 28. 601 При расчете относительных величин следует иметь в виду, что в числителе всегда находится показатель, отражающий то явление, которое изучается, т.е. сравниваемый показатель, а в знаменателе — показатель, с которым производится сравнение, принимаемый за основание, или базу сравнения. База сравнения выступает в качестве своеобразного измерителя. В зависимости от того, какое числовое значение имеет база сравнения (основание), результат отношения может быть выражен либо в форме числа (коэффициента) или процента, либо в форме промилле или децимилле. Если значение основания или базы сравнения принимается за единицу (приравнивается к единице), то относительная величина (результат сравнения) является коэффициентом и показывает, во сколько раз изучаемая величина больше основания. Расчет относительных величин в виде коэффициента применяется в том случае, если сравниваемая величина существенно больше той, с которой она сравнивается. Если значение основания или базу сравнения принять за 100%, результат вычисления относительной величины будет выражаться также в процентах. В тех случаях, когда базу сравнения принимают за 1000% (например, при исчислении демографических коэффициентов), результат сравнения выражается в промилле (%о). Относительные величины могут быть выражены и в децимилле (%оо), если основание отношения равно 10 000. Форма выражения относительных величин зависит от количественного соотношения сравниваемых величин, а также от смыслового содержания полученного результата сравнения. В тех случаях, когда сравниваемый показатель больше основания, относительная величина может быть выражена или коэффициентом, или в процентах. Когда сравниваемый показатель меньше основания, относительную величину лучше выразить в процентах; если же сравнительно малые по числовому значению величины сопоставляются с большими, относительные величины выражаются в промилле. Так, в промилле рассчитываются коэффициенты рождаемости, смертности, естественного и механического прироста населения. Расчет относительных величин считается правильным, если для сравнения используются сопоставимые показате ли. К несопоставимости показателей чаще всего приводят различия в методологии сбора, обработки статистической информации, в длительности периодов времени, за которые исчислены сравниваемые показатели, и др. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода и медиана. Модой называется чаще всего встречающийся вариант, или то значение признака, которое соответствует максимальной точке теоретической кривой распределений. Она представляет собой наиболее часто встречающееся или типичное значение. В дискретном ряду мода — это вариант с наибольшей частотой. В интервальном вариационном ряду модой приближенно считают центральный вариант так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). Мода — это именно то число, которое в действительности встречается чаще всего (является величиной определенной), а в практике имеет самое широкое применение (например, наиболее часто встречающийся тип покупателя). 602 Медиана — величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значения варьирующего признака меньшие, чем средний вариант, а другая — большие. Понятие медианы легко уяснить из следующего примера. Для ранжированного ряда (т.е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является вариант, расположенный в центре ряда. В интервальном вариационном ряду порядок нахождения медианы следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал5. Относительные величины структуры характеризуют состав изучаемых совокупностей. Исчисляются они как отношение абсолютной величины каждого из элементов совокупности к абсолютной величине всей совокупности, т.е. как отношение части к целому, и представляют собой удельный вес части в целом. Как правило, относительные величины структуры выражаются в процентах (база сравнения принимается за 100). Показатели структуры могут быть выражены также в долях (база сравнения принимается за единицу). Для изучения изменений объекта во времени строят ряды динамики. Ряд динамики — это ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени. В каждом ряду динамики имеются два основных элемента: 1) показатель времени /; 2) соответствующие ему уровни развития изучаемого явления у. В качестве отчета времени в рядах динамики выступают либо определенные даты (моменты) времени, либо отдельные периоды (годы, кварталы, сутки). Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Их можно выражать абсолютными, относительными или средними величинами. В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определенным датам (моментам) времени, или к отдельным периодам. В соответствии с этим ряды динамики подразделяются на моментные и интервальные: моментныеряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени; интервальные ряды динамики отображают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы (субпериоды) времени. Свойство суммирования уровней за последовательные интервалы времени позволяет получать ряды динамики более крупных периодов. Статистическое отображение развития изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями отображения результатов развития изучаемых показателей не только заданный отчетный период, но и с учетом предшествующих периодов. При составлении таких рядов производится последовательное суммирование смежных уровней. Этим достигается суммарное обобщение результата развития изучаемого показателя с начала отчетного периода (месяца, квартала, года и т.д.). Подробнее см.: http://lib.wsu.ru/books/Bakalavrf)2/page0142.asp 603 При использовании рядов динамики применяется специальная система показателей динамики, куда включаются: абсолютный прирост (сокращение), темп и коэффициент роста, темп и коэффициент прироста, абсолютное значение одного процента прироста. Важнейшим статистическим показателем анализа динамики является абсолютное изменение — абсолютный прирост (сокращение). Абсолютное изменение характеризует увеличение или уменьшение уровня ряда за определенный промежуток времени. Абсолютный прирост с переменной базой называют скоростью роста. Для характеристики интенсивности, т.е. относительного изменения уровня динамического ряда за какой-либо период времени, исчисляют темпы роста (снижения). Интенсивность изменения уровня оценивается отношением отчетного уровня к базисному. Показатель интенсивности изменения уровня ряда, выраженный в долях единицы, называется коэффициентом роста, а в процентах — темпом роста. Эти показатели интенсивности изменения отличаются только единицами измерения. Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым производится сравнение (если этот коэффициент больше единицы), или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень (если он меньше единицы). Темп прироста (сокращения) показывает то, на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу сравнения, и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения. Темп прироста может быть положительным, отрицательным или равным нулю, выражается он в процентах, коэффициент прироста выражается в долях единицы. Темп прироста (сокращения) можно получить и из темпа роста, выраженного в процентах, если из него вычесть 100%. Коэффициент прироста получается вычитанием единицы из коэффициента роста6. Из вышеизложенного можно сделать несколько обобщающих выводов. В основе расчета показателей рядов динамики лежит сравнение его уровней. В зависимости от применяемого способа сопоставления показатели динамики могут вычисляться на постоянной (базисный способ) и переменной (цепной способ) базе сравнения. Ряды динамики формируются в результате сводки и обработки материалов периодического наблюдения. Повторяющиеся во времени (по отчетным периодам) значения одноименных показателей в ходе статистической сводки систематизируются в хронологической последовательности. Для получения научно обоснованных выводов о динамике явления статистические данные должны быть сопоставимыми. Статистика не ограничивается простым описанием явлений, даже если они сгруппированы и переведены в средние величины. У нее есть куда более важная задача — выявить статистические закономерности, т.е. устойчивые связи между явлениями. Наличие и тесноту (силу) связи можно установить, пользуясь регрессионным и корреляционным анализом. Цель корреляционного анализа — измерение тесноты связи между признаками и явлениями. Наличие связи между явлениями совсем не означает, что одно явление служит причиной другого. Коэффициент корреляции позволяет выявить и количественно оценить взаимосвязь между двумя переменными. Он может показывать степень идентично- 6 Подробнее см.: Гусаров В.М. Теория статистики. М: Юнити, 1998; Ряузов Н.Н. Общая теория статистики. М.: Статистика, 1980; Экономическая статистика: Учебник/ Под ред. Ю.Н. Иванова. М.: ИНФРА, 1998. 604 ста характеристик, сравниваемых групп (например, ценностей или доходов), i также степень взаимосвязи между двумя признаками социального объекта (например, зависимость конкретных политических ориентации от величины совокупного дохода). При одновременном возрастании переменных корреляцш называется положительной. Тогда же, когда возрастание одной переменно! связано с уменьшением другой, корреляция считается отрицательной. Крайни* значения коэффициента корреляции обозначаются (+) и (-). В том случае, earn величина коэффициента корреляции составляет (+), можно говорить о тожде стве, если — (-), то о полной обратной зависимости (когда величина одного при знака максимальна, то другого — минимальна). Иногда с помощью коэффици ента корреляции можно установить причинно-следственные связи7. Более глубоко раскрыть характер взаимосвязи между переменными позволя етрегрессионный анализ, используя который можно установить характер и фор му зависимости результативного признака от объясняющих. Задачи регрессион ного анализа — выбор формы связи (например, прямая или обратная, функцио нальная или стохастическая) и определение расчетных значений зависимо! переменной (функции регрессии). Факторный анализ способствует определен™ степени взаимосвязи между непосредственно не наблюдаемыми переменным! (факторами) и эмпирически наблюдаемыми признаками.
Для анализа сложных социально-экономических явлений и процессов ис пользуется такой вид статистических показателей, как индексы. Индекс — этс относительный показатель, характеризующий изменение величины какого либо объекта во времени, пространстве или по сравнению с эталоном. OHI позволяют привести разнородные явления к соизмеримым величинам. Ин дексы разделяют на индивидуальные, характеризующие изменение одноп элемента совокупности, и общие (сводные), при помощи которых можж описать всю совокупность, процесс или явление. По способу построения ин дексы классифицируются на агрегатные и средние. Основное отличие агре гатного индекса состоит в том, что при его расчете только одна величина из меняется, а другая остается неизменной. Индексный метод широко используется как для оценки различных социально-экономических явлений и процессов, так и в аналитических целях.
Ви переглядаєте статтю (реферат): «СТАТИСТИЧЕСКИЙ ИНСТРУМЕНТАРИЙ» з дисципліни «Фундаментальна соціологія»