А.С. Ахременко
ПОЛИТИЧЕСКИЙ АНАЛИЗ и прогнозирование Учебное
пособие
Рекомендовано УМО по классическому университетск...
31 downloads
374 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
А.С. Ахременко
ПОЛИТИЧЕСКИЙ АНАЛИЗ и прогнозирование Учебное
пособие
Рекомендовано УМО по классическому университетскому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки ВПО 030200 - «Политология»
Москва ГАРДАРИКИ 2006
УДК [316.74:32](075.8) ББК60.561.3я71-1
ВВЕДЕНИЕ
А 95
Р е ц е н з е н т ы: доктор философских наук, профессор Т. А. Алексеева; доктор политических наук, профессор И. А. Василенко
А 95
Ахременко, А. С. Политический анализ и прогнозирование : учеб. пособие / А. С. Ахременко. — М.: Гардарики, 2006. — 333 с. ISBN 5-8297-0292-4 (в пер.) Агентство C I P РГБ Учебное пособие подготовлено в соответствии с государственным стандар том высшего профессионального образования. В нем рассматриваются кон цептуальные и методологические проблемы политического анализа и прогно зирования, множество конкретных аналитических и прогнозных техник с учетом их прикладного использования. Издание ориентировано на студен тов, обучающихся по специальности «Политология». Многие его материалы представляют интерес также для получающих профессиональную подготовку по специальностям «Международные отношения», «Связи с общественнос тью», «Социология». УДК [316.74:32](075.8) ББК 60.561.3я73-1
ISBN
5-8297-0292-4
©
«Гардарики», 2006
©
А.С. А х р е м е н к о , 2006
Политический анализ и прогнозирование как научная д и с ц и п л и н а в России пока что делает только первые шаги: это касается и сферы пре подавания, и сферы теоретических и прикладных разработок. Далек от окончательного ф о р м и р о в а н и я единый подход к определению модели специалиста по политическому анализу, в чрезвычайно широком диа пазоне колеблются оценки предметного поля этой д и с ц и п л и н ы . П о з и ц и ю автора данного учебного пособия, если опустить некото рые н ю а н с ы , м о ж н о определить в нескольких тезисах: • Политический анализ и прогнозирование является научной дис циплиной. Такие свойства научного знания, как обоснованность, спо собность быть подтвержденным или опровергнутым, устремленность к п о н и м а н и ю и объяснению, одинаково присущи и теоретическому, и прикладному направлениям политического анализа и прогнозирова ния. Ответу на вопрос «Каким образом?» должен предшествовать ответ на вопрос «Почему?». Это принципиально отличает политического ана литика от политического технолога: последний может действовать, опи раясь на типовые стратегии поведения в типовых ситуациях и не слиш ком задумываться над вопросом «Почему?». • Политический анализ и прогнозирование — многоуровневая дис ц и п л и н а , о р и е н т и р о в а н н а я на решение как познавательных, так и практических задач. Ее уровни тесно связаны между собой прежде всего общностью методологических подходов и методического инст рументария. Наука и практика в политическом анализе и прогнозиро вании имеют множество точек в з а и м о п р о н и к н о в е н и я и соразвития. • И теория, и практика политического анализа и прогнозирования имеют опору в виде эмпирически наблюдаемых фактов, процессов дейст вительности. Любая теория, любая практическая рекомендация тес тируются не просто на логическую непротиворечивость, но на соот-
6
Введение
ветствие реалиям политических процессов (в частности, с о в е р ш е н н о недостаточным аргументом является ссылка на сложившееся, пусть и авторитетное, м н е н и е ) . Любое знание л и б о вытекает из фактов, л и б о проверяется и м и «на прочность». В этом п р и н ц и п и а л ь н о е отличие специалиста по политическому анализу и прогнозированию от поли тического ф и л о с о ф а или публициста.
ГЛАВА 1
Политический анализ и прогнозирование: предметное поле
Таким образом, предметное поле политического анализа, совокуп ность п р и м е н я е м ы х исследовательских техник остаются очень об ш и р н ы м и . Политическая реальность, отличаясь чрезвычайно высо кой сложностью, испытывает воздействие со стороны всех других сфер общественной ж и з н и и, в свою очередь, оказывает на них влия ние. Отсюда богатый арсенал парадигм, методов и к онк р е тных техник анализа и прогнозирования развития политических процессов. Собственно говоря, «набор рабочих инструментов» политического аналитика — от аналитических стратегий парадигмального уровня до приемов обработки данных — является в данной книге приоритет ным. Такие рабочие инструменты окажутся полезными при р е ш е н и и задач как познавательных, так и практических. Разумеется, автор не ставил перед собой цели описать все подходы и методы, используемые для анализа и прогнозирования политичес ких процессов и ситуаций. Первой его задачей было показать много цветную палитру возможностей — разнообразие подходов и методов, п р и м е н я е м ы х в рамках д а н н о й научной д и с ц и п л и н ы . П о л и т и ч е с к и й анализ и прогнозирование может работать в рамках к а к дедуктивной, так и индуктивной логики; способен обрабатывать как количествен ную, так и качественную и н ф о р м а ц и ю ; использует такие п р и н ц и п и ально разные методы, как искусственные н е й р о н н ы е сети и креатив ные экспертные о ц е н к и . Второй задачей (по порядку, но не по значимости) было научить основам практической работы если не со всеми, то с боль ш и нс твом изложенных методов, а также продемонстрировать возможности их п р и м е н е н и я в прикладном и теоретическом анализе п о л и т и к и . По этому в учебном пособии практически каждое положение иллюстри руется к о н к р е т н ы м и примерами. Наконец, третьей задачей автора было внушить читателям понима ние политического анализа и прогнозирования как особого стиля науч ного мышления. Наверное, это самая главная задача, хотя в книге ей не посвящено отдельных глав или параграфов. Автор надеется, что такое понимание придет к читателю по изучении всего представленного здесь материала.
П о л и т и ч е с к и й а н а л и з и п р о г н о з и р о в а н и е как научная д и с ц и п л и н а н а ч и н а е т и н т е н с и в н о развиваться после Второй м и р о в о й в о й н ы . П е р и о д самого бурного ее роста приходится п р и м е р н о на 1960-е — 1970-е гг. и определяется т р е м я ключевыми ф а к т о р а м и . П е р в ы й ф а к т о р — становление мировой политической сис темы как системы б и п о л я р н о г о противостояния двух политических лагерей, возглавляемых Советским Союзом и С о е д и н е н н ы м и Штата ми Америки. Одним из в а ж н е й ш и х процессов, затронувших все сфе ры о б щ е с т в е н н о й ж и з н и , стала при этом гонка вооружений — соревно вание двух сверхдержав за стратегическое военное превосходство. П р о ц е с с гонки вооружений требовал не просто колоссальных затрат ресурсов, но и ясного п о н и м а н и я того, куда и каким образом эти ре сурсы следует направлять, что, в свою очередь, требовало максималь но т о ч н о й о ц е н к и текущей политической ситуации на мировой арене и п о н и м а н и я возможных перспектив ее развития. В числе первых крупных заказчиков и потребителей разработок по политическому анализу и п р о г н о з и р о в а н и ю были структуры, связанные с о б о р о н о й и в о е н н о - п р о м ы ш л е н н ы м к о м п л е к с о м (в частности, Пентагон). М о ж н о ожидать следующего возражения: крупные политические альянсы складывались и р а н ь ш е , и всегда они стремились опередить политических о п п о н е н т о в с т очки зрения военной м о щ и . Почему же резкий взлет интереса к созданию научно обоснованных разработок в области политического анализа происходит и м е н н о в это время? Здесь следует назвать в т о р о й ф а к т о р , тесно с в я з а н н ы й с первым и з а к л ю ч а ю щ и й с я в изменении качества вооружений. В конце Второй мировой войны появляется невиданное по своей разрушительной си ле оружие массового п о р а ж е н и я — ядерное. В условиях глобального п р о т и в о с т о я н и я сверхдержав его п р и м е н е н и е грозило не просто боль-
8
Глава 1. Политический анализ и прогнозирование: предметное поле
ш и м и или м е н ь ш и м и потерями сторон, но тотальным уничтожением одного из противников, а то и обоих вместе с остальной частью чело вечества. Таким образом, специфическое сочетание факторов воен но-технического развития с факторами устройства мировой полити ческой системы обусловило высочайший уровень планки требований, предъявляемых к политическому анализу и прогнозированию. По следствия политических ошибок, возникающих из-за недостатка на дежности и качества в аналитическом обеспечении п р и н я т и я реше н и й , стали в п р я м о м смысле слова витальными. Т р е т и й ф а к т о р носит сугубо технический характер и связан с п о я в л е н и е м и развитием электронной вычислительной техники. Она открыла перед исследователями целый спектр п р и н ц и п и а л ь н о новых возможностей в сфере использования статистических и математичес ких методов, новых подходов к обработке и н ф о р м а ц и и . К примеру, чрезвычайно активно применяемые в современном политическом анализе статистические методы, использующие сравнительно про стой математический аппарат, требуют огромного массива вычисле н и й . С этой задачей даже первые, маломощные ЭВМ справлялись значительно лучше, чем самый одаренный математик. П о я в л е н и е же соответствующих компьютерных программ сделало статистический инструментарий доступным для широкого круга политологов, не об ладающих фундаментальной математической подготовкой. Далее, с учетом рассмотренных трех основных факторов генезиса политического анализа и прогнозирования в качестве научной дисцип л и н ы , разделим основное ее понятие — «политический анализ и про гнозирование» — на две составные части: «политический анализ» и «политическое прогнозирование», а затем определим их соотношение. В современном языке термин «анализ» (от греч. analysis — расщеп ление, разложение на составляющие) понимается в ш и р о к о м смысле как рассмотрение, разбор чего-либо; в более узком — как метод науч ного исследования, состоящий в расчленении целого на составные эле менты, определении состава и свойств объекта изучения. П о н я т и ю «анализ» нередко противопоставляется понятие «синтез» (от греч. syn thesis — соединение, сочетание) — исследование какого-либо явления в единстве и взаимосвязи его частей. Синтез представляет собой обоб щение, сведение в единое целое данных, добытых анализом, поэтому анализ и синтез — неразрывные, д о п о л н я ю щ и е друг друга составляю щие научного исследования. В дальнейшем политический ана лиз мы будем понимать как аналитико-синтетическую процедуру, соче тающую расчленение исследуемого объекта на составные части и соединение этих частей на новом познавательном уровне.
1.1. От проблемы к з н а н и ю : теоретический и прикладной уровни.
9
Оценив процедуру анализа с несколько иной точки зрения, устано вим, что она прежде всего представляет собой определенный набор способов и методов преобразования информации. На «выходе» этого преобразования всегда появляется некое новое знание. Отправной точ кой, «толчком» для осуществления процедуры анализа можно считать определенную проблему — нечто, требующее р е ш е н и я , некое проти воречие, которое следует преодолеть. Характер проблемы всегда явля ется главным фактором, определяющим получаемое знание. Таким образом, в наиболее общем виде анализ — это преобразова ние и н ф о р м а ц и и с целью получения нового з н а н и я , направленного на р е ш е н и е определенной проблемы. Однако мы рассматриваем не просто абстрактный «анализ», но анализ политический, и м е ю щ и й де ло с процессами распределения и использования власти. И в этой свя зи з а к о н о м е р н о возникают четыре вопроса: • Какие проблемы решает политический анализ? • Какое новое знание он продуцирует? • В чем с п е ц и ф и к а и н ф о р м а ц и и , которая конвертируется в новое знание? • Каковы информации?
особенности
самого
процесса
преобразования
1.1. От проблемы к знанию: теоретический и прикладной уровни политического анализа Можно выделить три основных класса проблем, имеющих отношение к политическому анализу. П е р в ы й из них — п о з н а в а т е л ь н ы е п р о б л е м ы , образуемые несоответствием между достигнутым уров нем з н а н и я о политических явлениях, их связи с я в л е н и я м и неполи тическими и требуемым уровнем з н а н и я . Их решение предполагает уменьшение неопределенности относительно связей между полити ческими я в л е н и я м и и процессами. Формулируя познавательную про блему, мы задаемся следующими вопросами: какие факторы влияют на протекание данного процесса и существует ли связь между данны ми я в л е н и я м и , каков ее характер? Преобразуя в ходе политического анализа и н ф о р м а ц и ю в соответ ствии с д а н н ы м классом проблем, мы получаем в результате знание теоретическое, которое отличается: •качеством генерализации ( о б о б щ е н и я ) , способностью распро страняться на широкую совокупность явлений. Конечной целью при этом является формулирование теории — системного знания о зако-
10
Глава 1. Политический анализ и прогнозирование: предметное поле
номерностях, действующих в о п р е д е л е н н о й области реальности. В политической науке теоретическое знание объясняет не отдельные политические я в л е н и я , а классы политических я в л е н и й и процессов. К о н к р е т н а я политическая ситуация или процесс интересны не сами по себе, а к а к носители некой общей закономерности; •долгосрочной актуальностью сформулированных выводов и за кономерностей. Объектом теоретического исследования выступают политические процессы, не л и м и т и р о в а н н ы е (точнее, ограниченно л и м и т и р о в а н н ы е ) с точки зрения временных характеристик; • ориентацией на интересы общества в целом, которое выступает (пусть косвенно) «заказчиком», «клиентом» политического аналити ка, продуцирующего теоретическое знание; • сравнительно н и з к и м уровнем активности, преобразовательного потенциала, особенно на коротких временных интервалах. Теорети ческое з н а н и е не рассчитано на непосредственное п р и м е н е н и е в кон кретной политике, достижение ощутимого политического эффекта в б л и ж а й ш е й перспективе. Уровень политического анализа, продуцирующий з н а н и е такого характера, мы будем называть теоретическим уровнем. Второй класс образуют к о н к р е т н ы е п р о б л е м ы п о л и т и ч е с к и х а к т о р о в — значимых субъектов (участников) политиче ского процесса. В качестве таковых могут выступать политические лидеры, партии, органы государственной власти, лоббистские груп п ы , задействованные в политике ф и н а н с о в о - п р о м ы ш л е н н ы е компа н и и и т.д. Здесь необходимо выяснить, например, оптимальное рас п р е д е л е н и е п о л н о м о ч и й и ресурсов между у р о в н я м и в л а с т н о й вертикали: федеральным, региональным и м у н и ц и п а л ь н ы м ; характер действий, способных усилить роль института политических партий в политической системе общества; политические приоритеты, основ н ы е в д а н н о й ситуации для данного актора. Третий класс составляют п р о б л е м ы о б щ е с т в е н н о й ж и з н и, напрямую не затрагивающие властные о т н о ш е н и я , но требующие для своего р е ш е н и я политических методов. К таковым относится, на пример, проблема выработки э ф ф е к т и в н о й государственной полити ки в определенной сфере: образовательной, торговой, банковской, в области здравоохранения, охраны прав собственности и т.д. Преобразование информации для решения второго и третьего класса проблем формирует особый тип знания — прикладное. Если теоретичес кое знание отвечает на вопросы о долгосрочных и общих закономернос тях, то прикладное — о способах поведения в сложившихся конкретных условиях. Главный вопрос прикладного исследования: «Что делать?» Оно
1.1. От проблемы к з н а н и ю : теоретический и прикладной уровни.
11
ориентировано на принятие тех или иных политических решений, на снижение неопределенности для политических акторов. При этом до стигнутое знание не обязательно должно носить рекомендательный ха рактер типа «следует совершить действия 1, 2, 3...». Обозначение альтер натив поведения актора с учетом их последствий — это уже прикладное знание, полезное для лица, принимающего решение. Оно может быть сформулировано, например, таким образом: «В рамках данной ситуации существуют три стратегии поведения, каждая из которых несет в себе следующие риски и ориентирована на следующие выигрыши...» В лю бом случае конкретная форма прикладного знания будет обусловлена потребностями, интересами, особенностями восприятия того политиче ского актора, чья проблема решается аналитиком. Прикладное знание характеризуется: • утилитарностью, полезностью для р е ш е н и я конкретной пробле мы конкретного политического актора. В отличие от теоретического з н а н и я , ориентированного на долгосрочный общественный интерес, прикладное нацелено на удовлетворение потребностей определенно го клиента, заказчика (хотя в качестве такого заказчика могут высту пать отдельные государства и даже надгосударственные образования). Политический анализ, продуцирующий такое з н а н и е , нередко назы вают к л и е н т - о р и е н т и р о в а н н ы м ; • краткосрочной (в той или иной мере) актуальностью полученного знания. Объектом прикладного политического анализа являются про блемы и ситуации, четко локализованные в пространстве и времени. Со ответственно, прикладное знание в гораздо меньшей степени обладает свойством генерализации по сравнению со знанием теоретическим. Прикладное знание — это знание о данной политической ситуации, дан ном объекте, явлении, а не о классе ситуаций, объектов или явлений; •высоким преобразовательным потенциалом, активностью. При кладное з н а н и е имеет целью непосредственное влияние на текущие политические процессы, их к о р р е к ц и ю в соответствии с интересами клиента. Отсюда тесная связь прикладного политического анализа с политическим менеджментом — наукой об управлении политически 1 ми процессами . Проблема существования двух уровней политического анализа — теоретического и прикладного — довольно четко выявляется при пере воде термина «политический анализ» с английского языка на русский. В английском языке существуют по крайней мере два понятия, отража' Э т о дает повод н е к о т о р ы м а в т о р а м считать п о л и т и ч е с к и й а н а л и з политико-уп р а в л е н ч е с к о й д и с ц и п л и н о й , п р и у м е н ь ш а я его р о л ь в с о з д а н и и теорий (см., н а п р и м е р : Туронок, С. Г. П о л и т и ч е с к и й а н а л и з : курс л е к ц и й . М, 2005).
12
Глава 1. Политический анализ и прогнозирование: предметное поле
ющие различные интерпретации политического анализа: «political analysis* и «роliсу analysis*. Слово «politics» означает собственно поли тическую сферу, совокупность отношений между индивидами и груп пами по поводу распределения власти в обществе. Слово «роliсу» озна чает п о л и т и ч е с к и й курс, сознательно выработанную стратегию, направленную на решение определенной проблемы с использованием властных ресурсов. Нередко встречается также термин «public policy» со значением сферы политического управления, подконтрольной обще ственности. Соответственно, выделяются термины «political analysis» (анализ политической сферы как таковой) и «policy analysis*, или «ръшlic policy analysis* (анализ политического действия, определенного по литического курса). Первый в большей мере отражает теоретический уровень политического анализа, второй — прикладной уровень. П р и всей значительности различий между прикладным и теорети ческим уровнями политического анализа различия эти нельзя возво дить в абсолют. Между н и м и нет к а м е н н о й стены, два уровня полити ческого анализа имеют много общего, дополняют друг друга. Так, в р е ш е н и и прикладной задачи часто бывает необходимо опереться на теоретические наработки, о б ъ я с н я ю щ и е изучаемый класс явлений. Предположим, целью прикладного исследования является выработка р е к о м е н д а ц и й по п о в ы ш е н и ю уровня поддержки избирателями на предстоящих выборах депутатов Государственной думы политической партии N, принадлежащей к правому флангу политического спектра. Необходимым теоретическим подспорьем в решении д а н н о й пробле мы будет совокупность з н а н и й о закономерностях в л и я н и я различ ных факторов на уровень электоральной поддержки правых партий в России. Н а п р и м е р , знание известного факта, что поддержка правых у нас более высока в городах по сравнению с сельской местностью, ока жется н е с о м н е н н о полезным при формулировании рекомендаций. От глубины теоретических з н а н и й зависит выбор э ф ф е к т и в н о й приклад н о й модели р е ш е н и я проблемы. Другое дело, что оно не может быть обеспечено только за счет привлечения совокупности теоретических з н а н и й . Необходимо вовлечь в анализ и факторы, изучаемые на тео ретическом уровне и обладающие долгосрочным влиянием, и факто ры краткосрочного плана, определяющие с п е ц и ф и к у к о н к р е т н о й предвыборной ситуации — от расстановки политических сил до даты выборов. В свою очередь, частное з н а н и е , получаемое в рамках при кладных политических исследований, нередко оказывается п о л е з н ы м для формулирования общих, долгосрочных закономерностей. Хотя о п я т ь же набор результатов отдельных прикладных исследований не достаточен для создания теории. Необходимо использование с п е ц и -
1.2. Методологический уровень политического анализа
13
альных процедур, позволяющих удостовериться в действительной общности частных прикладных з н а н и й . И теоретический, и п р и к л а д н о й уровень политического анализа связаны с преобразованием политической реальности. П р и этом при кладной, как уже отмечалось, имеет дело с более б л и з к и м и временны ми горизонтами, его преобразовательный потенциал может быть реа л и з о в а н в к р а т к о с р о ч н о й п е р с п е к т и в е . О д н а к о и теоретический уровень анализа отнюдь не представляет собой «башню из слоновой кости»: в к о н е ч н о м счете вся политическая аналитика и прогностика ориентирована на создание активного з н а н и я . Фундаментальной характеристикой политического анализа как научной д и с ц и п л и н ы является стремление к п о н и м а н и ю и объясне нию политической реальности. Теоретический и прикладной уровни различаются глубиной, степенью о б о б щ е н и я , масштабом, актуально стью объяснительных моделей. Но в л ю б о м случае решение даже са мой «приземленно-практической», самой к о н к р е т н о й проблемы по литического анализа невозможно без понимания логики происходящих процессов, ф а к т о р о в , влияющих на их развитие. Теоретический и прикладной уровни анализа имеют много общего и в плане критериев научности получаемого з н а н и я , и в плане мето дологии и методик преобразования и н ф о р м а ц и и , и в плане общности и н ф о р м а ц и о н н о г о массива на «входе» анализа. Чтобы говорить об этом более предметно, рассмотрим еще один уровень политического анализа — методологический.
1.2. Методологический уровень политического анализа Мы говорили о трех классах проблем, с которыми имеет дело полити ческий анализ: познавательные проблемы, конкретные проблемы по литических акторов, проблемы общественной ж и з н и , требующие для своего р е ш е н и я политических методов. Однако есть и четвертый класс проблем, относящийся не к внешней для политического анализа среде, а к самому процессу преобразования информации в новое знание. К а к и е научные методы оптимальны для достижения поставленных целей? К а к убедиться, что используемые ме тоды э ф ф е к т и в н ы для решения и м е н н о тех задач, которые ставит перед собой исследователь? Какие операции по преобразованию информа ции следует осуществить, чтобы процедура анализа была оптимальной с точки зрения затрат ресурсов и получаемых результатов? Как отли чить и н ф о р м а ц и ю , действительно нужную для исследования, от «ин-
14
Глава 1. Политический анализ и прогнозирование: предметное поле
формационного шума»? Как получить обоснованные выводы и что яв ляется критерием их обоснованности? Какая исследовательская стра тегия будет оптимальной для решения проблемы данного типа? Отве чая на эти вопросы, мы получаем знание, которое будем называть методологическим, равно как и соответствующий уровень анализа. Методология — это система принципов научного исследования, со вокупность исследовательских процедур по сбору, первичной обработке 1 и анализу информации . Методологический уровень политического ана лиза «отвечает» за то, чтобы совокупность операций по преобразованию информации в теоретическое и прикладное знание о политике осуще ствлялась правильным образом. Это означает, во-первых, соответствие общенаучным принципам конструирования нового знания. Важнейшее место среди них занимают принципы логической и эмпирической обос нованности, проверяемости на истинность/ложность, эксплицитности (т.е. все правила получения нового знания должны быть сформулирова ны ясно и четко). И прикладной, и теоретический политический анализ являются научными методами познания: здесь ничто не принимается на веру без соответствующих доказательств, обоснований, контрольных процедур. Во-вторых, правильное преобразование исходной информа ции в новое знание должно учитывать специфику предметной области политического анализа — политической сферы жизни общества. Методологическое о с н а щ е н и е современного политического ана лиза включает: •общие п р и н ц и п ы ф о р м и р о в а н и я исследовательской стратегии, правила определения проблемы, объекта и предмета, постановки це лей и задач исследования, операционализации п о н я т и й и выдвиже н и я гипотез. Д а н н ы е п о з и ц и и фиксируются на п р о г р а м м н о м уровне любого политико-аналитического исследования; • совокупность методов сбора и н ф о р м а ц и и , ее тестирования в со ответствии с определенными к р и т е р и я м и ; •количественные (формализованные) и качественные (содержа тельные) методы анализа данных; • аналитические стратегии, формируемые различными парадигма тическими подходами к п о н и м а н и ю политики и политической науки. Отличительной чертой политического анализа, самым непосредст венным образом влияющей на его методологическую и методическую базу, является необходимость работать с разноплановой, разнокачест венной информацией. Политическая система, которую классик совре1
С м . : Ядов, В. А. С о ц и о л о г и ч е с к о е исследование: методология, п р о г р а м м а , мето
д ы . С а м а р а , 1995. С. 31.
1.2. Методологический уровень политического анализа
15
менной политологии Д. Истон определил как «совокупность взаимодей ствий по властному распределению ценностей для общества», относится к системам высшего порядка. Ее поведение определяется взаимодейстиием множества переменных и факторов, обладающим сложной струк турой как внутренних связей между ее элементами, так и внешних связей системы и среды. Статус политики как универсальной регулирующей деительности обусловливает тесное взаимодействие и взаимопроникнове ние политической системы общества и его экономической, социальной, культурной систем, которые, в свою очередь, являются сложными систе мами высшего порядка. На «входе» политического анализа образуются огромные массивы данных, касающихся самых разных сфер жизни об щества: это и социально-экономическая статистика, и данные опросов общественного мнения, и материалы политико-психологических иссле дований, и тексты С М И , и многое другое. Адекватная работа с этими данными требует привлечения как конкретных аналитических техник, так и общих теоретико-методологических подходов из самых разных областей знания. В результате важной отличительной чертой политического анализа следует считать, используя терминологию АА. Дегтярева, «гетерогенность его концептуально-методической базы». К этому можно добавить также методическую и информационную гетерогенность базы политического анализа. Политический анализ, по мнению Дегтярева, довольно «космополитичен» в отношении концептуальных подходов и принципов, поскольку заимствует их из самых разных социальных, гуманитарных и даже естественных наук. Во многом это связано с самим объекгом исследования, который необходимо препарировать сразу в нескольких предметных плоскостях. Например, чтобы проанализировать нею совокупность последствий для российской политики американской поенной кампании в Ираке (2003), нужно привлечь концептуальные зна ния из теории международных отношений, международной экономики, 1 поенной науки, социологии, истории, психологии, статистики и т.д. Следует отметить, что обилие разноплановой информации актуально и для теоретического, и для прикладного политического анализа. Сегодня мы все живем в информационно-избыточном мире, но политичеI кий аналитик ощущает эту избыточность, как, наверное, никто другой. Одна из важнейших функций политического анализа — редукция, «сжатие» информационных массивов до разумного, поддающегося реальному осмыслению объема. Эта ф у н к ц и я реализуется как посредством мыслительного приема абстрагирования (от лат. abstractio — мысленС м . : Дегтярев, А. А. П о л и т и ч е с к и й а н а л и з к а к п р и к л а д н а я д и с ц и п л и н а : предмет ное ноле и н а п р а в л е н и е р а з р а б о т к и // П о л и с . 2004. № 1.
1.3. Политический анализ и парадигмы политической науки
Глава 1. Политический анализ и прогнозирование: предметное поле
16
ное отвлечение от тех или иных сторон, свойств и связей объекта с це лью выделения существенных и закономерных признаков), так и с по мощью специальных количественных техник. В современной науке тех ники сжатия данных получили общее название Data Mining (в перев. с англ. буквально — «раскопка данных», поиск практически полезных и нетривиальных сведений в большом объеме сырой информации). Совокупность методов обработки и анализа и н ф о р м а ц и и можно разбить на следующие основные группы: 1. Методы,
применяемые
и
в
гуманитарных,
и
в
естественных
на
уках. Это прежде всего статистические методы анализа данных — кор р е л я ц и о н н ы й , регрессионный, ф а к т о р н ы й , д и с к р и м и н а н т н ы й , клас тер-анализ, а также математическое моделирование. 2. Методы,
применяемые
исключительно
в
гуманитарных
науках,
прежде всего в социологии, психологии и лингвистике. В основном это методы анализа текстов (традиционный анализ документов, кон тент-анализ и др.), однако сегодня в политическом анализе ш и р о к о используются также методы маркетинга, конкретной э к о н о м и к и (на пример, ситуационный и SWOT-анализ). 3. Методы тельно
в
анализа
рамках
данных,
политической
разработанные науки
и
(например,
используемые
исключи
ивент-анализ,
или
анализ политических событий). Развитие методического арсенала политического анализа идет в двух направлениях: адаптация методов других д и с ц и п л и н примени тельно к проблемному полю политической науки и практики и разра ботка собственных специфических методов анализа данных. Названные выше методы применяются как на теоретическом, так и на прикладном уровне политического анализа. Например, с помо щью кластер-анализа (статистического метода многомерной класси ф и к а ц и и , позволяющего объединять в группы сходства объекты, об ладающие множеством характеристик) м о ж н о решать как сугубо прикладную задачу определения группы территорий, где данная пар тия способна показать наиболее высокий результат, так и вполне тео ретическую задачу типологизации регионов России с точки зрения общности электоральной культуры. Однако есть еще одна, специфическая именно для прикладного ана лиза методологическая составляющая, пересекающаяся с подходами теории управления. Поскольку прикладной анализ политики нацелен на формулирование знания, ориентированного на принятие определен ных решений и осуществление определенных действий, зачастую требу ется — кроме получения адекватного знания о некоторой политической ситуации — адаптировать, приспособить это знание к процессу приня-
17
тия и реализации политических решений. Так, полученное в ходе анали за знание представляется в форме альтернатив политического действия, которые могут быть протестированы на соответствие определенному критерию (правилу выбора) с помощью созданной аналитиком модели данной ситуации. Такая адаптация осуществляется с помощью специ альных методов, пограничных для политического анализа и теории управления. К ним относятся SWOT-анализ, методика «стоимость — эффективность» и др. Здесь мы коснемся методов такого типа л и ш ь 1 вкратце, так как по ним существует отдельная литература . Подводя некоторые итоги, можно утверждать, что методологический уровень политического анализа обеспечивает исследовательским инст рументарием и теоретический, и прикладной уровень. Он не просто дает возможность получать обоснованное теоретическое или прикладное зна ние, но и формирует единое пространство коммуникации «прикладни ков» и «теоретиков», вырабатывает общий язык, позволяющий полити ческим аналитикам обогащать с в о и з н а н и я и представления о политической реальности. В конечном счете конструируется единое про странство понимания политической реальности. Именно методология и методики политического анализа будут в центре нашего внимания. Графически соотношение трех уровней политического анализа м о ж н о представить следующим образом:
1.3. Политический анализ и парадигмы политической науки В предыдущем параграфе среди основных компонентов методологи ческого о с н а щ е н и я современного политического анализа мы называ ли аналитические стратегии, формируемые различными парадигма т и ч е с к и м и подходами к п о н и м а н и ю п о л и т и к и и политической науки. Остановимся на этом подробнее. ' Из работ отечественных авторов следует назвать прежде всего книгу А.А. Дегтяре ва « П р и н я т и е п о л и т и ч е с к и х р е ш е н и й » ( М . , 2004), а также в ы ш е н а з в а н н ы й курс л е к ц и й по п о л и т и ч е с к о м у анализу С.Г. Туронка. 2 - 3863
18
Глава 1. Политический анализ и прогнозирование: предметное поле
Современные политологические парадигмы характеризуются не просто различным пониманием связи между явлениями, но принципи альными подходами к формированию научного знания, магистральны ми путями построения здания политической науки. Это положение можно наглядно проиллюстрировать сравнением двух ведущих пара дигм современной западной политологии — теории рационального вы 1 бора и бихевиоризма (постбихевиоризма) . Т е о р и я р а ц и о н а л ь н о г о в ы б о р а (или, как е е иначе на зывают, п о з и т и в н а я п о л и т и ч е с к а я теория) стремится выстроить здание политической науки на основе совокупности простых аксио матических утверждений, которые затем развиваются в теоремы, эво л ю ц и о н и р у ю щ и е , в свою очередь, в сложные теоретические конст рукции. Даже на уровне понятий просматривается явная аналогия с математикой: действительно, теория рационального выбора исполь зует присущий математике дедуктивный подход к ф о р м и р о в а н и ю тео р и и . Схематично дедуктивный подход м о ж н о изобразить следующим образом:
К а к видно из приведенной схемы, отправным пунктом является теория. На основе определенных теоретических положений дедуктив н ы м путем формируются предположения относительно ф а к т о в реаль ной действительности, которые затем сопоставляются с этими факта ми. В случае соответствия предположений фактам теория получает дополнительное подтверждение. В случае несоответствия теория в ее н ы н е ш н е м виде отвергается, ее место занимает другая, скорректиро в а н н а я в соответствии с фактами. В п о з и т и в н о й политической теории ключевым к о н ц е п т о м «аксио матического» уровня является утверждение о рациональности индиви да. Содержание понятия «рациональность» требует некоторых пояснеТретьей ведущей п а р а д и г м о й является н е о и н с т и т у ц и о н а л и з м .
1.3. Политический анализ и парадигмы политической науки
19
ний. Считается, что индивид выбирает из нескольких альтернатив по ведение в соответствии со своими предпочтениями. Другими словами, индивид способен установить некоторое соотношение между альтер нативами с точки зрения своих предпочтений, ранжировать их. Так, если А имеет три альтернативы — х, у, z, — он может соотнести их меж ду собой: предпочесть альтернативу х альтернативе у (символически хР^у), а альтернативу^ — альтернативе z (yP^z), и на этой основе при нимать р е ш е н и я . Также возможна ситуация, когда альтернативы яв ляются р а в н о з н а ч н ы м и для индивида: в этом случае говорят, что он индифферентен в о т н о ш е н и и этих альтернатив (например, в отноше х нии альтернатив у и z (у1д1) - В качестве аксиомы принимается ут верждение, что при рациональном принятии решений индивид стре мится к м а к с и м и з а ц и и своей выгоды, т.е. в ситуации хР^у и yP^z выбором А станет альтернатива х. Чтобы решение, принятое индивидом в соответствии со своими предпочтениями, считалось рациональным, необходимо соблюдение двух дополнительных условий. Первое условие — сопоставимости, или полноты, — гласит, что для любой пары альтернатив должно быть воз можно установление отношения предпочтения или индифферентности. В соответствии со вторым условием — транзитивности — отношения предпочтения являются транзитивными в случае, если мы, например, знаем, что А предпочитает альтернативу х альтернативе у (хР лу), а альтер нативу у — альтернативе z iyP^z), и можем однозначно заключить, что х для А предпочтительнее, чем z (xP^z)- То же самое для отношения индиф ферентности: если х!$ и yl^z, то всегда xl^zСодержательно теория рационального выбора концентрируется на проблемах т р а н с ф о р м а ц и и совокупности индивидуальных выборов в коллективный выбор. С т о р о н н и к а м этого подхода удалось убедитель но доказать, что коллективный выбор отнюдь не сводится к простой сумме индивидуальных выборов: он определяется с п е ц и ф и ч е с к и м и законами и подвержен в л и я н и ю специфических факторов. Одним из наиболее ярких примеров трудностей, возникающих при агрегировании индивидуальных предпочтений в единый групповой выбор, является открытый около двухсот лет назад парадокс «циклич ного голосования» (парадокс Кондорсе). Было установлено, что при принятии р е ш е н и я большинством голосов и при наличии более двух альтернатив существует вероятность в о з н и к н о в е н и я ситуации, когда 1
В о с в е щ е н и и проблем теории р а ц и о н а л ь н о г о выбора автор использует подходы од ного из наиболее п о п у л я р н ы х в С Ш А учебных пособий профессоров Гарвардского уни верситета: Sheplse, К. A., Bonchek, M.S. Analyzing Politics. N.Y., 1997. 2-
20
Глава 1. Политический анализ и прогнозирование: предметное поле 1.3. П о л и т и ч е с к и й анализ и парадигмы политической науки
решение не может быть принято в п р и н ц и п е . Так, есть группа из трех индивидов А, В и С и три кандидата N, М, О. Предпочтения индиви дов (по нисходящей) относительно кандидатов будут следующие:
А
В
с
N
О
м
М
N
О
О
M
N
Голосование по системе большинства будет представлять собой п о п а р н о е рассмотрение альтернатив всеми участниками. Н е с л о ж н о убедиться, что такая процедура в д а н н о й ситуации п р и н ц и п и а л ь н о 1 не с п о с о б н а в ы я в и т ь победителя: N победит M , О победит N, М победит О. Таким образом, голосование приобретает ц и к л и ч е с к и й характер. Однако представим, что меняется сам способ п р и н я т и я р е ш е н и я : сначала на голосование выносится одна пара альтернатив, а затем по бедитель в этой паре соревнуется с оставшейся третьей альтернати вой. Несложные логические умозаключения быстро приведут нас к выводу, что всегда победителем окажется третья альтернатива, а обе а л ь т е р н а т и в ы п е р в о г о г о л о с о в а н и я проиграют. С о о т в е т с т в е н н о , п р и н ц и п и а л ь н о е значение имеет вопрос о том, кто из троих участни ков группы будет формировать повестку голосования. Так, А выберет п о р я д о к «О против М, победитель против N», поскольку N — лучший кандидат для А — в этом случае однозначно выиграет. Это построение на самом деле является пусть простейшей, но все же работающей моделью влияния институционального фактора (как проводится процедура голосования) на политическое поведение. Тео рия рационального выбора располагает на сегодняшний день множе ством куда более сложных моделей, с помощью которых м о ж н о ана лизировать и предсказывать сложные политические процессы. М н о г и е из этих моделей изначально разрабатываются в рамках эко н о м и ч е с к о й науки, а затем адаптируются применительно к политиче с к и м реалиям. О с н о в н ы м методом конструирования теории является математическое моделирование. ' Я с н о , что А выберет N, так к а к это его наиболее предпочтительная альтернатива. В соответствии с той же л о г и к о й С выберет М. Р е ш а ю щ и м с т а н о в и т с я голос В, д л я ко т о р о г о N п р е д п о ч т и т е л ь н е е М.
21
Бихевиористский п о д х о д предполагает п р и н ц и п и а л ь н о иную логику построения научного з н а н и я , диктуемую индуктивным подходом. Вместо того чтобы строить теорию на основе простейших аксиоматических (следовательно, непроверяемых) утверждений, бихе виоризм кладет в фундамент научного знания обобщения эмпиричес ких фактов. Схематично индуктивную логику можно представить сле дующим образом:
Итак, ключевой процедурой в ф о р м и р о в а н и и теоретического зна н и я является генерализация — обобщение отдельных наблюдений. Важнейшим способом осуществления генерализации в этих условиях становится статистика — совокупность методов количественного о п и с а н и я и о б о б щ е н и я данных. Своеобразный «лозунг» бихевиориз ма — «что не измерено, то не понято». Н и к а к и е априорные, аксиома тические, непроверяемые д о п у щ е н и я о политической действительно сти не позволительны. Еще одно отличие бихевиористской теории от парадигмы рационального выбора состоит в том, что ее «базовой еди ницей анализа» является не р а ц и о н а л ь н ы й индивид, а скорее социаль ная
группа.
Вернемся к уже затронутой выше проблеме влияния институтов на политическое поведение, но теперь рассмотрим ее сквозь призму би хевиористского подхода. В индуктивной логике исследования прежде всего определим совокупность эмпирических данных, имеющих отно шение к н а ш е й проблеме. Н а п р и м е р , это будут данные о результатах выборов в ряде стран с различными избирательными системами (пра вилами определения победителя или победителей голосования). Далее станем искать систематически наблюдаемые различия в результатах выборов, проходивших в разных институциональных средах. Когда та ковые различия обнаружатся, мы должны будем четко соотнести осо бенности распределения голосов и тип избирательной системы, т.е. обнаружить статистическую связь между этими двумя переменными, которая и ляжет в основу создаваемой теории. В краткой форме основные различия между теорией рационального выбора и бихевиористской парадигмой представлены в следующей таб лице:
22
Глава 1. Политический анализ и прогнозирование: предметное поле Теория рационального выбора
Логика построения знания Дедуктивная Априорные предпосылки Единица анализа Основной метод
Цель
Бихевиоризм Индуктивная
Рациональность
-
Индивид
Группа
Математическое моделиро Статистическое обобщение вание Создание индуктивной Создание дедуктивной науки на базе обобщения ко науки на базе совокупности личественных характеристик простых аксиом политического поведения
Как видим, различия теории рационального выбора и бихевиориз ма не просто существенны — о н и фундаментальны. Как же в этой си туации действовать политическому аналитику? Идти путем приложе н и я д е д у к т и в н ы х моделей к изучаемому объекту п о л и т и ч е с к о й реальности или начинать со скрупулезного изучения фактических данных, чтобы затем обобщить их? Ответ заключается в том, что оба пути возможны. Каждый из них — своего рода аналитическая страте 1 гия , э ф ф е к т и в н о с т ь которой будет определяться конкретной ситуа цией, с п е ц и ф и к о й теоретической или прикладной проблемы. Более того, э ф ф е к т и в н ы м в ряде случаев может оказаться сочетание различ ных подходов, при том что ни одно исследование не является в чис том виде индуктивным или дедуктивным. Парадигмальный уровень политической науки на с е г о д н я ш н и й день весьма разнообразен, насыщен различными к о н ц е п ц и я м и . Толь ко в сфере международных о т н о ш е н и й можно выделить по м е н ь ш е й мере четыре направления: неолиберализм, неореализм, конструкти визм и постмодернизм. В нашем учебном пособии мы не располагаем возможностью охарактеризовать множество политологических пара дигм содержательно, тем более что в отечественной образовательной традиции это прерогатива д и с ц и п л и н ы «Теория политики». О д н а к о специалист по политическому анализу всегда должен помнить, что в его р а с п о р я ж е н и и имеется богатый арсенал аналитических стратегий, которые могут быть использованы для р е ш е н и я как теоретических, так и прикладных задач.
' В современной западной литературе наиболее полно освещает проблему выбора аналитической стратегии на парадигмальном уровне следующая работа: Hay, С. Politi cal Analysis. A Critical Introduction. Palgrave, 2004.
1.4. Политический анализ и политическое прогнозирование
23
1.4. Политический анализ и политическое прогнозирование Под прогнозом в науке понимается вероятностное, научно обосно ванное суждение о будущем. И м е н н о вероятностный характер прогно за и его научная обоснованность отличает д а н н ы й вид з н а н и я от дру гих форм предвидения. Последнее включает в себя любые способы получения и н ф о р м а ц и и о будущем, в том числе, например, астроло гический. Прогнозирование развивается сегодня в рамках как отдельных сфер (прогнозирование погоды в метеорологии, д и н а м и к и валютных курсов в э к о н о м и к е и т.д.), так и междисциплинарного направления. Второй вектор развития связан со значительной методологической и методической общностью подходов к разработке прогнозов в разных отраслях научного з н а н и я . В то же время прогнозирование в каждой отдельной области обладает существенной с п е ц и ф и к о й , определяе мой особенностями объекта п р о г н о з и р о в а н и я . В политической науке о с н о в н ы м и объектами п р о г н о з и р о в а н и я являются политическая сис тема и политический процесс, а также их отдельные компоненты и субъекты. Соответственно, политический прогноз — это веро ятностное, научно обоснованное суждение о возможных состояниях по литических систем, процессов и субъектов в будущем, о тенденциях их развития. Здесь мы отвечаем на вопрос: каким образом будет разви ваться изучаемое политическое я в л е н и е , процесс в течение опреде ленного периода времени начиная с настоящего момента? В прогнос 1 тике такой период называется периодом упреждения прогноза . Однако это не единственно возможная цель политического про гнозирования. В общественных науках субъект познания может вы полнять активную, преобразовательную ф у н к ц и ю , влияя на изучае мые процессы. Еще один вопрос, на который способно дать ответ политическое прогнозирование, заключается в том, как достичь опре деленного положения вещей, желательного для заданного политичес кого субъекта? Такой вид прогнозирования будет называться норма тивным, поскольку предполагает постановку определенной цели — некоего идеального образа конечного результата. Впрочем, возможен путь и «от противного», когда формируется образ наиболее неблаго приятной для субъекта политики ситуации с целью обеспечить его го товность к действию в ситуации максимальных рисков. Так или иначе, нормативный прогноз будет определяться как вероятностное, О терминологическом аппарате прогнозирования см.: Рабочая книга по прогно зированию. М , 1982.
24
Глава 1. Политический анализ и прогнозирование: предметное поле
научно обоснованное суждение о возможных путях и сроках достижения заданного состояния политических систем, процессов, субъектов. Если исследователь не определяет какое-то желаемое будущее со стояние, а рассматривает альтернативы развития объекта прогнозиро вания, исходя л и ш ь из действующих факторов и тенденций, не оце н и в а я их с т о ч к и з р е н и я б л а г о п р и я т н о с т и (желательности) для некоторого субъекта политики, — такое прогнозирование будет назы ваться поисковым. Итак, политический прогноз — это вероятностное, научно обоснованное суждение: •о возможных состояниях политических систем, процессов и субъектов в будущем, о тенденциях их развития (поисковый прогноз); • о возможных путях и сроках достижения заданного состояния политических систем, процессов, субъектов (нормативный прогноз). Графически различие между н о р м а т и в н ы м и п о и с к о в ы м прогно зированием отображено на схеме:
Следует обратить внимание, что в обоих случаях из настоящего в бу дущее ведет не одна стрелка, а н е к и й «сноп траекторий». В поисковом прогнозировании траектории расходятся, ведут к существенно разным состояниям возможного будущего, тогда как в нормативном — сходят ся в одной целевой точке. Однако в любом случае речь идет о несколь ких возможных путях, альтернативах развития объекта прогнозирова н и я . Это очень важное свойство политической прогностики. Взаимодействия по распределению и использованию власти носят чрезвычайно с л о ж н ы й характер. На них влияет множество факторов и субъектов, причем отнюдь не только собственно политического рода: в ы ш е мы уже отмечали влияние на политику э к о н о м и ч е с к о й , соци альной, культурной систем ж и з н и общества. Не следует забывать и о том, что политический процесс творится человеческой деятельностью и «человеческое измерение», несмотря на всю трудность его концеп туализации и операционализации, не может быть исключено из рас смотрения исследователем политики. Политическая деятельность ин дивидуальна, т.е. субъектна и субъективна, и нередко не может быть исчерпывающе объяснена рациональными причинами. Особую роль в
1.4. Политический анализ и политическое прогнозирование
25
политическом процессе играет психологический фактор: сам по себе феномен власти и властных отношений содержит в качестве сущностной составляющей межличностное взаимодействие. Из всего вышесказанного для политического прогнозирования важнейшим является следующее: ни одна будущая стадия политического процесса — наступление тех или иных событий, ситуаций — не может быть предсказана с вероятностью, равной единице. Всегда имеется спектр альтернативных будущих состояний политического объекта, которые могут быть актуализированы с определенной степенью вероятности. И м е н н о установление такого «веера» основных альтернатив и факторов, в л и я ю щ и х на вероятность их осуществления, составляет в самом общем виде задачу политической прогностики. Ее целью отнюдь не является точное предсказание наступления конкретных событий; более того, сама по себе постановка такого рода утопической цели свидетельствует о н е п о н и м а н и и аналитиком фундаментальных характеристик политической реальности. Фактически спектр основных ф у н к ц и й политического прогнозирования можно представить следующим образом: Нормативное прогнозирование Поисковое прогнозирование Показать наиболее предпочтительные Показать альтернативы политического развития, которые могут быть реализова (или, наоборот, неблагоприятные) для за данного субъекта политики альтернативы ны с той или иной вероятностью развития Выявить факторы, тенденции, возмож ные действия субъектов, влияющие на ре ализацию определенной альтернативы развития
Выявить факторы, тенденции, субъектов, на которые заданный субъект политики может оказывать влияние с целью реали зации наиболее благоприятных альтерна тив (или избежать наименее благоприят ных исходов)
Еще одна важная особенность политического (и социального в це лом) прогнозирования связана с так называемыми парадоксами само осуществления и самоопровержения^. В политике сам факт создания прогноза может стать новым фактором в процессе, который данный прогноз рассматривает, и в этом кардинальное отличие социально-по литического прогноза от естественно-научного. Значительная часть политических прогнозов является «активными», т.е. способными воз действовать на поведение системы, в отличие от «пассивных» прогно1
С м . : Мартына, Дж.
Т е х н о л о г и ч е с к о е п р о г н о з и р о в а н и е . М, 1977; Яковлев,
И. Г.
И н ф о р м а ц и о н н о - а н а л и т и ч е с к и е т е х н о л о г и и и п о л и т и ч е с к о е консультирование / По л и т и ч е с к и е и с с л е д о в а н и я . 1998. № 3.
26
Глава 1. Политический анализ и прогнозирование: предметное поле
1
зов, не обладающих такой способностью . Если, например, централь н ы й орган исполнительной власти государства официально обнародует прогноз, согласно которому политическая и экономическая ситуация в стране будет непрерывно и радикально ухудшаться, такой прогноз фак тически, независимо от объективных показателей и тенденций, «обре чен» на то, чтобы быть реализованным. Паника в политических и дело вых кругах, которая станет несомненной реакцией на такого рода заявление официальных л и ц , приведет в действие механизмы парадок са самоосуществления. В то же время предупреждение о возможных в будущем негативных последствиях того или иного политического про цесса способно вызвать к жизни парадокс самоопровержения. Это может случиться, если, реагируя на прогноз, лица, принимающие ре шения, осуществят максимальную мобилизацию ресурсов для предот вращения предсказанных отрицательных последствий. Таким образом, в прогнозно-политических исследованиях должны учитываться возможные эффекты обратной связи между продуцируе мыми прогнозами и поведением объекта прогнозирования. В норма тивном прогнозировании дополнительно необходимо обращать вни мание на возможности использования таких эффектов для достижения определенных политических целей, т.е. политический прогноз может не только обслуживать процесс принятия решений, но и непосредст венно выступать как фактор управления политическими процессами. Например, не случайно Национальный разведывательный совет (National Intelligence Council) — организация при Центральном разведы вательном управлении С Ш А — периодически публикует долгосрочные 2 сценарные прогнозы развития политической ситуации в мире . Причем изначально эти данные являются секретными, на создание прогнозов тратятся многие миллионы долларов. Зачем в таком случае делать их до стоянием гласности? Ответ легко найти в содержании самих прогнозов: все без исключения сценарии будущего развития мировой системы до 2025 г. предполагают сохранение лидирующей позиции С Ш А в политике и экономике. Таким образом, прогноз выполняет не только познаватель ную функцию — получение информации о возможных альтернативах развития, — но и управленческую — проектирование желаемого будуще го и внедрение этого проекта в массовое сознание и сознание элит. Отдельная тема, которую необходимо затронуть, — отношение меж ду
политическим
анализом
и
политическим
прогнозированием.
Данный
' С м . : Вишнев, С. М. О с н о в ы к о м п л е к с н о г о п р о г н о з и р о в а н и я . М., 1977. С. 37. С с о д е р ж а н и е м и м е т о д и к о й составления таких п р о г н о з о в м о ж н о о з н а к о м и т ь с я на сайте Н Р С www.cia.gov/nic.
1.4. Политический анализ и политическое прогнозирование
27
вопрос находится в центре оживленных научных споров, причем неко торые точки зрения являются полярными. Так, часть исследователей считают, что политическое прогнозирование — совершенно самостоя тельная с точки зрения предмета, задач и функций область политичес кой науки. Согласно противоположному мнению, оно не обладает са мостоятельным методологическим статусом, является л и ш ь этапом или ф у н к ц и е й политического анализа. Такой взгляд особенно распро странен среди авторов, склонных считать политический анализ сугубо прикладной дисциплиной. Например, К.В. Симонов в учебном посо бии «Политический анализ» пишет: «Политический анализ, на наш взгляд, включает в себя три основополагающих компонента: анализ сложившейся политической ситуации, прогноз относительно ее разви 1 тия и принятие компетентных политических решений» . Право на существование точки з р е н и я о «методологической неса мостоятельности» политического п р о г н о з и р о в а н и я связано с тем, что м н о г и е методы политического анализа действительно могут про дуцировать з н а н и е прогнозного характера. Большинство статистиче ских методов способно не только устанавливать связь между двумя п е р е м е н н ы м и , но и предсказывать значение одной п е р е м е н н о й на о с н о в а н и и з н а ч е н и й других п е р е м е н н ы х . Даже качественные (осно ванные на р а з м ы ш л е н и и , а не на подсчете) методы анализа — такие, н а п р и м е р , к а к с и т у а ц и о н н ы й а н а л и з , — содержат не только пред ставление о текущей политической ситуации, но и — в и м п л и ц и т н о м (скрытом) виде — суждения о ее д а л ь н е й ш е м развитии. Квалифици р о в а н н ы й политический а н а л и т и к , рассматривая уже обозначивши еся т а к т и к и действий политических акторов, неизбежно будет зада ваться в о п р о с о м о возможности п р о е ц и р о в а н и я подобных л и н и й поведения в будущее. В то же время существует ряд исследовательских методов, специ фических и м е н н о для прогностики. К таковым, например, относится метод составления политических сценариев, который мы еще будем рассматривать подробно. Более того, в политическом прогнозирова н и и есть целые методологические подходы, концентрирующие вни мание на таких п р и н ц и п и а л ь н ы х вопросах, как «открытость» (не п р е д о п р е д е л е н н о с т ь ) будущего, характер его альтернативности, с о о т н о ш е н и е предсказания, п л а н и р о в а н и я и проектирования в поли тической ж и з н и общества. Уместно говорить о существовании особой философии политического прогнозирования. Даже в тех случаях, когда для р е ш е н и я задач прогнозирования используются стандартные ме-
2
1
Симонов, К. В. П о л и т и ч е с к и й а н а л и з . М., 2002. С. 15.
Контрольные вопросы и задания
28
29
Глава 1. Политический анализ и прогнозирование: предметное поле
тоды политического анализа, используются они, как правило, опре деленным, адаптированным для целей прогнозирования образом. Политическое прогнозирование решает наиболее сложные задачи, что обусловлено очень высоким уровнем неопределенности, возника ющей в условиях взаимодействия множества факторов, действий мно жества политических субъектов, преследующих конфликтующие цели (которые, в свою очередь, часто бывают скрытыми). Такой уровень сложности решаемых проблем нередко требует разработки комплекс ных прогнозных систем, объединяющих в единое целое отдельные, сравнительно простые методы анализа и прогноза. Соответственно, построение политических прогнозов требует специального методологи ческого дизайна, отвечающего объекту и задачам конкретного исследо вания. Метафорически это можно представить следующим образом: чтобы построить прогностический «мост» из настоящего в будущее, в качестве строительного материала хороши методики политического анализа, но при этом архитектурное, дизайнерское решение по скреп л е н и ю , сцеплению отдельных элементов в целостную конструкцию будет подчинено задачам именно прогнозного характера. При постройке такого «моста» необходимо использовать не только методы политического анализа, но и накопленные теоретические зна н и я о связях между я в л е н и я м и политической жизни. Прогнозируя, к примеру, вероятность военного переворота в какой-нибудь стране «третьего мира», мы неизбежно примем во внимание имеющееся зна ние о факторах, в целом влияющих на дестабилизацию политической ситуации в д а н н о м классе государств. И н ы м и словами, мы станем ру ководствоваться результатами теоретических политико-аналитичес ких исследований по д а н н о й проблеме. В то же время конечные цели прогностического исследования но сят, как правило, прикладной характер. Это относится не только к нормативному прогнозированию, по определению ориентированно му на того или иного политического актора и его интересы, но и — в значительной мере — к прогнозированию поисковому. Исследование альтернатив будущего развития политических событий практически всегда ориентировано или на то, чтобы повлиять на это развитие, или на то, чтобы подготовиться к благоприятным / неблагоприятным ис ходам, если возможности влияния ограничены. Сложно представить себе прогнозное исследование, выполняемое из чисто научного, ака демического интереса. Что касается п о н и м а н и я политического п р о г н о з и р о в а н и я к а к «этапа» политического анализа, то созданию политического прогноза предшествует анализ исходной ситуации, сложившейся накануне;
прогноз невозможен без тщательного рассмотрения существующих тенденций, факторов, расстановки политических сил. Однако верно и то, что разработка прогноза способна скорректировать, уточнить, а иногда и п р и н ц и п и а л ь н о изменить взгляд аналитика на характерис тики исходной ситуации. Реальный процесс прогнозно-аналитичес кого исследования итеративен, он предполагает возвращение к уже пройденным этапам на новом уровне з н а н и я . Неправильно представ лять себе его к а к жесткую последовательность дискретных этапов или стадий: 1 — анализ ситуации; 2 — прогноз развития ситуации. Кор ректнее следующая схема: 1 — анализ ситуации; 2 — прогноз развития ситуации; 3 — уточнение анализа ситуации на основании сделанных прогнозов; 4 — уточнение прогнозов на основании углубленного ана лиза ситуации. Таким образом, политический анализ и политическое прогнозирование взаимно д о п о л н я ю т друг друга в решении задачи снижения неопределенности, причем анализ способен выполнять часть прогностических ф у н к ц и й , а прогноз — часть аналитических. Итак, являются ли анализ и прогнозирование частями единого целого или же это самостоятельные направления в политической на уке? И первое, и второе (но скорее первое, чем второе). У политиче ского анализа и п р о г н о з и р о в а н и я не просто много общего: полити ческое п р о г н о з и р о в а н и е м о ж н о рассматривать к а к интегральную деятельность, синтезирующую все три уровня политического анали за: теоретический, прикладной и методологический; оно решает при кладные проблемы, активно используя методологию политического анализа и его теоретические результаты. Любое добросовестное про гнозное исследование, н а ц е л е н н о е в качестве объекта на сложную систему, будет иметь и теоретико-методологический, и теоретикоприкладной аспект. В то же время политическое прогнозирование располагает с о б с т в е н н ы м и , о т л и ч н ы м и от аналитических, методоло гиями и методиками.
Контрольные вопросы и задания 1. Назовите четыре класса проблем, р е ш а е м ы х методами политического анализа. К а к о в ы о с н о в н ы е р а з л и ч и я между н и м и ? 2. Охарактеризуйте различие между теоретическим и прикладным уровня
ми политического анализа. 3. Раскройте с о д е р ж а н и е а н г л и й с к и х т е р м и н о в «political analysis* и «ройсу analysis*. 4. К а к и е о с о б е н н о с т и п о л и т и ч е с к о й с ф е р ы ж и з н и общества влияют на методологию политического анализа и п р о г н о з и р о в а н и я ?
30
Глава 1. Политический анализ и прогнозирование: предметное поле
5. Охарактеризуйте принципиальные аналитические стратегии на приме ре использования парадигм рационального выбора и бихевиоризма. 6. Охарактеризуйте понятия «политический анализ» и «политическое про гнозирование». К а к в науке определяется их соотношение? 7. Что такое «нормативное прогнозирование» и «поисковое прогнозирова ние»? Какой из указанных типов прогнозирования максимально ориентиро ван на решение прикладных проблем?
ГЛАВА 2
Подготовка к политическому анализу
Литература Ахременко, А. С.
Политическое прогнозирование: сценарный метод. М.,
2004. Дегтярев, А. А. Политический анализ как прикладная дисциплина: предметное поле и направление разработки // Полис. 2004. № 1. Симонов, К. В. Политический анализ. М., 2002. Туронок, С. Г. Политический анализ : курс лекций. М., 2005. Hay, С. Political Analysis. A Critical Introduction. Palgrave, 2002. Hogwood, В., Gunn, L. Policy Analysis for the Real World. Oxford, 1984. Quade, E. Analysis for Public Decisions. Elsevier, 1976. Sheplse, K.A., Bonchek, M. S. Analyzing Politics. N.Y., 1997.
2.1. Понятие программы исследования Работа политического аналитика и прогнозиста требует весьма тща тельной и основательной подготовки. Такая подготовка осуществля ется в соответствии с определенной научной процедурой — разработ кой программы и рабочего плана исследования. П о л о ж е н и я программы исследования отвечают на три основных вопроса: •Что подлежит изучению? ( К а к а я проблема находится в центре в н и м а н и я исследователя?) • Чего следует добиваться? ( К а к и е цели преследовать, каковы ос новные и промежуточные ожидаемые результаты?) • К а к достичь поставленных целей? (Какова стратегия исследова н и я , через призму какой теории мы ее рассматриваем, к а к и м и мето дами воспользоваться и в к а к о й последовательности, к а к и м и источ н и к а м и и н ф о р м а ц и и оперировать?) Таким образом, программа исследования представляет собой кон цептуальную (теоретико-методологическую) и методическую основу всей дальнейшей работы, от продуманности программы напрямую за висит успех исследования. Рабочий план и с с л е д о в а н и я отвечает на в о п р о с : к а к и м кон кретно образом реализовать программу исследования в рамках и м е ю щ и х с я у и с с л е д о в а т е л я в о з м о ж н о с т е й ? Р а б о ч и й п л а н соот носит поставленные цели и задачи исследования с имеющимися временными, ф и н а н с о в ы м и , кадровыми и и н ы м и ресурсами, оформляет последовательность операций в четкий план-график работы. Если п р о г р а м м а я в л я е т с я м е т о д о л о г и ч е с к о й и методиче ской о с н о в о й и с с л е д о в а н и я , то р а б о ч и й п л а н — ее о р г а н и з а ц и о н ная о с н о в а .
32
Глава 2. Подготовка к политическому анализу
Программа исследования в соответствии со своими ф у н к ц и я м и включает два основных раздела: методологический и методический (процедурный). О с н о в н ы м и положениями методологической части яв ляются: • формулировка проблемы, объекта и предмета исследования; • постановка цели и задач исследования; • определение парадигмального подхода и выбор теории; • операционализация понятий и конструирование переменных; • формулирование гипотез исследования. Методическая часть включает: • определение методов сбора данных и характеристик информаци онного обеспечения; • определение методов анализа данных и последовательности их применения. Указанные п о з и ц и и можно рассматривать также как этапы состав л е н и я программы исследования, но с определенной оговоркой. На практике процесс ф о р м и р о в а н и я программы итеративен, как и поли т и ч е с к и й анализ в целом; он не движется л и н е й н о , предполагая воз вращение к ранее п р о й д е н н ы м этапам. Так, определение концепту ального подхода к проблеме может повлечь корректировку цели исследования, формулирование гипотез — уточнение операционализации п о н я т и й и т.д. Некоторые этапы работы, например определение парадигмы и теории, конструирование переменных и формулирова ние гипотез, в реальности идут почти параллельно.
2.2. Проблема, предмет и цель исследования Отправной точкой любого исследования является некоторая проблема. В самом общем виде п р о б л е м а исследования — это несоответст вие, противоречие между желаемым и действительным. Проблема в теоретических исследованиях имеет доминирующую гносеологичес кую (познавательную) составляющую: это несоответствие между до стигнутым и требуемым уровнем знания о политических процессах и явлениях, закономерностях их ф у н к ц и о н и р о в а н и я и связях между н и м и . П р и н ц и п и а л ь н о е значение имеет разграничение того, что мы уже знаем и можем объяснить, и того, что мы еще не знаем и объяс нить не можем. Осмысливая теоретическую проблему, мы рассужда ем, к примеру, следующим образом: «В соответствии со сложившими ся т е о р е т и ч е с к и м и п р е д с т а в л е н и я м и д а н н а я с о ц и а л ь н а я группа д о л ж н а под влиянием факторов Аи Б придерживаться определенной
2.2. Проблема, предмет и цель исследования
33
модели политического поведения. Однако в реальности мы наблюда ем, что часть этой группы ведет себя иным образом, нежели мы ожи дали. Следовательно, должен действовать неизвестный нам фактор С, влияющий на поведение д а н н о й части группы. Каков этот фактор? И почему он избирательно действует только на часть д а н н о й группы?» Задавать «правильные» вопросы — чрезвычайно полезный способ осмысления проблемы как теоретического, так и прикладного иссле дования. В прикладном исследовании проблема — это всегда чья-то проблема: конкретного клиента, политического института или госу дарства в целом. Прикладное исследование в конечном счете всегда ориентировано на п о и с к р е ш е н и я проблемы — устранение конкрет ного противоречия в политической действительности. И вопросы, ко торые исследователь задает себе при осмыслении прикладной про блемы, отличаются от вопросов теоретического исследования. «Теоретические» вопросы
«Прикладные» вопросы
Какие факторы обусловливают уровень протестных настроений в обществе?
На какие факторы и каким образом следу ет воздействовать, чтобы снизить уровень протестных настроений в обществе? Какая связь существует между конкрет Какую политическую программу следует ными условиями жизни людей и их элек предложить, чтобы данная группа в дан торальными предпочтениями? ных конкретных условиях проголосовала за определенную политическую партию? Что является мерой эффективности пред Как повысить эффективность работы дан ставительных институтов власти? ного представительного института власти? Процесс осмысления и формулировки проблемы неотделим от оп ределения объекта и предмета исследования: проблема становится подлежащей р е ш е н и ю только в том случае, когда она распознана в ка ком-то определенном политическом я в л е н и и или процессе. О б ъ е к т исследования — это то, на что направлен процесс п о з н а н и я . В таком качестве могут выступать политические институты, социаль ные группы, политические элиты и т.д. Под п р е д м е т о м исследо вания п о н и м а ю т с я те п р и з н а к и и свойства объекта, в которых иссле дователь заинтересован в наибольшей степени, которые он изучает непосредственно. Например, в определенном регионе России наблюдается система тическое и существенное расхождение между данными предвыборных опросов общественного м н е н и я и итогами голосований, хотя в других регионах тот же опросный инструментарий приносит удовлетворитель ные результаты. Д а н н ы й феномен мы не в состоянии объяснить, исхо дя из имеющихся знаний. Это проблема исследования. Объектом изу3 - 3863
34
Глава 2. Подготовка к политическому анализу
чения станут избиратели данного региона — лица в возрасте от 18 лет, проживающие (и прописанные) в регионе и не ограниченные в избира тельных правах. Предметом изучения станут факторы, влияющие на формирование электорального выбора региональными избирателями. Из о п р е д е л е н и я проблемы, объекта и предмета исследования должны логически вытекать его цель и задачи. Ц е л ь — это планиру емый, ожидаемый результат, на достижение которого направлена по знавательная деятельность в рамках предпринимаемого исследова н и я . В случае теоретического исследования ф о р м у л и р о в к а цели содержит тот уровень знаний, ту степень преодоления неопределен ности, которой необходимо достичь по итогам работы. В случае при кладного исследования целью является определение путей р е ш е н и я конкретной политической проблемы. З а д а ч и — это те промежуточные результаты исследовательской работы, которые необходимо получить для достижения общей цели исследования. О н и всегда более конкретны по сравнению с целью и п о д ч и н е н ы ей. В сложных, комплексных исследовательских проектах цель и задачи образуют многоуровневую иерархическую конструкцию. П р и множественности задач могут потребоваться специальные методы упорядочения о т н о ш е н и й между ними, в том числе ф о р м а л и зованные. В частности, в п л а н и р о в а н и и существует специальная методика построения «дерева целей», позволяющая описать совокупность отдельных задач и уровней задач на я з ы к е м а т е м а т и к и и ф о р м а л ь н о й логики. В большинстве случаев столь сложные подходы не требуются, тем более что к р а й н е трудно (и. к а к правило, не нужно) на программном этапе формулировать абсолютно все задачи исследования. Важно очень четко определить цель как «стратегическую магистраль» иссле довательского процесса и основные задачи, указывающие главные направления работы. Сделать это зачастую м о ж н о л и ш ь после того, как выбран теоретический угол зрения на поставленную проблему (выше уже обращалось в н и м а н и е на итеративность процедуры пост р о е н и я исследовательской программы). Проблема в ы б о р а к о н ц е п т у а л ь н о й п а р а д и г м ы и с следования п р и н ц и п и а л ь н о важна прежде всего для теоретических исследований. Мы уже говорили о большом разнообразии научных установок, через призму которых можно смотреть на мир п о л и т и к и . Ч и с л о п о т е н ц и а л ь н о возможных способов объяснить тот или и н о й политический ф е н о м е н очень велико, причем многие из них опира ются на собственный набор источников и н ф о р м а ц и и и методов ана лиза данных. Однако в силу ограниченности ресурсов и особенностей
2.2. Проблема, предмет и цель исследования
35
человеческого м ы ш л е н и я исследователь не может объять необъятное, рассматривать проблему о д н о в р е м е н н о под множеством углов зрения. Поэтому выбор теории — важный и необходимый шаг, сильно продвигающий нас вперед в поиске ответов на вопросы «Что анализировать?» и «Как анализировать?». Нередко проблема парадигмального выбора актуальна даже для д о с т и ж е н и я с р а в н и т е л ь н о л о к а л ь н ы х исследовательских целей. Предположим, целью исследования является определение факторов, обусловливающих с п е ц и ф и к у электорального поведения населения региона N (разумеется, в реальном исследовании цель будет сформу лирована более конкретно). Перечень факторов, которые в п р и н ц и п е способны повлиять на голосование избирателей, весьма разнообра зен. Выбор же факторов (группы факторов), на которые будет обра щено в н и м а н и е исследователя, во многом зависит от выбора соответ ствующей теории. Н а п р и м е р , можно встать на п о з и ц и и социологического подхода к интерпретации электорального поведения. Д а н н а я теория рассматри вает р е ш е н и е индивида о голосовании за ту или иную политическую силу как следствие его принадлежности к более ш и р о к о й социальной группе. Такие группы могут выделяться по совершенно разным крите риям: национальность, религиозная и конфессиональная принадлеж ность, возраст, доход (выше или н и ж е определенного уровня), прожи вание на определенной территории и т.д. Однако во всех случаях в центре в н и м а н и я социологического подхода оказываются групповые политические ценности и особенности поведения, которые интерпо лируются на входящих в группу индивидов. В целом социологический подход лежит в русле бихевиористской парадигмы политической на уки. Соответственно, одна задача исследования будет заключаться в поиске свойств и п р и з н а к о в , с п е ц и ф и ц и р у ю щ и х избирателей регио на N к а к группу или совокупность групп. В частности, можно проана лизировать н а ц и о н а л ь н ы й и возрастной состав избирателей региона, соотношение проживающих в городской и сельской местности и т.д. Другой задачей будет обнаружить и охарактеризовать связи между групповой с п е ц и ф и к о й и результатами голосования. В информаци о н н о м плане придется опираться на статистические данные как наи более точно отражающие свойства групп в целом. П р е д п о ч т е н и е в качестве о п о р н о й теории рационального выбора п р е д о п р е д е л и т с о в е р ш е н н о и н у ю исследовательскую стратегию. Б а з о в ы м и п р е д п о с ы л к а м и д а н н о й т е о р и и п р и м е н и т е л ь н о к электо ральному п о в е д е н и ю будут: и н д и в и д у а л ь н ы й характер выбора, ра ц и о н а л ь н о с т ь выбора п р и о с н о в н о м критерии м а к с и м и з а ц и и выиг-
Глава 2. Подготовка к политическому анализу
36
р ы ш а и м и н и м и з а ц и и издержек. Так, избиратель, с к о р е е всего, не станет голосовать за действующего губернатора или р е г и о н а л ь н у ю «партию власти» в случае, если его надежды на улучшение социаль ного и материального п о л о ж е н и я не оправдались. Здесь фокус ис следовательского в н и м а н и я будет сосредоточен на п о и с к е связей между и з м е н е н и я м и в уровне ж и з н и граждан, д и н а м и к е социаль н о й ситуации и голосованием за ту или иную п а р т и ю и л и кандида та. В качестве о с н о в н о й и н ф о р м а ц и о н н о й базы будут использовать ся д а н н ы е о п р о с о в с п р и в л е ч е н и е м с о ц и а л ь н о - э к о н о м и ч е с к о й статистики. Теория социальных сетей рассматривает электоральный процесс че рез призму устойчивых связей между акторами социальной системы. Суть этой теории состоит в том, что все социальные действия, вклю чая и электоральное поведение, д о л ж н ы объясняться на основе соци альных д и с п о з и ц и й акторов, а не только их индивидуальных мотивов (как в теории рационального выбора). Элементом социальных диспо з и ц и й — взаимоотношений — являются ожидания по поводу поведе н и я других. Таким образом, социальные сети порождают наборы нор мативных, символических и культурных стандартов, определяющих индивидуальное поведение. Ч е м «гуще» социальная сеть, тем более политически однородны принадлежащие к ней индивиды. И наобо рот, разреженные сети (признаком которых служит то, что друзья од ного человека, к а к правило, не знают друг друга) более разнородны в 1 с о ц и а л ь н о м и политическом отношениях . Руководствуясь этими по л о ж е н и я м и , можно попытаться объяснить с п е ц и ф и к у голосования в регионе, исходя из структуры его социальных сетей, особое в н и м а н и е при этом уделив поиску «узлов» к о м м у н и к а ц и и , например крупных градообразующих предприятий. Взгляд на проблему с п о з и ц и й институционального подхода озна чал бы выдвижение на первый план с п е ц и ф и к и региональной изби рательной системы, анализ ее в л и я н и я на электоральное поведение. Использование партийно-идентификационного подхода повлекло бы за собой приоритетное в н и м а н и е к проблемам с о ц и а л и з а ц и и граж дан, усвоению и м и принятых в семье политических ц е н н о с т е й . Опо ра на п о л о ж е н и я теории диффузии инноваций привела бы к разделе н и ю т и п о в электорального поведения на «инновационные» и «периферийные»; одной из задач исследования стал бы анализ гео г р а ф и и и н н о в а ц и й в регионе и т.д. и т.п. Приведенных п р и м е р о в до1
С м . : Голосов, Г. В., Шевченко, Ю.Д. Ф а к т о р ы успеха в о д н о м а н д а т н ы х о к р у г а х / /
П е р в ы й электоральный цикл в России. М., 1996. С. 135.
2.3. И з м е р е н и е в политическом анализе
37
статочно для п о н и м а н и я того, как велика роль выбора теории не только «в принципе», но для р е ш е н и я вполне к о н к р е т н ы х исследова тельских задач. Как было отмечено выше, вопрос о выборе теории наиболее актуа лен для теоретического политического анализа. Это не означает, что в прикладном политическом анализе проблема не существует вовсе. Так, прикладные исследования зачастую оперируют понятиями, кон кретный смысл которых может быть раскрыт и переведен в практиче скую плоскость, если руководствоваться определенным теоретичес ким подходом. Более предметно мы остановимся на д а н н о й теме в параграфе 2.4, посвященном операционализации понятий. Однако прежде необходимо обратиться к проблеме измерения, являющейся одной из важнейших в политическом анализе вообще и в разработке его программной части в частности.
2.3. Измерение в политическом анализе Измерение представляет собой процедуру присвоения объекту значе н и я , отображающего выраженность в нем определенного признака или свойства. Соответственно, чтобы произвести процедуру измере н и я , необходимо: 1. Определить измеряемый п р и з н а к , или переменную. Перемен ная — это то, что меняется, варьируется, принимает разные значения. Несмотря на некоторую тривиальность данного определения, оно четко фиксирует главную, сущностную особенность переменной. Так, переменная «пол» может п р и н и м а т ь всего два значения: «мужской» и «женский», в то время как п е р е м е н н а я «доля избирателей, проголосо вавших за К П Р Ф » , варьируется в ш и р о к о м диапазоне от 0 до 100%. В обеих ситуациях мы имеем вариацию значений в рамках определен ного диапазона. 2. Установить совокупность объектов, которые будут получать то или иное значение в рамках определенной переменной. В терминах измерения такие объекты будут именоваться случаями. В качестве слу чаев могут выступать люди, территории, политические партии, изби рательные к а м п а н и и и многое другое. В процессе и з м е р е н и я случаи приобретают значения в рамках дан ной переменной (или переменные приобретают значения для опреде ленных случаев, что также корректно). В таблице ниже переменная «возраст» приобретает значение «25 лет» в случае «Иванов», случай «Сидоров» получает значение «мужской» по переменной «пол». Пере-
38
Глава 2. Подготовка к политическому анализу
1
менные (variables ), случаи (cases) и значения (values) являются основ ными составляющими и образуют данные для эмпирического анализа. Случаи
Переменные Пол
Возраст
Членство в политической партии
Иванов
Мужской
25
Нет
Петрова
Женский
40
«Единая Россия»
Сидоров
Мужской
65
КПРФ Значения
2.3. Измерение в политическом анализе
39
Объяснение свойства интервальных измерений ч и с л е н н о выра жать различия между объектами заложено в их названии: измерение осуществляется с помощью некоего неизменного интервала, который выступает эталоном меры. Такими эталонами являются, н а п р и м е р , градус, метр, килограмм, минута, процент или рубль. На интерваль ном уровне измерения осуществимы все операции с натуральными числами. Это имеет большое практическое значение, так как позволя ет п р и м е н я т ь к интервальным п е р е м е н н ы м статистические методы любой сложности.
П о р я д к о в ы е и з м е р е н и я позволяют ранжировать объекты с точки зрения выраженности у них свойства, измеряемого перемен ной, т.е. оценить, «больше» или «меньше» измеряемого свойства содер Различные измерения дают разную по степени полноты и точности информацию об объектах. Эта степень зависит от двух факторов: жится в данном объекте по сравнению с другими объектами. При этом 1) от подхода исследователя, который в ряде случаев сам определяет порядковое измерение, в отличие от интервального, не позволяет оце « п о р о г точности», необходимый ему в измерении переменных; 2) от нить, «насколько больше» или «насколько меньше» выражен признак. самих переменных, которые различаются тем, насколько «хорошо» Построение порядковой ш к а л ы м о ж н о проиллюстрировать на они могут быть измерены. Н а п р и м е р , переменная «возраст» может примере п е р е м е н н о й «политическое участие гражданина» с использо быть измерена с высокой с т е п е н ь ю т о ч н о с т и — в годах (или даже ме ванием измерения, позволяющего ранжировать граждан по классам, сяцах, днях, часах) с момента рождения человека, однако в реальном р а з л и ч а ю щ и м с я количеством д а н н о г о свойства, а и м е н н о : исследовании столь точное измерение может быть просто не нужно. 1) отсутствие политического участия; В исследованиях политического поведения иногда бывает достаточно 2) эпизодическое или регулярное участие в выборах в качестве из всего трех значений переменной: а) молодежь (18—35 лет); б) средний бирателя; возраст (36—55 лет); в) старший возраст (более 55 лет). В большинст 3) регулярное участие в выборах, членство в политической партии; ве случаев и м е н н о особенности переменных диктуют исследователю 4) регулярное участие в различных политических кампаниях, ак уровень полноты, на котором они могут быть измерены. циях и т.д.; Выделяется три основных уровня измерения переменных: номи 5) участие в выборах в качестве кандидата; нальный, порядковый и интервальный. 6) повседневное участие в п р и н я т и и политических решений. Наиболее полную и н ф о р м а ц и ю дают и н т е р в а л ь н ы е и з м е В приведенном перечне интенсивность политического участия р е н и я . О н и позволяют ч и с л е н н о выражать и сравнивать различия возрастает от первого класса к шестому. М о ж н о утверждать, что в между объектами и з м е р е н и я . Если температура воздуха в комнате классе 2 (участие в выборах в качестве избирателя) призна к «полити вчера составляла 25°, а сегодня — 23°, то сегодня она на 2° ниже. Ес ческое участие» выражен больше, чем в классе 1 (отсутствие участия), ли политическая партия N получает на выборах 1000 голосов, а пар но м е н ь ш е , чем в классе 5 (участие в выборах в качестве кандидата). тия М — 200, то поддержка избирателями партии N была в 5 раз выше Относя изучаемых нами граждан к определенным классам политиче по с р а в н е н и ю с партией М. Если на предпоследних выборах я в к а из ского участия, мы тем самым ранжируем их по данному признаку. Ес бирателей увеличилась с 50% до 55%, а на последних — с 5 5 % до 65%, ли гражданин Петров отнесен к классу 3, то он в большей мере участ то рост я в к и на последних выборах оказался в два раза выше, чем на предпоследних. вует в политике, чем гражданин И в а н о в , отнесенный к классу 1. В то же время мы не можем сказать, н а с к о л ь к о активнее Петров участвует в политике по сра внению с И в а н о в ы м , так как не располагаем фикси ' Мы будем иногда прибегать к т е р м и н о л о г и ч е с к и м соответствиям между русскими р о в а н н ы м интервалом, «эталоном меры» политического участия. И а н г л и й с к и м и п о н я т и я м и . Это обусловлено тем, что многие к о м п ь ю т е р н ы е програм Это налагает соответствующие ограничения на математические мы а н а л и з а д а н н ы х на с е г о д н я ш н и й д е н ь в ы п о л н е н ы в рамках а н г л о я з ы ч н о г о интер ф е й с а и не переведены на русский я з ы к . операции со значениями порядковых переменных. Например, бес-
40
Глава 2. Подготовка к политическому анализу
смысленно вычислять разность 3 и 1, чтобы получить количественную меру различий политического участия Иванова и Петрова, — нумера ция классов условна и отражает л и ш ь отношения порядка (больше или меньше). В п р и н ц и п е , мы можем присвоить полученным классам по литического участия произвольные значения, л и ш ь бы о н и отражали отношения возрастания и убывания, например: 2, 13, 16, 78, 56, 100. Порядковые переменные имеют широкое распространение в по литических и вообще в социальных исследованиях. Н а п р и м е р , такие распространенные характеристики, как социальный статус или уро вень образования, измеряются по порядковой шкале. П о р я д к о в ы м и по своей природе являются такие переменные, как «политическая влиятельность», «политическая активность», «интерес к политике», «удовлетворенность политикой правительства» и т.д. Порядковые переменные особенно удобны в тех случаях, когда лю ди сами фиксируют свое положение на шкале (как при проведении оп росов). Например, отношение к той или иной политической партии удобно измерять с помощью следующих классов: «полностью поддер живаю», «поддерживаю в целом», «отношусь нейтрально», «отношусь в целом отрицательно», «отношусь крайне отрицательно». Н а к о н е ц , наименее полную и н ф о р м а ц и ю дают н о м и н а л ь н ы е и з м е р е н и я (шкала наименований). Они представляют собой разби ение исследуемой совокупности объектов на несколько непересекаю щихся классов. Эти классы являются содержательно различными, и мы не располагаем возможностью их количественно упорядочить. Номи нальные переменные отражают сугубо качественные признаки, такие, как «политическая ориентация», «членство в партии» или «тип полити ческого режима». На этом уровне исчезает не только чувствительность измерения к количественным различиям между объектами, но и спо собность ранжировать их с точки зрения выраженности определенного свойства. Так, признак «членство в партии» не обладает интенсивнос тью; нельзя быть членом партии в большей или меньшей степени. Соответственно, числовые значения на н о м и н а л ь н о м уровне не отражают каких-либо свойств объектов, а служат своего рода «ярлы ками», «опознавательными кодами» классов (как номера картотечных я щ и к о в в библиотеке) и используются исключительно для удобства работы с д а н н ы м и . Н а п р и м е р , в простейшем варианте и з м е р е н и я но м и н а л ь н о й п е р е м е н н о й «политическая ориентация» может быть ис пользовано три класса: 1) левые; 2) центристы; 3) правые.
2.4. Операционализация понятий
41
Присвоение классам числовых з н а ч е н и й здесь является достаточ но произвольным: с таким же успехом класс «правых» мог получить код 1, «левых» — 2, «центристов» — 3 (равно как и 10, 20, 100). В лю бом случае сложение одного гражданина левой политической ориен тации с одним центристом не даст нам одного правого. Единственное строгое правило нумерации классов — запрет на присвоение разным классам одного и того же числового кода: иначе нельзя будет разли чить две содержательно разные категории. Для н о м и н а л ь н ы х и порядковых переменных с небольшим коли чеством категорий существует общее название: категориальные, или неметрические. Соответственно, интервальные и порядковые пере менные с большим числом категорий называют метрическими. По п о н я т н ы м п р и ч и н а м на разных уровнях измерения исследова тель располагает с о в е р ш е н н о р а з н ы м по богатству вычислительным арсеналом. На интервальном уровне мы обладает возможностью про изводить любые вычисления и оперировать статистическими метода ми самой в ы с о к о й сложности. На н о м и н а л ь н о м уровне спектр воз можных о п е р а ц и й с числами будет крайне узким. Более подробно мы поговорим об этом в гл. 4.
2.4. Операционализация понятий Операционализация переменных и гипотез представляет собой одну из наиболее важных процедур подготовки к политическому анализу — как теоретическому, так и прикладному. От того, каким образом пере менные анализа будут приведены к операциональному виду, зависит дальнейший выбор методов исследования, формат информационного обеспечения, в конечном счете — характер получаемых результатов. Операционализация (от лат. operatio — действие) в широком смыс ле представляет собой процесс приведения понятий к такому виду, ко торый позволит работать с н и м и на практическом уровне, оперировать ими при р е ш е н и и конкретных аналитических и прогнозных задач, ве рифицировать или фальсифицировать гипотезы исследования. В бо лее узком смысле о п е р а ц и о н а л и з а ц и я — это приведение понятия к из меряемому виду, превращение его в переменную. В некоторых простых случаях о п е р а ц и о н а л и з а ц и я осуществляется посредством всего одного логического действия. Так, понятие «элек торальная поддержка партии» на э м п и р и ч е с к о м уровне соответствует переменной «число (или доля) голосов, отданных за данную полити ческую партию» на определенных выборах.
42
Глава 2. Подготовка к политическому анализу
Однако многие п о н я т и я , используемые в политическом анализе, требуют с л о ж н о й , многоступенчатой процедуры операционализации. Это связано с тем, что о н и : • сформулированы в с л и ш к о м расплывчатой форме, их содержа ние неконкретно, допускает несколько толкований; • являются слишком абстрактными, эмпирически ненаблюдаемыми и, соответственно, не поддающимися непосредственному измерению. Возьмем т е р м и н «политическая стабильность», активно употребля емый и в академической политологии, и в комментариях средств мас совой и н ф о р м а ц и и . Представим себе, что целью анализа является со поставление уровня политической стабильности в нескольких регионах России для консультирования инвесторов по вопросам разме щения их капиталов (это будет сравнительное прикладное исследова ние). Сформулировав таким образом цель исследования, мы сразу сталкиваемся с обеими обозначенными выше проблемами. Во-первых, понятие «политическая стабильность» является неодно значным по своему содержанию. В политической науке существует це лый ряд п р и н ц и п и а л ь н о разных подходов к его интерпретации. Часть из них связывает политическую стабильность с процессами, происхо д я щ и м и в социальной сфере, например с уровнем социальной диффе ренциации или глубиной разрыва между ожиданиями и реальным бла госостоянием населения. Другие подходы помещают в фокус внимания эффективность работы политической системы по преобразованию тре бований и поддержки общества в политические решения и действия. Третьи, делают акцент на протестном политическом поведении, силе и активности системной (действующей в рамках правового поля) и не системной (действующей вне его) оппозиции. Четвертые отталкивают ся от степени легитимности правящего режима и т.д. Поэтому на пер вом этапе операционализации понятия «политическая стабильность» исследователю необходимо определиться с собственным осмыслением его содержания с учетом конкретной цели исследования. Д а н н ы й этап будет называться теоретической операционализацией; в качестве резуль тата теоретической операционализации мы должны получить четкую и ясную д е ф и н и ц и ю рассматриваемого понятия. Во-вторых, п о н я т и е «политическая стабильность» является эмпи рически ненаблюдаемым. Его невозможно измерить непосредствен н о , как, например, атмосферное давление по показаниям ртутного столба или время по часовой стрелке. Не существует готового обще п р и з н а н н о г о эталона измерения стабильности. Практически это оз начает, что необходимо найти эмпирически регистрируемые призна ки (индикаторы, показатели), которые были бы связаны с исходной
2.4. Операционализация понятий
43
переменной и служили средством ее измерения. Д а н н а я процедура получила н а и м е н о в а н и е эмпирической операционализации, а эмпири чески наблюдаемые признаки, отражающие основное понятие, назы ваются операциональными определениями. Не решив задачу эмпиричес кой операционализации, мы окажемся не в состоянии сравнивать регионы по уровню стабильности и, соответственно, не достигнем це ли исследования. Э м п и р и ч е с к а я о п е р а ц и о н а л и з а ц и я непосредственно связана с теоретической: выбор эмпирически наблюдаемых признаков будет обусловлен д е ф и н и ц и е й политической стабильности, которая была сконструирована исследователем на теоретическом уровне. Предположим, что в рамках теоретической операционализации мы сочли о с н о в н ы м признаком политической стабильности н и з к и й 1 уровень протестной политической активности населения . С а м о по себе понятие «уровень протестной активности» еще не является эм пирически операциональным, о н о не поддается прямому измерению. В то же время о н о существенно конкретизирует наше п о н и м а н и е тер мина «политическая стабильность», значительно сужает область по иска его операциональных определений. Это как раз тот самый слу чай выбора концепции, который раньше мы рассматривали на примере теоретического исследования. Затем мы еще более конкретизируем понятие «протестная полити ческая активность населения» через основные системные формы этой активности: 1) массовые акции протеста; 2) протестное электоральное 2 поведение (голосование) . Под массовыми акциями протеста будут по ниматься организованные и стихийные митинги, демонстрации, пике ты, участники которых выражают негативное отношение к деятельнос ти властей; под протестным голосованием — электоральная поддержка избирателями региона тех партий и кандидатов, которые находятся в оппозиции к действующей власти, а также голосование против всех. На этом этапе мы перешли от абстрактных понятий к конкретным призна кам. Следующий шаг — конструирование эмпирически наблюдаемых признаков, уже являющихся переменными. К ним относятся: • частота протестных акций. Необходимо ответить на вопрос, сколько а к ц и й протеста имело место в регионе за определенный пе риод времени (например, за последний год или пять лет); ' В р е а л ь н о м исследовании выделения т о л ь к о одного признака было бы, разумеет ся, н е д о с т а т о ч н о . 2
Вопрос о в к л ю ч е н и и в анализ н е с и с т е м н ы х ф о р м политического протеста — тер
р о р и с т и ч е с к и х актов, вооруженного с о п р о т и в л е н и я властям и т.д. — решается в зави симости от их актуальности для к о н к р е т н ы х р е г и о н о в .
Глава 2. Подготовка к политическому анализу
•массовость акций протеста. Мы измеряем количество людей, п р и н я в ш и х участие в таких акциях; • электоральная поддержка кандидатов, находящихся в оппозиции к власти, на последних выборах главы региона. Определяется суммар ное число голосов, отданных за кандидатов о п п о з и ц и и (их перечень составляется конкретно для каждого региона);
2.4. О п е р а ц и о н а л и з а ц и я понятий
45
дей, участвовавших в акциях протеста, а их долю в общем населении (точнее, взрослом населении) региона. В итоге мы сконструировали многоступенчатую систему опера ционализации п о н я т и я «политическая стабильность», отображенную на схеме ниже.
• число голосов, отданных против всех кандидатов на последних вы борах губернатора; 'электоральная поддержка оппозиционных партий на последних выборах депутатов регионального законодательного собрания; • число голосов, отданных против всех кандидатов на последних вы борах депутатов регионального законодательного собрания. П р и в е д е н н ы й выше перечень, хоть он и неполон, отвечает основ ному критерию о п е р а ц и о н а л и з а ц и и — приводит понятие к измеряе мому, э м п и р и ч е с к и регистрируемому виду. Для каждой переменной мы имеем определенную единицу измерения и можем получить кон кретные значения для каждого случая, в нашем примере — для каждо го региона. Эти значения мы получим из определенного набора ис т о ч н и к о в и н ф о р м а ц и и : электоральной статистики, материалов С М И , документов Министерства внутренних дел. Однако работа по о п е р а ц и о н а л и з а ц и и п о н я т и я «политическая ста бильность» еще не завершена. Мы уже можем получить к о н к р е т н ы е значения эмпирических п р и з н а к о в для отдельных регионов, но пока не в состоянии сравнивать эти з н а ч е н и я между собой. Д л я того чтобы иметь возможность сравнивать показатели, необходимо привести их к единому виду, другими словами — стандартизировать. Н а п р и м е р , мы знаем, что на выборах депутатов Государственной думы 2003 г. в К р а с н о я р с к о м крае против всех партийных списков проголосовало 69,4 тыс. избирателей, а в Москве — 260 тыс. Сравни вать эти ц и ф р ы между собой некорректно по той простой причине, что эти два региона радикально различаются по общему числу изби рателей: в Москве их было зарегистрировано более 7 млн, а в Красно я р с к о м крае — 2,2 млн. Был также различен уровень их электоральной активности (явки): в Москве участие в выборах п р и н я л о 57,7% изби рателей, в К р а с н о я р с к о м крае — л и ш ь 45%. Поэтому корректно срав нивать не абсолютное число голосов, отданных против всех партий ных с п и с к о в , а доли голосов от числа избирателей, п р и н я в ш и х участие в выборах. В результате стандартизации получаем 7 , 1 % голо сов против всех для Красноярского края и 6,4% голосов для М о с к в ы : достаточно близкие показатели при незначительном преимуществе сибирского региона. Точно так же мы будем сравнивать не число л ю -
В процессе перехода от абстрактных понятий к конкретным пере менным неизбежно возникает вопрос, насколько корректно такой пе реход был осуществлен. Действительно ли выделенные переменные отражают и м е н н о уровень п о л и т и ч е с к о й стабильности, а не что-то другое? Свойство измерять и м е н н о то, что следует измерить, называ ют валидностью (от англ. valid — о б о с н о в а н н ы й , правильный). Валид ное измерение предполагает, что вариация значений переменной от ражает реальные и з м е н е н и я изучаемого признака, будучи при этом м и н и м а л ь н о чувствительной к и з м е н е н и я м других признаков. Х о р о ш и й п р и м е р невалидного и з м е р е н и я приводят Дж. Мангейм и Р. Рич в своей хрестоматийной работе «Политология: методы иссле дования»: Возможно, нам понадобится измерить, в какой степени граждане раз ных государств согласны с политикой своих правительств. Мы решаем ис пользовать в качестве показателя согласия или несогласия ответы на ряд специально подготовленных вопросов. Мы считаем, что единственным источником различий в ответах на вопросы являются различия мнений. Однако минутное размышление наводит на мысль о другом возможном источнике вариаций. Если среди исследуемых нами государств есть госу дарства с авторитарным правительством, прибегающим к услугам секрет ной полиции для подавления инакомыслия и рассматривающим любую
46
критику своей политики как акт государственной измены, граждане этих государств, вполне возможно, побоятся высказывать в интервью несогла сие со своим правительством. В этом случае оценки, полученные для на шего измерения, могут по крайней мере в той же степени определяться от ношением правительства данного государства к несогласным, в какой — 1 мнением интервьюируемых .
ременная) с переменной «доля голосов, отданных за о п п о з и ц и о н н ы е партии на выборах законодательного собрания» (В — тестируемая пе ременная). Ожидаемая связь является п р я м о й , так как большие зна чения обеих переменных свидетельствуют о нестабильности, малые — о стабильности. Рассмотрим два блока данных: Пример 1
Существует несколько способов тестирования измерений на валидность, или валидизации. Наиболее простые из них — очевидная и прогностическая валидизация. П р и очевидной валидизации валидность и з м е р е н и я не требует специальных доказательств, как в н а ш е м при мере с операционализацией п о н я т и я «электоральная поддержка пар тии» посредством переменной «число (или доля) голосов, отданных за данную политическую партию». Прогностическая валидизация ис пользуется в том случае, если измерения способны предсказывать будущие события. Н а п р и м е р , м о ж н о сравнить результаты предвыбор ного опроса общественного м н е н и я с результатами, реально получен н ы м и кандидатами по итогам голосования. Близость результатов бу дет являться показателем валидности измерений, осуществляемых в д а н н о м случае с п о м о щ ь ю анкетных вопросов. Однако при операционализации сложных понятий, как та же «по литическая стабильность», очевидная и прогностическая валидиза ция редко может быть использована. Требуется более т о н к а я процеду ра, а и м е н н о конструктная валидизация. Д а н н ы й метод предполагает конструирование системы о ж и д а н и й относительно связей: а) различ ных и з м е р е н и й одного и того же п о н я т и я (внутренняя конструктная валидизация); б) данного п о н я т и я с другим понятием ( в н е ш н я я кон структная валидизация). Внутренняя валидизация и з м е р е н и й политической стабильности будет включать, во-первых, п о и с к других переменных, валидных по о т н о ш е н и ю к данному понятию. Н а п р и м е р , одной из таких перемен ных станет «частота смены (в год) руководителей высшего ранга в ре гиональных структурах власти», так называемый уровень «кадровой чехарды». О политической нестабильности будут свидетельствовать большие з н а ч е н и я переменной. Во-вторых, мы будем формулировать н а ш и о ж и д а н и я относительно связи этой переменной с теми пере м е н н ы м и , которые тестируем на валидность. К примеру, мы ожидаем п р я м о й связи между переменной «частота смены руководителей выс шего ранга в региональных структурах власти» (А — контрольная пеМангейм, Дж.,
Рич,
Р.
Политология:
методы и с с л е д о в а н и я . М., 1997. С. 100.
47
2.4. О п е р а ц и о н а л и з а ц и я понятий
Глава 2. Подготовка к политическому анализу
А
В
Пример 2
А
В
20%
Регион а
20
45%
Регион а
20
Регион b
2
5%
Регион b
2
70%
Регион с
10
20%
Регион с
10
45%
Регион d
35
70%
Регион d
35
5%
В первом блоке наблюдается я в н о е сходство вариаций тестируемой и контрольной переменных. С н и ж е н и е значений переменной А соот ветствует с н и ж е н и ю значений переменной В, увеличение значений переменной А — увеличению значений переменной В. Таким образом, наблюдается прямая связь между п е р е м е н н ы м и А и В. Это полностью соответствует н а ш и м теоретическим ожиданиям и служит аргументом в пользу валидности измерения политической стабильности посредст вом индикатора «электоральная поддержка оппозиции». Более обсто ятельно понятие «связь переменных» мы рассмотрим в гл. 4. Во втором блоке наблюдается обратная связь между переменными (рост значений одной п е р е м е н н о й сопровождается уменьшением зна чений другой, и наоборот), что полностью противоречит н а ш и м ожи д а н и я м . Это повод серьезно задуматься о валидности измерения. Приведенные п р и м е р ы содержат небольшое число случаев и со знательно сделаны максимально наглядными. На большом массиве данных измерение связи между п е р е м е н н ы м и будет осуществляться статистическими методами, в частности к о р р е л я ц и о н н ы м анализом. При в н е ш н е й конструктной валидизации мы будем искать другое понятие, с которым понятие «политическая стабильность» теоретиче ски связано. Н а п р и м е р , при н и з к о м уровне политической стабильно сти мы можем ожидать н и з к о г о уровня активности иностранных ин весторов, которые о с о б е н н о тщательно взвешивают политические риски своих проектов. Связь между п о н я т и я м и является прямой. Далее необходимо установить валидную о п е р а ц и о н а л ь н у ю пере менную для п о н я т и я «уровень а к т и в н о с т и и н о с т р а н н ы х инвесторов» (уверенность в валидности здесь о ч е н ь важна, так как не имеет смысла тестировать одно с о м н и т е л ь н о е измерение с п о м о щ ь ю дру гого с о м н и т е л ь н о г о и з м е р е н и я ) . Таковым может являться отноше-
48
ние объема и н о с т р а н н ы х и н в е с т и ц и й к валовому региональному продукту или доля и н о с т р а н н ы х и н в е с т и ц и й в общем объеме инвес т и ц и й в э к о н о м и к у региона. Очень важно здесь отметить некоррект ность с р а в н е н и я объемов и н о с т р а н н ы х и н в е с т и ц и й в абсолютных цифрах. Региональные э к о н о м и к и очень сильно различаются по своему потенциалу, и в одном регионе 1 млн долл. и н о с т р а н н ы х ин в е с т и ц и й может быть очень в ы с о к и м показателем, а в другом — ни ч т о ж н о малым. На следующем этапе мы устанавливаем ожидаемую связь между о п е р а ц и о н а л ь н ы м и п е р е м е н н ы м и на основании связи между поняти я м и . В качестве операциональных переменных мы имеем долю голо сов, отданных за о п п о з и ц и о н н ы е партии на выборах законодательно го собрания (В — тестируемая переменная), и долю иностранных и н в е с т и ц и й в общем объеме инвестиций в э к о н о м и к у региона (С — контрольная переменная). Рассуждаем следующим образом: «Высо кие з н а ч е н и я переменной В свидетельствуют о низком уровне поли тической стабильности. Высокие значения переменной С свидетель ствуют о в ы с о к о м уровне а к т и в н о с т и и н о с т р а н н ы х и н в е с т о р о в . Высокий уровень стабильности соответствует высокому уровню ак тивности. Следовательно, мы ожидаем обратную связь между пере м е н н ы м и В и С, хотя связь между п о н я т и я м и является прямой». Со ответствующие н а ш и м ожиданиям д а н н ы е приведены ниже. Пример 1
С
В
Регион а
5%
45%
Регион b
40%
5%
Регион с
15%
20%
Регион d
0%
70%
Обоснованность выводов конструктной валидизации напрямую зависит от числа используемых контрольных переменных. Чем их больше, тем выше наша уверенность в валидности измерения. П р и этом следует иметь в виду, что не существует стопроцентно валидных и з м е р е н и й . По природе своей операциональные определения никог да не раскрывают всего содержания научных понятий, а только л и ш ь некоторую его часть. Множественность операциональных определений порождает еще одну проблему, связанную с необходимостью объединить значения отдельных п р и з н а к о в в о б щ и й показатель политической стабильнос ти. Такой показатель будет называться индексом. До сих пор в процес се о п е р а ц и о н а л и з а ц и и мы двигались от общего абстрактного п о н я т и я
49
2.4. О п е р а ц и о н а л и з а ц и я понятий
Глава 2. Подготовка к политическому.анализу
к конкретным э м п и р и ч е с к и м п р и з н а к а м . Чтобы построить индекс политической стабильности, придется пройти к а к бы о б р а т н ы й путь — от отдельных з н а ч е н и й к общему п о н я т и ю , и на этом пути предстоит определиться по целому ряду вопросов. В частности, необходимо уточнить структуру индекса. В нашем случае он будет состоять из двух частных индексов (подиндексов): «протестного голосования» и «акций протеста». Далее надо решить, с п о м о щ ь ю каких вычислительных процедур будет рассчитываться значение каждого из подиндексов. Подиндекс а к ц и й протеста логич но вычислить путем с у м м и р о в а н и я участников всех прошедших ак ций, а затем найти долю общего числа протестующих в населении ре гиона. Н а п р и м е р , с о с т о я л о с ь с е м ь а к ц и й протеста, в к о т о р ы х приняло участие 3 , 5 , 8 , 2 , 1 0 , 3 , 4 тыс. человек. Суммарное число про тестующих составляет 35 тыс. П р и населении региона 1 млн человек доля участвующих в акциях протеста составит 3,5%. Подиндекс протестного голосования можно рассчитать через оп ределение объема суммарных протестных электоратов для каждого вида выборов, а затем вычисление усредненного объема протестного электората. Выборы губернатора (1-й тур)
Выборы депутатов законодательного собрания
Голосование за оппозиционера А — 23%
За оппозиционную партию N — 30%
За оппозиционера 5 — 1 5 %
За оппозиционную партию М — 16%
За оппозиционера С — 10%
За оппозиционную партию А — 11%
Против всех — 7%
Против всех — 9%
Сумма — 55%
Сумма — 66%
-
Средний объем протестного электората составит соответственно (66 + 55) : 2 = 60,5%. Далее необходимо определить алгоритм ф о р м и р о в а н и я итогового индекса политической стабильности, и это совсем не простая задача. Очевидно, что диапазон в а р и а ц и и подиндекса акций протеста (веро ятно, в пределах 10%) будет о ч е н ь существенно отличаться от диапа зона вариации подиндекса протестного голосования (примерно от 10 до 80%). Поэтому механическое сложение или подсчет средней ниче го не дадут. Одно из практических р е ш е н и й проблемы заключается в переко дировке данных в формат е д и н о о б р а з н о й порядковой шкалы. Это мо жет быть сделано, например, следующим образом: 4 - 3863
50
Глава 2. Подготовка к политическому анализу
Шкальная оценка 1
2.5. Выдвижение и проверка гипотез
Диапазон значений
Класс шкалы
Акции протеста
Протестное голосование
до 1%
до 10%
Очень низкий уровень
2
Низкий уровень
1-3%
11-25%
3
Средний уровень
3-5%
26-40%
4
Высокий уровень
5
Очень высокий уровень
5-7%
41-60%
выше 7%
выше 60%
Теперь уже можно осмысленно рассчитывать значение индекса как средней или суммы двух подиндексов. Однако прежде необходимо оп ределиться еще по одному вопросу: будет ли «вклад» каждого из по диндексов в общий индекс равным или различным? Например, если мы рассматриваем массовые а к ц и и протеста в качестве более сильно го индикатора политической стабильности, то придется присвоить данному подиндексу больший вес по сравнению с подиндексом проте стного голосования. Для этого потребуется специальная процедура взвешивания, представляющая собой умножение значения подиндекса на специальный коэффициент. Например, если мы считаем подин декс протестных акций в два раза более значимым по сравнению с подиндексом протестного голосования, то присваиваем первому вес 1, а второму — вес 0,5 (или 2 и 1 соответственно). В этом случае при зна чении подиндекса акций протеста 4 (высокий уровень) и значении по диндекса протестного голосования 3 (средний уровень) индекс ста бильности составит 4 х 1 + 3 х 0,5 = 5,5.
2.5. Выдвижение и проверка гипотез В
широком
переменными,
смысле
гипотеза
отражающими
—
свойства
это утверждение о изучаемого
объекта.
связях между В
большин
стве случаев (но не всегда) речь идет о влиянии одной или нескольких независимых переменных на зависимую переменную. Независимая переменная является объясняющей по о т н о ш е н и ю к з а в и с и м о й (объ я с н я е м о й ) переменной. В политическом анализе, к а к и в обществен ных науках в целом, независимая переменная и даже целый комплекс независимых переменных объясняют л и ш ь определенную долю вари а ц и и зависимой переменной. Соответственно, гипотезы являются ут верждениями о неких закономерностях или тенденциях, а не об абсо лютных законах. Так, гипотеза о прямой связи между п е р е м е н н ы м и «принадлежность к сельскому населению» (независимая) и «голосо-
51
вание за п а р т и и с к о н с е р в а т и в н о й идеологией» ( з а в и с и м а я ) не утверждает, что каждый сельский житель будет голосовать за консер вативные партии. В гипотезе содержится утверждение, что принад лежность к сельскому населению увеличивает вероятность такого электорального поведения. Определив характеристики связи между переменными, мы сможем предсказывать — опять же, с определен ной вероятностью — значения з а в и с и м о й переменной по значениям независимой. Формулировка гипотезы в научных исследованиях должна отве чать ряду требований. Прежде всего гипотеза должна быть проверяе мой. Другими словами, должны существовать я с н ы е критерии о ц е н к и истинности или ложности научной гипотезы, а также практически ре ализуемый способ протестировать гипотезу на соответствие этим кри териям. Проверяемая гипотеза должна быть сформулирована в терминах, которые могут быть о п е р а ц и о н а л и з и р о в а н ы на э м п и р и ч е с к о м уров не. Это касается и самих переменных, и связей между переменными. Так, утверждение «демократический политический режим лучше, чем авторитарный» не является научной гипотезой, так как относится к ценностным суждениям. П о н я т и е «лучше» не может иметь признан ного операционального определения на э м п и р и ч е с к о м уровне. Не является также научной гипотезой утверждение «фактор урба низации сильно влияет на электоральное поведение». Д а н н а я форму лировка чрезмерно абстрактна: что такое «фактор урбанизации»? ка кие с о с т о я н и я имеет этот фактор? о каких видах электорального поведения идет речь — о голосовании за определенную партию (ка кую?) или «против всех», об участии в выборах? каким образом опре деленные состояния «фактора урбанизации» связаны с определенны ми ф о р м а м и электорального поведения? каков критерий о ц е н к и «силы» этой связи? Однако если в примере со с р а в н е н и е м политических режимов мы п р и н ц и п и а л ь н о не можем сконструировать научную гипотезу, так как ц е н н о с т н ы е п о н я т и я н е о п е р а ц и о н а л ь н ы по определению, то в другом примере имеется в о з м о ж н о с т ь сформулировать утверждение в научно п р и е м л е м о й ф о р м е . Д л я этого его необходимо конкретизи ровать, ответив на п о с т а в л е н н ы е в о п р о с ы . Так, фактор урбанизации может быть представлен к а к н е з а в и с и м а я переменная «принадлеж ность к городскому или сельскому населению» (номинальная пере менная) и л и «доля городского/сельского населения в регионе» (ин тервальная п е р е м е н н а я ) . П о н я т и е «электоральное поведение» мы можем к о н к р е т и з и р о в а т ь через п о н я т и е «поддержка либеральных
52
Глава 2. Подготовка к политическому анализу
политических партий», которое, в свою очередь, получает эмпири ческое о п е р а ц и о н а л ь н о е определение как «суммарный процент го лосов, отданных на парламентских выборах 2003 г. за партии и объе динения " Я б л о к о " , С П С , " С Л О Н " , "Автомобилисты России", Российскую конституционно-демократическую партию». Гипотеза будет иметь следующий вид: «Рост доли городского населения по регионам РФ (независимая переменная) ведет к росту суммарной доли голосов, отданных за спи ски партий " Я б л о к о " , С П С , " С Л О Н " , АР и Р К Д П (зависимая пере м е н н а я ) . Связь считается сильной в том случае, если независимая пе ременная объясняет более 50% вариации зависимой». Гипотезы д о л ж н ы представлять собой обоснованные утверждения. Это означает, что о н и : • либо логически вытекают из какой-то доказавшей свою состоя тельность теории. В этом случае гипотеза будет сформулирована де дуктивным способом; • л и б о о б о б щ а ю т совокупность е д и н и ч н ы х н а б л ю д е н и й . Напри мер, мы в и д и м , что высокие показатели поддержки партии А со провождаются в ы с о к и м и показателями поддержки партии С в не с к о л ь к и х субъектах Р о с с и й с к о й Ф е д е р а ц и и . М ы ф о р м у л и р у е м п р е д п о л о ж е н и е о н а л и ч и и п р я м о й связи между п е р е м е н н ы м и «под д е р ж к а А» и «поддержка С» для Р о с с и и в целом (это п р и м е р гипоте зы, в к о т о р о й п е р е м е н н ы е не подразделяются на н е з а в и с и м ы е и за в и с и м ы е ) . Т а к а я г и п о т е з а будет с ф о р м у л и р о в а н а индуктивным способом. Очевидно в этой связи, что утверждение «граждане в ы ш е среднего роста голосуют в основном за левые партии, а граждане ниже средне го роста — за правые» не является о б о с н о в а н н ы м , так к а к не вытека ет ни из одной известной теории и не базируется на репрезентативной совокупности эмпирических наблюдений. Гипотезы в научном исследовании должны обладать также свойст вом о б о б щ е н и я : объяснять некий класс я в л е н и й , а не отдельный фе н о м е н . В этом их отличие от частных утверждений, таких, к а к «нара щ и в а н и е страной А военной мощи приведет к росту н а п р я ж е н н о с т и в ее в з а и м о о т н о ш е н и я х со страной В» или «высокая я в к а избирателей на выборы 12 марта 20... г. увеличит вероятность победы кандидата Иванова». В то же время частные утверждения о связях, зависимости, структуре изучаемых объектов должны отвечать требованиям прове ряемости, о п е р а ц и о н а л и з а ц и и на эмпирическом уровне, конкретнос ти и обоснованности. В этом п р и н ц и п и а л ь н о е отличие политическо го анализа к а к научной д и с ц и п л и н ы от разного рода ненаучных
2.5. Выдвижение и проверка гипотез
53
спекуляций на политические темы. Например, в утверждении «нара щивание страной А военной м о щ и приведет к росту н а п р я ж е н н о с т и в ее взаимоотношениях со страной В» мы имеем: • независимую переменную «военная м о щ ь страны А», которая может быть операционализирована через совокупность качественных и количественных характеристик вооруженных сил (численность ар мии, соотношение современных и устаревших видов вооружений и т.д.) или через объем ассигнований государственного бюджета на во е н н о - п р о м ы ш л е н н ы й комплекс; • зависимую переменную «уровень н а п р я ж е н н о с т и в отношениях стран Aw В». О п е р а ц и о н а л ь н ы м и индикаторами этой переменной мо гут стать, к примеру, объем внешнеторгового оборота между страна ми, степень позитивности (негативности) высказываний лидеров го сударств друг о друге, степень солидарности п о з и ц и й при п р и н я т и и коллективных решений в рамках О О Н и других международных орга н и з а ц и й и т.д.; • прямую связь между двумя п е р е м е н н ы м и . Рост значений пере м е н н о й «военная м о щ ь А» ведет к росту значений переменной «уро вень напряженности в о т н о ш е н и я х А и В». Еще одно общенаучное требование к гипотезам состоит в том, что они не д о л ж н ы противоречить точно установленным фактам и дока з а н н ы м теориям. Однако применительно к гипотезам в политической науке это требование не является жестким. Как было сказано выше, независимые переменные в политологических гипотезах объясняют л и ш ь некоторую долю вариации зависимой переменной, о н и не могут объяснить все факты. Также в политической науке не существует уни версальных теорий, истинность которых была бы неопровержимо до казана ( н а п р и м е р , совокупность п р и н ц и п о в классической механики в физике). Как правило, в политических исследованиях формулируется не од на гипотеза, а несколько. Важно, чтобы все выдвинутые гипотезы представляли собой единую систему, направленную на достижение цели исследования. Отдельные же гипотезы должны соответствовать частным задачам исследования. Так, гипотезы могут находиться в оп р е д е л е н н о м иерархическом с о о т н о ш е н и и . Выделяются гипотезыоснования ( о с н о в н ы е гипотезы) и гипотезы-следствия (выводные гипотезы), логически вытекающие из основных. При этом непосред ственной э м п и р и ч е с к о й проверке поддаются и м е н н о гипотезы - след ствия, на о с н о в а н и и истинности которых мы судим об истинности гипотезы-основания. В уже приводившемся примере с действием фактора урбанизации о с н о в н о й гипотезой является следующее ут-
54
Глава 2. Подготовка к политическому анализу
верждение: «Принадлежность избирателей к городскому населению способствует голосованию за либеральные партии». Из этой гипотезы вытекают несколько гипотез-следствий: • «Рост доли городского населения по регионам РФ ведет к росту суммарной доли голосов, отданных за списки партий " Я б л о к о " , С П С , " С Л О Н " , АР и Р К Д П на выборах депутатов Государственной думы 2003 г.; • «Рост доли городского населения по регионам РФ ведет к росту суммарной доли голосов, отданных за списки партий С П С , " Я б л о к о " и К Д Р на выборах депутатов Государственной думы 1999 г.»; • «Рост доли городского населения по регионам РФ ведет к росту суммарной доли голосов, отданных за списки партий " Я б л о к о " и С П С на выборах депутатов региональных законодательных собраний, состоявшихся в 2004 - 2006 гг.»; • «Рост доли городского населения по регионам РФ ведет к росту суммарной доли голосов, отданных за кандидатов, баллотирующихся в законодательное собрание от партий " Я б л о к о " и С П С или при их поддержке»; • «Доля респондентов, указавших свою принадлежность к городско му населению и положительно ответивших на вопрос о голосовании за С П С или " Я б л о к о " , будет больше доли респондентов, указавших свою принадлежность к сельскому населению и положительно ответивших на вопрос о голосовании за С П С или "Яблоко"». Если первые четыре гипотезы предполагают тестирование на истин ность путем анализа электоральной и демографической статистики, то последняя верифицируется с помощью анализа данных опросов обще ственного мнения. Рекомендуется выдвигать как можно большее число гипотез-след ствий. Чем больше гипотез-следствий получат эмпирическое под тверждение, тем выше будет степень уверенности относительно ис т и н н о с т и гипотезы-основания.
Контрольные вопросы и задания 1. Что такое программа политико-аналитического исследования? Ответы на какие ключевые вопросы она должна содержать? 2. Что такое рабочий план исследования? Какую ф у н к ц и ю он выполняет? 3. Определите понятия «переменная», «случай», «значение». 4. Охарактеризуйте основные уровни измерения: н о м и н а л ь н ы й , порядко вый, интервальный. 5. Дайте определение понятию «операционализация». Чем теоретическая
Литература
55
операционализация отличается от эмпирической? Приведите пример эмпи рической операционализации понятия. 6. Что такое гипотеза, какую роль она играет в исследовании? Каким тре бованиям должна соответствовать научная гипотеза?
Литература Мангейм, Дж., Рич, Р. Политология : методы исследования. М., 1997. Рабочая книга социолога. М., 2003. Туронок, С. Г. Политический анализ : курс лекций. М., 2005. Ядов, В. А. Социологическое исследование: методология, программа, ме тоды. Самара, 1995.
3.1. Критерии ф о р м и р о в а н и я и н ф о р м а ц и о н н о г о обеспечения
ГЛАВА 3
Информационное обеспечение политического анализа и прогнозирования
57
Далее, н е о б х о д и м о о ц е н и т ь уровень субъективнос т и / о б ъ е к т и в н о с т и той или и н о й и н ф о р м а ц и и . В политических исследованиях чрезвычайно важно я с н о разграничивать ф а к т ы и ин терпретации, происходящие события и о т н о ш е н и я к н и м . Даже ис кренне настроенный на объективное восприятие наблюдатель смот рит на происходящее в политической жизни через призму своего мировоззрения, ценностных установок. К а к и в случае с надежностью, различные и с т о ч н и к и и н ф о р м а ц и и могут обладать различной заведомой субъективностью. Так, сообще ние и н ф о р м а ц и о н н о г о агентства будет по определению содержать меньше интерпретационных н а с л о е н и й , нежели статья политическо го публициста в массовом печатном издании.
3.1. Критерии формирования информационного обеспечения Определяясь с и н ф о р м а ц и о н н ы м обеспечением, специалист по поли тическому анализу и прогнозированию должен руководствоваться це л ы м рядом критериев, или правил ориентации в информационном мас сиве. Часть этих критериев будет определяться целями и задачами каждого конкретного исследования, однако другую часть составят критерии, о б щ и е для любой аналитической работы. П р е ж д е всего и н ф о р м а ц и я д о л ж н а обладать о п р е д е л е н н ы м у р о в н е м н а д е ж н о с т и , достаточным для ф о р м и р о в а н и я обос н о в а н н ы х выводов и заключений. В политическом анализе надеж ность исходных данных далеко не всегда очевидна. В традиционных к л а с с и ф и к а ц и я х выделяются две степени надежности и н ф о р м а ц и и : абсолютно достоверная и вероятностно достоверная. Н е к о т о р ы е ис т о ч н и к и и н ф о р м а ц и и обладают заведомой надежностью, н а п р и м е р о п у б л и к о в а н н ы й на о ф и ц и а л ь н о м сайте Президента РФ текст его указа или выступления. Однако в большинстве случаев политическая и н ф о р м а ц и я обладает вероятностной надежностью. Одним из прак тических способов увеличения вероятностной надежности информа ц и и является р а с ш и р е н и е числа источников, подтверждающих досто верность сведений, содержащихся в том или и н о м с о о б щ е н и и . В ряде случаев — и это с п е ц и ф и к а политических исследований —а н а л и т и к может располагать абсолютно недостоверной (ложной) ин ф о р м а ц и е й , которая может оказаться полезной в процессе формиро вания выводов и заключений. Если мы знаем, что утверждение поли т и к а А о п о л и т и к е В я в л я е т с я л о ж н ы м , мы м о ж е м сделать содержательные выводы о политической тактике А по о т н о ш е н и ю к В, характере их о т н о ш е н и й и т.д.
Следующая п о з и ц и я , которая подлежит оценке, — п о л н о т а и н ф о р м а ц и и . С этой точки з р е н и я и н ф о р м а ц и я бывает частичной и комплексной. Последняя дает всесторонние сведения об объекте изу чения; первая на практике может использоваться только в совокупно сти с другой и н ф о р м а ц и е й . П р и этом следует четко понимать, что получение абсолютно полной и н ф о р м а ц и и о любом объекте исследо вания не только невозможно, но и не нужно. В каждом случае анали тик должен определить ту степень полноты и н ф о р м а ц и и , которая бу дет д о с т а т о ч н о й для ф о р м и р о в а н и я о б о с н о в а н н ы х выводов в соответствии с целью и задачами исследования. Названные выше критерии — надежность, объективность и полно та — вытекают из самой природы обоснованного научного знания и п р и м е н и м ы ко всей совокупности исследований. Однако существует целый ряд вопросов прагматичного характера, ответы на которые так же д о л ж н ы быть даны в процессе разработки и н ф о р м а ц и о н н о г о обес печения. Эти ответы будут диктоваться не только стремлением к науч ной добросовестности, но и объективной ограниченностью ресурсов в любом теоретическом или прикладном политическом анализе. Необходимо оценить у р о в е н ь д о с т у п н о с т и той или иной и н ф о р м а ц и и . В одних случаях доступ к полезным для исследователя сведениям может быть ограничен определенным кругом л и ц (напри мер, сведения могут находиться под грифом «секретно» или «для слу жебного пользования»). В других случаях и н ф о р м а ц и я может быть п р и н ц и п и а л ь н о доступна, но ее получение будет связано с неоправ д а н н о большой затратой ресурсов. И н ф о р м а ц и я может быть недо ступна и в том временном режиме, который оптимален для исследо вателя (слабая оперативная доступность). П р и н ц и п и а л ь н о в а ж н ы м зачастую о к а з ы в а е т с я выбор между п е р в и ч н о й и п е р е р а б о т а н н о й (производной, вторичной)
58
Глава 3. Информационное обеспечение политического анализа и прогнозирования
и н ф о р м а ц и е й . П е р в и ч н а я и н ф о р м а ц и я представляет собой совокуп ность полученных непосредственно из источника несистематизиро ванных данных. Так, при анализе м н е н и й представителей российской прессы о взаимоотношениях России и Украины первичной информа цией будут все материалы прессы (статьи, репортажи, комментарии, передачи и т.д.) за определенный период времени, и м е ю щ и е отноше ние к данному вопросу. Это будет максимально полная, но чрезвычай но громоздкая по объему и н ф о р м а ц и я , содержащая много л и ш н е г о и ненужного. Простая обработка такого массива может заключаться в его реферировании — вычленении только тех фрагментов, которые непосредственно относятся к предмету изучения; удалении повторов; группировке высказываний по некоторому содержательному призна ку. Н а к о н е ц , аналитик может остановиться на выборе источника, со держащего обобщения первичного и н ф о р м а ц и о н н о г о массива: в таком качестве могут выступать подготовленные другими исследователями аналитические материалы, обзоры д а н н о й темы, результаты количе ственного анализа прессы и т.д. В этом случае произойдет не только физическое с о к р а щ е н и е массива, подлежащего анализу, но и появит ся возможность использовать уже сформулированные выводы. В то же время существенно сократится полнота и н ф о р м а ц и и , снизится ее надежность и объективность: авторы обобщенных материалов могли руководствоваться определенным политическим заказом или их под ход к проблеме п р и н ц и п и а л ь н о отличается от того, которого придер живается исследователь.
3.1. Критерии ф о р м и р о в а н и я и н ф о р м а ц и о н н о г о обеспечения
59
при оценке ш а н с о в действующего депутата на переизбрание про ф и л ь н ы м и будут д а н н ы е об уровне его поддержки населением, ины ми словами — его текущий рейтинг. В той же ситуации ф о н о в о й ин ф о р м а ц и е й будут д а н н ы е о с о ц и а л ь н о - э к о н о м и ч е с к о м п о л о ж е н и и той территории, от которой депутат избран. В первом случае про ф и л ь н ы й характер и н ф о р м а ц и и определяется тем, что и м е н н о изби ратели непосредственно решают судьбу мандата в процессе голосова н и я , и уровень их поддержки действующего депутата н а п р я м у ю связан с о ц е н к о й его шансов на переизбрание. Во втором случае ин ф о р м а ц и я является ф о н о в о й , так к а к с о ц и а л ь н о - э к о н о м и ч е с к а я си туация хотя и влияет на поддержку действующего депутата как пред ставителя власти, но это влияние существенно слабее. Если бы речь шла, н а п р и м е р , о выборах представителя исполнительной власти, с о ц и а л ь н о - э к о н о м и ч е с к и е д а н н ы е и м е л и бы шансы стать профиль н ы м и : исполнительная власть гораздо больше влияет на состояние хозяйственного комплекса, следовательно в большей степени ответ ственна за это с о с т о я н и е . М о ж н о сказать, перефразируя сформулиро ванное выше правило, что анализ профильных данных осуществляется скорее на основе первичной информации, анализ фоновых — производной. В нашем примере есть п р я м о й резон включить в программу исследо вания измерение рейтинга депутата непосредственно, т.е. путем мас сового опроса избирателей. В то же время едва ли стоит осуществлять углубленный а н а л и з с о ц и а л ь н о - э к о н о м и ч е с к о й ситуации на «сыром» массиве данных — здесь м о ж н о воспользоваться производными дан ными (не забывая при этом об о ц е н к е их надежности).
В целом рекомендуется как м о ж н о больше обращаться к первич н о й и н ф о р м а ц и и , так как в этом случае риск оказаться заложником чужих о ш и б о к или преднамеренных искажений будет м и н и м а л е н . В то же время характер политических проблем столь сложен, а объем и разнообразие требуемой и н ф о р м а ц и и столь велики, что строить анализ целиком на первичных данных зачастую не представляется в о з м о ж н ы м . Поэтому общее правило можно сформулировать следую щ и м образом: чем ближе проблема к смысловому ядру исследования, чем плотнее она входит в его предметное поле, тем больше потребность в обращении к первичным данным. Если проблема в той или иной степе ни п е р и ф е р и й н а по о т н о ш е н и ю к предмету исследования, допустимо использование вторичной и н ф о р м а ц и и .
Еще один вопрос, в о з н и к а ю щ и й при работе с большими информа ц и о н н ы м и массивами, — это вопрос о проведении сплошного или выборочного исследования. Сплошное исследование — это исследова ние генеральной совокупности наблюдений, или всех элементов объ екта исследования. Если объектом являются студенты МГУ (а пред метом — их п о л и т и ч е с к и е п р е д п о ч т е н и я ) , то п р и с п л о ш н о м исследовании мы д о л ж н ы подвергнуть изучению политические пред почтения каждого студента МГУ. Если мы изучаем высказывания представителей отечественной прессы о российско-украинских отно шениях за 2005 г., то при с п л о ш н о м исследовании все такие высказы вания д о л ж н ы быть п р о а н а л и з и р о в а н ы .
Здесь возникает практически значимая проблема отделения п р о ф и л ь н о й — непосредственно относящейся к предмету исследова н и я — и н ф о р м а ц и и от и н ф о р м а ц и и ф о н о в о й — с в я з а н н о й с пред метом исследования, но не напрямую. Это в полной мере относится как к теоретическим, так и к прикладным исследованиям. Например,
Выборочное исследование предполагает отбор и изучение не всех объектов генеральной совокупности, а их части, но таким образом, чтобы выводы, сделанные относительно этой части, могли быть рас пространены на всю генеральную совокупность. Свойство выбороч ной совокупности (выборки) отражать п р и з н а к и генеральной сово-
60
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
купности, важные с точки зрения целей и задач исследования, назы ваются репрезентативностью.
При проведении выборочного исследо
вания будут опрашиваться не все студенты МГУ, а только меньшая их часть, но эта часть должна быть репрезентативна по о т н о ш е н и ю к ге неральной совокупности. О п р и н ц и п а х и приемах ф о р м и р о в а н и я вы
61
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
• владеющие и н ф о р м а ц и е й люди, сведения от которых м о ж н о по лучить путем опроса. Метод опроса включает в себя достаточно боль ш о й набор различных техник; • н е п о с р е д с т в е н н о е в о с п р и я т и е исследователем политических событий, или наблюдение.
происходящих
борочной совокупности мы поговорим отдельно. Следует еще определиться с такой характеристикой и н ф о р м а ц и и , как е е о б н о в л я е м о с т ь . П о этому критерию выделяется постоян ная и переменная (обновляемая) и н ф о р м а ц и я . Постоянная информа
Документальные ИСТОЧНИКИ информации Документальные источники и н ф о р м а ц и и чрезвычайно разнообразны
ция собирается однократно и затем остается в целом н е и з м е н н о й на
по целому ряду позиций. Политический документ — это и отчет о стати
протяжении всего исследования; обновляемая информация пополняет
стике работы с законопроектами на официальном интернет-сайте Госу
ся и изменяется с определенной периодичностью. Так, п р и изучении
дарственной думы, и хранящиеся в архиве письма В.И. Ленина, и аудио
персонального состава и политической активности членов Совета
кассета с репортажем о политическом митинге на Красной площади.
Ф е д е р а ц и и в качестве п о с т о я н н о й и н ф о р м а ц и и мы будем распола гать, н а п р и м е р , б и о г р а ф и я м и , сенаторов, в качестве обновляемой — сведениями об их публичных выступлениях,
визитах в р е г и о н ы ,
Документы различаются формой представления информации.
На
пример, выступление президента страны может быть представлено аудиовизуально (видеозапись), аудиально (звукозапись), иметь вид текстовой записи. Для одной и той же ф о р м ы представления инфор
встречах с населением, представителями элиты и т.д. П р и выборе и с т о ч н и к о в о б н о в л я е м о й и н ф о р м а ц и и з н а ч е н и е
мации возможны разные виды ее кодировки. Так, видео- и звукозапись
к а к о й времен
может быть осуществлена аналоговым или ц и ф р о в ы м способом. Раз
ной зазор разделяет ф а к т осуществления того или и н о г о политичес
н ы м ф о р м а м представления и н ф о р м а ц и и и разным видам кодировки
кого с о б ы т и я и о т р а ж е н и е этого ф а к т а в и н ф о р м а ц и о н н о м источни
соответствуют свои носители информации: в нашем примере аналого
имеет степень оперативности обновления данных, т.е.
ке.
Особенно важна оперативность обновления
информации в
вая видеозапись будет храниться на видеокассете (обычно формата
фиксация
VHS или Betacam), цифровая — на электронном носителе (жесткий
и з м е н е н и й о п р е д е л е н н о й ситуации или каких-то ее отдельных пара
д и с к компьютера, C D - или DVD-диск, флеш-карта и т.д.). Эти, каза
метров.
лось бы, «технические подробности» могут иметь очень существенное
мониторинговых
исследованиях,
целью
которых
является
Н а к о н е ц , нельзя забывать и о такой важной, хотя исключительно п р а к т и ч е с к о й , характеристике и н ф о р м а ц и о н н о г о и с т о ч н и к а , как удобство и скорость его обработки.
значение при п р и н я т и и аналитиком р е ш е н и й об и н ф о р м а ц и о н н о м обеспечении своей работы. В огромном массиве документальной и н ф о р м а ц и и выделяется не сколько ее видов, наиболее а к т и в н о используемых в качестве источ н и к о в и н ф о р м а ц и о н н о г о обеспечения политического анализа:
3.2. Источники информации и методы сбора данных П р и всем многообразии политической и н ф о р м а ц и и число принци пиальных способов (или базовых источников) ее получения невели ко. По большому счету существует всего три базовых и с т о ч н и к а ин формации: • материальные носители и н ф о р м а ц и и , специально созданные для ее х р а н е н и я и передачи, которые в науке называются документами. Это наиболее важный для политических исследований корпус источ н и к о в и самый разнообразный. Выработан целый ряд специальных методов работы с документами (о них речь ниже);
• материалы средств массовой и н ф о р м а ц и и ; • статистические д а н н ы е ; • нормативно-правовые акты; • политико-идеологические документы; • а г и т а ц и о н н о - п р о п а г а н д и с т с к и е материалы. К основным с р е д с т в а м
массовой
информации
отно
сятся телевидение, радио, пресса, и н ф о р м а ц и о н н ы е агентства. Ино гда к этой группе относят и Интернет, но более корректно говорить об этой глобальной сети как особой, уникальной системе хранения и пе редачи и н ф о р м а ц и и , по ряду характеристик радикально отличающей ся от т р а д и ц и о н н ы х С М И .
62
Глава 3. Информационное обеспечение политического анализа и прогнозирования
3.2. Источники и н ф о р м а ц и и и методы сбора данных
63
Специфика С М И с позиций информационного обеспечения поли тического анализа заложена уже в названии этого источника данных: С М И по определению рассчитаны на массовую аудиторию. Разумеется, масштаб этой «массовости» может колебаться от нескольких тысяч или даже сотен подписчиков одного журнала до многих миллионов зрителей общенациональных и международных телеканалов. Однако в любом случае ориентация на широкую аудиторию предопределяет возмож ность политического влияния. Информация в политике сама по себе яв ляется мощным ресурсом, а способность транслировать ее в массы це нится вдвойне. С М И не только и не столько информируют свои аудитории о происходящих событиях, сколько формируют определен ный угол зрения на эти события, задают вектор их восприятия. Это про исходит и в том случае, когда руководство С М И не ангажировано ка кой-то определенной политической силой и далеко от стремления грубо навязать ту или иную точку зрения общественности. Однако даже про стой выбор из очень большого числа ежедневно происходящих событий тех немногочисленных «информационных поводов», которые попадают в «повестку дня» и становятся фактом массового сознания, уже являет ся актом формирования определенной «картины мира».
и н ф о р м а ц и о н н ы е потребности последнего существенно отличаются от потребностей политического аналитика. Причем в большинстве случаев чем шире аудитория С М И , тем менее полную и н ф о р м а ц и ю можно с его помощью получить. Так, самое массовое С М И — телеви дение — отдает информации о политической жизни очень незначи тельную часть эфирного времени. За исключением наиболее значимых поводов политической повестки дня, события освещаются обычно очень кратко, так как детальные о п и с а н и я просто не интересны массо вой аудитории. Несколько лучше (конечно, с точки зрения информа ционных потребностей политического анализа) ситуация обстоит на радио, где аудитория меньше по объему. Радиоканалы, специализирую щиеся на общественной и политической проблематике, дают разверну тый комментарий нескольких экспертов по какой-то конкретной по литической проблеме. Еще более подробную и н ф о р м а ц и ю можно получить на страницах газеты и тем более общественно-политического журнала, которые не ограничены жесточайшими рамками эфирного времени. П р и этом аудитория общественно-политических печатных изданий в п р и н ц и п е не сопоставима по своему объему с аудиторий те левидения и даже радио.
П р и этом и аудитория различных С М И определенным образом влияет на характер освещения и м и событий. Каждое С М И и тем бо лее каждая телевизионная программа или газетная колонка в той или и н о й степени «привязаны» к своей аудитории, к ее о ж и д а н и я м (или к своему п о н и м а н и ю этих ожиданий), что также является фактором по дачи и н ф о р м а ц и и в определенном свете. Характерна сама метафора «освещение событий», ведь свет не идет отовсюду, он падает под оп ределенным углом, и если есть свет, обязательно есть и тень. В этой связи нужна известная осторожность при работе со С М И как источ н и к о м и н ф о р м а ц и и для политического анализа. Прежде всего это ка сается уровня субъективности и н ф о р м а ц и и : о с н о в н ы м продуктом С М И являются не факты, а их интерпретации. Определенное исклю чение составляют и н ф о р м а ц и о н н ы е агентства, такие, как Рейтер, Ф р а н с Пресс, Р И А «Новости» и др. Однако это с о в е р ш е н н о особый род и н ф о р м а ц и о н н ы х источников: основной аудиторией информ агентств является не столько общественность, сколько сами С М И , и их «массовость» м о ж н о поставить под сомнение.
Уровень достоверности политической и н ф о р м а ц и и в С М И сложно оценить однозначно. С одной стороны, прямое искажение фактов в прессе практически неизбежно ведет к судебному преследованию: по роду своей деятельности политики отличаются от звезд шоу-бизнеса несколько более внимательным отношением к своей репутации, здесь не действует п р и н ц и п «известность л ю б о й ценой». С другой стороны, в прессе (особенно, к сожалению, в отечественной) ш и р о к о распро странена практика «политического заказа». К проблеме оценки досто верности документальных источников в целом мы еще вернемся.
Нередко возникает проблема полноты и н ф о р м а ц и и . Л ю б ы м С М И движет желание быть интересным своей аудитории (хоть и очень раз ной) — в этом залог его в ы ж и в а н и я и успеха. В результате в э ф и р или на страницу газеты попадает л и ш ь то, что, по м н е н и ю представителей С М И , интересно массовому потребителю и н ф о р м а ц и и . Разумеется,
И н ф о р м а ц и я С М И отличается достаточно высокой оперативнос тью, хотя по этому показателю среди С М И есть свои лидеры и аутсайде ры. К первым принадлежат прежде всего информационные агентства: максимально быстрая доставка сообщений о событиях — это почти в прямом смысле слова их хлеб. И н ф о р м а ц и о н н ы е агентства — единст венные С М И , способные обеспечивать непрерывный поток данных по политической тематике. Оперативны также телевидение и радио, осо бенно в формате «прямых включений с места событий». В числе «отста ющих» — печатные С М И , оперативность которых ограничена перио дичностью их выхода в свет и особенностями технологического цикла. Даже специальный выпуск ежедневной газеты необходимо сверстать, отпечатать и доставить на точки распространения, что неизбежно влечет за собой существенное (по меркам С М И ) запоздание информации.
64
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
Б е с с п о р н ы м достоинством всех средств массовой и н ф о р м а ц и и яв ляется их высокая доступность. Д а н н ы й вид источников доступен, что называется, по определению. Единственным ограничением мо жет служить высокая стоимость, однако это относится л и ш ь к незна чительной категории узкоспециализированных изданий (например, подписка на некоторые журналы по проблематике нефтегазового комплекса может составлять несколько тысяч рублей в месяц). С т е п е н ь технического удобства обработки и н ф о р м а ц и и С М И очень сильно варьируется, причем не только в зависимости от типа С М И . В настоящее время исследователь может получать материалы прессы в нескольких разных форматах. Так, газету м о ж н о прочитать не только в ее «первозданном» — бумажном — виде, очень неудобном для последующей обработки. М о ж н о назвать по крайней мере три до полнительных ее варианта. Прежде всего это интернет-версия газеты, которой располагают в настоящее время не только большинство федеральных, но и многие региональные издания. Как правило, интернет-версия общественнополитических изданий содержит все или большинство материалов — в том числе графических, сопровождающих статьи (фотографии, ка рикатуры и т.д.), — доступных в бумажной версии. Работая с интер нет-версией, м о ж н о понять, какие материалы редакция считает глав н ы м и в д а н н о м номере (их заголовки выносятся на первую полосу). Все это будет представлено в электронном виде, тем более что обыч н ы й для таких случаев формат html легко «усваивается» распростра н е н н ы м и текстовыми редакторами, т а к и м и , как MS Word. В то же время интернет-версии печатных изданий могут быть рас считаны на несколько иную аудиторию по сравнению с читателями печатной версии. В н е ш н и й вид газеты неизбежно изменится хотя бы по той простой причине, что традиционная для печатных газет полоса (А2 или A3) физически не поместится на экране монитора. И н ы м и словами, по сравнению с печатным изданием мы будем иметь опреде ленную потерю и н ф о р м а ц и и в обмен на преимущество в техническом удобстве. Можем ли мы пренебречь этой потерей? — ответ на этот во прос целиком зависит от целей исследования. Если нас интересуют из л о ж е н н ы е в газете факты и суждения по определенной проблеме, не касающейся собственно данного издания, то можем. Если же для нас важны, к примеру, особенности восприятия политической позиции данного издания его читателями — ответ будет отрицательным. Другая возможная форма газеты — ее электронная копия, получен ная с п о м о щ ь ю процедуры с к а н и р о в а н и я . Фактически это «цифровая фотография» газетных полос; обычно для ее чтения используется про-
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
65
грамма Acrobat Reader (формат pdf). Потери и н ф о р м а ц и и здесь прак тически нет, однако могут возникнуть сугубо технические трудности. Так, файлы в формате pdf достаточно велики по объему, их труднее ре дактировать, особенно при низком разрешении сканирования. Н а к о н е ц , м о ж н о получить чисто текстовую электронную версию газеты (обычно формат txt). Д а н н ы й формат наиболее удобен с техни ческой точки з р е н и я : он может передаваться по электронным каналам связи в больших объемах, редактируется практически во всех про граммах, легок в отношении поиска отдельных слов и словосочетаний в крупном массиве данных и т.д. И м е н н о в таком формате материалы прессы хранятся в большинстве специализированных баз д а н н ы х по С М И . Однако в нем полностью теряется визуальное восприятие газе ты: ее структура (как материалы расположены на полосах), все графи ческие объекты, ш р и ф т заголовков и т.д. Соответственно, потеря и н ф о р м а ц и и по сравнению с печатной версией будет очень значи тельной. Дилемма «техническое удобство и л и полнота и н ф о р м а ц и и » акту альна и при работе с другими С М И . Так, отказ от оригинальной — звуковой — версии радиопрограммы в пользу ее текстовой стеногра фической записи ведет к потере невербальных характеристик речи (интонаций, темпа), однако обеспечивает существенный выигрыш в скорости обработки и н ф о р м а ц и и . Еще более сложная ситуация с те л е в и з и о н н ы м и программами, где «технически неудобное» для обра ботки изображение формирует львиную долю всей и н ф о р м а ц и и теле видения. С к а з а н н о е относится не только к С М И , но и к другим аудиои аудиовизуальным документам. Отдельного внимания заслуживает такой глобальный источник ин формации, как сеть Интернет. Как было отмечено выше, это особая коммуникативная среда, обладающая рядом уникальных характеристик. Во-первых, сеть Интернет является колоссальным и непрерывно п о п о л н я е м ы м х р а н и л и щ е м д о к у м е н т а л ь н о й и н ф о р м а ц и и , своего рода глобальной базой данных. В Интернете имеются официальные сайты всех значимых политических партий и общественных органи з а ц и й , государственных и, в м е н ь ш е й с т е п е н и , м у н и ц и п а л ь н ы х структур власти, многих н е ф о р м а л ь н ы х политических групп, в том или и н о м виде там представлено большинство средств массовой ин ф о р м а ц и и . Все более активно развиваются специальные интернетС М И : н о в о с т н ы е ресурсы, существующие исключительно в Сети и отличающиеся высокой оперативностью обновления и н ф о р м а ц и и . В и н т е р н е т - С М И имеются б а н к и д а н н ы х статистической и норма тивной и н ф о р м а ц и и , большой объем вторичных данных. Вся эта ин5 - 3863
66
Глава 3. Информационное обеспечение политического анализа и прогнозирования
ф о р м а ц и я представлена в электронном виде, что обеспечивает про стоту ее получения и обработки. Во-вторых, с п е ц и ф и к а сети Интернет состоит в активности потре бителя и н ф о р м а ц и и . В отличие от традиционных С М И , Интернет предполагает не пассивное восприятие данных, а их получение по оп ределенному запросу. С одной стороны, это открывает огромные воз можности целевого поиска данных, с другой — предъявляет повышен ные требования к навыкам пользователя. Объемы содержащейся в Интернете и н ф о р м а ц и и таковы, что могут «похоронить» под собой не опытного пользователя. Особенно это актуально для более насыщен ного, по сравнению с российским, западного сектора сети Интернет, где даже на детально сформулированный запрос можно получить сот ни тысяч ссылок. П р и этом рядовой пользователь Интернета может выступать не только активным потребителем, но и продуцентом данных. В отличие от и н ф о р м а ц и о н н о г о поля, формируемого т р а д и ц и о н н ы м и С М И , пространство Интернета значительно менее регламентировано. Что бы помещать сообщения, документы в глобальную и н ф о р м а ц и о н н у ю среду, его отправитель не должен обладать соответствующими лицен з и я м и , необходимыми для телеканалов и печатных изданий. Более то го, выявление авторства того или иного документа подчас вызывает серьезные затруднения. Поэтому и н ф о р м а ц и я , циркулирующая в Ин тернете, требует особо тщательной проверки на надежность. Отдельной и очень важной составляющей информационного обеспечения политического анализа являются с т а т и с т и ч е с к и е д а н н ы е , которые, в отличие от индивидуальных показателей, ха рактеризуют определенные свойства групп людей, взятых в целом, причем эти свойства не могут быть распространены на каждого члена групп в отдельности. Так, если мы утверждаем, что на выборах депу татов Государственной думы 2003 г. избиратели Я м а л о - Н е н е ц к о г о ав т о н о м н о г о округа в среднем поддержали партию «Единая Россия» на 8% лучше, чем избиратели С м о л е н с к о й области, это н и к о и м образом не означает, что каждый отдельный избиратель ЯНАО больше поддер живает «Единую Россию», чем избиратель С м о л е н щ и н ы . К а к правило, группы людей, которым присваиваются статистиче ские характеристики, формируются по территориальному или соци ально-демографическому признаку. В первом случае речь идет о насе л е н и и города, района, области, страны, во втором — о возрастных, тендерных, национальных и иных общностях. О с н о в н ы м источником статистических данных являются специаль ные государственные структуры, например Центральная избиратель-
3.2. Источники информации и методы сбора данных
67
ная комиссия РФ или Федеральная служба государственной статисти ки, имеющие свои территориальные подразделения. В силу официаль ного происхождения большинства статистических данных они облада ют достаточно высокой надежностью. Впрочем, иногда статистические показатели могут становиться инструментом политического влияния, и тогда уровень доверия к ним снижается. Например, по м н е н и ю многих экспертов, данные переписи населения 2002 г. в некоторых националь ных республиках были подвергнуты сознательному искажению. Речь идет об абсолютной и относительной численности той или иной на циональности; в ряде регионов это имеет принципиальное значение с точки зрения распределения власти между представителями различных этносов. Обоснованные вопросы нередко вызывают и результаты голо сований, существуют даже специальные методики, позволяющие оце нить степень надежности электоральной статистики. Важным плюсом статистической и н ф о р м а ц и и является то, что она изначально дана в количественной ф о р м е . Соответственно, к ее дан ным может применяться весь арсенал статистических методов, позво ляющих не только представлять и н ф о р м а ц и ю в наглядном виде, но и осуществлять п о и с к скрытых закономерностей, связей, зависимостей между п р и з н а к а м и . При условии владения такими методами — обяза тельном для специалиста по политическому анализу — статистичес кие д а н н ы е представляются удобным для обработки информацион ным массивом. Большинство статистических данных являются суммарными п о к а з а т е л я м и . К примеру, у р о в е н ь п о д д е р ж к и о п р е д е л е н н о г о кан дидата в п р е з и д е н т ы на ф е д е р а л ь н ы х выборах рассчитывается пу тем с у м м и р о в а н и я всех голосов, п о д а н н ы х за этого кандидата. Со ответственно, с у м м а р н ы е с т а т и с т и ч е с к и е д а н н ы е обеспечивают в о з м о ж н о с т ь п р о в е д е н и я с п л о ш н о г о и с с л е д о в а н и я без п о с т р о е н и я в ы б о р о ч н о й с о в о к у п н о с т и , тем с а м ы м п о в ы ш а я о б о с н о в а н н о с т ь итоговых результатов. К плюсам статистической и н ф о р м а ц и и относится также ее достаточ но высокая доступность. Скажем, результаты выборов можно без труда найти в и н ф о р м а ц и о н н о й системе Центризбиркома (www.cikrf.ru), ос новные показатели социально-экономической статистики доступны на сайте Федеральной службы государственной статистики (www.gks.ru), а также на официальных сайтах многих субъектов Федерации. Все это публикуется и в печатном виде — в специальных статистических сбор никах. Определенные проблемы с доступностью информации могут возникнуть тогда, когда речь идет о небольшой социальной или терри ториальной общности (например, о населении муниципального образо5*
68
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
вания). В таких случаях может возникнуть необходимость обратиться с запросом в местные органы власти. Однако статистические данные не отличаются оперативностью об новления. Это обусловлено самой их природой: потребность в измере нии неких общегрупповых показателей возникает на сравнительно длинных временных дистанциях. Так, не имеет никакого смысла еже недельно фиксировать уровень безработицы в определенном регионе: за неделю он просто не успеет принципиально измениться. Среди всего массива статистических данных следует обратить внима ние на некоторые их разновидности, наиболее активно востребованные в качестве информационной базы политического анализа. Прежде всего это электоральная статистика — количественный учет избирательного процесса, сводные данные о голосованиях избирателей за политические партии (объединения) или отдельных кандидатов. Электоральная стати стика содержит также сведения об общем числе избирателей, их актив ности (явке на выборы), о числе голосов, поданных против всех канди датов (партий), если такая позиция имеется в бюллетене.
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора д а н н ы х
69
Среди собственно «политических» видов статистических данных следует также выделить статистику, отражающую политическую ак тивность населения вне электорального процесса. Это могут быть дан ные об участии в митингах, демонстрациях, иной массовой политиче ской активности, членстве в политических партиях и т.д. Впрочем, такого рода д а н н ы е гораздо менее доступны по сравнению со статис тикой электоральной. Полезные для политического анализа данные содержат демографи ческая и социально-экономическая статистика. Эти данные важны для того, чтобы понять, в какой среде протекают властные процессы, ка кие неполитические факторы влияют на политическое поведение масс и элит. Н а п р и м е р , особенности институциональной организации вла сти в Дагестане, структуру политической элиты региона невозможно понять, не зная численности титульных этносов этой республики.
•территориальному — д а н н ы е территориальных избирательных к о м и с с и й о результатах голосования в муниципальных образованиях;
Высокую п р о т е с т у ю активность определенной социальной группы можно объяснить, исходя из показателей социального самочувствия, операциональными индикаторами которого выступают: отношение средней заработной платы к прожиточному минимуму; уровень детской смертности; уровень безработицы; доля населения, живущего за чертой бедности; направление миграционных потоков (люди переезжают из менее благополучных мест в более благополучные) и т.д. Полезным под спорьем в оценке уровня политической стабильности может стать стати стическая информация, характеризующая социальную дифференциа цию: разрыв между наиболее обеспеченными и наиболее бедными слоями населения. Уровень поддержки политических партий в опреде ленном регионе можно объяснить, исходя из данных о возрастной струк туре населения или о соотношении проживающих в городах и сельской местности. Эти и многие другие закономерности невозможно было бы выявить и обосновать без использования статистических данных.
• местному — д а н н ы е участковых избирательных комиссий о ре зультатах голосования по отдельным избирательным участкам.
Н о р м а т и в н о - п р а в о в ы е а к т ы — особый вид нормативных, т.е. устанавливающих некие нормы поведения, документов, которые:
Обновление электоральной статистики привязано к избиратель н ы м циклам. Так, д а н н ы е о выборах Президента РФ обновляются раз в четыре года. В дальнейшем мы будем неоднократно иллюстрировать примене ние различных методов исследования на примере анализа электораль ной статистики.
• п р и н и м а ю т с я к о м п е т е н т н ы м (уполномоченным на то) органом государственной власти или и н о й организацией при обязательной санкции государства. Нормативно-правовой акт всегда отражает во лю государства, это властный и о ф и ц и а л ь н ы й документ; •занимают определенное место в иерархической системе права. В частности, л ю б о й нормативно-правовой акт не должен входить в противоречие с в ы ш е с т о я щ и м и нормативно-правовыми актами; • характеризуются определенной процедурой вступления в силу (официальное опубликование, определенный срок с момента приня тия и т.д.);
В зависимости от масштаба выборов электоральная статистика анализируется по четырем уровням: • общефедеральному — д а н н ы е Центральной избирательной ко миссии о результатах голосования в целом по стране (выборы прези дента Р Ф , депутатов Государственной думы, о б щ е н а ц и о н а л ь н ы е ре ферендумы); • субъектов Федерации/окружному — д а н н ы е избирательных ко миссий субъектов Федерации и окружных избирательных к о м и с с и й о результатах голосования в целом по региону/избирательному округу 1 по выборам депутатов Государственной думы ;
' В соответствии с и з м е н е н и я м и в избирательном законодательстве 2005 г., предус м а т р и в а ю щ и м и переход к п р о п о р ц и о н а л ь н о й системе к о м п л е к т о в а н и я Государствен н о й д у м ы , о к р у ж н о й уровень у п р а з д н я е т с я .
70
Глава 3. Информационное обеспечение политического анализа и прогнозирования
• всегда облекаются в специально предусмотренную документаль ную форму, имеют установленную структуру, определенные реквизи ты. Соответственно, всегда можно определить вид нормативно-пра вового акта ( н а п р и м е р , з а к о н или п о с т а н о в л е н и е ) , установить властный институт, п р и н я в ш и й акт, должностное л и ц о , его подписав шее, дату п р и н я т и я , подписания и вступления в силу. Важнейшим видом нормативно-правовых актов являются законы, регулирующие наиболее значимые общественные о т н о ш е н и я . Они п р и н и м а ю т с я в соответствии с четко определенной процедурой ком петентным органом. В России федеральные законы принимаются Го сударственной думой, проходят процедуру одобрения Советом Феде рации и Президентом Р Ф . Предусмотрено также принятие законов посредством прямого волеизъявления граждан — на референдуме. О с н о в н ы м и законами Российской Федерации является Конститу ция и ряд конституционных законов (о Правительстве, об изменении конституционно-правового статуса субъекта РФ и др.). Эти докумен ты определяют правовую архитектуру политической системы, ключе вые характеристики ее институционального дизайна: статус, ф у н к ц и и и п о л н о м о ч и я важнейших институтов государственной власти, фор мат их взаимодействия. Аналогичную ф у н к ц и ю в субъектах РФ вы п о л н я ю т уставы краев и областей, конституции республик. Обычные з а к о н ы — это акты текущего законодательства, регла ментирующие различные стороны жизни общества. О н и также обла дают высшей юридической силой, но при этом сами д о л ж н ы соответ ствовать Конституции и конституционным з а к о н а м . Прочие нормативно-правовые акты являются п о д з а к о н н ы м и ; о н и обладают полнотой юридической силы, но не в той степени всеобщ ности и верховенства, как законы. Наиболее з н а ч и м ы е подзаконные акты в нашей стране — это указы и распоряжения Президента Р Ф , по становления и р е ш е н и я Правительства. С и с т е м а н о р м а т и в н о - п р а в о в ы х актов, с одной с т о р о н ы , фикси рует п р о и с х о д я щ и е в п о л и т и ч е с к о й сфере и з м е н е н и я , с другой — са ма стимулирует эти и з м е н е н и я в о п р е д е л е н н о м н а п р а в л е н и и . Нор м о т в о р ч е с т в о — м о щ н ы й р ы ч а г в о з д е й с т в и я на п о л и т и ч е с к и й п р о ц е с с . К примеру, ряд п р и н ц и п и а л ь н ы х и з м е н е н и й , в н е с е н н ы х в и з б ирательн о е законодательство с 2000 по 2005 г. ( н о в ы й з а к о н «О политических партиях», п о п р а в к и в з а к о н «Об о с н о в н ы х гаран тиях избирательных прав граждан» и др.), с у щ е с т в е н н ы м образом п о в л и я л на п о в ы ш е н и е роли партий в п о л и т и ч е с к о м , в частности э л е к т о р а л ь н о м , процессе. И н с т и т у ц и о н а л ь н ы е п е р е м е н ы в регули р о в а н и и ф едеративны х о т н о ш е н и й ( и з м е н е н и е п р и н ц и п о в к о м -
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
71
плектования Совета Ф е д е р а ц и и , п о я в л е н и е института п о л н о м о ч н ы х представителей Президента в федеральных округах, и з м е н е н и е по рядка и з б р а н и я губернаторов и т.д.) самым р а д и к а л ь н ы м образом п о в л и я л и на ф а к т и ч е с к о е распределение властных ресурсов между федеральным и р е г и о н а л ь н ы м у р о в н я м и у п р а в л е н и я . Влияние нормативно-правовых актов на политический процесс находится в фокусе в н и м а н и я такой парадигмы политического анали за, как институциональный (неоинституциональный) подход. Бихе виоризм рассматривает этот вид документов под несколько и н ы м уг лом зрения: нормативно-правовой акт — это политическое решение, появившееся в результате взаимодействия политических субъектов, заинтересованных групп и т.д. Такой подход может быть достаточно плодотворным. Огромный интерес для исследователя, интересующе гося л о б б и с т с к и м и процессами, д и н а м и к о й взаимодействия различ ных групп давления представляет бюджетный процесс — ежегодное принятие федерального закона о государственном бюджете на следу ю щ и й год. Важным элементом и н ф о р м а ц и о н н о г о обеспечения в дан ном случае станет мониторинг т р а н с ф о р м а ц и и п о л о ж е н и й закона о бюджете от чтения к чтению (всего их четыре, не считая так называе мого «нулевого чтения» — обсуждения законопроекта в парламент ских ф р а к ц и я х с участием представителей Правительства). В системе и н ф о р м а ц и о н н о г о обеспечения политического анализа нормативноправовые акты могут выступать и как постоянная, и как переменная и н ф о р м а ц и о н н а я компонента. Н е с о м н е н н ы е достоинства нормативно-правовых актов — высо кая надежность (если нормативно-правовой акт уже опубликован и вступил в силу, содержащаяся в нем и н ф о р м а ц и я обладает абсолют ной достоверностью) и доступность. Нормативно-правовые акты пуб ликуются в о ф и ц и а л ь н о й прессе, на интернет-сайтах органов госу дарственной власти и управления, хранятся в специальных базах данных. Ф а к т о р о м , облегчающим п о и с к нужных исследователю нор мативно-правовых актов, является довольно высокая степень их сис тематизации. Политико-идеологические документы формулиру ют социально значимые цели и приоритеты, стратегии их достижения; постулируют фундаментальные политические ценности. Под «соци альной значимостью» понимается актуальность таких целей, ценнос тей и стратегий для всего общества или больших социальных групп. К основным видам политико-идеологических документов относятся: • программы политических партий, общественно-политических объединений;
72
3.2. Источники и н ф о р м а ц и и и методы сбора данных
Глава 3. Информационное обеспечение политического анализа и прогнозирования
•декларации, хартии, меморандумы, принимаемые на государст венном уровне (например, Декларация независимости, Великая хар тия вольностей); • программные выступления политических лидеров. Так, в России одним из ключевых политико-идеологических текстов является еже годное послание Президента РФ Федеральному собранию. Как правило, политико-идеологическую нагрузку несут норматив но-правовые акты высшего уровня правовой иерархии, прежде всего конституции. Так, преамбула к действующей р о с с и й с к о й Конститу ц и и , п р и н я т о й на референдуме 1993 г., имеет отчетливо выраженное идеологическое содержание: М ы , многонациональный народ Российской Федерации, соединенные общей судьбой на своей земле, утверждая права и свободы человека, гражданский мир и согласие, сохраняя исторически сложившееся государственное единство, исходя из общепризнанных п р и н ц и п о в равноправия и самоопределе н и я народов, чтя память предков, передавших нам любовь и уважение к Отечеству, веру в добро и справедливость, возрождая суверенную государственность России и утверждая незыб лемость ее демократической основы, стремясь обеспечить благополучие и процветание России, исходя из ответственности за свою Родину перед н ы н е ш н и м и будущи ми п о к о л е н и я м и , сознавая себя частью мирового сообщества, принимаем К О Н С Т И Т У Ц И Ю Р О С С И Й С К О Й Ф Е Д Е Р А Ц И И . Известно множество исторических примеров нормативных актов, о д н о в р е м е н н о в ы п о л н я в ш и х политико-идеологическую ф у н к ц и ю . В р о с с и й с к о й истории это, например, Соборное уложение 1649 г., Декрет о мире и Декрет о земле 1917 г. Политико-идеологические документы являются хорошей основой не только для традиционного, но и для политико-психологического анализа. Так, анализ программных выступлений политических лиде ров позволяет реконструировать фундаментальные характеристики их м и р о в о з з р е н и я , способ восприятия мира политического и т.д. С точки зрения и н ф о р м а ц и о н н о г о обеспечения политического анализа политико-идеологические документы обладают примерно те ми же свойствами, что и нормативно-правовые акты — прежде всего надежностью и доступностью.
73
Агитационно-пропагандистские м а т е р и а л ы (АПМ) представляют собой документы, целью которых является формиро вание политических ценностей и установок и побуждение к опреде л е н н ы м п о л и т и ч е с к и м д е й с т в и я м . В какой-то мере их м о ж н о счи тать р а з н о в и д н о с т ь ю политико-идеологических документов. В то же время а г и т а ц и о н н о - п р о п а г а н д и с т с к и е материалы обладают мень ш е й «всеобщностью», о р и е н т и р о в а н ы на более адресные аудитории. Ц е н н о с т и и цели п о л и т и к о - и д е о л о г и ч е с к и х документов преломля ются в материалах а г и т а ц и о н н о й п р о д у к ц и и через призму более ло кальных задач, н а п р и м е р м о б и л и з а ц и и электората на предстоящих выборах. Кроме того, агитационно-пропагандистские материалы значи тельно более разнообразны по ф о р м е представления и н ф о р м а ц и и . В силу своей базовой ф у н к ц и и — убеждать и побуждать — о н и ис пользуют практически все возможные каналы к о м м у н и к а ц и и . Агита ционно-пропагандистские документы — это листовки, плакаты, бук леты, рекламные щиты, аудио- и видеоролики, книги и ф и л ь м ы , сувениры с соответствующей с и м в о л и к о й . Анализ агитационно-пропагандистских материалов может дать от веты на многие вопросы относительно продуцента А П М — партии, кандидата, общественной организации, органа государственной влас ти, в частности об особенностях позиционирования политического субъекта по отношению к оппонентам; специфике понимания им ожи даний населения; видении важнейших локальных или общих проблем; представлении об оптимальной форме передачи информации. А г и т а ц и о н н о - п р о п а г а н д и с т с к и е материалы, будучи доступными документами, не обладают «заведомой» степенью надежности, как н о р м а т и в н о - п р а в о в ы е акты и политико-идеологические документы. Степень надежности А П М к а к и с т о ч н и к а и н ф о р м а ц и и для полити ческого анализа особенно понижается в ситуации избирательной к а м п а н и и . Нередко избирательные штабы политических партий и кандидатов идут на сознательную ф а л ь с и ф и к а ц и ю агитационных ма териалов своих о п п о н е н т о в , чтобы с н и з и т ь уровень их электораль н о й поддержки. От исследователя в таких ситуациях требуются осо бая аккуратность, использование специальных методов проверки надежности источника. Об этом мы поговорим отдельно в гл. 5.
Опрос Опрос является практически незаменимым методом в ситуациях, ког да в задачи исследования входит получение информации о мнениях
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
людей по определенным политическим вопросам, их отношении к тем или и н ы м политическим акторам, решениям, проблемам. Ключевым инструментом опроса является, разумеется, в о п р о с . От того, насколько корректно сформулированы вопросы, насколько о н и п о н я т н ы респонденту (опрашиваемому), в очень значительной мере зависит успех исследования. По форме вопросы разделяются на открытые, закрытые и полуза крытые. Открытый вопрос предполагает формулировку ответа самим респондентом. Например, чтобы выяснить, за какую партию респон дент голосовал на последних парламентских выборах, мы просто спра шиваем его: «За какую партию вы голосовали на выборах депутатов Го сударственной думы в декабре 2003 года?» Закрытый вопрос содержит полный перечень возможных вариантов ответа, респонденту остается л и ш ь выбрать один из них. Например: «Как часто вы участвовали в выборах за последние 5 лет?» 1. Всегда, практически всегда. 2. Редко. 3. Никогда. 4. Затрудняюсь ответить. Важнейшее требование, предъявляемое к закрытому вопросу, со стоит в том, чтобы предлагаемый отвечающему перечень был исчер пывающим. Полузакрытый вопрос также содержит варианты ответа, но при этом оставляет респонденту возможность сформулировать ответ са мостоятельно, если ни один из предложенных вариантов не соответ ствует его п о з и ц и и . Например: «За какую партию вы голосовали на выборах депутатов Государст в е н н о й думы в декабре 2003 года?» Против всех
«Родина»
СПС
«Единая Россия»
ЛДПР
Иное
КПРФ
«Яблоко»
Затрудняюсь ответить
Такой вопрос не имеет смысла делать закрытым, поскольку в этих выборах п р и н я л и участие 23 партии и перечень получился бы слиш ком д л и н н ы м и неудобным для восприятия. Поэтому в с п и с о к вари антов ответов внесены партии, набравшие наибольшее число голосов. Пункт «Иное» добавлен для тех немногочисленных респондентов, ко торые голосовали за другие партии. Вопросы также подразделяются в соответствии с ф у н к ц и е й , кото рую о н и в ы п о л н я ю т в процессе опроса. Содержательные вопросы не-
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора д а н н ы х
75
посредственно служат д о с т и ж е н и ю цели и р е ш е н и ю задач исследова н и я . Функциональные вопросы способствуют о п т и м и з а ц и и процедуры исследования. Среди ф у н к ц и о н а л ь н ы х вопросов выделяются, в част ности, контрольные вопросы, тестирующие искренность, вниматель ность или (реже) компетентность респондента. В простейшем случае контрольный вопрос представляет собой уже заданный содержатель ный вопрос в и н о й формулировке. Разные ответы на идентичные или очень схожие по смыслу вопросы наводят на мысль о неискренности или невнимательности респондента. Другой вид ф у н к ц и о н а л ь н ы х вопросов — вопросы-фильтры. Они позволяют выделить тех респондентов, которые непосредственно ин тересуют исследователя. Н а п р и м е р , если мы изучаем электорат пар тии «Яблоко», первым в о п р о с н и к е будет вопрос-фильтр: «Голосовали ли вы за партию "Яблоко"?» П р и отрицательном ответе процедура оп роса прекращается. Бывают также ситуации, когда в рамках одного опроса имеются разные наборы вопросов для разных групп респон дентов (например, отдельные блоки вопросов для л и ц старшего, сред него, младшего возраста). В д а н н о м случае вопрос о возрасте респон дента будет также выполнять ф у н к ц и ю вопроса-фильтра. Кроме того, существуют адаптационные вопросы, в ы п о л н я ю щ и е ф у н к ц и ю адаптации респондента к самому процессу опроса. О н и , как правило, имеют содержательную нагрузку, но также служат вовлече н и ю отвечающего в беседу на интересующие исследователя темы. Со ответственно, адаптационные вопросы обычно предшествуют наибо лее существенным для исследования содержательным вопросам. Отдельную группу составляют вопросы, относящиеся непосредст венно к л и ч н о с т н ы м и социальным характеристикам респондента. На социологическом жаргоне совокупность таких вопросов получила на звание паспортички. К о с н о в н ы м пунктам паспортички в политичес ких исследованиях относятся: 1. Пол респондента. 2. Возраст респондента. Указывается л и б о число полных лет, либо принадлежность к определенной возрастной группе (например, от 18 до 35, от 36 до 55, старше 55). 3. Уровень образования. К а к п р а в и л о , вопрос является закрытым и содержит следующие варианты ответов: ниже среднего; среднее; сред нее специальное; незаконченное высшее; высшее; отказ от ответа. 4. Род занятий респондента. Получить и н ф о р м а ц и ю по данной по з и ц и и не так просто, как кажется на первый взгляд. Например, некор ректно задавать вопрос «Кто вы по профессии?», так как в данном случае респондент, скорее" всего, назовет свою специальность по об-
76
Глава 3. Информационное обеспечение политического анализа и прогнозирования
разованию, которая может не совпадать с его сегодняшним родом за
3.2. Источники информации и методы сбора данных
77
благосостояния. Так, домохозяйка или студент из обеспеченной се
нятий. Один из подходов к р е ш е н и ю д а н н о й проблемы состоит в том,
мьи могут не иметь никакого самостоятельного дохода и при этом
чтобы задать три вопроса, первый из которых является фильтрующим:
жить вполне благополучно.
а) «Вы работаете в настоящее время?»
пондентом своего уровня благосостояния. Д л я этого можно использо
С другой стороны, важно о ц е н и т ь субъективное восприятие рес вать два типа вопросов: Работаю
>вопрос б
Не работаю
>вопрос в
а) открытый вопрос: «Какой доход на человека, с вашей точки зре н и я , должен быть в семье, чтобы его можно было назвать средним?» Полученный ответ сравнивается с ответом на вопрос об объективном уровне дохода, и таким образом выявляется оценка респондентом
б) «В к а к о й сфере вы работаете?»
своего материального п о л о ж е н и я ; б) з а к р ы т ы й шкальный вопрос: «Выберите из предложенных фор
Государственное и городское управ ление, юстиция
Транспорт и связь
Общественные организации
Армия, МВД, ФСБ
Промышленное производство
Финансы и страхование
Торговля, общественное питание
Строительство
Сфера услуг (тур., рекл., консулы., юрид.)
Сельское и лесное хозяйство
Образование и наука, включая НИИ
Средства массовой информации
Здравоохранение и спорт
Жилищно-коммунальное хозяйство
Культура и искусство
Другое
в) «В чем п р и ч и н а того, что вы не работаете?»
мулировок ту, которая наиболее точно характеризует ваше материаль ное положение». Варианты ответа могут быть такими: • «У меня есть возможность удовлетворять практически все свои материальные потребности»; •«Материальных трудностей в о с н о в н о м не испытываю, хотя и приходится экономить»; • «Вынужден э к о н о м и т ь даже на самом необходимом»; • «Живу фактически в бедности, нищете». П р и в е д е н н ы е в ы ш е п у н к т ы с о с т а в л я ю т ядро п а с п о р т и ч к и оп росного политического
исследования.
О б щ и й к р и т е р и й отбора
п р и з н а к о в — их с п о с о б н о с т ь в л и я т ь на п о л и т и ч е с к о е с о з н а н и е и п о в е д е н и е . П о э т о м у в опросах по п о л и т и ч е с к о й т е м а т и к е редко ин тересуются, н а п р и м е р , с е м е й н ы м п о л о ж е н и е м р е с п о н д е н т о в ; на се г о д н я ш н и й д е н ь э м п и р и ч е с к и е и с с л е д о в а н и я н е обнаружили влия
Ищу работу
Занимаюсь домашним хозяйством
Не могу работать по состоянию здоровья
Нахожусь в декретном отпуске
Учусь, не могу совмещать учебу с работой
Нет желания работать
Нахожусь на пенсии по старости
Другое
н и я этого ф а к т о р а на п о л и т и ч е с к и е установки и д е й с т в и я . В то же время к о н к р е т н ы й п е р е ч е н ь в о п р о с о в п а с п о р т и ч к и будет опреде ляться и н д и в и д у а л ь н о для каждого о п р о с а в з а в и с и м о с т и от его це ли и задач. Л и ч н ы е д а н н ы е о респонденте играют существенную роль в анали зе результатов опроса, причем к а к в теоретических, так и в приклад ных проектах. Предположим, по итогам исследования мы в ы я с н и л и ,
5. Доход респондента. Здесь важно, с одной стороны, получить ин ф о р м а ц и ю об объективной составляющей измеряемого п р и з н а к а . Корректно это сделать с п о м о щ ь ю открытого вопроса: «Каков был об щ и й доход живущих с вами членов семьи (включая вас) в п р о ш л о м месяце в расчете на одного человека?» Несмотря на некоторую гро моздкость этой формулировки и необходимость производить опреде л е н н ы е в ы ч и с л е н и я , более простого способа, видимо, не существует. Размер дохода респондента сам по себе ничего не скажет об уровне его
что текущий уровень электоральной поддержки (рейтинг) нашего кандидата составляет 25%. Однако этой и н ф о р м а ц и и совершенно не достаточно для разработки о б о с н о в а н н о й стратегии избирательной к а м п а н и и , ф о р м у л и р о в а н и я р е к о м е н д а ц и й по эффективному про д в и ж е н и ю кандидата. Мы не знаем, кто, собственно, эти люди? Как с т о р о н н и к и кандидата распределяются по возрастным группам, тен дерному, образовательному, статусному признакам? Не имея такой и н ф о р м а ц и и , мы не в с о с т о я н и и определить э ф ф е к т и в н ы е каналы
/8
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
к о м м у н и к а ц и и с этой аудиторией, социальные проблемы, в решении которых она более всего заинтересована. И н ы м и словами, требуется установить связь между отдельными п е р е м е н н ы м и , характеризующими личность респондента и его поли тическое поведение. Например, мы можем установить, связана ли пе ременная «возраст респондента» с п е р е м е н н о й «поддержка кандида та». Одним из практических способов сделать это является анализ таблиц сопряженности вроде следующей: Половозрастные группы Поддержка кандидата
В целом
муж.
муж.
муж.
жен.
жен.
жен.
18-34
35-54
от 55
18-34
35-54
от 55
А
50,0
45,3
45,2
52,4
46,8
61,1
45,6
В
14,5
5,3
9,8
33,7
1,9
3,8
31,8
С
7,2
2,8
7,1
2,0
6,7
12,6
7,6
1,0
0,6
1,0
D
1,9
4,7
1,8
4,8
Е
1,2
1,6
2,5
2,5
F
0,4
G
0,9
1,2
1,2
1,8
1,2
1,2
4,2
Против всех
2,6
2,8
3,4
2,0
3,5
Не участвовал
16,3
30.2
23,7
4,8
29,9
9,6
6,6
4,6
4,0
3,8
4,2
6,6
Затрудняюсь ответить
5,1
7,2
На о с н о в а н и и такой таблицы уже можно получить гораздо больше и н ф о р м а ц и и . Н а п р и м е р , среди электората кандидата В я в н о домини руют представители старшего возраста; кандидат А пользуется наи большей поддержкой среди ж е н щ и н от 35 до 54 лет и т.д. И с п о л ь з о в а н и е таблиц сопряженности не ограничивается соотне сением л и ч н ы х данных респондентов с их политическим поведением. Часто бывает необходимо проанализировать сочетания разных при з н а к о в , отражающих политическое поведение. Н а п р и м е р , м о ж н о вы я с н и т ь , насколько активен электорат д а н н о г о кандидата, посмотрев распределение поддержавших его респондентов по группам активно сти участия в выборах (ответ на вопрос: «Как часто вы участвовали в выборах за последние 5 лет?»). Если в ы я с н и т с я , что электорат канди дата состоит в о с н о в н о м из пассивных избирателей, руководителям его избирательной к а м п а н и и может быть рекомендована стратегия общего п о в ы ш е н и я явки в день выборов. Более подробно техника использования таблиц с о п р я ж е н н о с т и будет рассмотрена в гл. 4.
3.2. Источники и н ф о р м а ц и и и методы сбора данных
79
Формирование выборочной совокупности Выше мы уже говорили о различии между выборочным и с п л о ш н ы м исследованием. Для метода опроса д а н н а я проблема чрезвычайно ак туальна. К а к правило, аналитика, работающего с политическими про блемами, интересует мнение не какого-то очень узкого круга л и ц , ко торый м о ж н о было бы охватить с п л о ш н ы м исследованием, а людей как представителей широких социальных групп. Нередко требуется выявить о т н о ш е н и е к определенным политическим проблемам в мас штабах региона или даже всей страны. По п о н я т н ы м п р и ч и н а м такое исследование неизбежно будет в ы б о р о ч н ы м . В ы б о р о ч н а я с о в о к у п н о с т ь ( в ы б о р к а ) — это часть ге неральной совокупности (всех изучаемых объектов), отражающая те ее свойства, которые важны с точки зрения цели и задач исследова ния. Ф о р м и р у я выборочную с о в о к у п н о с т ь , мы д о л ж н ы быть увере н ы , что п о л у ч е н н о е з н а н и е о ее свойствах может быть к о р р е к т н о э к с т р а п о л и р о в а н о на генеральную с о в о к у п н о с т ь , т.е. в ы б о р к а ре п р е з е н т а т и в н а по о т н о ш е н и ю к г е н е р а л ь н о й с о в о к у п н о с т и . Разуме ется, п о л н о й и д е н т и ч н о с т и в ы б о р о ч н о й и генеральной совокупно сти д о б и т ь с я н е в о з м о ж н о , если о н и с и л ь н о различаются по объему (а так, к а к п р а в и л о , и бывает). Д л я каждой в ы б о р о ч н о й совокупно сти с п е ц и а л ь н ы м образом в ы ч и с л я е т с я ошибка, п о к а з ы в а ю щ а я допустимое о т к л о н е н и е результатов, полученных при изучении вы б о р к и , от и с т и н н ы х з н а ч е н и й п р и з н а к а для генеральной совокуп н о с т и . К а к п р а в и л о , п о л и т и ч е с к и е исследования требуют повы шенной надежности выборки, при которой ошибка не должна п р е в ы ш а т ь 3%. Существует достаточно много способов ф о р м и р о в а н и я выбороч ной совокупности, они подробно изложены в учебниках по приклад 1 ной социологии . Мы коснемся этой темы кратко, обозначив л и ш ь п р и н ц и п и а л ь н ы е подходы к ф о р м и р о в а н и ю выборки. Конкретные техники приводятся в иллюстративном режиме. Так, существуют методы п о с т р о е н и я выборки, основанные на п р и н ц и п е случайного отбора. П р и н ц и п случайности предполагает обеспечение для всех элементов генеральной совокупности равных шансов попасть в выборку. Этот п р и н ц и п реализован, например, в лототроне: каждый из шаров в крутящемся барабане имеет теоретичес ки равные ш а н с ы оказаться в руке у человека, который их оттуда до1 С м . , н а п р и м е р : Рабочая книга с о ц и о л о г а . М., 2003; Ядов, В. А. С о ц и о л о г и ч е с к о е и с с л е д о в а н и е : методология, п р о г р а м м а , м е т о д ы . Самара, 1995.
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
Глава 3. Информационное обеспечение политического анализа и прогнозирования
стает. Для этого все шары должны иметь одинаковые размер, вес, цвет (либо человек должен достать их с завязанными глазами), температу ру, — а это уже техника реализации случайного п р и н ц и п а . Примерами случайных методик, принятых в науке, являются ме тод пошаговой выборки и метод случайных чисел. Метод пошаговой выборки предполагает следующие действия: 1) составление перечня всех элементов генеральной совокупнос ти ( н а п р и м е р , с п и с к а студентов ф и л о с о ф с к о г о факультета МГУ; тог да в совокупности будет о к о л о 1500 элементов). Каждый элемент ну меруется; 2) определение объема выборочной совокупности. Если нас удов летворяет 5%-ная о ш и б к а , мы можем остановиться на выборке из 300 студентов; 3) определение шага выборки, который является результатом деле ния объема генеральной совокупности на объем выборочной (в на шем случае 1500:300=5); 4) ф о р м и р о в а н и е из генеральной совокупности выборочной сово купности в соответствии с шагом выборки. Например, отбирается каждый пятый студент из общего списка: 1-й, 6-й, 11-й и т.д. При построении пошаговой выборки важно следить за тем, чтобы шаг выборки не совпал с той или иной структурной закономерностью генеральной совокупности. Например, если перечень элементов гене ральной совокупности составлен с учетом разбиения студентов на группы, при этом в каждой группе по 5 человек и первым в списке груп пы идет ее староста, мы можем получить в выборочной совокупности 1 одних старост групп . Такая выборка с высокой вероятностью не будет репрезентативной: старосты групп обычно старше по возрасту, соци ально активнее, обладают лучшей успеваемостью по сравнению с дру гими студентами, среди них больше л и ц мужского пола и т.д. Метод случайных чисел также начинается с ф о р м и р о в а н и я перечня элементов генеральной совокупности и определения объема выборки. Однако отбор производится не пошаговым методом, а методом слу чайных чисел: с п о м о щ ь ю компьютера или специальных таблиц вы бирается определенное количество случайных чисел, равное объему выборки, в интервале, заданном объемом генеральной совокупности. В н а ш е м примере генерируется 300 случайных чисел в интервале от 1 до 1500. 1
Разумеется, для с т у д е н ч е с к и х групп, к а к п р а в и л о с у щ е с т в е н н о р а з л и ч а ю щ и х с я по ч и с л е н н о с т и , это м а л о в е р о я т н о . О д н а к о в с о в о к у п н о с т я х , где п р и н я т о более стро гое г р уп п о во е д е л е н и е ( н а п р и м е р , в а р м е й с к и х п о д р а з д е л е н и я х ) , т а к а я о ш и б к а в п о л н е возможна.
81
Еще одним вариантом р е а л и з а ц и и метода случайного отбора яв ляется гнездовая (серийная) выборка. Ее с п е ц и ф и к а состоит в т о м , что случайным образом отбираются не элементы генеральной сово купности, а группы э л е м е н т о в , из которых совокупность состоит. Так, в нашем п р и м е р е будут отбираться не студенты, а студенческие группы (соответственно, требуется с п и с о к групп, а не с п и с о к сту дентов). А уже внутри каждой из отобранных групп п р о и з в о д и т с я с п л о ш н о е и с с л е д о в а н и е — о п р а ш и в а ю т с я все студенты, обучающи еся в д а н н ы х группах. С о б с т в е н н о , эти группы и получили н а з в а н и е «гнезда». Гнездовая выборка удобна для проведения исследования тех сово купностей, где существует четко наблюдаемая структура: в учебных заведениях, в трудовых коллективах и т.д. По сравнению с простым случайным методом ф о р м и р о в а н и е гнездовой выборки может суще ственно технически облегчить процесс исследования. Значительно проще найти и опросить студентов шести групп, которые собираются в определенном месте и в определенное время (студенческие груп пы — в соответствии с расписанием занятий), чем искать и опраши вать каждого из 300 студентов по отдельности. Случайный метод (во всех технических воплощениях) имеет ряд существенных о г р а н и ч е н и й . Во-первых, принцип случайности эф фективно работает тогда, когда совокупность относительно однород на с точки зрения тех свойств, которые важны для исследователя. Это в значительной мере относится к студентам одного факультета, но ни как не к избирателям большого города или района или членам поли тической партии. Во-вторых, техническая реализация п р и н ц и п а слу чайности предполагает н а л и ч и е полного перечня э л е м е н т о в генеральной совокупности или хотя бы списка компактных групп, на которые эта совокупность разбита. Политические исследования, к а к правило, имеют дело с очень б о л ь ш и м и совокупностями, явным об разом не структурированными по группам и не внесенными в единые списки. К о н е ч н о , существуют с п и с к и всех избирателей России, но как практически работать с м н о г о м и л л и о н н ы м перечнем, даже если таковой удастся получить? Поэтому случайный способ не стал основным в выборочных поли тических исследованиях, уступив пальму первенства квотной (стра тифицированной) выборке. В ее основе лежит принцип квотирования выборочной совокупности по определенному набору признаков, зна чимых с точки з р е н и я цели исследования, в соответствии с распреде лением этих п р и з н а к о в в генеральной совокупности. В качестве кво тирующих выделяются те п р и з н а к и , которые являются наиболее 6 - 3863
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
существенными с точки з р е н и я целей и задач исследования (влияют
83
Указанные в ы ш е квоты д о л ж н ы быть воспроизведены в выбороч ной совокупности. Так, если доля мужчин в возрасте от 18 до 24 лет
на политическое поведение). Рассмотрим простой пример. Предположим, цель нашего исследо вания — выявить уровень поддержки действующего губернатора изби
составляет 5% от общего числа совершеннолетних жителей города TV, то и в выборке их доля должна составлять 5%.
рателями города N (генеральная совокупность). Мы ограничиваемся
При определении числа квотирующих признаков руководствуются
двумя квотирующими признаками — пол и возраст членов генераль
с п е ц и ф и к о й исследования и п р и н ц и п о м разумной достаточности.
ной совокупности. Прежде всего выясняется распределение каждого
Нередко возникает искушение существенно увеличить число квоти
из признаков в генеральной совокупности — это делается на основе
рующих п р и з н а к о в , чтобы добиться более полного соответствия вы борочной и генеральной совокупности. Однако следует помнить: чем
имеющихся статистических данных, например:
больше квотирующих п р и з н а к о в , тем сложнее технически будет про вести опрос. П р е д п о л о ж и м , что к половозрастному квотированию до
Пол 43,4%
Мужчины
бавляется еще один п р и з н а к с тремя категориями: образование (не
Женщины
56,6%
полное среднее, среднее, высшее). Несложно подсчитать, что общее
Вся совокупность
100,0%
число квот возрастет с 8 до 24: мужчины от 18 до 24 лет с н е п о л н ы м средним образованием; мужчины от 18 до 24 лет со средним образова
Возраст 18—24 года
11,7%
25—39 лет
26,4%
40—54 года
29,6%
Старше 55 лет
32,3%
Вся совокупность
100,0%
нием... и так далее по всем п о з и ц и я м . Работать с таким дробным кво тированием неудобно с технической точки зрения. Если входящие в генеральную совокупность люди проживают на большой территории, квотный п р и н ц и п формирования выборки до полняется п р и н ц и п о м многоступенчатого районированного отбора. На пример, при проведении общероссийского опроса на первом этапе (ступени) производится отбор субъектов Федерации; на втором — горо
Д л я удобства работы на о с н о в а н и и этих данных строятся единые
дов и районов в рамках выбранных субъектов Федерации; на третьем —
половозрастные квоты: для мужчин в возрасте от 18 до 24 лет, жен
населенных пунктов и т.д. На каждой ступени отбора важно следить за
щ и н — от 18 до 24 лет, мужчин — от 29 до 39 лет и т.д. Всего получит
тем, чтобы не произошло с м е щ е н и я выборки по какому-то важному
ся 8 половозрастных квот (произведение числа групп в каждом из кво
признаку, например представленности городcкого/сельского населе
тирующих п р и з н а к о в ) :
ния или национальных групп.
ВИДЫ опроса Существует множество разновидностей опроса. По характеру взаимо действия исследователя и респондента выделяют интервью и анкети рование. Интервью предполагает п р я м о й контакт между задающим вопросы (в этом случае он будет называться интервьюером) и респон дентом. Анкетирование предполагает к о м м у н и к а ц и ю между исследо вателем и респондентом при п о м о щ и материального посредника — анкеты, представляющей собой структурированный по определенной схеме перечень вопросов, з а ф и к с и р о в а н н ы й на бумажном или элек тронном носителе. Говоря о достоинствах и недостатках анкетирования и интервью в сравнительном ключе, следует отметить следующее. Анкетирование 6"
84
Глава 3. Информационное обеспечение политического анализа и прогнозирования
позволяет охватить большее число респондентов, чем интервью, за один период времени. Н а п р и м е р , чтобы проинтервьюировать членов студенческой группы из 20 студентов, одному интервьюеру потребует ся около 5 часов при условии, что каждое интервью длится 15 минут. В этой же ситуации процесс анкетирования займет всего 15 минут, ес ли раздать анкеты всем студентам одновременно. А н к е т ы , п р е д с т а в л я ю щ и е собой е д и н о о б р а з н ы е , четко структу р и р о в а н н ы е перечни в о п р о с о в , легче поддаются т е х н и ч е с к о й обра ботке. И н т е р в ь ю , о с о б е н н о п о с т р о е н н о е по с вободной схеме (когда и н т е р в ь ю е р руководствуется л и ш ь о б щ и м с п и с к о м тем), требует д о с т а т о ч н о трудоемкой и д л и т е л ь н о й по времени р а с ш и ф р о в к и от ветов. В то же время интервью — более гибкий исследовательский инст румент, предполагающий возможность уточнять те или иные аспекты в ответах респондента, глубже рассматривать отдельные темы. Лич н ы й к о н т а к т между и н т е р в ь ю е р о м и р е с п о н д е н т о м увеличивает «включенность» последнего в процесс опроса, повышает уровень его ответственности при формулировке ответов. Впрочем, л и ч н ы й кон такт может иметь и негативные последствия, н а п р и м е р когда интер вьюер вызывает личную а н т и п а т и ю у респондента. Существует своего рода «гибрид» анкетирования и интервью, ког да л и ч н ы й контакт между респондентом и интервьюером есть, но их беседа проходит по очень жестко заданной схеме. Формулировки и п о р я д о к следования вопросов не подлежат изменению; ф у н к ц и и ин тервьюера ограничиваются ф и к с а ц и е й ответов респондента в соот ветствии с заранее разработанной и единообразной для всех интер вьюеров процедурой. Б л а н к интервью содержит коды ответов для облегчения последующей обработки. Вопросы, содержащие развер нутые перечни вариантов ответа, выносятся на специальные карточ к и , которые интервьюер предъявляет для з а п о л н е н и я респонденту. Такой вид опроса называется стандартизованным интервью в проти вовес свободному интервью. В последнем случае интервьюер ограни чен л и ш ь тематическим планом беседы и набором наиболее важных вопросов, вместе получивших название «гайд» (от англ. guide — про водник), т.е. сценарий интервью. Пример 1 тервью : 1
карточки,
используемой
в стандартизованном
ин-
Ф р а г м е н т о п р о с н о г о и н с т р у м е н т а р и я проекта «Будущее России: взгляд из центра и р е г и о н о в ( п о л и т и ч е с к а я сфера)», осуществляемого отделением п о л и т о л о г и и фило с о ф с к о г о факультета МГУ и м . М.В. Л о м о н о с о в а п р и поддержке И Н О - Ц е н т р а .
3.2. Источники и н ф о р м а ц и и и методы сбора данных
85
Карточка № Какие факторы, по вашему м н е н и ю , могут оказать наибольшее деста билизирующее воздействие на ситуацию в стране в близком и отдален ном будущем? (Отметьте не более трех факторов в каждом столбце.) Факторы дестабилизации
2008 г.
2015-2020 гг.
Этнические к о н ф л и к т ы Терроризм Раскол во властной элите Р е г и о н а л ь н ы й сепаратизм Социальная д и ф ф е р е н ц и а ц и я
Р а д и к а л и з а ц и я молодежи Негативное о т н о ш е н и е к с о ц и а л ь н ы м р е ф о р м а м Падение м и р о в ы х цен на п р и р о д н ы е ресурсы Действия в н е ш н и х для страны п о л и т и ч е с к и х сил
Другое
(Напишите)
Одной из разновидностей опроса являются мониторинговые (трендовые) опросы — серии опросов, проводящихся с определенной пери одичностью. Трендовые опросы нацелены на ф и к с а ц и ю изменений во м н е н и и респондентов по о т н о ш е н и ю к одной и той же политичес кой проблеме или политическому актору. Наиболее распространен ный трендовый опрос — ежемесячное измерение рейтинга поддержки ведущих п о л и т и к о в на протяжении года, оставшегося до президент ских выборов. Основной вопрос, п о в т о р я ю щ и й с я в каждом ежеме сячном опросе — «За кого вы бы проголосовали, если бы выборы пре зидента состоялись в следующее воскресенье?» — как правило, будет иметь полузакрытую форму. Результаты м о н и т о р и н г о в ы х о п р о с о в удобно представить в виде графика. Так, к о л е б а н и я г и п о т е т и ч е с к о г о рейтинга п о л и т и к а N в течение года могут быть о т о б р а ж е н ы следующим образом:
86
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
С п е ц и ф и ч е с к о й разновидностью трендового опроса являются панельные опросы. О с н о в н о е отличие панельных опросов от обычных трендовых с о с т о и т в том, что п а н е л ь н ы е исследования проводятся по одной и т о й же в ы б о р о ч н о й совокупности. Речь идет не только о с о х р а н е н и и единых п р и н ц и п о в отбора, что актуально для всех мо н и т о р и н г о в ы х о п р о с о в ; в п а н е л ь н о м исследовании о п р а ш и в а ю т с я одни и те же л ю д и . Несмотря на ряд технических сложностей, свя з а н н ы х с п р о в е д е н и е м панельных опросов, они обладают одним у н и к а л ь н ы м д о с т о и н с т в о м , а и м е н н о способностью з а ф и к с и р о в а т ь не т о л ь к о т е н д е н ц и ю в и з м е н е н и и м н е н и й , но и п р и ч и н ы и мотивы этого и з м е н е н и я . В отечественной политической науке (в отличие от западной) па нельные исследования пока что распространены довольно слабо, хо тя это один из о с н о в н ы х рабочих инструментов, к примеру, россий ских с п е ц и а л и с т о в по маркетингу. Вероятно, и в п о л и т и ч е с к и х исследованиях панельные опросы займут в ближайшем будущем до стойное место. Несколько видов опроса выделяется по техническому способу свя зи между исследователем и респондентом. Так, достаточно широкое распространение получили телефонные опросы, в частности, в силу их меньшей стоимости по сравнению с очным интервью. В то же время проведение телефонных опросов связано с рядом ограничений, осо бенно в России. Во-первых, в нашей стране уровень телефонизации очень сильно колеблется по отдельным территориям. Достаточно вы сок он Москве и Санкт-Петербурге, ряде крупных городов. На осталь ной же территории, особенно в сельской местности, наличие телефо на в семье может отражать ее более высокий социальный статус или уровень благосостояния. В этом случае проведение телефонного опро са приведет к существенному с м е щ е н и ю выборки, так как доля статус ных и обеспеченных граждан в ней будет выше по сравнению с гене ральной совокупностью. Во-вторых, использование т е л е ф о н н о й связи рекомендуется при проведении экспресс-опросов, когда перечень зада ваемых вопросов незначителен. С некоторой натяжкой к видам опроса можно отнести разнообраз ные голосования на интернет-сайтах. О г р а н и ч е н и я их репрезентатив ности очень велики и связаны с н и з к о й распространенностью Интер нета в России, возрастной и профессиональной с п е ц и ф и к о й его аудитории в целом и аудитории отдельных сайтов в частности. Слабой репрезентативностью обладают также опросы, проводящиеся во время телевизионных передач (когда зрителям предлагается определить свое о т н о ш е н и е к проблеме, позвонив по одному из указанных номеров).
3.2. Источники и н ф о р м а ц и и и методы сбора данных
87
Несмотря на значительную распространенность телевидения, каждая телепрограмма имеет собственную специфическую аудиторию. Кро ме того, от респондента в д а н н о м случае требуется сделать некое уси лие — набрать номер телефона. Соответственно, выборка будет сме щена в сторону п о в ы ш е н н о й представленности социально активных граждан. Опросы бывают индивидуальными и групповыми. В последнем слу чае опрос представляет собой беседу нескольких респондентов, про текающую в русле заданной темы и направляемой ведущим, который называется обычно модератором или медиатором. Наиболее распро страненный вид группового опроса — фокус-группа; в силу ш и р о к о й распространенности фокус-групп в политических исследованиях ме тодика их проведения будет рассмотрена отдельно. Групповые опросы нельзя путать с массовыми о п р о с а м и . Массо вый опрос — это совокупность большого числа индивидуальных оп росов. Предметом исследований, реализуемых с п о м о щ ь ю массово г о о п р о с а , я в л я е т с я м н е н и е б о л ь ш о й с о ц и а л ь н о й группы и л и с о в о к у п н о с т и социальных групп по той или и н о й п о л и т и ч е с к о й проблеме. Объектом таких и с с л е д о в а н и й может быть, н а п р и м е р , мо лодежь крупных городов, л и ц а с доходом ниже прожиточного мини мума, н а с е л е н и е региона или с т р а н ы в целом. Массовые опросы все гда п р о в о д я т с я в ы б о р о ч н ы м методом, причем объем выборки, как п р а в и л о , составляет от одной до полутора тысяч респондентов. Ре п р е з е н т а т и в н о с т ь такой в ы б о р о ч н о й совокупности (а в массовых опросах о ш и б к а выборки о б ы ч н о не п р е в ы ш а е т 2,5%) обеспечивает ся с о ч е т а н и е м квотного п р и н ц и п а и многоступенчатого райониро в а н н о г о отбора. В ы с о к а я р е п р е з е н т а т и в н о с т ь м а с с о в ы х о п р о с о в п о з в о л я е т ко личественно оценивать характеристики общественного мнения, п р и ч е м на и н т е р в а л ь н о м уровне и з м е р е н и я . По результатам массо вого о п р о с а мы можем не т о л ь к о с к а з а т ь , что, к примеру, отноше ние взрослого населения России к реформе системы образования я в л я е т с я «скорее п о з и т и в н ы м » и л и «скорее н е г а т и в н ы м » ; мы мо жем с в ы с о к о й т о ч н о с т ь ю (до з н а ч е н и я о ш и б к и в ы б о р к и ) о ц е н и т ь , н а с к о л ь к о д о л я « о д н о з н а ч н о п о з и т и в н о » в о с п р и н и м а ю щ и х рефор му б о л ь ш е и л и м е н ь ш е доли о ц е н и в а ю щ и х ее « о д н о з н а ч н о нега т и в н о » , к а к о в п р о ц е н т не и м е ю щ и х о п р е д е л е н н о г о м н е н и я по дан ному в о п р о с у и т.д. В п р и в е д е н н о м в ы ш е п р и м е р е трендового о п р о с а о б щ е с т в е н н о г о м н е н и я , ф и к с и р у ю щ е г о к о л е б а н и я рейтин га к а н д и д а т а в п р е з и д е н т ы , мы т а к ж е оперируем и н т е р в а л ь н ы м и данными.
88
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
Отдельную разновидность опроса составляют экспертные опросы. Экспертом является человек, владеющий и н ф о р м а ц и е й по интересу ющей исследователя проблеме. Основная с п е ц и ф и к а данного вида исследований состоит в том, что при их проведении нас интересует не столько субъективное мнение респондента как представителя некото рой ш и р о к о й социальной группы, сколько объективная его оценка тех или иных процессов и явлений. И н ф о р м а ц и я , полученная от но сителя экспертного з н а н и я , является не только и н ф о р м а ц и е й о мне н и и (как в большинстве опросов), но и и н ф о р м а ц и е й об оцениваемом экспертом объекте. Например, на о с н о в а н и и массового опроса жите лей сельских территорий Юга России по проблеме социально-эконо мических р е ф о р м правительства м о ж н о получить представление о восприятии д а н н о й группой этих реформ — и не более того. На осно вании же опроса экспертов можно сделать выводы относительно самого процесса социально-экономических реформ — при условии, к о н е ч н о , что опрашиваемые эксперты обладают высокой компетент ностью в д а н н о м вопросе. Э к с п е р т н ы й о п р о с является о д н и м из наиболее распространен ных методов политических и с с л е д о в а н и й , о с о б е н н о прикладных. П р и п р о в е д е н и и э к с п е р т н ы х и с с л е д о в а н и й используются самые р а з л и ч н ы е о п р о с н ы е техники: а н к е т и р о в а н и е и интервью (очное и т е л е ф о н н о е ) , групповые дискуссии. Э к с п е р т н ы й опрос может быть о д н о к р а т н ы м или носить т р е н д о в ы й характер. Наиболее распро с т р а н е н н ы й п р и м е р трендового э к с п е р т н о г о опроса — разнообраз н ы е р е й т и н г и влиятельности п о л и т и к о в , публикуемые в средствах м а с с о в о й и н ф о р м а ц и и . Более п р е д м е т н о методики о р г а н и з а ц и и э к с п е р т н о г о опроса будут р а с с м о т р е н ы отдельно.
Количественные и качественные опросные исследования Особого в н и м а н и я заслуживает разделение опросных исследований н а количественные и качественные. О к о л и ч е с т в е н н ы х и с с л е д о в а н и я х , обеспечивающих точную числовую ф и к с а ц и ю ха рактеристик общественного м н е н и я (массовый опрос), уже говори л о с ь в ы ш е . О д н а к о б о л ь ш о й объем в ы б о р к и , о б е с п е ч и в а ю щ и й точность измерений, накладывает естественные ограничения на ха рактер и н ф о р м а ц и и , получаемой в результате количественных иссле дований. Первое ограничение связано с необходимостью в сжатые сроки обработать и н ф о р м а ц и ю , полученную более чем от тысячи респон дентов, вследствие чего массовые опросы проводятся только методом
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
89
стандартизованного интервью и а н к е т и р о в а н и я , техника свободного интервью не применяется. В анкетах и опросных листах д о м и н и р у ю т закрытые и полузакрытые вопросы. Общее число вопросов достаточ но жестко ограничено. Соответственно, ограничиваются полнота, глубина получаемой и н ф о р м а ц и и по отдельным аспектам проблемы. С помощью массового опроса м о ж н о с высокой точностью опреде лить, н а п р и м е р , долю избирателей, планирующих принять участие в предстоящих выборах. Но при этом за скобками останутся, например, такие вопросы: «Почему вы в настоящее время планируете (не плани руете) участвовать в голосовании?»; «Какие факторы повлияют на ва ше решение об участии (неучастии) в выборах непосредственно в день голосования?»; «Какие действия власти или участвующих в избира тельной к а м п а н и и кандидатов могли бы изменить ваше решение?». Подобные вопросы крайне сложно сформулировать в закрытом или полузакрытом виде; если это все же удастся сделать, формулировки вопросов будут громоздки и займут много места в опросном листе или анкете; скорее всего, их будет неудобно обрабатывать. Поэтому в большинстве случаев такие вопросы в количественных исследовани ях просто не задаются. Еще одно обстоятельство, ограничивающее полноту и н ф о р м а ц и и по отдельным аспектам проблемы в количественных опросах, — вы сокая стоимость таких исследований. Массовый опрос, предполагаю щ и й получение и н ф о р м а ц и и от большого числа респондентов, «раз бросанных» п о б о л ь ш о й т е р р и т о р и и , является о д н и м и з самых затратных по ресурсам видов сбора данных. Поэтому у исследователя возникает желание получить в рамках одного опроса и н ф о р м а ц и ю по максимально большему кругу проблем. Например, при диагностике ситуации в избирательном округе перед началом электоральной кам п а н и и н е о б х о д и м о о п р е д е л и т ь с я п о целому ряду т е м а т и ч е с к и х блоков. Нужно сформировать представление о проблемах жителей округа, поскольку на этом материале будет строиться программа кан дидата. Важно оценить текущий уровень узнаваемости и поддержки кандидата и его о п п о н е н т о в , в ы я с н и т ь , поддержка каких политичес ких сил будет способствовать росту рейтинга кандидата; каков про гнозируемый уровень явки избирателей на выборы; какие каналы к о м м у н и к а ц и и с электоратом наиболее э ф ф е к т и в н ы для данного кан дидата; к а к и е политико-идеологические установки в наибольшей сте пени поддерживаются и з б и р а т е л я м и и т.д. Н а к о н е ц , целый ряд вопросов будет неизбежно п о с в я щ е н характеристикам самого рес пондента — и все это в условиях жестких ограничений по количеству вопросов. Поэтому приходится идти по пути сокращения числа во-
90
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
9!
просов, р а с к р ы в а ю щ и х отдельные смысловые блоки, в пользу увели чения числа этих смысловых блоков. Соответственно, уменьшается глубина п о н и м а н и я исследователем отдельных аспектов каждой из рассматриваемых проблем.
вание э ф ф е к т и в н о с т и а г и т а ц и о н н о - п р о п а г а н д и с т с к и х материалов
Кроме того, далеко не все данные можно и нужно получать в коли чественной ф о р м е . Например, один из самых э ф ф е к т и в н ы х методов оценки имиджа политического деятеля — проведение психологичес ких тестов, результаты которых можно интерпретировать только на качественном уровне.
тервью. Подготовка к проведению фокус-группы включает в себя, кроме общих программных к о м п о н е н т о в , с п е ц и ф и ч е с к и е составляющие. Во-первых, это подготовка гайда (сценария) фокус-группы, опре деляющего о с н о в н ы е тематические блоки беседы с респондентами и их последовательность в соответствии с задачами исследования, а также наиболее важных вопросов в рамках каждого смыслового бло ка. Заранее готовится так называемый стимульный материал, реак цию группы на который нужно будет выявить. Содержание стимульн о г о материала зависит от цели и с с л е д о в а н и я . Это могут быть ф о т о г р а ф и и , биографии, агитационные материалы политических ли деров, видеоролики, призывающие голосовать за ту или иную поли тическую партию, и т.д. Во-вторых, это определение состава респондентов, участвующих в фокус-группе. Важной особенностью метода является ограничение по числу участников — в фокус-группе участвует от семи до двенадцати респондентов. В соответствии с з а к о н а м и социальной психологии увеличение количества респондентов приведет к расколу малой груп пы на н е с к о л ь к о подгрупп, что снизит э ф ф е к т и в н о с т ь обсуждения. Столь небольшой объем выборки неизбежно обострит проблему ре презентативности исследования. В фокус-групповом методе задача п о в ы ш е н и я репрезентативности решается за счет использования се рийного подхода: в рамках одного исследования проводится не одна, а несколько фокус-групп (в некоторых случаях до двадцати; число фо кус-групп в серии ограничено т о л ь к о ресурсами исследования и п р и н ц и п о м разумной достаточности). Н е с м о т р я на малое число у ч а с т н и к о в фокус-групп, их состав оп р е д е л я е т с я , исходя из научных п р и н ц и п о в ф о р м и р о в а н и я выбороч н о й с о в о к у п н о с т и . Здесь существует два о с н о в н ы х подхода. П е р в ы й з а к л ю ч а е т с я в и с п о л ь з о в а н и и к в о т н о г о метода, второй — в т о м , чтобы задействовать в каждой из фокус-групп представителей раз ных с о ц и а л ь н ы х групп, при этом с е р и я фокус-групп в целом долж на охватывать все с о ц и а л ь н ы е г р у п п ы , я в л я ю щ и е с я объектом ис следования. П р е д п о л о ж и м , для изучения в о с п р и я т и я кандидата в депутаты городского совета и з б и р а т е л я м и д а н н о г о округа (района города) за п л а н и р о в а н а серия из семи фокус-групп. В соответствии с первым
К о м п е н с и р о в а т ь д е ф и ц и т полноты и глубины и н ф о р м а ц и и , неиз бежный при количественных исследованиях, призваны к а ч е с т в е н н ы е и с с л е д о в а н и я . Качественные о п р о с н ы е исследова н и я к о н ц е н т р и р у ю т в н и м а н и е на глубоком изучении отдельных случаев, ф о р м и р о в а н и и всестороннего, к о м п л е к с н о г о п о н и м а н и я с р а в н и т е л ь н о н е б о л ь ш о г о числа проблем. Не случайно качествен ные и с с л е д о в а н и я называют также г л у б и н н ы м и и фокусированны ми. П р и м е н е н и е качественных методов опроса предполагает н е б о л ь ш о й объем в ы б о р к и — соответственно, о н и менее репрезен т а т и в н ы по о т н о ш е н и ю к большим генеральным с о в о к у п н о с т я м (данная п р о б л е м а не является к р и т и ч е с к о й , так к а к качественные методы не претендуют на точное и з м е р е н и е ) . Д о м и н и р у ю щ е й тех н и к о й о п р о с а я в л я е т с я здесь очное свободное интервью, к а к инди видуальное, т а к и групповое, в о п р о с ы формулируются в о с н о в н о м в открытой ф о р м е . В теоретических и прикладных политических проектах качествен н ы е исследования п р и м е н я ю т с я главным образом в целях: • в ы я в л е н и я с п е ц и ф и к и восприятия политических субъектов и объектов: лидеров, политических партий, институтов, государства и власти в целом. В прикладных исследованиях одной из наиболее рас п р о с т р а н е н н ы х задач является диагностика имиджа (сознательно формируемого образа) политического деятеля; • получения и н ф о р м а ц и и об особенностях политической культуры определенных групп населения и элиты; • ф о р м и р о в а н и я представления об особенностях социального са мочувствия групп населения и характера его в л и я н и я на политичес кое поведение; • выявления особенностей отношения населения к социальным проблемам; • выявления с п е ц и ф и к и восприятия различными группами населе н и я политической и н ф о р м а ц и и и каналов ее распространения. В при кладных исследованиях распространенной задачей является тестиро-
(листовок, плакатов, аудио- и видеороликов и т.д.). Наиболее р а с п р о с т р а н е н н ы м методом качественных о п р о с н ы х и с с л е д о в а н и й являются фокус-группы — групповые глубинные ин
92
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
Глава 3. Информационное обеспечение политического анализа и прогнозирования
подходом мы определяем квотирующие п р и з н а к и — скажем, пол и возраст — и формируем состав участников каждой группы в пример ном соответствии с распределением этих п р и з н а к о в в генеральной с о в о к у п н о с т и . Н а п р и м е р , участниками каждой группы станут две д е в у ш к и и один молодой человек, два мужчины и две ж е н щ и н ы в возрасте от 35 до 55 лет, два мужчины и три ж е н щ и н ы старше 55 лет. Могут быть введены и д о п о л н и т е л ь н ы е квотирующие при з н а к и : н а п р и м е р , среди трех представителей молодого п о к о л е н и я двое будут из студенческой молодежи, один — из рабочей; среди л и ц старшего возраста будут работающие и н е р а б о т а ю щ и е п е н с и о н е р ы и т.д. Эти квоты будут сохраняться для каждой из шести групп в серии, хотя к о н к р е т н ы й состав участников будет, разумеется, меняться п о л н о с т ь ю . В соответствии со вторым подходом мы проводим две фокус-группы среди представителей молодежи, две — среди пред ставителей среднего и три — среди представителей старшего возрас та. В л ю б о м случае участники фокус-группы не д о л ж н ы быть знако мы друг с другом. Далее определяется способ рекрутинга участников фокус-груп п ы . В отличие от массового опроса, участие в фокус-группе требует с у щ е с т в е н н о больше времени. К р о м е того, если в массовом опросе интервьюер сам приходит к респонденту, то в случае с фокус-груп п а м и п о с л е д н и й д о л ж е н сам добираться до места п р о в е д е н и я ис с л е д о в а н и я . Соответственно, рекрутинг р е с п о н д е н т о в оказывается отнюдь не простой задачей. В некоторых случаях используются ор г а н и з а ц и о н н ы е ресурсы п о л и т и ч е с к и х п а р т и й или властных струк тур, п р и ч е м крайне важно следить з а т е м , чтобы п о л и т и ч е с к и е инте ресы этих о р г а н и з а ц и й н е о к а з а л и и с к а ж а ю щ е г о в л и я н и я н а подбор р е с п о н д е н т о в . В л ю б о м случае при п р о в е д е н и и фокус-групп предус матривается д е н е ж н о е или и н о е материальное вознаграждение уча стников. Подготовка к проведению фокус-группы включает в себя также определение медиатора (модератора, ведущего), от опыта и квалифи к а ц и и которого во многом зависит успех исследования. Ф у н к ц и я ме диатора — не только задавать вопросы, как о б ы ч н ы й интервьюер; ме диатор как бы дирижирует всем процессом дискуссии, стимулирует свободное высказывание мнений участниками группы и в то же вре мя не дает им отклониться от темы обсуждения, обеспечивает плав ность перехода от одного смыслового блока к другому. Важным к о м п о н е н т о м подготовки к проведению фокус-групп яв ляется материально-техническое обеспечение. Фокус-группы рекомен дуется проводить в п о м е щ е н и и , специально оборудованном средства-
93
ми ф и к с а ц и и аудио- и в и д е о и н ф о р м а ц и и . Важность видеозаписи на фокус-группах обусловлена потребностью ф и к с и р о в а т ь не только вербальные (словесные) реакции участников группы, но и их мимику и жестикуляцию. Весьма желательно обеспечить возможность группе исследователей незаметно для респондентов наблюдать за ходом фо кус-группы, не вмешиваясь (так называемое невключенное скрытое наблюдение технически обеспечивается односторонним зеркалом). Впрочем, эти требования не всегда в ы п о л н и м ы в п р и н ц и п е , особен но если фокус-группа проводится в сельской местности. Жестко обя зательной, независимо от условий проведения фокус-группы, являет с я л и ш ь д и к т о ф о н н а я запись. Проведение фокус-группы занимает в среднем от полутора до двух часов. П р и меньших затратах времени сложно получить комплексную и н ф о р м а ц и ю о восприятии респондентами разных аспектов несколь ких различных проблем; существенное превышение двухчасового ин тервала не будет э ф ф е к т и в н ы м из-за усталости участников. Первый смысловой блок должен выполнять ф у н к ц и ю адаптации участников группы к процессу опроса, «втягивать» их в рассматрива емую тематику. Например, в предвыборных исследованиях адаптаци онную ф у н к ц и ю выполняет беседа о проблемах, «болевых точках» той территории, где проживают участники. С одной стороны, это форми рует заинтересованное о т н о ш е н и е респондентов к беседе; с другой — «проблемная» и н ф о р м а ц и я практически важна организаторам изби рательной к а м п а н и и . Д л я р е ш е н и я целого ряда задач, связанных с анализом бессозна тельных, слабо вербализуемых к о м п о н е н т о в восприятия политичес ких объектов и процессов, используется психологическое тестирова ние. Этот метод позволяет, с о д н о й стороны, углубить и дополнить о ц е н к и , сформулированные респондентом вербально, с другой — ди агностировать скрытые, не осознаваемые респондентом ценности, мотивы, установки. В реальности политическое поведение базируется на системе ценностей, не всегда совпадающей с социально одобряе мой. Ответы респондентов об их предпочтениях не могут работать как надежный инструмент исследования. Их необходимо дополнить ис следованием бессознательных установок, в которых заложена система ценностей респондентов, — о н и могут ощущаться ими как «непра 1 вильные» с т о ч к и зрения п р и н я т ы х норм . 1
П о д р о б н е е с м . : Шестопал, Е. Б. В о с п р и я т и е о б р а з о в власти: п о л и т и к о - п с и х о
л о г и ч е с к и й а н а л и з // П о л и с . 1995. № 4; 1988.
Шестопал.
Е. Б. Л и ч н о с т ь и п о л и т и к а . М.,
Глава 3. Информационное обеспечение политического анализа и прогнозирования
О с н о в н ы м методом в ы я в л е н и я скрытых пластов восприятия явля
95
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
2. А с с о ц и а ц и и с з а п а х а м и :
полити
П о л и т и к о в N и М ч а щ е с р а в н и в а ю т с запахами п и щ и : N — с запахом
ческим лидерам и даже к о л л е к т и в н ы м политическим субъектам (пар
хлеба ( п о н ч и к о в , батона), борща, ч е с н о к а , лука; М — с запахом жарено
ется
ассоциативное
тестирование.
Респондент
приписывает
т и я м , органам власти) определенные а с с о ц и а ц и и , з н а ч е н и я которых
го мяса, п ш е н и ц ы , водки. Это свидетельствует об их д о с т у п н о с т и и теп
затем «расшифровываются» специалистом по политической психоло
лоте. И того и другого с р а в н и в а ю т с запахами р е з к и м и (мужским рабо
гии. Обычно используются а с с о ц и а ц и и с ж и в о т н ы м и , запахами, цве
чим запахом пота). Н а п р о т и в , K с р а в н и в а ю т с чем-то трудноуловимым и
том, а также р и с у н о ч н ы е тесты.
и з ы с к а н н ы м , т.е. на уровне запаха он в о с п р и н и м а е т с я холодным и отст
Н и ж е приводится несколько фрагментов отчета о реальном фокус-
раненным.
групповом исследовании, где использовались техники психологичес
Привлекает в н и м а н и е и наличие среди а с с о ц и а ц и й с п о л и т и к о м
кого тестирования. П о д л и н н ы е и м е н а п о л и т и к о в по п о н я т н ы м сооб
С большого числа запахов, и м е ю щ и х с о ц и а л ь н ы й смысл, — «дорогой пар-
р а ж е н и я м не приводятся.
фюм», «французские духи», «что-то дорогое», «статусный запах» и т.д. Это означает, что С в о с п р и н и м а е т с я к а к часть элиты, как человек, обладаю
1. А с с о ц и а ц и и с ж и в о т н ы м и : Ж и в о т н о е , с к о т о р ы м сравнивают политика N, о б ы ч н о неагрессивное,
щ и й б о л ь ш и м и ф и н а н с о в ы м и ресурсами, богатый. Это может вызвать
хорошо з а щ и щ е н н о е (мохнатое), н а п р и м е р сенбернар, медведь. Живот
ожидания граждан относительно его дальнейших действий — либо как бо
ное л и б о д о м а ш н е е , к а к кот (7 у п о м и н а н и й ) , либо нехищное, как барсук,
гатого человека, которому нет дела до жителей округа, либо как мецената,
крот, бобер (7 у п о м и н а н и й ) . Последние могут быть о п и с а н ы еще и к а к
который заботится о своих избирателях «как родной отец».
«накопители»,
«создатели
припасов»,
«сообразительные»,
«строители».
Лев, слон упоминаются к а к символы царственной мудрости. Таким обра зом, ж и в о т н о е неопасное, умное, человеку дружественное. П о л и т и к а М чаще сравнивают с ж и в о т н ы м и , с и м в о л и з и р у ю щ и м и ум и
3. А с с о ц и а ц и и с ц в е т о м : Среди цветов, а с с о ц и а ц и и с к о т о р ы м и вызывает у респондентов поли т и к С, преобладают т е м н ы е , д о п о л н и т е л ь н ы е , холодные и тусклые. Пре
хитрость (лиса, обезьяна), и с ж и в о т н ы м и — символами силы (не х и щ н о й ,
обладание т е м н ы х цветов над светлыми и холодных над т е п л ы м и свиде
но д и к о й ) и напора (кабан, бык, лось). Если это собака, то злой, агрессив
тельствует
ный доберман-пинчер.
серьезный, о б л а д а ю щ и й о п р е д е л е н н ы м статусом и з н а ч и м ы й . С другой
о
том,
что
этот
политик
воспринимается
как
человек
Участники обсуждения д о с т а т о ч н о е д и н о д у ш н о с р а в н и в а л и полити
стороны, в его образе нет легкости, он не вызывает теплых э м о ц и й , он
ка К с ж и в о т н ы м и х и т р ы м и , о с т о р о ж н ы м и (лиса — 6 у п о м и н а н и й ,
способен решать п р о б л е м ы , но не внушает любви. 78% ассоциаций — это
р ы с ь ) , н е о п а с н ы м и (взлохмаченная дворняга, опоссум). Его с р а в н и в а л и
а с с о ц и а ц и и с тусклыми цветами и только 22% — с я р к и м и . Это говорит о
также с п т и ц а м и — показатель в о с п р и н и м а е м о г о масштаба, веса фигу
н и з к о м интересе к этому политику, отсутствии в нем ярких и привлека
р ы , к тому же п т и ц ы — существа вроде бы и умные (птица-говорун, по
тельных черт. В с о з н а н и и граждан он мало чем отличается от остальных,
пугай).
нет четкого п о з и ц и о н и р о в а н и я .
Среди а с с о ц и а ц и й с п о л и т и к о м С п р е о б л а д а ю т ж и в о т н ы е с р е д н е г о
Цветовые а с с о ц и а ц и и в о т н о ш е н и и политика T состоят в о с н о в н о м из
и к р у п н о г о р а з м е р а , что м о ж н о и н т е р п р е т и р о в а т ь в о с п р и я т и е его к а к
светлых, д о п о л н и т е л ь н ы х , холодных и тусклых цветов; у политика R — из
з н а ч и т е л ь н о г о п о л и т и к а , о б л а д а ю щ е г о д о в о л ь н о в ы с о к и м статусом.
светлых, о с н о в н ы х , холодных и тусклых. Это свидетельствует о том, что
Э т о подтверждает и н а л и ч и е д о в о л ь н о з н а ч и т е л ь н о г о ч и с л а (27,5%)
образы д а н н ы х п о л и т и к о в выглядят более л е г к и м и , не с в я з а н н ы м и с вла
с р е д и а с с о ц и а ц и й с н и м ж и в о т н ы х , в ы п о л н я ю щ и х роль х о з я е в леса и
стью и государством, о т с т р а н е н н ы м и , не слишком з н а ч и м ы м и , не при
повелителей. Положительным моментом является также относительно
влекающими внимания.
н е б о л ь ш о е к о л и ч е с т в о а с с о ц и а ц и й с ж и в о т н ы м и не из н а ш е г о леса ( о к о л о 10%). Это свидетельствует о т о м , что по ш к а л е «свой — чужой»
П о о к о н ч а н и и ф о к у с - г р у п п ы а н а л и з и р у ю т с я : а ) с т е н о г р а м м а (ви
С в о с п р и н и м а е т с я к а к «свой» п о л и т и к . О ч е н ь м н о г о а с с о ц и а ц и й со
деозапись) беседы; б) карточки н а б л ю д е н и й ассистентов модератора,
слоном — большим, сильным, умным, немного неуклюжим и добрым
о с у щ е с т в л я в ш и х н е в к л ю ч е н н о е с к р ы т о е н а б л ю д е н и е (если таковое
животным.
велось); в) результаты психологического тестирования. Полученные д а н н ы е с р а в н и в а ю т с я с результатами анализа других фокус-групп в
96
Глава 3. Информационное обеспечение политического анализа и прогнозирования
серии, на основе чего формулируются общие выводы проведенного исследования. Как правило, фокус-группы используют в сочетании с массовым опросом. В целом комплексное использование количественных и ка чественных методов — залог точности и полноты получаемой иссле дователем и н ф о р м а ц и и . В таблице приведены ключевые различия количественных и каче ственных о про сн ы х исследований: Количественный опрос
Качественный опрос
Основной результат иссле дований
Знание о количественных Знание о качественных ха характеристиках распреде рактеристиках восприятия ления признаков
Объем выборки
Большой (1 — 1,5 тыс.)
Небольшой (до 100)
Анкетирование или стан дартизованное интервью
Свободное интервью и психологическое тестиро вание
Способ коммуникации ис следователя и респондента
Уровень репрезентативно Высокий сти данных Степень полноты информа ции по отдельным аспектам Сравнительно небольшая проблемы Число смысловых блоков в Значительное рамках одного исследования
Сравнительно невысокий Большая Сравнительно небольшое
Наблюдение Наблюдение — это способ получения информации, предполагающий непосредственную регистрацию наблюдателем происходящих событий. Бесспорное достоинство наблюдения — прямое восприятие событий, отсутствие «посредников» между исследователем и реальной действи тельностью. Для политической науки это имеет особое значение, по скольку, как неоднократно отмечалось выше, политическая реальность в наибольшей мере подвержена сознательным и неосознанным интерпре тационным искажениям. В то же время наблюдатель сам является человеком из плоти и кро ви, с собственным политическим мировоззрением, предпочтениями, ценностными ориентациями. По природе своей наблюдение неизбежно избирательно, и даже самый беспристрастный наблюдатель фиксирует реальность под определенным углом зрения, зависящим от особеннос тей его личности. Поэтому наблюдение можно в целом охарактеризо вать как достаточно субъективный метод, хотя и существуют специаль-
3.2. Источники и н ф о р м а ц и и и методы сбора данных
97
ные методики, нацеленные на смягчение действия субъективного фак тора (о них ниже). Другое важное достоинство наблюдения — глубина и насыщен ность собираемой и н ф о р м а ц и и . В ходе наблюдения исследователь получает не только сухой фактический материал, но «живой» образ ситуации, он способен различить оттенки, полутона происходящего, не фиксируемые более объективными и строгими методиками. Ко нечно, это свойство наблюдения имеет и свою отрицательную сторо ну: все та же субъективность получаемых данных. Надо отметить, что возможности использования наблюдения при сборе и н ф о р м а ц и и для политического анализа существенно ограни чены. Наблюдать можно только четко локализованное политическое событие, например заседание Государственной думы, съезд политиче с к о й партии, митинг или демонстрацию. Кроме того, наблюдение многих политических событий затруднено в силу их закрытого харак тера. К примеру, наблюдать неформальную встречу политического лидера с представителями его ближайшего окружения практически невозможно, не будучи частью этого окружения. Поэтому результаты наблюдения в большинстве случаев используются как дополнитель ная, а не о с н о в н а я составляющая и н ф о р м а ц и о н н о г о обеспечения. Так, п р и изучении определенной политической партии наблюдение ее съезда или к о н ф е р е н ц и и может оказаться чрезвычайно полезным, но л и ш ь в сочетании с анализом ее программных документов, резуль татов участия в избирательных кампаниях, изучением п о с в я щ е н н ы х партии материалов С М И , м н е н и й экспертов, данных опросов обще ственного м н е н и я и т.д. Существует несколько о с н о в а н и й к л а с с и ф и к а ц и и наблюдения. С точки зрения участия наблюдателя в процессе, который является объектом наблюдения, выделяют включенное и невключенное наблюде ние. В первом случае исследователь непосредственно участвует в процессе, за которым наблюдает. Так, если объектом наблюдения яв ляется политический митинг, исследователь находится в толпе ми тингующих, вместе с которыми скандирует лозунги, выражает свое одобрение или неодобрение выступающим и т.д. Используя включен ный метод, наблюдатель получает и н ф о р м а ц и ю о небольшом фраг менте реальности, которая непосредственно его окружает, но эта ин ф о р м а ц и я будет п о л н о й , глубокой, э м о ц и о н а л ь н о н а с ы щ е н н о й . Включенное наблюдение дает наиболее интересные, но при этом и наиболее субъективные данные: невозможно участвовать в какой-то деятельности, сохраняя по о т н о ш е н и ю к ней полную эмоциональную д и с т а н ц и ю . О с о б е н н о это касается массовых мероприятий, в ходе ко7 - 3863
98
Глава 3. И н ф о р м а ц и о н н о е обеспечение политического анализа и прогнозирования
торых нередко проявляется ф е н о м е н «передачи настроения»: наблю датель н е о с о з н а н н о становится эмоционально сопричастным окру ж а ю щ и м людям, испытывает те же ощущения, что и они (эмоцио нальный подъем, агрессию и т.д.). Основание другой классификации — знание/незнание людей, ко торые являются объектом наблюдения, о том, что за н и м и наблюдают. По этому основанию выделяют открытое (наблюдаемые осведомлены о процессе наблюдения) и скрытое (наблюдаемые не осведомлены) наблюдение. Например, большинство заседаний Государственной ду мы проходит в ситуации открытого наблюдения: за работой палаты следит большое число представителей прессы, о чем сами депутаты прекрасно осведомлены. Открытое наблюдение, как правило, гораздо легче организовать с технической точки зрения. В то же время о н о несет в себе определен н ы й риск получения неадекватных результатов: знание наблюдаемых о процессе наблюдения за их поведением может стать фактором, вли я ю щ и м на это поведение. Классический тому пример, п р и в о д и м ы й во многих работах по социологии, связан с изучением производитель ности труда на ткацких предприятиях. Группа социологов (преимуще с т в е н н о мужчин) вела о т к р ы т о е наблюдение за работой ткачих (исключительно ж е н щ и н ) с целью выявить факторы, в л и я ю щ и е на производительность их труда. Результат оказался неутешительным: о с н о в н ы м таким фактором стало присутствие на предприятии группы наблюдающих за ткачихами социологов. В политике хорошо известен «эффект камеры»: многие политические лидеры в присутствии жур налистов демонстрируют совершенно иное поведение, нежели в не публичных ситуациях. К о м б и н и р о в а н н а я к л а с с и ф и к а ц и я на основе двух приведенных выше оснований дает четыре вида наблюдений: Включенное
Невключенное
Открытое
Включенное открытое
Невключенное открытое
Скрытое
Включенное скрытое
Невключенное скрытое
Еще одна к л а с с и ф и к а ц и я касается степени стандартизации проце дуры наблюдения. Выделяют стандартизованное (структурированное, контролируемое) и нестандартизованное (свободное, неконтролируе мое) наблюдение. В первом случае исследователь фиксирует наблю даемый процесс в соответствии с заранее разработанной строгой про цедурой. К л ю ч е в о й м о м е н т подготовки к с т а н д а р т и з о в а н н о м у
3.2. И с т о ч н и к и и н ф о р м а ц и и и методы сбора данных
99
наблюдению — о п е р а ц и о н а л и з а ц и я изучаемых признаков до уровня аудиовизуально наблюдаемых индикаторов. Скажем, одной из задач прикладного исследования является опре деление степени авторитетности нескольких лидеров к о н к р е т н о й партии в среде п а р т и й н о й элиты (руководства). Методом измерения данного признака выбирается, н а п р и м е р , невключенное открытое наблюдение. Наблюдаемым событием будет ежегодная партийная конференция, на которой будут выступать все интересующие иссле дователя п а р т и й н ы е лидеры. Примем в качестве исходной п о с ы л к и , что авторитетность партий ного лидера будет проявляться, в частности, во в н и м а н и и и поддерж ке аудиторией его выступления. Далее необходимо привести неопера циональные п о н я т и я «внимание» и «поддержка» к э м п и р и ч е с к и наблюдаемому виду, причем наблюдаемому аудиовизуально. Так, при знак «внимание» может быть о п е р а ц и о н а л и з и р о в а н через: • уровень шума в зале в процессе выступления оратора; • число выходящих из зала во время выступления; • число людей, разговаривающих друг с другом; •число людей, з а н и м а ю щ и х с я п о с т о р о н н и м и делами (читающих газету, разговаривающих по мобильному телефону и т.д.). Чем м е н ь ш е значение каждого из операциональных признаков, тем выше уровень в н и м а н и я к оратору. П р и з н а к «поддержка» может быть операционализирован через: • продолжительность аплодисментов по завершении выступления оратора; • громкость аплодисментов по з а в е р ш е н и и выступления оратора; • количество раз, когда выступление оратора прерывалось апло дисментами; • количество одобрительных возгласов из зала; • количество неодобрительных возгласов из зала и т.д. Д л я каждого и з о п е р а ц и о н а л ь н ы х и н д и к а т о р о в определяется единица счета. Н а п р и м е р , п р о д о л ж и т е л ь н о с т ь аплодисментов мо жет и з м е р я т ь с я в секундах ( и н т е р в а л ь н а я ш к а л а ) , уровень шума в за ле — на п о р я д к о в о м уровне (отсутствует, слабый, у м е р е н н ы й , гром кий, о в а ц и я ) . Все о п е р а ц и о н а л ь н ы е п р и з н а к и и соответствующие им единицы счета заносятся в специальную карточку наблюдателя, которая запол няется в процессе наблюдения. По итогам наблюдения мы сможем количественно о ц е н и т ь значения п р и з н а к о в «внимание аудитории» и «поддержка аудитории» п р и м е н и т е л ь н о к каждому из выступающих. При этом необходимо будет сделать поправку на время выступления
100
Глава 3. Информационное обеспечение политического анализа и прогнозирования
оратора, п о м н я , что первый выступающий имеет дело со свежей ауди торией, последний — с уставшей. Основное достоинство стандартизованного наблюдения заключа ется в том, что оно существенно снижает субъективность данной про цедуры. В то же время значительно уменьшаются глубина и насыщен ность получаемой и н ф о р м а ц и и — она в какой-то мере обедняется. Возникает р и с к упустить существенные особенности поведения на блюдаемых, не учтенные исследователем при разработке программы наблюдения. Это компенсируется наличием в карточках графы «Зара нее не формализуемые пометки», но л и ш ь частично: наблюдатель не избежно будет концентрироваться на параметрах, обозначенных в карточке. Свободное наблюдение не предполагает столь жестко структури рованной процедуры ф и к с а ц и и данных, исследователь руководству ется л и ш ь о б щ и м планом. При этом свободное наблюдение остается научным методом сбора и н ф о р м а ц и и , поскольку: • оно п о д ч и н е н о четко сформулированным целям и задачам ис следования; • наблюдатель понимает, какие конкретно характеристики поведе ния ему интересны; • результаты наблюдения в том или ином виде фиксируются; • и н ф о р м а ц и я , полученная посредством наблюдения, поддается проверке на надежность. Подход «Пойду посмотрю, что там происходит» п р и н ц и п и а л ь н о не приемлем ни при каком научном наблюдении. Н а к о н е ц , различают индивидуальное и групповое наблюдение. В последнем случае наблюдение осуществляется несколькими людьми. П р и групповом наблюдении важно учесть два момента. Во-первых, необходимо четко определить пространственные п о з и ц и и каждого из наблюдателей, чтобы все вместе о н и охватывали объект наблюде н и я ц е л и к о м , а их индивидуальные сектора не пересекались. Во-вто рых, до начала процедуры наблюдения следует определить правила и п р и н ц и п ы , в соответствии с к о т о р ы м и отдельные наблюдения будут складываться в единую картину происходящего. Э ф ф е к т и в н о е реше ние этой задачи возможно за счет использования стандартизованно го н а б л ю д е н и я ; использование иных методик с высокой вероятнос тью приведет к тому, что собрать отдельные фрагменты в единое целое будет попросту невозможно.
Литература
101
Контрольные вопросы и задания 1. Назовите основные критерии ф о р м и р о в а н и я и н ф о р м а ц и о н н о г о обес печения в политических исследованиях. 2. На какие три основные группы подразделяется совокупность источни ков и н ф о р м а ц и и о политических явлениях и процессах? 3. В чем с п е ц и ф и к а документальных источников информации? Какие ос новные виды документов используются в политическом анализе и прогнози ровании? Охарактеризуйте особенности каждого из них. 4. Дайте сравнительную характеристику контент-анализа и традиционно го метода анализа документов. 5. Назовите основные виды опроса. 6. Охарактеризуйте понятия «генеральная совокупность», «выборочная совокупность», «репрезентативность». Каковы основные методики построе ния выборочной совокупности? 7. Что такое фокус-группа? К а к и м образом в рамках фокус-групповых ис следований решается проблема репрезентативности? 8. Объясните суть использования психологических тестов в рамках фокусгрупп. 9. Дайте сравнительную характеристику качественных и количественных методов опроса. 10. В чем заключается специфика наблюдения как метода сбора данных для политического анализа? Назовите основные виды наблюдения. 11. О п и ш и т е процедуру стандартизованного наблюдения. Литература Боришполец, К. П. Методы политических исследований : учеб. пособие. М , 2005. Мангейм, Дж., Рич, Р. П о л и т о л о г и я : методы исследования. М., 1997. Рабочая книга социолога. М., 2003. Ядов, В. А. Социологическое исследование: методология, программа, ме тоды. Самара, 1995.
Глава 4. Статистические методы в политическом анализе
ГЛАВА 4
Статистические методы в политическом анализе
Статистические методы давно и прочно заняли одну из центральных п о з и ц и й в методическом арсенале политического анализа. Как будет показано, статистика позволяет решать множество разнообразных за дач, обеспечивая исследователя т о ч н ы м и количественными характе р и с т и к а м и различных свойств совокупностей объектов. Причем мно гие из этих к о л и ч е с т в е н н ы х х а р а к т е р и с т и к о т р а ж а ю т с к р ы т ы е , н е я в н ы е свойства и связи, которые невозможно обнаружить «нево оруженным глазом». Статистические методы помогают обрабатывать очень большие массивы данных. В современном мире, п е р е н а с ы щ е н н о м информа ц и е й , это чрезвычайно полезное свойство. И м е н н о статистические подходы лежат в основе большинства методов Data Mining (англ.) — «раскопки данных», поиска практически полезных и нетривиальных сведений в большом объеме сырой и н ф о р м а ц и и . Н и ж е приводятся перечень и краткая характеристика «типовых за дач», которые способна решать статистика в политическом анализе и прогнозировании. 1. Получение усредненных данных. К а к правило, в процессе исследо в а н и я бывает важно не только получить характеристики отдельных объектов, но взглянуть на их совокупность в целом через призму ка кого-то конкретного свойства. Вместо большого числа отдельных по казателей нам требуется одно значение, которое было бы т и п и ч н ы м для всей совокупности объектов. К а к о в о отношение «среднего» рос с и я н и н а к перспективам вступления России в ВТО? Принадлежность к к а к о й социальной или возрастной группе наиболее т и п и ч н а для членов определенной партии? Сколько раз в среднем в месяц студен ты смотрят общественно-политические телепрограммы? Ответы на эти вопросы дает анализ одномерных распределений, в частности
103
подсчет средних величин для разных уровней и з м е р е н и я . Анализ од номерных распределений позволяет заодно установить, насколько ти пичное значение в действительности т и п и ч н о , репрезентативно по отношению к совокупности данных. 2. Оценка связей между переменными. Утверждение о наличии стати стической связи между п е р е м е н н ы м и правомочно в том случае, если изменение значений одной переменной приводит к изменению рас 1 пределения другой . Для порядковых и интервальных переменных по нятие связи более определенно: связанные переменные обладают общностью вариаций. Возрастание значений одной переменной будет соответствовать возрастанию (и тогда связь будет положительной, или прямой) или уменьшению (связь будет отрицательной, или обратной) значений другой переменной. Наличие связи позволяет делать пред положения относительно зависимой переменной на основании ин формации о независимой. В статистическом анализе такие предсказания никогда не будут стопроцентно точными, случаи однозначного соответствия значений переменных практически не встречаются. Речь идет скорее об увели чении шансов получить правильный ответ относительно значений зависимой переменной на о с н о в а н и и значений независимой перемен ной. Например, мы можем объяснить определенную часть всех случа ев (долю вариации) голосования за либеральные политические партии с п о м о щ ь ю независимой п е р е м е н н о й «принадлежность к городскому населению». Статистические методы позволяют ответить на вопрос об интен сивности (плотности, тесноте) связи между п е р е м е н н ы м и . Числен ная о ц е н к а и н т е н с и в н о с т и будет называться коэффициентом связи; для разного типа п е р е м е н н ы х вычисляются разные к о э ф ф и ц и е н т ы , их общее количество в статистике достаточно велико. 3. Классификация. Ряд с т а т и с т и ч е с к и х т е х н и к дает в о з м о ж н о с т ь соотнести исследуемые о б ъ е к т ы с н е с к о л ь к и м и заранее определен н ы м и к л а с с а м и . Н а п р и м е р , м о ж н о выделить класс граждан, участ вующих в выборах, и класс не участвующих в них (абсентеистов). Далее, о п и р а я с ь на ряд х а р а к т е р и с т и к (возраст, уровень образова н и я , п р о ж и в а н и е в городе/на селе и т.д.), исследователь может предсказать с о п р е д е л е н н о й д о л е й вероятности п р и н а д л е ж н о с т ь ре с п о н д е н т о в к одному и л и другому классу. В п р и н ц и п е , задачу клас с и ф и к а ц и и м о ж н о считать ч а с т н ы м случаем задачи обнаружения с в я з и : в н а ш е м п р и м е р е мы устанавливаем связь п е р е м е н н ы х «возСм.: С т а т и с т и к а : у ч е б н и к / П о д ред. И.И. Елисеевой. М., 2006. С. 77.
104
Глава 4. Статистические методы в политическом анализе
раст» ( и н т е р в а л ь н а я ) , «уровень образования» ( п о р я д к о в а я ) , «про ж и в а н и е в городе и л и на селе» ( н о м и н а л ь н а я ) с н о м и н а л ь н о й пере м е н н о й «участие в выборах». 4. Кластеризация. П о д кластеризацией п о н и м а е т с я р а з б и е н и е объектов на группы по критерию их близости в о п р е д е л е н н о м про странстве п р и з н а к о в . Н а п р и м е р , нас интересуют три п р и з н а к а , ха р а к т е р и з у ю щ и е идеологию политических партий: степень поддерж ки действующего политического руководства страны, видение с о ц и а л ь н о й р о л и государства, восприятие западных д е м о к р а т и й в качестве о п т и м а л ь н о й модели политического устройства России. С п о м о щ ь ю определенных статистических процедур мы можем вы я с н и т ь , к а к и е п а р т и и будут б л и з к и друг к другу в пространстве всех этих п р и з н а к о в о д н о в р е м е н н о . Кластеризация отличается от клас с и ф и к а ц и и тем, что в первом случае заранее о п р е д е л е н н ы е классы отсутствуют. 5. Редукция данных. Слово «редукция» означает с о к р а щ е н и е , сжа тие. Р е ш е н и е этой задачи важно в ситуации, когда объекты измерены большим числом переменных и исследователь ищет способ сгруппи ровать их по какому-то смысловому признаку. К примеру, при изуче н и и образов политических лидеров используется большое число при знаков о п и с а н и я (так называемых дескрипторов): интеллектуальные качества, энергичность, опыт, волевые качества, честность, личное обаяние и т.д. Чтобы сделать описание более к о м п а к т н ы м , мы можем объединить отдельные п р и з н а к и в группы, основываясь на выявле н и и скрытых связей между н и м и . Способность статистических тех н и к решать задачи редукции д а н н ы х обусловливает их высокую по лезность в качестве методов Data Mining. Существуют статистические методы, которые п р и с п о с о б л е н ы к р е ш е н и ю к а к о й - т о о д н о й из у к а з а н н ы х задач, а также многофунк ц и о н а л ь н ы е , «многозадачные» т е х н и к и . Н и ж е мы р а с с м о т р и м при м е р ы тех и других. Следует оговориться, что н а ш е и з л о ж е н и е стати с т и ч е с к и х методов не преследует цель з а м е н и т ь о т д е л ь н ы й курс с т а т и с т и к и ( к о т о р ы й с о в е р ш е н н о необходим для с о в р е м е н н о г о по л и т о л о г а ) . Н а ш е й задачей будет, во-первых, п р о д е м о н с т р и р о в а т ь палитру тех в о з м о ж н о с т е й , к о т о р ы е открывает перед п о л и т и ч е с к и м а н а л и т и к о м статистика; во-вторых, дать я с н о е п р е д с т а в л е н и е о п р а к т и ч е с к о м и с п о л ь з о в а н и и ряда наиболее п о л е з н ы х и распро с т р а н е н н ы х техник.
4.1. Анализ одномерных распределений
105
4.1. Анализ одномерных распределений Когда мы г о в о р и м об анализе о д н о м е р н ы х р а с п р е д е л е н и й , то име ем в виду а н а л и з свойств р а с п р е д е л е н и я з н а ч е н и й одной перемен ной. В о п р о с ы , ответы на к о т о р ы е мы находим в п р о ц е с с е одномер ного а н а л и з а , могут звучать п р и м е р н о т а к и м о б р а з о м : к а к о в а поддержка н а с е л е н и е м действующего президента в ц е л о м по стра не? н а с к о л ь к о т и п и ч н а эта у с р е д н е н н а я поддержка, н а с к о л ь к о она отражает п о к а з а т е л и поддержки в р а з л и ч н ы х регионах и л и среди различных с о ц и а л ь н ы х групп? к а к о в о б щ и й размах к о л е б а н и й этой поддержки, в к а к и х пределах о н а варьируется? не отражает ли фор ма р а с п р е д е л е н и я п о д д е р ж к и по с о ц и а л ь н ы м группам н а л и ч и я по л и т и ч е с к о г о р а с к о л а в обществе? Во всех случаях мы и м е е м дело с одной п е р е м е н н о й — «поддержка действующего президента населе нием», — со з н а ч е н и я м и , которая д а н н а я п е р е м е н н а я п р и н и м а е т в отдельных случаях. Наиболее в а ж н ы м и о п е р а ц и я м и в рамках одномерного анализа яв ляются, во-первых, вычисление средней с определением степени разброса д а н н ы х вокруг нее, во-вторых — определение ф о р м ы рас пределения з н а ч е н и й переменной.
Средние величины и меры разброса С р е д н я я в е л и ч и н а я в л я е т с я в б о л ь ш и н с т в е случаев весьма инфор м а т и в н о й м е р о й «центрального п о л о ж е н и я » наблюдаемой перемен ной. О н а п о з в о л я е т о ц е н и в а т ь и с р а в н и в а т ь свойства не отдельных объектов, но групп объектов в целом. Н а п р и м е р , мы п р о в о д и м о п р о с среди студентов о д н о й учебной группы с целью в ы я в и т ь их полити ческую с а м о и д е н т и ф и к а ц и ю в качестве «левых», «либералов», «на ц и о н а л - п а т р и о т о в » и «центристов». Всего о п р а ш и в а е т с я 15 чело век, к а ж д ы й р е с п о н д е н т о т н о с и т с е б я к той или и н о й категории п о л и т и ч е с к и х взглядов. С о о т в е т с т в е н н о , по итогам и с с л е д о в а н и я у нас будет я с н о е представление о п о л и т и ч е с к о й самоидентифика ц и и каждого из студентов курса, т.е. о том, какие з н а ч е н и я прини мает п е р е м е н н а я «политическая с а м о и д е н т и ф и к а ц и я » в каждом из 15 и з у ч е н н ы х случаев. Но почти н а в е р н я к а мы захотим получить и н ф о р м а ц и ю не только о взглядах каждого отдельного студента, но и о том: 1) как распреде лены студенты по категориям политических убеждений в группе в це лом; 2) какова «средняя» политическая самоидентификация группы в целом. И здесь мы вступаем на путь статистических расчетов.
106
Глава 4. Статистические методы в политическом анализе
П е р е м е н н а я «политическая самоидентификация» является номи нальной: мы попросту распределяем совокупность изучаемых объек тов (15 респондентов) по четырем категориям, каждой из которых произвольно присваивается числовой код. Например: 1 — «левые», 2 — «либералы», 3 — «национал-патриоты», 4 — «центристы». Пред положим, по итогам опроса мы получаем следующий ряд значений: ( 2 , 3 , 4 , 4, 1, 1, 1,4, 4 , 2 , 2 , 3 , 3 , 4 , 2). Д л я п р е в р а щ е н и я этих д а н н ы х в осмысленную статистическую картину необходимо прежде всего рассчитать частотное распределе ние — показатель того, сколько раз встречается каждое из значений п е р е м е н н о й . В нашем случае частота з н а ч е н и я 1 («левые») составит 3, з н а ч е н и я 2 («либералы») — 4, з н а ч е н и я 3 («национал-патриоты») — 3, з н а ч е н и я 4 («центристы») — 5. На о с н о в а н и и частотного распре д е л е н и я л е г к о в ы ч и с л и т ь процентное соотношение р е с п о н д е н т о в , п р и н а д л е ж а щ и х к четырем к а т е г о р и я м п о л и т и ч е с к о й самоиденти фикации. Таблица частот для нашего примера будет иметь следующий вид: Категория
Частота
% от всех случаев
1 («левые»)
3
20%
2 («либералы»)
4
26,7%
3 («национал-патриоты»)
3
20%
4 («центристы»)
5
33,3%
Подобного рода д а н н ы е удобно визуализировать, сделать нагляд н ы м и п р и п о м о щ и построения круговой диаграммы или столбчатой гистограммы. Следует подчеркнуть, что визуализация д а н н ы х в ста тистике сама по себе является а н а л и т и ч е с к о й процедурой. Сделав д а н н ы е н а г л я д н ы м и , мы сможем обнаружить скрытые в них законо мерности. Д л я н а ш е г о примера: Круговая диаграмма
Столбчатая гистограмма
4.1. Анализ одномерных распределений
107
Мы выяснили характер распределения студентов по категориям по литических предпочтений в группе, теперь следует определиться со средней величиной. На номинальном уровне измерения средняя вели чина определяется на основе частотного распределения. Это попросту наиболее часто встречающееся значение, именуемое модой (модальным значением). В нашем случае модой является 4; иными словами, в груп пе наиболее распространены центристские убеждения. Имеющееся распределение будет называться унимодальным, так как значение моды всего одно. В ситуации, когда модальных значений несколько, распре деление является мультимодалъным. Наконец, необходимо выяснить, насколько средняя в действитель ности отражает характер распределения, т.е. насколько центристские политические взгляды на самом деле типичны для группы в целом. По казателем типичности средней для числового ряда в статистике являет ся коэффициент вариации. Он показывает, насколько существен раз брос значений вокруг средней. К а к и средние величины, меры вариации различаются на разных уровнях измерения. На н о м и н ал ьн о м у р о в н е и з м е р е н и я м о ж н о использовать л и ш ь один простой показатель — отношение об щего числа немодальных (т.е. не соответствующих моде) значений к общему числу значений. В нашем случае все респонденты немодаль ных категорий («левые» + «либералы» + «национал-патриоты») со ставляют 10; всего же о п р о ш е н о 15 респондентов. Соответственно, о т н о ш е н и е (10:15) составит п р и м е р н о 0,6. Чем ближе значение коэф ф и ц и е н т а к 0, тем лучше мода описывает реальное распределение; чем ближе к 1 — тем менее она репрезентативна. По существу, о п е р а ц и я м и по расчету частотного р а с п р е д е л е н и я , п р о ц е н т н о г о с о о т н о ш е н и я , моды и к о э ф ф и ц и е н т а в а р и а ц и и исчер п ы в а ю т с я все в о з м о ж н ы е в ы ч и с л е н и я на н о м и н а л ь н о м уровне. Столь н е б о л ь ш о е число о п ц и й обусловлено тем, что числа на этом уровне и з м е р е н и я служат не более чем «ярлыками», «опознаватель н ы м и з н а к а м и » категорий п р и з н а к а , не отражая его к а к и е - л и б о со д е р ж а т е л ь н ы е свойства. На п о р я д к о в о м уровне и з м е р е н и я , где присутствует упорядочивание категорий с точки зрения возрастания/убывания ин т е н с и в н о с т и признака, открываются новые статистические возмож ности. О с н о в н о й средней величиной для порядковых переменных явля ется медиана (М). Медиана представляет собой середину ранжирован ного числового ряда: выше и ниже медианы должно быть равное чис ло элементов. Так, для ряда (1, 1, 2, 4, 4, 6, 7, 8, 9) медианой будет 4.
[OS
Глава 4. Статистические методы в политическом анализе
В случае, когда число элементов является четным ( 1 , 1, 2, 4, 4, 6, 7, 8, 9, 9) и возникают к а к бы две середины числового ряда (4 и 6), медиа н о й станет их среднее арифметическое — 5. Распространенным способом измерить разброс значений вокруг средней на порядковом уровне является вычисление квартилей — чет вертей ранжированного ряда. Значение нижнего (первого, Qj) квар тиля показывает середину части числового ряда от его начала до ме д и а н ы , верхнего (третьего, Qj)— середину части от медианы до конца ряда. Второй квартиль совпадает с медианой. Чем больше интервал между н и ж н и м и верхним квартилем, тем больше разброс значений вокруг средней и тем в меньшей степени средняя является репрезен тативной для числового ряда. Разность между верхним и н и ж н и м квартилем называется квартильным рангом и служит мерой вариации для порядковых переменных. Проиллюстрируем о д н о м е р н ы й анализ порядковых переменных следующим примером. Предположим, имеется две группы по 11 рес пондентов в каждой, которые д о л ж н ы дать оценку политической вли ятельности лидера А по шкале от 0 до 10, где 0 — отсутствие влиятель ности, 10 — максимальная влиятельность. Получены также о ц е н к и : Группа
Оценки
1
1, 1,2, 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10
2
3,3,4, 4,5, 5,5,5,6, 6,7
В обеих группах медианы получились одинаковые — 5. Другими словами, политическая влиятельность лидера Л оценена респондента ми обеих групп на о д и н а к о в о м среднем уровне. Но насколько эта усредненная о ц е н к а отражает реальное распределение м н е н и й в каж д о й из групп, насколько едино мнение респондентов в каждой из групп относительно д а н н о й о ц е н к и ? Чтобы выяснить это, рассчитаем квартальные ранги для каждого случая. В первой группе н и ж н и й квартиль равен 2, верхний — 8, квар тальный ранг равен 6 (6 = 8—2). Во второй группе н и ж н и й квартиль составляет 4, верхний — 6, квартальный ранг равен 2 ( 2 = 6—4). М
Qi
Q3
(3-ранг
1
5
2
8
6
2
5
4
6
2
Группа
Глядя на эту статистику, м о ж н о утверждать, что в первой группе средняя 5 является скорее случайным значением, не репрезентатив-
4.1. Анализ одномерных распределений
109
н ы м по о т н о ш е н и ю к общей совокупности м н е н и й : разброс вокруг средней очень велик. Напротив, во второй группе наблюдается в до статочной мере к о н с о л и д и р о в а н н о е м н е н и е , и оценку влиятельности политика А «на среднем уровне» м о ж н о считать действительной оцен кой группы в целом. На и н т е р в а л ь н о м уровне и з м е р е н и я , предполагаю щем не только упорядочение категорий по признаку «больше—мень ше», но и установление ф и к с и р о в а н н о г о интервала измерения, мы способны осуществлять все операции с натуральными числами. На иболее р а с п р о с т р а н е н н о й средней величиной для интервальных вы числений является хорошо знакомое еще со ш к о л ь н о й скамьи среднее арифметическое. Среднее арифметическое представляет собой ре зультат деления суммы всех элементов совокупности на общее их чис ло. Так, для числового ряда ( 1 , 2, 3, 4, 5, 6, 7, 8, 9) среднее арифмети ческое составит 5 (5 = ( 1 + 2 + 3 + 4+ 5 + 6 + 7 + 8 + 9 ) :9). Характерной особенностью среднего арифметического является высокая чувствительность к кренам в распределении, связанным с наличием в совокупности одного и л и нескольких предельных значе ний. Н а п р и м е р , если за партию Хв четырех районах из пяти проголо совало по 2% избирателей, а в одном — 90%, среднее арифметическое составит 19,6% — с о в е р ш е н н о не и н ф о р м а т и в н о е с точки зрения ре альной к а р т и н ы распределения число. Кстати, к т а к и м п р е д е л ь н ы м з н а ч е н и я м с о в е р ш е н н о не чувстви тельна м е д и а н а , что обусловлено с п е ц и ф и к о й п о р я д к о в о г о у р о в н я . Н а п р и м е р , в ряду ( 1 , 2, 3, 4, 5) число 3 является и медианой (боль ше и м е н ь ш е его по два з н а ч е н и я ) , и с р е д н и м а р и ф м е т и ч е с к и м . О д н а к о если мы н а х о д и м с я на п о р я д к о в о м уровне и з м е р е н и я , то имеем право, к примеру, з а м е н и т ь число 5 на число 100. Такая воз м о ж н о с т ь обусловлена тем, что 100 п о - п р е ж н е м у больше е д и н и ц ы , д в о й к и , т р о й к и и четверки, т.е. п о р я д о к чисел с точки з р е н и я отно ш е н и я «больше — меньше» не и з м е н и л с я . В числовом ряду ( 1 , 2, 3, 4, 100) м е д и а н о й остается 3, тогда к а к среднее а р и ф м е т и ч е с к о е ме няется р а д и к а л ь н о — 22. С р е д н е е а р и ф м е т и ч е с к о е чувствительно к а б с о л ю т н ы м з н а ч е н и я м чисел, а м е д и а н а — нет. Соответственно, находясь на п о р я д к о в о м уровне и з м е р е н и я , мы не можем коррект н ы м образом рассчитать среднее а р и ф м е т и ч е с к о е , в то же время расчет м е д и а н ы д л я и н т е р в а л ь н ы х п е р е м е н н ы х может оказаться весьма у м е с т н ы м . Здесь следует подчеркнуть о д н о правило, связанное с использова нием вычислительных процедур на разных уровнях измерения. В бо лее сложных измерениях могут использоваться все вычисления, при-
1ш
Глава 4. Статистические методы в политическом анализе
менимые на более простых уровнях, но не наоборот. Так, на интер вальном уровне м о ж н о рассчитывать и среднее арифметическое, и моду, и медиану; на порядковом — моду и медиану; на номиналь ном — только моду. Т р а д и ц и о н н о й мерой разброса значений вокруг средней на интер вальном уровне выступает стандартное отклонение. Вычисление стандартного отклонения — несколько более и з о щ р е н н а я процедура по с р а в н е н и ю с подсчетом медианы и моды. Она включает следующие стадии: • подсчет разностей между средним значением и всеми имеющи мися з н а ч е н и я м и , как бы определение расстояния (отклонения) от каждой точки числового ряда до его середины. В нашем примере с экстремальным показателем поддержки партии в одном из пяти рай о н о в мы получим четыре одинаковые разности: - 1 7 , 6 (2—19,6) и одно значение 70,4 (90—19,6); • возведение в квадрат каждого из полученных о т к л о н е н и й . Полу 2 2 чаем четыре значения 309,62 (—17,б ) и одно значение 4956,16 (70,4 ); • суммирование всех квадратов отклонений. В нашем случае полу чится 6195,2 (309,62 + 309,62 + 309,62 + 309,62 + 4956,16); • деление суммы квадратов о т к л о н е н и й на общее число элементов с о в о к у п н о с т и м и н у с 1 (N— 1). В н а ш е м случае п о л у ч и м 1548,8 (6195,2: (5-1));
4.1. Анализ одномерных распределений
111
за могут быть поставлены под сомнение. Во-вторых, ф о р м а распреде л е н и я переменной для политического аналитика может представлять интерес сама по себе, независимо от использования того или иного статистического инструментария. Ф о р м а распределения значений пе ременной может отражать содержательные характеристики изучаемо го явления. Большинство статистических методов, работающих с интерваль н ы м и д а н н ы м и (а это основная часть вообще всех статистических ме тодов), исходит из предположения о нормальном распределении значе ний переменной, т.е. большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается. В более точном смысле основное свойство нормального распределения характеризуется тем, что 6 8 % всех наблюдаемых з н а ч е н и й переменной лежит в диапазоне ±1 — стандартное отклонение от среднего, а диапазон ±2 стандартного от к л о н е н и я содержит 9 5 % значений. Если же говорить совсем просто, суть «нормальности» распределения состоит в том, что средние и близкие к средним з н а ч е н и я встречаются чаще, чем крайние (экстре мально большие и экстремально малые). Почему и м е н н о такое распределение называется «нормальным»? Потому что о н о т и п и ч н о для окружающего мира, действительности в целом. К примеру, если мы случайно отберем достаточно большое
• извлечение из полученного частного квадратного к о р н я : 39,35 (Vl548,8). Это очень большое значение стандартного о т к л о н е н и я . Ес ли бы «аномальный» район отдал партии не 90%, а 10% голосов, зна чение стандартного отклонения сократилось бы до 3,57.
количество людей и измерим их рост, логично предположить, что
Таким образом, стандартное отклонение представляет собой сумму квадратов отклонений всех измеренных значений от их среднеарифме тического значения, деленную на количество элементов совокупности, минус 1.
ации смотрелась бы толпа, состоящая в о с н о в н о м из «великанов» и
При о д н о м е р н о м анализе распределений интервальных перемен ных используют и такие показатели, как минимум ( н а и м е н ь ш е е зна чение), максимум (наибольшее значение), размах (разница между ми н и м у м о м и максимумом).
Форма распределения значений переменной О ц е н к а ф о р м ы распределения переменной важна с двух точек з р е н и я . Во-первых, многие статистические методы предъявляют особые тре бования к ф о р м е распределения; если реальное распределение значе н и й п е р е м е н н о й не отвечает д а н н ы м требованиям, результаты анали-
б о л ь ш и н с т в о из них окажутся среднего или близкого к среднему ро ста, а ч и с л о о ч е н ь высоких и людей очень маленького роста будет сравнительно н е б о л ь ш и м . Согласитесь, весьма странно в такой ситу «карликов». Нормальное распределение описывается колоколообразной кривой (колокол Гаусса). В действительности нормальное распределение «в чистом виде» — т.е. полностью соответствующее кривой Гаусса — можно наблюдать довольно редко. Для большинства статистических методов важно, чтобы распределение в целом соответствовало нор мальному. Наиболее р а с п р о с т р а н е н н ы й (хотя и не единственный) способ т е с т и р о в а н и я распределения на нормальность — визуальный анализ диаграммы распределения. Наиболее удобная ее форма — уже у п о м и н а в ш а я с я нами столбчатая гистограмма. На рисунке н и ж е приведена столбчатая гистограмма, показываю щая распределение голосов, поданных за одну из политических пар тий по р е г и о н а м России на федеральных парламентских выборах 2003 г. К р и в а я показывает идеальное нормальное распределение для
112
Глава 4. Статистические методы в политическом анализе
4.2. Анализ связей между неметрическими переменными
113
д а н н о й п е р е м е н н о й . Н е с м о т р я на отсутствие полного соответствия очевидна близость распределения переменной к нормальному.
Такого рода гистограмма строится на основе таблиц распределения частот встречающихся значений переменной в определенных интер валах. Число интервалов в современных статистических программах может быть задано пользователем. Таблица частот в д а н н о м случае бу дет иметь вид: Интервал 0 - 2 %
голосов
Частота
% от всех случаев
3
3,4%
2-4%
8
8,9%
4-6%
14
15,7%.
6-8%
23
25,8%
8-10%
26
29,3%
10-12%
8
8,9%
12-14%
3
3,4% 2,3%
14-16%
2
16-18%
1
1,1%
18-20%
1
1,1%
В то же время ненормальность распределения сама по себе может представлять интерес для исследователя. К примеру, мы имеем следу ющее распределение электоральной поддержки некоторой политиче ской партии по регионам страны:
К а к видно из гистограммы, мы имеем распределение, по сути, об ратное нормальному: преобладают регионы с очень высокой или, на против, очень н и з к о й поддержкой д а н н о й партии, тогда как средние значения я в н о «провисают». Содержательно такую картину мы мо жем интерпретировать как электоральный раскол между регионами страны по критерию поддержки д а н н о й партии. Подобную картину можно было наблюдать, например, при голосовании за партию Х С С в Германии.
4.2. Анализ связей между неметрическими переменными Прежде всего необходимо напомнить, что неметрическими (категори альными) переменными называют переменные, измеряемые на номи нальном уровне. Номинальные переменные — пол, принадлежность к той или иной политической партии, предпочтение определенного кан дидата — соотносят изучаемые объекты с определенным набором непе ресекающихся классов (мужской/женский; член К П Р Ф / член Л Д П Р / член «Единой России» и т.д.; поддерживает кандидата А / кандидата В / кандидата Q. К неметрическим относятся также порядковые перемен ные с небольшим числом категорий. Порядковые переменные ранжи руют объекты по интенсивности определенного признака (например, интенсивность интереса к политике: н и з к а я / средняя / высокая). Анализ связей между п е р е м е н н ы м и предполагает получение отве та на три о с н о в н ы х вопроса: • Существует ли связь между п е р е м е н н ы м и ? • Какова интенсивность (плотность) связи между переменными, если она существует? • Какова направленность (характер) этой связи? 8 - 3863
114
Таблица ожидаемых частот для нашего примера выглядит следую
Таблицы сопряженности
щим образом:
Наиболее простым и распространенным способом выявления связи между категориальными п е р е м е н н ы м и является построение таблиц сопряженности, которые показывают, сколько случаев относится од н о в р е м е н н о и к определенной категории переменной А, и к опреде л е н н о й категории переменной В. П р е д п о л о ж и м , имеется две н о м и н а л ь н ы е п е р е м е н н ы е : 1) пол ре с п о н д е н т а с категориями «мужской» и «женский»; 2) политические п р е д п о ч т е н и я респондента с категориями «поддержка кандидата в п р е з и д е н т ы А» и «поддержка кандидата в президенты В» («выбор кандидата»). Всего о п р о ш е н о 54 респондента, мужчин и ж е н щ и н среди них поровну (по 27). К а н д и д а т у р отдали предпочтение 24 ре спондента, кандидату В — 30. Возникает вопрос: существует ли связь между половой принадлежностью р е с п о н д е н т о в и их выбором меж ду кандидатом А и кандидатом В? Чтобы ответить на него, построим матрицу с о п р я ж е н н о с т и п е р е м е н н ы х «пол» и «выбор кандидата» (этот прием называется кросстабуляцией). В ней будет четыре кате гории частот:
Пол мужской
Пол женский
Всего
Кандидат А
12
12
24
Кандидат В
15
15
30
27
27
54
Всего
Как видим, среди поддерживающих кандидата А частота значений «мужской пол»
выше о ж и д а е м о й , а частота з н а ч е н и й
«женский
пол» — ниже. Д л я кандидата В ситуация обратная. Полезно вычис лить точные отклонения между наблюдаемыми и ожидаемыми часто тами, вычтя вторые из первых. Полученные разности будут называть ся остатками. Таблица остатков в н а ш е м примере будет иметь вид: Пол мужской
Пол ж е н с к и й
Кандидат А
7
-7
Кандидат В
-1
7
Еще один способ сделать наше п о н и м а н и е связи между перемен ными более глубоким — д о п о л н и т ь абсолютные частоты процентны
1) мужчины, поддерживающие кандидата А; 2) мужчины, поддерживающие кандидата В; 3) ж е н щ и н ы , поддерживающие кандидата А; 4) ж е н щ и н ы , поддерживающие кандидата В.
ми о т н о ш е н и я м и :
Пол мужской
Пол женский
Всего
19
5
24
Кандидат В
8
22
30
27
27
54
Даже беглого взгляда на матрицу сопряженности достаточно, что бы убедиться в наличии связи. Так, среди поддерживающих кандида та А я в н о д о м и н и р у ю т мужчины (18 мужчин из 23 случаев), электорат же кандидата В представлен в о с н о в н о м ж е н щ и н а м и (21 ж е н щ и н а из 29 случаев). В рамках анализа таблиц сопряженности мы располагаем рядом способов сделать п о н и м а н и е связи более глубоким. Первый из них позволяет вычислить о т н о ш е н и я между (1) реально наблюдаемыми частотами и (2) частотами, которые мы ожидали бы увидеть в том слу чае, если бы связи не существовало. П р и отсутствии связи между пе р е м е н н ы м и «пол» и «выбор кандидата» логично ожидать равного вы бора кандидата А и кандидата В для каждого пола.
Кандидат А
Пол женский
19
5
24
% от «кандидат»
79,2%
20,8%
100%
% от «пол»
70,4%
18,5%
44,4%
% от «всего»
35,2%
9,3%
44,4%
8
22
30
Частота Кандидат В
% от «кандидат»
26,7%
73,3%
100%
% от «пол»
29,6%
81,5%
55,6%
% от «всего»
14,8%
40,7%
55,6%
27
27
54
% от «кандидат»
50%
50%
100%
% от «пол»
100%
100%
100%
% от «всего»
50%
50%
100%
Частота Всего
Всего
Пол мужской Частота
Кандидат А Всего
1 15
4.2. Анализ связей между неметрическими п е р е м е н н ы м и
Глава 4. Статистические методы в политическом анализе
Из п р и в е д е н н о й таблицы следует, в частности, что кандидата А поддерживают 19 из 27, или 70%, о п р о ш е н н ы х мужчин. Этого же кан дидата поддерживает 5 из 27, или 18%, опрошенных ж е н щ и н . Доля мужчин в совокупном электорате кандидата А составляет 79%, доля ж е н щ и н — 2 1 % . Среди всех о п р о ш е н н ы х доля мужчин, поддержива8'
116
Глава 4. Статистические методы в политическом анализе
ющих кандидата А, составляет 35%, ж е н щ и н — 9%. Аналогичным об разом оценивается и распределение мужской и ж е н с к о й поддержки для кандидата В. Наиболее показательными с точки з р е н и я оценки связи между пе р е м е н н ы м и являются доли мужчин и ж е н щ и н среди поддерживаю щих кандидата А и В соответственно (в таблице эти з н а ч е н и я выделе ны ж и р н ы м шрифтом). По этим значениям можно построить наглядную столбчатую гистограмму:
Полученные результаты позволяют сделать вывод не только о на л и ч и и связи, но и о ее характере: мужчины склонны в большей степе н и , чем ж е н щ и н ы , поддерживать кандидата А; ж е н щ и н ы , напротив, в своем большинстве отдают предпочтение кандидату В.
Меры связи категориальных переменных С п о м о щ ь ю таблиц сопряженности мы получили наглядное представ ление о сочетаниях категорий переменных и сделали обоснованное предположение о наличии и характере связи между н и м и . Однако нельзя ли дополнительно получить некую единую числовую «меру уверенности» в том, что связь действительно существует и является значимой? Кроме того, нет ли возможности выявить числовую меру и н т е н с и в н о с т и (плотности) этой связи? Во многих случаях — особен но если требуется сопоставить связи между различными переменны ми — единый числовой к о э ф ф и ц и е н т удобнее, нежели о б ш и р н а я ста тистика таблиц сопряженности. Действительно, статистические инструменты позволяют получить ответы на оба вопроса. Существует несколько к о э ф ф и ц и е н т о в связи между категориальными п е р е м е н н ы м и . Идея, лежащая в основе вычисления к о э ф ф и ц и е н т а х и 2 к в а д р а т ( х ) , уже была нами затронута при рассмотрении матриц
4.2. Анализ связей между неметрическими переменными
117
сопряженности. Хи-квадрат оценивает значимость различий между ожидаемыми и наблюдаемыми частотами. Если наблюдаемые значе н и я совпадают с ожидаемыми, п е р е м е н н ы е считаются в з а и м н о неза в и с и м ы м и . Оценивая степень взаимной независимости переменных, хи-квадрат косвенно устанавливает их зависимость. Хи-квадрат можно рассчитывать разными путями: чаще всего ис пользуются формула Пирсона и метод максимального правдоподобия. Формула П и р с о н а имеет следующий вид:
где Уд — наблюдаемое з н а ч е н и е , ^ — ожидаемое значение. В нашем случае хи-квадрат по формуле Пирсона равен 14,7. Мно го это или мало? Чтобы разобраться в этом, следует сначала познако миться с двумя важными статистическими понятиями: степень свобо ды и уровень статистической значимости. Степень свободы (обозначается df— от англ. degrees of freedom) — это количество ячеек таблицы, которые могут быть заполнены числа ми, прежде чем содержание всех остальных ячеек станет постоян 1 ным . Степень свободы вычисляется по формуле:
где г — количество категорий п е р е м е н н о й в строке, с — количество категорий переменной в столбце. Д л я н а ш е г о п р и м е р а с п е р е м е н н ы м и «пол» и «выбор к а н д и д а та» df= (2 — 1) (2 - 1) = 1 х 1 = 1. Д р у г и м и с л о в а м и , в ы я с н и в , что ч и с л о м у ж ч и н , п о д д е р ж а в ш и х к а н д и д а т а А, составляет 19, мы тем с а м ы м п р е д о п р е д е л я е м з н а ч е н и я во всех остальных я ч е й к а х таб лицы. Статистическая значимость результата (/^-уровень) представляет собой меру уверенности в том, что результат не является случайным, т.е. результат репрезентативен для более широкой выборки. Три ос новных з н а ч е н и я р-уровня, используемых в статистике, — 0,05, 0,01 и 0,001. Если выявленная статистическая связь надежна на уровне 0,05 (5%), имеется не более чем 5%-ная вероятность того, что найденная связь носит случайный характер и не проявится в генеральной сово купности. На /7-уровне 0,01 вероятность случайности результата сни жается до 1 % и т.д. 1
См.: Мангейм, Дж.,
Рич,
Р.
Политология :
методы исследования. С. 422.
118
Глава 4. Статистические методы в политическом анализе
И н т е р п р е т а ц и я к о э ф ф и ц и е н т а хи-квадрат производится на р а з л и ч н ы х / ь у р о в н я х с учетом с т е п е н и с в о б о д ы . И м е е т с я специ альная т а б л и ц а р а с п р е д е л е н и я у } , ф р а г м е н т к о т о р о й п р и в о д и т с я 1 ниже .
4.2. Анализ связей между неметрическими п е р е м е н н ы м и
Схематично для нашего примера это выглядит так: Пол мужской Кандидат А Кандидат В
df
0,05
0,01
1
3,841
6,635
10,827
2
5,991
9,210
13,815 16,266
Пол женский
1 9 ( а ) ~ ^ _ ^ ^ 5 ( 6 ) ~ - * - 2 2 (d)
0,001
3
7,815
11,345
4
9,488
13,277
18,467
5
11,070
15,086
20,515
Н а п о м н и м , что д л я случая с п е р е м е н н ы м и «пол» и «выбор кан дидата» н а м и был получен к о э ф ф и ц и е н т 14,7. С т е п е н ь свободы со ставляет 1. Ч т о б ы быть статистически з н а ч и м ы м на о п р е д е л е н н о м / ь у р о в н е , хи-квадрат д о л ж е н п р е в ы ш а т ь з н а ч е н и е , у к а з а н н о е в таблице для д а н н о г о />-уровня п р и соответствующей с т е п е н и сво боды. В н а ш е м п р и м е р е п о л у ч е н н ы й результат з н а ч и м и на уровне 0,05 (14,7>3,841), и на уровне 0,01 (14,7>6,635), и на уровне 0,001 (14,7>10,827). Т а к и м о б р а з о м , мы м о ж е м быть уверены относи тельно с т а т и с т и ч е с к о й н а д е ж н о с т и п о л у ч е н н о г о результата. Суще ствует не более о д н о г о ш а н с а из т ы с я ч и , что с в я з ь между п о л о м ре спондентов и поддержкой одного из кандидатов явится о с о б е н н о с т ь ю и с к л ю ч и т е л ь н о о д н о й и з у ч е н н о й в ы б о р к и и не будет ф и к с и р о в а т ь с я вне ее. Однако мы еще не получили прямого ответа на вопрос о степени интенсивности связи между переменными. Это м о ж н о сделать, рас считав н е с к о л ь к о с п е ц и а л ь н ы х к о э ф ф и ц и е н т о в п л о т н о с т и связи между категориальными переменными, наиболее простым из кото рых является к о э ф ф и ц и е н т а с с о ц и а ц и и . О н определяет от н о ш е н и е разности произведений диагональных ячеек матрицы со пряженности к их сумме:
1
119
Ц е л и к о м эта т а б л и ц а п р и в о д и т с я во многих математических и статистических с п р а в о ч н и к а х . С м . т а к ж е : Мангейм, Дж., Рич, Р. П о л и т о л о г и я : методы и с с л е д о в а н и я С. 519.
К о э ф ф и ц и е н т а с с о ц и а ц и и в н а ш е м случае равен 0,79. Для боль шинства статистических к о э ф ф и ц и е н т о в , отражающих плотность связи, близость к единице (иногда к ± 1 ) отражает высокую степень связи переменных, близость к 0 — слабую связь или ее отсутствие. Для к о э ф ф и ц и е н т а а с с о ц и а ц и и статистически показательным является значение, п р е в ы ш а ю щ е е 0,5. Чтобы лучше п о н я т ь логику этих вычислений, рассмотрим расчет к о э ф ф и ц и е н т а а с с о ц и а ц и и для ожидаемых значений, при которых связь отсутствует. Вернемся к таблице сопряженности, где указаны ожидаемые з н а ч е н и я сопряженности переменных «пол» и «выбор кандидата»:
Несложные в ы ч и с л е н и я покажут, что отношение разности произ ведений диагональных ячеек и их суммы составит 0/360 = 0. Существенное ограничение использования к о э ф ф и ц и е н т а ассо ц и а ц и и состоит в том, что обе изучаемые переменные должны быть н о м и н а л ь н ы м и и дихотомическими (альтернативными), т.е. изме ряться всего двумя в з а и м о и с к л ю ч а ю щ и м и категориями, охватываю щ и м и все пространство универсума. Типичной номинальной дихото мической п е р е м е н н о й является «пол»: две категории «мужской» и «женский» охватывают все возможные состояния признака. Несколько и н о й подход к расчету связи неметрических перемен ных используется п р и вычислении к о э ф ф и ц и е н т а л я м б д а . Прежде всего п о с м о т р и м на изучаемые п е р е м е н н ы е «пол» и «вы бор кандидата» через призму о т н о ш е н и й в л и я н и я . З а в и с и м о й пере м е н н о й будет «выбор кандидата», н е з а в и с и м о й — «пол респонден та». Л я м б д а п о з в о л и т п о н я т ь , н а с к о л ь к о хорошо мы с п о с о б н ы предсказать з н а ч е н и я з а в и с и м о й п е р е м е н н о й , используя з н а ч е н и я н е з а в и с и м о й . Д л я этого сначала следует рассмотреть н а ш и ш а н с ы предсказать з н а ч е н и е з а в и с и м о й п е р е м е н н о й без о б р а щ е н и я к неза висимой.
120
4.2. Анализ связей между неметрическими п е р е м е н н ы м и
Глава 4. Статистические методы в политическом анализе
В нашем примере кандидата А поддерживают 24 человека, или 44,4% всех респондентов, без различения пола. Кандидата В поддер живают 30 человек, или 55,6% респондентов. Если нам придется уга дывать выбор кандидата в каждом отдельном случае, логично называть более часто встречающееся значение, т.е. «кандидат В». В результате мы окажемся правы в 55,6% случаях и не правы в 44,4%. Следующий вопрос состоит в том, сможем ли мы повысить вероят ность правильного определения выбора респондентов, если будем учитывать их половую принадлежность. Обратимся еще раз к таблице с о п р я ж е н н о с т и , которую построили ранее:
121
в соответствии со степенью выраженности признака (больше — мень ш е ) , и это дает новые возможности для оценки связи. О с н о в н ы м и мерами связи неметрических порядковых перемен ных являются гамма (у), d Сомера и Тау-б (Ть Кендалла). Вычисление каждого из этих критериев основано на одном общем п р и н ц и п е : под счете количества «инверсий», или «нарушений порядка». Так, отно ш е н и е инверсии возникает в том случае, когда переменные ранжиру ются в п р о т и в о п о л о ж н о м порядке: возрастанию з н а ч е н и й одной переменной соответствует уменьшение значений другой. Напротив, соответствием считается однонаправленная вариация переменных: увеличение з н а ч е н и й одной переменной сопровождается увеличени ем значений другой.
Пол мужской
Пол ж е н с к и й
Всего
Кандидат А
19
5
24
Наиболее простым к о э ф ф и ц и е н т о м связи порядковых перемен
Кандидат В
8
22
30
ных является гамма, представляющая собой отношение разности со
27
27
54
ответствий и инверсий к их сумме:
Всего
Д л я респондентов-мужчин логично сделать предположение о под держке кандидата А: в этом случае мы угадаем верное значение 19 раз и не угадаем 8 раз. Относительно ж е н щ и н будет уместна гипотеза о выбо ре кандидата В — она подтвердится в 22 случаях и не подтвердится в 5 случаях. В общей сложности мы будем правы 41 раз (41 = 19 + 22; 75,9% от всех случаев) и не правы 13 раз (13 = 8 + 5; 24,1% от всех случаев). Теперь сопоставим точность наших прогнозов без учета независи м о й п е р е м е н н о й и с учетом таковой: Верно
Ошибка
Б е з учета пола
30 (55,6%)
24 (44,4%)
С учетом пола
41 (75,9%)
13(24,1%)
Н е в о о р у ж е н н ы м глазом видно, что н а ш и предсказания во втором случае стали существенно точнее: доля о ш и б к и с н и з и л а с ь с 44,4% до 24,1%. Собственно говоря, к о э ф ф и ц и е н т лямбда как раз и дает нам точную меру с о к р а щ е н и я о ш и б о к (улучшения качества прогноза) при и с п о л ь з о в а н и и независимой переменной. Д л я вычисления меры связи категориальных переменных исполь зуются также коэффициент контингенции, коэффициенты взаимной со пряженности Пирсона и Чупрова. Способы их расчета м о ж н о найти в большинстве учебников по статистике. Д л я переменных, измеренных на порядковом уровне, м о ж н о ис пользовать как охарактеризованные выше техники (таблицы сопря ж е н н о с т и , хи-квадрат, лямбду), так и совершенно и н ы е . Н а п о м н и м , что з н а ч е н и я переменных порядкового уровня выстраивают объекты
где
р— частота соответствий вариации двух переменных, /— частота
инверсий. К о э ф ф и ц и е н т может принимать значение от 1 до - 1 . Модульное значение к о э ф ф и ц и е н т а показывает интенсивность связи: чем ближе оно к 1, тем связь плотнее. При у = 0 связь отсутствует. Знак «—» или «+» (последний не записывается) указывает на направление связи. От рицательные значения у свидетельствуют об обратной (отрицательной) связи, положительные — о прямой. В таблице ниже приведены приме ры вариации порядковых переменных, когда: (а) у = 1 и (б) у = - 1 . (б) У = - 1 (а)у= 1 А 1 1 1 2 2 2 3 3 3 4 4 4
В 3
А 1
D 8
3 4 4 5 5 6 6 7 7 8 8
1 1
8 7 7 6 6 5 5 4 4 3 3
2 2 2 3 3 3 4 4 4
122
Из таблицы хорошо видно, что гамма (как и другие меры связи по рядковых переменных) фиксирует соответствия и инверсии именно рангов переменных, а не их значений. Так, в левом столбце при у = 1 абсолютные з н а ч е н и я переменных не совпадают ни разу.
4.3. Корреляционный анализ К о р р е л я ц и о н н ы й анализ является одним из наиболее ш и р о к о ис пользуемых статистических методов, в частности и в рамках полити ческой науки. П р и своей относительной простоте он может быть весь ма п олезен к а к д л я т е с т и р о в а н и я и м е ю щ и х с я гипотез, так и в поисковом исследовании, когда предположения о связях и взаимоза висимостях только формируются. Умение работать с д а н н о й статис тической техникой важно и в силу того, что она используется как со ставная часть более сложных, комплексных методов, в том числе фа кт о рно г о анализа, некоторых версий кластер-анализа и др. Целью корреляционного анализа является измерение стати стической взаимозависимости между двумя или более переменными. В слу чае, если исследуется связь двух переменных, корреляционный анализ будет парным; если число переменных более двух — множественным. Следует подчеркнуть, что переменные в корреляционном анализе как бы «равноправны» — они не делятся на зависимые и независимые (объ ясняемые и объясняющие). Мы рассматриваем именно взаимозависи мость (взаимосвязь) переменных, а не влияние одной из них на другую. Понятие «корреляционный анализ» фактически объединяет несколь ко методов анализа статистической связи. В фокусе нашего внимания будет находиться наиболее распространенный из них — метод Пирсона 1 (Pearson) . Его применение ограничено следующими условиями: •переменные должны быть измерены, к а к м и н и м у м , на интер вальном уровне; • связь между переменными должна носить л и н е й н ы й характер, т.е. фиксироваться прямой л и н и е й . При наличии н е л и н е й н о й связи к о р р е л я ц и о н н ы й анализ Пирсона, скорее всего, не даст ее адекватно го отображения; 1
К о э ф ф и ц и е н т Пирсона вычисляется по следующей формуле:
где Xj и у/ — значения двух переменных, х и у — их средние значения, sx и sy — их стан дартные отклонения; п — количество пар значений.
123
4.3. Корреляционный анализ
Глава 4. Статистические методы в политическом анализе
•анализируемые переменные д о л ж н ы быть распределены нор мально (или, во всяком случае, приближаться к нормальному распре делению). К о р р е л я ц и о н н ы й анализ фиксирует две характеристики статисти ческой взаимосвязи между п е р е м е н н ы м и : • направленность связи. Как уже говорилось, по направленности связь бывает прямая (положительная) и обратная (отрицательная); • интенсивность (плотность, теснота) связи. Эта характеристика определяет н а ш и возможности по предсказанию значений одной пе ременной на о с н о в а н и и значений другой. Чтобы более наглядно представить себе особенности корреляцион ного анализа, обратимся к примеру из сферы исследования электо ральных процессов. Предположим, мы проводим сравнительный ана лиз электората двух политических партий либеральной ориентации — Союза правых сил и «Яблока». Н а ш а задача — понять, существует ли общность электората С П С и «Яблока» в территориальном разрезе и насколько она значима. Д л я этого мы можем, например, взять данные электоральной статистики, характеризующие уровень поддержки этих партий, в разрезе данных избирательных комиссий субъектов Федера ции. Проще говоря, мы смотрим на проценты, полученные С П С и «Яблоком» по регионам России. Н и ж е приводятся данные по выборам депутатов Государственной думы 1999 г. (количество регионов 88, по 1 скольку выборы в Чеченской Республике не проводились) . Случай Республика Адыгея Республика Алтай Республика Башкортостан Республика Бурятия Республика Дагестан Республика Ингушетия Кабардино-Балкарская Республика Республика К а л м ы к и я Карачаево-Черкесская Республика Республика Карелия Республика К о м и Республика М а р и й Эл И т.д. (всего 88 случаев) 1
Переменные (%) СПС 3,92 5,40 3,38
«Яблоко» 4,63 3,95 3,14
6,04
0,39 2,89 1,38 3,07
1,22 0,38
4,17 9,66 8,91 4,68
8,36
1,30 3,80 2,94 10,25 9,95 7.24
Здесь и далее результаты выборов взяты из (или рассчитаны на основе) официаль ных данных Ц И К РФ или ее территориальных подразделений.
(24
Глава 4. Статистические методы в политическом анализе
Таким о б р а з о м , у н а с есть две п е р е м е н н ы е — «поддержка С П С в 1999 г.» и «поддержка " Я б л о к а " в 1999 г.», п р о с т е й ш и м образом о п е р а ц и о н а л и з и р о в а н н ы е через п р о ц е н т голосов, п о д а н н ы х за эти п а р т и и , от числа и з б и р а т е л е й , п р и н я в ш и х участие в г о л о с о в а н и и на ф е д е р а л ь н ы х п а р л а м е н т с к и х выборах 1999 г. В качестве случаев выступают с о о т в е т с т в у ю щ и е д а н н ы е , о б о б щ е н н ы е на уровне реги онов РФ. Далее, в н а ш е м р а с п о р я ж е н и и есть методический п р и е м , кото р ы й является о д н и м из о с н о в н ы х в статистике, — геометрическое представление. Геометрическим представлением н а з ы в а ю т представ л е н и е случая как т о ч к и в условном пространстве, ф о р м и р у е м о м «осями» — п е р е м е н н ы м и . В н а ш е м примере мы м о ж е м представить каждый регион к а к точку в двухмерном пространстве г о л о с о в а н и й за правые п а р т и и . Ось X формирует п р и з н а к «поддержка С П С » , ось Y— «поддержка " Я б л о к а " » (или наоборот; для к о р р е л я ц и о н н о г о анализа это н е в а ж н о в силу н е р а з л и ч е н и я зависимых и н е з а в и с и м ы х п е р е м е н н ы х ) . «Координатами» региона будут: по оси X — з н а ч е н и е п е р е м е н н о й «поддержка С П С » (процент, н а б р а н н ы й в регионе дан н о й п а р т и е й ) ; по оси Y— значение п е р е м е н н о й «поддержка "Ябло к а " » . Так, Республика Адыгея будет иметь координаты (3,92; 4,63), Р е с п у б л и к а Алтай — (3,38; 5,4) и т.д. Осуществив геометрическое представление всех случаев, мы получаем диаграмму рассеяния, или корреляционное поле. Д а ж е сугубо в и з у а л ь н ы й а н а л и з д и а г р а м м ы р а с с е я н и я н а в о д и т н а м ы с л ь , что с о в о к у п н о с т ь т о ч е к м о ж н о р а с п о л о ж и т ь вдоль неко т о р о й у с л о в н о й п р я м о й , н а з ы в а е м о й линией регрессии. М а т е м а т и -
4.3. К о р р е л я ц и о н н ы й анализ
125
ч е с к и л и н и я р е г р е с с и и с т р о и т с я методом н а и м е н ь ш и х квадратов ( в ы с ч и т ы в а е т с я такое п о л о ж е н и е л и н и и , при к о т о р о м сумма квад ратов р а с с т о я н и й от н а б л ю д а е м ы х т о ч е к до п р я м о й я в л я е т с я мини мальной). И н т е н с и в н о с т ь связи будет зависеть от того, н а с к о л ь к о т е с н о точки (случаи) р а с п о л о ж е н ы вдоль л и н и и регрессии. В коэффициен те корреляции (обозначается г), к о т о р ы й и является ч и с л о в ы м ре зультатом к о р р е л я ц и о н н о г о анализа, плотность колеблется от 0 до 1. П р и этом чем ближе з н а ч е н и е к о э ф ф и ц и е н т а к 1, тем п л о т н е е с в я з ь ; чем б л и ж е з н а ч е н и е к 0, тем с в я з ь слабее. Так, п р и г = 1 с в я з ь п р и о б р е т а е т характер ф у н к ц и о н а л ь н о й — все т очки «ложатся» на одну п р я м у ю . П р и г = 0, ф и к с и р у ю щ е м п о л н о е отсутствие с в я з и , п о с т р о е н и е л и н и и регрессии с т а н о в и т с я н е в о з м о ж н ы м . В н а ш е м п р и м е р е г = 0,62, что свидетельствует о н а л и ч и и з н а ч и м о й статис т и ч е с к о й с в я з и ( п о д р о б н е е об и н т е р п р е т а ц и и к о э ф ф и ц и е н т а кор реляции см. ниже). Тип связи определяется н а к л о н о м л и н и и регрессии. В коэффици енте к о р р е л я ц и и существует всего два значения типа связи: обратная (знак «-») и п р я м а я (отсутствие знака, так как знак «+» традиционно не записывается). В нашем примере связь прямая. Соответственно, итоговый результат анализа 0,62. Сегодня к о э ф ф и ц и е н т корреляции Пирсона можно легко подсчи тать с п о м о щ ь ю всех компьютерных пакетов программ статистическо го анализа (SPSS, Statistica, N C S S и др.) и даже в ш и р о к о распростра н е н н о й программе Excel (надстройка «анализ данных»). Настоятельно рекомендуем пользоваться профессиональными пакетами, так как они позволяют визуально оценить корреляционное поле. Почему важна визуальная о ц е н к а геометрического представления данных? Во-первых, мы д о л ж н ы убедиться, что связь л и н е й н а по форме, а здесь самый простой и э ф ф е к т и в н ы й метод — и м е н н о зри тельная о ц е н к а . Н а п о м н и м , что в случае я р к о выраженной нелиней ности связи вычисление к о э ф ф и ц и е н т а корреляции окажется беспо л е з н ы м . Во-вторых, визуальная о ц е н к а позволяет найти в данных выбросы, т.е. н е т и п и ч н ы е , резко выделяющиеся случаи. Вернемся к н а ш е м у п р и м е р у с двумя п а р т и я м и . Внимательно глядя на д и а г р а м м у р а с с е я н и я , мы замечаем по м е н ь ш е й мере один н е т и п и ч н ы й случай, л е ж а щ и й я в н о в стороне от «общей магистра ли», т е н д е н ц и и связи п е р е м е н н ы х . Это точка, представляющая дан ные по С а м а р с к о й области. Хотя и в меньшей с т е п е н и , но тоже н е т и п и ч н о п о л о ж е н и е Т о м с к о й , Н и ж е г о р о д с к о й областей и СанктПетербурга.
126
М о ж н о скорректировать данные анализа, удалив с и л ь н о отклоня ющиеся наблюдения, т.е. произведя «чистку выбросов». В силу специ ф и к и вычисления л и н и и регрессии, связанной с подсчетом суммы квадратов расстояний, даже е д и н и ч н ы й выброс может существенно исказить общую картину.
127
4.3. К о р р е л я ц и о н н ы й анализ
Глава 4. Статистические методы в политическом анализе
на массиве данных, взятых в территориальном разрезе. Логично пред положить, что в основе этой связи лежит н е к и й фактор или комплекс факторов, который мы пока непосредственно не учитывали. Исследуя данные электоральной статистики разного уровня, нетрудно заме тить, что обе партии демонстрируют лучшие результаты в городах и худшие — в сельских районах. Мы можем выдвинуть гипотезу, что од ним из факторов, опосредующих связь между переменными, является уровень урбанизации территорий. Этот п р и з н а к проще всего операционализировать через переменную «доля сельского населения» или 1 «доля городского населения» . Такая статистика существует по каждо му субъекту Федерации. Теперь в наших исходных данных появляется третья переменная — 2 пусть это будет «доля сельского населения» . П е р е м е н н ы е (%)
Случай «Яблоко»
СПС
Сел. нас.
Республика Адыгея
4,63
3,92
46
Р е с п у б л и к а Алтай
3,38
5,40
76
Республика Б а ш к о р т о с т а н
3,95
6,04
36
И т.д. (всего 88 случаев)
Удалив только один из 88 случаев — Самарскую область, — мы по лучим значение к о э ф ф и ц и е н т а корреляции, отличное от полученно го ранее: 0,73 по сравнению с 0,62. Плотность связи усилилась более чем на 0,1 — это весьма и весьма существенно. И з б а в и в ш и с ь о т т о ч е к , соответствующих Санкт-Петербургу, Томской и Нижегородской об ластям, получим еще более высокую плотность: 0,77. Впрочем, чисткой выбросов не следует увлекаться: с о к р а щ а я ко личество случаев, мы понижаем общий уровень статистического до верия к полученным результатам. К сожалению, о б щ е п р и н я т ы х кри териев определения выбросов не существует, и здесь многое зависит от добросовестности исследователя. Лучший способ — содержательно понять, с чем связано наличие «выброса». Так, в н а ш е м примере не т и п и ч н о е положение Самарской области в п р и з н а к о в о м простран стве связано с тем, что в 1999 г. одним из активных лидеров правых был глава региона К. Титов. Соответственно, в ы с о к и й результат С П С в регионе был обусловлен не только поддержкой партии как таковой, но и поддержкой губернатора. Возвратимся к нашему исследованию. Мы в ы я с н и л и , что голосо вание за С П С и «Яблоко» довольно плотно коррелирует между собой
Чисто технически мы можем вычислять каждый парный коэффици ент корреляции отдельно, но удобнее сразу получить матрицу интер корреляций (матрицу парных корреляций).
Матрица обладает диаго
нальной симметрией. В нашем случае она будет выглядеть следующим образом: СПС СПС
1
«Яблоко»
Сел. нас.
0,62
-0,61
«Яблоко»
0,62
1
-0,55
Гор. н а с .
-0,61
-0,55
1
Мы получили статистически з н а ч и м ы е к о э ф ф и ц и е н т ы корреля ц и и , подтверждающие выдвинутую нами гипотезу. Так, доля город1
О б ъ е к т и в н о гораздо точнее будут результаты, полученные с п о м о щ ь ю более ди
в е р с и ф и ц и р о в а н н ы х статистических д а н н ы х . Так, п о л е з н о выделить в отдельную груп пу п о с е л к и г о р о д с к о г о т и п а , жители которых ф о р м а л ь н о п р и н а д л е ж а т к городскому на с е л е н и ю , а на деле зачастую д е м о н с т р и р у ю т э л е к т о р а л ь н о е поведение, свойственное ж и т е л я м сельских т е р р и т о р и й . 2
П о д а н н ы м В с е р о с с и й с к о й п е р е п и с и н а с е л е н и я 1989 г.
128
Глава 4. Статистические методы в политическом анализе
ского населения оказалась отрицательно связанной к а к с поддерж ! кой С П С (г= - 0 , 6 1 ) , так и с поддержкой «Яблока» (г= - 0 , 5 5 ) . Мож но заметить, что переменная «поддержка С П С » более чувствительна к фактору урбанизации по срав не ни ю с переменной «поддержка "Яблока"».
4.3. К о р р е л я ц и о н н ы й анализ
129
избирателей к городскому или сельскому населению влияет на их электоральный выбор, а н и к а к не наоборот.
Интерпретация интенсивности связи Мы подошли к проблеме интерпретации интенсивности связи на ос нове значения к о э ф ф и ц и е н т а корреляции Пирсона. Определенного жесткого правила здесь не существует; скорее речь идет о совокупном опыте, н а к о п л е н н о м в процессе статистических исследований. Тра д и ц и о н н о й можно считать следующую схему интерпретации данного коэффициента: Значение
«Яблоко» В этом примере мы уже начинаем мыслить в категориях в л и я н и я одной п е р е м е н н о й на другую. Строго говоря, и это отмечено выше, к о р р е л я ц и о н н ы й анализ не различает зависимых и независимых пе ременных, фиксируя л и ш ь их взаимную статистическую связь. В то же время содержательно мы п о н и м а е м , что и м е н н о принадлежность Следует отметить, что после чистки выбросов (см. диаграммы рассеяния) связь бы ла бы еще плотнее. Так, после удаления двух выбросов (Самарская область и Усть-Ордын с к и й Бурятский АО) плотность к о э ф ф и ц и е н т а для С П С увеличивается до - 0 , 6 5 .
Интерпретация
Д о 0,2
О ч е н ь слабая к о р р е л я ц и я
Д о 0,5
Слабая корреляция
Д о 0,7
Средняя корреляция
Д о 0,9
Высокая корреляция
С в ы ш е 0,9
Очень высокая корреляция
Необходимо отметить, что п о д о б н ы й вариант и н т е р п р е т а ц и и п л о т н о с т и к о э ф ф и ц и е н т а к о р р е л я ц и и п р и м е н и м в науках, в гораз до б о л ь ш е й с т е п е н и о п и р а ю щ и х с я на к о л и ч е с т в е н н ы е д а н н ы е , не ж е л и наука п о л и т и ч е с к а я ( н а п р и м е р , в э к о н о м и к е ) . В эмпиричес ких и с с л е д о в а н и я х п о л и т и к и д о в о л ь н о редко м о ж н о обнаружить г > 0,7; к о э ф ф и ц и е н т же со з н а ч е н и е м 0,9 — случай просто уникаль н ы й . Это с в я з а н о прежде всего с о с о б е н н о с т я м и м о т и в а ц и и поли тического п о в е д е н и я — с л о ж н о й , м н о г о ф а к т о р н о й , нередко ирра ц и о н а л ь н о й . Я с н о , что такое с л о ж н о е я в л е н и е , к а к голосование за о п р е д е л е н н у ю п о л и т и ч е с к у ю п а р т и ю , не может ц е л и к о м подчи няться одному или даже двум ф а к т о р а м . Поэтому п р и м е н и т е л ь н о к п о л и т и ч е с к и м и с с л е д о в а н и я м предлагаем н е с к о л ь к о смягченную схему и н т е р п р е т а ц и и : • 0,4 > г > 0,3 — слабая к о р р е л я ц и я ; • 0,6 > г > 0,4 — средняя к о р р е л я ц и я ; • г > 0,7 — сильная корреляция. Существует еще одна п о л е з н а я процедура, п о з в о л я ю щ а я оце нить з н а ч и м о с т ь к о э ф ф и ц и е н т а к о р р е л я ц и и в процессе вычисле н и я коэффициента детерминации, к о т о р ы й представляет собой г, 2 в о з в е д е н н ы й в квадрат (г ). С м ы с л процедуры состоит в том, что при в о з в е д е н и и в квадрат н и з к и е к о э ф ф и ц и е н т ы потеряют «в весе» 9 - 3863
130
Глава 4. Статистические методы в политическом анализе
4.3. К о р р е л я ц и о н н ы й анализ
2
гораздо с и л ь н е е , чем высокие. Так, 0,9 = 0,81 (значение снижается 2 всего на 0,09); 0,5 = 0,25 (здесь мы теряем уже п о л о в и н у з н а ч е н и я ) ; 2 0,3 = 0,09 (более чем трехкратная «потеря веса»). Когда речь идет о переменных, к о т о р ы е мы можем содержательно и н т е р п р е т и р о в а т ь к а к «определяющие» и «определяемые», значение г 2 будет показы вать долю случаев, которые объясняет определяющая п е р е м е н н а я . В н а ш е м п р и м е р е к о э ф ф и ц и е н т к о р р е л я ц и и между п е р е м е н н ы м и «поддержка С П С » и «доля сельского населения» после ч и с т к и вы бросов составил —0,65. К о э ф ф и ц и е н т д е т е р м и н а ц и и составляет со 2 ответственно - 0 , 6 5 = 0,42. Н е с к о л ь к о упрощая реальное положе ние дел, мы м о ж е м утверждать, что ф а к т о р у р б а н и з а ц и и о б ъ я с н я е т п р и м е р н о 40% в а р и а ц и и п е р е м е н н о й «голосование за С П С » по ре гионам Р о с с и и в 1999 г.
Использование корреляционного анализа для выявления динамики связи переменных во времени К о р р е л я ц и о н н ы й а н а л и з м о ж н о использовать не т о л ь к о для обна ружения с в я з и между п е р е м е н н ы м и , но и для о ц е н к и и з м е н е н и я этой связи во в р е м е н и . Так, п р и изучении проблемы э л е к т о р а л ь н о й а к т и в н о с т и в регионах Р о с с и и необходимо было убедиться в том, что уровень а к т и в н о с т и избирателей является н е к о й с т а б и л ь н о й ха р а к т е р и с т и к о й э л е к т о р а л ь н о й культуры р о с с и й с к и х т е р р и т о р и й . И м е ю т с я в виду, разумеется, не абсолютные п о к а з а т е л и , которые с у щ е с т в е н н о колеблются от выборов к выборам. Речь идет об устой чивости р а з л и ч и й в уровне а к т и в н о с т и избирателей р а з л и ч н ы х ре гионов России. Устойчивость п р о п о р ц и о н а л ь н о г о распределения я в к и по субъ ектам Ф е д е р а ц и и достаточно просто проверяется методом корреля ц и о н н о г о анализа. П р и в о д и м а я ниже матрица парных к о р р е л я ц и й э л е к т о р а л ь н о й а к т и в н о с т и на федеральных выборах 1991—2004 гг. д о в о л ь н о четко демонстрирует существующую т е н д е н ц и ю . Статис т и ч е с к а я связь наиболее сильна внутри одного электорального цик ла ( 1 9 9 1 - 1 9 9 3 ; 1 9 9 5 - 1 9 9 6 ; 1 9 9 9 - 2 0 0 0 ; 2 0 0 3 - 2 0 0 4 ) , между двумя б л и з к и м и по времени ц и к л а м и она несколько слабеет, а по мере уда 1 л е н и я электоральных циклов стремится к затуханию .
С м . : Ахременко, А. С. Э л е к т о р а л ь н о е участие и а б с е н т е и з м в р о с с и й с к и х реги о н а х : з а к о н о м е р н о с т и и т е н д е н ц и и // Вестник МГУ. Сер. 12. П о л и т и ч е с к и е науки. 2005. № 3.
1991
1993
1995
19961
1991
1
1993
0,83
1
1995
0,52
0,66
1
1996
0,43
0,47
0,76
1
1999
131
2000
2003
1999
0,14
0,26
0,61
0,56
1
2000
0,13
0,15
0,34
0,47
0,74
1
2003
0,04
0,13
0,36
0,38
0,81
0,75
1
0,66
0,73
2004
0,04
0,10
0,11
0,21
0,55
2004
1
Отметим, что внутри каждого электорального цикла плотность корреляции превышает 0,7 ( 1 9 9 1 - 1 9 9 3 : г= 0,83; 1995-1996: г = 0,76; 1999—2000: г = 0,74; 2003—2004: г= 0,73). На максимальной времен ной дистанции — между президентскими и парламентскими выбора ми 1991 — 1993 и 2003—2004 гг. — связи нет н и к а к о й , к о э ф ф и ц и е н т ы не превышают 0,1. В то же время затухание связи во времени проис ходит медленно. Так, обращает на себя внимание наличие связи, хоть и неплотной, между уровнем электоральной активности на парла ментских выборах 1995 и 2003 гг. (г= 0,36). Тот факт, что определен ная преемственность обнаруживается на протяжении восьми лет, в те чение которых происходит с е р ь е з н е й ш е е «переформатирование» политического режима и системы федеративных отношений, свиде тельствует о в ы с о к о й устойчивости распределения уровня явки по российским регионам. Таким образом, мы имеем основания считать уровень активности/абсентеизма одной из составляющих электораль ной культуры территорий.
Другие коэффициенты корреляции К а к было о т м е ч е н о , к о э ф ф и ц и е н т к о р р е л я ц и и П и р с о н а является наиболее распространенным критерием связи интервальных и н о р м а л ь н о р а с п р е д е л е н н ы х п е р е м е н н ы х . Но что делать, если мы имеем п е р е м е н н ы е , с у щ е с т в е н н о о т к л о н я ю щ и е с я о т н о р м а л ь н о г о р а с п р е д е л е н и я ? И л и п е р е м е н н ы е не и н т е р в а л ь н ы е , но при этом я в л я ю т с я м е т р и ч е с к и м и ( п о р я д к о в ы е п е р е м е н н ы е с б о л ь ш и м чис лом к а т е г о р и й ) ? 1
Здесь р а с с м а т р и в а е т с я з н а ч е н и е я в к и для первого тура президентских выборов
1996 г. П р о б л е м а к о л е б а н и й я в к и от первого ко второму туру анализируется отдельно. 9'
130
Глава 4. Статистические методы в политическом анализе
2
гораздо с и л ь н е е , чем в ы с о к и е . Так, 0,9 = 0,81 ( з н а ч е н и е снижается 2 всего на 0,09); 0,5 = 0,25 (здесь мы теряем уже п о л о в и н у з н а ч е н и я ) ; 2 0,3 = 0,09 (более чем трехкратная «потеря веса»). Когда речь идет о п е р е м е н н ы х , к о т о р ы е мы м о ж е м содержательно интерпретировать как «определяющие» и «определяемые», значение г 2 будет показы вать долю случаев, которые объясняет определяющая п е р е м е н н а я . В н а ш е м п р и м е р е к о э ф ф и ц и е н т к о р р е л я ц и и между п е р е м е н н ы м и «поддержка С П С » и «доля сельского населения» после ч и с т к и вы бросов составил - 0 , 6 5 . К о э ф ф и ц и е н т д е т е р м и н а ц и и составляет со 2 ответственно - 0 , 6 5 = 0,42. Н е с к о л ь к о упрощая реальное положе ние дел, мы м о ж е м утверждать, что фактор у р б а н и з а ц и и объясняет п р и м е р н о 40% в а р и а ц и и п е р е м е н н о й «голосование за С П С » по ре г и о н а м Р о с с и и в 1999 г.
Использование корреляционного анализа для выявления динамики связи переменных во времени К о р р е л я ц и о н н ы й а н а л и з м о ж н о использовать не т о л ь к о для обна ружения связи между п е р е м е н н ы м и , но и для о ц е н к и и з м е н е н и я этой связи во в р е м е н и . Так, п р и изучении проблемы э л е к т о р а л ь н о й а к т и в н о с т и в регионах Р о с с и и необходимо было убедиться в том, что уровень а к т и в н о с т и избирателей является н е к о й с т а б и л ь н о й ха р а к т е р и с т и к о й э л е к т о р а л ь н о й культуры р о с с и й с к и х т е р р и т о р и й . И м е ю т с я в виду, разумеется, не абсолютные п о к а з а т е л и , которые с у щ е с т в е н н о к о л е б л ю т с я от выборов к выборам. Речь идет об устой чивости р а з л и ч и й в уровне а к т и в н о с т и избирателей р а з л и ч н ы х ре гионов России. Устойчивость п р о п о р ц и о н а л ь н о г о распределения я в к и по субъ ектам Ф е д е р а ц и и достаточно просто проверяется методом корреля ц и о н н о г о анализа. П р и в о д и м а я ниже матрица парных к о р р е л я ц и й э л е к т о р а л ь н о й а к т и в н о с т и на федеральных выборах 1991—2004 гг. д о в о л ь н о четко демонстрирует существующую т е н д е н ц и ю . Статис т и ч е с к а я с в я з ь наиболее сильна внутри одного электорального цик ла ( 1 9 9 1 - 1 9 9 3 ; 1 9 9 5 - 1 9 9 6 ; 1 9 9 9 - 2 0 0 0 ; 2 0 0 3 - 2 0 0 4 ) , между двумя б л и з к и м и по времени ц и к л а м и она несколько слабеет, а по мере уда 1 л е н и я электоральных ц и к л о в стремится к затуханию .
С м . : Ахременко, А. С. Э л е к т о р а л ь н о е участие и а б с е н т е и з м в р о с с и й с к и х реги о н а х : з а к о н о м е р н о с т и и т е н д е н ц и и // В е с т н и к МГУ. Сер. 12 П о л и т и ч е с к и е науки 2005. № 3.
131
4.3. К о р р е л я ц и о н н ы й анализ
1991
1993
1995
1996'
1999
2000
2003
1991
1
1993
0,83
1
1995
0,52
0,66
1
1996
0,43
0,47
0,76
1
1999
0,14
0,26
0,61
0,56
1
0,47
0,74
1
0,38
0,81
0,75
1
0,21
0,55
0,66
0,73
2000
0,13
0,15
0,34
2003
0,04
0,13
0,36
2004
0,04
0,10
0,11
"2004
1
Отметим, что внутри каждого электорального цикла плотность корреляции превышает 0,7 ( 1 9 9 1 - 1 9 9 3 : /-= 0,83; 1995-1996: г= 0,76; 1999—2000: г= 0,74; 2003—2004: г= 0,73). На максимальной времен ной дистанции — между президентскими и парламентскими выбора ми 1991 — 1993 и 2003—2004 гг. — связи нет н и к а к о й , к о э ф ф и ц и е н т ы не превышают 0,1. В то же время затухание связи во времени проис ходит медленно. Так, обращает на себя внимание наличие связи, хоть и неплотной, между уровнем электоральной активности на парла ментских выборах 1995 и 2003 гг. (г= 0,36). Тот факт, что определен ная преемственность обнаруживается на протяжении восьми лет, в те чение которых происходит с е р ь е з н е й ш е е «переформатирование» политического режима и системы федеративных о т н о ш е н и й , свиде тельствует о высокой устойчивости распределения уровня явки по российским регионам. Таким образом, мы имеем основания считать уровень активности/абсентеизма одной из составляющих электораль ной культуры территорий.
Другие коэффициенты корреляции Как было о т м е ч е н о , к о э ф ф и ц и е н т к о р р е л я ц и и П и р с о н а является наиболее р а с п р о с т р а н е н н ы м критерием связи интервальных и н о р м а л ь н о р а с п р е д е л е н н ы х п е р е м е н н ы х . Но что делать, если мы имеем п е р е м е н н ы е , с у щ е с т в е н н о о т к л о н я ю щ и е с я от н о р м а л ь н о г о р а с п р е д е л е н и я ? И л и п е р е м е н н ы е не и н т е р в а л ь н ы е , но при этом являются м е т р и ч е с к и м и ( п о р я д к о в ы е п е р е м е н н ы е с б о л ь ш и м чис лом к а т е г о р и й ) ? 1
Здесь р а с с м а т р и в а е т с я з н а ч е н и е я в к и д л я первого тура президентских выборов
1996 г. П р о б л е м а к о л е б а н и й я в к и от первого ко второму туру анализируется отдельно. 9-
132
Глава 4. Статистические методы в политическом анализе
В этих ситуациях рекомендуется вычислять коэффициенты корре ляции рангов, наиболее известным из которых является коэффициент Спирмана. Ранговая к о р р е л я ц и я оперирует л о г и к о й порядкового уровня: п р и н и м а ю т с я во внимание не абсолютные значения, а отно ш е н и я порядка (возрастания и убывания). В какой-то мере ранговую к о р р е л я ц и ю м о ж н о считать усложненной версией расчета показателя гамма (у), который мы рассматривали в качестве стандартной меры связи порядковых переменных. К о э ф ф и ц и е н т корреляции С п и р м а н а колеблется в том же интер вале, что и к о э ф ф и ц и е н т Пирсона — от 0 до ± 1. П р и н ц и п ы интерпре тации значений к о э ф ф и ц и е н т а также идентичны. Дополнительно стоит отметить, что ранговая корреляция не чувствительна к выбро сам, так к а к не чувствительна к абсолютным значениям вообще.
4.4. Дисперсионный анализ Д и с п е р с и о н н ы й анализ (англ. ANalysis Of VAriance, ANOVA) является одним из основополагающих статистических методов. Важность уме н и я работать с его алгоритмами определяется не только теми возмож ностями, которые он предоставляет исследователю для самостоятель ного анализа данных. Как и в случае с к о р р е л я ц и о н н ы м анализом, изучение д и с п е р с и й переменных входит во многие более сложные статистические методы. Дисперсионный анализ служит для проверки гипотезы о статистической значимости различий между средними величинами в нескольких группах наблюдений. Н а п р и м е р , по результатам социологи ческого исследования мы выявили две группы респондентов: при н я в ш и х участие в последних федеральных выборах (группа 1) и про и г н о р и р о в а в ш и х голосование (группа 2). Проведя о п и с а т е л ь н ы й статистический анализ обеих групп, мы обнаружили, что они суще ственно различаются по средним з н а ч е н и я м п е р е м е н н о й «возраст». Группа «активных избирателей» в среднем значительно старше, чем группа «абсентеистов». Ниже в таблице представлены исходные дан ные (разумеется, в реальном исследовании объемы выборок д о л ж н ы 1 быть существенно больше ). Переменная «возраст» является интер вальной. П е р е м е н н а я «участие в выборах» относится к н о м и н а л ь н ы м д и х о т о м и ч е с к и м п е р е м е н н ы м и п р и н и м а е т всего два з н а ч е н и я : «при1
В д и с п е р с и о н н о м анализе в ы б о р к и д о л ж н ы извлекаться случайно из генеральных
н о р м а л ь н о р а с п р е д е л е н н ы х совокупностей.
133
4.4. Д и с п е р с и о н н ы й анализ
н я л участие» («активные избиратели», код 1) или «не п р и н я л учас тия» («пассивные избиратели», код 2). Возраст
А к т и в н ы е избиратели (код 1)
Возраст
П а с с и в н ы е избиратели (код 2)
38
1
23
2
76
1
50
2
41
1
19
2
57
1
34
2
82
1
45
2
63
1
22
2
47
1
33
2
58
1
18
2
64
1
22
2
71
1
45
2
49
1
27
2
43
1
37
2
С р е д н е е в группе I: 57,42
Среднее в группе 2: 31,25
Теперь п о п ы т а е м с я ответить на вопрос: не является ли различие между с р е д н и м и в двух группах случайным? Н а с к о л ь к о вероятно, что а к т и в н ы е избиратели в среднем старше, чем п а с с и в н ы е , и в ге н е р а л ь н о й совокупности? Вопрос отнюдь не п р а з д н ы й . Убедившись в существовании з н а ч и м ы х различий между с р е д н и м и , мы сможем оперировать п е р е м е н н ы м и «возраст» и «участие в выборах» в терми нах з а в и с и м о с т и . З н а я же з н а ч е н и я н е з а в и с и м о й п е р е м е н н о й («воз раст») — с о п р е д е л е н н о й долей статистической вероятности пред сказывать значение группирующей п е р е м е н н о й «участие в выборах». И н ы м и словами, «возраст» может играть роль переменнойпредиктора (предсказывающего фактора) п р и о т н е с е н и и объекта к одному из классов группирующей п е р е м е н н о й . Сформулируем две гипотезы — нулевую и альтернативную. В соот ветствии с нулевой гипотезой различия средней являются случайны ми, зависимость между переменной «возраст» и переменной «участие в выборах» отсутствует. Альтернативная гипотеза основана на проти воположном утверждении. Вычислительная логика д и с п е р с и о н н о г о анализа базируется на разбиении общей дисперсии (вариации) переменной на две компо ненты, одна из которых обусловлена случайностью, а другая связана с
134
4.4. Дисперсионный анализ
Глава 4. Статистические методы в политическом анализе
различием средних значений. В качестве меры «случайной ошибки» выступает сумма д и с п е р с и й переменной внутри каждой группы, ко торая затем сравнивается с общей дисперсией (дисперсией перемен ной без учета з н а ч е н и й группирующей переменной). Проиллюстри 1 руем эту логику на н а ш е м примере . 1. Вычисляем отклонения от средней для группы активных изби рателей (из средней вычитаем значения переменной). 2. Возводим все полученные значения в квадрат. 3. Суммируем все квадраты отклонений. 4. Повторяем те же операции для группы 2. Активные избиратели
2
Пассивные избиратели
Сумма Сумма Значение Квадра Значение Квадра квадра квадра перемен Откло ты от перемен Откло ты от тов от тов от н о й «воз н е н и я клоне ной «воз нения клоне клоне клоне раст» ний раст» ний н и й (SS) н и й (SS) 2242,917
38
19,42
377,01
76
-18,58
41
16,42
57
0,42
0,17
34
-2,75
7,56
82
-24,58
604,34
45
-13,75
189,06
63
-5,58
31,17
22
9,25
85,56
47
10,42
108,51
33
-1,75
3,06
58
-0,58
0,34
18
13,25
175,56
64
-6,58
43,34
22
9,25
85,56
71
-13,58
184,51
45
-13,75
189,06
49
8,42
70,84
27
4,25
18,06
14,42
207,84
37
-5,75
33,06
43
23
8,25
68,06
345,34
50
-18,75
351,56
269,51
19
12,25
150,06
1356,25
Теперь м о ж н о рассчитать один из элементов итоговой дисперси о н н о й статистики — сумму квадратов о ш и б к и (дисперсию о ш и б к и или остаточный к о м п о н е н т ) , которая в статистических программах, ' Разумеется, в реальных исследованиях все вычисления будет выполнять компью тер: модули дисперсионного анализа присутствуют во всех статистических программах. Особенно полезно будет пройти вычислительный алгоритм дисперсионного анализа, используя программу MS Excel, где для всех указанных действий имеются соответству ющие ф у н к ц и и . 2 Здесь и далее числа округлены до второго знака после запятой.
135
как правило, обозначается SS-еттот (sum of squares error). Складываем сумму квадратов отклонений для группы 1 и группы 2 и получаем 3599,17. Далее необходимо вычислить общую вариацию переменной отно сительно единой средней (в н а ш е м случае — 44,3). Действуем таким же образом, как ранее, — вычисляем сумму квадратов отклонений, однако теперь уже без учета разделения наблюдений на две группы. Общая сумма квадратов отклонений составит в нашем случае 7707,33. Вычитаем сумму квадратов о т к л о н е н и й о ш и б к и из общей суммы квадратов о т к л о н е н и й и получаем второй элемент итоговой статис тики д и с п е р с и о н н о г о анализа — т а к называемую «сумму квадратов эффекта» (обозначается ^ - e f f e c t , в нашем случае — 4108,16). Это межгрупповая д и с п е р с и я — вариация зависимой п е р е м е н н о й , «очи щенная» от случайного к о м п о н е н т а , связанного с внутригрупповой изменчивостью. И м е н н о о т н о ш е н и е межгрупповой дисперсии к дисперсии ошиб ки (внутригрупповой дисперсии) покажет статистическую значи мость средней, точнее — значимость различия между средними значе н и я м и в двух группах. Чем б о л ь ш е о т н о ш е н и е м е ж г р у п п о в о й дисперсии к внутригрупповой, тем большей значимостью обладает различие средних. Другими словами, чем меньше доля случайных ошибок, тем выше статистическая значимость. В д и с п е р с и о н н о м анализе о т н о ш е н и е дисперсий показывает кри терий Фишера, или F-критерий (/^-отношение). Он проверяет, дей ствительно ли о т н о ш е н и е д и с п е р с и й значимо больше 1. Для вычисле н и я F-статистики используются показатели Л/5-error и MS'-effect — средние квадраты э ф ф е к т а и о ш и б к и (Mean Square). Это те же SSerror и ^ - e f f e c t , но преобразованные с поправкой на объем совокуп ности (число з н а ч е н и й , п р и н и м а е м ы х переменной). В нашем приме ре MS-effect = SS-effect = 4108,16; MS-tnox = 163,59 (значение 55-error — 3599,17, разделенное на число случаев в выборке — 22); F= 25,1, т.е. существенно выше е д и н и ц ы . Полезным показателем в ^-статистике является также показательр, отражающий значимость f - к р и т е р и я . Это вероятность того, что при д а н н о м з н а ч е н и и /^-критерия верна нулевая гипотеза. В обычном слу чае нулевая гипотеза отвергается п р и /?-значение
o.oooboooooT
/•"-отношение 54,29 значимо на уровне 0,0000000001. Соответ ственно, мы можем с уверенностью отвергнуть нулевую гипотезу (что обнаруженная н а м и связь носит случайный характер).
143
4.5. Регрессионный анализ
Аналогичную функцию выполняет критерий t, но уже в отношении регрессионных к о э ф ф и ц и е н т о в (углового и F-пересечения). С помо щью критерия t проверяем гипотезу о том, что в генеральной совокуп ности регрессионные к о э ф ф и ц и е н т ы равны нулю. В нашем случае мы вновь можем уверенно отбросить нулевую гипотезу. t
р-значение
Intercpt
19,42
0,0000000000
Сел. нас.
-7,37
0,0000000001
Множественный регрессионный анализ Модель множественной регрессии практически идентична модели парной регрессии; разница л и ш ь в том, что в линейную ф у н к ц и ю по следовательно включаются несколько независимых переменных:
Если независимых переменных больше двух, мы не имеем возмож ности получить визуальное представление об их связи, в этом плане множественная регрессия менее «наглядна», нежели парная. П р и на л и ч и и двух независимых переменных данные бывает полезно отобра зить на трехмерной диаграмме рассеяния. В профессиональных ста т и с т и ч е с к и х пакетах п р о г р а м м ( н а п р и м е р , Statistica) существует о п ц и я в р а щ е н и я трехмерной диаграммы, позволяющая хорошо визу ально представить структуру данных. При работе с множественной регрессией, в отличие от парной, не обходимо о п р е д е л я т ь алгоритм анализа. Стандартный алгоритм включает в итоговую регрессионную модель все имеющиеся предик торы. Пошаговый алгоритм предполагает последовательное включе ние (исключение) независимых переменных, исходя из их объясни тельного «веса». П о ш а г о в ы й метод хорош, когда имеется много независимых переменных; он «очищает» модель от откровенно сла бых предикторов, делая ее более к о м п а к т н о й и л а к о н и ч н о й . Д о п о л н и т е л ь н ы м условием корректности множественной регрес сии (наряду с интервальностью, нормальностью и линейностью) яв ляется отсутствие мультиколлинеарности — наличия сильных корре л я ц и о н н ы х связей между н е з а в и с и м ы м и переменными. И н т е р п р е т а ц и я статистики множественной регрессии включает в себя все элементы, рассмотренные н а м и для случая парной регрессии. Кроме того, в статистике множественного регрессионного анализа есть и другие важные составляющие.
Глава 4. Статистические методы в политическом анализе
144
Работу с множественной регрессией мы проиллюстрируем на при мере тестирования гипотез, объясняющих различия в уровне электо ральной активности по регионам России. В ходе конкретных эмпири ческих и с с л е д о в а н и й б ы л и в ы с к а з а н ы п р е д п о л о ж е н и я , что на уровень я в к и избирателей влияют: • национальный фактор (переменная «русское население»; операционализирована как доля русского населения в субъектах Р Ф ) . Предполагается, что увеличение доли русского населения ведет к сни жению активности избирателей; • фактор урбанизации (переменная «городское население»; операционализирована как доля городского населения в субъектах Р Ф , с этим фактором мы уже работали в рамках корреляционного анализа). Предполагается, что увеличение доли городского населения также ве дет к с н и ж е н и ю активности избирателей. Зависимая переменная — «интенсивность избирательной активно сти» («актив.») операционализирована через усредненные данные яв ки по регионам на федеральных выборах с 1995 по 2003 г. Исходная таблица данных для двух независимых и одной зависимой перемен ной будет иметь следующий вид:
Случай Республика Адыгея
Переменные
145
4.5. Регрессионный анализ
1
Актив.
Гор. нас.
Рус. нас.
64,92
53
68
Республика Алтай
68,60
24
60
Республика Бурятия
60,75
59
70
Республика Дагестан
79,92
41
9
Республика Ингушетия
75,05
41
23
Республика К а л м ы к и я
68,52
39
37
Карачаево-Черкесская Республика
66,68
44
42
Статистика, о п и с ы в а ю щ а я качество модели: 1. Множественный R = 0,62; Л-квадрат = 0,38. Следовательно, на циональный фактор и фактор урбанизации вместе объясняют около 38% вариации переменной «электоральная активность». 2. Средняя о ш и б к а составляет 3,38. И м е н н о настолько «в среднем ошибается» построенная модель при прогнозировании уровня я в к и . 3. /^-отношение о б ъ я с н е н н о й и необъясненной вариации состав ляет 25,2 на /ьуровне 0,000000003. Нулевая гипотеза о случайности выявленных связей отвергается. 4. Критерий / для константы и регрессионных к о э ф ф и ц и е н т о в пе ременных «городское население» и «русское население» значим на уровне 0,0000001; 0,00005 и 0,007 соответственно. Нулевая гипотеза о случайности к о э ф ф и ц и е н т о в отвергается. Дополнительная полезная статистика в анализе соотношения ис ходных и предсказанных значений зависимой переменной — расстоя ние Махаланобиса и расстояние Кука. Первое — мера уникальности слу чая (показывает, насколько сочетание значений всех независимых переменных для данного случая отклоняется от среднего значения по всем независимым переменным одновременно). Второе — мера влия тельности случая. Разные наблюдения по-разному влияют на наклон линии регрессии, и с помощью расстояния Кука можно сопоставлять их по этому показателю. Это бывает полезно при чистке выбросов (вы брос можно представить как чрезмерно влиятельный случай). В нашем примере к уникальным и влиятельным случаям, в частно сти, относится Дагестан. Исходные значения
Предска занные значения
Остатки
Адыгея
64,92
66,33
-1,40
0,69
0,00
Республика Алтай
68,60
69.91
-1,31
6,80
0,01
65,56
-4,81
0,23
0,01
Случай
Расстояние Расстояние Махаланобиса Кука
Республика Карелия
61,70
73
73
Республика Бурятия
60,75
Республика Коми
59,60
74
57
Республика Дагестан
79,92
71,01
8,91
10,57
0,44
Республика Ингушетия
75,05
70,21
4,84
6,73
0,08
Республика Калмыкия
68,52
69,59
-1,07
4,20
0,00
Республика Марий Эл
65,19
62
47
И т.д. (после чистки выбросов остается 83 случая из 88)
Собственно регрессионная модель обладает следующими парамет рами: У-пересечение (константа) = 75,99; Ь (Гор. нас.) = - 0 , 1 ; b (Рус. нас.) = - 0 , 0 6 . Итоговая формула: ' Д а н н ы е по удельному весу городского и русского н а с е л е н и я п р и в о д я т с я по офи
Актив. = - 0 , 1 х Гор. нас.„ + - 0 , 0 6 х Рус. нас. я + 75,99.
ц и а л ь н ы м результатам В с е р о с с и й с к о й п е р е п и с и н а с е л е н и я 1989 г.
10-3863
146
Глава 4. Статистические методы в политическом анализе
147
4.6. Кластер-анализ
Можем ли мы сравнивать «объяснительную силу» предикторов, исходя из значения к о э ф ф и ц и е н т а 61 В данном случае — да, так как обе независимые переменные имеют одинаковый п р о ц е н т н ы й фор мат. Однако чаще всего множественная регрессия имеет дело с пере м е н н ы м и , и з м е р е н н ы м и в разных шкалах (к примеру, уровень дохода в рублях и возраст в годах). Поэтому в общем случае сравнивать пред сказательные возможности переменных по регрессионному коэффи циенту некорректно. В статистике множественной регрессии для этой цели существует специальный бета-коэффициент (В), вычисляемый отдельно для каждой независимой переменной. Он представляет со бой частный (вычисленный после учета влияния всех других предик торов) к о э ф ф и ц и е н т корреляции фактора и отклика и показывает не зависимый вклад фактора в предсказание значений отклика. В парном регрессионном анализе бета-коэффициент по понятным причинам равен к о э ф ф и ц и е н т у парной корреляции между зависимой и незави симой переменной.
блоки в несколько идеологически близких групп, — все равно решить
В нашем примере бета (Гор. нас.) = -0,43, бета (Рус. нас.) = -0,28. Та к и м образом, оба фактора отрицательно влияют на уровень электо ральной активности, при этом значимость фактора урбанизации су щественно в ы ш е значимости национального фактора. Совокупное в л и я н и е обоих факторов определяет около 38% вариации п е р е м е н н о й «электоральная активность» (см. значение Л-квадрат).
голосований в 16 районах Северо-Восточного АО г. М о с к в ы на парла
поставленную задачу будет крайне проблематично. Если, конечно, не применять кластер-анализ, который как раз и предназначен для ре ш е н и я подобного рода проблем. Среди различных алгоритмов классификации, объединяемых клас тер-анализом, наиболее распространены три — иерархический кластеранализ (tree clustering), метод К-средних (K-means) и двухходовое объеди нение (two-way joining). Мы рассмотрим первые два алгоритма как более активно используемые в анализе политической информации.
Иерархический кластер-анализ Иерархический кластер-анализ организует д а н н ы е в наглядные «дре вовидные»
структуры,
или
П р и м е р такой структуры
дендрограммы.
приводится ниже; в качестве объектов выступают политические пар тии и блоки, упорядоченные с т очки зрения близости в пространстве ментских выборах 1999 г.
4.6. Кластер-анализ К л ас тер - анализ представляет собой группу алгоритмов много мерной классификации объектов, под которой понимается упорядочение в наглядные структуры или группы сходства/различия объектов, облада ющих множеством характеристик. В качестве объектов могут высту пать не только наблюдения (респонденты, политические п а р т и и и т.д.), но и переменные. Н а п р и м е р , в парламентских выборах 17 декабря 1995 г. п р и н я л и участие 43 избирательных объединения, выборы проводились во всех 89 регионах России. Наша задача — разбить субъекты Федерации на несколько групп по признаку близости политических предпочтений избирателей, выявленных в ходе голосования за избирательные объ е д и н е н и я и блоки. Н а ш и исходные д а н н ы е в этом случае составят таб лицу с 89 столбцами и 43 строками, всего 3287 (43 х 89) числовых дан ных. Даже если мы проведем предварительное «сжатие» д а н н ы х с п о м о щ ь ю группировки или т и п о л о г и з а ц и и , н а п р и м е р о б ъ е д и н и м
«Яблоко»
—Г~
спс КПРФ
_| 1
«Единство»
,
i
j
;
1,0
1,5
j 1!
«Блок Жиринов-
р
ского» (БЖ) «Отечество — вся
:
Россия» ( О В Р )
| 0
0,5
2,0
Ось р а с с т о я н и я
Это горизонтальная дендрограмма. На ней расстояния между объ ектами и группами объектов (кластерами) различаются по горизон 1
тальной оси . Так, н а и м е н ь ш е е расстояние з а ф и к с и р о в а н о между 10'
объектами п а р т и й «Яблоко» и С П С — о н и соединены самой корот к о й ветвью. Вторые по близости — К П Р Ф и кластер « " Я б л о к о " — С П С » . Третьи по близости объекты — «Единство» и «Блок Жиринов
148
Глава 4. Статистические методы в политическом анализе
В древовидной к л а с с и ф и к а ц и и нет четкого правила определения, какие объекты входят в один кластер, а какие нет. Все зависит от ис следовательского критерия уникальности объектов. Если критерий уникальности «слабый», т.е. вы хотите получить минимальное число кластеров, м о ж н о считать таковыми « " Я б л о к о " — С П С — К П Р Ф » (1) и « " Е д и н с т в о " — БЖ — ОВР» (2). Эти два кластера, между прочим, будут сильно различаться по плотности: расстояния в первом класте ре значительно меньше, чем во втором. При более «сильном» критерии уникальности можно рассматри вать О В Р к а к изолированный объект, не входящий ни в один кластер. П р и максимально сильном критерии уникальности можно говорить о кластере « " Я б л о к о " — С П С » и четырех изолированных объектах.
Создание дендрограммы: вычислительный аспект Д л я указанного примера мы имеем исходные данные в виде процен тов голосов, набранных 6 ведущими партиями и избирательными об ъед и н ениями в 16 районах Северо-Восточного АО г. Москвы на вы борах депутатов Госдумы 1999 г. О н и представлены в таблице. Район
«Яблоко» «Единство»
БЖ
ОВР
КПРФ
СПС
Алексеевский
10,72
5,91
1,94
39,83
12,68
14,91
Алтуфьевский
8,13
7,39
3,73
43,57
10,42
9,70
Бабушкинский
8,95
6,68
3,04
42,03
12,44
10,75
Бибирево
9,29
9,58
3,21
40,25
11,04
11,09
Бутырский
10,04
6,84
2,82
40,51
12,18
12,13
Лианозово
8,49
6,73
3,16
45,20
11,46
9,17
Лосиноостровский
9,14
6,51
2,41
43,64
12,80
10,60
9,42
6,55
2,84
44,25
11,51
10,60
Марьина Роща
10,00
6,83
2,51
41,07
12,26
12,04
Останкинский
10,61
5,78
1,92
39,97
12,31
14,64
10,93
11,07
Марфино
149
4.6. Кластер-анализ
В кластер-анализе используется п р и н ц и п геометрического представ ления, о котором уже говорилось ранее. Мы представляем объекты как точки в л-мерной системе координат. В нашем случае каждая партия бу дет иметь определенную позицию в 16-мерном (по числу районов) при знаковом пространстве. Естественно, если число измерений превышает три, мы не можем получить визуальное геометрическое представление. Впрочем, это никоим образом не мешает нашему исследованию. Создание дендрограммы происходит в два этапа: 1) построение матрицы расстояний (измерение расстояния между всеми парами имеющихся объектов); 2) построение дендрограммы на основе полученной матрицы рассто яний. Уже н а стадии п о с т р о е н и я м а т р и ц ы р а с с т о я н и й воз никает возможность выбирать из нескольких вариантов: что именно считать расстоянием, какую метрику использовать? В стандартных компьютерных программах кластер-анализа мы имеем семь-восемь различных мер близости (или мер расстояния — англ. distance measure). Среди них: евклидово расстояние, взвешенное евклидово расстояние, манхэттенское расстояние, расстояние Чебышева, степенное расстоя ние, процент несогласия, к о э ф ф и ц и е н т Пирсона. Более подробно ос тановимся на евклидовом расстоянии (eucledian distance) и расстоянии, основанном на к о э ф ф и ц и е н т е корреляции Пирсона (1 — г). Евклидово расстояние — это кратчайшее расстояние (dist) между двумя точками х и у в л-мерном евклидовом пространстве. Оно вы числяется по простой формуле:
Так, если мы имеем х с координатами (1;—1) и у (2; 0), то расстоя ние между н и м и составит: 2
dist = V ( 1 - 2 ) + ( - 1 - 0 )
для наших исходных данных и получить матрицу расстояний:
9,71
6,74
3,38
42,42
Ростокино
8,98
6,97
2,23
41,66
11,88
12,49
«Яблоко»
Свиблово
9,00
6,38
2,71
43,16
11,17
11,29
«Единство»
8,83
6,67
3,21
45,27
10,70
9,95
Южное Медведково
9,03
6,55
2,89
44,52
11,43
10,11
Ярославский
8,54
6,68
2,88
44,25
11,50
10,88
= 2.
Используя эту формулу, м о ж н о подсчитать все парные расстояния
Отрадное
Северное Медведково
2
«Яблоко»
БЖ ОВР КПРФ СПС
11,17 26,37 133,53 9,8 9,08
«Единство»
БЖ
16,21 143,45
159,31
20,14 19,8
35,74 35,03
ОВР
КПРФ
124,05 125,71
5,28
СПС
150
Глава 4. Статистические методы в политическом анализе
Вариацией евклидова расстояния является взвешенное евклидово расстояние. Эта мера близости отличается тем, что отсутствует опера ция извлечения квадратного к о р н я :
Таким образом, происходит «растягивание» д и с т а н ц и й : большие расстояния становятся многократно больше, незначительные же уве личиваются не столь существенно. Большим расстояниям придается больший вес, отсюда и название меры близости. Д л я н а ш и х данных матрица расстояний во взвешенной евклидовой метрике имела бы следующий вид: «Яблоко»
«Единство»
БЖ
ОВР
КПРФ
СПС
«Яблоко» «Единство»
124,81
БЖ
695,33
262,87
ОВР
17830,31
20576,99
25378,81
КПРФ
96,14
405,48
1277,05
15388,04
СПС
82,49
392,12
1227,05
15803,83
27,87
Так, расстояние « " Я б л о к о " — С П С » увеличилось с 9 до 82, тогда как расстояние « Б Ж — ОВР» — со 159 до 25 378. Такой прием может понадобиться тогда, когда различия расстояний между объектами не значительны и структура объектов ненаглядна. В нашем же случае го раздо удобнее использовать обычное евклидово расстояние. П р и н ц и п и а л ь н о ино й метод вычисления матрицы р а с с т о я н и й ос нован на парном корреляционном анализе Пирсона, о котором подробно говорилось выше. Сначала вычисляется матрица парных к о р р е л я ц и й , которая для наших данных будет иметь вид: «Яблоко»
«Единство»
БЖ
ОВР
КПРФ
СПС
«Яблоко» «Единство»
-0,31
БЖ
-0,68
0,51
ОВР
-0,76
-0,14
0,51
КПРФ
0,58
-0,43
-0,79
-0,48
СПС
0,86
-0,33
-0,82
-0,82
151
4.6. Кластер-анализ
0,59
Затем к о э ф ф и ц и е н т ы корреляции преобразуются в р а с с т о я н и я с п о м о щ ь ю простейшей формулы: dist= 1 - г.
«Яблоко»
«Единство»
БЖ
ОВР
КПРФ
СПС
«Яблоко» «Единство»
1,31
БЖ
1,68
0,49
ОВР
1,76
1,14
0,49
КПРФ
0,42
1,43
1,79
1,48
СПС
0,14
1,33
1,82
1,82
0,41
Плотная положительная корреляция « С П С — " Я б л о к о " » ( г = 0,86) стала н а и м е н ь ш и м расстоянием — 0,14. Плотная отрицательная кор реляция «БЖ — С П С » (г= -0,82) стала наибольшим расстоянием — 1,82. Следует оговориться, что мера расстояния 1 - г не используется; если кластеризация случаев осуществляется на основании всего двух переменных, она будет давать только значения -1 или + 1. После вычисления матрицы парных расстояний можно присту пать к ф о р м и р о в а н и ю д е н д р о г р а м м ы . Однако и н а этой стадии мы имеем достаточно ш и р о к и й набор о п ц и й . Основной во прос состоит в том, каким образом связывать вместе несколько объ ектов, как следует определить расстояния между кластерами, т.е. не обходимо выбрать правило объединения (или правило связи). Как и в случае с мерой близости, в статистических программах имеется около семи вариантов выбора правила объединения. Основные из них: оди ночная связь (метод ближайшего соседа), полная связь (метод даль них соседей), невзвешенное и взвешенное попарное среднее, невзвеш е н н ы й и в з в е ш е н н ы й центроидный метод, метод Варда. Например, в случае использования метода ближайшего соседа (near est neighbour, single linkage) расстояние между двумя кластерами опре деляется расстоянием между двумя наиболее близкими объектами в различных кластерах. Построение дендрограммы начинается с нахож дения наименьшего значения среди всех парных расстояний. В методе дальних соседей (complete linkage), напротив, расстояния между класте рами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах. Соответственно, формирование дендрограммы начинается с поиска самой удаленной пары объектов. Как выбирать меры близости и правило объединения? В некото рых случаях существуют четкие критерии. Так, процент несогласия к а к мера р а с с т о я н и я «работает» только на категориальных данных. Однако чаще простых и ясных критериев не существует. Чтобы с ходу «попасть в яблочко», требуются серьезная статистическая подготовка и глубокое п о н и м а н и е с п е ц и ф и к и изучаемых объектов. Практичес кие же советы таковы:
152
Глава 4. Статистические методы в политическом анализе
1. Следует, не ограничиваясь одной мерой близости и одним пра вилом объединения, пробовать различные к о м б и н а ц и и (конечно, в разумных пределах). Особого в н и м а н и я заслуживает общее в кластер н о й структуре объектов, обнаруживаемое в разных сочетаниях. 2. Необходимо проводить содержательную интерпретацию получа емых результатов, ни в коем случае не ограничиваясь «механическим перебором». В продолжение рассмотрения нашего примера с электоральной статистикой построим четыре дендрограммы, используя к о м б и н а ц и и мер расстояния (евклидово и 1 - г) и правил связи (полная и одиноч ная связь).
4.6. Кластер-анализ
!53
блока. При этом парламентские выборы в декабре 1999 г. проходили одновременно с выборами столичного главы. Н е с о м н е н н о , все это способствовало более четкому п о з и ц и о н и р о в а н и ю ОВР в глазах сто личных избирателей. На всех дендрограммах фиксируется близость «Яблока» и С П С , причем в двух случаях (3,4) это наименьшее расстояние между объек тами. Здесь «московская специфика», скорее всего, ни при чем — бли зость электората С П С и «Яблока» в территориальном разрезе являлась на тот момент общероссийской тенденцией (мы уже рассматривали этот вопрос в параграфе, посвященном корреляционному анализу). Общероссийской закономерностью на парламентских выборах 1999 г. являлась также близость в территориальном разрезе электоратов «Единства» и «Блока Жириновского» (все дендрограммы). Больше вопросов вызывает близость, с одной стороны, С П С и «Яблока», с другой — К П Р Ф . Казалось бы, эти партии в значительной мере п о л я р н ы по своим идеологическим установкам. Ключ к ответу содержится, вероятно, в дендрограммах 3 и 4, демонстрирующих кар тину двух противостоящих кластеров: «"Единство" — БЖ — ОВР» и « С П С — " Я б л о к о " — К П Р Ф » . Содержательное различие между двумя кластерами м о ж н о представить к а к п р и з н а к отсутствия/наличия вы раженной политической идеологии. «Правые» С П С и «Яблоко» и «ле вая» К П Р Ф были четко п о з и ц и о н и р о в а н ы в политико-идеологичес ком спектре, в отличие от «партий власти» ОВР и «Единства» (и в меньшей степени «Блока Жириновского»). Таким образом, можно предполагать наличие «раскола» (электорального размежевания) в Москве по л и н и и «идейные» — «властные» партии. К проблеме интерпретации структур электорального выбора мы вернемся, когда будем рассматривать ф а к т о р н ы й анализ.
Метод К-средних
Сопоставляя полученные результаты, попробуем н а й т и общие мо менты и дать им содержательное объяснение. Так, на трех дендрограммах (1,2,4) четко видно изолированное по л о ж е н и е блока «Отечество — вся Россия» (ОВР). Н а п о м н и м , что кла стер-анализ осуществлялся на данных избирательных к о м и с с и й рай онов М о с к в ы , мэр которой Ю.М. Лужков являлся одним из лидеров
П р и всех сильных сторонах иерархического кластер-анализа он обла дает одним существенным недостатком. С н и м трудно работать при наличии большого числа объектов, так к а к дендрограммы становятся перегруженными и теряют наглядность. В таких случаях используют другой метод кластеризации — метод К-средних. Впрочем, этот метод весьма э ф ф е к т и в е н и при незначительном количестве объектов: его можно и нужно сочетать с древовидной классификацией для получе ния более надежных результатов. П р и н ц и п и а л ь н о е отличие метода К-средних от иерархического кла стер-анализа заключается в том, что исследователю необходимо изна-
154
4.6. Кластер-анализ
Глава 4. Статистические методы в политическом анализе
чально определить число кластеров, на которое требуется разбить изучаемую совокупность. Соответственно, желательно еще до начала анализа иметь гипотезу о структуре исследуемой совокупности. В ином случае рекомендуется «разведочный» алгоритм: сначала совокупность делится на два кластера, затем на три и так до тех пор, пока не будет найдено оптимальное число кластеров. Вычислительный алгоритм кластеризации в методе К-средних м о ж н о проиллюстрировать простейшим примером. Предположим, мы имеем пять объектов — а, Ь, с, d, е, — для каждого из которых за даны координаты: а
Ъ
с
d
е
X
1
3
2
10
9
У
1
2
0
11
12
Затем производится с м е щ е н и е центров кластеров т а к и м образом, чтобы минимизировать расстояние между объектами внутри класте ров и максимизировать расстояние между кластерами. 4. Вычисляются средние з н а ч е н и я переменных для объектов каж дого кластера: Средние — кластер 2
Средние — кластер 1
X
2
9,5
У
1
11,5
5. Вычисленные средние становятся координатами нового центра
Уже на диаграмме рассеяния мы видим, что объекты д о л ж н ы быть сгруппированы в два четких кластера. Однако к этому еще необходи мо п р и й т и математическим путем. 1. Центры кластеров (их число определено исследователем, в на шем случае их два) задаются случайным образом. Предположим, слу чайные координаты центра первого кластера (3;3), второго — (8;8). 2. Рассчитываются расстояния от центров кластеров до всех объек тов (используется евклидово расстояние). В н а ш е м случае матрица ев клидовых расстояний будет такой: а
b
с
d
е
Центр 1
2,83
1
3,16
10,63
10,82
Центр 2
9,89
7,81
10
3,60
4,13
3. Объекты «приписываются» к тем кластерным центрам, к кото р ы м о н и ближе находятся. Так, объекты a, b и с п р и п и с ы в а ю т с я к пер вому кластеру, объекты d и е — ко второму.
каждого кластера. 6. Повторяются шаги 2—5 до момента, когда кластерные центры перестанут «мигрировать» и займут устойчивое положение. В н а ш е м простейшем случае это происходит уже на первой итера ц и и . Координаты центра первого кластера — (2;1), второго — (9,5; 11,5). Расстояния от центров кластеров до всех объектов: а
b
с
d
е
Центр 1
1
1,4
1
13
12,9
Центр 2
13,5
11,5
13,7
0,7
0,7
156
157
4.6. Кластер-анализ
Глава 4. Статистические методы в политическом анализе
Одна из проблем метода К-средних состоит в том, что результат к л а с с и ф и к а ц и и может оказаться зависимым от начальных п о з и ц и й кластерных центров, которые выбираются случайно. Если существует несколько устойчивых п о л о ж е н и й центров кластеров, анализ остано вится только на одном из них, не обязательно оптимально отражаю щем структуру изучаемой совокупности. Один из таких примеров приводится на рисунке ниже.
О ©
О О
о
•
Вернемся к нашему примеру с голосованием за политические пар тии и попробуем поработать с этими д а н н ы м и с помощью метода Ксредних. Сначала разобьем объекты на два кластера. Мы уже имеем пред ставление о структуре совокупности благодаря ранее проведенному иерархическому анализу, поэтому можем сформулировать предполо ж е н и е о том, к а к произойдет разбиение. Скорее всего, о н о будет соот ветствовать дендрограммам 1 и 2, поскольку метод К-средних исполь зует евклидову метрику, т.е. мы получим к л а с с и ф и к а ц и ю «ОВР — все остальные». Так и происходит (числа указывают расстояние каждого объекта до кластерного центра): Кластер 1
«Яблоко»
«Единство»
БЖ
КПРФ
СПС
Расстояние
1,003274
1,826990
5,639210
3,332240
3,184501
Кластер 2 Расстояние
ОВР 0
При разбиении совокупности объектов на три кластера картина получается также вполне ожидаемая — в полном соответствии с на шей содержательной интерпретацией дендрограмм.
Сравнивая внутрикластерные расстояния, можно заметить, что клас тер «"Единство" — БЖ» является менее плотным (однородным), нежели кластер «"Яблоко" — С П С — К П Р Ф » . Это также вполне согласуется с результатами иерархического кластер-анализа. Кроме того, с помощью данных о расстоянии объекта до центра кластера можно определить, на сколько «типичным» является д а н н ы й объект для кластера. Иными сло вами, находится ли он на периферии (и, следовательно, вполне может быть «притянут» другим кластером) или непосредственно возле центра кластера (т.е. является типичным представителем кластера). Кроме принадлежности объектов к кластерам и размера расстоя н и й до кластерных центров метод К-средних может дать нам и другую полезную и н ф о р м а ц и ю , в частности позволит узнать координаты каждого кластерного центра. В н а ш е м случае их будет 16 (по числу районов). Район
Номер кластера 2
3 3,93
1 39,83
Алтуфьевский
5,56
43,57
Бабушкинский
4,86
42,03
9,42 10,71
Бибирево
6,40
40,25
10,47
Бутырский
4,83
40,51
Лианозово Лосиноостровский
4,94
45,20
11,45 9,71
4,46
43,64
Марфино Марьина Роща
4,69 4,67
44,25
Останкинский Отрадное
3,85 5,06
39,97 42,42
12,52
Ростокино
4,60 4,55 4,94
41,66 43,16 45,27
11,11 10,49 9,83
4,72 4,78
44,52 44,25
10,31
Алексеевский
Свиблово Северное Медведково Южное Медведково Ярославский
41,07
12,77
10,85 10,51 11,43 10,57
10.19
158
159
4.6. Кластер-анализ
Глава 4. Статистические методы в политическом анализе
М о ж н о классифицировать любой объект, не участвовавший в ана лизе, зная его значения по п е р е м е н н ы м и координаты центров (в на шем случае — еще одна партия с результатами голосования по райо нам). Для этого надо вычислить расстояния (в евклидовой метрике) до центра первого, второго и третьего кластеров и отнести объект к ближайшему из них.
К а к видим, вклад переменных в формирование кластеров очень неравномерен. Кластерообразующими являются прежде всего пере ме нные С П С и ОВР.
Мы также имеем данные расстояний между кластерными центра ми. В н а ш е м случае наиболее удаленным от всех других является кла стер с единственным объектом — О В Р (№ 1).
Одна из сфер применения кластер-анализа, наряду с исследованиями электорального поведения, — изучение образов политиков, формиру ющихся в с о з н а н и и населения.
№1
№2
№3
№1 №2
31,9
№3
37,8
6,1
П р о ф е с с и о н а л ь н ы е статистические программы позволяют про сматривать результаты дисперсионного анализа переменных, по ко торым проходит к л а с с и ф и к а ц и я объектов методом К-средних. Так, м о ж н о о ц е н и т ь вклад каждой п е р е м е н н о й в разбиение совокупности на кластеры. Об этом свидетельствуют следующие показатели: • н а с к о л ь к о кластеры различаются между собой по этой перемен ной (межгрупповая дисперсия); • вариативность объектов внутри кластера по д а н н о й переменной (внутригрупповая дисперсия); • о т н о ш е н и е межгрупповой и внутригрупповой д и с п е р с и й (^-от н о ш е н и е ) . Ч е м сильнее различия между кластерами и чем выше одно родность объектов внутри кластеров, тем больше /"-отношение. Рассмотрим некую «инверсию» нашего примера с голосованием за партии в М о с к в е : в качестве объектов к л а с с и ф и к а ц и и возьмем райо ны Северо-Восточного АО, а в качестве переменных — политические партии. Разбив совокупность из 16 районов на 4 кластера, посмотрим на статистику д и с п е р с и о н н о г о анализа: г
Межгрупповая дисперсия
3 v vl Внутригрупповая дисперсия
F-отношение
«Яблоко»
5,96
2,23
10,67
«Единство»
4,31
6,07
2,84
БЖ
2,20
1,63
5,40
ОВР
48,59
4,83
40,22
3,09
4,72
2,61
3,30
42,95
КПРФ СПС
35,41
Кластер-анализ в исследовании образов политических лидеров
П о д о б н ы е исследования прежде всего требуют особым способом представленной исходной и н ф о р м а ц и и . Сам по себе образ политика как субъективное отражение его личности — сложная, синкретичная совокупность представлений, о щ у щ е н и й , оценок, ассоциаций. Непо средственный анализ образа статистическими методами невозможен. Поэтому в политической психологии и социологии существует прием «разложения» целостного образа на совокупность признаков, кото рые выступают его дескрипторами. Наиболее часто в качестве дес крипторов берутся качества, которые респондент приписывает (или не приписывает) данному политику. Н и ж е приводятся данные социологического опроса, проведенного Всероссийским центром изучения общественного м н е н и я ( В Ц И О М ) в марте—апреле 2000 г. Исследование было посвящено представле н и я м о л и ч н ы х качествах р о с с и й с к и х п о л и т и к о в (В.В. П у т и н , Е.М. П р и м а к о в , Г.А. Зюганов, Г.А. Я в л и н с к и й , В.В. Ж и р и н о в с к и й , Б.Н. Ельцин) в глазах населения. Основным вопросом анкеты был: «Какие из перечисленных качеств российских политиков в наиболь шей степени свойственны ... ?» Н и ж е в таблице приводятся результа ты исследования (данные стандартизированы — переведены из чис лового в п р о ц е н т н ы й формат).
Путин Примаков Зюганов Явлинский
Жири Ельцин новский
Опыт политической дея тельности
5,8
25,0
22,1
16,8
10,1
20,2
Активность, энергич ность
32,5
3,8
9,6
11,5
37,6
5,1
Профессиональные, ин теллектуальные качества
17,5
31,5
16,1
22,4
4,9
7,7
Умение связно излагать свои мысли
23,2
14,8
15,5
26,1
16,9
3,5
!6С
Глава 4. Статистические методы в политическом анализе
4.6. Кластер-анализ
Продолжение Путин Примаков Зюганов Явлинский
Жири Ельцин новский
Сдержанность, рассуди тельность
22,2
27,8
20,6
17,5
0,8
11,1
Волевые качества, муже ственность
35,9
7,8
12,5
7,8
18,0
18,0
Культура, образован ность
18,0
26,1
10,8
37,8
2,7
4,5
Государственный подход к решению проблем
23,5
27,5
19,6
12,7
5,9
10,8
Четкая, последователь ная политическая линия
19,4
16,5
31,1
16,5
7,8
8,7
Стремление к порядку и законности
31,5
14,6
20,2
12,4
14,6
6,7
Независимость
11,9
10,9
9,9
18,8
29,7
18,8
Честность, порядочность
20,2
33,3
22,6
14,3
2,4
7,1
Личное обаяние
32,9
16,5
6,3
20,3
12,7
11,4
Опыт хозяйственной деятельности
6,0
28,6
20,2
10,7
3,6
31,0
Уважительное отноше ние к простым людям
19,6
14,3
41,1
12,5
3,6
8,9
Готовность защищать ин тересы простых людей
19,3
12,3
38,6
10,5
12,3
7,0
Используя
иерархический
161
кластер-анализ,
получим дендро-
грамму:
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
Отдельный кластер образуют образы Путина и Ж и р и н о в с к о г о , причем этот кластер наиболее удален от всех остальных объектов. Также отдельный кластер формируют образы П р и м а к о в а и Явлинско го. Образы Зюганова и Ельцина м о ж н о рассматривать и как кластер, и к а к два изолированных объекта — «расстояние» между ними доста точно велико. Н а п е р в ы й взгляд, п о л у ч е н н ы е результаты в ы з ы в а ю т удивление ( о с о б е н н о б л и з о с т ь Ж и р и н о в с к о г о и П у т и н а ) . П р о в е р и м их с по м о щ ь ю метода К - с р е д н и х . П р и р а з б и е н и и на два кластера полу чим: Кластер
Расстояние
Путин
2
6,9
1
6,2
Гибкость, способность к компромиссам
19,3
21,1
8,8
21,1
10,5
19,3
Примаков Зюганов
1
8,9
Открытость, доступность
18,2
9,1
20,5
11,4
27,3
13,6
Явлинский
1
6,8
Бескорыстность
18,2
18,2
13,6
22,7
18,2
Жириновский
2
6,9
Ельцин
1
8,1
1
9,1
Используя эти данные, мы можем оценить сходство/различия обра зов политиков в многомерном пространстве дескрипторов, эти образы фиксирующих. В результате образы политиков становятся объектами (наблюдениями) многомерной классификации, а дескрипторы — клас с и ф и ц и р у ю щ и м и переменными.
2,0
Эти д а н н ы е в целом соответствуют результатам, полученным с по м о щ ь ю древовидной кластеризации. Так, совершенно четко выделен кластер, в к л ю ч а ю щ и й образы Путина и Ж и р и н о в с к о г о . Образы Яв линского и П р и м а к о в а значительно ближе к центру второго кластера (6,8 и 6,2), чем образы Ельцина (8,1) и Зюганова ( 8 , 9 ) . П р и ч и н ы появ л е н и я и м е н н о такой картины сходства образов вытекают из результа тов д и с п е р с и о н н о г о анализа, представленных в таблице: 11 - 3863
162
Глава 4. Статистические методы в политическом анализе
Межгрупповая Внутригрупповая дисперсия дисперсия
4.7. Д и с к р и м и н а н т н ы й анализ
/•-отноше ние
Опыт политической деятельности
228,85
44,67
20,49
Ахтивность, энергичность
1011,84
52,23
77,49
90,02
381,80
0,94
Профессиональные, интеллектуаль ные качества Умение связно излагать свои мысли
34,76
274,38
0,51
Сдержанность, рассудительность
79,84
373,68
0,85
Волевые качества, мужественность
317,43
231,48
5,49
Культура, образованность
119,31
797,42
0,60
Государственный подход к решению проблем
11,53
326,80
0,14
Четкая, последовательная политичес кая линия
28,36
328,73
0,35
Стремление к порядку и законности
121,62
235,45
2,07
Независимость
51,06
230,12
0,89
Честность, порядочность
86,10
540,32
0,64
Личное обаяние
112,30
315,25
1,42
Опыт хозяйственной деятельности
425,17
255,10
6,67
Уважительное отношение к простым людям
76,80
782,05
0,39
Готовность защищать интересы про стых людей
2,31
654,82
0,01
Гибкость, способность к компромис сам
9,23
143,12
0,26
Открытость, доступность
110,19
113,64
3,88
Бескорыстность
27,55
82,64
1,33
В этом примере, как и в предыдущем, переменные очень неравно мерно распределены по «вкладу» в ф о р м и р о в а н и е кластеров. Так, аб солютным «лидером» является дескриптор, связанный с активностью и энергичностью (/-отношение равно 77,5). Если мы посмотрим на исходные д а н н ы е , то увидим: и м е н н о эти качества в наибольшей сте п е н и выражены, по м н е н и ю респондентов, у Путина и Жириновско го. К р о м е того, их образы объединяет высокая о ц е н к а волевых ка честв, а это также «весомый» дескриптор (/"-отношение равно 5,5). По двум другим «сильным» дескрипторам — политическому (20,5) и хо зяйственному (6,7) опыту — образы Ж и р и н о в с к о г о и Путина сущест венно уступают образам других п о л и т и к о в (не будем забывать, что оп-
163
рос проводился в начале 2000 г., совпавшем с началом первого прези дентского срока Путина). Разумеется, полученные результаты позволяют сделать еще целый ряд выводов. Кроме того, на материале исследования качеств полити ческих лидеров можно составить представление о структуре самих дескрипторов: какие группы сходства о н и образуют. К этой теме мы еще вернемся в рамках изучения факторного анализа.
4.7. Дискриминантный анализ Д и с к р и м и н а н т н ы й анализ, наряду с алгоритмами кластер-анализа, относится к методам многомерной к л а с с и ф и к а ц и и . Однако если кла стер-анализ устанавливает близость/удаленность объектов в много мерном признаковом пространстве, то дискриминантный ана лиз определяет принадлежность объекта к одной из нескольких (как правило, двух) заданных заранее групп. М н о г о м е р н ы й характер метода объясняется тем, что решение о принадлежности объекта к группе оп ределяется на основе анализа его з н а ч е н и й по нескольким независи мым переменным. Иначе говоря, д и с к р и м и н а н т н ы й анализ устанав ливает, какие переменные лучше всего различают (дискриминируют) две или более группы. Группирующая переменная имеет порядковое или номинальное измерение, как в уже изученном нами примере с ак тивными и п а с с и в н ы м и избирателями. В такой формулировке цель д и с к р и м и н а н т н о г о анализа похожа на цель д и с п е р с и о н н о г о анализа, но д и с к р и м и н а н т н ы й анализ является гораздо более м о щ н ы м статистическим инструментом. Во-первых, в данном методе корректно использовать независимые переменные, измеренные и на порядковом, и на н о м и н а л ь н о м уровнях, и — что особенно важно — на интервальном уровне. Так, в дисперсионном анализе переменную «возраст» мы были вынуждены приводить к по рядковому виду (младший — с р е д н и й — старший), что имело след ствием потерю и н ф о р м а ц и и и ухудшение качества классификации. Очевидно, что интервальная п е р е м е н н а я «возраст» является лучшим предиктором участия в выборах, чем вероятность «человек старшего возраста скорее пойдет на выборы, чем человек младшего возраста». Во-вторых, д и с к р и м и н а н т н ы й а н а л и з использует несколько незави симых переменных, выстраивает целостную модель классификации объектов. Модель дискриминантного анализа очень напоминает модель мно жественной регрессии (в целом д и с к р и м и н а н т н ы й анализ как бы и*
164
Глава 4. Статистические методы в политическом анализе
«вбирает в себя», синтезирует черты нескольких более простых мето дов, изученных н а м и ранее). В центре д и с к р и м и н а н т н о г о анализа — вычисление так называемой дискриминантной функции. По аналогии с регрессией она рассчитывается как сумма «вклада» факторных пере менных в и з м е н е н и е зависимой переменной:
где d — значение д и с к р и м и н а н т н о й ф у н к ц и и , по которому судят о принадлежности объекта к тому или иному классу; Xj — x n — значения переменных, соответствующих рассматриваемым случаям; bj — Ь п — к о э ф ф и ц и е н т ы , определяющие вклад каждой независимой перемен ной в итоговый результат; а — константа. И м е н н о к о э ф ф и ц и е н т ы вклада и константу рассчитывает дискрим и н а н т н ы й анализ, причем таким образом, чтобы значение ф у н к ц и и (d) с м а к с и м а л ь н о возможной точностью показывало принадлеж ность объекта к классу. Расчет д и с к р и м и н а н т н о й ф у н к ц и и может осуществляться тремя о с н о в н ы м и способами: • стандартным, предполагающим включение в анализ всех неза висимых переменных одновременно; • пошаговым с включением, предполагающим включение в модель на первом шаге переменной, которая лучше всего дискриминирует за висимую переменную, на втором — вторую по «вкладу» независимую переменную и т.д.; • пошаговым с исключением, когда все п е р е м е н н ы е будут сначала включены в модель, а затем на каждом шаге будут удаляться вносящие малый вклад в предсказания. Этот метод оптимален, когда исследова тель желает оставить в модели только те факторы, которые являются с и л ь н ы м и предикторами зависимой переменной. Стандартный метод, как правило, используется в том случае, если число независимых переменных относительно невелико и каждая из них обладает предсказательной силой по отношению к зависимой пе ременной. В ситуации поискового исследования (когда в анализ вклю чается большое число переменных, причем в отношении «предсказа тельной силы» многих из них сформулированы л и ш ь самые общие предположения) рекомендуется пошаговый метод с исключением. Он позволит «очистить» модель от явно слабых предикторов. К тому же всегда полезно сопоставление результатов, полученных разными мето дами. Рассмотрим пример. Пусть зависимой (группирующей) перемен н о й , как и ранее, будет участие/неучастие в выборах. Это н о м и н а л ь -
165
4.7. Д и с к р и м и н а н т н ы й анализ
ная дихотомическая переменная с двумя з н а ч е н и я м и : 0 (неучастие); 1 (участие). В качестве независимых переменных возьмем: • Возраст — интервальная переменная, годы; • Пол — номинальная переменная (1 — мужской, 2 — ж е н с к и й ) ; • Доход — интервальная переменная, тыс. руб. Имеем следующие исходные д а н н ы е (пример учебный): №
з г *
Возраст
Пол
87
1
Участие
№
Возраст
Пол
Доход
10
1
16
77
2
4
1
0
17
35
2
6
1
Доход
Участие
19
1
I
35
1
2
0
18
51
2
0,9
1
42
1
0,6
0
19
40
2
12
1
0
20
33
2
2
5 6
19 38
1 2
3 5
1
21
21
1
8
1
7
54
2
8
1
22
84
1
2
1
8
76
2
3
1
23
67
4
1
9 10
22 34
2 2
2
24
24
2,5
0 0
1 1
25
43
1
60
0 0
39 45
54
2 3 0,7
26 27
13
1 1 1
1 2
1,5
11 12
28
55
2 2
9 6 7
1 1 1
14
48
1
29 30
2
2,2
1
35
0 0
70
15
0,5 0,9
46
2
3
1
20
1
1
1
Вычислительный алгоритм д и с к р и м и н а н т н о г о анализа относи тельно сложен, и мы не будем здесь рассматривать его подробно. Ска жем л и ш ь , что в нем используются элементы дисперсионного анали за, а ключевые вычислительные процедуры базируются на алгоритмах канонического анализа. Этот метод, к а к и изученный нами метод Пир сона, выявляет к о р р е л я ц и и , но не между двумя переменными, а меж ду двумя множествами переменных. Остановимся на интерпретации ключевых позиций весьма обшир ной итоговой статистики д и с к р и м и н а н т н о г о анализа. В первую очередь (как и в регрессионном анализе) рассматривает ся статистика, свидетельствующая о качестве полученной модели. Сначала анализируется д и с п е р с и о н н а я статистика для изучаемых пе ременных, которая включает: • таблицу средних значений каждой переменной для: (а) группы «неучаствующих» (участие = 0), (б) группы «участвующих» (участие = 1) и (в) обеих групп вместе;
166
4.7. Дискриминантный анализ
Глава 4. Статистические методы в политическом анализе
•значения теста на значимость различий средних переменных в группах «участвующих» и «неучаствующих». В качестве тестовой вели чины в дискриминантном анализе обычно служит лямбда (X) Уилка (Wilk's Lambda), иногда используется и простой дисперсионный анализ. Средние значения переменных Группа
Возраст
Пол
Участие = 0
54,89
1,67
5,2
Участие = 1
32,08
1,25
9,73
Обе группы
45,77
1,5
7,01
Доход
Значимость различий средних значений Лямбда Уилка
/)-значение
Возраст
0,619915
0,000305
Пол
0,408189
0,123504
Доход
0,538459
0,002121
d = 0,05 х Возраст,, + 0,81 х П о л „ + 0,29 х Доход,- - 4,69. Нестандартизированные коэффициенты нельзя сравнивать непо средственно. Фактически это прямой аналог коэффициента b в множе ственном регрессионном анализе. Стандартизированные же коэффици енты отражают «вклад» каждой независимой переменной в изменение зависимой и в этом отношении являются прямыми аналогами бета-ко эффициентов множественной регрессии. Наши предположения, осно ванные на анализе дисперсионной статистики, подтвердились: самым весомым фактором оказался возраст (стандартизированный коэффици ент 0,85), несколько слабее фактор уровня доходов (0,74), существенно слабее — фактор половой принадлежности (0,38). Используя н е с т а н д а р т и з и р о в а н н ы е к о э ф ф и ц и е н т ы , мы можем вычислить все значения д и с к р и м и н а н т н о й ф у н к ц и и для наших слу чаев. К примеру, значение d для случая 1 составит: d= 3,54 = 0,05 х 87 + 0,81 х 1 + 0,29 х 10 - 4,69.
Гипотеза о различии средних полностью подтвердилась для пере менных «возраст» и «доход». П е р е м е н н а я «пол» не проходит тест на уровне /КО,05, однако пока что (в учебных целях) оставим ее в модели. Теперь можно сделать предположение об «удельном весе» каждой пе ременной в конечной дискриминантной функции, исходя из /ьзначения лямбды Уилка. Так, наибольший вклад в дискриминацию внесет пере менная «возраст», для которой р-значение самое низкое — 0,000305. На втором месте «доход», на третьем — с большим отставанием — «пол». Рассчитанные к о э ф ф и ц и е н т ы самой д и с к р и м и н а н т н о й ф у н к ц и и представлены в стандартизированном и нестандартизированном виде (округлены до второго знака после запятой); в статистических про граммах о н и о б о з н а ч а ю т с я к а к Standardized ( U n s t a n d a r d i z e d ) Canonical Discriminant Function Coefficients. Стандартизированные коэффициенты
167
Нестандартизированные коэффициенты
Возраст
0,85
Возраст
0,05
Пол
0,38
Пол
0,81
Доход
0,74
Доход
0,29
Константа
-4,69
Нестандартизированные к о э ф ф и ц и е н т ы — это те, по которым, собственно, и рассчитываются з н а ч е н и я д и с к р и м и н а н т н о й ф у н к ц и и (множители заданных значений п е р е м е н н о й ) . В нашем случае:
Д л я случая 2d= - 2 , 6 = 0,05 х 19 + 0,81 х 1 + 0,29 х 1 - 4,69 и т.д.
№ Возраст Пол Доход Участие 1
87
2
19
3
d
№ Возраст Пол Доход Участие
d
1
3,54
16
77
2
4
1
2,11
0
-2,60
17
35
2
6
1
0,49
2
0
-1,47
18
51
2
0,9
1
-0,14
1
0,6
0
-1,51
19
40
2
12
1
19
1
3
0
-2,02
20
33
2
2
6
38
2
5
1
0,36
21
21
1
8
1
7
54
2
8
1
2,05
22
84
1
2
1
1,09
8
76
1
1,77
23
67
1
4
1
0,77
9
22
0
-1,34
24
24
1
1
10
34
2
2,5
0
-0,57
25
43
1
1,5
1
-1,20
11
60
1
2
1
-0,17
26
39
2
9
1
1,55
12
20
1
3
0
-1,97
27
45
2
6
1
1,01
13
54
1
0,7
0
-0,85
28
55
2
7
1
1,82
14
48
1
0,5
0
-1,22
29
70
2
2,2
1
1,23
15
35
1
0,9
0
-1,79
30
46
2
3
1
0,20
1
10
1
1
~35~~
1
4
42
5
2 3 _____ _____
2,47 -0,76 -0,49
-2,34
Но каким образом по з н а ч е н и ю ф у н к ц и и определить, к какой группе принадлежит объект? Для этого рассчитываются так называе-
168
мые групповые центроиды дискриминантной функции. Делается это очень просто: рассчитываются средние значения д и с к р и м и н а н т н о й функции для группы «участвующих» (участие = 1) и для группы «неучаствующих» (участие = 0). В нашем случае: Групповые центроиды Участие = 0
-1,54
Участие = 1
1,03
И м е н н о групповые центроиды являются «критериями» для отне сения объекта к той или иной группе. Вычисляется расстояние между значением д и с к р и м и н а н т н о й ф у н к ц и и в конкретном случае и обоими центроидами. Если значение ближе к центроиду группы «участие = 0», объект классифицируется как принадлежащий к группе «неучаст вующих», и наоборот. Наличие подсчитанных значений д и с к р и м и н а н т н о й ф у н к ц и и по зволяет дополнительно оценить качество модели. Так, мерами удачности д и с к р и м и н а н т н о й ф у н к ц и и служат:
169
4.8. Ф а к т о р н ы й анализ
Глава 4. Статистические методы в политическом анализе
Исходные
% Всего
Результаты классификации Всего Предсказания Участие = 1 Участие = 0 12 0 12 18 16 2 100 0 100 100 88,89 11,11 93,3% случаев классифицированы корректно
К а к видно из итоговой таблицы, два «активных» избирателя были ошибочно к л а с с и ф и ц и р о в а н ы как «пассивные» (в нашем примере это случаи 21 и 25). Постарайтесь самостоятельно определить, почему и м е н н о эти случаи оказались «ошибочными». Если бы мы использовали для тех же самых данных пошаговый анализ с исключением, то переменных в модели оказалось бы всего две: «возраст» и «доход». При этом ее качество снизилось бы очень не существенно. Это означает, что о б ы ч н о интервальные переменные являются куда лучшими предикторами, чем номинальные. Стандартный метод (три переменные в модели)
Пошаговый метод с исключением (две переменные в модели)
• канонический корреляционный коэффициент между ее з н а ч е н и я м и и показателем принадлежности к группе. В нашем примере он равен 0,793, что свидетельствует о достаточно высоком качестве модели;
р-значение лямбды Уилка
0,0000009
0,000006
•лямбда Уилка, показывающая, значимо ли в обеих группах (учас твующих и неучаствующих) различие в средних значениях дискрими н а н т н о й ф у н к ц и и . В нашем случае р = 0,0000009, что свидетельствует об очень высокой значимости;
Канонический коэффици ент корреляции
0,793
0,769
Собственное значение
1,69
1,45
Процент корректно клас сифицированных случаев
93,3
93,3
• собственное значение (eigenvalue), соответствующее отношению сум мы квадратов между группами к сумме квадратов внутри групп. Это зна чение можно получить, проведя дисперсионный анализ значений дис к р и м и н а н т н о й ф у н к ц и и по переменной «участие». Чем больше собственное значение (относительно 1), тем лучше подобрана функция. В нашем случае eigenvalue = 1,69, что также можно считать хорошим по казателем. Однако наиболее комплексным показателем качества модели явля ется сопоставление результатов классификации, произведенной с помо щью дискриминантной функции по значениям независимых перемен ных, и исходных значений зависимой переменной. Проще говоря, нас интересует процент соответствия предсказаний модели и истинных зна чений. В нашем случае модель неверно классифицировала два случая из 30, что составляет 6,6%. Правильно классифицированных случаев — 28, или 93,3%:
4.8. Факторный анализ Ф а к т о р н ы й анализ является одним из наиболее мощных статистиче ских средств анализа данных. В его основе лежит процедура объеди нения групп коррелирующих друг с другом переменных («корреляци онных плеяд» или «корреляционных узлов») в несколько факторов. Иными словами, цель факторного анализа — сконцентриро вать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристик, которые, однако, не поддаются непосредственному измерению (и в этом смысле я в л я ю т с я латентными). Для п р и м е р а гипотетически представим себе законодательный ор ган регионального уровня, состоящий из 100 депутатов. В числе раз-
170
Глава 4. Статистические методы в политическом анализе
171
4.8. Ф а к т о р н ы й анализ
ных вопросов повестки д н я на голосование выносятся: а) законопро
в действительности ф а к т о р н ы й анализ э ф ф е к т и в н о обрабатывает ин
ект, предлагающий восстановить памятник В.И. Ленину на централь
тервальные д а н н ы е .
н о й площади города — административного центра региона; б) обра щ е н и е к Президенту РФ с требованием вернуть в государственную собственность все стратегические производства. Матрица сопряжен ности показывает следующее распределение голосов депутатов:
Обращение к Президенту (за)
Обращение к Президенту (против)
Памятник Ленину (против)
49
4
выделяя узлы взаимосвязанных признаков и сводя их к неким обоб
6
41
щ е н н ы м факторам, уменьшает исходный базис признаков о п и с а н и я .
мятника Ленину, поддерживают и возвращение в государственную соб ственность стратегических предприятий. Аналогичным образом боль шинство противников восстановления памятника являются в то же время и противниками возврата предприятий в госсобственность. При этом тематически голосования между собой совершенно не связаны. что в ы я в л е н н а я статистическая связь
обусловлена существованием некоторого скрытого (латентного) фак тора. Законодатели, формулируя свою точку зрения по самым разно образным вопросам, руководствуются ограниченным, н е б о л ь ш и м на бором политических п о з и ц и й . В д а н н о м случае м о ж н о предположить наличие скрытого раскола депутатского корпуса по критерию под консервативно-социалистических ценностей.
Выделяется группа «консерваторов» (согласно н а ш е й таблице сопря ж е н н о с т и — 49 депутатов) и их оппонентов (41 депутат). Выявив такие расколы, мы сможем описать большое число отдельных голосований через небольшое число факторов, которые являются л а т е н т н ы м и в том смысле, что мы не можем их обнаружить непосредственно: в на шем гипотетическом парламенте ни разу не проводилось голосова н и е , в ходе которого депутатам предлагалось бы определить свое от ношение
к
по крайней мере три «типовые» цели факторного анализа:
Памятник Ленину (за)
большинство депутатов, поддерживающих идею восстановления па
держки/отвержения
причин большой востребованности данного метода состоит в разнооб разии задач, которые можно решать с его п о м о щ ь ю . Так, выделяются
Очевидно, что голосования статистически связаны: подавляющее
Л о г и ч н о предположить,
Факторный анализ очень активно используется как в политической науке, так и в «соседних» социологии и психологии. Одна из важных
консервативно-социалистическим
ценностям.
Мы
обнаруживаем наличие данного фактора, исходя из содержательного 1
анализа количественных связей между переменными . П р и ч е м , если в н а ш е м примере сознательно взяты номинальные п е р е м е н н ы е — поддержка законопроекта с категориями «за» (1) и «против» (0), — то
'уменьшение размерности
(редукция)
данных.
Факторный
анализ,
Решение этой задачи важно в ситуации, когда объекты измерены боль ш и м числом переменных и исследователь ищет способ сгруппировать их по смысловому признаку. Переход от множества переменных к не скольким факторам позволяет сделать описание более компактным, избавиться от малоинформативных и дублирующих переменных; •выявление
структуры
объектов
или
признаков
(классификация).
Эта задача близка к той, которая решается методом кластер-анализа. Но если кластер-анализ принимает за «координаты» объектов их зна чения по н е с к о л ь к и м п е р е м е н н ы м , то ф а к т о р н ы й анализ определяет положение объекта относительно факторов (связанных групп пере менных). И н ы м и словами, с п о м о щ ь ю факторного анализа можно оценить сходство и различие объектов в пространстве их корреляци онных связей, или в факторном пространстве. Координатными осями факторного пространства выступают полученные латентные пере менные, на эти оси проецируются рассматриваемые объекты, что по зволяет создать наглядное геометрическое представление изучаемых данных, удобное для содержательной интерпретации; • косвенное измерение. Ф а к т о р ы , являясь латентными (эмпиричес ки не наблюдаемыми), не поддаются непосредственному измерению. Однако ф а к т о р н ы й анализ позволяет не только выявить латентные п е р е м е н н ы е , но и оценить количественно их значение для каждого объекта. Рассмотрим алгоритм и интерпретацию статистики факторного анализа на примере д а н н ы х о результатах парламентских выборов в Рязанской области 1999 г. (общефедеральный округ). Для упрощения примера возьмем электоральную статистику только по тем партиям, которые преодолели 5%-ный барьер. Д а н н ы е взяты в разрезе террито риальных избирательных к о м и с с и й (по городам и районам области).
Более п о д р о б н о об и с п о л ь з о в а н и и ф а к т о р н о г о анализа в и с с л е д о в а н и и парламент ских г о л о с о в а н и й см.: Сатаров, Г. А, Р о с с и й с к и е съезды // Р о с с и й с к и й м о н и т о р 1992-1993. № 1-3.
Первым шагом будет стандартизация данных путем перевода их в стандартные баллы (так называемые ^-баллы, рассчитываемые с по м о щ ь ю ф у н к ц и и нормального распределения).
172
ТИК «Ябло «Единст (территориальная ко» во» избирательная комиссия)
Блок Жириновского (БЖ)
ОВР
КПРФ СПС
Ермишинская
1,49
35,19
6,12
5,35
31,41
2,80
Захаровская
2,74
18,33
7,41
11,41
31,59
^бз"
Кадомская
1,09
29,61
8,36
5,53
35,87
1,94
Касимовская
1,30
39,56
5,92
5,28
29,96
2,37
Касимовская городская
3,28
39,41
5,65
6,14
24,66
4,61
-0,91
-0,17
-0,74 0,43
То же в стандартизированных баллах (г-баллах) Ермишинская
-0,83
1,58
-0,25
Захаровская
-0,22
-1,16
0,97
0,44
-0,14
Кадомская
-1,03
0,67
1,88
-0,87
0,59
-1,10
Касимовская
-0,93
2,29
-0,44
-0,92
-0,42
-0,92
Касимовская городская
0,04
2,26
-0,70
-0,73
-1,32
0,01
И т.д. (всего 32 случая)
-0,55
БЖ
-0,47
ОВР КПРФ СПС
Остановимся на интерпретации собственных значений, фактор ных значений и факторных нагрузок. Собственные значения факторов для нашего случая таковы: Собственное значение
% общей вариации
1
3,52
58,75
2
1,14
19,08
3
0,76
12,64
4
0,49
S.22
5
0,05
0.80
0,27
6
0,03
0,51
Всего
6
100%
«Единство»
БЖ
ОВР
КПРФ
«Яблоко» «Единство»
Это две разные плеяды, а не одна, так как между «Единством» и К П Р Ф связи нет (0,01). Относительно переменной БЖ предположе ние сделать сложнее, здесь к о р р е л я ц и о н н ы е связи менее выражены. Чтобы проверить н а ш и предположения, необходимо вычислить собственные значения факторов (eigenvalues), факторные значения (factor scores) и факторные нагрузки (factor loadings) для каждой пере менной. Такие расчеты достаточно сложны, требуют серьезных навы ков работы с матрицами, поэтому здесь мы не станем рассматривать вычислительный аспект. Скажем л и ш ь , что эти вычисления могут осуществляться двумя путями: методом главных компонент (principal components) и методом главных факторов (principal factors). Метод главных компонент более распространен, статистические программы используют его «по умолчанию».
Фактор
Далее на стандартизированных данных рассчитывается матрица парных корреляций (интеркорреляций): «Яблоко»
173
4.8. Ф а к т о р н ы й анализ
Глава 4. Статистические методы в политическом анализе
0,60
-0,72
-0,61
0,01
0,10
-0,48
0,94
-0,45
-0,39
0,52
СПС
-0,47 -0,67
Уже визуальный анализ матрицы парных корреляций позволяет сделать предположения о составе и характере корреляционных плеяд. К примеру, положительные корреляции обнаруживаются для «Союза правых сил», «Яблока» и блока «Отечество — вся Россия» (пары «Яб локо» - ОВР, «Яблоко» - С П С и О В Р - С П С ) . Одновременно эти три переменные отрицательно коррелируют с К П Р Ф (поддержка К П Р Ф ) , в меньшей степени — с «Единством» (поддержка «Един ства») и в еще м е н ь ш е й — с переменной БЖ (поддержка «Блока Жи риновского»). Таким образом, предположительно мы имеем две выра ж е н н ы е к о р р е л я ц и о н н ы е плеяды: • («Яблоко» + О В Р + С П С ) — К П Р Ф ; • («Яблоко» + О В Р + С П С ) - «Единство».
Чем больше собственное значение фактора, тем больше его объяс нительная сила (максимальное значение равно количеству перемен ных, в нашем случае 6). Одним из ключевых элементов статистики факторного анализа является показатель «% общей вариации» (% total variance). Он показывает, какую долю вариации (изменчивости) пере менных объясняет извлеченный фактор. В нашем случае вес первого фактора превосходит вес всех остальных факторов, вместе взятых: он объясняет почти 59% общей вариации. Второй фактор объясняет 19% вариации, третий — 12,6% и т.д. по убывающей. Имея собственные значения факторов, мы можем приступить к р е ш е н и ю задачи сокращения размерности данных. Редукция про изойдет за счет исключения из модели факторов, обладающих на именьшей объяснительной силой. И здесь ключевой вопрос состоит в том, сколько факторов оставить в модели и какими критериями при
174
175
4.8. Факторный анализ
Глава 4. Статистические методы в политическом анализе
этом руководствоваться. Так, я в н о л и ш н и м и являются факторы 5 и 6, в совокупности объясняющие чуть более 1% всей вариации. А вот судьба факторов 3 и 4 уже не столь очевидна. К а к правило, в модели остаются факторы, собственное значение которых превышает единицу (критерий Кайзера). В нашем случае это факторы 1 и 2. Однако полезно проверить корректность удаления че тырех факторов с помощью других критериев. Одним из наиболее ш и р о к о используемых методов является анализ «графика осыпи» (scree plot). Д л я нашего случая он имеет вид:
воспроизведенных корреляций содержит к о э ф ф и ц и е н т ы , которые удалось восстановить по двум оставленным в модели факторам. Осо бое значение в ней имеет главная диагональ, на которой расположены общности переменных (в таблице выделены курсивом), которые пока зывают, насколько точно модель воспроизводит корреляцию перемен ной с той же переменной, которая должна составлять единицу. Матрица остаточных к о э ф ф и ц и е н т о в содержит разность между исходным и воспроизведенным к о э ф ф и ц и е н т а м и . Например, вос произведенная корреляция между п е р е м е н н ы м и С П С и «Яблоко» со ставляет 0,88, исходная - 0,94. Остаток = 0,94 - 0,88 = 0,06. Чем ни же значения остатков, тем выше качество модели. Воспроизведенные корреляции
«Яблоко» «Яблоко»
«Единство»
БЖ
ОВР
-0,53
0,80
БЖ
-0,47
0,59
0,73
-0,72
-0,56
0,76
-0,70
0,01
0,12
-0,34
-0,40
0,66
КПРФ СПС
СПС
0,89
«Единство»
ОВР
КПРФ
0,88
-0,43
0,44 0,89 -0,77
0,88
КПРФ
СПС
Остаточные коэффициенты 1
2
3
4
5
6
7
График получил свое название из-за сходства со склоном горы. «Осыпь» — геологический термин, обозначающий обломки горных пород, скапливающиеся в н и ж н е й части скалистого склона. «Ска ла» — это по-настоящему влиятельные факторы, «осыпь» — статисти ческий шум. Образно говоря, нужно найти место на графике, где кон чается «скала» и начинается «осыпь» (где убывание собственных значений слева направо сильно замедляется). В нашем случае выбор нужно сделать из первого и второго перегибов, соответствующих двум и четырем факторам. Оставив четыре фактора, мы получим очень вы сокую точность модели (более 98% общей вариации), но сделаем ее до статочно сложной. Оставив два фактора, мы будем иметь значитель ную необъясненную часть вариации (около 22%), но модель станет л а к о н и ч н о й и удобной в анализе (в частности, визуальном). Таким об разом, в д а н н о м случае лучше пожертвовать некоторой долей точнос ти в пользу компактности, оставив первый и второй факторы. Проверить адекватность полученной модели можно с помощью специальных матриц воспроизведенных корреляций (reproduced corre lations) и остаточных к о э ф ф и ц и е н т о в (residual correlations). Матрица
«Яблоко» «Яблоко»
«Единство»
БЖ
ОВР
0,11 -0,02
0,20
0,00
-0,31
-0,13
-0,01
0,09
0,24
КПРФ
0,09
0,00
-0,02
-0,14
0,11
СПС
0,06
-0,03
0,01
-0,14
0,10
«Единство» БЖ
ОВР
0,56
0,12
Как видно из матриц, двухфакторная модель, будучи в целом адек ватной, плохо объясняет отдельные связи. Так, очень низкой является общность переменной БЖ (всего 0,56), слишком велико значение ос таточного к о э ф ф и ц и е н т а связи БЖ и «Единства» (-0,31). Теперь необходимо решить, насколько важным для данного кон кретного исследования является адекватное представление перемен ной Б Ж . Если важность высока (к примеру, если исследование посвя щено анализу электората и м е н н о этой партии), корректно вернуться к четырехфакторной модели. Если нет, м о ж н о оставить два фактора.
176
Глава 4. Статистические методы в политическом анализе
4.8. Факторный анализ
П р и н и м а я во в н и м а н и е учебный характер наших задач, оставим более простую модель.
К
РНЫе
Н