В. В. Давние, В. И. Тинякова
ПРОГНОЗНЫЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ
Издательство Воронежского государственного уни...
30 downloads
237 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
В. В. Давние, В. И. Тинякова
ПРОГНОЗНЫЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ
Издательство Воронежского государственного университета 2005
УДК 681.3.07.+65.01(075.8) ББК 65.23 Д13 Р е ц е н з е н т ы : д-р экон. наук, проф. Д. В. Соколов (Санкт-Петербургский государственный университет экономики и финансов); д-р физ.-мат. наук, проф. А. Б. Секерин (Орловский государственный университет) Давние, В. В. Прогнозные модели экспертных предпочД13 тений: монография / В. В. Давние, В. И. Тинякова; Во ронеж, гос. ун-т. — Воронеж: Изд-во Воронеж, гос. ун-та, 2005. - 248 с. - ISBN 5-9273-0785-х В монографии исследуются проблемы прогнозирования дан ных нечисловой природы. Обостренный интерес к этим пробле мам определяется прежде всего возросшей в современных усло виях потребностью в прогнозных решениях, для надежного обо снования которых недостаточно фактографической информации и требуется использование экспертных эвристик. Предлагается подход, закладывающий основы прогнозирования в номиналь ных и ранговых шкалах и обеспечивающий возможность прове дения комбинированных прогнозных расчетов. Издание ориентировано на слушателей магистерских про грамм, аспирантов и преподавателей экономических вузов, а также всех, кто интересуется прикладными аспектами математи ческого моделирования социально-экономических процессов с учетом экспертных предпочтений. УДК 681.3.07.+65.01 (075.8) ББК 65.23
ISBN 5-9273-0785-х
© Давние В. В., Тинякова В. И., 2005 © Издательство Воронежского государственного университета, 2005
О Г Л А В Л Е Н И Е Предисловие 5 Г л а в а 1. Субъективные измерения в экономике 7 1.1. Основные понятия теории субъективных измерений 7 1.2. Проблемы субъективных измерений 11 1.3. Шкалы измерений 12 Г л а в а 2. Методы экспертного оценивания 19 2.1. Неопределенность и экспертные оценки 19 2.2. Методы индивидуального и группового экспертного оценивания 24 2.3. Проверка согласованности мнений экспертов 33 Г л а в а 3. Эконометрические модели экспертных предпочтений 47 3.1. Экспертные оценки и модели бинарного выбора 47 3.1.1. Концептуальные основы моделирования экспертных предпочтений 47 3.1.2. Эконометрический подход к построению моделей субъективных предпочтений 50 3.1.3. Принципы формирования псевдовыборочных совокупностей 53 3.1.4. Оценка надежности и согласованности результатов моделирования экспертных предпочтений 57 3.1.5. Предельный анализ моделей субъективных предпочтений 62 3.2. Методы оценивания моделей бинарного выбора 65 3.2.1. Метод максимального правдоподобия 65 3.2.2. Численное решение с помощью метода Ньютона — Рафсона 68 3.2.3. Итерационная схема обобщенного МНК (метод Берксона) 69 3.3. Оценка качества пробит- и логит-моделей 74 3.3.1. Адекватность 74 3.3.2. Статистическая значимость коэффициентов 75 3.3.3. Стандартные ошибки предсказанных вероятностей и предельных эффектов 78 3.3.4. Тесты для проверки линейных гипотез 80 3.4. Эконометрический прогноз экспертных предпочтений в задачах выбора наиболее перспективных сегментов рынка 87 3.5. Модели множественного выбора в экспертном оценивании будущего 100 3.5.1. Мультиномиальная логит-модель множественного выбора 100 3
3.5.2. Модели множественного выбора в задачах оценки инвестиционных проектов 107 3.5.3. Пробит- и логит-модели множественного выбора в ранговых шкалах 113 3.5.4. Преференция условий ведения бизнеса на основе прогнозных рейтинговых решений 117 Г л а в а 4. Экспертные оценки в комбинированных прогнозных расчетах 130 4.1. Мультитрендовая модель с вероятностной оценкой вариантов 131 4.2. Прогнозирование прибыли предприятия с помощью комбинированной модели 137 4.3. Адаптивные модели прогнозирования 145 4.4. Имитационное моделирование на основе адаптивной схемы прогнозных расчетов 153 4.5. Адаптивное моделирование переходных процессов в комбинированных прогнозах 160 Г л а в а 5. Комбинированные прогнозы многомерных процессов 172 5.1. Модель с детерминированным матричным предиктором 172 5.2. Модель с настраиваемым параметром матричного предиктора 176 5.3. Модель с адаптивным матричным предиктором 181 5.4. Матричная модель с разделенными переменными 187 5.5. Вычислительная схема комбинированных прогнозных расчетов для многомерных процессов 189 5.6. Многоуровневое комбинированное прогнозирование основных показателей социально-экономического развития региона 204 Заключение 222 Библиографический список 223 Приложения 228 П р и л о ж е н и е 1. Система основных показателей социальноэкономического развития региона 228 П р и л о ж е н и е 2. Основные показатели социальноэкономического развития Воронежской области за 2000—2002 гг., млн р., в ценах соответствующих лет 232 П р и л о ж е н и е 3. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2003 г., млн р 235 П р и л о ж е н и е 4. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2004 г., млн р 238 П р и л о ж е н и е 5. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2005 г., млн р 241
ПРЕДИСЛОВИЕ Российская экономическая наука проявила особое внимание к проблемам прогнозирования после некоторого переосмысления новых условий хозяйствования. Пришло понимание того, что только прогноз как вероятностное представление о перспективах изучаемого объекта в будущем позволяет менеджерам разных уров ней увидеть основные ориентиры происходящих перемен. Это дает им возможность принимать обоснованные решения, поскольку любое управленческое решение в конечном счете является своеоб разной реакцией на прогнозное представление о будущем управля емого объекта. Кроме того, благодаря прогнозам менеджеры по лучают возможность своевременно оценить опасность рисков и уг роз, а следовательно, принять упреждающие меры для избежания "шока будущего". В настоящее время круг задач прогнозирования существенно расширился. Прогноз стал средством определения основных харак теристик, приоритетов и направлений государственной экономи ческой и социальной политики. Более того, в современных усло виях на федеральном и региональном уровнях прогнозные разработ ки стали доминировать над плановыми. Об этом, в частности, свидетельствует Федеральный закон "О государственном прогнози ровании и программах социально-экономического развития Россий ской Федерации" от 20 июля 1995 г., в котором конституционно закрепляется необходимость в научной разработке прогнозов. Фак тически он ориентирует на усиление прогностической направлен ности всех аналитических документов, разрабатываемых властны ми структурами. Логическим следствием усиления роли прогнозирования в реше нии задач современного управления явилось повышение требований к обоснованности и надежности прогнозных оценок. Применение традиционных методов прогнозирования не обеспечивает необходи мого уровня надежности вследствие неопределенности и отсутствия стабильности в социально-экономическом развитии России. Пре одолеть такой барьер можно только в том случае, если наряду с экстраполяционными методами использовать уникальные знания человека и его внутреннюю информацию, не доступную количе ственным методам. Все это требует новых методов и подходов, по зволяющих не только дополнять прогнозные расчеты экспертными оценками, но и применять на регулярной основе прогнозные мо дели экспертных предпочтений. 5
Монография как раз и вводит в круг проблем построения таких моделей. В ней подробно рассмотрены два направления. Одно из них основано на использовании эконометрических моделей каче ственных переменных, а другое — на инкорпорировании эксперт ных ожиданий в расчетные траектории адаптивно-имитационных моделей прогнозирования. В рамках первого направления детально рассмотрены методы построения и тестирования статистической надежности моделей бинарного и множественного выбора. С их помощью удается понять суть прогнозных расчетов в номинальных и ранговых шкалах, а так же дополнить аппарат анализа нечисловых данных процедурами ис следования предельных эффектов. Особый интерес представляет возможность применения этих моделей для предсказания экспертных предпочтений. Практическую реализацию данной возможности предлагается осуществлять с помощью псевдовыборочных совокуп ностей, при формировании которых эксперты должны руководство ваться специально разработанными для этих целей принципами. Второе направление предусматривает построение прогнозных моделей на основе авторского подхода, заключающегося в реали зации идеи комбинирования с распределенным во времени доми нированием адаптивных принципов и экспертных предпочтений. Такой подход позволяет повысить надежность прогнозных расчетов по коротким и нестабильным временным рядам за счет использо вания максимально возможного объема информации. Все расчеты, иллюстрирующие прикладные возможности пред ложенных моделей, проведены с использованием реальных дан ных, а содержательная интерпретация результатов моделирования имеет практическую направленность. Вклад авторов в подготовку материалов монографии распреде лен следующим образом: В. В. Давние, доктор экономических наук, профессор, — предисловие, главы 2, 3 (3.2; 3.3; 3.5), 4 (4.3; 4.4), 5 (5.1; 5.2; 5.3; 5.4), заключение; В. И. Тинякова, кандидат экономических наук, — предисловие, главы 1, 3 (3.1; 3.4; 3.5), 4 (4.1; 4.2; 4.5), 5 (5.5; 5.6), заключение, приложения. Особую признательность авторы выражают своим коллегам из Во ронежского государственного университета — проректору по науке А. С. Сидоркину, декану экономического факультета В. П. Бо чарову, декану факультета международных отношений О. Н. Беленову, зав. кафедрой экономического анализа и аудита Д. А. Ендовицкому, благодаря поддержке которых монография вышла в свет.
6
ГЛАВА 1 СУБЪЕКТИВНЫЕ ИЗМЕРЕНИЯ В ЭКОНОМИКЕ 1.1. Основные понятия теории субъективных измерений В прогнозных расчетах, как правило, приходится оперировать с тремя типами переменных: количественными, ран говыми и номинальными. Причем эти типы переменных могут быть как исходными данными для построения моделей, так и результатами прогнозирования. Поэтому предварительная обработ ка исходных данных, также как и использование прогнозных оце нок в перспективном анализе, требуют специальных подходов в зависимости от типа переменных. Процедуры сравнения и обра ботки данных в этих подходах со всей очевидностью должны адек ватно учитывать природу и характер исходной и расчетной инфор мации. Причем в отдельных ситуациях сравнение осуществляется только по некоторым свойствам, используемым для установления определенного отношения, в котором находятся сравниваемые объекты. В других же случаях для сравнения используются чис ловые величины, соответствующие ожидаемым свойствам, фактам и т.п. Есть ситуации, когда сравнения можно осуществлять с эталоном (единицей измерения). Разработкой методов и подхо дов, обеспечивающих объективность сравнений в различных ситу ациях, занимается теория измерений [34, 45]. Рассмотрим основные понятия теории измерений. Для этого дадим определение следующим терминам: объект измерения, по казатель (признак), процедуры сравнения. Объектами измерения могут быть предметы, явления, решения. В качестве показателей используются характеристики объектов различной природы (пространственно-временные, физические, физиологические, психологические и др.). Процедуры сравнения включают определенные отношения меж ду объектами и способ сравнения объектов. Так как сравнение количественных данных не вызывает затруднений, то рассмотрим сравнение объектов, не имеющих количественного описания. 7
Сравнение таких объектов, как правило, носит качественный характер: "больше", "меньше", "равны", "лучше", "хуже", "одинаковы", "предпочтительнее" и т.п. Способ сравнения оп ределяет, например, сравнение всех объектов последовательно с одним объектом или сравнение всех объектов друг с другом в произвольной последовательности. Для формального описания множества объектов и отношений между ними вводится понятие эмпирической системы с отноше ниями M={0;R), (1.1) где 0={Ор 02, ..., 0п} — множество объектов; R={Rp R2, ..., RJ — множество отношений. Запись OjRkOj означает, что объект О- находится в отношении Rk к объекту О. Такое отношение называется двухместным (бинар ным). Могут быть трехместные отношения. Реально применяемые отношения обычно обладают определен ным набором свойств. В качестве основных свойств можно на звать следующие: 1) отношение R рефлексивно, если О/RО, истинно; 2) отношение R антирефлексивно, если OjROl ложно; 3) отношение R симметрично, если из О/RO- следует OjRO:, 4) отношение R антисимметрично, если из OtRO- и O^ROj следует 0-=0:, 5) отношение R несимметрично (асимметрично), если из ис тинности OJROJ следует, что ОАО; ложно; 6) отношение R транзитивно, если из ОАО; и OjROk следует 0,ROk, где О., Ор ОкеО; 7) отношение R линейно (связно), если для любых Ор Oj€ О либо OJROJ, либо OjRO- истинно, либо они оба истинны. В практике проведения различных исследований часто ис пользуются отношения, обладающие не всем набором свойств, а только некоторыми из вышеперечисленных. Примерами подоб ных отношений являются отношения, определения которых при водятся ниже. Отношение R называется отношением частичного порядка, если оно рефлексивно, антисимметрично и транзитивно. Отношение R называется отношением линейного порядка, если оно рефлексивно, антисимметрично, транзитивно и связно, т.е. отношение линейного порядка, обладающее свойством связности. 8
Иногда рассматривают отношения строго частичного или линей ного порядка, обладающие свойством антирефлексивности, а так же отношения квазипорядка (предпорядка, почти порядка), не обладающие свойством антисимметричности. Отношение R называется толерантностью, если оно рефлек сивно и симметрично. Отношение R называется эквивалентностью, если оно рефлек сивно, симметрично и транзитивно, т.е. эквивалентность — это толерантность, обладающая свойством транзитивности. Интерес вызывают возможные способы представления резуль татов таких сравнений. В принципе информация об отношени ях может быть задана различными способами. Например, можно перечислить объекты, принадлежащие отношению. Но это не всегда удобно. Более распространен матричный способ представ ления информации об отношениях. Суть задания отношения с помощью такого способа в следу ющем. Строки и столбцы матрицы ||/•.. || отношения R соответству ют элементам всего множества объектов, т.е. матрица квадратная. Иногда матрицу отношений обозначают M(R). Пусть R — отношение частичного или линейного порядка. Тогда, если объект Oj предшествует О, т.е. принадлежит отно шению R, то на пересечении /-й строки и у'-го столбца в матри це отношений ставится 1, в противном случае — 0: 1, если (О,, г =i V
Oj)eR; (К2)
О, если (О,, O^tR.
Аналогично, с помощью матрицы ||/v||, можно задать инфор мацию об отношениях толерантности или эквивалентности. Рассмотрим пример матричного задания отношения частично го порядка. С этой целью элементы матрицы, задающей это от ношение, будем определять в соответствии с правилом 1, если (0(, 1 0 § 2 />.
(2.1)
1=1
Своего максимального значения (/ = log2 n) величина / дости гает при равновероятных исходах Pf = [/п. Это как раз тот слу чай, когда об интересующем нас событии ничего не известно, т.е. имеет место полная неопределенность. Формула (2.1) наво дит на мысль, что в терминах теории принятия решений неопре деленность можно понимать как условия риска с равновероятным выбором альтернатив. Такое определение вполне согласуется с интуитивным пониманием неопределенности как ситуации, в которой неизвестны предпочтения любой деятельности. В связи с этим имеет смысл уточнить роль прогнозирования в задачах принятия решений. Для принятия решений в условиях неопределенности разрабо таны методы, которые позволяют действовать рационально и по21
лучать результаты, гарантирующие в некотором смысле успешную деятельность, несмотря на отсутствие предпочтений. По сути, перед прогнозированием стоит та же самая задача — повышение надежности принимаемых решений, но достигается это не за счет рационального выбора, а путем снижения уровня неопределенно сти ситуации, в которой принимается конкретное решение. При чем прогноз должен предшествовать самому акту принятия реше ния, так как снижение уровня неопределенности, как правило, упрощает процедуру рационального выбора. Понятно, что снижение происходит за счет новой информа ции, полученной с помощью методов прогнозирования. Но сле дует предостеречь от ошибочного представления, в соответствии с которым снижение неопределенности достигается только благо даря получению новой информации. Тривиальный пример хоро шо это демонстрирует. Предположим, что в результате дополни тельных исследований выяснилось наличие еще одной равноверо ятной альтернативы. Уровень неопределенности от этой новой информации увеличится и станет равным / = log2 (n + 1). Формально за единицу измерения уровня неопределенности принимается 1 бит: (1Л — — ]па 2 2 , J 2 ° ,2, По сути, он представляет собой то количество информации, ко торое необходимо для того, чтобы случайное событие с двумя равновероятными исходами можно было превратить в достоверное событие (1>
/rf = -1 • log2 (1)-0 • log, (0) = 0 бит (2.3) с заранее известным исходом и, следовательно, нулевым уровнем неопределенности. Для объяснения механизма снижения уровня неопределеннос ти введем следующие обозначения: /0 — естественный (минимально возможный) уровень неопреде ленности интересующего нас события, характеризующий такое его состояние, которое в принципе достижимо, но нам неизвестно; /j— первоначальный уровень неопределенности события, зада ваемый дискретным распределением вероятностей Р{1, Р21, ..., PJ; 12 — конечный уровень неопределенности события, состояние которого описывается уточненным распределением вероятностей р 2
22
р 2
р 2
Тогда разность /, — /0 характеризует максимальный объем информации, который, в принципе, можно получить об интере сующем нас событии, а разность /, — /2 представляет собой тот объем новой информации, который получен от экспертов. Объем недостающей информации определяется величиной /2 — /0. Таким образом, поскольку величина / зависит от вероятностей, то из менение неопределенности происходит благодаря уточнению пер воначального представления о вероятностном распределении воз можностей. Исследование механизма изменения неопределенности позволя ет сформулировать, по крайней мере, два принципа проведения экспертиз: 1) экспертные опросы должны быть ориентированы на полу чение такой информации, которая способствовала бы снижению неопределенности; 2) результаты обработки экспертных опросов не должны носить категоричный характер, поскольку имеют место определенные ограничения, приводящие к погрешностям в оценке событий. Рассмотрим основные группы этих ограничений. 1. Ограниченность объемов доступной информации. Если исклю чить из рассмотрения случаи детерминированных событий (в со временной экономике такие события весьма редки), то для ос тальных, несмотря на использование всей доступной информации и отсутствие ограничений на ее получение, уровень неопределен ности всегда положителен. Другими словами, эксперты не обла дают абсолютными знаниями об интересующем нас событии. 2. Неоднородность информации. Неоднородность возникает в силу того, что каждый эксперт имеет свою собственную точку зрения о событии и уровне ее неопределенности. 3. Двусмысленность. Как следствие нечеткой формулировки вопроса, у экспертов может возникнуть двусмысленность его по нимания, что приведет к явному искажению ответа, так как от вечать он будет не на тот вопрос, который ему был задан. 4. Несовершенство процедуры экспертного опроса. Несовершен ство процедуры приводит к ситуациям, когда в экспертизе участ вуют недостаточно компетентные эксперты либо ответы наиболее компетентных экспертов используются неправильно. Следствием этого является искажение экспертных оценок. 5. Прочие погрешности. Эти погрешности, как правило, несу щественно искажают окончательный результат. Их возникновению 23
способствуют незначительные отклонения от правил, предписы ваемых процедурами экспертного опроса. Обсудив вопросы, связанные с природой неопределенности и принципами использования субъективной информации для сниже ния ее уровня, перейдем к описанию конкретных методов обра ботки результатов экспертных опросов, которые можно применять как непосредственный аппарат решения задач в ситуациях первого типа и как вспомогательный аппарат при решении задач второго и третьего типов. 2.2. Методы индивидуального и группового экспертного оценивания Известные в настоящее время процедуры экспертного оценивания, применяемые для решения прогнозных задач, прак тически не отличаются от тех, которые принято использовать в управленческой деятельности, осуществляемой в условиях неопре деленности. Причем и в управлении, и в прогнозных расчетах, несмотря на большое разнообразие задач, решаемых с привлече нием экспертной информации, в основном используются фор мальные постановки, сводящиеся к классификации и ранжирова нию. Это и естественно, так как довольно низкая разрешающая способность экспертов позволяет получать от них только качествен ную информацию, количественное представление которой возмож но либо в номинальной, либо в ранговой шкале. Действуя как бумеранг, шкала представления результатов, в свою очередь, определяет содержание вопросов, ответы на которые предполага ется получить от экспертов. Например, не следует требовать от экспертов, чтобы они оценили ожидаемый темп инфляции, но их мнение о возможном повышении или снижении этого темпа мо жет оказаться достаточно надежным. Для получения надежной экспертной информации разработаны специальные методы и процедуры: метод комиссий (дискуссии), метод "суда", различные методы анкетирования, метод коллек тивной генерации идей, метод Дельфы. Своеобразие экспертно го подхода в том, что с помощью одного и того же метода мо гут решаться различные задачи, и одна и та же задача может решаться с помощью различных методов. Отсутствие строгих предписаний, рекомендующих, в каких ситуациях, какой из пе речисленных методов является более эффективным, делают выбор того или иного метода для решения конкретной задачи в некото24
рой степени субъективным. Поэтому ниже будут описаны только те, которым в силу определенных причин мы отдаем предпочте ние и которые будут использованы в комбинированных процеду рах. Подробное описание остальных можно найти в [6, 8, 12, 18, 26, 27, 29, 32-34, 40, 47, 49]. Рассмотрение начнем с методов, применяемых для получения решений в ранговой шкале. Задачу классификации можно отдель но не рассматривать, так как она представляет собой частный случай ранжирования, когда нужно упорядочить два объекта. Уровень неопределенности, с которым приходится иметь дело при решении задач ранжирования, достаточно высок, так как для п ранжируемых объектов число возможных исходов п\ В соответ ствии с (2.1) он равен I(n) = log2(« !). Чтобы иметь представле ние об этой величине, приведем несколько ее значений: /(3) = 2,58 бит; /(4) = 4,58 бит; /(10) = 21,79 бит; /(20) = 61,08 бит. Поэтому для ранжирования даже небольшого числа объектов при меняют специальные процедуры, упрощающие работу экспертов. Смысл этих упрощений в том, чтобы снизить уровень неопре деленности решаемой задачи. Достигается это применением мно гоэтапных процедур экспертного оценивания, с помощью которых снижается число возможных альтернатив. Реализация многоэтап ной процедуры предусматривает вначале деление интересующих нас объектов на группы с последующим ранжированием самих групп и объектов внутри каждой группы. Устроенную таким об разом процедуру принято называть "простое ранжирование" [18]. Процедура достаточно проста, но, к сожалению, в результате ее применения часто получаются слишком огрубленные ранжировки. Поэтому, не останавливаясь на подробном описании этой проце дуры, перейдем к рассмотрению более эффективного и чаще дру гих используемого метода парных сравнений. При попарном сравнении объектов удается получить наиболее точное отражение субъективных предпочтений, поскольку на вы бор здесь налагается гораздо меньше ограничений, чем при дру гих видах экспертного оценивания. При этом способе каждый раз эксперту приходится делать выбор всего из двух альтернатив, т.е. решать задачу, уровень неопределенности которой не превышает одного бита. Естественно, это облегчает работу экспертов, но одновременно ставит вопрос о возможно недостаточном объеме информации для получения надежных оценок. Опасения по это му поводу напрасны. Один бит информации требуется при срав нении только одной пары из п объектов, а сравниваемых пар 25
п{п—1)/2 и, следовательно, так как п{п—1)/2 > log2(A2!), то и объем информации, затраченный на решение задачи ранжирова ния, в сумме превосходит тот, который затрачивается при дру гих способах ее решения. Для получения парных сравнений объектов А,- (/ = 1,я) исполь зуется анкетирование, предусматривающее заполнение таблицы, в которой количество строк равно количеству столбцов. Т а б л и ц а 2.1 Матрица парных сравнений Объекты
А,
А2
А
А, А2
а
°,2
a
а
а
°2п
Ая
а
и
2,
i„
22
„,
а
„„
а
п2
Значение элемента, стоящего на пересечении /-й строки и у'-го столбца, определяется по формуле 0,
А
< А,
1, А, 2, А
У А,
(2.4)
В соответствии с (2.4) на пересечении /-й строки и у'-го столб ца должен стоять 0, если объект с номером /, по мнению экспер та, менее значим, чем объект с номером у; должна стоять 1, если объекты равнозначны, и 2, если /-й объект превосходит у'-й. Полностью заполненная таблица представляет собой квадрат ную матрицу А, элементы которой удовлетворяют соотношению а + а и л ~ ^' Метод вычисления весовых коэффициентов, в со ответствии со значениями которых ранжируются объекты, пред ставляет собой итерационную процедуру Ар Г-1
(2.5)
где ро = (1, 1,..., 1)'. Чтобы избежать в процессе итерирования получения чрезвычай но больших весовых значений, компоненты вектора р' на каждом шаге нормируются путем деления на сумму 26
*=?.Pi=lI.auPjrl. '
(2.6)
' j
С учетом нормирующего множителя процедура вычисления ве совых коэффициентов записывается следующим образом:
У
(2.7)
Ее применение приводит к получению весовых коэффициентов pi в виде относительных величин, так как £ л ' = 1. Вычислитель ный процесс продолжается до момента, кбгда весовые коэффи циенты, полученные на двух соседних итерациях, будут незначи тельно отличаться друг от друга, т.е. t-\\
max \р/ - р}
О для любых /', J) и неразложима, т.е. среди номеров строк и столбцов нельзя выделить такие подмножества I и J, что д.. = 0 для всех / е I и J e J. Другими словами, неразложимость матрицы А означает, что любыми перестановками строк и столбцов нельзя ее привес ти к виду А и А12 О А 22.
(2.9)
где А п и А22 — квадратные подматрицы. В соответствии с широко известной теоремой Фробениуса — Перрона у таких матриц максимальное собственное значение яв ляется действительным положительным числом Я, которому отве чает собственный вектор р с положительными компонентами. Причем и собственное число, и собственный вектор получаются в виде предельных значений Я = lim Я';
lim p
(2.10)
представляя, по сути, результат применения итерационной про цедуры. Содержательную интерпретацию итерационной процедуры рас смотрим на простом примере. Пусть требуется оценить степень значимости пяти объектов А,, А., г3> А5- В результате 27
опроса одного из экспертов была получена следующая матрица парных сравнений:
2 0 1 0 0 2 2 0 N (\
0
2 2 1 0 1
0 0 2 1 2
2\
2 1 0
Ч
Последовательность итераций без учета нормирующего множи теля выглядит следующим образом:
ГО
J)
Г709Л 5 21 469 93 4 2 3 ; Р' = 4 ; Р = 18 ; Р = 94 ; Р = 462 5 617 137 29
Гзз^
Л
1
Ч
^94 J
И 62 ,
Итерированная значимость первого порядка р1 (так будем на зывать промежуточные результаты итерационного процесса) пред ставляет собой сумму "очков", набранных каждым объектом в результате экспертного сравнения. Расчеты показали, что одина ковое количество очков набрали А2, А4 и А3, А5. Если предпо чтение устанавливать по итерированной значимости первого поряд ка, то эти пары объектов следует считать одинаково значимыми. Однако, как показывают дальнейшие расчеты, это не так. При подсчете итерированной значимости второго порядка каж дому объекту засчитываются не только собственные "очки", но и те, причем удвоенные, которые набрали проигравшие ему в срав нении. Поэтому очень важно, в сравнении с какими "противни ками" (сильными или слабыми) были заработаны "очки". Эти рассуждения хорошо иллюстрируют очевидные расчеты р 2 2 = 0 - 7 + 1-5 + 2-4 + 0-5 + 2-4 = 21; р2л = 2 - 7 + 2-5 + 0-4 + 1-5 + 0-4 = 29, из которых понятен механизм формирования итерированных пред почтений, обеспечивший превосходство четвертого объекта над вторым. 28
Метод парных сравнений был рассмотрен применительно к обработке результатов опроса одного эксперта. Индивидуальные экспертные оценки имеют право на существование и даже прак тическое использование, но уверенность в их объективности очень низкая. Поэтому предпочтение отдают групповым экспертным оценкам. В простейшем случае за групповую оценку принимают усредненные значения индивидуальных оценок. Применение та кого способа предполагает, что компетентность экспертов, при нимавших участие в экспертизе, одинакова. Подобное предположение следует признать несостоятельным. Нетрудно указать и причины несостоятельности. Во-первых, сформировать однородную группу экспертов практически невоз можно. Во-вторых, однородная группа не всегда обеспечивает высокую объективность результатов экспертизы. Скорее, наоборот: результаты опроса такой группы могут оказаться смещенными, хотя и согласованными. Поэтому рациональный взгляд на эту проблему подсказывает решение, суть которого в том, чтобы при построении групповой оценки не стремиться к созданию однород ной группы, а предусмотреть возможность учитывать компетент ность каждого эксперта. В связи с этим возникает вопрос о про цедуре определения весовых коэффициентов, характеризующих компетентность экспертов. Существует несколько подходов к решению этой задачи. Чаще других используются самооценка и взаимная оценка, строятся также интегральные оценки коэффициентов компетентности по отдельным характеристикам экспертов. В некоторых случаях уро вень компетентности связывают с источниками аргументации, которые используют эксперты при проведении экспертизы. Как правило, это несложные и интуитивно понятные процедуры. Их достаточно подробное описание можно найти в [6, 18]. Поэто му, ограничившись только их упоминанием, перейдем к изложе нию более интересной, на наш взгляд, итерационной процедуры, в которой параллельно уточняются и коэффициенты компетентно сти, и групповая оценка. Пусть опрос группы из т экспертов позволил получить оцен ки значимости п объектов. Результаты опроса представлены в виде прямоугольной табл. 2.2, в каждой строке которой, как нетрудно понять, стоят оценки, полученные соответствующим объектом, а в столбце — оценки, поставленные соответствующим экспертом. 29
Т а б л и ц а 2.2 Результаты опроса группы экспертов Эксперты Объекты А, А,
А„
э,
э2
э
Л. Ри
Ра Рп
Ры Ръ,
Л/
Рп2
р
т
Изложение формальной процедуры итерационного уточнения групповой оценки и коэффициентов компетентности начнем с обозначений: Р — прямоугольная п х т матрица с элементами />.., представ ляющими собой оценки /-го объекта у'-м экспертом; Р = (Р/, Р2> ••• РпУ ~~ в е к т 0 Р групповой оценки; v= (v;, v2, ... vm)' — вектор весовых коэффициентов компе тентности; р,.. — i-я строка матрицы Р; p v — у'-й столбец матрицы Р. В качестве начального приближения весовых коэффициентов компетентности удобно взять вектор V =(У,°, V», ..., Vй )'={]/,
У ,...,
У )',
(2.П)
т равенство компонент которого означает, что эксперты не разли чимы по уровню компетентности. С помощью этого вектора лег ко определяется групповая оценка Р' = v,p., + v2p.2 + • • • +v„p.„, = Pv° (2-12) Затем полученные значения групповой оценки используются для уточнения коэффициентов компетентности. С этой целью строки матрицы Р умножаются на оценки первой итерации р1 и суммируются (2ЛЗ) v 1 =A l .P,.+^P 2 .+ -+A 1 ,.P,,Так как коэффициенты компетентности являются нормирован ными величинами, то и полученный результат необходимо про нормировать, разделив его на сумму 30
Я
= Svy.
(2.14)
y'=i
После нормирования расчеты повторяются в той же последо вательности, образуя таким образом итерационную процедуру параллельных расчетов. В матричной форме эта процедура запи сывается следующим образом: p'=Pv'-';
(2.15)
v'=^[p']'P.
(2.16)
Я
Если в (2.15) подставить (2.16) с измененным порядком со множителей, а в (2.16) подставить (2.15), то окончательно ите рационный процесс записывается в виде р'^РР'р'1;
(2.17)
я' P-Pv'"1.
(2.18) Я' Так как столбцы матрицы Р в силу того, что получены с по мощью метода парных сравнений, неотрицательны, то и сама матрица неотрицательна и, следовательно, неотрицательны мат рицы РР' и Р'Р. Кроме того, можно показать [40], что в случае неразложимости Р они тоже неразложимы. Таким образом, и групповая оценка значимости объектов р, и весовые коэффициенты компетентности экспертов v могут быть получены как характеристические векторы матриц РР' и Р'Р, при чем эти векторы являются предельными величинами v
p=limp'-
v=limv/.
(2.19)
Как и в случае обработки матрицы парных сравнений, расчеты ведутся до достижения заданной точности. Если проводилась само оценка или взаимная оценка компетентности, полученные с помо щью итерационной процедуры результаты могут сравниваться с ними для уточнения общих характеристик экспертной группы. В качестве примера рассмотрим ситуацию, предусматрива ющую вычисление групповой оценки коэффициентов относительной важности, позволяющих сравнивать между собой восемь объектов. Групповая оценка вычисляется по результатам индивидуального оценивания (табл. 2.3). 31
Т а б л и ц а Индивидуальные экспертные оценки
2.3
Эксперты Объекты
1 2 3 4 5 6 7 8
РР'
1
2
3
4
5
6
0,3679 0,1840
0,1840
0,3679 0,1226
0,3679 0,0920
0,3679 0,0920
0,1840 0,1226 0,0613
0,1840 0,1226 0,0736
0,1840 0,3679 0,0920 0,1226 0,0736
0,1226 0,0920
0,3679 0,0920 0,1226
0,0736
0,0736
0,1840 0,0613 0,0920
0,0613 0,0526
0,0613 0,0526
0,0736 0,0460
0,0736 0,0460
0,0526 0,0460
0,0526 0,0613
0,0460
0,0460
0,0526
0,0526
0,0613
0,0460
0,6092 0,3159 0,2820
0,3159 0,3366 0,1467
0,2820 0,1467 0,1335
0,1918 0,1373 0,0903
0,1376 0,0914 0,0643
0,1170 0,0738 0,0547
0,0911 0,0657 0,0423
0,0951 0,0592 0,0447
0,1918 0,1376 0,1170 0,0911 0,0951
0,1373 0,0914 0,0738 0,0657 0,0592
0,0903 0,0643 0,0547 0,0423 0,0447
0,0724 0,0470 0,0396 0,0329 0,0327
0,0470 0,0339 0,0280 0,0227 0,0227
0,0396 0,0280 0,0239 0,0189 0,0190
0,0329 0,0227 0,0189 0,0156 0,0153
0,0327 0,0227 0,0190 0,0153 0,0156
Р'Р =
0,2068 0,1720
0,1720 0,2068
0,2023 0,1534
0,2000 0,1474
0,2000 0,1474
0,1719 0,2067
0,2023 0,2000 0,2000 0,1719
0,1534 0,1474 0,1474 0,2067
0,2068 0,2040 0,2040 0,1531
0,2040 0,2068 0,2064 0,1471
0,2040 0,2064 0,2068 0,1473
0,1531 0,1471 0,1473 0,2068
Р -
32
0,3105 0,1996 0,1445 0,1067 0,0747 0,0627 0,0506 0,0508
;
0,1759 0,1562 0,1717 v - 0,1700 0,1701 0,1561
)
j
2.3. Проверка согласованности мнений экспертов Не вызывает сомнений тезис о том, что групповые экспертные оценки должны отражать согласованное мнение экс пертов. Следовательно, перед формированием групповой оценки необходимо уточнить, можно ли для этих целей использовать полученные в результате опроса индивидуальные оценки. Выяс няется этот вопрос с помощью рангового коэффициента корре ляции и коэффициента конкордации. Эти коэффициенты приме нимы в тех случаях, когда результаты экспертного опроса представимы в ранговой шкале. С помощью рангового коэффициента корреляции устанавливает ся теснота связи между двумя ранжированными рядами, интер претируемая как согласованность мнений двух экспертов. В прак тике анализа согласованности применяются два коэффициента: Спирмена и Кендалла. Ранговый коэффициент корреляции Спирмена определяется формулой, аналогичной обычному коэффициенту корреляции Р
-~ШГ ,
(2-20)
где Кп — величина ковариации между первой и второй ранжи ровками; Dr D2 — дисперсии ранжировок. Ковариация и дисперсии вычисляются по данным ранжировок с использованием известных формул 1 ^12=
" rX(A-i-A)(A-2-/>2);
(2.21)
« - 1 i=i
^=-^ЪРШ-Р^
Р>=-£Р,>
k=l 2
>-
(2-22)
Рассмотрим случай, когда обе ранжировки не содержат связ ных рангов, т.е. когда нет повторяющихся рангов, и мы имеем строгое упорядочивание объектов. В этом случае средний ранг представляет собой сумму натуральных чисел от 1 до п, деленную на п, вне зависимости от порядка, задаваемого ранжировкой, т.е. средние равны между собой: _ _ _ и(и + 1) /г + 1 P = Pi=P2= 7~ = ^ Г ~ ' п-2 2
(
/т тал ' 33
При вычислении дисперсии, если произвести возведение в квад рат, то под знаком суммы будут стоять натуральные числа и их квадраты. Два ранжированных ряда одинаковой длины могут отли чаться друг от друга только перестановкой рангов, но сумма нату ральных чисел и их квадратов не зависит от порядка, в котором расположены слагаемые. Из этого вытекает, что дисперсии любых ранжировок, не имеющих связных рангов, равны между собой: Д=Д =
1 л-1
1 (л + 1)(2л + 1)и - 2р]п + р\п 6 я^1 п(п +1) (2.24) jfc= 1 , 2 12(я-1) 12 Если полученные выражения для Кп и D собрать вместе, под ставив их в (2.20), то выражение для рангового коэффициента корреляции примет следующий вид: 1
12 ^(Рп-Р)(Р1г~Р) п -1 п(п +1) %,
=
12 Х(Р -/>)(Р,- -Р)м 2
(2.25)
Дальнейшее упрощение формулы получается, если использовать легко проверяемое тождество
25>,.,-/>)(/>-,-/*) = ^Рп-РУ-
1(Р,-Р)2-1(Рп-Р,Г--
+
(2.26)
Первые две суммы правой части (2.26) одинаковы и, как нетруд но понять, равны 2(л" - п) (2.27) 1(Рп-рУ- + 1(Рп.-Р)2 = ,=1 ,-=• 12 Заменив в тождестве (2.26) первые две суммы полученной форму лой для их расчета (2.27), можем записать ^(РП-Р)(Р,2-Р) 34
=
(И3-71)
12
1
•Х^Рп-Ра)1*•
i=I
(2.28)
Подставив данное выражение в (2.25), имеем формулу коэффи циента корреляции Спирмена, удобную'для практических расчетов: Г»-3
(2.29) М
^ ~
Возможные значения коэффициента изменяются от — 1 до +1. Из формулы нетрудно понять, что р = 1 в тех случаях, когда ран жировки совпадают, т.е. рп = рааля всех /. Значение р = — 1 по лучается, если ранжировки имеют противоположный порядок. В отличие от предыдущего, это нетривиальный случай, требующий специального рассмотрения. Доказательство основано на подсчете суммы квадратов для нечетного и четного п. Пусть п — нечетное. Тогда Ё ( А , - Р , 2 ) 2 = [ ( - ( « - 1 ) ) 2 + - + И 2 ) + (-22) + 0 + 2 2 +4 2 +... + (,г-1)2] = = 2-2J
11+22+...+
:2-2'
л-1
я+1
=
2-2'
л-П
Гл-1
+1
2(я -1)
+1
я-1
2(я + 1 ) я ( я - 1 ) _ л з _ и
(2.30)
Полученное выражение позволяет сделать вывод, что действи тельно, в случае обратных ранжировок при нечетном числе ран жируемых объектов коэффициент корреляции Спирмена равен — 1. Покажем, что этот же самый результат получается и в слу чае четного числа ранжируемых объектов. Для любого п, в том числе и четного, можно записать очевид ное соотношение (л-1)3-(л-1) и3-л (2.31) (я~ —л)3 3 Пользуясь этим соотношением, сумму квадратов отклонений для четного числа ранжируемых объектов можно представить в виде суммы для нечетного п и добавочного слагаемого
2j(Pn ~ Р-лУ = —г— + К" + 1) -(и +1)] =
•
(2.32)
35
Таким образом, и для четного числа ранжируемых объектов (п + 1 четное) в случае обратных ранжировок коэффициент корре ляции Спирмена равен — 1. Проиллюстрируем расчеты по формуле (2.29) числовым приме ром. Пусть два эксперта провели оценку сравнительной значимос ти семи объектов. Каждому объекту в соответствии с полученной оценкой приписали ранг. Требуется оценить с помощью рангового коэффициента уровень согласованности мнений экспертов. Получен ные ранжировки и промежуточные расчеты приведены в табл. 2.4. Таблица Результаты ранжирования Эксперты
э, э2 Рн-Ра (Р„~Р,2)7
2.4
Объекты А, 2 1 1 1
А, 4 5 -1 1
А, 1 2 -1 1
\ 3 4 -1 1
А, 5 3 2 4
А, 7 6 1 1
А, 6 7 -1 1
Л 10 =0,821. п -п\ 336 Полученная оценка рангового коэффициента корреляции явля ется случайной величиной и, следовательно, необходимо прове рить ее значимость. Для этого определяется порог, ниже которого коэффициент корреляции считается незначимым. Определение порога осуществляется в предположении, что имеет место неза висимость ранжировок, т.е. Н0 : р = 0. При выполнении нульгипотезы отклонения расчетных значений коэффициента корреля ции от нуля носят случайный характер и подчиняются нормаль ному распределению. Только в том случае, если отклонение ока жется очень большим, нуль-гипотеза отвергается, и коэффици ент корреляции считается значимым. Очень большим считается отклонение, превосходящее по величине установленный порог. Для определения порога S используется приближенная формула 8=-
1
Ч>
2
(2.33)
в которой п — количество ранжированных объектов; а — вероят ность, задающая уровень возможной ошибки; у (х) = Ф~'(х) — функция, обратная функции нормального закона распределения. 36
В практических расчетах чаше всего а = 0,05. В аргумент функции вероятность а входит деленной на 2, так как отклоне ния коэффициента корреляции от нуля возможны в обе стороны (двусторонний критерий). Определим пороговое значение для нашего примера 1 1 „Л . 0,05 -440,975) = 0,800. д=-^Ч'\ 1V6 2 2,449 Так как р = 0,821 > 0,800 = 8, то нуль-гипотеза о независи мости экспертных мнений отвергается, а коэффициент корреляции признается значимым. В тех случаях, когда ранжировки содержат связные ранги, коэффициент корреляции корректируется. Прежде чем записать формулу для вычисления коэффициента корреляции, поясним механизм введения связных рангов. Они вводятся в тех случаях, когда в ранжируемой совокупности некото-рые объекты получили одинаковые оценки. Тогда каждому из этих объектов приписывается средняя величина порядковых номе ров, которые должны получить одинаково оцененные объекты. Например, пусть оценивались семь объектов, два из которых при знаны одинаково значимыми. Если их выстроить в порядке зна чимости, то объекты с одинаковой значимостью делят между собой второе и третье места. Так как их нельзя предпочесть друг другу, то каждому из них приписывается средний ранг
r23 =(r 2 + r 3 )/2 = (2 + 3)/2 = 2,5, и последовательность рангов, соответствующая значимости объек тов, выглядит следующим образом: 1; 2,5; 2,5; 4; 5; 6; 7. Расчет скорректированного на наличие связанных рангов коэф фициента корреляции осуществляется по формуле Р = /
+ Г +Г
'
-
,
(2.34)
в которой р — оценка коэффициента ранговой корреляции, рассчи танная в соответствии с (2.29), а величины 7j и Т2 вычисляются по формулам Tt = -з^— XM*i/ - О; Т2 = - J _ 2 * 2 , ( * 2 | . -1) / г -п
i
'
/Г - п i
где ки, k2j — количество повторений в z'-й подпоследовательности связных рангов в оценках 1-го и 2-го экспертов соответственно. 37
Данные для вычисления скорректированного коэффициента ранго вой корреляции с промежуточными расчетами приведены в табл. 2.5. Таблица Данные для вычисления скорректированного коэффициента ранговой корреляции Эксперты
А, 1 2,5 -1,5 2,25
А, 2 1 1 1
э, э, РЯ 'Р.! (Рп-РвУ
А, 4 2,5 1,5 2,25
Объекты А4 5 5 0 0
п -п~~х
А, 5 4 1 1
А, 5 7 -2 4
2.5
А, 7 6 1 1
336
7 1 = ^ - 5 ; M * W - 1 ) = ^7-3-(3-1)=0,054;
п -п i
336
п -rij
336
р + Т.+Т, 0,795 + 0,054 + 0,018 0,866 ^ ' —— = — = = 0,898 7(1 - 7^ )(1 - Г2) yjO, 946 -0,982 0,964 Коэффициент корреляции Кендалла в практических расчетах ис пользуется гораздо реже, чем коэффициент Спирмена. Поэтому, опуская подробный вывод, приведем только окончательную фор мулу для его расчета: р=
т=—
Xsign[ (/>„ - pJX) (рп - pJ2) ],
(2.35)
где п — количество ранжируемых объектов; plk — ранги объектов; 1, х > 0; sign х = - - 1 , х < 0; 0, х = 0. Как нетрудно понять, с помощью коэффициентов ранговой корреляции нельзя установить согласованность между всеми 38
экспертными оценками. Да они и не предназначены для этого. Но с их помощью удается описать структуру согласованности ин дивидуальных оценок. Это описание в виде корреляционной мат рицы может быть использовано как для более детального анали за однородности всей группы экспертов, так и для деления ее на подгруппы, имеющие более высокий уровень согласованности, чем вся группа. В целом согласованность мнений всей группы экспертов при нято оценивать с помощью дисперсионного или энтропийного коэффициентов конкордации. Рассмотрим сначала дисперсионный коэффициент конкордации. Он определяется как отношение дис персии D, отражающей реальный разброс между ранжировками, к величине Dmax, характеризующей максимально возможный раз брос W=-^—. D
(2.36)
max
Будем считать, что результаты ранжирования представлены в табл. 2.4. Тогда дисперсия может быть вычислена по формуле D = -±-t(Pi~P)2>
(2-37)
п -1 /=i т
rae pt = %р& ,
1 п
(/ = 1, л);
Р = -^РГ
При вычислении дисперсии каждый раз приходится вычислять среднее. Чтобы упростить эти вычисления, выразим среднее зна чение через количество оцениваемых объектов п и количество экспертов т, принявших участие в экспертизе. Для этого сначала вычислим сумму рангов, которые приписываются объектам каж дым экспертом: А
и(и + 1)
/=i
^
. ,—
.. . . .
а затем средний ранг представим в удобном для расчетов виде
P = - S S P t f = - I X ^ = - S - L ^ = i -—-• (2-39) 39
Для вычисления максимально возможного значения дисперсии проведем, используя очевидное равенство
2£р,=пр>
(2.40)
преобразование формулы (2.37): I й L -, 1 - :^{pi-P)2=-Lл - 1 /=i п -1
•2P11P,J+»P2
D=
i=\j=i
IPIJ
п-\
(2.41)
-пр
Преобразованная формула позволяет понять, что максимальное значение дисперсии достигается при наибольшем значении перво го члена в квадратных скобках. В свою очередь, наибольшего зна чения этот член достигает в том случае, когда у всех экспертов оценки оказались одинаковыми, т.е. все ранжировки одинаковые. В случае одинаковых ранжировок каждая строка в табл. 2.2 будет содержать одинаковые целые числа (ранги) /, и, следовательно, величину, возводимую в квадрат, можно представить в виде
Х/Л = гт >
(2.42)
7=1
где / — величина среднего ранга, которая для данного случая целая. Теперь величина первого члена в квадратных скобках может быть выражена через пит:
1
1
IPO 7=1
"
/=1
•>
т2(п + 1)(2и + \)п
(2.43)
6
Это максимально возможное значение для случая, когда оцени валось п объектов группой из т экспертов и их точки зрения пол ностью совпали. Если изменится хотя бы одна из ранжировок, то сумма уменьшится. Действительно, перестановка рангов в одной из ранжировок приведет к изменению некоторых / под знаком суммиро вания. Причем если /, < /2, то /, возрастет на величину (/2 — /,)//я, а /2 — уменьшится на эту же величину. Тогда с помощью простых 40
вычислении можно показать, как изменится в целом вся сумма в зависимости от тех изменений, которые произошли с двумя сла гаемыми: /
л
л
,-»
л
-I,
(2.44) т т Из полученного выражения следует, что сумма уменьшается на величину дополнительного слагаемого, которое всегда отрицатель ное. Следовательно, дисперсия имеет максимальное значение только в случае полного совпадения мнений экспертов. Окончательно, подставляя (2.40) в (2.38) и подробно распи сывая р, получаем формулу для вычисления значения максималь ной дисперсии и +•
с +1; + 2
m'(n + l)(2n + Y)n п(п-\)
т~ т'(п'-п) (2.45) 6 4 Щп-1) Когда дисперсия равна нулю, имеет смысл рассматривать слу чай т - п. Именно в этом случае возникает ситуация, когда один и тот же объект оценивается экспертами по-разному, т.е. все п ранжировок разные. А для разных ранжировок первый член в выражении (2.41) равен £>
у
£
YJPH
г
т(т +1) ^
=Е
т2(т + \)2п
(2.46)
При т = п полученное выражение полностью совпадает с вы ражением для пр2 и, следовательно, величина дисперсии в рассматриваемом случае равна нулю. Если ввести обозначение D
где
S
1 •S, га-1
(2.47)
= l 5>, =i
;=i
то коэффициент конкордации можно записать в компактном виде следующим образом: 125 W = (2.48) ч т (п —п) 2 / 3
41
Если в полученных ранжировках есть связные ранги, то коэф фициент конкордации нужно корректировать, так как максималь ное значение дисперсии становится меньше, чем в случае отсут ствия связных рангов. Скорректированный коэффициент конкор дации вычисляется по формуле
W-
™2
3
т (п - п) -m^Tj
(2.49)
где Т — показатель связных рангов в у'-й ранжировке:
Здесь Я, — число групп равных рангов в у'-й ранжировке; пк — число равных рангов в к-к группе связных рангов в ранжировке, полученной от у'-го эксперта. Коэффициент конкордации равен 1 в тех случаях, когда мне ния экспертов по всем объектам полностью совпадают, и равен нулю, когда все ранжировки различны. В остальных случаях его значения удовлетворяют неравенству 0 < W < 1, причем чем бли же это значение к 1, тем теснее связь между ранжировками и надежнее групповая оценка. Коэффициент конкордации, вычисляемый по выведенной фор муле, является, по сути, оценкой истинного значения и пред ставляет собой случайную величину. Естественно, возникает не обходимость в проверке его значимости. Для небольших значений тип разработана специальная таб лица распределения частот [22]. Если число объектов п > 7, то значимость оценки коэффициента конкордации проверяется с помощью критерия х2- Доказано, что величина (150) X2 =Wm(n-l) имеет ^-распределение с v = (и — 1) степенями свободы. Если в некоторых ранжировках есть связные ранги, то для проверки значимости коэффициента конкордации используется статистика 2_ А/
125; /и
тп(п + \)-{п-1У^Т} 42
> 14,07 = #2та6л позволяет отвергнуть гипотезу W= 0 и признать, что мнения экспертов согласованы. 43
Энтропийный коэффициент конкордации определяется через ве личину энтропии Не помощью формулы W=l где H = -J^^Pi.log2p. i=I
—, п—
(2.52)
.
./=1
В формуле для вычисления энтропии />.. представляет собой оценку вероятности, с которой /-му объекту приписывается у'-й ранг. Вычисляется эта вероятность как отношение числа экспертов т1р приписавших объекту А(- ранг у, к общему числу экспертов т р„= — •
(2
-53)
т Как известно, максимальное значение энтропии достигается при равновероятном распределении рангов. Если в опросе при нимают участие т экспертов, то в случае равномерного распре деления число экспертов, приписавших /-му объекту у'-й ранг, равно их среднему числу, приходящемуся на один объект, т.е. от.. = т/n. Тогда вероятность определяется с помощью простой формулы р = — = i. (2.54) 4 mn n Подставляя эту вероятность в формулу энтропии, получаем )
Н =-
1
я
т
1
т
£ £ l ° g 2 L = £log 2 л = m\og2n.
(2.55)
Значение энтропийного коэффициента конкордации заключено между нулем и единицей. Если W3 = 0, то это означает, что между ранжировками нет связи. В этом случае ранги равномерно распре делены между объектами и, следовательно, Н = # m a r Противопо ложный случай: W3 = 1 соответствует ситуации, когда все экспер ты идентично оценили значимость объектов, и ранжировки оказа лись совпадающими между собой. При совпадающих ранжировках рк/= 1, а все остальные р0 = 0 (i*k, j*l, i = l,n, j = l,m). Поэто му H = 0 и, следовательно,^ = 1. 44
Процедура вычисления энтропийного коэффициента конкордации более громоздкая, чем дисперсионного. Проиллюстрируем ее основные этапы на данных предыдущего примера. На первом этапе по табл. 2.6 сформируем квадратную матри цу размером п х п с элементами т^, представляющими количество экспертов, приписавших /-му объекту у'-й ранг (табл. 2.7). Т а б л и ц а 2.7 Частоты экспертных предпочтений Объекты
Ранги 1
2
3
4
5
6
7
8
1 2
4 2
2 1
0 1
0 2
0 0
0 0
0 0
0 0
3 4 5
0 0 0
3 0 0
2 1 1
0 0 4
0 1 1
0 0 0
6 7
0 0
0 0
2 1 1
2 2
0
2 0 0
0 0 0 0 3
8
1 4 0 0 0 0
2
3
0 0 0
0
Разделив все элементы этой матрицы на число экспертов III::
Ру= — , (2-56) т получим матрицу, элементы которой есть вероятности, с которыми эксперты присваивают ранги соответствующим объектам (табл. 2.8). Т а б л и ц а 2.8 Вероятности, с которыми эксперты проводят ранжировку объекто Объекты
Ранги 1
2
3
4
5
6
7
8
1 2
0,667 0,333
0,333 0,167
0 0,167
0 0,333
0 0
0 0
0 0
0 0
3 4 5 6 7 8
0 0 0 0 0 0
0,5 0 0 0 0 0
0,167 0,667 0
0,333 0,167 0,167
0 0,167 0,167
0 0 0
0 0 0
0 0 0
0 0 0,667 0,333 0 0
0,333 0,167 0,167
0,333 0,333 0,333
0 0 0 0 0,5 0,5 45
Из матрицы вероятностей применением преобразования htj = -р& log, PiJ (2-57) легко получается матрица энтропийных характеристик полученных ранжировок, представленная соответствующей частью табл. 2.9. Таблица Энтропийные характеристики ранжировок Объекты 1 2 3 4 5 6 7 8
Ранги 1 3 4 5 6 2 0 0 0 0 0,39 0,528 0 0 0,528 0,431 0,431 0,528 0 0 0,5 0,431 0,528 0 0 0 0,431 0 0,39 0,431 0 0 0 0,431 0,39 0,431 0,528 0,528 0 0 0 0 0 0,431 0 0 0 0,431 0 0 Суммарная
7 8 0 0 0 0 0 0 0 0 0 0 0 0,528 0,528 0,5 0,528 0,5 энтроп ия Н
2.9
Сумма 0,918 296 1,918 296 1,459 148 1,251 629 1,251 629 1,584 963 1,459 148 1,459 148 11,302 26
Величина максимальной энтропии для рассматриваемого случая равна tfmax=6.l0g28 Окончательно получаем
= 18-
^ = 1 - ^ = 1 - 1 ^ = 0,6279. #тах 18 Значения дисперсионного и энтропийного коэффициентов кон кордации не совпадают. Причем их значения сближаются по мере увеличения степени согласованности мнений экспертов, т.е. чем ближе к единице, тем меньше различие между ними. Самое боль шое различие между этими коэффициентами имеет место в слу чае, когда эксперты разделились на две группы с полностью про тивоположными точками зрения. По дисперсионному коэффици енту конкордации степень согласованности в этой ситуации будет равна нулю, а по энтропийному — 0,5.
ГЛАВА 3 ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ 3.1. Экспертные оценки и модели бинарного выбора 3.1.1. Концептуальные основы моделирования экспертных предпочтений В предыдущих главах достаточно подробно изложен математический аппарат, применяемый в настоящее время (и не без успеха) в различных схемах получения и обработки эксперт ной информации, используемой в задачах обоснования управлен ческих решений. И все же во всех этих схемах, несмотря на их разнообразие, по преимуществу используются методы из одного и того же вышеописанного набора. К этому набору можно доба вить балльное оценивание и простое ранжирование, которые в силу своей распространенности и того, что не приводят к полу чению более надежных оценок, чем метод парных сравнений, не рассматривались среди вышеизложенных. Можно вспомнить и медиану Кемени, процедура нахождения которой достаточно сложна и поэтому редко используется в практике получения груп повых оценок. Однако в каком бы составе мы не рассматривали эти методы, их главная особенность в том, что для числового представления получаемых результатов в основном используются номинальные и ранговые шкалы. Этим и объясняется, на наш взгляд, тот консер ватизм, который утвердился в отношении методов обработки экс пертной информации. Его природа очевидна: низкая разрешающая способность экспертов, которая служит непреодолимым барьером для повышения точности экспертных оценок. Возникает естествен ный вопрос: "Какой смысл в разработке новых подходов и более точных методов, если они из-за указанного барьера не приводят к уточнению финальных результатов?" Трудно возразить этому тези су. И все же смысл есть. Он появляется в тех случаях, когда меняется привычное представление о сути решаемых задач. 47
В качестве примера, демонстрирующего новый взгляд на обра ботку экспертной информации, рассмотрим в фокусе этого взгля да задачу ранжирования показателей по степени их влияния на возможность появления какого-либо события. Эта задача является одной из наиболее распространенных в практике экспертного оце нивания. Ее решение можно получить с помощью любого из рассмотренных методов. Однако несмотря на многообразие мето дов, суть подхода, реализуемого в этих методах, одна — непосред ственное оценивание показателей. Наряду с простотой реализации этот подход имеет и ряд недостатков. Очевидно, что его примене ние имеет смысл только в линейном случае, когда степень влия ния не зависит от структуры оцениваемого набора показателей. В реальных ситуациях все гораздо сложней. Представление о линейном взаимодействии — скорее абстракция, помогающая уп ростить задачу, сделав ее всегда решаемой, но с некоторой ошиб кой, которой можно пренебречь. Логика получения результатов по такой схеме оценивания без учета совместных эффектов вполне объяснима. Решение ищется для конкретной ситуации с фиксиро ванной структурой показателей, которая хотя и не указывается в задании эксперту, но, как правило, присутствует в его представ лениях о решаемой задаче. Но как только структура начинает из меняться, сразу же появляются неучтенные эффекты взаимодей ствия и надежность экспертных оценок резко снижается. Поэтому непосредственное оценивание показателей с предполагаемой линей ной структурой взаимосвязей необходимо заменить более сложным, основанным на модельном представлении структуры, но без услож нения самой процедуры опроса экспертов. При этом модель, от ражающая взаимосвязь между возможностью появления интересу ющего нас события и набором оцениваемых показателей, должна быть, по всей вероятности, нелинейной и, кроме того, эконометрической, так как интерес вызывают не только механизм взаимо действия, но и количественная оценка силы этого взаимодействия, а также желание заменить повторные экспертные опросы прогноз ными оценками. Последнее особенно важно. Именно этой воз можностью не обладают ранее рассмотренные методы. Таким образом, смысл излагаемого здесь подхода в том, что бы экспертную информацию использовать для построения модели, а не для получения самих оценок. Возникает естественный воп рос: "Каким образом экспертная информация может использовать ся для этих целей?" По всей видимости, можно предложить несколько подходов, обеспечивающих реализацию обсуждаемой 48
здесь идеи. Наше предложение заключается в том, чтобы инту ицию и знания экспертов применить для формирования специаль ного набора данных псевдовыборки, по которым оцениваются ко эффициенты модели, имеющей, в отличие от непосредственных экспертных оценок, многоплановое применение: анализ, оценка значимости факторов, прогноз ожидаемых событий и т.п. Есте ственно, это значительно расширяет область практического ис пользования экспертных решений. Реализация данного подхода предполагает введение бинарной переменной со следующим смыслом: _ I \, если, по мнению эксперта, событие должно произойти; J О, в противном случае. Будем считать, что значение этой переменной, характеризу ющей появление интересующего нас события, зависит от оценива емого нами набора показателей xv х2, ... , хт, и существует не которое множество различных вариантов х,, х2, ... , х/( этих на боров х;. = (хп, хп, ... , хш), отличающихся друг от друга все ми или некоторыми своими компонентами (оцениваемыми пока зателями). Предполагается, что у каждого эксперта есть представ ление о том, при реализации каких вариантов ожидаемое собы тие будет иметь место, а при реализации каких — нет. Матема тически это предположение записывается в виде зависимости yf = f(x,,,* / 2 ,...,*,„) + £*, (3-1) где у* — ожидаемое значение бинарной зависимой переменной, которое k-й эксперт связывает с г'-м набором оцениваемых пока зателей; f(xn, ха, ... , xjm) — индексная функция, т.е. функция, принимающая всего два значения: 0 и 1; £,- — ошибка, которую может допустить k-Pi эксперт, оценивая влияние /-го набора на появление ожидаемого события (£,*— случайная переменная со значениями в номинальной шкале: I, 0, -1). Теперь становится понятной реализация основанной на модель ном подходе идеи получения экспертных решений. Сначала в результате целевого опроса экспертов формируется псевдовыбор ка, объединяющая в себе субъективные мнения по поводу инте ресующих нас закономерностей, предпочтений, рейтингов, про гнозных оценок и т.п. Затем по данным псевдовыборки строит ся регрессионная зависимость (3.1), связывающая субъективные мнения с одновременным их усреднением в единую формализо ванную зависимость. Построенная таким образом модель, по 49
сути, является концентрированным выражением обобщенного мнения экспертов по изучаемой проблеме и может использовать ся для анализа и получения всевозможных оценок. Модель в качестве результата опроса, а не разовые экспертные оценки является главной особенностью данного подхода. Благодаря этой особенности удается получить прогнозные оценки экспертных суждений, т.е. оценки субъективного характера относительно тех событий или объектов, о которых эксперты не знали или не имели представления в момент формирования псевдовыборки. Практическая реализация этой процедуры требует рассмотрения целого ряда довольно сложных вопросов: Как построить регрессию на бинарную переменную? Какими способами эксперты должны формировать выборочную совокупность (псевдовыборку) для построения регрессии с бинар ной зависимой переменной? Как оценить компетентность эксперта и адекватность построен ной таким образом модели? Как проверить согласованность мнений опрашиваемой группы экспертов? Как оценить надежность расчетных характеристик, получаемых с помощью регрессии субъективных суждений? Какую содержательную интерпретацию имеют оценки, полу ченные в результате моделирования экспертных предпочтений? Можно ли, а если можно, то как использовать статистические методы для проверки различного рода гипотез, выдвигаемых от носительно оцениваемых параметров и объектов? По сути, в этих вопросах нет ничего нового. Практически все они в той или иной степени присутствуют в задачах прямого эк спертного оценивания, обеспечивая надежность получаемых ре зультатов. Но расчет и анализ характеристик, а также соответ ствующие выводы на их основе в новом подходе отличаются от того, как это делается в традиционном, поэтому требуют специ ального рассмотрения. 3.1.2. Эконометрический подход к построению моделей субъективных предпочтений Решение первого и, очевидно, самого главного во проса, связанного с моделированием субъективных предпочтений, требует построения регрессионного уравнения специального вида. Проблема, которую необходимо преодолеть при реализации это50
го подхода, связана, прежде всего, с тем, что применение ли нейной регрессии у = ХЬ + е (3-2) для рассматриваемого случая не может привести к успеху, так как значения линейной формы xib = b0+blxn+b2xl2 + ••• +bmxim, i = l,n °°; 4) F(z) —> 0 при z —> — °°. 51
В практике решения прикладных задач в качестве F, как пра вило, используются две функции. Если такой функцией являет ся стандартная нормальная вероятностная функция распределения Ф(г) = -1= [e'^dx, л/2я: J
(3.5)
—со
то регрессионная зависимость называется пробит-моделью. В слу чае, когда используется логистическая функция
Пг) = —Ц- зависимость называется логит-моделью. Обе функции удовлетворяют всем четырем условиям, сформу лированным выше, и, кроме того, являются симметричными относительно z = О, т.е. Ф(—г) = 1 - Ф(г) и Л(—г) = 1 ~ л(г). Эти свойства значительно упрощают всевозможные преобразова ния тех выражений, в которых используются эти функции. Таким образом, понимая под функцией регрессии зависимость "в среднем" между зависимой и независимыми переменными, можно записать Е(у | х) = 1 • F(xb) + 0 • (1 - F(xb) = F(xb), (3.6) где F (xb) — одна из вышеприведенных функций распределений. Отражая тот факт, что реальная зависимость не всегда совпа дает с математическим ожиданием и, кроме того, ее значения могут отличаться даже на совпадающих наборах значений незави симых переменных, введем в рассмотрение случайную составля ющую е и окончательно запишем yt = ЕСу;|х,) + £; = F(x.b) + £,., i = u-
(37)
Нелинейный характер этих моделей, естественно, по сравне нию с линейными моделями требует применения более сложно го математического аппарата, который, к сожалению, не изло жен на русском языке в форме, доступной для понимания. По этому ниже будет приведено достаточно подробное описание всего комплекса формальных процедур построения и анализа моделей, которые нами используются для прогнозирования субъективных предпочтений. Уровень детализации в изложении материала прак тически исключает в рассуждениях моменты, требующие самосто ятельного восстановления преобразований, пропущенных якобы в 52
силу их очевидности. Это позволит заинтересованным читателям в полном объеме освоить основы математического аппарата эко нометрики качественных переменных. Полученные знания обес печат грамотное восприятие и корректное практическое использо вание результатов моделирования. Однако не следует эту возможность воспринимать как обяза тельный элемент знаний, без которого доступ к практическому применению этого аппарата существенно ограничен. Для тех, кто в большей степени ориентирован на практическое использование предлагаемых здесь методов, вполне достаточно уметь пользоваться одним из статистических пакетов, владеть приемами интерпрета ции результатов моделирования и освоить принципы формирова ния псевдовыборки, к изложению которых мы переходим.
3-1.3- Принципы формирования псевдовыборочных совокупностей Вопрос применения для наших целей моделей бинар ного выбора имеет два аспекта. Один из них связан с методами построения этих моделей. Это тот аспект проблемы, основная на правленность которого — корректное применение математического аппарата, как уже отмечалось, будет со всеми деталями рассмот рен ниже. Другой аспект представляет собой срез информацион ной составляющей, обнажающий проблему формирования специ альных выборочных совокупностей и правомерность их использо вания в процедурах построения эконометрических моделей. Это как раз та проблема, на решение которой должны быть нацеле ны усилия экспертов. Смысл основной задачи, стоящей перед экспертами, формиру ющими псевдовыборку, в том, чтобы на данные выборочного множества перенести собственные представления о механизмах предполагаемых закономерностей между объясняющими переменны ми и ожидаемыми событиями. Тогда, если проведение такой про цедуры было успешным, то по замыслу построенная модель долж на отражать ту закономерность, руководствуясь которой эксперт оценивал степень воздействия выборочных значений на возможные проявления интересующего нас события. Таким образом, главное отличие псевдовыборки от выборки в том, что в ее данных содер жится информация, которую эксперты сумели обнаружить и связат своими субъективными оценками со значениями зависимой переменной. Способы формирования псевдовыборки зависят от смыслово го содержания решаемой задачи. Это не совсем строго формализо53
ванные процедуры, и поэтому для их успешного применения в каждом конкретном случае требуется адаптивное вмешательство. Рассмотрим типовые ситуации, которые возникают в практике анализа и прогнозирования бизнес-процессов. Можно выделить три ситуации, которые отличаются принципами формирования псевдовыборки. В первой ситуации псевдовыборку формируют непосредственно из выборочной совокупности с известными значениями зависимой (дихотомической) и независимых переменных^ Это тот случай, когда взаимосвязь между yt и наборами х,- (/ = 1, п) существует, но эксперты не уверены в абсолютной правомерности и надежности такой связи. Применяя принцип усиления взаимосвязей субъективны ми мнениями, они своими оценками уточняют возможность появ ления соответствующего значения yi при заданном наборе х(. Уточ няющие оценки удобно, хотя и не обязательно, получать в баллах, пользуясь для этого стобалльной шкалой. Таким образом, в резуль тате опроса эксперта каждому наблюдению будет приписано опре деленное количество баллов. Причем чем выше, по мнению экс перта, реальность наблюдаемого значения у. при соответствующем наборе объясняющих переменных хЛ тем больше баллов приписы вается данному наблюдению. Количество баллов удобно интерпре тировать как частоту (число случаев), с которой данное наблюде ние тиражируется в выборочной совокупности. Вторая ситуация, которую мы намерены рассмотреть, преду сматривает случаи, когда выборочное множество состоит только из объясняющих переменных и требуется на основе принципа субъективной идентификации взаимосвязей восстановить значения бинарной зависимой переменной. В соответствии с этим прин ципом эксперт каждому набору объясняющих переменных выбо рочной совокупности ставит в соответствие одно из возможных значений (0 или 1) зависимой переменной. В сформированной таким образом псевдовыборке, как нетрудно понять, содержится информация, отражающая субъективное мне ние по поводу того, какие условия, описываемые объясняющими переменными, благоприятны, а какие неблагоприятны для появ ления некоторого события. Другими словами, экспертами сгенери рованы значения бинарной переменной в зависимости от значений объясняющих переменных. Естественно, модель, построенная по данным так сформированной псевдовыборки, будет являться до вольно грубым приближением к той зависимости, которую экспер ты пытались описать своими предпочтениями в процессе формиро54
вания дискретной зависимой переменной. Поэтому желательно провести некоторые уточнения, используя для этого, например, описанный выше принцип усиления взаимосвязей субъективными мнениями. Как следует из приведенных рассуждений, для получения надеж ных результатов в условиях второй ситуации целесообразно псевдо выборку формировать на основе двух сформулированных здесь прин ципов. Причем использование этих принципов может быть как последовательным, так и параллельным. Последовательное приме нение фактически уже было рассмотрено. Процедура параллельного использования принципов, по сути, приводит к тем же результа там. В ее рамках предполагается, что одновременно с идентифи кацией бинарного значения оценивается и возможная частота по явления идентифицированного значения в выборочной совокупно сти. Для этих целей можно использовать не только балльное оце нивание, как в случае первой ситуации, но и другие процедуры экспертного оценивания. Особенность третьей ситуации в том, что исследуемые объек ты имеют не только описание в виде набора показателей, но и имена. Например, это могут быть города, районы области, фир мы, товары и т.п. Предполагается, что эксперты знакомы с эти ми объектами до такой степени, что способны указать свои пред почтения относительно их использования в определенных целях. В принципе им могут быть известны и показатели, задающие формальное описание объектов. Но вне зависимости от уровня информированности экспертов, вне зависимости от полноты ин формационного описания этих объектов эксперты имеют субъек тивное представление об интегрированной ценности каждого объекта. Это как раз тот случай, когда для формирования псев довыборки следует применять принцип субъективных предпочтений. Если объектов не более двух-трех десятков, то принцип субъек тивных предпочтений удобно реализовать с помощью метода пар ных сравнений, подробное описание которого приводилось в пре дыдущей главе. Причем сравнивать между собой следует объекты, а не их информационные описания. Это значительно упрощает работу экспертов, но только в том случае, если у них действи тельно имеются интегрированные представления об объектах. Формирование значений бинарной переменной осуществляет ся по результатам экспертного опроса, отраженным в матрице парных сравнений. Объектам, которые получили больше полови ны предпочтений в процессе сравнения с другими объектами, 55
приписывается 1, а получившим меньше половины — 0. Одновре менно с формированием массива значений бинарной переменной можно, руководствуясь первым принципом, осуществить усиление предполагаемых связей. Для этого можно использовать или сумму очков, обеспечивших объекту предпочтение, или сумму потерян ных очков. Другими словами, если объекту приписана 1, то дан ные о нем в псевдовыборке повторяются столько раз, сколько он набрал очков при сравнении с другими объектами, а если 0, то число повторений определяется числом потерянных очков. Метод парных сравнений, являясь удобной процедурой форми рования псевдовыборок, не всегда обеспечивает получение ожида емого результата. Поэтому в арсенале исследователя должно быть несколько дополняющих друг друга процедур экспертного опроса, которые в случае необходимости могут комбинироваться при фор мировании одной и той же псевдовыборочной совокупности. Результатом применения вышеописанных принципов является выборочная совокупность следующей структуры: У\
х
\\
х
•••,
х
У2
Х
2\
Х
22>
•••'
х
Уп
Х
п\
Х
п2'
•••'
Х
12>
\т
2т
пт
w
l'>
W
2'
W
n-
где yi — сгенерированное по результатам экспертного опроса зна чение бинарной переменной; хп, xl2,..., xim — набор показате лей, которые, по мнению экспертов, определяют выбор сгенери рованного ими значения бинарной переменной; w;. — определяемая экспертами частота повторяемости /-го наблюдения в выборочной совокупности. Такая форма представления данных выборочной совокупности очень удобна для компьютерной обработки с помощью, напри мер, пакета STATISTICA. Чтобы завершить обсуждение вопроса, связанного с формиро ванием специальных выборочных совокупностей, необходимо про вести обоснование правомерности использования для построения бинарных моделей данных, полученных подобным образом. Фор мально числовые данные псевдовыборки ничем не отличаются от данных выборочной совокупности, полученных в результате ста тистических наблюдений. Более того, элементами псевдовыбор ки зачастую являются сами статистические наблюдения. И поэто56
му в силу того, что на формальном уровне данные этих якобы различных, по сути, выборочных совокупностей можно считать гомогенными, при построении модели не возникает вопросов вычислительного характера, но они сразу же появляются, как только есть необходимость в содержательной интерпретации и проверке статистической значимости результатов моделирования. Правомерность проверки статистической значимости результа тов моделирования по стандартным тестам, описание которых будет дано ниже, гарантируется свойствами случайной составля ющей модели экспертного опроса (3.1). Если ошибки, которые допускает эксперт в своих предпочтениях при формировании псев довыборки, независимы и нормально распределены, то случайная составляющая удовлетворяет необходимым условиям и применение тестов можно считать корректным. Подобные предположения не противоречат возможностям реальных ситуаций. Правда, здесь уместно заметить, что все, о чем мы говорим, имеет смысл толь ко в том случае, если эксперты относятся к своей работе добро совестно. 3-1.4. Оценка надежности и согласованности результатов моделирования экспертных предпочтений Псевдовыборка, сформированная одним из вышеопи санных способов, позволяет построить регрессионную модель, от ражающую механизм субъективного выбора интересующих нас альтернатив. Этот механизм может отражать как индивидуальную точку зрения, так и групповое мнение в зависимости от того, какая процедура использовалась при формировании выборки. Чтобы подобную модель применять в практической деятельности, нужна уверенность в надежности получаемых с ее помощью ре зультатов анализа и прогноза. Надежность при использовании подобного подхода может рождаться только из оценок, свидетель ствующих о компетентности экспертов и согласованности их мне ний. Поэтому в центре дальнейших наших рассуждений будут именно эти вопросы. Естественно, при оценке компетентности и согласованности можно использовать известные процедуры, применяемые в эксперт ных методах прямого оценивания. Это имеет смысл и позволя ет получать некоторые гарантии надежности, но не в полном объеме. Необходимость в дополнительных характеристиках возни57
кает потому, что при реализации рассматриваемого здесь подхо да изменяется представление о содержательном смысле характери стик надежности. Прежде всего это касается компетентности эк сперта. Переходя к рассмотрению компетентности, сразу согласимся с тем, что эксперт имеет право на собственное мнение, отличное от других экспертов. На наш взгляд, оригинальность в оценках не должна снижать компетентность, несмотря на то, что есть точка зрения [40], в соответствии с которой оценка компетентности тем выше, чем ближе индивидуальные оценки к групповым. Но с этой точкой зрения можно согласиться только при условии, что групповые оценки совпадают или почти совпадают с истинными. Вполне возможна ситуация, когда вопреки нашим ожиданиям групповые оценки далеки от истинных значений и заключение о компетентности, сделанное на основе близости индивидуальной оценки к такой групповой, теряет смысл. Независимо от сделанного замечания и не взамен общеприня того подхода введем в рассмотрение еще одну составляющую компетентности. Оценка этой составляющей основана на положе нии, смысл которого в том, что эксперт не может быть компе тентным, если его оценки противоречивы. Возникает естествен ный вопрос: как оценить уровень противоречивости экспертных суждений? Содержательный смысл решаемой здесь задачи позволяет пред ложить следующий подход. Сформированная экспертами псевдо выборка представляет собой данные, которые, по сути, сгенери рованы в соответствии с представлением эксперта о взаимосвязи предпочтений бинарного выбора с факторным пространством. Если модель хорошо подгоняется к этому набору данных, т.е. имеет достаточно высокий индекс отношения правдоподобия (ко эффициент Макфаддена, который далее будет рассмотрен более подробно), то следует признать, что суждения эксперта не про тиворечивы, ему действительно удалось сформировать модель соб ственных суждений, и поэтому он может быть отнесен к группе компетентных специалистов. Для этих же целей можно использовать энтропийный коэффи циент предсказывающих возможностей построенной модели. Этот коэффициент имеет следующий вид:
58
Н = - -jF( X .b)log 2 F( X ,b)-J(l-F(x,b))log 2 (l-F(x,b)) п
(3.8)
Для случая, когда расчетные значения модели в точности со впадают с фактическими значениями дихотомической перемен ной, значение коэффициента равно нулю, т.е. во всех случаях модель обеспечивает безошибочный выбор, не оставляя место для сомнений в пользу альтернативы. Максимальный уровень энтро пии (Н — 1) получается в случае, когда для всех рассмотренных ситуаций j) =F(x,b) = 0,5- Во всех остальных случаях 0 < Н < 1. Величина коэффициента показывает средний уровень неопределен ности в каждом случае бинарного выбора, которая остается по сле построения модели. Случай, когда построенная модель оказывается неадекватной, свидетельствует о некомпетентности эксперта, так как его взгля ды на исследуемую проблему были противоречивы. Механизм, трансформирующий противоречивость взглядов в неадекватность модели, можно представить следующей схемой рассуждений. Противоречивость является следствием неуверенности эксперта в собственных суждениях. В свою очередь, неуверенность нарушает логику, которой он должен придерживаться в процессе реализа ции своих предпочтений на выборочном множестве. В силу этого в сформированной псевдовыборке содержатся данные, слабо со гласованные со значениями бинарной переменной. Несогласован ность исключает возможность восстановления той зависимости, которой якобы пользовался эксперт, формируя псевдовыборку. Таким образом, модель действительно имеет плохую точность в тех случаях, когда псевдовыборка формировалась некомпетент ным образом. Поэтому уровнем адекватности модели имеет смысл измерять компетентность эксперта. Чем выше уровень адекватно сти (коэффициент Макфаддена) или ниже остаточная энтропия (энтропийный коэффициент), тем компетентнее действовал экс перт, распределяя свои предпочтения между наблюдениями выбо рочной совокупности. Переходя к рассмотрению вопроса о согласованности оценок, сразу заметим, что, как и в случае прямого экспертного опроса, в рассматриваемом подходе действует тезис — доверие групповым оценкам выше, чем индивидуальным. Действие тезиса возможно только при согласованности индивидуальных оценок. Следователь но, не любая групповая оценка обладает высокой надежностью. На первый взгляд может показаться, что для проверки согласованнос ти можно воспользоваться двумя подходами: в соответствии с пер вым проверять согласованность до построения модели, в соответ ствии со вторым — после построения по результатам моделирования. 59
От первого подхода сразу нужно отказаться, Дело в том, что псевдовыборка, сформированная с ориентиром на согласованное мнение экспертов, не всегда гарантирует построение адекватной модели. Это бывает в том случае, когда согласованными оказа лись мнения некомпетентных экспертов. Подобная ситуация не возникает в задачах прямого экспертного оценивания. В них ком петентность оценивается либо экзогенно, и тогда она не связана с результатами опроса, либо в зависимости от того, насколько соответствующее индивидуальное мнение похоже на групповое. Второй подход представляет собой авторское решение задачи, в рамках которой проверяется согласованность экспертных сужде ний. Как и в случае прямого экспертного оценивания, в пред лагаемом подходе предусматриваются проверка согласованности мнений двух экспертов и проверка согласованности мнений всей группы экспертов, принявших участие в экспертизе. Обе провер ки основаны на одной и той же идее. Смысл этой идеи в том, что эксперты с близкими мнениями распределяют свои предпоч тения по выборочной совокупности так, что полученные псевдо выборки обеспечивают построение почти идентичных моделей. Таким образом, проверка согласованности сводится к статистичес кой проверке значимости уровня идентичности. Выполнить такую проверку можно несколькими способами. На наш взгляд, наиболее приемлемым следует считать способ, который позволяет не только оценить статистическую значимость, но и получить содержательно интерпретируемую величину, харак теризующую уровень идентичности моделей и, следовательно, уровень согласованности экспертов. В качестве такой величины удобно использовать коэффициент Юла, который измеряет тесноту связи между двумя дихотомическими переменными. Формально с помощью этого коэффициента мы можем оценить тесноту связи между предикторными возможностями двух моделей бинарного выбора. Для этого заполняется таблица сопряженнос ти 2 х 2 следующего вида: Модель 1-го эксперта 1 Коды 0 1 а в 0 с d
Правило заполнения таблицы сопряженности довольно про стое. В верхней левой клеточке стоит число случаев, когда пред60
сказания по обеим моделям совпадали и были равны 1, в ниж ней правой — число случаев, когда обе модели предсказали 0. В остальных клеточках стоит число несовпадающих предсказаний. Коэффициент Юла рассчитывается по формуле ad-be ,, g. ad + be При полном совпадении предсказанных значений qn — 1, и мы наблюдаем случай, когда мнения экспертов идентичны; при qn = —\ мнения экспертов противоположны, а при qn = 0 — независимы. Чем ближе значение коэффициента к 1, тем выше уровень согласованности экспертных мнений. Для проверки групповой согласованности нет подходящего из мерителя. Но можно предложить следующую двухэтапную проце дуру. На первом этапе для каждой пары экспертов вычисляется коэффициент сопряженности Юла, и все эксперты делятся на две группы. В первую группу включаются только те эксперты, по моделям которых предсказанные значения имеют положительную связь между собой. Из коэффициентов сопряженности этой груп пы формируется матрица Яи
Q=
Яи Яп
Яш Ягт
Матрица Q обладает всеми свойствами, необходимыми для того, чтобы с помощью обычной итерационной процедуры вычис лить максимальное собственное значение Я, которое является дей ствительным числом. Тогда в качестве меры, определяющей уро вень согласованности экспертов, можно использовать величину L=^ - =— , (3.10) trQ-1 m-1 в знаменателе которой стоит след матрицы без единицы. Так, определенный коэффициент согласованности будем назы вать характеристическим. Он равен 1, когда между всеми экспер тами группы наблюдается абсолютное согласие, и равен 0, если результаты экспертного опроса статистически независимы. С отбракованной на первом этапе группой экспертов поступа ют точно так же. 61
Окончательно групповая оценка строится только для группы экспертов, имеющих согласованные мнения. Для этого все псев довыборки объединяются в одну, по данным которой строится модель, отражающая групповое экспертное мнение. Ее и реко мендуется использовать в расчетах. 3.1.5. Предельный анализ моделей субъективных предпочтений Предельный анализ факторов модели экспертных предпочтений проводится по схеме предельного анализа бинарной модели. Поэтому вначале изложим все детали предельного анализа бинарной модели, а затем обсудим интерпретацию этих результа тов для случая, когда моделируются экспертные предпочтения. Рассмотрение начнем с линейной модели. В классической теории коэффициенты линейной регрессии интерпретируют как предельные коэффициенты абсолютного ро ста. Принято считать, что k-н коэффициент регрессии показы вает, насколько изменится зависимая переменная (моделируемый показатель), если к-я независимая переменная изменится на еди ницу при условии, что эта единица достаточно мала, а все ос тальные переменные неизменны. Естественно, при построении пробит- и логит-моделей возникает аналогичный вопрос. Предельный анализ с использованием пробит- и логит-моделей в силу их нелинейного характера и вероятностной интерпретации результатов моделирования требует более сложных математических обоснований по сравнению с линейными моделями. Рассмотрим общий случай модели бинарного выбора и запи шем для события yt- условное математическое ожидание E(y,.|x,.) = lF(xi.b) + 0(l-F(x,b))(3-П) Предельный эффект к-го фактора вычисляется в виде первой производной ЭЕ(у,.|х,.) faF(x,.b)3(x,.b) = f(x,.b)b t , (3.12) dxik { Э(х,Ь) dxik где f() — функция плотности, связанная с соответствующим кумулятивным распределением F(). Полученный предельный эффект можно интерпретировать как величину, на которую изменяется вероятность выбора при изме нении фактора на единицу, т.е., по сути, как изменится неопре62
деленность ситуации бинарного выбора. Однако механизм форми рования этой величины не так прост, как в линейной модели, и представляет собой взаимодействие двух составляющих, каждая из которых имеет собственную интерпретацию. Первая составляющая определяется плотностью распределения, которая в предельном эффекте является изменяемой характерис тикой, зависящей от х- Рассмотрим основные механизмы фор мирования этой составляющей и ее содержательную интерпрета цию. Прежде всего обратим внимание на то обстоятельство, что изменение к-й переменной, например в сторону увеличения ее значения, может привести как к увеличению, так и снижению плотности вероятности. Механизм реализации этих изменений начинает действовать с изменения значения линейной формы: Zi = x,b = b0+ bxxn +••• + bkxik +••• + bmxim. (3.13) Изменение линейной формы зависит от величины и знака ко эффициента регрессии Ьк. В свою очередь, изменение плотнос ти вероятности зависит не только от величины, на которую из менилось значение линейной формы, но и от того, где это зна чение расположено на оси z- Если оно лежит в левой половине распределения, то увеличение z приводит к возрастанию плотно сти, если в правой — то к снижению. Это положение хорошо иллюстрирует рис. 3.1.
Рис. 3.1. Изменение плотности вероятности в зависимости от распо ложения значения линейной формы Анализ предельной производительности факторов позволяет обнаружить, что максимально возможная производительность фактора достигается в тех точках, в которых плотность имеет наи большее значение. Интересно, что именно в этих точках ситуа ция бинарного выбора обладает самым высоким уровнем неопре деленности. Это становится совершенно очевидным для логит63
модели, если вспомнить о выражении для плотности и предель ную производительность ее А:-го фактора записать в виде ЭЕ(У |Х )
'
' = F(x,b)(l - F(x,b))b,.
(3.14)
Максимальное значение первой составляющей, которая в дан ном выражении представлена произведением вероятностей, до стигается при F(x;b) = 0,5, т.е. когда имеет место самый высо кий уровень неопределенности. Вторая составляющая менее интересна для анализа. Она рав на постоянной величине и в основном играет роль мультиплика тора, усиливающего или снижающего вклад первой в предельную производительность. Геометрически (см. рис. 3.1) при увеличе нии xik на единицу коэффициент Ьк определяет ширину прямо угольника с высотой f(x(.b), на величину площади которого изме няется вероятность бинарного выбора в условиях, описываемых вектором х(. Так как события бинарного выбора несовместны, то при рас смотрении результатов предельного анализа нужно помнить, что увеличение вероятности возможного появления одного из событий влечет за собой уменьшение на ту же самую величину вероятно сти возможного возникновения альтернативного события. Поэтому если из двух вероятностей увеличивается при изменении xjk та, которая имеет большее значение, то неопределенность выбора снижается; если та, которая имеет меньшее значение, то неопре деленность выбора увеличивается. Переходя к интерпретации результатов моделирования эксперт ных предпочтений, прежде всего попытаемся понять смысл рас четных значений &=F(x,.b)-
(3.15)
С одной стороны, это вероятность возможного появления собы тия, состоящего в том, что yj примет значение, равное 1, а с другой — это характеристика оставшейся в предпочтениях эксперта неопределенности. Действительно, с ее помощью можно вычис лить энтропию Я, =-F(x,.b)log 2 F(x,.b)-(l-F(x 1 .b))log 2 (l-F(x,6)). ( з л 6 ) которая характеризует уровень неопределенности бинарного выбо ра, сохраняемый в точке х,- после экспертного опроса. 64
Предельная производительность фактора, изменяя вероятность выбора, естественно, изменяет и энтропию ситуации, в которой осуществляется выбор. Причем, как упоминалось выше, рост вероятности в одних случаях снижает энтропию, а в других при водит к ее увеличению. Фактически это означает, что для экспер та более важной является информация о ситуации, в которой он будет принимать решение, а не информация о возможном изме нении ситуации. Ситуацию с максимальной энтропией можно понимать как равновесную, смысл которой в том, что эксперт не располагает информацией, позволяющей одну альтернативу предпочесть дру гой. Естественно, что именно в этой ситуации любая информа ция, позволяющая изменить степень предпочтения эксперта, це нится дороже, чем та же самая информация, но в условиях, когда уже сформированы убедительные предпочтения. На основе результатов анализа предельных производительностей легко выстраивается процедура ранжирования факторов по степени их влияния на вероятность появления интересующего нас события (на изменение уровня неопределенности). В основе про цедуры лежит простое соображение. Так как первая составляющая (плотность вероятности) одинакова для всех факторов, то поря док значимости факторов следует определять по абсолютной вели чине коэффициентов бинарной регрессии. Если вспомнить, что в случае линейной модели ранжирование факторов по величине соответствующих коэффициентов регрессии некорректно, то вы вод следует признать неожиданным. Таким образом, предельный анализ модели экспертных пред почтений позволяет оценить влияние факторов на уровень неопре деленности в каждой ситуации бинарного выбора, а также упо рядочить все факторы по степени их влияния на выбор в любой из рассмотренных ситуаций. 3.2. Методы оценивания моделей бинарного выбора 3.2.1. Метод максимального правдоподобия Построение регрессионных моделей с использованием нелинейных зависимостей подобного типа практически исключа ет применение метода наименьших квадратов. Для оценивания моделей бинарного выбора обычно используется метод максималь ного правдоподобия [2]. Применение этого метода осуществляется 65
в предположении, что каждое наблюдение может трактоваться как однократный выбор из распределения Бернулли. Таким образом, модель с вероятностью успеха F(x/b) и независимыми наблюдени ями (эксперты опрашиваются независимо друг от друга) представ ляет собой вероятность совместного появления всей совокупнос ти ожидаемых событий: Wx=yx,Y2=y2,
... Y„=yn)=
n F ( x , b ) n ( l - F ( x ; b ) . (3.17)
Для каждого вектора у, представляющего собой результаты конкретного экспертного опроса, величина вероятности зависит от вектора оцениваемых параметров b и может быть записана как функция правдоподобия L(y,b) = nF(x,.b) v '[l-F(x,b)] 1 - v '.
(3.18)
В данной форме записи множители произведения селектиру ются с помощью компонент вектора у, принимающих всего два значения: 0 или 1. Удобнее и математически проще максимизировать логарифми ческую функцию правдоподобия: lnL = E[y,lnF(x,b) +(l- 3 > / )ln(l-F(x,.b))].
(3.19)
Используя сокращенные записи F; = F(x ( b) и F£(x.b) = f-> вы пишем для логарифмической функции правдоподобия условия максимизации первого порядка:
ain_L= « v f
-f х', = 0 . (l-F,)
(3.20)
Подставляя в полученное выражение логистическое распределе ние, имеем после очевидных преобразований следующую систему уравнений:
Х(х-Л,)х,=0.
(3.21)
/=1
В случае нормального распределения система уравнений име ет вид cHnL
М эь =1 Ф;
66
+ (1_Л)_^_ х'=0.
(1-Ф,)
(3.22)
Введение в рассмотрение переменной qt = 2у. переписать эту систему следующим образом:
1 позволяет
'' [1- F(x*b)]'"v' } =
=п 70
2>< I-F(x*b) F(x*b) M
'•'
(3.39)
Если все пк достаточно велики, то можно вместо максимиза ции логарифмической функции правдоподобия для получения оценок параметров модели применить схему метода взвешенных наименьших квадратов. С этой целью перейдем от исходного на бора наблюдений к наблюдениям вида (ДД.),
/ = 1,2, ...,7V,
(3-4°)
где р =2^у'- / rij— относительная частота события, состоящего в /=' том, что зависимая переменная примет значение, равное едини це, при значениях объясняющих переменных, равных х,. В соответствии с теоремой Бернулли относительная частота Д связана с истинным значением вероятности P{j,-=l|x,.) = F(x;b) неравенством P{|p,.-F(x,.b)jl-],
(3.48)
которая является решением уравнения ez/(l + ez) = pi
(3.49)
относительно z, т.е. действительно находит квантиль уровня р{. В пробит-моделях значения зависимой переменной yi опреде ляются в виде табличных квантилей уровня Pi стандартного нор мального распределения. 72
После преобразования моделей к линейному виду их построение осложняется только гетероскедастичностью остатков е;-. Как извест но, избежать возможного искажения коэффициентов удается путем применения взвешенного метода наименьших квадратов. В каче стве весовых коэффициентов в этом методе используются величи ны, обратные дисперсии соответствующих остатков De}. Для логит-модели весовые коэффициенты определяются из соотношения (') Щ
=
_J_ Det
=
Щf/2 Ц-а-Ц)
=
.dA(x.b) 2 2 2 "' d(»,b) = я,-Л (1-Л,-) Л(х 1 -Ь)(1-Л(х / Ь) Л ; (1-Л г -)
=
= л,.Л,.(1-Л,). (3.50) Таким образом, оценка параметров логит-модели сводится к решению оптимизационной задачи вида Хи^ф-Х/Ь)2 /=i
-*
min,
(3.51)
ь
где у,- рассчитано по формуле (3.48); w(/) определяется в соответ ствии с (3.50). Оценка параметров b пробит-модели сводится к решению этой же оптимизационной задачи, но с другими значениями зависимой пе ременной и другими весовыми коэффициентами. Для пробит-модели значения зависимой переменной yt определяются в виде табличных квантилей уровня pi стандартного нормального распределения, а весовые коэффициенты w- рассчитываются по формуле w\n) =п,.ф 2 (х,Ь)/Ф(х,Ь)(1-Ф(х,.Ь)),
(3.52)
в которой ср — функция плотности, а Ф — функция распределе ния стандартного нормального закона вероятности. При фиксированных значениях весовых коэффициентов w ре шение оптимизационной задачи (3.51) легко получается с помо щью обобщенной процедуры метода наименьших квадратов. Од нако в рассматриваемом случае веса w зависят от оцениваемых параметров Ь, и решение оптимизационной задачи можно полу чить, применив итерационную процедуру. На первом шаге этой процедуры оптимизация (3.51) проводится с помощью обобщен ного метода наименьших квадратов при w = 1. Полученные оцен ки Ь^1' используются для подсчета по соответствующим формулам 73
весовых коэффициентов w' '(b^') или w^p\h( ') в зависимости от модели (логит-модель или пробит-модель). Эти новые коэффици енты применяются в обобщенном методе наименьших квадратов на следующем шаге итерационной процедуры для получения оце нок Ь^ '. Итерационная процедура продолжается до тех пор, пока пересчитанные весовые коэффициенты очередного шага не совпа дут до определенного знака после запятой с весовыми коэффици ентами предыдущего шага. Подобного рода итерационные процедуры применяются во мно гих статистических пакетах. В частности, возможность построения моделей бинарного выбора с использованием итерационной проце дуры реализована, например, в пакетах Eviews и STATISTICA. 3.3. Оценка качества пробит- и логит-моделей 3.3-1 • Адекватность Оценка качества регрессионных моделей с бинарной зависимой переменной осуществляется практически по той же схеме, что и качества обычной линейной регрессии: определяет ся пригодность модели в целом, затем — статистическая значи мость каждого коэффициента модели и, наконец, проверяются гипотезы (если они имеют место) относительно ограничений, которым могут удовлетворять отдельные группы параметров. Пригодность модели в целом (адекватность) определяется с по мощью двух показателей. В качестве первого рассмотрим предло женный Макфадденом (McFadden) индекс отношения правдоподобия тот
1
toLflj)
lnL(60) где InL(b) — максимальное значение логарифмической функции правдоподобия, достигаемое в точке, координаты которой равны оценкам параметров модели b = (b0, bx,..., bm), a lnL(£0) — зна чение логарифмической функции правдоподобия, вычисленное в предположении, что Ьх = Ь2 = ... = Ът = 0. (Во многих пакетах предусмотрен расчет этих значений функции правдоподобия.) Интуиция подсказывает, что значения такого показания долж ны быть заключены между 0 и 1. Действительно, в случае, когда все коэффициенты, кроме Ь0, равны нулю, индекс отношения правдоподобия тоже равен нулю. Если же модель оказалась такой, 74
что ее расчетные значения у = (F(x Ь) в точности совпадают с наблюдаемыми значениями уп т.е. имеют место только случаи или у( = у. =1, или у: = у. = 0 , то индекс LRI = 1. О такой модели принято говорить, что она совершенно согласована. В остальных случаях значение LRI заключено между 0 и 1, причем чем больше совпадений между расчетными и фактическими зна чениями, тем ближе значение индекса к 1. К сожалению, слу чаи, когда значения индекса заключены между нулем и едини цей, не имеют собственной интерпретации. Даже в случае когда построенная модель идентична истинной функции распре деления вероятностей, она не является совершенно согласованной. Второй показатель принято называть псевдо (pseudo) R2. Его расчет осуществляется по формуле j^2 _ j
\ n
2(lnL(b)-rnL(4))) '
(354)
п где п — объем выборки. Как и в случае индекса LRI, псевдо R2 равен 0, когда все коэффициенты модели, кроме Ьф равны нулю. Его значение приближается к 1 по мере того, как увеличивается разность между InL(b) и 1пЦЪ0), но 1 не достигает. Чем ближе к 1 значение псевдо R2, тем точнее модель воспроизводит фактические значе ния бинарной переменной. 3.3.2. Статистическая значимость коэффициентов Проверка статистической значимости отдельных коэф фициентов модели осуществляется с помощью статистики Вальда. Для вычисления ее значения необходимо иметь стандартные ошибки коэффициентов модели. Стандартные ошибки, как и в случае линейной регрессии, определяются по диагональным эле ментам ковариационной матрицы оценок 6. Но прежде чем пе рейти к определению значимости, исследуем вопрос состоятель ности и асимптотической нормальности этих оценок. Известно, что решение любого из уравнений правдоподобия (3.1) или (3.2), даже если оно существует, не обязательно име ет хорошие асимптотические свойства. Желаемые состоятельность и асимптотическая нормальность обеспечены только в том случае, когда выполняются определенные условия, налагаемые на пове75
дение объясняющих переменных в генеральной совокупности. Существуют два подхода к этой проблеме: 1) полагают, что объясняющие переменные являются стохас тическими. Тогда налагаемые на них условия предстают в форме "все х. являются независимыми, одинаково распределенными слу чайными переменными, для которых существуют моменты доста точно высокого порядка"; 2) полагают, что объясняющие переменные фиксированы. В этом случае условия будут следующими: • для зависимой переменной у: существует асимптотическая матрица вариации-ковариации; • значения независимых переменных х. ограничены, т.е. всегда найдутся такие константы т, М; т >— °°, М, что т < х. < М, V/, /'. Если одно из этих условий выполнено, то при достаточно больших п оценка b существует и сходится по вероятности к ис тинному значению Ь. Ковариационная матрица этой оценки рав няется матрице, обратной к информационной матрице Фишера, которая представляет собой математическое ожидание Гессиана, взятое с обратным знаком
V(b) = r' = J-E
Э2 ln(L) ЭЬЭЬ'
(3.55)
Предполагается, что математическое ожидание здесь берется условно по х. Таким образом, при выполнении сформулированных выше условий можно считать, что оценка вектора коэффициентов мо дели, полученная с помощью метода максимального правдоподо бия, является асимптотически нормальной, т.е. (
R V
_- 1 - 1
Э 2 ln(L) -Е ЭЬЭЬ' J
"i
J
Как нетрудно понять, асимптотическая матрица ковариации зависит от неизвестного параметра Ь. Поэтому непосредственное использование ее в практических расчетах исключено. Рекоменда ции здесь те же самые, что и при использовании обычной регрес сии — неизвестные параметры, присутствующие в матрице, сле76
дует заменить соответствующими оценками. Руководствуясь этим общим правилом, можно записать V(b)=
-E
Э21п(Ъ) ЭЬЭЬ'
(3.57) ь=ь
и использовать в практических расчетах не ковариационную мат рицу, а ее оценку. Рассмотрим детально, каким образом может быть получена оценка этой матрицы. Для этого вычислим матрицу вторых про изводных (Гессиан)
Э2 ln(L) _ Э ain(L) ЭЬЭЬ' п
/=1
f'F-f2 F2
дЪ
эь
f'(l-F) + f 2 -X/X/O-JV) (1-F)2
,
(3.58)
где F = F(x,.b) и f = f(x,b). Для получения информационной матрицы Фишера необходи мо Гессиан умножить на —1 и взять математическое ожидание. Используя тот факт, что Е(_у;) = F(x / b), и проведя несложные преобразования, получаем 1=Е
- Э2 In (L) ЭЬЭЬ'
= 2^F(x /
[f(x,b)r
(3.59)
/b)[l-F(x/b)]
Соответственно асимптотическая матрица вариации-ковариации Ь примет вид -1 -1
]aF(x,b)[l-F(x,b)J
(3.60)
а ее оценка равна 2
[f(x,b)] v(b) = r1 = jsF(x,b)[l-F(x,b)]
(3.61)
Корни квадратные из диагональных элементов этой матрицы Sf являются стандартными ошибками соответствующих оценок \)Чкк ъ Их используют для получения статистики Вальда 11
f
b,л
, к=0,
1,
т.
(3.62)
В случае логит-модели, для которой f = F ( l - F ) , матрица Фи шера упрощается: -Э 2 1п(Ь) ЭЬЭЬ'
XFCx^tl-FCx^JxX.
(363)
Кроме того, матрицу Фишера можно представить в более ком пактной и более удобной для расчетов форме. С этой целью обо значим через X матрицу наблюдений за экзогенными перемен ными, дополненную столбцом из единиц и имеющую размер пх(т+\). По-прежнему х(. будет обозначать /-ю строку матрицы наблюдений. Далее через D обозначим диагональную матрицу «-го порядка, у которой /-й элемент диагонали имеет следующий вид: [f(x,b)] 2 (3.64) F(x,b)[i - F(x,b)] Тогда информационная матрица Фишера может быть записана следующим образом: d;; =
_
1=Е
-Э 2 1п(Ь)" = ХТ)Х. ЭЬЭЬ'
(3.65)
Ковариационная матрица в этом случае равна V(b) = (XDX)- 1 . (3.66) Такая форма ковариационной матрицы напоминает обобщенную оценку наименьших квадратов.
3.3.3- Стандартные ошибки вероятностей и предельных
предсказанных эффектов
Расчетные значения F, = F(x,b), получаемые с помо щью оцененных пробит- и логит-моделей, представляют собой ве роятности того, что переменная у примет значение 1 или 0. Воз можные изменения этих вероятностей в зависимости от факторов оцениваются частными предельными эффектами Э F(x,b) f(X-b)b. (3.67) Эх Это именно те характеристики, которые подлежат интерпретации и практическому использованию. Чтобы иметь представление о на-
78
дежности выводов, полученных на основе результатов моделирова ния, необходимо иметь оценки стандартных ошибок этих характе ристик, получить которые можно с помощью дельта-метода [63]. Для расчетной вероятности F, дельта-метод позволяет записать асимптотическую величину стандартной ошибки в виде V( F,) = [Э F(x,b) /ЭЬ]'У(Ь)[Э F(x,b)/дЬ],
(3.68)
где V(b) — асимптотическая ковариационная матрица оценки Ь. Заметим, что доступность практического использования данной формулы гарантируется тем, что асимптотическую ковариацион ную матрицу в ней, следуя рекомендациям предыдущего парагра фа, можно заменить оценкой V(b). Чтобы сделать формулу (3.68) более удобной для расчетов, проведем ее преобразование. С этой целью введем обозначение: Z, = х , Ь . Тогда вектор производных может быть представлен сле дующим образом:
[aF(x,b)/ab] = [aF(x,b)/8zi][3z./ab] = f(x,b)x,. (3.69) Замена в (3.68) вектора производных на (3.69) позволяет запи сать выражение для стандартной ошибки расчетной вероятности F, в более компактной форме: V(F,.) = [f (x,b) ] 2 x,. V(b)x; •
(3.70)
Стандартная ошибка зависит от вектора, по которому рассчи тывалась вероятность. Теперь перейдем к рассмотрению предельных эффектов. Для удобства введем обозначение g =f(xb)b- Тогда асимптотическая ковариационная матрица предельных эффектов может быть запи сана так: V(g,-) - [3g, /3b']V(b)[3g, /ЭЬ']'-
(3-71)
Для дальнейших преобразований матрицу производных предста вим в виде суммы
В полученном выражении вычисление производной дЪ/дЪ' привело к единичной матрице, а вычисление dZj/дЪ'— к векторстроке х(, 79
Для пробит-модели, если учесть, что df/dz = -Z(t>, выражение (3.72) переписывается следующим образом: V(g,)=0 2 [I-(b' X ;)bx,.]V(b)[I-(bX)bx,]'. (3.73) В случае логит-модели плотность вероятности f может быть записана через функцию распределения Л как f=A(l-A). Для краткости будем писать Л, полагая Л = Л(£,•). Дифференцируя это выражение по z, имеем - f =0-2Л)
ЭЬ,
(у;0;И)
о
(3.88)
Обе системы уравнений представляют собой математические ожидания соответствующих уравнений правдоподобия. Взятие математического ожидания в данном случае эквивалентно замене каждой случайной величины yt ее ожидаемым значением F(x ; b) или F ( x ; b ) соответственно. Причем значения самих производных вычислены в точке Ъ. Для рассматриваемого случая статистика множителей Лагранжа записывается следующим образом: LM =
ain[L(y;b)] /f (1ц~ I12I22I21) ЭЬ,
Э1п[Цу;Ьс)] ЭЬ,
(3.89)
Она является асимптотически эквивалентной статистике Вальда W и статистике отношения правдоподобия LR и имеет распределе ние c2(q). Решение, отвергнуть нулевую гипотезу или нет, при нимается по результатам сравнения с критическим значением х1ъ*(я), т.е. процедура сравнения проводится точно так же, как это описано в тесте Вальда. Можно значительно упростить процедуру расчета статистики множителей Лагранжа, сведя ее к построению регрессионного уравнения. Правда, для этого необходимо провести ряд не совсем простых преобразований, которые приведут к упрощенной схеме. Начнем с того, что [I,,-!,,!^!,,]"1, являясь частью матрицы, обрат84
ной информационной матрице Фишера, позволяет записать стати стику множителей Лагранжа в эквивалентном виде Э1 L M =
"[Ь(у;Ь)] j _ , Э1п[Цу;Ь)] д(ЪсУ
дЪс
(3.90)
Теперь вставим индивидуальные наблюдения в уравнение прав доподобия, которое после этой операции будет записываться как сумма логарифмов
ln[L(y;b)] = 5:in[Z(yI;b)].
(3.91)
Если наблюдения не коррелированы между собой, то можно показать, что информационная матрица Фишера представима в виде произведения производных первого порядка. Первая произ водная равна Э1п[Цу;Ь)]
дь'
=/=i1
у, f/
=
А_Э1п[1,( л ;Ь)]_ /=1
+ (i-j,)
ЭЬ' -f, х, (1-Fj)
(3.92)
Соответственно вторая производная может быть записана как Э21п(Ь) _ Э Э1п(Ь) ЭЬЭЬ' ~ЭЬ f'F-f2
=2
f ( l - F ) + f2
(!->',)
i=i
(1-F)2
(3.93)
Выполним операцию взятия математического ожидания путем замены у: на F(x(b) (yi = F(x,b) + £,.):
f
(1 -F) -('-F>f =i=i1 F g^F2 (1-F)2 В результате проведенного преобразования взаимно уничтожа ются слагаемые, содержащие F : •1 i=i
f2 f2 - F —2- ( 1 - F ) F (1-F)2 85
Если в преобразованном выражении убрать оператор ожида ния, т.е. в числителе снова вернуться к у{
=1 7'F_0^'W 1=1
то получаем выражение, отрицательное значение которого представимо в виде суммы произведений
1
/=1
F2
(1-F) 2
= 1 Л ?- ( 1 _ л ) аЬ)
Л
?" (1 * Л) ^Ь)
(3.94)
Возможность такого представления непосредственно следует из того, что у2 — у. и у,(1 — J,) = 0, а правильность проверяется непосредственным перемножением. Таким образом, имеем состоятельную оценку информационной матрицы Фишера:
^-дЫЩу^ЪПдЫи^у^Ъ)]
(3.95) ,=, дЬ ЭЬ' Используя полученную оценку информационной матрицы, за пишем статистику множителей Лагранжа ь м =
^Э1п[/,(у,,Ь)1 х /=i
ЭЬ'
« _Э1п [/Дз',-; Ь) ] ainC/,-^.; b) ]' ЭЬ' 1=1 эь
-1
x«,31n[/i(Jilb)]
(3.96) ЭЬ ;=1 Упрощенный расчет этой статистики можно осуществить следу ющим образом. Обозначим через G матрицу (размером п х q) из соответствующих значений частных производных первого порядка Э1п[/,.(у,.;Ь)]
(3.97) ЭЬ' и через е я-мерный вектор из единиц. Тогда искусственная ли нейная регрессия (3.98) е = Ga + error 86
с вектором коэффициентов a = (G'G) G e (3.99) может использоваться для расчета статистики LM. Коэффициен ты такой регрессии легко рассчитываются с помощью любого ста тистического пакета, а значение статистики равно сумме расчет ных значений этой регрессии. 3.4. Эконометрический прогноз экспертных предпочтений в задачах выбора наиболее перспективных сегментов рынка В предыдущих параграфах был предложен авторский взгляд на обработку экспертной информации и обоснована идея о возможности построения модели бинарного выбора для прогно зирования субъективных предпочтений. Такую модель можно ис пользовать, например, для решения любых прогнозных задач маркетинга, в которых имеет место выбор из двух альтернатив. Здесь же, преследуя цель продемонстрировать прикладные возмож ности предлагаемой модели, изложим процедуру моделирования вероятностных распределений ожидаемых результатов маркетинго вой деятельности ОАО "Радуга" в районах Воронежской и Курс кой областей. Владельцам этой компании принадлежит сеть супер маркетов, организованных по принципу "Пятерочки", "Магни та", "Перекрестка" и других известных отечественным потребите лям супермаркетов. Результаты маркетинговой деятельности любой торговой ком пании во многом определяются уровнем социально-экономическо го развития районов, на территории которых осуществляется эта деятельность. ОАО "Радуга" в течение 2003 г. функционировала в 18 районах Воронежской области. Экспертным путем было ус тановлено, что наибольшее влияние на результаты деятельности оказали: 1) объем розничного товарооборота на душу населения (тыс. р.); 2) численность населения района (тыс. чел.); 3) уро вень зарегистрированной безработицы (%); 4) темп роста промыш ленного производства в сопоставимых ценах (в % к предшеству ющему периоду). Для построения модели необходимо ввести понятие "успешная деятельность". Под успешной деятельностью будем понимать ста бильное получение прибыли, увеличение товарооборота, откры тие новых торговых точек и т.д. 87
При введенных обозначениях ("1" — "успех" компании на по требительском рынке того или иного района Воронежской облас ти и "О" — напротив, "неуспех") была сформирована табл. 3.1, отражающая взаимосвязь результатов деятельности компании с социально-экономическими показателями районов. В качестве основного источника данных для формирования этой таблицы были использованы статистические сборники, а также публикации федеральных и муниципальных органов власти.
*i
Аннинский Богучарский Бобровский Верхнехавский Грибановский Кантемировский Каширский Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский Эртильский 88
Х
7
9,585
52,747
11,300 5,955 6,603 9,698 7,160 5,643 7,653 5,210 21,081 8,093
40,719 54,162 26,656 39,648 41,808 27,106 24,077 64,275 27,972 25,841 23,414
7,469 3,865 10,815 7,579 14,221 8,138 6,011
29,563 33,230 17,884 31,750 25,696 31,499
х , 1,45 1,6 1,0 2,3
Темп роста промышленного производства в сопоставимых ценах, % к предыдущему году
Уровень заре гистрированной безработицы, %
Численность населения, тыс. чел.
Район
Объем розничного товарооборота на душу населе ния, тыс. р.
Факторы
Показатель успеш ности (1— "успех", 0 — "неуспех")
Т а б л и ц а 3.1 Результаты деятельности ОАО "Радуга" в зависимости от уровня с циально-экономического развития районов Воронежской области в 20
2,1 3,1 2,3
124,6 100,2 85,5 228,4 170,5 92,7 109,0 132,4 213,3 105,6 81,2 111,4
У 1 1 0 0 1 0 0 1 1 1 0 1
1,3 1,6 2,3 0,3 2,0 3,2
143,0 249,6 116,5 105,3 111,8 163,7
0 1 0 1 1 0
1,7 2,8 2,7 1,9 1,9
Х
А
Поскольку ОАО "Радуга" осуществляло свою деятельность на территории указанных районов Воронежской области в течение лишь одного (2003) года, то результаты моделирования, по дан ным табл. 3.1, очевидно, могут вызвать определенные сомнения в своей надежности. Поэтому нами было предложено привлечь к решению поставленной задачи группу экспертов, которые уточни ли "надежность" результата деятельности компании (т.е. указали "вероятность устойчивости", понимаемую как процент случаев успешной/неуспешной деятельности в данных условиях), превра тив, по сути, данные фактических наблюдений в псевдовыборку. Итоги экспертного опроса нашли отражение в последнем столб це табл. 3.2.
Таблица 3.2 Экспертная оценка надежности взаимосвязи показателя успешност с определяющими его факторами Район
У
Аннинский Богучарский Бобровский Верхнехавский Грибановский Канте мировски й Каширский Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский
1 1 0 0 1 0 0 1 1 1 0 1
Подгоре некий Рамонский Репьевский Россошанский Терновский Эртильский
0 1 0 1 1 0
х
,
9,585 11,300 5,955 6,603 9,698 7,160 5,643 7,653 5,210 21,081 8,093 7,469 3,865 10,815 7,579 14,221 8,138 6,011
х2
Х
3
52,747
1,45
40,719 54,162 26,656 39,648 41,808 27,106 24,077 64,275 27,972 25,841 23,414
1,6 1,0 2,3
29,563 33,230 17,884 31,750 25,696 31,499
Х
4
1,9 1,9 2,1 3,1 2,3
124,6 100,2 85,5 228,4 170,5 92,7 109,0 132,4 213,3 105,6 81,2 111,4
1,3 1,6 2,3 0,3 2,0 3,2
143,0 249,6 116,5 105,3 111,8 163,7
1,7 2,8 2,7
Экспертная оценка, % 75 60 85 55 90 70 85 80 95 90 40 75 60 95 65 95 45 50
По данным табл. 3.2 и с использованием пакета STATISTICA 6.0 была построена логит-модель. Причем в качестве частоты по явления каждого наблюдения в выборочной совокупности были 89
использованы соответствующие экспертные оценки (последний столбец табл. 3.2). В результате выполнения необходимых действий в указанном статистическом пакете были получены расчетные характеристики модели, которые отражены в табл. 3.3 — 3.5. Т а б л и ц а 3.3 Оценки параметров модели, их стандартные ошибки, статистики Вальда и вероятности
Effect Interc "Var2" "Var3" "Var4"
Var 1 - Parameter estimates (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Level of Column Estimate Standard Wald Stat. P Error Effect 1 -75,9566 9,467 498 64,36655 0,000 000 2 9,1266 1,185 847 59,2309 0,000 000 3 0,3427 0,042 789 64,14358 0,000 000 4 0,607 581 49,98247 0,000 000 -4,2955 5
"Var5" Scale
0,0732 1,0000
0,008 013 0,000 000
83,5)625
0,000 000
Анализ табл. 3.3 позволяет: 1) сделать вывод о том, что полученные оценки коэффициен тов являются статистически значимыми (все стандартные ошибки меньше значений коэффициентов, а все вероятности ошибки меньше 0,05); 2) записать аналитическое выражение для построенной логитмодели: р^.
=
Щ.)=
(1 + g-75,956+9,126xh-
+0,34212;-4,295% +0,073^ } -1 .
(*) При сравнении первого и второго столбцов табл. 3.4 мож но сделать следующий вывод: с достаточным уровнем надежно сти не удалось предсказать результат деятельности компании только для двух случаев, описываемых 4 и 12 наблюдениями. С учетом тиражируемости фактически оказалось, что в 1280 случаев из 1310 удалось получить достаточно надежные пост прогнозные оценки результатов маркетинговой деятельности ОАО "Радуга".
90
Таблица Предсказанные значения
Case 1 2 3
Varl - Predicted Values (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Response Pred. LINEAR Standard Lower CL Value Value Pred. Error 95% 1,000 000 1,000 000 32,4945 4,28734 1,000 000 1,000 000 1,000 000 41,5936 1,000 000 5,53909 0,175682 0,000 000 0,253395 -1,0806 0,23740
3.4
Upper CL 95% 1,000 000 1,000 000 0,350 854
4
0,000 000
0,571 408
0,2876
0,23063
0.458 988
0,676 912
5 6
1,000 000 0,000 000
1,000 000 0,179 268
31,3242 -1,5213
4,08611 0,22834
1,000 000 0,122 512
1,000 000 0,254 685
7
0,000 000
0,000 000
-18,7816
2,30808
0,000 000
0,000 001
8
1,000 000 1,000 000
0,975 275 0,746 225
0,62203 0,21746 16,35 733
0,920 980 0,657 545
0,992 565 0,818 287
1,000 000
3,6749 1,0786 124,7406
1,000 000
1,000 000
-0,6088
0,24 938
0,250 193
0,470 028 0,237 265 0,000 000
9 10 11
0,000 000
1,000 000 0,352 331
12 13
1,000 000 0,000 000
0,184 278 0,000 000
-1,4876 -25,6632
0,16322 3,25375
0,140 938 0,000 000
14
1,000 000
45,5412
5,81938
1,000 000
15 16
0,000 000 1,000 000
1,000 000 0,118 643 1,000 000
1,000 000
0,998 793
0,21585 9,41515 1,03164
0,081 032 1,000 000
17
-2,0053 71,1365 6,7181
1,000 000 0,170 472 1,000 000
0,990 952
0,999 840
18
0,000 000
0,000 006
-12,0596
1,55648
0,000 000
0,000 122
Данные табл. 3.5 позволили оценить пригодность модели в це лом с помощью индекса отношения правдоподобия Макфаддена: 267 565 LR1 = l - i ^ ' =0.694 = 1-1пЦ6 0 ) -875,656
Рассчитанное таким образом значение индекса свидетельству ет об адекватности построенной логит-модели, хотя может пока заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска зание возможности появления самого события (возможность появ ления события считается предсказанной, если расчетная вероят ность выше порогового значения 0,5). 91
Таблица Тест правдоподобия 1-го типа
Effect Intercept "Var2" "Var3"
3.5
Varl - Likelihood Type 1 Test (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Degr. of LogChiP Freedom Li kelihd Square -875,656 0,000 000 -544,209 662,8941 -455,771 176,8766 0,000 000
"Var4"
-436,503
38,5347
0,000 000
"Var5"
-267,565
337,8759
0,000 000
Как известно, одной из наиболее удобных форм представления результатов маркетинговых исследований является их графическое представление. В целом, визуализация позволяет сформировать у лица, принимающего решения, системный взгляд на исследуемую проблему. Эта возможность как раз и заложена в графическом представлении самого решения, которое, по сути, является рас пределением вероятности осуществления успешной или неуспеш ной деятельности. В отличие от анализа состояния дел в отдель ном районе, анализ распределения дает целостное представление об успешных/неуспешных результатах маркетинговой деятельнос ти в целом по области. Кроме того, визуализация результатов вычислительных экспериментов с моделью позволяют проследить за изменениями формы распределения и наметить оптимальные стратегии реализации маркетинговых планов компании. Правда, существуют некоторые ограничения, связанные с возможностью визуального восприятия объектов только в трехмер ном пространстве. Но даже при этом естественном ограничении графическое представление результатов моделирования может ока заться весьма полезным. Для того чтобы иметь возможность построить график в трехмер ном пространстве в зависимости от наиболее значимых показате лей, был проведен экспертный опрос, главной целью которого стал отбор по результатам маркетинговой деятельности в районах двух таких показателей. В результате опроса были выбраны: 1) объем розничного товарооборота на душу населения (тыс. р.); 2) численность населения района (тыс. чел.). Оставшиеся два фактора были зафиксированы на уровне, соответствующем сред ним значениям. Далее по рассчитанным вероятностям сформиро92
вали табл. 3.6, по данным которой была построена диаграмма (рис. 3.2), визуализирующая представление об успешной/неус пешной маркетинговой деятельности ОАО "Радуга". Т а б л и ц а 3.6 Данные для построения профиля вероятностного распределения успешной деятельности в Воронежской области (2003 г.) *.
Х
7
x
i
4
х,Ь
Х
•^расчет
9,585
52,747
1,45
124,6
31,061
11,3
40,719
1,6
100,2
42,591
1 1
5,955
54,162
-1,584
0,1702
26,656
1,0 2,3
85,5
6,603
228,4
-5,0%
0,0061
9,698
39,648
U
170,5
27,603
1
2,8 2,7
92,7
5,180
0,9944
109
-13,704
0
1,9 1,9 2,1 3,1 2,3 1,3
132,4
3,603
0,9735
213,3
-4,918
0,0073
105,6
127,490
1
81,2
8,223
0,9997
111,4
1,696
0,8451
7,16
41,808
5,643
27,106
7,653
24,077
5,21
64,275
21,081
27,972
8,093
25,841
7,469
23,414
3,865
29,563
10,815
33,23
7,579
17,884
14,221
31,75
8,138
25,696
6,011
31,499
Средние значения
143
-29,089
1,6 2,3 0,3 2,0 3,2
249,6
35,598
0 1
116,5
0,805
0,6911
105,3
66,176
1
1,975
135,817
111,8
8,584
0,9998
163,7
-8,839
0,0001
С целью разработки маркетинговой стратегии на 2004 г. по данным табл. 3.6 были получены прогнозные оценки результатов деятельности ОАО "Радуга", представленные в табл. 3.7. Эти прогнозные оценки являются выражением объективных тенденций и субъективных мнений по поводу успешности деятельности. Анализ табл. 3.8 позволяет сделать вывод о том, что в целом Воронежская область (за исключением двух районов — Каширско го и Подгоренского) продолжает оставаться привлекательной для того рода бизнеса, которым занимается ОАО "Радуга". Профиль на рис. 3.3 хорошо иллюстрирует сделанный вывод. Данные для построения этого профиля (табл. 3.9) были подготовлены анало93
гично тому, как это было сделано в случае осуществления пост прогнозных расчетов на 2003 г.
Рис. 3.2. Профиль вероятностного распределения успешной деятельности ОАО "Радуга" в Воронежской области (2003 г.) Т а б л и ц а 3.7 Прогнозные оценки показателей, характеризующих уровень социальноэкономического развития районов Воронежской области в 2004 г. Район 1 Аннинский Богучарский Бобровский Верхнехавский Грибановский Кантемировский Каширский
94
*. 2 11,985 13,626 7,168 7,916 11,458 8,159 6,594
Х
2
3 52,747 40,719 54,162 26,656 39,648 41,808 27,106
х
г 4 1,6 1,6 1,1 2,6 2,1 2,9 4,4
Х
4
5 114,5 102,7 106,5 100,4 126,0 114,1 103,1
1 Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский
2 10,422 6,318 25,753 9,686 9,336 5,104 13,337 9,672 17,869 10,367
Эртильский
8,235
О к о н ч а н и е 4 3 24,077 2,2 1,8 64,275 27,972 2,1 25,841 3,8 23,414 2,8 29,563 1,5 33,230 1,6 17,884 2,4 31,750 0,3 25,696 2,1 3,0 31,499
т а б л . 3.7 5 91,5 102,5 151,18 71,1 82,6 142,5 105,6 102,1 111,5 138,7 90,7
Т а б л и ц а Ожидаемые результаты деятельности ОАО "Радуга" на территории районов Воронежской области в 2004 г. Ожидаемый результат 1 1 1 0,83 1 1 0 1 0,97
Район Аннинский Богучарский Бобровский Верхнехавский Грибанове кий Канте мировс кий Каширский Нижнедевицкий Новоусманский
3.8
Ожидаемый результат 1 1 1 0 1 1 1 1 0,97
Район Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский Эртильский
Т а б л и ц а 3.9 Данные для построения профиля вероятностного распределения успешной деятельности по районам Воронежской области (2004 г.) х
1
Х
2
1
2
11,985
52,747
13,626
40,719
7,168
54,162
*з 3 1,6 1,6 1,1
4
х,Ь
4
5
114,5
49,944
102,7
60,798
6 1 1
106,5
6,466
0,998
Х
-'расчет
95
О к о н ч а н и е 1 2 7,916 26,656 11,458 39,648 41,808 8,159 6,594 27,106 10,422 24,077 6,318 64,275 25,753 27,972 9,686 25,841 23,414 9,336 5,104 29,563 13,337 33,23 17,884 9,672 31,75 17,869 10,367 25,696 8,235 31,499 Средние значения
3 2,6 2,1 2,9 4,4 2,2 1,8 2Д 3,8 2,8 1,5 1,6 2,4 0,3 2,1 3,0 2,216
4 100,4 126 114,1 103,1 91,5 102,5 151,18 71,1 82,6 142,5 105,6 102,1 111,5 138,7 90,7
5 3,866 40,645 11,276 -8,045 25,854 2,174 167,109 19,741 15,715 -20,802 55,594 16,886 96,449 25,906 8,437
табл.
3.9
6 0,979 1 1 0 1 0,898 1 1 1 0 1 1 1 1 1
108,737
Рис. 3.3. Профиль вероятностного распределения успешной деятель ности ОАО "Радуга" в Воронежской области (2004 г.) 96
В связи с тем, что в стратегические планы ОАО "Радуга" входило расширение сферы деятельности за счет освоения новых рынков сбыта, было решено обследовать другие области, входя щие в Центрально-Черноземный регион. Приведем результаты ис следования по Курской области, в котором использовались офи циальные данные, характеризующие уровень социально-экономи ческого развития районов области в 2003 г. (табл. 3.10). Т а б л и ц а 3.10 Показатели, характеризующие уровень социально-экономического развития районов Курской области в 2003 г.
Район
Объем роз Числен Уровень Темп роста про ничного ность зарегистри мышленного производства в товарообо населения, рованной рота на душу тыс. чел. безработи сопоставимых населения, цы, % ценах, % к тыс. р. предыдущему году *i
1 Беловский Большесолдатский Глушковский Горшеченский Дмитриевский Железногорский Золотухинский Касторенский Конышевский Кореневский Курский Курчатовский Льговский Мантуровский Медвенский Обоянский Октябрьский Поныровский Пристенский Рыл ьс кий
2 2,09 2,46 3,09 3,57 2,45 2,70 2,23 2,73 7,01 3,67 4,69 1,38 0,85 1,72 11,78 4,20 4,28 3,37 2,76 6,18
х-, 3 22,182 14,636 28,147 22,835 22,420 18,190 26,800 24,237 15,155 21,474 56,494 19,714 19,313 16,758 19,220 35,815 23,877 13,553 21,249 40,714
*3
*4
4 0,7 1,0 0,9 1,0 0,4 0,9 0,4
5 73,0 73,0 61,0 98,0 81,0 93,0 103,0 62,0 83,0 111,0 30,0 91,0 198,0 40,0
1,4 1,0 4,0 1,1 4,0 1,4 0,7 0,6 0,6 0,8 1,1 0,6 0,4
70,0 72,0 71,0 55,0 106,0 100,0
|
97
Окончание 1
4
т а б л . 3.10
2
3
5
Советский
11,38
23,673
0,5
63,0
Солнцевский
1,98
18,492
0,6
100,0
Суджанский
5,96
31,466
0,5
104,0 76,0
Тимский
5,98
14,628
0,9
Фатежский
4,24
23,194
0,7
90,0
Хомутовский
2,62
16,432
1,0
93,0
Черемисиновский
1,62
12,431
0,9
99,0
Щигровский
1,18
15,099
1,9
114,0
По ли (*) ности (табл.
данным табл. 3.10 с использованием построенной моде были получены прогнозные оценки результатов деятель ОАО "Радуга" на территории районов Курской области 3.11).
Т а б л и ц а 3.11 Ожидаемые результаты маркетинговой деятельности ОАО "Радуга в Курской области (2003 г.) А
хгЬ
4
5
6
0,7
73
-46,9412
0
1,0
73
-47,4390
0
28,147
0,9
61
-37,5083
0
3,57
22,835
1,0
98
-32,6679
0
2,45
22,42
0,4
81
-41,69%
0
2,7
18,19
0,9
93
-42,1366
0
2,23
26,8
0,4
103
-40,5954
0
х
98
, 1
*г 2
2,09
22,182
2,46
14,636
3,09
Х
3
3
Х
у •'расчет
2,73
24,237
1,4
62
-44,2083
0
7,01
15,155
1,0
83
-5,0027
0,0067
3,67
21,474
4,0
111
-44,1562
0
4,69
56,494
1,1
30
-16,3204
0
1,38
19,714
4,0
91
-67,1239
0
0,85
19,313
1,4
198
-53,0946
0 0
1,72
16,758
0,7
40
-54,5935
11,78
19,22
0,6
70
40,6907
1
4,2
35,815
0,6
72
-22,6557
0
4,28
23,877
0,8
71
-26,9490
0
Окончание 1
2
3,37
13,553
2,76
21,249
6,18
40,714
11,38
23,673
1,98
18,492
5,96
31,466
5,98
14,628
4,24
23,194
2,62
16,432
1,62
12,431
1,0 0,9
15,099
1,9
1,18
3 1,1 0,6 0,4 0,5 0,6 0,5 0,9 0,7
4 55 106 100 63 100 104 76 90 93 99 114
т а б л . 3.11
5 -38,3000
6 0 0
0,0034
0,5009
38,4830 -46,8030
1 0
-5,3103
0,0049
-14,6668
0 0 0 0 0
-41,2526
-25,7273 -43,8987 -53,5275 -59,8260
Анализ табл. 3.11 свидетельствует о том, что в целом терри тория Курской области (за исключением двух районов — Медвенского и Советского) неблагоприятна для осуществления бизнеса ОАО "Радуга". Для того чтобы сформировать окончательную точку зрения от носительно перспектив начала деятельности в Курской области, было проведено (независимо от расчетов по модели) экспертное оценивание ожидаемых ее результатов (табл. 3.12). Т а б л и ц а 3.12 Экспертные оценки результатов маркетинговой деятельности ОАО "Радуга" на территории Курской области Район 1 Белове кий Большесолдатский Глушковский Горшеченский Дмитриевский Железногорский Золотухинский Касторенский Конышевский Кореневе кий
Экспертная оценка 2 0 0 0 1 0 0 0 0 0 0
3 Me две некий Обоянский Октябрьский
Экспертная оценка 4 1 0 0
Поныровский Пристенский Рыл ьс кий Советский Солнцевский Суджанский Тимский
0 0 1 1 0 1 0
Район
99
Окончание 1 Курский Курчатовский Льговский Мантуровский
2 0 0 0 0
т а б л . 3.12
3 Фатежский Хомутовский Черемисиновский Щигровский
4 1 0 0 0
Сравнение табл. 3.11 и 3.12 позволяет сделать вывод о том, что результаты моделирования с использованием построенной модели и экспертные оценки, в основном, совпадают. В целом, Курская область действительно малопривлекательна. Однако по ряду районов (Горшеченскому, Рыльскому, Суджанскому, Фатежскому) имеются расхождения во мнениях. Это может свидетель ствовать о том, что эксперты располагают дополнительной инфор мацией о тенденциях, которые пока еше не нашли отражение в официальной статистике, но проявление которых ожидается в ближайшем будущем. В подобных ситуациях следует рекомендовать корректирующие уточнения базовой модели (*) с учетом субъективных мнений экспертов. Возможны различные варианты подобного уточнения. Предлагаемая нами методика позволяет это делать. 3.5. Модели множественного выбора в экспертном оценивании будущего 3.5.1. Мультиномиальная логит-модель множественного выбора Рассмотрим случай, когда перед экспертами стоит задача выбора не среди двух, а среди целого множества альтер нативных вариантов. По результатам их выбора, оформленным в виде псевдовыборки, требуется построить модель, с помощью которой можно будет осуществлять прогнозные расчеты эксперт ных предпочтений в виде соответствующих вероятностей. Для решения этой задачи можно воспользоваться мультиномиальной логит-моделью, которая по сути является обобщением логит-модели бинарного выбора. Ниже достаточно подробно описывается мультиномиальная логит-модель и некоторые детали, характери зующие особенность ее построения и анализа. Предварительно все варианты множественного выбора нумеру ются в произвольном порядке: 0, 1, 2, ..., /. (Нумерация начата 100
с 0 только для того, чтобы было единообразие с предыдущей кодировкой 0 и 1.) Вероятность наступления того или иного ва рианта описывается полиномиальной логит-моделью Р(>',=7') = ^
'
7 = 0,1,2,...,/.
(3.100)
Вектор независимых переменных х(. = [гр w;] составлен из двух подвекторов, каждый из которых имеет собственную смысловую нагрузку. Компоненты вектора z7 принято называть атрибутами и понимать их как показатели, по которым различаются альтерна тивы. В свою очередь, компоненты вектора w( называют харак теристиками, понимая под ними описание индивидуальных черт тех лиц, которые осуществляли выбор альтернатив. Оценка параметров модели (3.100) не дает однозначного ре зультата, так как вместе с вычисленными коэффициентами b идентичные вероятности позволяют получить вектор b + d. Избе жать этой неоднозначности позволяет операция нормализации (стандартизации), смысл которой в том, чтобы для одного из ва риантов, например yt = /, положить b y = 0. Тогда оценивается не / + 1 функция, a / функций одного вида Р(У,- = У') = —1=1
ь
' 7 = 1,2,...,./,
(3.101)
1+1У' ' после чего определяется еще одна функция через значения этих / функций путем вычитания их суммы из единицы:
1+2У"
(3.102)
7=0
Это одна из особенностей построения полиномиальной логитмодели. В соответствии с этой особенностью компьютерные па кеты рассчитывают только коэффициенты первых / зависимостей b0, b,,..., b / p по которым вычисляются в соответствии с (3.101) первые /вероятностей Р(у, = 0), Р(у(. = 1),... , PCv, = / — 1). Ве роятность выбора последнего варианта Р(у- = J) компьютером не рассчитывается, а определяется отдельно с помощью (3.102). 101
Форма логит-модели, применяемой для бинарного выбора, опи сание которой приведено выше, легко получается из полиномиаль ной при J = 2. В силу того, что логит-модель является частным случаем полиномиальной, ее часто называют биномиальной. Оценивание коэффициентов модели осуществляется путем чис ленного решения уравнений правдоподобия. Для записи самого уравнения правдоподобия, а точнее его логарифмической формы, удобно ввести переменную */.., которая принимает значение 1, если в /-м наблюдении (z'-м индивидуумом) был выбран у'-й аль тернативный вариант среди (/ + 1)-го, и 0 — в противном слу чае. Тогда для каждого /' только одно из й-- будет равно 1. Используя введенную переменную dp запишем функцию лога рифмического правдоподобия
1пь=££^1п (=1 у=0
(3.103)
Sе ' к Xybi.
Дифференцируя это выражение по b , получим систему уравне ний максимального правдоподобия {
\
—-it'.—'» 0
' -I
к=0
к=0 Pj
1=1 ;=0
х,= х,Ь,
к=0
х,Ь,
•54 1=1
1-
е '
2у,ь< к=0
102
*; = £ [ < * , , - Р у К = 0 , У =0,1,2,.../-!. (3.104) )
Заметим, что ву'-м блоке уравнений суммирование идет по всем /, причем если в /-м случае был выбран у'-й вариант, т.е. y-t = j , то в квадратных скобках имеем [1 — Р^], в противном случае [— Р.]. Решение этой системы с учетом того, что Ьу = 0, осуществ ляется численно с помощью метода Ньютона — Рафсона. Ком пьютерная реализация устроена таким образом, и об этом уже го ворилось, что нулевые значения получают параметры той модели, которая соответствует последней из указанных альтернатив. Дру гими словами, если бы мы захотели, чтобы Ь0 = 0, а не Ьу, то данные, соответствующие альтернативе с номером у ~ О, долж ны быть введены последними. Для реализации метода Ньютона — Рафсона требуется матрица частных производных второго порядка. Кроме того, с помощью этой матрицы определяются характеристики надежности самой модели. Поэтому имеет смысл выписать эту матрицу в общем виде:
Э21пЬ
Э "
х,Ь,
dlt
Х; = х ,Ь,
к=0
j x,b, V"
е ' ' к=0 Xie
х b
x,b t
e
x,b,
e '' х,. х,.=
/=1
х.Ь,
=-1 1=1
ЗУ
*=0
А
1(7=0--
х,х,.=
x,bj
5У" (t=0
)
=-ik№j=i)-P«)h'x,
(3.105)
В полученном выражении 1(/ = I) принимает значение 1 при у = / и 0 — в противном случае. Это позволяет осуществлять селекцию, так как результатом произведения РЛ(/ = /) является Р... 103
Матрица состоит из ^-блоков, каждый из которых имеет раз мер по числу оцениваемых параметров, т.е. (т + 1) х (т + 1), где т — число объясняющих переменных. Данные объясняющих переменных должны обеспечивать обратимость этой матрицы. Практически нет строгих ограничений на количество оценива емых альтернатив, однако следует помнить, что каждая новая альтернатива требует дополнительного введения в модель т + 1 параметров. Коэффициенты модели трудно интерпретируемы. Нелинейный характер не позволяет непосредственно через коэффициенты про следить связь между уровнем вероятности и атрибутами (фактора ми). Поэтому естественно для этих целей использовать предель ный анализ. Дифференцируя по /-му атрибуту в /-й точке у'-ю вероятность, получаем предельный эффект в виде "
" Л Ъ,-е^(ех-ь"Ь10+е^Ьп к=0
+- +
е^Ьи)
) х,Ь,
х,Ь,
2> J
е
• '
X:b„
к х, Ь,
lj
и
j
E
k=0
x,b,
x,b,
x,b,
-bюm+-
j \п k=0
=Рцк-ьа]
хЪ,
\+-
+ — x,b. k=0
(3.106)
При расчетах по этой формуле нужно помнить, что вектор Ь0 в соответствии с принятым соглашением нулевой, и поэтому первое слагаемое при определении математического ожидания коэффициента равно нулю. 104
Таким образом, предельный эффект, получаемый при измене нии /-го атрибута (1-й независимой переменной) представляет собой произведение вероятности P(yj = J) на разность коэффици ента, стоящего перед 1-й переменной и средней величиной это го коэффициента. Предельный эффект зависит от атрибута, причем механизм этой зависимости реализуется через вероятность и через среднюю вели чину коэффициента, при определении которой задействована та же самая вероятность. При высокой вероятности так же, как и при малой, предельный эффект незначительный. Это объясняется тем, что при больших Р.. в средней величине коэффициента Ь, доми нирует величина Ьц и разность между ними близка к нулю. При малых значениях Р.. разность большая, но значение самой вероят ности близко к нулю, а следовательно, и величина предельного эффекта небольшая. Обобщая, можно утверждать, что 8Г -> 0 в двух случаях: когда Р.. -> 0 и когда Р.. —> 1. Своего максимально го значения он достигает тогда, когда вероятность близка к 0,5, т.е. имеет место ситуация с самым большим уровнем неопределен ности при выборе /-го варианта. Это естественно, так как имен но в этой ситуации наиболее ценна любая информация, уточня ющая наше представление о выборе альтернатив. Фактически предельный эффект является функцией, с помо щью которой можно ранжировать атрибуты по степени их влия ния на выбор конкретного варианта. Кроме того, для каждого атрибута с помощью предельного эффекта можно определить тот вариант, на выбор которого изменение данного атрибута влияет сильнее всего. Безусловно, подобный анализ интересен, однако он не дает прямого ответа на главный вопрос: "Как изменится неопределенность выбора при изменении атрибута?" Ответ можно получить, если использовать энтропийный показатель для оценки уровня неопределенности ситуации множественного выбора. Обычно интерес вызывает анализ конкретной ситуации. Пусть это ситуация с номером /. Тогда неопределенность выбора в /-и ситуации можно определить с помощью выражения J
Hi =-l
fy
logzVy.
(3.107)
j=0
Если вероятность изменяется на величину предельного эффекта дп то, естественно, изменяется и величина энтропийного показателя Hi+AHi
= -i(PiJ+Sij)\og2(Pij+S0). у=о
(з.108)
105
При AHj < 0 увеличение соответствующего атрибута снижает уровень неопределенности множественного выбора в г-й ситуации на величину ДЯ(. Если неравенство в противоположную сторону, то такое же самое изменение атрибута увеличивает уровень неопре деленности. Величину ДЯ, будем называть предельным информационным эф фектом, имея в виду, с одной стороны, содержательный смысл этой величины, а с другой — механизм ее определения через предельный эффект атрибута. Понять, в каких ситуациях следу ет ожидать отрицательное значение предельного информационного эффекта, а в каких — положительное, весьма сложно. Гораздо проще вычислить ДЯ(. как разность между значениями, определя емыми в соответствии с (3.108) и (3.107). И все же рассмотрим механизм формирования величины предельного информационно го эффекта ДЯ, = - Е (Р//+ 8и) log2(P^+ S^+i
?y Iog2 Py =
7=0
7=0
р У*П
= -£(P//+ 2 3 1 3 3 2
X,
1 1 2 3 1 2
Х
4
60 45 20 15 35 60
№ п/п 12 13 14 15 16 17
У 0 0 1 2 0 2
х
,
1 3 3 3 1 2
Х
7
1 2 1 1 3 3
*i
1 1 1 3 2 2
3.15 *4
40 45 35 20 35 25
109
Окончание № п/п 7 8 9 10 11
У 0 1 0 1 1
х
, 2 1 3 2 2
*?
2 2 3 2 1
*, 3 3 1 1 2
Х
4
50 15 50 30 10
№ п/п 18 19 20 21
У 1 0 2 2
*| 2 2 3 1
т а б л . 3.15 x
i
3 2 2 1
х
, 1 1 2 3
*4
25 60 20 10
Т а б л и ц а 3.16 Оценки коэффициентов модели и характеристики их надежности
Effect Interc l "Var2" "Var3" "Var4" 'Var6" Interc 2
Var 1 - Parameter estimates (Spreadshee 1) Distribution: MULTINOMIAL Link function: LOGIT Standard Level of Level of Wald Stat. Column Estimate P Error Effect Response 17,17 493 6,932 343 6,13804 0,013 230 0 1 -6,12 757 1,816 164 11,38 325 0,000 741 0 2 0 3 -1,70 320 0,751 912 5,13096 0,023503 0 4 -5,91 578 1,715851 11,88 680 0,000 565 0 5 0,38 431 0,074 424 26,66 555 0,000 000 20,82 143 6,824078 9,30 965 0,002 280 6 7
"Var2" "Var3" "Var4"
8 9 10
'Var6" Scale
-4,72 550 1,778 669 7,05 840 -2,40 530 0,685082 12,32 685 -5,15872 1,689 180 9,32 680 0,22 872 0,070 576 10,50 218
0,007 889 0,000 446 0,002 258 0,001 192
1,00 000 0,000 000
Анализ табл. 3.16 позволяет: 1) сделать вывод о том, что полученные оценки коэффици ентов являются статистически значимыми (все стандартные ошибки меньше полученных оценок, значения статистики Вальда превосходят критический уровень и все вероятности ошибки меньше 0,05); 2) записать аналитическое выражение для построенной муль тиномиальной логит-модели:
^
ПО
'
17,17-6,12х, -1,70ft -5,91х3 +0,38х4
е
-
Р(У=О)= 1
-—:—-—
17,17-6,12г1-1,70.г2-5,91хз+0,3&с4 ,
2Q82-4,71X!-2,40A: 2 -5,15^3+0,22X4 '
20,82-4,71х, -2,40х 2 -5,15х3 +0,22х4
P(y=i)=
j + e17,17-6,12x,-l,7ac2-5,9h-3+0,38x4
20,82-4,71лг1-2,4аг2-5,15гз+0,22х4
+
Анализ табл. 3.17 позволяет сделать вывод, что построенная модель обеспечивает достаточно точное предсказание наиболее предпочтительных типов предприятий общественного питания, которые будут успешны в соответствующих условиях. Полужир ным шрифтом в этой таблице выделены те случаи, в которых предсказания были недостаточно точны. Т а б л и ц а 3.17 Предсказанные значения вероятностей № п/п
1 2 3 4 5 6 7 8 9 10 11
Предсказанные вероятности
У 0 0 1 2 1 1 0 1 0 1 1
Р О = 0)
Р(У=1)
Р(У = 2)
0,9929
0,0071
0,0000
0,8699
0,1300
0,0000
0,0601
0,9395
0,0003
0,0000
0,0000
1,0000
0,2395
0,6896
0,0709
0,9413
0,0587
0,0000
0,5951
0,3748
0,0302
0,0088
0,3158
0,6754
0,7813
0,2180
0,0007
0,2431
0,7567
0,0002
0,0024
0,7163
0,2813
Предсказанные вероятности
№ п/п
У
12 13 14 15 16 17 18 19 20 21
0 0 1 2 0 2 1 0 2 2
Р ( у = 0)
Р(у=1)
Р(У=2)
0,7541
0,2459
0,0000
0,4490
0,5504
0,0005
0,0785
0,9207
0,0008
0,0000
0,0013
0,9987
0,7287
0,2709
0,0004
0,0517
0,3703
0,5779
0,2279
0,7653
0,0069
0,9716
0,0284
0,0000
0,0002
0,0197
0,9802
0,0039
0,6204
0,3757
Данные табл. 3.18 позволили оценить пригодность модели в целом с помощью индекса отношения правдоподобия Макфаддена: - ^ = l--92'742=0,59 lnL(Z>0) -226,167 Рассчитанное таким образом значение индекса свидетельству ет об адекватности построенной логит-модели, хотя может пока заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска зание возможности появления самого события (возможность появLRI = l
111
ления события считается предсказанной, если расчетная вероят ность данного события выше остальных). Т а б л и ц а 3.18 Тест правдоподобия J-го типа
Effect Intercept "Var2"
Varl - Likelihood Type 1 Test (Spreadsheet 1) Distribution: MULTINOMIAL Linkfunction: LOGIT Chi-Square Degr. of Freedom Log-Likelihd
P
2 2
-226,167
2
14,7729 13,9401 99,1481
0,000 000
138,9898
0,000 000
-218,781
"Var3" "Var4"
2
-211,811 -162,237
"Var6"
2
-92,742
0,000 620 0,000 940
Используя построенную модель, рассчитаем вероятности успеха в случае выбора инвестиционного проекта, связанного с рестора ном, кафе и бистро, при условии: ¥(у = 0) = 0,0002; Р(у =1) = 0,0056; P(j = 2) = 0,9942; ?{у = 0) = 0,9322; Р(у = 1) = 0,0678; ?{у = 2) = 0,0000. В первом случае наиболее вероятен успех при выборе проек та, связанного с бистро, а во втором — ресторана. Предельный эффект имеет смысл рассчитывать только для фактора х4: 1) для первого случая: bl4 = 0,0002 • 0,3843 + 0,0056 • 0,2287 = 0,0014; 510 = 0,0002 • (0,3843 - 0,0014) = 0,0001; te fell, mo hv
(4-8)
Полученная классификация позволяет ввести вторую фиктив ную переменную i2, следуя правилу если если если если
t е тоо, feloi, tell0, t£ I u ,
«о то то то
il2 - 0; / Г 2 = 1J it2=0; it2 = 1.
(4.9)
Модель с двумя фиктивными переменными У, = ао + ауу^
+ a2yt_2 +••• + ату,_т + dxin + dxitX + £,
(4.10)
обеспечивает получение четырех траекторий, различие между ко торыми определяется идентифицируемыми эффектами. Коэффи циенты модели оцениваются с помощью обычного метода наи меньших квадратов, и полученное уравнение у,=а0+
аху,_х + а2у,_2 +••• + а„у,_т + dxirX + d2il2
(4.11)
используется для статистического анализа результатов моделирова ния. Если коэффициенты при фиктивных переменных окажутся значимыми, то это будет свидетельствовать о том, что эффекты играют существенную роль в динамике моделируемого процесса, и они должны быть учтены в прогнозных расчетах. Процесс уточнения модели путем идентификации фиксирован ных эффектов прекращается, как только точность модели дости гает требуемого уровня или коэффициенты при переменных, ха рактеризующих эффекты, становятся статистически незначимыми. На этом построение экстраполяционной составляющей модели завершается. Полученную модель будем называть мультитрендовой. Таким образом, мулътитрендовая модель — это модель, обеспечи вающая адекватное описание процессов с несколькими траектория ми развития. Мультитрендовая модель имеет две особенности. Во-первых, она обеспечивает высокую точность аппроксимации данных рет роспективного периода, а во-вторых, с ее помощью можно про водить многовариантные прогнозные расчеты. Многовариантность открывает возможность для всестороннего анализа ожидаемых си туаций, которые могут иметь место в обозримом будущем. Это важное и нужное свойство. Оно создает ситуацию альтернативного выбора, обостряя чувство риска у лиц, принимающих решение на основе прогнозной информации. Естественно, в подобной ситу135
ации для снижения риска необходимо уточнение возможной реаль ности каждого из прогнозных вариантов. Для этой цели предлага ется дополнить мультитренд вероятностными оценками, позволяю щими проводить альтернативное сравнение прогнозных вариантов в процессе принятия прогнозного решения. Для получения вероят ностных оценок удобно использовать модель дискретного выбора. Количество прогнозных вариантов заранее не задается, а, как следует из вышерассмотренной схемы построения модели, опреде ляется в соответствии со статистическими критериями надежности. Если их окажется два, то для получения вероятностного распреде ления, устанавливающего степень реальности каждого варианта, можно использовать модель бинарного выбора; если вариантов боль ше двух, то для этих же целей можно использовать модель множе ственного выбора. Таким образом, в схеме прогнозных расчетов применяются две модели: мультитрендовая и дискретного выбора. Первая обеспечивает оценку будущего в виде альтернативных про гнозных траекторий, а вторая — оценивает вероятность реальнос ти каждого из этих вариантов. Формально комбинированная модель может быть записана следующим образом:
j£i = «о + аху, + агу,_х + ••• + amy,_m+i + f *d; р* _
(4.13)
exp(x,+1b') l+£exp(x I+1 b*)
(4-14)
где у* — к-й вариант прогнозной оценки; у— запаздывающие зна чения зависимой переменной; а- — оценка у-го коэффициента регрессии; Р* — вероятность реальности k-ro варианта прогнозной оценки; f* — вектор значений, которые в к-м варианте приняли фиктивные переменные (например при К = 3 имеем набор из четы рех векторов f° = (0,0), Р = (0, 1), f = (1, 0), Р = (1, 1)); d - век тор коэффициентов при фиктивных переменных; 6*— оценка век тора параметров логит-модели множественного выбора к-го вариан та; х ж — вектор значений, описывающий условия, ожидаемые в упреждающем периоде. Описание моделей дискретного выбора со всеми подробностями построения и предельного анализа результатов моделирования приведено в предыдущей главе. Это позволяет непосредственно 136
перейти к построению комбинированной модели на основе мультитрендовой с использованием логит-модели множественного вы бора. Последовательному изложению этапов реализации этой процедуры посвящается следующий параграф. 4.2. Прогнозирование прибыли предприятия с помощью комбинированной модели Рассмотрим прикладные возможности комбинирован ной модели на примере многовариантных прогнозных расчетов ожидаемой прибыли ОАО "Воронежстальмост", которые проводи лись по заданию одного из коммерческих банков г. Воронежа с целью их использования при обосновании кредитной надежности данного акционерного общества, обратившегося к ним с просьбой о предоставлении кредита. Динамика прибыли объединения при ведена в табл. 4.1 Т а б л и ц а 4.1 Динамика прибыли ОАО "Воронежстальмост", тыс. р. Год 1996 1997 1998 1999 2000
Прибыль 13146 16 828 40 325 73454 80 206
Год 2001 2002 2003 2004
Прибыль 115 343 109 730 141 050 126 618
Как предусмотрено описанной в предыдущем параграфе схе мой, построение модели проведем в два этапа. На первом эта пе построим мультитрендовую модель, а на втором — модель множественного выбора, позволяющую рассчитать для каждого прогнозного варианта вероятность его реальности. Построение мультитрендовой модели и все дополнительные расчеты проведем в пакете MS Excel. Его среда обеспечивает много удобств при реализации расчетов подобного типа. Для построения логис тической модели множественного выбора используем пакет STATISTICA 6.0, в котором предусмотрена такая возможность. Всю процедуру построения комбинированной модели разделим на шаги и проведем их подробное описание. 1. Ввод исходных данных в MS Excel. 2. Определение порядка авторегрессии. 137
2.1. Формирование вектора значений лаговой переменной yt_r Построение с помощью "Пакета анализа" MS Excel авторегресси онной модели первого порядка: yt = Z?0 + &i}V-i +Et (см. вывод итогов 4.1). Вывод итогов 4.1 Регрессионная статистика Множественный R 0,914613 R-квадрат 0,836 517 Нормированный „ ,™ .^g R-квадрат Стандартная
ISQIKSM
ошибка Наблюдения
18 9 1 8 8 4
'
8
Дисперсионный анализ
Ре фесе ия Остаток Итого
Y-пересечение Переменная X 1
df
SS
1 6 7
UE+10 2J5E+09 1.31Е+10
Значи мость F 1.1Е+10 30,70098 0,001 458 3,58Е+08 MS
F
Коэффи Стандартная t-cma - Р-значе- Нижние Верхние тистика ошибка циенты ние 95% 95% 26 089,62 13013,91 2,004 749 0,09 182 -5754,28 57 933,53 0,151 347 5,540 847 0,001 458 0,468 257 1,208 923 0,83859
Сравнение расчетных значений ^-статистик с табличными по зволяет сделать вывод о значимости коэффициента авторегрессии Ьх (тот же самый вывод можно сделать по Р-значению, которое в случае значимости коэффициента не должно превосходить 0,05). Следовательно, необходимо далее наращивать порядок авторегрес сии, т.е. строить авторегрессию второго порядка. 2.2. Формирование вектора значений лаговой переменной у,_2. Построение авторегрессионной модели второго порядка: yt =b0 + blyt_l +b2y,-2 +£t ( см - вывод итогов 4.2). Сравнение расчетного значения /"-статистики с табличным по зволяет сделать вывод о незначимости коэффициента &2- Следо вательно, прогнозные расчеты необходимо осуществлять с исполь зованием авторегрессионной модели первого порядка. 138
Вывод итогов 4.2 Регрессионная статистика Множественный R 0,956 435 R-квадрат 0,914 768 Нормированный 0,872 152 R-квадрат Стандартная 12 519,77 ошибка Наблюдения 7 Дисперсионный анализ
Регрессия Остаток Итого
Y-пересечение Переменная X I Переменная X 2
df
SS
2 4 6
6,73Е+09 6,27Е+08 7,36Е+09
Значи мость F 3,36Е+09 21,46528 0,007 265 1,57Е+08 MS
Коэффи Стандартная l-ста ошибка циенты тистика 46 007,64 11137,3 4,130 953 0,03107 0,31213 0,099541 0,772 209 0,326 376 2,366 009
F
Р-значение 0,014483 0,925498 0,077 156
Нижние 95% 15085,49 -0,83554 -0,13396
Верхние 95% 76 929,79 0,897684 1,678 377
3. Построение мультитрендовой модели. 3.1. Вычисление расчетных значений у , отклонений расчет ных от фактических значений и относительных ошибок в процен тах 8Г Результаты расчетов представлены в табл. 4.2. Т а б л и ц а 4.2 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
У,-, 13146 16 828 40 325 73454 80 206 115 343 109 730 141 050
У 37 114 40 202 59 906 87 688 93 349 122 815 118 108 144 373
yt-9t -20 285,46 123,38 13548,36 -7481,65 21 993,65 -13 084,72 22 941,50 -17 755,08
5 120,54 0,31 18,44 9,33 19,07 11,92 16,26 14,02 139
3.2. Идентификация случайного эффекта с помощью фиктив ной переменной /|, принимающей только два значения (0 или 1) и формируемой по следующему правилу: _ |0, если y,-yt
[1, если у, — yt 03.3. Построение регрессионного уравнения с фиктивной и лаговой переменными: у, = 3114,56 + 31630,72^ + 0,94 yt_y. (6672,99) (5631,03) (0,06) 3.4. Вычисление расчетных значений у , отклонений расчет ных от фактических значений и относительных ошибок в процен тах § г Результаты расчетов представлены в табл. 4.3. Относительный уровень ошибок хотя и снизился, но для не которых наблюдений остается все же высоким. Очевидно, оста ется еще неучтенный эффект, который требуется идентифициро вать аналогичным образом. При этом нужно оставаться в рамках ограничений, которые необходимо выполнить для успешной ре ализации второго этапа. Суть этих ограничений в том, чтобы в каждой группе наблюдений, на которые делится выборочная со вокупность, было не менее двух наблюдений. В противном слу чае идентификация модели множественного выбора невозможна. Т а б л и ц а 4.3 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
У,-, 13146 16 828 40 325 73454 80 206 115 343 109 730 141 050
У
у, -
У,
15414,70 1413,56 50 490,76 -10 165,74 72 475,66 978,47 71 842,43 8363,44 109 790,45 5552,64 111 036,12 -1305,67 137 415,33 3634,63 135088,93 -8471,33
8, 8,40 25,21 1,33 10,43 4,81 1,19 2,58 6,69
3.5. Введение фиктивной переменной f2 аналогично fv Замечание. Преследуя цель выполнения сформулированных выше ограничений при формировании / 2 , самому маленькому положительному отклонению был присвоен 0 вместо 1. 140
3.6. Построение регрессионного уравнения с двумя фиктивны ми и лаговой переменными: у, =-2735,06 + 31924,81/, + 9595,63/2 +0,95y,_i. (5141,52) (3885,31) (3760,31) (0,04) 3.7. Вычисление расчетных значенийy t , отклонений расчетных от фактических значений и относительных ошибок в процентах 5Г Результаты расчетов приведены в табл. 4.4. Т а б л и ц а 4.4 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
л 1 0 0 1 1 0 1 0
У,-, 13146 16 828 40 325 73454 80 206 115343 109 730 141 050
У 19 321.96 45 141,66 67 414,77 76 489,44 114 814,38 106 601,32 142 801,41 130 969,46
у, -
У,
-2493,70 -4816,64 6039,37 3716,43 528,72 3129,12 -1751,45 -4351,85
8, 14,82 11,94 8,22 4,63 0,46 2,85 1,24 3,44
Данные табл. 4.4 свидетельствуют о том, что мультитрендовая модель обеспечивает достаточно высокую точность аппрок симации, особенно последних наблюдений. С помощью этой модели удается рассчитать четыре прогнозных траектории, от личающиеся друг от друга на величину случайного эффекта фиксированной величины. Раз эффекты случайны, то необхо димо знать их вероятностный закон распределения. Его иден тификация осуществляется с помощью модели множественного выбора. Атрибутами (факторами) модели множественного выбора мо гут быть как количественные, так и качественные переменные. Каждый из вариантов есть результат определенной экономической ситуации, которую не всегда удается описать количественными показателями, и поэтому имеет смысл использовать качественные оценки, получаемые с помощью экспертов. 3.8. Нумерация вариантов и определение интервалов для балль ной оценки условий, в которых может сформироваться соответ ствующий вариант (табл. 4.5). 141
Т а б л и ц а 4.5 Ситуация
Номер варианта
Баллы
Очень плохая Плохая Хорошая Очень хорошая
0
5-25 1 5 - 40 3 5 - 75 50 - 90
]
2 3
3.9. Экспертная оценка ситуаций, в которых была получена соответствующая прибыль (табл. 4.6). Т а б л и ц а 4.6 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
Л 1 0 0 1 1 0 1 0
У,, 13146 16 828 40 325 73454 80 206 115343 109 730 141 050
Номер варианта
Баллы
1 2 2 1 3 0 3 0
15 35 75 40 50 5 90 25
3.10. Построение мультиномиальной логит-модели по данным последних двух столбцов табл. 4.6 с помощью пакета STATISTICA. Результаты моделирования представлены в табл. 4.7. Т а б л и ц а 4.7 Оценки параметров модели, их стандартные ошибки, статистики Вальда и вероятности
Effect Interc l "Var2" Interc 2 "Var2" Interc 3 "Var2" Scale 142
Varl - Parameter estimates (Spreadsheetl) Distribution: MULTINOMIAL Link function: LOGIT Level Level of Standard Wald Stat. of Effect Response Column Estimate Error 1 9,672 420 2,140 278 20,42349 0 2 0 -0,270 766 0,058 671 21,29770 3 1 7,769 844 2,044 825 14,43817 4 1 -0,179 950 0,050 178 12,86105 2 5 2,192 924 1,075929 4,15413 6 2 -0,035 078 0,016 337 4,61045 1,000 000 0,000 000
P 0,000 006 0,000 004 0,000 145 0,000 335 0,041 533 0,031778
Статистика Вальда и вероятность ошибки свидетельствуют об адекватности построенной модели. Сама модель может быть запи сана следующим образом: Р(А,) =ехр(9,672 - 0,27Lc,-)+exp(7,770 - 0,180*, )+ехр(2Д 93 - 0,035х,); ехр(9,672-0,271*,.)
P(v =0)=
, = x , B ( f - l , a ) ;
(4.26)
B(t,a) = В(? - La) + —-^[у, -x,B(f - l , a ) ]
(4.27)
в рекуррентной формуле (4.27) адаптивного механизма которой в качестве корректирующего слагаемого используется обычно приме няемый в адаптивной фильтрации градиент от прогнозной ошибки grad(;y,-x,B(f-l,a))2 = -2 x ;(v,-x,B(?-l,a)),
(4.28)
умноженный на константу к =а/2^х~(0 обеспечивающих максимально возможную точность аппроксимации. Второе слагаемое выполняет роль стабилизирующего члена, минимизация которого приводит к текущим оценкам B(t), мало отличающимся от предыдущих B(f-l)- Последнее слагаемое, как и второе, выполняет роль ста билизирующего члена, обеспечивающего сглаживание чрезмерных скачков реакций адаптивной модели в случае появления выброс ных наблюдений. Возможные значения параметра а в этом выражении остают ся в прежних границах 0 < а < 1, а значения параметров у и Р, определяющих долю участия каждого слагаемого в комбинирован ном критерии, удовлетворяют следующим неравенствам: у > О, Р> О, у + р< 1. Решение оптимизационной задачи (4.28) с использованием РМНК позволяет записать прогнозную модель с настраиваемой структурой адаптивного механизма в виде соотношений 5>, + T =x / + T B(f-l), r = 0 , 1 , 2 , . . . ;
(4.30)
6 ( 0 = B(t -1) + /3[6(f -1) - B(t - 2)] +
+ -^Нг—а-/"/*)!?,-?,]; £-1 _
а
^t-lXtXt^t-l
х,сДх^+а
(4.31) (4.32)
Структура рекуррентной формулы (4.31), с помощью которой осуществляется пересчет текущих значений коэффициентов адап тивной регрессии, зависит от граничных значений параметров у и р. Если ввести обозначения
*»>«*>= Л" 1 *', 150
;
(4-33)
et = yt-xtB(.t-l,a,Y), (4.34) то возможные варианты этой рекуррентной формулы удобно пред ставить в виде табл. 4.10. Т а б л и ц а 4.10 Варианты структуры адаптивного механизма Параметр ,3 = 0
0 < /К 1
у=0
0
(4-46)
P,=(Xn,+1CrX+i+air';
(4.47)
B,.(r + l) = B(0 + )8[B(0-B(?-l)] + + a-y-P)C;lXnt+lPtEin[; е,+и=хр(Щ>Зе); yt^=xl+lBi(t
+ l) + el+u;
y™"=minyl+uУ?+\ = m a x Уг+и; i
(4.49) (4.50) (451)
(4.52)
min.
/A C-J\
^, + i = У,+1 - y,+i .
(4-53)
yt+i~N~
(4.54)
n
158
(4.48)
max
EU+i;+1'
перепишем (4.65) следующим образом:
в(/) =
1 ^,-1 _ 1 C / _iX / x / C f _ I
«
'-1
a
7 1
а
2
LXtc;W(+l
х {ay M L M k-iYM + (I - Л,-1 ft-J+ *& Ч + (l - A '),,]} (4-67) 162
Выполнив в (4.67) умножение и некоторую перегруппировку результатов перемножения, можем записать
в(/)=в (/ -1) + - c,-ilX; tyyt + (i - л' )yt} а
_l CrVix C,-i, ^ ; _ | L b | [ A [ _ | t b | t (I-A,_,)Y,_|].
(4.68)
После несложных преобразований получаем B(f) = B ( f - l ) + - C / - V f
x r C^ix', + а r'v'
\Xyt+(l-X')y]-
x,B(r-l)
/ ^ 7 — 1 / —1 ' ^
(4.69)
Приведение к общему знаменателю в квадратной скобке позво ляет записать (4.69) следующим образом:
B(r) = B(/-l) + х^ V х^ + ( l - A ' ) ^ ] Л-г-1 г
H v ' ' , fB(r-l). • ^ '• >£—*
r-i
(4.70)
Окончательная формула для рекуррентного вычисления коэф фициентов В(/) приобретает вид
B(t) = B(t-l)+^^{\Xyt Х
+
(l-X)yt]-XtB(t-l)}.
(4.71)
Л"7-1Х/
Начальные значения В(0) и CQ1 определяются по данным рет роспективного периода с помощью МНК. Оптимальное значение параметра сглаживания а подбирается с использованием пост прогнозных расчетов на контрольной выборке, в качестве кото рой, как правило, используются последние наблюдения ретрос пективного ряда. Задача подбора оптимального значения парамет163
pa Я не может быть решена по аналогии с параметром а, так как, в принципе, нельзя получить данные для сравнения с постпрогноз ными расчетами. Четких рекомендаций по его подбору нет. Од нако если предположить, что степень доверия экстраполяционным данным в начале упреждающего периода равна степени доверия рациональным ожиданиям в конце упреждающего периода, то значение параметра Я определяется из уравнения 1 — Ят = I, где т — длина периода упреждения. В тех случаях, когда абсолют ным доверием пользуется только одна из траекторий, Я принимает соответственно значения 0 или 1. Таким образом, в общем виде адаптивная модель для расчета комбинированной траектории выглядит следующим образом:
y,+i =*,«т £(r + i) = £(/)+ +
~~ГГ x
/+i^?
x
/+i
4+1
+
a
{ ( ^ ж + (l - А ' + 1 Ы - х,+1В(/)}; (4.73) Q-1
а
Ц Х
X
!+lXt+l^r
Г + 1*-Т
Х
/+1
(4.74)
+СС
Модель (4.72)—(4.74) можно применять для построения комби нированных прогнозных оценок в тех случаях, когда в качестве экспертной траектории используются непосредственно числовые значения, получившие в результате сравнения с другими возмож ными вариантами ожидаемых значений экспертное предпочтение. Если же считать, что в своих оценках эксперты руководствовались некой моделью и в комбинированном прогнозе следует учесть не значения, а тенденцию, в соответствии с которой эти значения были сформированы, то возникает проблема восстановления этой тенденции. Такая ситуация обычна для регрессионного анализа и при наличии достаточных информационных возможностей эксперт ные оценки аппроксимируются регрессионным уравнением yt=x,B,
t =lt,
(4.75)
которое используется при построении комбинированной модели. Модель, ориентированная на использование тенденций, в со ответствии с которыми формировались экспертные ожидания, естественно, должна отличаться от только что рассмотренной. Это 164
отличие касается, прежде всего, второго слагаемого ее квадра тичного функционала. Оно, по идее, должно представлять собой дважды взвешенную сумму квадратов отклонений расчетных зна чений от соответствующих значений, определяемых построенным уравнением регрессии (4.75), а саму экстремальную задачу мож но записать в виде В (/) = Argmin £ AJa'~j [у,- - х у В(/)] 2+
+
i(l-A;)a'-J[xjB-XjB(t)}2\.
(476)
При записи этого функционала использованы те же самые обозначения, что и в функционале (4.57), кроме вектора В , который представляет собой коэффициенты регрессионного урав нения (4.75). Дифференцирование (4.76) и проведение тех же самых преобра зований, что и в предыдущем случае, позволяет получить формулу для пересчета текущих коэффициентов регрессии следующего вида: B(f)=B(/-l)+A'—§Ц^—^-^(/-1)] + х,С г _]Х, + а
+М )
5
V
' МВ-В(?-1))].
(4.77)
X/C/.jX, +a
Полученная рекуррентная формула адаптивного механизма рег рессионной модели содержит два корректирующих слагаемых, первое из которых является реакцией модели на ошибку прогно зирования, а второе — реакцией на несовпадение текущих коэф фициентов с коэффициентами модели экспертных ожиданий. Адаптивная модель для этого случая имеет вид & + 1 =х, + 1 В(0; В(/ + 1) = В(/) + Xм
ffi+i x
t+v^t
+ (l - Я'+1)
ffi+'
x
t+[ +
(4-78) \ум - хмЩ] +
a
[х ж (В - В(0)];
( 4. 7 9)
165
1
-i-1
С" =
C~V x Г"1 (4.80)
Графическая иллюстрация результатов моделирования переход ного процесса, полученных с использованием выведенных здесь рекуррентных соотношений, представлена на рис. 4.1. У * 25
20
10
X
0
5
10
15
20
—— Траектория переходного процесса —•— Траектория 1
25 А
30
Траектория II
Рис. 4.1. Прогнозные траектории развития экономического процесса На графике легко выделяются четыре участка: ретроспективный и три прогнозных, характеризующих ожидаемые траектории раз вития экономического процесса. На первом из трех прогнозных абсолютным доверием пользуется экстраполяция, на втором — предпочтение отдается траектории, реализующей переходной про цесс, и, наконец, на третьем участке абсолютное доверие смеща ется к экспертным оценкам. Несмотря на то, что в основу построения моделей (4.72)— (4.74) и (4.78)—(4.80) положены одни и те же идеи, применяются они в разных ситуациях. Первая модель, как правило, используется в тех случаях, когда не удается получить формального представления о тенденциях эксперт ных ожиданий, а сами экспертные ожидания — не что иное, как количественные оценки прогнозируемого показателя, которым экс перты отдали свое предпочтение при сравнении с другими. Вторую модель рекомендуется использовать там, где, в прин ципе, количественные оценки могут даже отсутствовать, но у экспертов есть представление в виде некоторой закономерности, в соответствии с которой они формируют свои представления. 166
Чтобы убедиться в том, что эти модели действительно могут при водить к разным результатам при использовании одного и того же набора данных, проведем сравнительные расчеты на условном примере. Исходные данные, характеризующие динамику величи ны чистой прибыли и затратных факторов торговой компании ОАО "Ларец", представлены в табл. 4.11. Таблица Динамика показателей ОАО "Ларец" Период 1 2 3 4 5 6 7 8 9 10
Чистая прибыль, тыс. р. 488,23 451,42 510,41 553,23 548,93 568,88 412,29 576,93 708,64 602,91
Затраты на рекламу, тыс. р. 190,99 161,66 207,32 238,29 235,95 251,99 134,49 192,97 232,85 167,39
4.11
Затраты на хранение, тыс. р. 130,82 74,36 138,24 141,44 156,32 189,92 93,74 114,06 135,29 94,25
Первые семь наблюдений исходных данных были использованы для получения начальных значений адаптивной многофакторной регрессионной модели
в(о)=
^231,9220ч 1,3900 -0,0701
С0 =
4,3258 •0,0323 0,0180
-0,0323 0,0005 -0,0005
0,0180^ -0,0005 0,0006
По оставшимся трем наблюдениям с использованием постпрог нозных расчетов был настроен параметр адаптации а. Его опти мальное значение оказалось равным 0,01. Динамика коэффициен тов адаптивной регрессионной модели при а = 0,01 приведена в табл. 4.12. Коэффициенты адаптивной регрессии для t = 10 были приняты за начальные значения адаптивной модели переходных процессов, а само регрессионное уравнение использовалось для получения экстраполяционных прогнозных оценок. В качестве факторов при проведении этих расчетов были приняты плановые затраты на хранения и рекламу. Все эти величины приведены в табл. 4.13. 167
Т а б л и ц а 4.12 Динамика коэффициентов адаптивной многофакторной модели Параметры *о
*.
ъ,
Г=8 285,5876 2,8947 -2,3765
Время 1=9 174,0371 4,7260 -4,1878
/ = 10 285,3286 4,3583 -4,3743
Кроме того, в эту таблицу включены экспертные оценки I и II. Экспертные оценки I представляют собой обобщенные результа ты экспертного опроса относительно ожидаемого уровня чистой прибыли, а экспертные оценки II являются расчетными значени ями уравнения у = 266,1523 + 3,3577*, -1,8878* 2 , полученного как регрессия экспертных оценок на планируемые затраты. Т а б л и ц а 4.13 Исходные данные для построения адаптивной модели переходных процессов Период t =11 / = 12 t= 13 / = 14 / = 15
Ожидаемая чистая прибыль, тыс. р. Затраты на Затраты на рекламу, хранение, Экстраполяцион- Экспертные Экспертные тыс. р. тыс. р. оценки I ные оценки оценки II 204,93 698,23 712,77 127,92 618,91 198,56 102,51 648,30 722,89 739,35 786,67 234,71 131,56 660,78 805,89 796,44 211,71 119,57 751,30 684,99 236,74 133,57 732,83 813,99 808,91
Данные табл. 4.13 использовались в качестве исходных для расчета коэффициентов адаптивной модели переходных процессов, динамика которых представлена в табл. 4.14. В модели переход ных процессов с помощью дополнительного параметра у = 0,7 регулировался уровень реакции на ошибки прогнозирования. Фактически в табл. 4.14 представлены значения текущих коэф фициентов четырех моделей. Две первые применялись для расчета прогноза с начальным уровнем доверия экстраполяционным оцен кам Я = 0,6, а две последние — с уровнем доверия Я = 0,9. При каждом уровне доверия для получения комбинированной траекто рии использовались модель I (4.72)—(4.74) и модель II (4.78)—(4.80). 168
Т а б л и ц а 4.14 Динамика коэффициентов адаптивной модели переходных процессов Уровень доверия Модель Параметры *о
I
*•
*,
Я = 0,6 11
к *•
Ьг I Я = 0,9 11
К ь, К К ь, ь,
/ = 11 300,9379 3,1105 -2,3237 303,8024 2,8815 -1,9474 291,0117 3,9040 -3,6277 291,7254 3,8470 -3,5340
/ = 12 269,7979 3,6103 -2,8810 243,7292 3,8457 -3,0225 354,2388 2,8891 -2,4962 346,7635 2,9635 -2,5490
Время / = 13 180,7640 4,1225 -3,0046 135,9068 4,4660 -3,1722 392,0664 2,6715 -2,4437 462,4788 2,2978 -2,3884
1= 14 722,0867 -3,3627 6,2349 386,4274 1,0019 1,1038 749,0811 -2,2652 3,6500 736,6041 -1,4927 2,2905
1= 15 415,5484 -10,3667 21,1998 186,1166 -3,5749 10,8828 336,9973 -11,6807 23,7675 267,3906 -12,2135 25,1970
Окончательные результаты в виде четырех вариантов прогноз ных расчетов приведены в табл. 4.15. Т а б л и ц а 4.15 Результаты расчетов ожидаемой чистой прибыли, тыс. р. (модели I, II) Уровень доверия Я = 0,6 Я = 0,9
Модель I II I II
t= 11 641,12 645,19 627,00 628,01
/ = 12 691,33 697,50 672,02 673,91
Время / = 13 753,07 766,79 697,61 687,59
t= 14 755,68 730,52 705,96 694,46
/ = 15 793,01 793,41 746,35 741,53
Анализ результатов расчетов показывает, что от параметра уровня доверия в значительной степени зависят прогнозные оцен ки. Это различие легко обнаруживается на рис. 4.2, 4.3, отра жающих динамику ожидаемой чистой прибыли. При А = 0,6 про гнозные оценки переходных процессов достаточно быстро дости гают тенденции развития, предсказанной экспертами, в то вре мя как при А = 0,9 в комбинированной траектории продолжает доминировать экстраполяционная тенденция. Зависимость про гнозных оценок от А очевидна. В силу этого вопросу определе ния значения этого параметра следует уделять пристальное внима ние, тем более что формальных процедур его выбора нет. 169
Расчеты, полученные по первой и второй моделям, отличаются друг от друга незначительно. И все же между прогнозными тра екториями этих моделей есть различие, и есть объяснение этому различию. Суть его сводится к тому, что в экспертных оценках II учитывается возможное влияние факторов, а это равносильно использованию дополнительной информации, способствующей повышению их объективности. У, 900 800 700 600 500 400 300 200 100
0
10
12
- Комбинированная траектория I
- Комбинированная траектория II
- Экспертная траектория
- Экстраполяционвая траектория
16
Рис. 4.2. Динамика ожидаемой чистой прибыли (А = 0,6) У к 900 > 800700 600 500 400 300200 100 -
X
0
2
4
6
- Комбинированная траектория I - Экспертная траектория
10 12 14 Комбинированная траектория П А
Эксграполяционная траектория
Рис. 4.3. Динамика ожидаемой чистой прибыли (Я = 0,9) Обобщая результаты проведенного вычислительного экспери мента, следует сделать ряд выводов относительно возможности 170
использования разработанных в этом параграфе моделей для по строения комбинированных прогнозных траекторий. Во-первых, с помощью введенного в эти модели параметра Я, регулирующего степень доверия, удается достаточно эффективно управлять процессом комбинирования инерционных тенденций и тенденций экспертных ожиданий. В то же время специфическая роль этого параметра и отсутствие объективной информации, позволяющей оптимизировать выбор Я, оставляет вопрос о его определении в субъективной плоскости. Во-вторых, несмотря на то, что обе разработанные модели дают практически одни и те же прогнозные оценки, однако ус ловия их применения различны. Первая модель (4.72)—(4.74) используется в тех ситуациях, когда удается получить экспертные оценки непосредственно в количественном виде. В отличие от первой, вторая модель (4.78)—(4.80) позволяет проводить расчеты тогда, когда исследователь располагает не количественными оцен ками, а некой параметрической моделью рациональных ожиданий относительно тенденций изменения прогнозируемого показателя. Обычно эта модель представляет собой регрессионную зависи мость, отражающую отличные от ретроспективного периода зако номерности развития моделируемого процесса. В-третьих, адаптивность разработанных моделей позволяет эффективно реализовать процедуру получения прогнозных оценок для тех перспективных периодов, в которых ожидается смена тен денций.
ГЛАВА
5 КОМБИНИРОВАННЫЕ ПРОГНОЗЫ М Н О Г О М Е Р Н Ы Х ПРОЦЕССОВ
В практике принятия прогнозных решений, как пра вило, приходится иметь дело с многомерными временными ряда ми. Причем стандартной является ситуация, когда число наблю дений столь мало, что идея построения эконометрических моде лей многомерных временных рядов в виде систем одновременных уравнений или векторной авторегрессии теряет всякий смысл. По этому возникает необходимость построения моделей, основанных на несколько иных принципах, чем эконометрические. Взамен предположений о характере динамики для рассматри ваемого случая выдвигается гипотеза о характере структурного вза имодействия экономических показателей, которое можно описы вать косвенными темпами приростов, представляющими собой от ношения приростов каждого из рассматриваемых показателей ко всем остальным. Основная идея этой гипотезы в том, что на про тяжении достаточно длительного периода времени структура кос венных темпов приростов прогнозируемых показателей может ос таваться почти неизменной [14]. Неизменность — это как раз то свойство структуры, которое переносится из настоящего в буду щее. Модели, обеспечивающие такой перенос в различных усло виях принятия решений, описаны ниже. Причем описание начи нается с простейших вариантов этой модели, которые постепен но усложняются с целью повышения адекватности отражения многомерной динамики. 5.1. Модель с детерминированным матричным предиктором Детерминированный матричный предиктор имеет смысл строить в тех ситуациях, когда возможность применения статистических методов моделирования полностью исключена. Примером может служить ситуация, в которой исследователь рас полагает всего двумя, тремя наблюдениями. Чтобы перейти к 172
формальному описанию модели с таким предиктором, введем обозначения: xtj — величина /-го показателя в момент времени /; хг_и — величина /-го показателя в момент времени (—1; Axti — величина изменения (прироста) /-го показателя. Далее естественно предположить, что любое изменение произ вольного /-го показателя зависит от величины остальных показа телей. Это может быть функциональная или регрессионная зави симость Axti = F(x„, xa, ... , хт). Будем рассматривать случай, когда малый объем ретроспективных данных не позволяет реали зовать известные методы идентификации этой зависимости. Един ственно доступной альтернативой идентификации в подобной ситуации является подход, основанный на значительном упроще нии этой зависимости. В качестве такой упрощенной формы удобно использовать линейное представление приростов. Сразу заметим, что модель, построенная по двум наблюдениям, не может претендовать на применение для расчетов, распространя емых за рамки, очерченные краткосрочными прогнозами. Поэто му при рассмотрении краткосрочных периодов такое упрощение не приводит к значительному росту ошибки прогнозирования даже в том случае, когда истинная зависимость явно нелинейная. Модель этой простейшей (линейной) зависимости строится в предположении, что прирост любого из показателей формируется под воздействием всех остальных, являясь как бы суммарной ве личиной, причем каждый показатель в отдельности оказывает не значительное влияние, и среди них нет доминирующих. Для ре ализации этого предположения вводится в рассмотрение харак теристика, устанавливающая степень влияния j-ro показателя на изменения, происходящие в /-м. В качестве такой характерис тики, как отмечалось выше, удобно использовать косвенный темп прироста
Если условиться, что на формирование прироста все показате ли оказывают равномерное воздействие, то, разделив vtJ на (и—1), получим ту долю в приросте /-го показателя, которая сформирована под воздействием у-го. Использование введенной меры степени влияния у'-го показателя на /-й позволяет выразить прирост Axtj через сумму произведений 173
A*/* =
~^va П-1
(5.2)
V
j*i
Учитывая, что Axrj = xtj— xt_u, можно величину любого /-го показателя представить в виде суммы предшествующего значения xx_Vl и прироста Axtj (5.2): *«• = х,-\, +
Ъvuxv'
1 = 1, и.
(5.3)
Для полученной системы уравнений (5.3), введя обозначения Хц */2
V=
1
О
"12
"1л
"21
О
"2л
(5.4)
/1-1 v
v
О
«l «2 m можно использовать компактную матричную запись V
v
х
x,_,+Vx,.
(5.5)
Считая, что неизвестным вектором в этой системе является х,, запишем его следующим образом: х, = ( I - V ) - ' x , _ 1 ,
(5.6)
где через I обозначена единичная матрица. Обратную матрицу (I—V)""1 будем называть матричным предик тором. Он определяет переход из состояния, описываемого век тором значений предшествующего момента времени, в состояние, представленное вектором значений текущего момента времени. Внедиагональные элементы обратной матрицы интерпретируются как косвенные темпы роста равномерно распределенных частей прогнозируемых показателей, а диагональные — как прямые тем пы роста оставшейся части. В предположении, что матричный предиктор перспективно го периода почти не отличается от матричного мультипликатора текущего периода, выражение (5.6) позволяет рассчитывать прогнозные оценки. Основное преимущество данного подхода заключается в том, что с его помощью можно проводить рас четы для многомерных рядов динамики даже в том случае, когда исследователь располагает наблюдениями лишь за два 174
периода. Правда, статистическая надежность таких прогнозных расчетов не проверяется и опирается, в основном, на то обсто ятельство, что даже при изменении характера динамики про гнозируемых процессов структура самого предиктора, как пра вило, изменяется незначительно. Как показывает практика прогнозных расчетов, применение этой модели предпочтитель нее обычных расчетов с использованием темпов роста, в кото рых совсем не учитывается взаимодействие между моделируемы ми показателями. Рассмотренная модель является базовой, и ее прикладные воз можности весьма ограничены. Она предназначена, главным об разом, для того, чтобы продемонстрировать принципы построе ния матричного мультипликатора, которые ниже будут использо ваны для построения более сложных модификаций модели. Про иллюстрируем эти принципы условным числовым примером, ис ходные данные для которого представлены в табл. 5.1. Т а б л и ц а 5.1 Динамика основных показателей, характеризующих деятельность ОА О "Консультант ", тыс. р. Период
1 2 3 4 5
Объем оказанных услуг
Фонд оплаты труда
Затраты на переобучение, повы шение квалификации персонала
3231,44
872,48
242,35
3755,52
951,01
271,02
4426,22
1036,61
298,62
5362,63
1129,89
331,45
6430,77
1171,58
347,93
Построение модели начинается с расчета приростов:
Ах1
^524,08Л 78,53 28,67
J
которые используются для формирования матрицы косвенных тем пов прироста f
0 0,2755 0,9669Л 0,0105 0 0,1449 0,0038 0,0151
0 175
На основе этой матрицы вычисляется предиктор '1,0069 0,2928 1,0160Л A 2 = ( l - V 2 ) ~ ' = 0,0111 1,0054 0,1564 0,0040 0,0163 1,0062 помощью которого рассчитываются прогнозные оценки х3 - А2х2
^4335,36^ - 1040,27 303,25
Проведенные расчеты не только иллюстрируют алгоритм по строения базовой модели, но и предназначены для того, чтобы оценить ее точность, поскольку сами, по сути, являются пост прогнозными оценками. Кроме того, представляет интерес срав нение (см. табл. 5.2) этих результатов с оценками, полученны ми с помощью модификаций базовой модели, к описанию кото рых мы и переходим. 5.2. Модель с настраиваемым параметром матричного предиктора Решающим фактором выбора модели с подобным пре диктором является не число наблюдений, а, скорее, ситуация, когда за рамками системы показателей, для которых строится мат ричный предиктор, остались факторы, оказывающие заметное влияние на их динамику. Природа этих факторов либо не изуче на, либо такова, что не поддается количественному измерению, и поэтому факторы не могут быть включены в модель. Но их влияние проявляется в динамике показателей, включенных в мо дель. Уловить это влияние можно, если прирост каждого показа теля разделить на две части, одна из которых формируется меха низмом, явно учитываемым моделью, а вторая — "скрытыми" факторами. В соответствии с этим делением представим прирост в виде суммы двух составляющих Axri =Д'х,+Д*х„-.
(5.7)
где Ыхп — та часть прироста, которая формируется "скрытыми" факторами"; A"xtj — та часть прироста, которая формируется про порционально факторам, включенным в модель. 176
Поскольку влияние "скрытых" факторов в соответствии с на шим предположением проявляется непосредственно в динамике самих показателей, то и отразить это влияние можно через соб ственные темпы той части прироста, которая формируется "скры тыми" факторами, т.е. /
А'*,,-
V;; = '
(5.8)
Коэффициенты косвенных темпов прироста в этом случае бу дем называть частными и вычислять по второй составляющей прироста:
А /г (5.9) о Сложение диагональной матрицы прямых темпов прироста V
U
V' =
=
х
О
О
"22
о (5.10)
о
о
пп J
элементы которой вычислены по формуле (5.8), и матрицы кос венных темпов прироста V" с элементами (5.9) ^0 ft
V2I
V12 ft
о
v
2n
(5.11) V„l
0
V„ 2
приводит к матрице темпов прироста 1
v = v'+-^-v', л-1
(5.12)
с помощью которой можно записать x,=(I-V)
-1,
»,-!'
(5.13)
где (I—V) ' — матрица роста с элементами, представляющими со бой частные коэффициенты роста. 177
Существенным в формировании матрицы роста в рассматри ваемом подходе является вопрос о соотношении, в котором на ходятся две составляющие прироста. Дать абсолютно четкие ре комендации по этому поводу весьма трудно. Единственно пра вильный выход, на наш взгляд, заключается в том, чтобы вве сти в модель настраиваемый параметр, через который можно оп ределять величину этого соотношения. Такая возможность пре доставляется тогда, когда в наборе данных содержится более двух наблюдений и часть из них (хотя бы одно наблюдение) можно использовать в качестве контрольной выборки для настройки параметра. Введение такого параметра позволяет каждую из составляющих прироста любого /-го показателя представить в виде А'*,., = fihxu;
A% =(1-ц)Ах„,
(5.14)
где 0 < jU < 1.
Если в формулах (5.8) и (5.9) используются составляющие при роста (5.14), то матрица темпов приростов V зависит от настраи ваемого параметра /л, и модель (5.13) можно переписать в виде x^d-VGu))-'*,.,.
(5.15)
У этой модели полностью сохраняются свойства, касающиеся точности аппроксимации, и одновременно повышается точность экстраполяции. Настройку параметра ц можно осуществлять таким образом, чтобы минимизировать выражение Х(ц) = max|x,+1/ -xt+u\,
(5.16)
представляющее собой максимальную величину разности между компонентами контрольного наблюдения х,+1 и вектора прогноз ных оценок х1+1=(1-Х(ц)Г1хг
(5.17)
В тех случаях, когда прогнозируемые показатели сильно отли чаются масштабом измерения, критерий в виде разности (5.16) теряет свою целесообразность. Его можно заменить относительной величиной ошибки Ъ\ц) = max ' 178
l x
\ t+u\
-—-—:—1.
(5 18)
Используя набор данных табл. 5.1 и некоторые результаты пре дыдущего примера, проиллюстрируем порядок построения вышеиз ложенной модели. Для удобства расчетов, проводимых в матричной форме, вве дем в рассмотрение матрицу М, элементы которой определяют ся настраиваемым параметром ц, и матрицу весовых коэффици ентов W: А
М*
0,1 0,9 0,9 Л 0,9 ОД 0,9 0,9 0,9 0,1
1 0,5 0,5 W = 0,5 1 0,5 0,5 0,5 1
Затем рассчитаем комбинированную матрицу прямых и косвенных темпов прироста: '0,1395 0,5511 1,9337N V,=V 2 ' + V ' = 0,0209 0,0826 0,2898 0,0076 0,0301 0,1058 v ) Применяя операции блочного умножения (*) и обращения мат риц, получаем предиктор (1,0200 0,2678 0,9323Л A 2 ( / i ) = ( l - M * W * V 2 ) 4 = 0,0102 1,0128 0,1424 0,0037 0,0148 1,0159 с помощью которого рассчитываем постпрогнозные оценки и от носительные ошибки < 2,00 ^
^ 4337,82^ х 3 = А , (/i)x 2 = 1039,95 303,24
$х? у
-0,32 1,55
Настройка параметра по критерию минимизации максимальной относительной ошибки позволила установить оптимальное значе ние параметра /л* = 0,9, при котором предиктор
A2(fi*)=k-M* *W*\2У
(1,1437 = 0,0013 0,0005
0,0342 1,0804 0,0018
0,1228 0,0174 1,1053
дает прогнозные оценки с соответствующими относительными ошибками 179
х
>("*) 2 =
4361,13 1037,03 303,11
f
1,47 ^
5x-i = -0,04
-1,50
Сравним результаты прогнозирования по базовой модели и модели с настраиваемым параметром. Сопоставление корректно проводить по постпрогнозным расчетам четвертого наблюдения, которое не использовалось при построении моделей. Для удобства результаты прогнозирования сведем в табл. 5.2. Таблица Сопоставление результатов прогнозирования Показатели Объем оказанных услуг Фонд оплаты труда Затраты на переобу чение, повышение квалификации персонала
5.2
Модельс параметром Базовая модель Фактическое Прогнозная Прогнозная значение, Ошибка, оценка, Ошибка, оценка, тыс. р. % % тыс. р. тыс. р. 5362,63
5063,81
5,57
5134,55
4,25
1129,89
1138,10
-0,73
1130,86
-0,09
331,45
335,10
-1,10
334,09
-0,80
Анализ табл. 5.2 позволяет сделать, по крайней мере, два вывода. Во-первых, модели с матричным мультипликатором по зволяют получать прогнозные оценки достаточно высокой точно сти. Во-вторых, модель с настраиваемым параметром, как и предусматривалось замыслом ее построения, приводит к результа там, которые по точности выше получаемых по базовой. В тех случаях, когда прогнозные расчеты не дают удовлетво рительных результатов и причиной тому является отсутствие ста ционарности временных рядов, следует предварительно преобра зовать исходные данные ряда, как это принято в авторегрессион ных моделях, в конечные разности и только затем строить мо дель, итоговый вариант которой будет иметь вид (5.19) Этот прием можно распространить и на случай, когда для до стижения стационарности потребуется переход к конечным разно стям более высокого порядка. V+1
180
= х, + (1-УГДх_,.
5.3. Модель с адаптивным матричным предиктором Идеи, лежащие в основе построения адаптивного пре диктора, по сути, ничем не отличаются от тех, которые изложе ны в предыдущей главе, хотя детали имеют свою специфику. Чтобы понять эту специфику, опишем не только модель, но и процедуру ее построения. Особенность такой модели заключается в том, что ее матрич ный предиктор строится в два этапа. На первом этапе определя ется начальное приближение, а на втором — организуется про цесс обучения мультипликатора в виде рекуррентной процедуры постпрогнозных расчетов. С этой целью выборочное множество наблюдений делится на две части. Пусть & (0 > 2) первых наблю дений используются для нахождения начальных значений. Кроме того, в рассмотрение вводится матрица, определяющая соотноше ние прямых и косвенных темпов приростов
(
м
(1-м)
М=
(1-м) • • (1-м)
• • (1-м)
м
,(1-м) 0-м)
(5.20)
М
и матрица весовых коэффициентов ИЛ.
w,.
W
ИЛ,
W
(5.21) W
1
W.я 2
J
определяемая либо по соответствующим коэффициентам корреля ции, либо с помощью экспертного оценивания, либо в соответ ствии с некоторой гипотезой (например, значимость равномерно распределена по показателям). При заданном начальном значении мультипликатора А,, на строенных параметрах ц* и а* и известной матрице W адаптив ная модель записывается следующим образом: Ч+\
Atxt;
(5.22) 181
л/+1 _ Xl+ij
Xt_Hi
', j = ln;
(5.23)
;
(5.24)
At+l=(l-M^W*\t+l)~l
(5.25)
A /+1 = a"Kt + (l -a*)A,+,A,.
(5.26)
V
~
X
t+lj
vt+l =
Л/ + 1
С помощью формулы (5.23) рассчитываются элементы матри цы корректирующих темпов прироста Yt+l, которая использует ся для построения корректирующего мультипликатора (5.25). Если в качестве А ж взять произведение корректирующего и текущего мультипликаторов А, + 1 А Г то расчетное значение х,+1 в точнос ти совпадет с фактическим значением вектора показателей х,+1. Однако учитывая, что основное назначение мультипликатора А ж — прогноз на период / + 2, его значение комбинируется из А, и A f+1 A r , причем параметр а, с помощью которого осуществляет ся комбинирование, является настраиваемым по критерию мини мизации, например, суммарной прогнозной ошибки. Модель (5.22)—(5.26) записана в предположении, что началь ное значение мультипликатора А, и оптимальные значения пара метров ц* и а* известны, а сами процедуры их получения не описывались ранее, поэтому логично привести их алгоритмичес кое описание. Процедура построения начального приближения: 1. Расчет текущих значений прямых и косвенных темпов при роста показателей ,' _ V
V~
X
ii
~
x
X
i-\i
' i , 7 = l , я, / = 1,0.
(5.27)
2. Определение геометрических средних значений прямых и косвенных темпов прироста показателей за период / (5.28)
182
3. Формирование матрицы средних темпов прироста показате лей за период 0 V
e=|KI
(5-29)
4. Построение начального приближения мультипликатора для t = Q
A, = ( l - M * W * V , ) _ 1 . (5.30) Процедура настройки параметров: 1. Определение шага изменения настраиваемых параметров h h = S, где 8 — достаточно малое положительное число. 2. Присвоение начальных значений параметрам ц* = 0 ; а* = 0; ц = -8 «критерию
z(u*,a*)=Q,
где Q — достаточно большое положительное число. 3. Изменение текущего значения fi JJ. = ц + 8 и проверка на выполнение неравенства /л > 1. Если неравенство выполняется, то настройка параметров заверша ется. 4. Присвоение начального значения параметру а а = -8. 5. Изменение текущего значения а а=а +8 и проверка на выполнение неравенства а > 1. Если неравенство выполняется, то выполняется п.З. 6. Установка счетчика t = k- 1 .
7. Присвоение начального значения критерию Z(n, а) = 0. 8. Изменение счетчика t =t +1 и его проверка: если t > Т, то выполняется п. 16. 9. Вычисление постпрогнозной оценки Х
(х > \ 12 (х + Ml = JL ^21 Уг2у V Х*о ) \ ,z) Выполнив умножение, получаем две системы уравнений Х Х
/1
=
Х
/2
=
X
г-11
+
*11 Х П
М2 Х Г2>
(5.35)
r-12
+
*21X,! +V22X,2.
(5.36)
+
Проведя перегруппировку, имеем х
п ~ »и х (1 = х г-п + * 1 2 х, 2 ; х/2 — V 22 x /2 = х,_12 + \21х-гГ
(5.37) (5.38) 187
Решая каждую из этих систем, получаем х„ =(I-V 11 )" 1 (x f _„ + V l 2 x , 2 ) ;
(5.39)
х, 2 =(I-V 2 2 )" 1 (x,_ 1 2 +V 2 1 x f l ).
(5.40)
Первое уравнение определяет значения целевых переменных через запаздывающие значения этих же переменных и ресурсные переменные, а второе — значения ресурсных переменных через их лаговые значения и целевые переменные. С помощью этой модели решаются как бы две взаимодвой ственные задачи. Смысл первой из них в том, что при известных значениях ресурсных показателей определяются значения целевых показателей, т.е. (5.39), по сути, является своеобразным вектор ным аналогом уравнения множественной регрессии. С помощью второго уравнения решается обратная задача: по заданным значе ниям целевых показателей определяются значения ресурсных, обеспечивающих достижение целевых. Следует отметить, что воз можность решения обратной задачи выгодно отличает эту модель от моделей регрессионного анализа, так как расширяет сферу ее прикладного использования. На основе этого математического аппарата можно построить методику, позволяющую сформировать допустимые варианты плана, и тем самым проиллюстрировать возможность переноса идеи альтернативности стратегического выбора в практическую плоскость. Используя все те же данные табл. 5.1 для построения модели с разделенными переменными, положим, что объем оказанных услуг х, и фонд оплаты труда х2 являются целевыми показателя ми, а затраты на переобучение и повышение квалификации пер сонала х3— ресурсными. В соответствии с таким разделением пе ременных матрицу косвенных темпов прироста V2 разобьем на четыре части, из которых для дальнейших расчетов потребуются только две: V„ =
О
0,2755
0,0105
0
0,9669 0,1449
Получив обратную матрицу
Au=(l-Vuyl
(1,0029 0,2763^ 0,0105 1,0029
рассчитаем прогнозные оценки для третьего периода *з = (А'З i >-*32) в зависимости от ожидаемых в этом же периоде затрат на пере обучение и повышение квалификации персонала: М330,68' х 3 - А и |х 2 + V12x33 J — 1039,55 С помощью этой модели можно изучать динамику прогнозных оценок в зависимости от изменения плановых затрат перспектив ного периода. Для случая, когда по заданным значениям целевых показате лей х3' требуется определить уровень ресурсных х 3 , обеспечива ющих достижение заданных значений целевых, модель выглядит следующим образом: x32 = (l-V 2 2 )-'(x2 + V 2 1 x 3 ). Так как в рассматриваемом примере (I-V 22 )=l, то расчеты упрощаются и искомое значение ресурсного показателя равно х\ = 271,02 + (0,0038 0,0151)
'4426,22Л = 303,54. 1036,61
Расчеты показали, что, действительно, с достаточно большой точностью можно решать как прямую задачу по определению зна чений целевых показателей по ресурсным, так и обратную — рас чет уровня ресурсного показателя, требуемого для достижения заданных значений целевых. В разработанной модели с разделенными переменными ис пользуется мультипликатор базовой модели (5.6). Естественно, аналогичная модель может быть получена и с адаптивным матрич ным мультипликатором. Однако мы опускаем отдельное рассмот рение подобной модели, так как ее построение не вызывает осо бых затруднений, если руководствоваться принципами, заложен ными в (5.22)—(5.26). 5.5. Вычислительная схема комбинированных прогнозных расчетов для многомерных процессов Идеи, на основе которых была построена модель пе реходных процессов, позволяющая комбинировать в прогнозных оценках фактографическую и экспертную информацию, могут практически без изменений использоваться при решении задач 189
многомерного прогнозирования. Поэтому логичным продолжением развития идеи комбинированного прогнозирования является созда ние комбинированных моделей для многомерных процессов. Ос новой построения таких моделей может служить адаптивный мат ричный предиктор, различные варианты которого разработаны в предыдущих параграфах настоящей главы. Ниже приводится до статочно подробное алгоритмическое описание построения одно го из вариантов подобной модели. I. Набор данных, имеющихся на момент построения модели 1. Динамика показателей: хи
х12
•••
Х
-^22
'''
X
'"
2\
X
il
l2
х1п, Х
2п'
Х
нГ
2. Ожидаемые темпы роста показателей: вариант 1: qn
qt2
•••
вариант 2 : q\
q]2
••• q]n\
m: q't" q"2
••• q'"x.
вариант
qm;
II. Обозначения 1. Константы: N — число имитационных экспериментов; п — число моделируемых переменных; М — число экспертов; т — число альтернативных вариантов; т — число прогнозных периодов; в — число наблюдений для построения начального значения предиктора; / — число наблюдений, используемых для построения прогноз ной модели. 2. Оцениваемые параметры и величины: Q* — диагональная матрица, диагональными элементами ко торой являются ожидаемые темпы роста показателей по k-му ва рианту (к = 1, т); 190
dp s. — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей изменения абсо лютных приростов /-го показателя (г = 1, /г); d, s — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей ожидаемые значе ния элементов весовой матрицы W; W — матрица весовых коэффициентов w., характеризующих вклад j-ro показателя в прирост /'-го, имеющая вид 1 W =
XV21
Пп
1 В некоторых случаях, когда число прогнозируемых переменных невелико, элементы матрицы W могут быть настраиваемыми. В имитационных экспериментах элементы матрицы W форми руются случайным образом. 3. Настраиваемые параметры: а — параметр адаптации, регулирующий в предикторе соотно шение старых и новых тенденций; а* — оптимальное значение параметра а; ц — параметр, регулирующий комбинирование прямых и кос венных темпов прироста. В предикторе используется матрица М, элементы которой зависят от ц: XVл 2
1-И М=
1-/л 1-/л
1-М 1-М
\-ц
М* — матрица М с оптимальным значением параметра /и*; к — параметр, регулирующий вклад в прогнозную траекторию экстраполяционных тенденций и экспертных ожиданий. В блоч ном предикторе используется диагональная матрица с элементами, зависящими от X: Л О о 2 Л О о Л,
о о
Лг 191
[Л 0
0 • •• 0" Л • • 0
,0
0 •
; АТ =
• к
!лт 0
0 т
• ••
0
я • ••
0
^0
0
•
• ят
4. Случайные величины: й/у — элемент /-й строки y'-го столбца матрицы w v , форми руемый датчиком случайных чисел в V-M имитационном экспери менте; W" — матрица весовых коэффициентов, сформированная из имитируемых датчиком случайных чисел элементов wjj; 5,v+/, — прогнозная ошибка /-го показателя в периоде t+l, ими тируемая датчиком случайных чисел в V-M эксперименте; v,+/,y — элемент /-й строки y'-го столбца матрицы V v , рассчи тываемый по имитируемой случайной ошибке 8^+и в V-M экспе рименте для периода t+l; V" — комбинированная матрица прямых и косвенных темпов прироста, сформированная по имитируемым прогнозным ошиб кам в v-м эксперименте; A v — корректирующая матрица в v-ом имитационном экспе рименте; А^+. — блочный предиктор для расчета вектора прогнозных оценок по всем упреждающим периодам в V-M имитационном экс перименте; Х)'+. — вектор прогнозных оценок для всех упреждающих пе риодов, полученных в v-ом имитационном эксперименте. 5. Процедура моделирования случайной величины: F — процедура моделирования псевдослучайных чисел, имити рующих элементы весовой матрицы; Т — процедура моделирования псевдослучайных чисел, имити рующих прогнозные ошибки. 6. Процедура экспертного оценивания: Е — процедура интерактивного экспертного оценивания веро ятности реализации того или иного прогнозного варианта. 7. Результаты экспертного оценивания: ~Рн-и ~ вероятностная оценка, полученная от r-го эксперта, относительно реальности А:-го варианта /-го показателя для момен та времени / + /; "p,k+li — групповая экспертная оценка относительно реальности k-ro варианта /-го показателя для момента времени t+l; 192
x
t+n ~ усредненное по групповым экспертным оценкам значе ние /-го показателя для момента времени / + /; ~х,+и — наиболее вероятное значение /-го показателя для мо мента времени по результатам экспертного опроса. 8. Моделируемые переменные и величины: x,i — значение /-го показателя в момент времени /; х н — расчетное значение /-го показателя в момент времени /; x t+u ~ расчетное значение /-го показателя по к-му варианту в момент времени / + / (с целью упрощения алгоритма для каж дого / задается фиктивный вариант х,'"!1, принимающий макси мально возможное значение); X, =(хп, х,2, •••, х,„) — вектор-столбец из значений моделиру емых показателей в момент времени t, х, — вектор расчетных значений моделируемых показателей для момента времени t, X, =(х,,х,,...,х,) — вектор-столбец с компонентами из одина ковых вектор-столбцов хг; X =(х+1, x, + ,,...,x, +r ) ~~ вектор-столбец с компонентами из вектор-столбцов прогнозных значений моделируемых показателей; Х^+. =(х^+|,х^+2,...,х^+г) — вектор-столбец значений комбини рованной прогнозной траектории для моментов времени / + 1, / + 2,
•••'r Zт; Mt+u — индикаторная переменная, принимающая значение О или 1 в зависимости от результата сравнения полученной величи ны /-го показателя в v-м эксперименте для периода / + 1 с соот ветствующим к-м вариантом; Ае — начальное значение предиктора; Ve — начальное значение комбинированной матрицы прямых и косвенных темпов прироста; V,+. — корректирующая матрица прямых и косвенных темпов прироста для моментов времени t + \, t + 2, , t + г, Vt+uj ~ элемент /-й строки у'-го столбца матрицы V,+., опре деляемый по отклонениям постпрогнозных расчетов от фактичес ких значений для периода / + 1; Z(a, /л) — критерий настройки параметров адаптации а и fi. А^ + . _ скорректированное на прогнозные ошибки значение предиктора для моментов времени в + 1, в + 2, ..., в + г, 193
A r + . — корректирующая матрица для моментов времени t + 1, Г +2,..., t + г, А , + . — предиктор для моментов времени / + 1, / + 2, ..., t+ г, рк и — вероятность реальности значения /-го показателя по к-му варианту в момент времени t + 1; А ? + . — предиктор комбинированной модели для моментов вре мени t + 1, t + 2, ..., t + т . III. Вычислительная схема 1. Расчет альтернативных вариантов: ( S-J
\
(глк
хк
Q,
о
О
О
Q*Q*
О
V х Л
k = l,m.
(5.41)
Qk \х>; 2. Построение начального значения предиктора: О
••• Qk
0
ч>; 0-1
Д*/ =
v
y
,
/ = 1, п;
(5.42)
i, j = l,n;
(5.43) (5.44)
v0 = Ae = ( l - M * W * V e )-l
(5.45) 3. Настройка параметров предиктора по постпрогнозным расче там: fх
\
(к О
J+2
О
О Vx, >
2
А
е
(5.46) О _ хе+« )+/;/
-*•'е+к
%+/i 194
О
,
Ag j ухв ;
/, j = 1, п,
I = 1, т ;
(5.47)
ve+.=
(5.48)
e+lij\
A0+. = ( l - M * W * V 0 + . ) - 1 ;
A-£+.=a*Ae+.+(l-a%+.A
(5.49) (5.50)
e+.
- A ad
A
(5.51) (5.52)
X 0+ . - A 0+# X 0 ; Z(a, fi) = max -%+//
-^fl+Zi
v
a
/ = 1, n,
/ = 1, т;
(5.53)
e+«
= Argmin Z(a, /i);
(5.54)
v^ , V, + .=
'f+fty
(5.55) (5.56)
A, + . = a*A 0 + . + (l - a* )&, + .A e+ .
(5.57) (5.58)
4. Имитационные расчеты: (5.59) (5.60) 1, если i = j ;
Щ
w-j / w\, если i * j ;
(5.61)
ГУ
-V
(5.62) (5.63) 195
't+li
~v V,t+lij
i, j = l,n, Vv =
I = 1, т ;
(5.64) (5.65)
/+///•
(5.66)
AV=&-M**WV,*VV)"1;
Al.=a*A„.+(l-a*)kvAt+.;
(5.67) (5.68)
X;+. = A,+.X,, J0, если х^+1 < xt+l, •
к
„ -v
^
k+\
k = l,m',
(5.69)
[l, если x,+l < x,+i < *, + i ,
#,; = ЛГ1 £й# й
(5.70)
v=\
5. Экспертное оценивание
P = E(X, 1
(5.71)
P); M
~k 1 v ~kr Pt+u = 7 7 L, Л + ~
_ Д ~*
(5.72)
.*
(5.73)
2-iPr+uxt+ii;
-*?+//
(5.74) 6. Расчет значений комбинированной прогнозной траектории ш (5.75)
Хг+. = А,+.Х,, _
x
t+li
~~
"/+/// */ +//
x
i+li
'
V;+.=
i, j = l,n,
l = 1, т ;
-f+/
(5.76) (5.77) (5.78)
A, c + . = Л А Г + . + (I - Л ) А , + . А , + # ; 196
(5.79)
Х г с + .=А, С + .Х Г
(5.80)
IV. Описание вычислительной схемы модели Вычислительная схема модели представляет собой систему ин формационно связанных между собой расчетных блоков. В пер вом из них осуществляется расчет альтернативных вариантов мо делируемых показателей в соответствии с ожидаемыми темпами роста этих показателей, задаваемых матрицей со специально уст роенной блочной структурой диагонали. В следующем блоке оп ределяется начальное значение предиктора по средним темпам прироста каждого показателя. Для этого используется известная схема построения комбинированной матрицы прямых и косвенных темпов прироста. Для удобства в расчетную формулу предиктора введена операция блочного умножения. Далее с помощью полученного начального значения строится блочный предиктор, позволяющий осуществлять прогнозные рас четы сразу на несколько периодов. Путем последовательных кор ректировок и одновременного соответствующего подбора парамет ров адаптации он трансформируется в текущий предиктор с оп тимальными параметрами. Текущий предиктор используется в блоке имитационных расче тов, в котором с помощью датчика случайных чисел получают матрицу весовых коэффициентов и комбинированную матрицу прямых и косвенных темпов прироста. Полученные матрицы ис пользуются для построения корректирующей матрицы, которая, в свою очередь, применяется для корректировки текущего предик тора. Скорректированный предиктор, по сути, является случай ным оператором, имитирующим одну из возможных многомерных траекторий развития моделируемых процессов. Многократное об ращение к датчикам случайных чисел позволяет воссоздать доста точно полную картину будущего. Сравнение имитируемых вари антов с альтернативными обеспечивает построение вероятностного распределения, характеризующего степень реальности альтернатив ных вариантов. Именно это вероятностное распределение и явля ется основным результатом комплекса расчетов этого блока, ко торый затем подлежит экспертному оцениванию. В целом, блок экспертного оценивания предназначен для формирования оценок, отражающих экспертное представление о будущей динамике моделируемых показателей. Ориентиром экс пертных ожиданий является эмпирическое вероятностное распре197
деление, полученное в четвертом блоке. Строгих формальных правил получения экспертных ожиданий моделью не предусматри вается. Возможен, например, интерактивный режим формирова ния экспертных оценок. Последний блок вычислительной схемы реализует главный за мысел модели — комбинирование на принципах адаптации экстраполяционных оценок и экспертных ожиданий. Ниже приводятся результаты вычислительного эксперимента, иллюстрирующие весь комплекс расчетов, предусмотренных этой моделью. В расчетах использовались фактические данные, харак теризующие экономическое развитие Воронежской области. С целью упрощения для более легкого восприятия логики расчетов в соответствии с вычислительной схемой комбинированной моде ли прогнозирования многомерных процессов из всех макроэконо мических показателей были выбраны только три — валовой регио нальный продукт (ВРП), продукция промышленности и продук ция сельского хозяйства, динамика которых приведена в табл. 5.3. Для проведения расчетов были сформированы три альтернатив ных варианта возможного развития Воронежской области в бли жайшие два года (2003—2004 гг.). Учитывая, что исходные дан ные содержат инфляционную составляющую (вариант I — 14 %, вариант II — 15 %, вариант III — 16 %), в эти варианты были внесены поправки на ожидаемые уровни инфляции. При разра ботке вариантов для упрощения расчетов принято допущение, что темпы роста и темпы инфляции остаются неизменными на про тяжении 2003—2004 гг. В табл. 5.4 представлены данные о трех вариантах возможной динамики макроэкономических показателей. Т а б л и ц а 5.3 Основные макроэкономические показатели экономического развития Воронежской области (1995-1997 гг. - млрд р., 1998-2002 гг. - млн р.) Годы
Валовой региональный продукт
1 1995 1996 1997 1998 1999
2 14 547,90 20 158,30 23393,10 24075,00 40 710,10
198
Продукция промышленности сельского хозяйства 4 3 4118,80 9598,00 5731,00 12 909,00 6902,70 15 384,70 6783,80 14 653,30 15 500,00 24 237,10
Окончание 2 52 100,40 63 866,90 75284,00
1 2000 2001 2002
3 33151,50 41 623,90 51 573,10
т а б л . 5.3 4 18 247,20 22 300,20 25443,70
Т а б л и ц а 5.4 Альтернативные варианты экономического развития Воронежской области Валовой региональный продукт № Годы варианта Значение, Темп млн р. роста, % 118,0 I 88 827,59 90 997,28 119,4 2003 11 III 89 909,29 120,9 I 104 807,68 139,2 109 990,23 142,6 2004 II 107 375,81 146,1 III
Продукция промышленности сельского хозяйства Значение, Темп Значение, Темп млн р. роста, % млн р. роста, % 60 439,55 117.2 117,4 29 875,99 119,0 62 277,61 30 400,13 118,5 61 354,02 120,8 30 138,06 119,5 70 830,31 137,3 35080,39 137,9 141,5 75203,95 36 322,08 140,3 145,8 72 989,90 35698,54 142,8
Динамические ряды исходных данных были разделены на две части: первые пять наблюдений были использованы для построе ния начального значения адаптивного матричного предиктора, а три последних — для его обучения (настройки параметра адапта ции) по постпрогнозным расчетам. В рамках процедуры постро ения начального значения рассчитывались средние приросты (5.42) показателей за 1995—1999 гг., которые использовались при фор мировании комбинированной матрицы прямых и косвенных тем пов прироста (5.43)—(5.44) '0,1607 0,2699 0,4220^ Vfl = 0,0899 0,1510 0,2361 0,0699 0,1174 0,1836
М
1 0,3 0,7 '0,15 0,85 0,85^ 0,85 0,15 0,85 W = 0,7 1 0,3 0,85 0,85 0,15 0,7 0,3 1
С помощью этих матриц было получено начальное значение предиктора (5.45) 199
0,0478 0,0776 0,2616 0,0570 1,0371 0,0750 0,0442 0,0335 1,0509 Так как прогнозные значения рассчитываются на два упрежда ющих периода, то был построен блочный мультипликатор (5.46) '1,0478 0,0776 0,2616 0,0570 1,0371 0,0750 0,0442 0,0335 1,0509 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 1,1139 0,1705 0,5549 0,1221 1,0826 0,1715 0,0948 0,0734 1,1185
для которого в процессе обучения настраивались параметры /л и а. За два шага постпрогнозных расчетов по критерию минимизации максимальной относительной прогнозной ошибки были получены оптимальные значения параметров /л* = 0,20, а* = 0,15 и настро енный по этим параметрам матричный предиктор 0,0182 ^ 0,0097 < 1,0565 0,0883 0,2815 0,0073 0,0141 0,0678 1,0557 0,1035 0,0106 0,0267 0,0430 0,0317 1,0472 -0,0012 -0,0016 -0,0029 0,0074 0,0110 0,0197 1,1220 0,1805 0,5726 0,0216 0,0311 0,0576 1,1445 1,1165 0,2274 -0,0068-0,0096-0,0182 0,0874 0,0641 1,0967 с помощью которого были рассчитаны прогнозные оценки мак роэкономических показателей на 2003—2004 гг. г
•Л, , . —
92771,64 Л 64383,77 31280,51 109973,80 78944,99 36319,26
Настроенный предиктор и прогнозные оценки использовались в 700 имитационных экспериментах, в результате которых были 200
получены оценки вероятностей возможной реализации каждого из рассматриваемых альтернативных вариантов. Обработанные ими тационные расчеты были сведены в табл. 5.5. Т а б л и ц а 5.5 Экстраполяционные прогнозные оценки, требующие экспертного уточ Валовой № Значе ва ние / продукт, млн р. ри Вероят Расчетная Оценка анта ность оценка эксперта Значе 88 827,59 ние I Вероят 0,10 ность Значе 89 909,29 ние 2003 II Вероят 0,10 ность Значе 90 997,28 ние III Вероят 0,67 ность Значе 104 807,68 ние I Вероят 0,16 ность Значе 107 375,81 ние 2004 II Вероят 0,17 ность Значе 109 990,23 ние III Вероят 0,57 ность
Продукция, млн р. промышленности сельского хозяйства Расчетная Оценка Расчетная Оценка оценка эксперта оценка эксперта 60 439,55
29 875,99
0,09
0,01
61 354,02
30 138,06
0,11
0,07
62 277,61
30 400,13
0,80
0,73
70 830,31
35080,39
0,04
0,13
72 989,90
35698,54
0,11
0,20
75203,95
36 322,08
0,84
0,36
В левой колонке каждого показателя этой таблицы приведены значения по вариантам и оценки вероятностей возможной реали зации соответствующих вариантов. Правая колонка заполняется экспертами. Причем экспертам разрешается, ориентируясь на соб ственное видение ситуации, изменять либо только вероятностные оценки, либо пытаться предсказать и значения, и их вероятнос ти. В случае компьютерной реализации процедуры экспертного оценивания следует предусмотреть интерактивный режим функци онирования этой модели. 201
В проводимом вычислительном эксперименте приняли участие 7 экспертов. Результаты обработки экспертной информации све дены в табл. 5.6 и 5.7 по периодам. Т а б л и ц а 5.6 Результаты обработки экспертной информации (2003 г.) Валовой Эксперт
1 2 3 4 5 6 7 Групповая оценка
продукт, млн р. усреднен наиболее ный вероятный 76 267,29 76 422,90 72 059,00 71 927,43 73628,82 73 725,62 80 978,07 80 918,36 78 704,37 79 167,63 90 323,67 90 997,28 78 930,46 79 120,17
Продукция, млн р. промышленности наиболее вероятная 53991,53 55218,61 57 059,24 52 150,91 54 605,07 59 163,73 58 540,96
усреднен ная 53855,93 55320,09 56 941,44 53047,18 54 639,34 58 717,20 57 952,14
сельского усреднен ная 27 100,67 25961,56 29 792,58 30 093,51 26 939,18 26 177,92 26 660,92
78 698,81 78897,05 55 781,90 55 818,58 27532,33
хозяйства наиболее вероятная 27 124,26 25 918,73 29 836,68 30 138,06 27 784,67 25 315,97 25 536,11 27379,21
Т а б л и ц а 5.7 Результаты обработки экспертной информации (2004 г.) Валовой Эксперт
1 2 3 4 5 6 7 Групповая оценка
Продукция, млн р. промышленности
сельского хозяйства
продукт, млн р. усреднен наиболее ный вероятный 94 385,86 94490,71 93699,16 93416,95 97 295,54 97 711,98 91 564,23 91 269,43 96 686,29 97 891,30 119 400,47 109 990,23 98 341,52 98 785,74
усреднен ная 64 778,50 66 813,04 68 250,74 62 594,96 66 115,74 71 879,30 70 020,72
наиболее вероятная 64 961,01 66 420,81 68 610,50 62 771,31 65690,91 72 947,84 71 443,76
98 767,58 97650,91
67207,57
67549,45 33 220,75 33309,87
усреднен ная 32 872,58 31 525,31 35606,46 34 912,93 32 588,54 34 546,57 30 492,89
наиболее вероятная 32 842,65 31414,71 35 698,54 34 984,56 32 485,67 34 869,20 30 873,77
Групповые экспертные оценки в качестве экспертных ожиданий использовались для перенастройки адаптивного предиктора на 202
режим комбинированного прогнозирования. Перенастройка осу ществлялась с помощью диагональной матрицы, значения элемен тов которой определялись параметром Я. В расчетах этот параметр был принят равным 0,08, т.е.
Л=
,80 0 0 0 0 0 0 0,80 0 0 0 0 0 0 0 0 0,80 0 0 0 0 0,64 0 0 0 0 0 0 0,64 0 0 0 0 0 0 0,64 )
Таким образом, предиктор для расчета комбинированной тра ектории (5.79) с тенденцией усредненной точки зрения экспертов выглядел следующим образом:
,cl
/"1,0307 0,0330 0,0170 0,0492 0,0406 0,0130
0,0754 1,0374 0,0273 0,0787 0,0651 0,0208
0,1408 0,0981 1,0303 0,1409 0,1163 0,0373
0,0202 0,0171 0,0060 1,0590 0,0623 0,0321
0,0315 0,0266 0,0092 0,1437 1,0683 0,0510
0,0577Л 0,0487 0,0172 0,2726 0,1854 1,0561
а с тенденцией наиболее вероятных значений среди ожидаемых f
,с2
1,0308 0,0756 0,1410 0,0202 0,0316 0,0580Л 0,0330 1,0374 0,0981 0,0170 0,0266 0,0488 0,0170 0,0482 0,0409 0,0131
0,0271 0,0773 0,0656 0,0209
1,0301 0,0059 0,0091 0,0170 0,1380 1,0582 0,1425 0,2703 0,1171 0,0625 1,0687 0,1862 0,0375 0,0322 0,0511 1,0563
С помощью этих предикторов были получены следующие ком бинированные прогнозные траектории (5.80):
203
^89717,81 N 62382,09 62374,81 30231,16 30261,59 гс2 X cl 105022,27 ' 105421,56 74000,95 73878,70 34955,79 34923,93 ) Комбинированные траектории X,cj. и Х,с+. существенно отлича ются от экстраполяционной траектории Х, +# : темпы роста последней значительно выше. На наш взгляд, это связано с тем, что эксперты в своих ожиданиях ориентировались на снижение темпов роста ин фляции, в то время как в экстраполяционных прогнозах нашли свое отражение темпы инфляции последних периодов. В этом отличии и заключается суть комбинированного прогнозирования, позволя ющего в прогнозных оценках учесть те тенденции, которые еще не успели проявиться в экономической действительности. 8УО/ЙДЭ
5.6. Многоуровневое комбинированное прогнозирование основных показателей социально-экономического развития региона Разработанные в предыдущих параграфах схемы много мерных прогнозных расчетов вполне применимы для решения реаль ных задач достаточно большого размера. К классу подобных задач следует отнести, прежде всего, разработку прогнозов социальноэкономического развития региона. Число разнообразных показате лей, ожидаемые значения которых необходимо рассчитать при реше нии этой задачи, столь велико, что попытка построения единой прогнозной модели, отражающей взаимодействие между всеми этими показателями, вряд ли окажется успешной. На наш взгляд, в по добной ситуации целесообразнее использовать многоэтапную схему проведения многоуровневых прогнозных расчетов. В рамках такой схемы удается сгруппировать показатели по какому-либо признаку (сектор экономики, отрасль, источник доходов и т.д.), что позво ляет значительно снизить размерность решаемой задачи посредством сведения ее к последовательности задач меньших размеров. Каждая так определенная группа характеризуется соответству ющим агрегированным показателем, являющимся, как правило, суммой всех показателей, включенных в группу. Из практики 204
прогнозных расчетов известно, что динамика агрегированных по казателей менее подвержена случайным колебаниям, и, следова тельно, их прогнозные оценки являются более надежными, чем прогнозные оценки дезагрегированных показателей. Эти рассуждения приводят к выводу, определяющему последо вательность расчетов "сверху вниз", т.е. вначале получают прогноз ные оценки агрегированных показателей, которые затем использу ются для получения прогнозных оценок показателей 1-го уровня дезагрегирования, используемые, в свою очередь, для получения прогнозных оценок показателей 2-го уровня дезагрегирования, и т.д. Прогнозные расчеты социально-экономического развития Во ронежской области проводились в соответствии со структуризаци ей показателей, представленной в приложении 1. Такой подход обеспечивает более высокую точность прогнозных расчетов и, кроме того, позволяет учесть структурную взаимосвязь между моделиру емыми показателями, а также всю априорную информацию, извест ную к моменту начала процесса прогнозирования. Необходимые для построения моделей и проведения прогноз ных расчетов количественные значения показателей представлены в приложении 2. Общая схема разработки прогноза развития региона, учитыва ющая общую концепцию и все изложенные в этом параграфе обстоятельства, изображена на рис. 5.1. В ней отражено совме стное действие правовой, методической, математической и ин формационной составляющих разработки прогноза агрегированных показателей, генерирующего последовательно уточняющийся про цесс обоснования социально-экономической политики региона. Для формализованного описания многоуровневой системы рас четов введем следующие обозначения: X = (х', X2, , X'") ~~ вектор-столбец значений агрегирован ных показателей в момент времени /; т — число агрегированных показателей; X.'=\Х'1 X'2 X""', X' ) ~~~ вектор-столбец значений показа телей 1-го уровня дезагрегирования /-го агрегированного показа теля (/ = 1,т), причем последняя компонента ITlj
представляет собой величину соответствующего агрегированного показателя; 205
о ON
Обоснование социально-экономической политики региона
Информация Рис. 5.1. Общая схема разработки прогнозов социально-экономического развития региона
от,— число показателей 1-го уровня дезагрегирования /-го аг регированного показателя; , X'J' =(xijl X'j2,..., X'1"'', Х у ) — вектор-столбец значений по казателей 2-го уровня дезагрегирования у-го показателя, дезагре гированного на 1-м уровне (/ = 1, т, j = l,m-), причем последняя компонента '"; ...
представляет собой величину соответствующего показателя преды дущего уровня; от — число показателей 2-го уровня дезагрегирования /-го по казателя, дезагрегированного на 1-м уровне. Используя введенные обозначения, запишем многоуровневую модель с матричным мулыпипшкатором для прогнозирования основ ных показателей социально-экономического развития региона в следующем виде: Х,+, = ( I - V ) - % ;
(5.81)
x;+1 = (i-v,'ir(xi+v;2xj+1);
(5.82)
Х^4-^Г(Х?+^Х^),
(5.83)
где V — матрица косвенных темпов прироста прогнозируемых по казателей; "V Vp — соответствующие блоки матрицы косвенных темпов прироста показателей /-Й группы 1-го уровня дезагрегиро вания; V,"p V^ — соответствующие блоки матрицы косвенных тем пов прироста показателей у'-й группы 2-го уровня дезагрегирования /-го показателя предыдущего уровня; X — вектор прогнозных оценок агрегированных показателей; XJ+I — вектор прогнозных оце нок показателей /-Й группы 1-го уровня дезагрегирования; XJ'+I — вектор прогнозных оценок показателей у'-й группы 2-го уровня дез агрегирования i-ro показателя предыдущего уровня. С помощью модели (5.81)—(5.83) удается решить несколько проблем, возникающих в практических расчетах. Во-первых, как ранее неоднократно упоминалось, она повышает надежность про гнозов, осуществляемых по коротким временным рядам. Во-вто рых, она обеспечивает взаимосвязь между прогнозными оценка ми, получаемыми на разных уровнях. Причем механизм этой взаимосвязи устроен таким образом, что в расчетах каждого 207
последующего уровня в качестве ограничивающих условий (ресурс ных показателей) используются прогнозные оценки, полученные на предыдущем уровне. Это гарантирует некую сбалансирован ность темпов роста агрегированных и дезагрегированных показате лей. В-третьих, расчеты по рассматриваемой модели легко моди фицируются, обеспечивая более точную подгонку матричного пре диктора к фактическим данным, а значит — и более точные прогнозные оценки. Вопросы модификации расчетов, несмотря на свою важность, до сих пор не были исследованы, так как они непосредственно связаны с прикладными аспектами прогнозирования, к рассмот рению которых мы приступили только в этом параграфе. При проведении прогнозных расчетов показателей социально-экономи ческого развития Воронежской области сразу же был обнаружен ряд негативных моментов, таких как резкая смена типов роста показателей, несоразмерность показателей, принадлежащих одной группе, и др. Это потребовало применения специальных при емов, ориентированных на устранение подобных "пороков" в фактических данных. Так, в случае резкой смены характера роста показателей при менялась процедура экспоненциального сглаживания с обратным порядком взвешивания данных. В соответствии с этой процеду рой временной ряд Хх, Х2,..., Хп преобразуется в сглаженный ряд Х1,Х2,...,Хп следующим образом: Xn_x=aXn_x+{l-a)Xn; Хя-2=аХ„_2
Х1
+ (1-а)Ха_1;
(5.84)
=aXl+(l-a)Xr
где а — настраиваемый по постпрогнозным расчетам параметр (О < а < 1). Для тех случаев, когда наблюдалась несоразмерность показате лей, принадлежащих одной группе, например, когда одни пока затели измерены в сотнях единиц, а другие — в сотнях тысяч тех же самых единиц, применялась процедура кумулятивного пред ставления многомерного процесса. Формализация этой процеду ры следующая:
х: = х;-, 208
А,
— А,
(5.85)
i A.. ?
х? = х,'""1 + х; В качестве первого (который остается без изменений) в этой процедуре рекомендуется использовать максимальный по величи не показатель. Применение кумулятивного представления данных после получения прогнозных оценок Х], Х2,...,Х'" предполагает обратное преобразование
х! = хУ-. (5.86)
х}=х}-х}\ Y'" = У'" — У'"
В более сложных случаях можно комбинировать рассмотренные приемы обработки данных. Частота использования этих приемов в прогнозных расчетах основных показателей социально-экономи ческого развития Воронежской области отражена в табл. 5.8. Т а б л и ц а 5.8 Использование процедур предварительной обработки данных Показатели Агрегированные ВРП Выпуск товаров и услуг Промышленная продукция Продукция сельского хозяйства Объем инвестиций Доходы области Доходы населения Расходы населения
Процедура экспонен Процедура кумулятив циального сглаживания ного представления
+ +
+
+ + +
+ +
-
Прогнозные расчеты проводились с использованием вышеопи санной модели (5.81)—(5.83), вычисления по которой осуществ лялись в соответствии с многоуровневым вариантом схемы преды дущего параграфа. Детальное описание этого варианта приводится ниже. 209
7. Набор данных, имеющихся на момент построения модели 1. Динамика показателей: 1
21
42
Мл„'
v
1
22
2я„>
агрегированные показатели: к
а
л
\\
х
2\
Л
\2
ч«,-
22
*-2л/••
V2
v
х
показатели 1-го уровня дезагрегирования:
xiJ x'J •
21
m,- >
х'у • • х? ; x'J л 22
•
•4;
x'J л /2
•
• х'7 •
показатели 2-го уровня дезагрегирования
2V
2. Ожидаемые темпы роста показателей: к к к к-я вариант для агрегированных показателей: qn qt2 • • • qm ; k-ik вариант для показателей /-й группы 1-го уровня дезагреги рования: q% qf2 ••• q\ln. ; к-й вариант для показателей у'-й подгруппы /-Й группы 2-го уровня дезагрегирования: qt'J qt'^ ••• gj 7 . ; Q*— диагональная матрица, диагональными элементами кото рой являются ожидаемые темпы роста показателей по к-му вари анту (к = 1, т). II. Обозначения 1. Константы и переменные: N — число имитационных экспериментов; п — число моделируемых переменных; п а ~ число моделируемых агрегированных переменных; ni — число моделируемых переменных /-й группы 1-го уровня дезагрегирования; Чу — число моделируемых переменных /-й группы у'-й подфуппы 2-го уровня дезафегирования; 210
М — число экспертов; т — число альтернативных вариантов; т — число прогнозных периодов; в — число наблюдений для построения начального значения предиктора; t — число наблюдений, используемых для построения прогноз ной модели; qt — среднегодовой ожидаемый темп роста /-го показателя, применяемый для настройки параметров адаптации прогнозной модели; q" — среднегодовой ожидаемый темп роста /-го агрегированно го показателя, используемый для настройки параметров адаптации прогнозной модели; qif, — среднегодовой ожидаемый темп роста дезагрегированно го /-го показателя g-й группы на 1-м уровне (необходим для на стройки параметров адаптации прогнозной модели); q. — среднегодовой ожидаемый темп роста дезагрегированно го /-го показателя g-й группы на 2-м уровне (используется для на стройки параметров адаптации прогнозной модели). 2. Оцениваемые параметры и величины: dj, Sj — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей изменения абсо лютных приростов /-го показателя (/ = 1, «); d, s — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей ожидаемые значе ния элементов весовой матрицы W; W — матрица весовых коэффициентов и>.., характеризующих вклад у'-го показателя в прирост /-го, имеющая вид:
W W
=
••• w,„N
1
wn
21
1
•••
Win
W„2
•••
1
4 W„i
t
В некоторых случаях, когда число прогнозируемых переменных невелико, элементы матрицы W могут быть настраиваемыми. В имитационных экспериментах элементы матрицы W форми руются случайным образом. 211
3. Настраиваемые параметры: а — параметр адаптации, регулирующий в предикторе соотно шение старых и новых тенденций; а — оптимальное значение параметра а; у. — параметр, регулирующий комбинирование в предикторе прямых и косвенных темпов прироста. При построении предик тора используется матрица М, элементы которой зависят от ц: 1-J" М=
Ц
1 - jl
1 —А*
1- ц I- ц М* — матрица М с оптимальным значением параметра //*; Я — параметр, регулирующий вклад в прогнозную траекторию экстраполяционных тенденций и экспертных ожиданий. В блоч ном предикторе используется диагональная матрица Л с элемен тами, зависящими от Я:
Лт =
где
'я о о я Л=
о
'Л о
о л2
о
о
лт =
о о v
0^
о
ят о о я2
о о
о
я2
о
4. Случайные величины: wjj — элемент /-й строки у'-го столбца матрицы Wv, формиру емый датчиком случайных чисел в v-м имитационном эксперименте; Wv— матрица весовых коэффициентов, сформированная из имитируемых датчиком случайных чисел элементов Щ; Sf+Ii— прогнозная ошибка /-го показателя в периоде t+l, ими тируемая датчиком случайных чисел в v-м эксперименте; 212
Vt+uj ~ элемент /-й строки у'-го столбца матрицы \ v , рассчи тываемый по имитируемой случайной ошибке 5,v+/, в V-M экспери менте для периода t + /; у1'— комбинированная матрица прямых и косвенных темпов прироста, сформированная по имитируемым прогнозным ошиб кам в V-M эксперименте; \v— корректирующий мультипликатор в V-M имитационном эксперименте; Avt+,— блочно-диагональный мультипликатор для расчета век тора прогнозных оценок по всем упреждающим периодам в V-M имитационном эксперименте; Xv+#— вектор прогнозных оценок для всех упреждающих пери одов, полученных в V-M имитационном эксперименте. 5. Процедура моделирования случайной величины: F — процедура моделирования псевдослучайных чисел, имити рующих элементы весовой матрицы; Ц1 — процедура моделирования псевдослучайных чисел, имити рующих прогнозные ошибки. 6. Процедура экспертного оценивания: Е — процедура интерактивного экспертного оценивания веро ятности реализации того или иного прогнозного варианта. 7. Результаты экспертного оценивания: р*+/(- — вероятностная оценка, полученная от г-ю эксперта, от носительно реальности k-го варианта /-го показателя для момен та времени / + /; р*+/. — групповая экспертная оценка относительно реальности А:-го варианта /-го показателя для момента времени / + /; xt+li — усредненное по групповым экспертным оценкам значе ние /-го показателя для момента времени t + I; x*+li — наиболее вероятное значение /-го показателя для момен та времени / + / по результатам экспертного опроса. 8. Моделируемые переменные и величины: хи — значение /-го показателя в момент времени Г, хп— расчетное значение /-го показателя в момент времени Г, xf+li— значение /-го показателя к-го альтернативного варианта в момент времени / + / (с целью упрощения алгоритма для каж дого / задается фиктивный вариант .?,'"!', принимающий макси мально возможное значение); 213
x, = (xn,xr2,.--,xm) — вектор-столбец из значений моделиру емых показателей в момент времени Г, х,— вектор расчетных (прогнозных) значений моделируемых показателей для момрнта времени t, X, = (х,, х,,..., х,) — вектор-столбец с компонентами из одина ковых вектор-столбцов х,; Х, + . = (х,+1, х + 2 ,..., х + ) ~~ вектор-столбец с компонентами из вектор-столбцов прогнозных значений моделируемых показателей; Х^+. = (х^+1, х, с +2 ,..., xrc+ J — вектор-столбец значений комбини рованной прогнозной траектории для моментов времени t+ 1, t + 2, ... , t +т; со^ц — индикаторная переменная, принимающая значение О или 1 в зависимости от результата сравнения полученной величи ны /-го показателя в v-м эксперименте для периода t + I с соот ветствующим к-м вариантом; Ад — начальное значение матричного предиктора; Ve — начальное значение комбинированной матрицы прямых и косвенных темпов прироста; Vy — элемент /-й строки у'-го столбца матрицы Ve ; V,+,— корректирующая матрица прямых и косвенных темпов прироста для моментов времени t + 1, t + 2, ... , t + т; vt+lij— элемент /-й строки у-го столбца матрицы V, + ., опреде ляемый по отклонениям постпрогнозных расчетов от фактических значений для периода / + /; Z(a, fi) — критерий настройки параметров адаптации а и ц. Ag+/ (a, /i) — скорректированное на прогнозные ошибки зна чение предиктора для момента времени 9+1; А!+,— корректирующая матрица для моментов времени t + 1, t+2, ..., t + т; А, — предиктор для моментов времени г, Plk+lj — вероятность реальности значения /-го показателя по к-му варианту в момент времени / + /; А^+. — предиктор комбинированной модели для моментов вре мени t + 1, t + 2, ..., t + г. III. Инициализация глобальных констант t = 3, т = 3, в = 2; т = 5, М = 11; N = 700. 214
IV. Вычислительная схема прогнозирования агрегированных пока зателей 1. Инициализация локальных констант: п = 6; 4i = Ч°Диагональная матрица ожидаемых темпов роста афегированных показателей по £-му варианту: ( к Чл
о
Qf = ч
0
-
qkM
2. Расчет альтернативных вариантов: 0
'Qf Х
,+2
X*
+3
0
=
(Q*)
^0
2
0
^ ГО
0
х
,
3
0
(Qf) ^ Л ,
, к=\,т. к=
1 ' начального ) 3. Построение значения предиктора: М = 0,5; Wy =
•/ = 1, "Г, / = 1, л ;
(5.118)
(5.119)
*=1
х/ +;; = Argmax{p*+/I.(x,+li = х"+н)}, / = 1, л, / = 1, т . (5.120) к 1. Расчет значений комбинированной прогнозной траектории: Х,+.=А,+.Х,; v
,+nj
, / , 7 = 1, л , Z = l , r ;
=
(5.121) (5Л22)
X
t+lj
V / + . =|v?7' , и
= 1,л, Z = 1 , T ;
(5.123)
A, + . = (l„x„ - I r x r (M* * W) * \r+. У;
(5-124) 217
А,с+. = ЛА, + . + (l(
(5.125)
_ 1С X?С + .=A= + .X,.
(5.126)
V. Вычислительная схема прогнозирования показателей i-й груп пы 1-го уровня дезагрегирования 1. Инициализация локальных констант: п1 = 5, «2 = 7, я3 = 13, «4 = 4, я5 = 3, я6 = 8; п = я ; , / = 1, 6;
V >' . . Диагональная матрица ожидаемых темпов роста показателей /-й группы 1-го уровня дезагрегирования по k-му варианту: (
ki
О
Ял
Q,* = О
2. Расчет альтернативных вариантов в соответствии с (3.7) 3. Построение начального значения предиктора: М = 0,5; (5.127) Wy =
1,
если i = j 1 /(п - 1), если i Ф j ' hj-hn д
_
Х
X
в\
U
v
+
'j
Y
Уя =
; _ 1 „ i 1
' /, 7 = 1 , « + 1 ;
, /, у = 1, п +1;
В й = М * W * Уа "в /'•all
вб =
Вв21
+ l;
(5.128) (5.129)
(5.130) (5.131) (5.132)
Т>12\ т>2: а
в
(5.133)
Ав = ( l - M * W * V e ) ~ l . (5.134) 4. Адаптивное преобразование предиктора и настройка его пара метров: а = 0,1; (5.135)
хе+1 = (1-ву) ч (х е +в^ е+ ,.„ + .); x
e+i.n+\ ~ V* ~ "в _ хв+и
-
) \хв,п+\
+
"в
x
e+i)'
(5.136) (5.137)
х
в+и /, j = l, л + i;
3+1(/ V
(5.138)
e+U
_ V'e+i vfl 1 > i, j = I, n + 1', flJ , = H^e+iy
(5.139)
A e+1 =(i-M*w*v e+1 )"';
(5.140)
Ae+i(a,^) = aA 0 +(l-a)A 0+1 A 0 ;
(5.141)
Be+,(a, M) = I - (Ae+,(a, //))"'; * 9 + 2 = (i - ВУ + ,(a, A*))"1 (x9+1 + B £ , ( a , / i ) i e + M + 1 ) ; v
Z ( a , ^ ) = max
e+2/
^0+1;
( a *\ ^
, / = l, n;
(5.142) (5.143) (5.144)
(5.145)
= ArgminZ(a, /u)',
у
5. Имитационные расчеты (v =1, N)'-
w£=F(rf, Д . /, 7 = 1, n + l, щ - X w)/.г' ;' = l и +1;
i*j;
(5.146) (5.147)
(l, если / = /';
w,'r = 1 'У [wy /wj,
WV
~V
(5.148) если i Ф j ; •
•
1
, 1 .
= hvtj > i, j =1, n + 1,
(5.149) 219
^ ^ Y ^ . ^ X , 1 = 1,/1 + 1; 8;+ll=5'+i'~°'5,i 1,5
(5.150)
= ln^l;
(5.151)
Х
;А+П ' 'J ~ ., п ... я* л ' ' ' •' ~1>п +1; ^а+