ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ МОСКОВСКИЙ ИНЖЕНЕРНО-ФИЗИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)
Б.В. Сед...
105 downloads
309 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ МОСКОВСКИЙ ИНЖЕНЕРНО-ФИЗИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)
Б.В. Седелев
РЕГРЕССИОННЫЕ МОДЕЛИ И МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ И СТРУКТУРЫ ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ Учебное пособие Под редакцией В.В. Харитонова
Москва 2009 1
УДК 330.43(075) ББК 65.053я7 С 28 Седелев Б.В. Регрессионные модели и методы оценки параметров и структуры экономических процессов: Учебное пособие / Под редакцией В.В. Харитонова. М.: МИФИ, 2009. – 240 с. В книге рассмотрены методологические основания и отвечающие им эконометрические модели временных рядов и связывающих их многофакторных регрессионных моделей. Применение вместо традиционного принципа “постулирования и проверки” подхода к методам эконометрики, исходящего из присущих именно экономическим объектам свойств и характера исходной (качественной и количественной) информации, позволили решить ряд сложных проблем, недоступных для традиционного подхода. Являясь учебным пособием для студентов Экономико-аналитического института МИФИ, слушающих курс по эконометрике, книга снабжена содержательно интересными примерами и их решениями. Они помещены в специальном приложении. Рецензент д-р физ.-мат. наук, профессор А.В. Крянев Рекомендовано редсоветом МИФИ к изданию в качестве учебного пособия.
ISBN 978-5-7262-1139-8
© Б.В. Седелев, 2009 © Московский инженерно-физический институт (государственный университет), 2009
2
ОГЛАВЛЕНИЕ Предисловие редактора серии ................................................................... 5 ВВЕДЕНИЕ ................................................................................................. 8 Раздел 1. ВРЕМЕННЫЕ РЯДЫ МАКРОЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ ........................14 1.1. Исходная информация ......................................................................14 1.2. Инвариантность по сдвигу во времени ...........................................19 1.3. Точность приближения .....................................................................21 1.4. Стохастическая модель временного ряда........................................23 1.5. Свойства и назначение моделей временных рядов ........................33 1.6. Прогнозирование временных рядов с параболическими трендами. ..........................................................37 1.7. Модель как результат целенаправленного изучения свойств информации .........................................................................48 Раздел 2. МНОГОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ ............53 2.1. Основные свойства уравнений множественной регрессии для временных рядов с параболическими трендами ......................54 2.2. Уравнения регрессии для отклонений от трендов и теорема Фриша – Воу ....................................................................58 2.3. Свойства уравнений множественной регрессии как моделей-измерителей .................................................................67 2.4. Уравнения со свободными членами и полиномами различных степеней ..........................................................................72 2.5. Допустимые уравнения множественной регрессии. Активное согласование свойств исходной информации, уравнений и метода оценки параметров .........................................81 2.6. Уравнения с распределенными лагами. ..........................................93 2.7. Модель процессов с распределенными лагами из двух уравнений ...........................................................................114 2.8. Сбалансированный прогноз структуры макроэкономических процессов ....................................................125 Раздел 3. СТРУКТУРНО-ДИНАМИЧЕСКАЯ МОДЕЛЬ ИНВЕСТИЦИОННОГО ПРОЦЕССА .......................................139 3.1. Краткий анализ свойств исходной информации ..........................139 3.2. Системы динамических структурно-балансовых уравнений инвестиционного процесса ..........................................141 3
Раздел 4. ОПЕРАТОРЫ СДВИГА И КОМПРОМИСС “ТОЧНОСТЬ-НАДЕЖНОСТЬ” В АНАЛИЗЕ ВРЕМЕННЫХ РЯДОВ С АПРИОРИ НЕИЗВЕСТНОЙ СТРУКТУРОЙ. ........156 4.1. Краткий анализ основных методов исследования временных рядов .............................................................................157 4.2. “Наиболее подходящий” оператор сдвига и анализ временных рядов с априори неизвестной структурой .................177 4.3. О прогнозировании. ........................................................................192 ЗАКЛЮЧЕНИЕ .............................................................................................194 ПРИЛОЖЕНИЕ (примеры и их решения) ..................................................204
4
ПРЕДИСЛОВИЕ РЕДАКТОРА СЕРИИ
Глубокоуважаемый читатель! В Ваших руках очередное издание МИФИ под названием “Регрессионные модели и методы оценки параметров и структуры экономических процессов”. Эта книга, написанная замечательным и многоопытным специалистом профессором Б.В. Седелевым, выходит в год 13-летия Экономикоаналитического института (ЭАИ) МИФИ, который активно использует методологию физического познания мира в экономическом образовании. Экономико-аналитический институт создан в 1996 году как программно-целевое подразделение государственного университета МИФИ. Задача ЭАИ – на основе высокого учебно-методического и научного потенциалов кафедр МИФИ подготовить экономистовматематиков, экономистов-информатиков и экономистов-менеджеров, владеющих современными математическими методами и информационными технологиями в экономике и управлении, представляющих состояние и перспективы развития наукоемких технологий реального сектора экономики, способных решать сложные социально-экономические задачи. Для обеспечения учащихся ЭАИ МИФИ учебной литературой по тем разделам и дисциплинам, по которым обильный рынок экономической литературы имеет “вакансии”, издается с 1998 года серия “Учебная книга Экономико-аналитического института МИФИ”. В этой серии уже изданы около 40 книг. Среди последних изданий ЭАИ: ¾ Розанов В.Б., Степанов Р.В. Концепции современного естествознания. Что и почему должен знать каждый о физике. М.: МИФИ, 2003. – 232 с. ¾ Скворцов В.И. Технология создания бизнес-моделей. Часть 1. Технологические приемы построения диаграмм в среде ARIS 6.0. М.: МИФИ, 2003. – 92 с. ¾ Экономика ядерной энергетики (конспект лекций). Учебное пособие /Под ред. проф. В.В. Харитонова. (Серия “Учебная книга Экономико-аналитического института МИФИ”). М.: МИФИ, 2004. – 280 с. 5
¾ ¾ ¾ ¾ ¾ ¾ ¾
Новохатько А.Г. История экономических учений. Курс лекций и хрестоматия. М.:МИФИ, 2004. – 484 с. (часть 1); 2005. – 860 с. (часть 2). Мишулина О.А. Статистический анализ и обработка временных рядов. М.:МИФИ, 2004. – 140 с. Власов В.А. Оценки и доверительные интервалы. М.: МИФИ, 2006. – 104 с. Фомина А.В. Стратегический менеджмент. Курс лекций. М.: МИФИ, 2006. – 186 с. Седелев Б.В. Метод целевого синтеза как инструмент постановки и решения задач о существовании из теории чисел. М.: МИФИ, 2007. – 56 с. Харитонов В.В. Энергетика. Технико-экономические основы. М.: МИФИ, 2007. – 256 с. + ил.72 с. Юшков Е.С. и др. Управление интеллектуальными активами предприятия. В 4-х томах. М.: Полиграфикс, 2008.
Несколько слов об авторе учебного пособия “Регрессионные модели и методы оценки параметров и структуры экономических процессов”. Седелев Борис Владимирович окончил механикоматематический факультет МГУ им. М.В. Ломоносова. Последующие 10 лет занимался научно-исследовательской работой в области случайных процессов в радиоэлектронике. По результатам этих исследований в 1963 г. им была защищена диссертация на соискание ученой степени кандидата технических наук и присуждено ученое звание старшего научного сотрудника по “Теории вероятностей и математической статистике”. В 1966 г. он был принят на работу в Научно-исследовательский экономический институт Госплана СССР на должность заведующего лабораторией эконометрического моделирования. В 1974 г. Б.В. Седелев защитил докторскую диссертацию по одной из самых сложных и практически важных проблем экономики – методам оценки распределенных лагов в экономических процессах. В 1983 г. перешел на работу в Институт системного анализа РАН, где возглавил лабораторию по методам анализа и прогноза макроэкономических процессов. По проведенным разработкам им были опубликованы две монографии и около 50 научных статей. В 1986 г. ему было присвоено звание профессора. 6
В настоящее время Б.В. Седелев продолжает работать в Институте системного анализа и почти 10 лет является профессором – совместителем ЭАИ МИФИ. В своем курсе эконометрики он излагает современную и оригинальную методологию эконометрического моделирования и ее приложение к задачам анализа и прогнозирования на основе статистических данных. Большое внимание в последние годы он уделяет разработке методологии и методов целевого синтеза в эконометрии и математике. На их основе решена задача обобщения последней теоремы Ферма (“Информационная математика”, № 1 (3), 2003 г.), а также доказана теорема Гольдбаха-Эйлера (см. Седелев Б.В. Метод целевого синтеза как инструмент постановки и решения задач о существовании из теории чисел. М.: МИФИ, 2007. – 56 с.). Авторы данной книги и редактор серии будут признательны читателям за отзывы и предложения по улучшению содержания учебного пособия. Директор ЭАИ МИФИ, профессор, академик Академии естественных наук, Заслуженный работник высшей школы
7
В.В. Харитонов
ВВЕДЕНИЕ Современные статистические методы анализа и прогнозирования рядов наблюдений и связывающих их моделей процессов возникли не из абстрактных проблем математики, а имели своим источником конкретные задачи, возникавшие в различных областях знания о природе, технике, экономике. Каждая из этих областей характеризуется специфическими свойствами своих объектов и имеющейся в отношении них исходной статистической информацией. Поэтому учет указанной специфики и различий весьма существенен при решении вопроса их адекватного отражения в задачах анализа и прогноза экономических процессов (с присущими, именно им свойствами объектов и характером имеющейся статистической информации). Понятно, что только адекватные, специально разработанные и апробированные на реальных экономических проблемах статистические методы обеспечат ценное содержательно и количественно надежное проникновение в структуру и механизм современной экономики с ее усложненными факторными, лаговыми и балансовыми взаимосвязями показателей. В связи с этим становятся особенно актуальными выявление реальных возможностей методов анализа и прогнозирования экономических процессов народно-хозяйственного и отраслевого уровней, оценка их информационного предела при исследовании динамики и структуры процессов. Эти возможности зависят как от качества методов, их точности и надежности, так и от степени соответствия их информационной базы тем целям и практическим задачам, которые должны быть реализованы с помощью предлагаемых экономико-математических методов. Традиционная ситуация в соотношении “методы – информация” на макроэкономическом уровне характеризуется тем, что информация о процессах, для которых исследователь разрабатывает соответствующие методы и модели, черпается им из статистической отчетности, а не готовится специально под поставленные цели исследования. 8
Возникает проблема разработки методов, реализующих предельные возможности существующей (подвергнутой агрегированию с другими, а не с поставленными в конкретных методах и моделях целями) информации в задачах анализа и прогнозирования динамики и структуры макроэкономических процессов. В свою очередь, она порождает новую проблему обращения к первичной (дезагрегированной) информации и такому формированию на ее основе временных рядов для агрегированных показателей, которые были бы адекватны разрабатываемым методам и моделям соответствующих экономических процессов. При этом естественно подразумевается, что адекватность приносит в качестве своего главного эффекта существенное углубление в отражении механизма и структуры отраслевых и народно-хозяйственных процессов. Данная работа посвящена вопросам моделирования и оценки параметров и структуры макроэкономических процессов. Разработка новых и анализ известных методов проводятся в условиях двух следующих постановок. В первой рассматриваются методы исследования имеющихся временных рядов макроэкономических процессов и выявляются предельные возможности оценки параметров и структуры связывающих эти ряды многофакторных регрессионных моделей. Полученные здесь результаты показывают, какие методологические трудности возникают перед исследователем в том случае, когда исходная информация (временные ряды экономических показателей) берется из официальной статистической отчетности и в силу этого оказывается сформированной не в соответствии с целями анализа параметров и структуры экономических процессов, а, как правило, с целями отчета о их динамике за прошедшие отчетные годы. Во второй постановке мы обращаемся к методам исследования, преследующим ту же самую цель – сценку параметров и структуры экономических процессов отраслевых и народно-хозяйственного уровней, но разработку их начинаем с этапа формирования интересующих нас временных рядов. При этом так используем первичную (дезагрегированную) информацию, что необходимые при этом ряды показателей позволяют реализовать поставленную цель в наиболее полной и простой (прямой) форме. 9
Если в первой постановке мы не всегда конкретизировали, с какими именно процессами связаны данные временные ряды и соответствующие им регрессионные модели, то во второй вынуждены были сделать это. Такие действия вызваны самим характером первичной информации, существенно отличающейся по составу и уровню дезагрегирования для различных экономических процессов. Поэтому мы остановились на одном из них, а именно на инвестиционном процессе. Однако сам подход, будучи по форме экономико-математическим, не только позволяет показать возможности, заложенные в целевом формировании информации, но и в силу общности может быть распространен на широкий круг воспроизводственных процессов, характеризующихся "рождением" объектов, их "жизнью" и "смертью". Исходя из характера решаемых в работе вопросов, она разбита на четыре раздела. Три из них – первый, второй и четвертый – посвящены первому подходу, а третий раздел – второму подходу. Анализ временных рядов экономических показателей и оценка параметров связывающих их уравнений множественной регрессии (эконометрических моделей процессов) вызывают необходимость решения ряда практически интересных и одновременно трудных в теоретическом и вычислительном плане проблем, таких как формирование требований к точности и надежности моделей временных рядов, преодоление мультиколлинеарности факторов (аргументов регрессии), устранение временного тренда у ошибки уравнения. Обращение к свойствам инвариантности по отношению к сдвигу по времени экономических временных рядов, обоснование компромисса "точность – надежность" и согласование свойств временных рядов и связывающих эти ряды уравнений множественной регрессии явились той основой, которая позволила выявить условия разрешимости указанных выше проблем и предложить простые вычислительные процедуры для их реализации. Преимущества подхода, исходящего из совместного исследования статистических свойств временных рядов и связывающих их регрессионных уравнений, проявились, в частности, в конструктивных уточнениях условий применимости к уравнениям регрессии теоремы Гаусса – Маркова – теоретической основы оценки линейных регрессий с помощью метода наименьших квадратов. 10
В целях систематического исследования вопроса в работе последовательно обсуждены свойства исходной информации, заданной временными рядами, и гипотезы об этих свойствах; рассмотрены классы функций, применяемые для описания компонент временных рядов с простой и со сложной – априори неизвестной – структурой; рассмотрены отвечающие им классы инвариантных по сдвигу по аргументу функций времени: степенные полиномы ρ (t ) = a 0 + a 1t + … + ak t k – для простой структуры, и дополненные k
∑ a1λti
и си-
∑ ai sin ωt t + bi cos ωi t
– для
линейными комбинациями показательных функций
i =1
k
нусов и косинусов одинаковых частот
i =1
рядов со сложной структурой; предложены процедуры выбора "наилучших" функций из числа инвариантных по сдвигу по аргументу и соответствующие им критерии, которые следует положить в основу принятия решения о таких функциях; среди последних особый интерес и сложность оценки представляют второй и третьи классы – с нелинейными параметрами λi и ωi ; соответствующие методы их оценки потребовали разработки оригинальных процедур с двухэтапным применением метода наименьших квадратов (МНК). На первом этапе производилась оценка частот в спектре ряда в полосе 0 ≤ ω ≤ π, которым могут соответствовать тренды (ω = 0) и циклические компоненты (ω = ωi , где 0 < ω < π). На втором этапе МНК применялся для оценки амплитуд (линейных параметров) компонент с уже оцененными нелинейными параметрами. При изучении уравнений множественной регрессии была исследована зависимость их свойств от свойств временных рядов, в анализ уравнений регрессии введены понятия о допустимости уравнений с постоянными и переменными параметрами. Наконец, рассмотрены проблемы, связанные с мультиколлинеарностью факторов и возможным возникновением временного тренда у ошибки уравнения, предложены процедуры решения этих проблем; разработаны и обоснованы методы приведения первоначально некорректных регрессий, включая производственные функции и уравнения с распределенными лагами, к допустимым регрессиям. 11
Наряду с проблемами анализа и прогнозирования экономических показателей с помощью отдельных уравнений регрессии нами разработан метод матричного прогноза для сбалансированной совокупности структурно-динамических компонент макроэкономических процессов. В отличие от известного метода RAS он не только согласует прогноз элементов матрицы с его итоговыми окаймлениями в году прогноза, но и устраняет два наиболее существенных недостатка этого метода. А именно: учитывает возможную разнонаправленность (рост, убывание) элементов в пределах одной строки и столбца матрицы и существенно снижает степень воздействия на результаты прогнозирования элементов, значительно превосходящих по величине другие элементы в данной строке или столбце матрицы. Для оценки параметров и структуры инвестиционного процесса привлекается дезагрегированная информация о ходе капитального строительства, отраженная в совокупности титульных списков объектов за годы отчетного периода. Данные списки являются важнейшими документами сводного характера о ведущемся в экономике и ее отраслях капитальном строительстве и содержат сведения о сметных стоимостях строек, о годах начала и продолжительности их строительства, об освоенной к началу отчетного года на каждой стройке части ее сметной стоимости и т.д. В зависимости от уровня и характера агрегирования, которых отражается процесс строительства (отраслевые, региональные или федеральные органы управления), титульные списки включают в свой состав те или иные совокупности строек, имеющие некоторые (но не ниже принятой за минимальную на данном уровне) сметные стоимости, и расшифровывают ход строительства либо до объектов включительно, либо ограничиваются информацией по стройкам в целом. Поэтому характер развиваемых нами методов и их возможности применения к анализу и планированию инвестиционного процесса определяются, прежде всего, степенью детализации, которую предоставляют титульные списки в отношении строек и их отдельных объектов. Построенные в соответствии с целями структурно-динамического анализа и прогнозирования инвестиционного процесса временные ряды показателей обладают несравненно более высокой информационной емкостью, чем имеющиеся в статистической отчетности (на уровне отраслей, регионов или экономи12
ки в целом). Это проявляется как в самом типе моделей, носящих двухуровневый характер (процесс на уровне стройки и на агрегированном уровне), так и в широком спектре возможностей проникновения в механизм процесса с помощью их структурных и динамических показателей. В основу разработанных эконометрических моделей и методов оценки параметров и структуры экономических процессов были положены численные и теоретические знания, присущие именно экономическим временным рядам и связывающим их многофакторным уравнениям, а не каким-либо другим (например, техническим) процессам.
13
Раздел I. ВРЕМЕННЫЕ РЯДЫ МАКРОЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ 1.1. Исходная информация
Изучение регрессионных моделей экономических процессов народно-хозяйственного и отраслевых уровней, являющихся объектами исследования, начнем с анализа информации о поведении характеризующих их показателей за некоторый промежуток времени. Не конкретизируя, в какой роли будет рассматриваться тот или иной показатель в будущей регрессионной модели изучаемого процесса (в роли функции или фактора), введем для него обозначение X(t). Для каждого такого показателя имеются отчетные данные – ряд чисел, зарегистрированных в равноотстоящие моменты времени. Это временной ряд показателя, который также будем обозначать через X(t). В качестве периода анализа временного ряда выбирается такой отрезок времени [1, N], на котором изучаемый экономический процесс обладает рядом свойств, необходимых для его исследования методами математической статистики и численного анализа. Вопервых, на этом отрезке процесс должен быть практически однородным, т.е. таким, чтобы его изучение можно было проводить с помощью одной и той же совокупности показателей и одной и той же модели. Динамичность (изменчивость структуры и свойств) экономических процессов не позволяет рассматривать их как однородные на сколько-нибудь большом отрезке времени, что заставляет сокращать период анализа. Во-вторых, период наблюдения должен по возможности более полно отражать (сохранять для анализа) диапазон вариации исследуемого показателя, что аналогично свойству представительности пространственной выборки. Это вызывает потребность в увеличении периода [1, N]. Налицо противоречивость требований. Насколько удачно она разрешается, зависит от профессионального уровня исследователя, занимающегося анализом соответствующего процесса, и имеющейся в его распоряжении информации качественного и количественного характера. 14
Предположим, что период анализа [1, N] выбран. При годовых данных, что наиболее характерно для макроэкономических показателей, он навряд ли будет превосходить 15–20 лет, и поэтому о соответствующих рядах следует говорить как о коротких. В дальнейшем необходимые уточнения этого понятия будут опираться на различия в поведении характеристик точности и надежности в зависимости от числа параметров приближающих функций и величины N из практически интересных диапазонов их возможных значений. Теперь обратимся к важному для измерений вопросу – о точности временных рядов. Его можно изучать под разными углами зрения, но не все они конструктивны. Начнем с того, что нас интересует проблема повышения точности временных рядов, представленных в соответствующей статистической отчетности по итогам развития экономики и ее отраслей за период времени [1, N]. Желание иметь возможно более точные исходные данные вполне оправдано, ведь чем они точнее, тем надежнее результаты проводимого с их помощью анализа. Известно, что для многих физических и технических процессов проблема повышения точности исходных наблюдений успешно решена. Для этого разработаны специальные процедуры обработки данных, в результате которых происходит очищение (выделение) "сигнала" (собственно значений показателя) от скрадывающих его "помех" (ошибок измерения). На первый взгляд, экономические данные X(t), t = 1, ..., N, ничем принципиальным не отличаются от физических и технических измерений, это также некоторые ряды (последовательности) чисел. Поэтому есть надежда, что и для экономических временных рядов существуют процедуры, уменьшающие погрешность в данных. Может быть, способность уменьшать (сглаживать) соответствующие ошибки присуща широко известным в эконометрической методологии процедурам скользящих средних? Ведь известно, что простые и взвешенные скользящие средние являются ничем иным, как разновидностью линейных фильтров, а последние (в виде так называемых оптимальных, согласованных фильтров) как раз и служат эффективными инструментами уменьшения ошибок наблюдения в физических и технических процессах. 15
Известно также, что соответствующим образом (согласно рекомендациям, описанным в литературе, посвященной методике скользящих средних) подобранная средняя превращает первоначально колеблющийся, "зубчатый" временной ряд в более плавный, гладкий. Означает ли это, что полученные в результате такого сглаживания значения ряда стали более близкими к истинным значениям исследуемого показателя? Понятно, что это может произойти лишь случайно: ведь флюктуации показателя могут входить составной частью в истинные значения показателей и их практическое устранение (возможно, наряду с ошибками измерения) только ухудшит точность. И лишь в том случае, если собственно флюктуации показателя будут значительно меньше случайной ошибки измерения, процедуры сглаживания с помощью скользящих средних могут привести к повышению точности показателя. Поэтому можно сделать вывод, что скользящие средние сглаживают значение временного ряда в целом, но совсем не обязательно улучшают точность показателя (а как мы видели, могут и ухудшить ее). Чтобы не рассматривать возможности уменьшения ошибок наблюдения с помощью других методов обработки временных рядов, укажем на следующие различия в характере экономических измерений и физических, и технических. В случае измерения физических и технических показателей с помощью соответствующих приборов мы, как правило, располагаем либо сведениями о статистических свойствах ошибок (в виде закона распределения, значений его параметров), либо можем практически сколь угодно наращивать (повторять) ряды наблюдений. Что касается тех процедур выделения сигнала на фоне помех, в которых период наблюдения не всегда может быть увеличен, то и здесь известна существенно большая информация о виде сигнала (измеряемого показателя) и природе помех (ошибок измерения), чем в случае экономических временных рядов. Именно опираясь на эти знания и строятся оптимальные, согласованные со статистическими свойствами ошибок измерения и видом сигнала фильтры для обработки физических и технических наблюдений. Будучи лишенными этих знаний и соответствующих им возможностей в случае сформированных статистическими органами экономических временных рядов – единственная, принципиально неповторимая реализация показателя процесса с отсутствием ин16
формации о статистических характеристиках ошибок измерения – мы никакими математико-статистическими или другими вычислительными средствами не можем повысить исходную (неизвестную нам) точность показателей. Поэтому вопрос о точности показателей, представленных временными рядами, целесообразно перевести в следующую плоскость. Незнание потребителями экономической информации ее точности не может служить основанием для сомнения в том, что она высокая: все методологически лучшее, что можно применить для измерения (построения) экономических показателей, используется составителями статистической отчетности. Предполагая далее (доказать этого нельзя), что точность привлекаемой для изучения макроэкономических процессов теории регрессионного анализа не выше точности имеющейся в нашем распоряжении исходной информации, мы считаем целесообразным иметь дело не с двумя неизвестными ошибками, а с одной – ошибкой теории, “перенеся” в нее последствия неточности информации. Конструктивность такой точки зрения становится очевидной, если учесть, что согласование теории и информации осуществляется в данном случае (регрессионного анализа) с помощью метода наименьших квадратов, в котором фигурирует лишь одна ошибка – теории (ошибка уравнения регрессии). Одновременно это означает, что гипотеза о точности исходной информации фактически используется в регрессионном анализе экономических временных рядов, хотя об этом и не говорится явно. Какой мы получаем выигрыш от принятия данной гипотезы, будет видно в дальнейшем, а сейчас уточним ее воздействие на объект исследования (экономические показатели) и постановку вопроса о согласовании информации и теории. Сначала о первом: принимая данную гипотезу, мы, строго говоря, заменяем один объект исследования (который нам известен неточно) на другой, истинные значения которого в точности совпадают с имеющимися наблюдениями. Второй вопрос обычно сводят к точности согласования теории и информации. Но теорий (регрессий) может быть много. Это наводит на мысль сопоставить их по точности приближения и выбрать одну из них – наилучшую по точности приближения. Какая, однако, точность должна соответствовать ей? Насколько теории следует быть близкой к информации? 17
Наконец, сводится ли проблема выбора “наилучшей теории” к одной точности? Пока можно утверждать только то, что, приняв гипотезу о точности исходных наблюдений, мы обеспечили “наилучшие условия” для сопоставления различных теорий по точности приближения. В качестве иллюстрации того, насколько вопрос о согласовании теории и измерений сложен и неоднозначен, приведем рассуждения по этому поводу известного специалиста в области численного анализа Р.В. Хемминга. Он пишет: "Рассмотрим, например, решение системы линейных алгебраических уравнений для неизвестных xi . Нам нужно ответить на следующие вопросы: 1. Должны ли быть точными xi? 2. Должны ли быть маленькими остатки уравнений после того, как вычисленные xi подставлены в них? 3. Должна ли данная группа уравнений быть близкой к группе уравнений, для которой xi суть точные ответы? Очевидно, что в определенной конкретной ситуации может годиться еще какая-либо другая мера точности. Обычно отвечают утвердительно на первый вопрос; но лишь иногда такой ответ является самым подходящим. Второй критерий часто является надлежащим, потому что стремятся обратить в нуль уравнения и вычислить xi , которые дают это обращение в нуль. Третий критерий также полезен и постепенно все больше и больше используется в приложениях так же, как и в формальном анализе ошибок. В известном смысле говорят: "Так как ни ваши измерения, ни ваша физическая теория не являются точными, то как близко к ним я должен подойти в своих вычислениях?" Во многих отношениях это – самый основной критерий, критерий, из которого делаются предположения для других критериев"1. Преимущества, получаемые от принятия гипотезы о точности исходной информации, будут в полной мере раскрыты при обосновании наличия четкой тенденции у показателя точности моделей временного ряда с ростом числа их параметров. 1
Хемминг Р.В. Численные методы. М.: Наука, 1968, с.98. 18
Однако прежде мы обсудим некоторые специфические свойства экономических временных рядов и связанные с ними вопросы построения их моделей. 1.2. Инвариантность по сдвигу во времени
Экономические временные ряды как объект анализа обладают следующим замечательным свойством – у них нет преимущественного (естественного) начала отсчета времени. Именно по этой причине их изучение правомерно проводить в любой шкале времени t = t0 + 1,...,t0 + N и руководствоваться единственно соображениями удобства, решая, чему положить t0 – нулю (что обычно и делается) или какому-либо другому числу. Это наводит на мысль использовать для анализа экономических рядов функции, инвариантные по отношению к сдвигу во времени. Известны три класса таких функций: степенные полиномы, линейные комбинации синуса и косинуса одинаковых частот, показательные функции. Каждая функция из этих классов при изменении начала отсчета или, иначе говоря, при сдвиге во времени остается с точностью до линейных коэффициентов функцией того же вида, а именно: полиномы остаются полиномами тех же порядков, хотя и с другими коэффициентами, функции синус и косинус будут иметь те же частоты (периоды колебаний), показательные функции не изменяют своих оснований. Использование любого другого множества функций времени подразумевает существование естественного начала отсчета (например, в виде их "особых" точек), что будет сказываться на результатах анализа. Если мы хотим быть в согласии с указанным (естественным) свойством экономических временных рядов, то следует выбрать для их анализа один из этих классов функций или их комбинацию. Ранее нами были разработаны методы анализа временных рядов, использующие как класс степенных полиномов, так и комбинации функций трех указанных классов1. В данной работе мы вновь об1
Седелев Б.В. Оценка распределенных лагов в экономических процессах. М.: Экономика, 1977, с. 141–190. 19
ращаемся к классу полиномов, намереваясь изложить в ней новые результаты как по анализу рядов, так и по их прогнозированию. Начнем с вопросов анализа, а среди них со следующего: какого вида полиномы – общие (со всеми степенями – от нулевой до старшей) или частные (ряд коэффициентов которых при степенях времени, помимо старшей, равен нулю) – следует рассматривать в задаче подбора наилучшего для данного временного ряда полинома. На первый взгляд, полиномы частного вида более привлекательны, особенно для рассматриваемого случая коротких временных рядов: обладая при той же степени, что и у полинома общего вида, меньшим числом коэффициентов, они увеличивают отношение числа наблюдений к числу неизвестных (оцениваемых) параметров и обеспечивают тем самым большую надежность измерений. В научной литературе известно предложение американского статистика Д.К. Кифера1 использовать такие (частного вида) полиномы в анализе временных рядов. Действительно, у полинома t43 + 12t18 + 3t4 (если t заменить на х, то это в точности воспроизводит пример Д.К. Кифера) всего 3 коэффициента вместо 44, которые пришлось бы оценивать для полинома Р43(t) общего вида. Однако привлекательность преимущества такого предложения носят чисто умозрительный характер. Они тут же рассеиваются, если учесть инвариантность по сдвигу класса полиномов и связанную с произвольностью выбора начала отсчета изменчивость их коэффициентов: бывшие нулевыми при одном начале отсчета коэффициенты перестают быть таковыми при переходе к другому началу отсчета. Не зная соответствующего начала отсчета, мы не можем предпочесть (априори) один полином частного вида другому, а там самым и остановиться на каком-либо конкретном полиноме. Конечно, апостериори (после оценки "всех" полиномов частного вида) предпочтение станет возможным, но это уже другая задача. Действительные трудности проблемы подбора наиболее подходящего для данного временного ряда полинома Рr (t) весьма значительны, – ведь нам предстоит оценить не только коэффициенты полинома некоторой степени r, но и саму эту степень. Од1
The Future of Statistics. Academia Press. New York and London, 1968, p. 141. 20
нако преодолеваются они совершенно другими средствами, чем только что рассмотренное. 1.3. Точность приближения Приступая к исследованию временного ряда X(t), t = 1,..., N, зафиксируем исходные позиции: принята гипотеза о точности исходных данных X(t), t = 1,...,N; выбран период анализа [1, N]; в качестве приближающих функций взяты степенные полиномы r
общего вида Pr (t ) = ∑ ai t i ( ai и r неизвестны). j =0
Начнем с вопроса: какую меру согласия (приближения) следует принять на данном этапе анализа, когда мы имеем дело с последовательностью неслучайных и точных величин X(1),...., X(N)? Таких мер существует много. Наиболее известные из них – критерий точного совпадения в узлах информации, критерий Чебышева (основная его идея состоит в том, чтобы уменьшить максимальные отклонения до минимума), критерий минимизации среднего квадрата невязок. Выбор конкретного из них определяется неформальными соображениями. В нашем случае в качестве таковых выступают следующие. Вскоре мы приступим к формированию стохастической модели временного ряда (в отличие от рассматриваемого сейчас неслучайного временного ряда наблюдений). В качестве адекватного метода оценки параметров стохастических моделей временных рядов выступает известный статистический метод наименьших квадратов. Совпадение результатов, получаемых по критерию наименьших квадратов и по минимуму среднего квадрата невязок (несмотря на различия в трактовке природы этих результатов), делает целесообразным выбор последнего критерия на данном этапе исследования. У полинома Рr (t) степени r число неизвестных коэффициентов равно r + 1, и если оно меньше числа наблюдений N, то приближающий полином будет в общем случае (т.е. для реальной, а не специально подобранной информации) отклоняться от временного ряда X(t). Минимизируя средний квадрат отклонений (невязок) 21
для каждого r из диапазона [1, N – 2], мы получим совокупность оцененных полиномов Pr (t), r = 1,..., N – 2, и соответствующих им характеристик точности приближения S 2 (r ) =
N 1 2 min ∑ [ X (t ) − Pr (t )] , r = 1,…, N − 2 . N ( ai ) t =1
(1.3.1)
Для полноты картины целесообразно рассмотреть интерполяционный (проходящий через все значение временного ряда) полином PN–1(t) и охарактеризовать его той же мерой приближения S2(N – 1), равной в данном случае 0. В результате будем располагать полной группой приближающих полиномов Pr (t), r = 1,..., N – 1; t = 1,..., N, которые можно сопоставить между собой по значениям показателей точности S2(r). Последние удовлетворяют следующим неравенствам: S 2 (1) > S 2 (2) > ... > S 2 ( N − 2) > S 2 ( N − 1) = 0 .
(1.3.2)
Такая детерминистски строгая, а не вероятностная сопоставимость показателей S 2 (r ) является, как нетрудно видеть, следствием принятой ранее гипотезы о точности исходной информации (нашей готовности смотреть на нее как на точную). Действительно, не имея в составе X(t), t = 1,..., N, случайной ошибки, нет надобности учитывать в показателе точности соответствующую оценку ее дисперсии или интервала доверительности (величин, известных лишь в вероятностном смысле). Если поведение S 2 (r ) изобразить на графике, то оно имеет следующий характер: для небольших r величина S 2 (r ) быстро убывает, затем убывание становится медленным, и, наконец, при значениях r, близких к N – 1, снова начинается быстрое убывание S 2 (r ) , пока при r = N – 1 функция не обратится в 0. Следует отметить, что такое поведение S 2 (r ) типично для рядов любой конечной длины, однако крутизна начального и последнего участков будет тем большей, чем меньше N. И наоборот, с ростом N их крутизна уменьшается. Одновременно с этим скорость убывания на втором участке изменения показателя будет тем меньшей, чем больше N. С убыванием N скорость убывания на этом участке возрастает, но 22
всегда остается заметно меньшей, чем на первом и третьем участках. Проводя анализ конкретного временного ряда X(t), t = 1,..., N, мы имеем дело со случаем N = const и тем самым исследуем поведение показателей точности в зависимости от одного аргумента r. Установленная тенденция S 2 (r ) – повышение точности приближения полиномов с ростом их порядка – будет положена как важнейшее свойство Рr (t) в основание процедуры выбора одного из них – "наилучшего" приближающего полинома. Однако это лишь одно из важнейших свойств Рr (t), но не единственное. Известно, что высокая точность приближающего полинома может сопровождаться плохой надежностью оценок его коэффициентов. Анализ последней требует уже другого подхода к временным рядам – стохастического. Это вызывает необходимость ввести в рассмотрение новую (модельную) интерпретацию свойств исследуемого экономического показателя и соответствующие ей вычислительные процедуры, причем естественным образом дополняющие уже разработанный подход и элементы методологии анализа, а не противоречащие им. 1.4. Стохастическая модель временного ряда
Обратимся вновь к неслучайному (точному) временному ряду. Построенная для него совокупность приближающих полиномов Рr (t), r = 1,..., N – 1, дает возможность ввести в анализ следующую интерпретацию проведенных для X(t), t = 1,..., N, операций, являющуюся отправным моментом для перехода от разработанной методологии, относящейся к численному анализу, к идеям и методам математической статистики. Представим значение временного ряда в момент времени t в виде суммы Рr (t) и соответствующей этому полиному невязки δr (t): X(t) = Рr (t) + δr (t),
r = 1,…, N – 1;
t = 1,...,N.
(1.4.1)
Формула (1.4.1) говорит о наличии в нашем распоряжении N – 1 разбиений временного ряда на две составляющие, которые различаются не только по величине, но и по характеру поведения. Так, при r = 1 приближающий полином в виде прямой линии с положи23
тельным или отрицательным наклоном отражает общую (среднюю) тенденцию временного ряда на отрезке [1, N]. Реальные ряды макроэкономических показателей имеют, как правило, более сложную динамику, чем прямолинейная. Поэтому в невязку δ1(t) будет входить динамическая компонента, аккумулирующая в себе члены 2го и более высоких порядков времени (помимо небольших флюктуации, "зубцов", свойственных любым данным). При графическом анализе δ1(t) будет наблюдаться явный временной тренд, на который наложены собственно флюктуации. Тренд невязки часто напоминает волну с периодом в 1,5–2 раза меньшим, чем величина N. При r = 2 соответствующий полином представляет собой достаточно гибкую кривую, чтобы в основном уловить тенденцию реальных макроэкономических временных рядов. Поэтому при изображении на графике невязки δ2(t) явной временной тенденции может не наблюдаться. В то же время средний квадрат невязки хотя и уменьшился по сравнению δ1(t), но еще достаточно велик. При r = 3 мы имеем дело с полиномом, способным отражать переходы от роста показателя к падению, а затем снова к росту показателя. Гибкость кривой позволяет не только отразить общую тенденцию показателя, но и ее "нюансы". Соответствующая невязка все больше напоминает флюктуации типа белого шума (неавтокоррелированный стационарный процесс с нулевым средним). Ее средний квадрат становится заметно меньше, чем при r = 2. Дальнейшее увеличение r до значений 4–5 лишь в редких случаях "изощренной" динамики макроэкономического показателя существенно повышает точность приближающего полинома и соответственно сколько-нибудь заметно уменьшает средний квадрат невязок. По своему характеру невязки δ4(t) и δ5(t) близки к уже упоминавшемуся белому шуму. Для временных рядов с периодом анализа N = 10÷20 (лет) (наиболее часто встречающийся "компромиссный" период) картина поведения Рr (t) и δr (t) для r > 5 качественно близка к имеющей место при r = 3÷5 и лишь вблизи точки r = N – 1 (за 2–3 значения до нее) она начинает резко меняться: полиномы между узлами информации начинают "вспучиваться", а средние квадраты невязок быстро убывать к 0. 24
Описанное выше поведение приближающих полиномов и невязок с ростом параметра r столь тесно связано с картиной изменения показателя S2(r), r = 1,..., N – 1, что, опираясь лишь на последнюю, можно предсказать область значений r0′ < r < r1′ , где полиномы уже обладают высокой точностью, а небольшая величина их порядков (большое число степеней свободы N – r –1) позволяет надеяться на высокую степень надежности коэффициентов полиномов (напомним, что точность приближения и надежность коэффициентов не одно и то же). Наметив область [r0′ , r1′] (взятую с некоторым "запасом" по отношению к диапазону перехода S2(r) от быстрого убывания к медленному), мы проводим в ней более тонкое изучение результатов разбиения временного ряда на полиномы и невязки (прежде всего, их автокорреляции). В дальнейшем будем исходить из того, что для некоторых значений r из диапазона r0 ≤ r ≤ r1 (r0′ < r; r1 < r1′) мы пришли к таким разбиениям X(t) = Рr (t) + δr (t), которые позволяют смотреть на невязки δr (t), t = 1,..., N, как на реализации белого шума. При этом для рядов реальной длительности N = 10÷20 следует ограничиться проверкой лишь такого простейшего свойства δr (t) как неавтокоррелированность; что касается нулевого среднего у δr (t), то оно обеспечивается самой процедурой оценки приближающих полиномов. Обычно отрезок [r0, r1] захватывает точку перехода S2(r) от быстрого убывания к медленному и 3–4 значения r вправо от нее. Поэтому проведение необходимых расчетов и их анализ не вызывают каких-либо затруднений. Если проведенные для величины δr(t) проверки с помощью коэффициента автокорреляции или теста Дарбина – Уотсона позволяют смотреть на некоторые из них (обычно они идут подряд по r) как на реализацию белого шума δrt, то в отношении самого временного ряда мы принимаем гипотезу о его случайности: X(t), t = 1,..., N, ставится в соответствие совокупность случайных временных рядов Xt со структурой r
X t = Pr (t ) + δrt = ∑ ari t i +δrt , r0 ≤ r ≤ r1 . i =0
25
(1.4.2)
Уравнения (1.4.2) представляют собой регрессионные модели исследуемого временного ряда. Их свойства таковы, что к ним применима теорема Гаусса – Маркова: если в уравнении регрессии случайная компонента – белый шум, а факторы {1, t,..., tr} – неслучайные линейно-независимые векторы, то несмещенные и эффективные, т.е. с минимальными дисперсиями, линейные оценки коэффициентов аr0, ar1,..., arr могут быть получены методом наименьших квадратов. Учитывая, что полиномы Рr (t) были оценены ранее по критерию (1.3.1), приводящему к тем же численным значениям коэффициентов, что и метод наименьших квадратов, совсем не обязательно проводить заново их оценку, исходя из новой (стохастической) точки зрения на объект исследования. Однако теперь помимо самих значений оценок коэффициентов мы имеем возможность вычислить их дисперсии σi2 ( ari ) = a ii (r )σδ2 (r ), i = 0, 1,... r , (1.4.3) являющиеся важнейшими показателями статистической надежности результатов измерения. Величины, входящие в (1.4.3), означают: σi2 (r ) – дисперсию оценки i-гo коэффициента полинома порядка r, σδ2 (r ) – дисперсию δrt , a ii (r ) – i-й диагональный элемент обратной матрицы соответствующей системы нормальных уравнений. Прежде чем заняться дальнейшим изучением вопроса, сделаем следующее замечание. Может показаться, что требование о неавтокоррелированности δrt чрезмерно сильное, ведь метод наименьших квадратов можно применять и в случае автокоррелированного δrt . Однако в условиях небольших значений N невозможно различить природу связанности величин δrt в соседние моменты времени, объясняется ли она наличием в этой величине некоторого (остаточного) тренда или отражает собственно свойство автокорреляции стохастической величины (при отсутствии у нее временного тренда). Требуя, чтобы данная компонента была неавтокоррелирована, мы страхуем себя и от присутствия в ней остаточного тренда. Существование для исследуемого временного ряда, как правило, нескольких стохастических моделей, подчиняющихся условиям теоремы Гаусса – Маркова (в дальнейшем будем называть их до26
пустимыми моделями), ставит перед нами проблему сопоставления их качества. Ранее, при оперировании с X(t) как с неслучайной функцией времени, мы характеризовали модели разбиения временного ряда на полиномы Рr (t) и невязки δr (t) показателем точности приближения S2(r). Желательность высокой точности приближения для целей анализа и прогнозирования экономических показателей вполне очевидна. Но что проку в высокой точности, если соответствующий полином будет оценен ненадежно! Вместе с моделями (1.4.2) мы получаем возможность измерять второе практически важное свойство полиномов – их надежность. В отношении него мы зададимся рядом вопросов: будут ли полиномы Рr (t) из диапазона r0 ≤ r ≤ r1 статистически надежными? Если не все, то какие из них? И что столь же интересно выяснить, как и в случае с показателем S2(r), имеют ли показатели надежности (1.4.3) определенную и общую для всех i (0 ≤ i ≤ r) тенденцию при изменении r? Начнем с выяснения характера динамики показателей надежности. Из формулы (1.4.3) следует, что дисперсия оценки i-гo коэффициента полинома, оцененного методом наименьших квадратов, является функцией двух величин – диагонального элемента обратной матрицы aii(r) и дисперсии случайной составляющей (белого шума) σδ2 (r ) . Для регрессионных моделей временных рядов, факторы которых представляют собой известные (в данном случае степенные) функции времени, главный определитель системы нормальных уравнений будет зависеть лишь от сумм этих функций за время t = 1,..., N (что очевидно из самой записи системы нормальных уравнений). Поэтому диагональные элементы аii(r) как отражающие общие свойства регрессий с полиномиальными трендами могут быть вычислены заранее, независимо от того, какие конкретные значения принимает X(t) на отрезке t = 1,..., N. Что касается дисперсии σδ2 (r ) , то она определяется в прямой зависимости от значений δr(t) и вследствие этого всегда носит конкретный (частный) характер. Желая выяснить, как изменяются диагональные элементы обратных матриц с ростом степеней приближающих полиномов r, мы провели необходимые расчеты и свели их результаты в табл. 1.1. 27
В качестве практически интересных значений N нами взяты N = 10, 15, 20. Из табл. 1.1 видно, как растут первые шесть диагональных элементов аii(r), i = 0, 1,..., 5, когда r изменяется от 1 до 5 (при фиксированных значениях N). Ограничиваясь шестью элементами, мы делаем эту таблицу пригодной для анализа полиномов до 5-й степени включительно. Но, как показывает практика (расчеты показателя обусловленности матриц), именно в этом диапазоне (1 ≤ r ≤ 5) временные ряды макроэкономических показателей имеют точные и надежные приближающие полиномы. Переход к полиномам степени r = 6 и выше (из области r, отвечающей медленному убыванию показателя S2(r)) сопровождается потерей надежности оценок их коэффициентов, а следовательно, и полиномов в целом. Это объясняется тем, что векторы {l, t,…, tr–1, tr}, t = 1,..., N (10 ≤ N ≤ 20, r ≥ 6) начинают "смотреть" практически в одну и ту же сторону, а соответствующие им матрицы систем нормальных уравнений становятся плохо обусловленными. Для оценки скорости роста диагональных элементов по мере возрастания r мы могли бы применить известные из численного анализа приближенные формулы для главного определителя соответствующей системы нормальных уравнений, например, основанные на анализе поведения определителя Гильберта в зависимости от изменения его порядка1. Однако получающиеся при этом оценки аii(r) говорят об их факториальной скорости роста (от r), что явно завышено. Поэтому вместо аналитических, но весьма приближенных оценок аii(r) мы предпочли дать таблицу их точных значений (рекомендуем читателям внимательно "прочитать" таблицу хотя бы для одного из значений N, например для N = 15). Изменение второго показателя – дисперсии σδ2 (r ) нельзя затабулировать, так как она зависит от конкретного временного ряда. Но оценить характер ее поведения в зависимости от r можно. Для этого свяжем дисперсию с показателем S2 (r): N δδ2 (r ) = (1.4.4) S 2 (r ), r0 ≤ r ≤ r1 . N − r −1 1
Хемминг Р.В. Указ.соч., с. 237–239. 28
29
i\r
0 1 2 3 4 5
0 1 2 3 4 5
0 1 2 3 4 5
N
10
15
20
ii
2 0,1383·101 0,2413·100 0,1804·10–2 – – – 0,7934·100 0,6562·10–1 0,2424·10–3 – – – 0,5535·100 0,2662·10–1 0,5696·10–4 – – –
1
0,4666·100 0,1212·10–1 – – – –
0,2952·100 0,3571·10–2 – – – –
0,2158·100 0,1504·10–2 – – – –
0,1193·101 0,1931·100 0,2305·10–2 0,2266·10–5 – –
0,1840·101 0,5047·100 0,1030·10–1 0,1746·10–4 – –
0,3776·101 0,2116·101 0,9005·10–1 0,3237·10–3 – –
3
Диагональные элементы a (r)
0,2426·101 0,9477·100 0,3321·10–1 0,1661·10–3 0,9160·10–7 –
0,4147·101 0,2685·101 0,1586·100 0,1357·10–2 0,1318·10–5 –
0,1103·10² 0,1405·10² 0,1687·101 0,2971·10–1 0,6072·10–4 -
4
0,4830·10¹ 0,3701·10¹ 0,2859·100 0,3947·10–2 0,1091·10–4 0,3857·10–8
0,1068·10² 0,1357·10² 0,1744·10¹ 0,4072·10–¹ 0,1181·10–3 0,1163·10-6
0,4134·10² 0,9623·10² 0,2426·10² 0,1155·101 0,1114·10–1 0,1461·10–4
5
Таблица 1.1
Показатель точности S2(r) для каждого временного ряда X(t), t = 1,..., N, имеет определенную величину (уровень) и динамику (характер зависимости от r). Про первую ничего конкретного мы не знаем. Но это и не нужно. Важно знать его динамику, а она известна и к тому же носит закономерный характер: в интересующей нас области r0 ≤ r ≤ r1 (на практике r0 = 1 ÷ 2, r1 = 4 ÷ 5) показатель S2(r) является медленно убывающей функцией r. Из (1.4.4) видно, что если S2(r) убывает быстрее, чем линейная функция, находящаяся в знаменателе выражения, то σδ2 (r ) будет также убывать, причем не более быстро, чем S2(r) (т.е. медленно). Это наиболее часто встречающийся на практике случай. Если же убывание S2(r) такое же или еще более медленное, чем у знаменателя, то σδ2 (r ) будет либо практически постоянно, либо растущей в интересующем нас диапазоне r. Про скорость роста (в общем, также невысокую) можно в этом случае ничего не говорить – важен сам факт роста. Учитывая, что в рассматриваемом диапазоне r0 ≤ r ≤ r1 элементы ii а (r) растут быстро, а дисперсии σδ2 (r ) либо медленно растут, либо практически неизменны, либо медленно убывают, приходим к выводу, что результирующая тенденция показателей (1.4.5) – возрастание, причем достаточно быстрое. Иначе говоря, "надежность" с ростом r быстро ухудшается. Для каждого фиксированного r величина σδ2 (r ) = const, а диагональные элементы подчиняются неравенствам a11 (r ) > a 22 (r ) > ... > a11 (r ) . (1.4.5) Это означает, что дисперсии оценок коэффициентов полинома убывают по мере роста их номера i: σ12 (r ) > σ 22 (r ) > … > σr2 (r ) . (1.4.6) Дает ли это основание считать, что надежность оценок коэффициентов полинома ari увеличивается при переходе от младших коэффициентов к старшим? Абсолютная, как это видно из неравенств (1.4.6), увеличивается, но для нас более важно знать, что происходит при этом с относительной, учитывающей величины самих коэффициентов, ведь для большего по абсолютной величине ari, i = 0, 1, …, r, можно допустить пропорционально большее среднеквадра30
тическое отклонение σi (ari), сравнивая тем самым надежность оценок с помощью коэффициентов вариации σ(ari ) , i = 0, 1,..., r ; r = r0 ,..., r1 . Bi (r ) = (1.4.7) ari Имея в виду, что для реальных экономических рядов модули коэффициентов полиномов по мере возрастания их старшинства (с ростом i) имеют тенденцию к убыванию, а среднеквадратические отклонения этих коэффициентов σi (r) удовлетворяют такого же вида неравенствам (1.4.6), что и их дисперсии (т.е. также убывают с ростом i). можно заключить, что обращение к относительной мере надежности (1.4.7) выравнивает (уменьшает различия по i) скорости ухудшения надежности оценок ari с ростом r (см. с этой целью поведение аii (r) с ростом r для различных значений i в табл. 1.1) . Что касается характера динамики абсолютных значений коэффициентов полиномов | ari | в зависимости от r, то она также дифференцирована по i, а именно: младшие коэффициенты, включая нулевой (i – 0), медленно варьируют с ростом r, а старшие быстро убывают. Поэтому общая тенденция по r показателей надежности (1.4.7) – быстрое и достаточно близкое по своему характеру для различных i возрастание в диапазоне [r0, r1]. Заметим также, что переход к ортогональным полиномам не изменяет указанного поведения показателей (1.4.7). Происходящее при этом некоторое замедление в росте среднеквадратических отклонений σ (ari) сопровождается быстрым убыванием старших коэффициентов разложения по ортогональным полиномам. Наличие общей (с некоторыми флюктуациями у младших коэффициентов) тенденции к росту у относительных показателей надежности вместо четкой (монотонной) тенденции у абсолютных служит определенным основанием для того, чтобы в практических исследованиях использовались оба этих показателя. Однако в качестве основного показателя надежности в дальнейшем выступают сопоставимые по i коэффициенты вариации (1.4.7).
31
r
Мы проанализировали полиномы Pr (t ) = ∑ ari t i , r = r0 ,..., r1 , i =0
со стороны их статистических свойств (“надежности”). Однако эти же полиномы выступают (в процедуре подбора подходящих функций) и в своем другом качестве – как функции времени, “хорошо аппроксимирующие” неслучайный ряд (наблюдения) X (t ), t = 1,..., N . Показателем полиномов в их данном качестве выступает мера точности S2 (r), r = 1, …, N – 1. Имея в виду, что с ростом r точность аппроксимации улучшается, а надежность оценок ухудшается, можно говорить о размене этих показателей на отрезке [r0, r1] . Указанное свойство может быть положено в основу принятия решения о “наилучшем” полиноме. Так как, принимая решение (о полиноме некоторой степени r = k), мы фактически разрешаем компромисс между точностью и надежностью, то в целом о процедуре решения можно говорить как о компромиссе “точность – надежность”. Общее ее обоснование затруднено проблемой сопоставимости “цен” этих разнородных качеств. Однако если со стороны “заказчика задачи” имеются требования (ограничения) к показателям надежности σ(ari ) Bi (r ) = < b, i = 0, 1, … , r ; r = r0 , …, r1 , (1.4.8) ari то, установив, до какого значения k выполняются неравенства (1.4.8), можно разрешить компромисс в пользу соответствующего полинома Рk (t) как “наиболее точного из допустимых по надежности”1. Если же требования оказались невыполненными для всех r0 ≤ r ≤ r1, то следует либо принять Pr0 (t) как “наилучший по надежности”, либо вообще отказаться от дальнейшего решения (при данном требовании к надежности). Это и есть конструктивный ответ на поставленный в начале работы вопрос: в какой степени теории следует быть близкой к исходной информации. 1
Удобство коэффициентов вариации Bi (r) в качестве сопоставимой меры надежности оценок ari проявляется, в частности, в том, что к ним, как к относительным показателям, можно задавать требования одним числом, например Bi (r) < 0,3. 32
Выбор конкретного критерия для разрешения компромисса “точность – надежность” зависит от поставленной цели анализа временного ряда Х(t), t = 1, ..., N. Этот вопрос следует обсудить особо. Критерий, рассмотренный только что, привел к модели временного ряда k
X t = ∑ aki t i + δ kt
(1.4.9)
i =0
с возможно наименьшими (в среднеквадратическом) значениями δkt и надежными (в смысле критерия (1.4.8)) оценками aki , i = 0, 1,..., k. В дальнейшем будем говорить о ней, как о В-модели. Чтобы воспользоваться всеми преимуществами, которые дает теорема Гаусса – Маркова и развитая на ее основе теория линейного оценивания с помощью метода наименьших квадратов, мы принимаем гипотезу о том, что соответствующий данной модели полином (тренд временного ряда) является оценкой математического ожидания показателя Хt . 1.5. Свойства и назначение моделей временных рядов
Построенная в предыдущем параграфе В-модель временного ряда обладает всеми необходимыми свойствами, чтобы использовать ее в разнообразных задачах анализа. Прежде всего она предназначена для анализа динамических характеристик показателя Х(t) на отрезке наблюдений [1, N]. В отличие от принятых в практике прогнозирования темпов роста точная и надежная полиномиальная регрессия дает не только более глубокую и разностороннюю информацию о временном ряде (в виде значений скорости его изменения во времени, ускорения и прочих динамических характеристик), но и указывает, каким числом таких характеристик определяется поведение временного ряда. В то же время средние за период анализа темпы – чрезвычайно грубые характеристики реальных (экономических) рядов, а погодовые темпы (в количестве N – 1) – это в большей мере другое представление исходной информации о показателе Х(t), чем собственно анализ (имеющий целью сжатие информации и выявление существенных свойств временного ряда). 33
Среди прочих задач анализа, проводимых с помощью “наилучшего” полинома, следует указать на интерполяцию, нахождение нулей, дифференцирование и вычисление различного рода интегралов и сумм. Эти тонкие средства изучения свойств показателей известны в численном анализе как методы аналитической замены. Оцененный на этапе анализа временного ряда полином может быть использован и для целей прогнозирования. Однако задача прогнозирования имеет и другое решение, не являющееся столь непосредственным продолжением задачи анализа, как только что указанное, и при этом в большей мере отвечающее собственно целям прогнозирования. Поэтому прогнозирование временных рядов с полиномиальными трендами будет рассмотрено в специальном параграфе. Свойства временных рядов, изученные с помощью В-моделей, являются определяющими и для решения вопросов их согласования со свойствами уравнений множественной регрессии, в которые эти временные ряды входят в виде функций и факторов. При этом одной из важнейших является проблема мультиколлинеарности факторов (опасность ее возникновения). Покажем с этой целью, что знание степеней k (j) “наиболее точных из допустимых по надежности” полиномов Pk(j) (t) позволяет установить, что факторы уравнения множественной регрессии n
Yt = ∑ c j X j (t ) + εt будут линейно-зависимы, если n > max k ( j ) + 1. j
j =1
(Тем самым все подобные регрессии можно заранее исключить из анализа.) В равенстве
n
n
k ( j ) + 1, ∑ c j X j (t ) = ∑ c j ⎡⎣Pk ( j ) (t ) + δ j (t )⎤⎦ , n > max j j =1
рассмотрим сумму
j =1
n
∑ c j Pk ( j )(t ) .
Из того, что более чем
j =1
max k ( j ) + 1 полиномов со степенями max k ( j ) и менее являются j
j
линейно-зависимыми, вытекает существование таких c j , не всех равных 0, что
n
∑ c j Pk ( j )(t ) = 0 . Обозначим j =1
34
n
∑ c j δ j (t ) через j =1
ζ (t).
Так как средние значения δj (t) равны 0, то и среднее значение ζ (t) будет равно 0 (ζ (t) = 0). Знание средних квадратов (показателей точности) S 2j для δj (t), j = 1, …, n, позволяет определить величину n
среднего квадрата для ζ (t ) : Sζ2 = ∑ c 2j S 2j . Чем меньше величины j =1
S 2j ,
тем меньше будет
Sζ2 .
Это означает, что линейная комбинация
факторов с ненулевыми коэффициентами n
∑ c j X j (t ) = ζ(t )
(1.5.1)
j =1
будет близка (в среднеквадратическом) к нулю. Такая (практическая) линейная зависимость факторов множественной регрессии называется в эконометрии мультиколлинеарностью. Для реальных (экономических) временных рядов точной (математически) линейной зависимости, о которой предупреждает теорема Гаусса – Маркова, никогда не бывает. Но чтобы выяснить, имеет ли место мультиколлинеарность факторов и насколько ее проявление (воздействие на процедуру оценки с помощью метода наименьших квадратов) близко к линейной зависимости, следует оценить средний квадрат Sζ2 . Имея в виду, что последний будет тем меньше, чем меньше средние квадраты S 2j , приходим к следующему заключению: выбор критерия (1.4.8), приводящего к В-моделям (1.4.9), и свойства этих моделей отвечают поставленной цели совместного исследования временных рядов и многофакторных уравнений регрессии. Таким образом, установлено, что для выявления мультиколлинеарности факторов с целью выбора допустимых многофакторных регрессионных моделей достаточно информации о свойствах временных рядов Хj (t), получаемой с помощью В-моделей. Но все ли показатели и свойства В-моделей необходимы при этом? Нетрудно видеть, что мы воспользовались лишь частью из них, а именно: свойством близости полиномов Pk(j) (t) к Xj (t) с характеристиками этой близости и свойством надежности оценок старших коэффициентов полиномов аk(j), на котором основано знание показателей k (j) – степеней этих полиномов. 35
Последнее нуждается в некотором пояснении, для чего вновь обратимся к свойству инвариантности по сдвигу класса по t полиномов. Как уже отмечалось, при временном сдвиге полином Рr (t) степени r остается полиномом той же степени, хотя и с другими коэффициентами ari (i ≠ 1). Но что касается коэффициента аr при старшей степени tr, то он всегда будет одним и тем же. Это и есть единственно подлинный инвариант динамики, описываемой полиномиальной функцией Pr (t), t = 1, …, N. Из сказанного следует, что совсем не обязательно требовать надежности всех коэффициентов полинома, так как надежность только одной оценки старшего коэффициента обеспечивает надежность интересующего нас показателя r – степени полинома. Поэтому, если при разрешении компромисса “точность – надежность” мы обратимся вместо критерия (1.4.8) к критерию надежности оценки одного старшего коэффициента σ(arr ) B(r ) = (1.5.2) < b, r0 ≤ r ≤ r1 , arr то придем к “наиболее точному из допустимых по надежности оценки старшего коэффициента” полиному Рk (t), а вместе с ним к модели X t = Pk (t ) + δ kt , (1.5.3) которую в отличие от В-модели будем называть Вr-моделью. В практических расчетах (для временных рядов длительности N = 10 ÷ 20) поведение критериальных функций (1.4.8) и (1.5.2) в области [r0, r1] таково, что лишь в редких случаях степень, полученная по критерию (1.5.2), будет превосходить более чем на 1 степень полинома, соответствующего критерию (1.4.8). В то же время, будучи менее “жесткой”, Br-модель является более вероятной (более часто отвечающей своему критерию), чем В-модель. Чтобы выяснить, какая модель, а вместе с тем и какие свойства функций Рr (t) отвечают наилучшим образом целям прогнозирования, рассмотрим вначале классический подход к проблеме прогнозирования с помощью уравнения регрессии для случайных величин, а затем обратимся к нашему арсеналу средств – к инвариантам и компромиссу “точность – надежность”. 36
1.6. Прогнозирование временных рядов с параболическими трендами
Задача прогнозирования с помощью уравнений регрессии рассматривается в математической статистике как продолжение задачи анализа, дополняющее ее решение оценкой прогноза и его надежности. При этом указывается, что полиномиальные регрессии самостоятельного интереса не представляют, поскольку они могут быть получены из регрессии для случайных величин общего вида y = a0 + a1 x1 + ...ar xr
(1.6.1)
заменой переменных xi = t i . На основании последнего делается вывод, что достаточно исследовать общий случай. Но это ошибочное заключение. Частное может быть специфичным и вследствие этого обладать свойствами, не присущими общему. Подход к регрессии для временных рядов с полиномиальными трендами как к специфическому случаю уравнений регрессии (с присущим классу полиномов свойством инвариантности по сдвигу во времени) привел к ряду конструктивных результатов, изложенных в предыдущих параграфах. Возможно, что не только в задаче анализа, но и при прогнозировании с помощью полиномиальных регрессий учет специфики объекта приведет к новым результатам. Лучший способ проникновения в специфику лежит на пути выявления возможностей конструктивной модификации общего. Поэтому вначале рассмотрим классический подход к задаче прогнозирования с помощью уравнения (1.6.1)1. С этой целью обратимся к однофакторному уравнению, что более удобно для анализа:
yi = a0 + a1xi + δi , i = 1,..., N .
(1.6.2)
Применяя к уравнению (1.6.2) метод наименьших квадратов, получаем следующую систему (нормальных) уравнений: 1
См., например, Смирнов Н.В., Дунин-Барковский И.В. Краткий курс математической статистики для технических приложений. М.: Гостехиздат, 1959, с. 196. 37
⎧N ⎪∑ ( yi − a0 − a1 xi ) = 0, ⎪ i =1 (1.6.3) ⎨N ⎪ ( y − a − a x ) x = 0. 0 1 i i ⎪∑ i ⎩ i =1 Формулы для оценок параметров будут иметь наиболее простой N
вид, если положить
∑ xi = 0 : i =1
N
a0 =
N
∑ yi i =1
N
,
a1 =
∑ xi yi i =1 N
∑ i =1
.
(1.6.4)
xi2
Получив оценки для a0 и a1 , находим прогнозное значение показателя y в точке x ( y/ x = a0 + a1 x) , а затем дисперсию прогноза ⎛1 x2 ⎞ 2 ⎟ σδ σ 2 ( y/ x) = ⎜ + N ⎜N ⎟ 2 ⎜ ∑ x1 ⎟⎠ ⎝
(1.6.5)
i =1
где σδ2 – дисперсия случайной компоненты δ. Из формулы (1.6.5) следует, что наиболее надежный прогноз будет при х = 0, что соответствует y/0 = a0 . Поэтому имеем σ 2 ( y/0) = σ 2 (a0 ), (1.6.6) и тем самым вопрос о надежности прогноза по уравнению регрессии удается в этом частном случае свести к расчету дисперсии оценки свободного члена уравнения. N
Понятно, что при
∑ xi ≠ 0
формула (1.6.6) и полученный на ее
i =1
основе вывод перестают быть справедливыми. Дисперсия прогноза N
в условиях x =
∑ xi i =1
N
≠ 0 равняется 38
⎛1 σ 2 ( y/ x) = ⎜ + N ⎜ ⎜ ⎝
( x − x )2 ⎞
⎟ σδ 2 ∑ ( xi − x ) ⎟⎟ i =1 ⎠ N
2
(1.6.7)
Она достигает минимума в точке x = x и растет по мере удаления от нее. При x = x прогноз по уравнению регрессии приводит к величине y/x = a0 + a1 x , что отличается от полученного ранее выражения y/0 = a0 . Это объясняется тем, что численные значения оценок a0 (обозначенных в обоих случаях одним и тем же символом) на самом деле различны, хотя сами прогнозные значения совпадаN
ют и равны y , где y =
∑ yi i =1
. Последний свободным членом: они N всегда проходят через точку среднеарифметических ( x , y ) . Это замечательная точка регрессии (“центр тяжести” совокупности наблюденных значений xi , уi , i = 1,..., N), что проявляется, в частности, в простоте формулы (1.6.6), соответствующей случаю прохождения регрессии через эту точку (при x = 0). Несмотря на то, что при x ≠ 0 диспeрсия прогноза y/ x = a0 + a1 x не равна дисперсии свободного члена, в обоих cлучаях ( x = 0 и x ≠ 0 ) y/x = y и проблема сводится к весьма нетрудному расчету дисперсии среднего значения наблюдений функσ2 ции yi , i = 1,…, N. Она, как известно, равна δ , что согласуется N формулами (1.6.5) и (1.6.7). В проведенном анализе классического подхода к прогнозированию с помощью уравнений регрессии (1.6.1) мы усматриваем два интересных и важных для нас момента. Во-первых, это простота, с которой может быть рассчитан показатель σ 2 ( y / x) в точке x = x . Во-вторых, возможность положить x = 0 (что достигается соответствующим сдвигом аргумента) и выразить дисперсию прогноза по уравнению регрессии через дисперсию оценки одного свободного члена a0 . Это наводит на мысль, что обращение к специфическим свойствам полиномиальной регрессии, и прежде всего к инвари39
антности по сдвигу во времени, позволит так трансформировать процедуру расчета дисперсии прогноза, что указанные возможности будут распространены с одной точки на их произвольное множество. Если бы это удалось, то дисперсия прогноза, выраженная формулой, подобной (1.4.3), могла бы быть затабулирована (помимо члена σ δ2 ; или в целом, если условно положить σ δ2 равным 1), что значительно упростило бы прогнозные расчеты с помощью полиномиальных регрессий, устранив, в частности, потребность в их реальных сдвигах по t. В начале данного параграфа отмечалось, что задачу прогнозирования в математической статистике принято рассматривать как продолжение задачи анализа. Это означает, что для временного ряда Х(t), t = 1,..., N, который мы намереваемся прогнозировать, уже построено конкретное (оцененное) уравнение регрессии X t = Pk (t ) = a0 + a1t + … + ak t k .
(1.6.8)
Оно может относиться к типу В-моделей, если мы хотим не только прогнозировать, но и проводить с его помощью тонкий эконометрический анализ временного ряда. Если же наша цель использовать уравнение (1.6.8) в последующем исследовании многофакторных регрессий, где Х(t) – один из ее показателей, то оно будет представлять собой Br-модель. Такой подход к прогнозированию (на основе заранее выбранного уравнения регрессии) не единственно оправданный, но вполне допустимый. Альтернативная точка зрения на необходимые для прогноза свойства уравнения будет обсуждена несколько позднее, а пока будем исходить из того, что с помощью уравнения (1.6.8) рассчитан ряд прогнозных значений в моменты времени N + 1, …, N + j, …, N + p: k
X t = N +1 = Pk ( N + 1) = ∑ ai ( N + 1)i ,…, i =0 k
(1.6.9)
X t = N + p = Pk ( N + 1) = ∑ ai ( N + p ) , i
i =0
и нужно определить их дисперсии σ2 [Pk ( N + 1)] ,..., σ2 [Pk ( N + p )]. 40
(1.6.10)
Начнем с того, что возьмем некоторое произвольное, но фиксированное значение j из диапазона прогнозирования 1 ≤ j ≤ p и осуществим сдвиг временного ряда на N + j единиц времени “влево”: X (t + N + j) , t = − N − j + 1, …, − j. (1.6.11) В последующих действиях будем оперировать с временным рядом (1.6.11) как с исходным. Рассмотрим в этой новой шкале времени, где начало отсчета (t = 0) совпадает с моментом прогнозирования, уравнение регрессии X t = Qk (t ) = α0 + α1t + ... + α k t k . Применяя к нему метод наименьших квадратов
min ( αi )
−j
∑
t =− N − j +1
(1.6.12) 2
⎡α0 + α1t k + ... + α k t k − X (t + N + j)⎤ , ⎣ ⎦
(1.6.13)
получим “наилучший” полином Qk (t ) , обладающий такими свойствами: а) Qk (t ) = Pk (t + N + j ), (1.6.14) б) Qk (0) = Pk ( N + j ) = α0 . Из них вытекает следующая схема прогнозных расчетов: 1) прогнозирование с помощью уравнения регрессии можно проводить в “старой” шкале времени X t =0 = Qk (0) = X t = N + j = Pk ( N + j ),
(1.6.15)
2) дисперсия прогноза в силу свойства (б) из (1.6.14) и формулы (1.4.6) вычисляется как произведение диагонального элемента α 00 (k , j) обратной матрицы для системы нормальных уравнений
(соответствующей критерию (1.6.13)) и дисперсии σ δ2 (k ) (инвариантной по отношению к имевшему место в рассмотренной задаче сдвигу во времени): σ 2 [Pk ( N + j )] = σ 2 (α 0 ) = α 00 (k , j) σδ2 (k ) . (1.6.16) Учитывая, что диагональные элементы обратной матрицы для систем нормальных уравнений в рассматриваемом случае полиномиальной регрессии не зависят от ряда наблюдений, их можно затабулировать. С этой целью автором рассчитана табл. 1.2, в кото41
рой представлены величины α 00 (k , j) для имеющих наибольший практический интерес значений N, k, j. Как и в табл. 1.1, для первых двух из них взяты значения N = 10, 15, 20, k = 1, 2, 3, 4, 5. Для величины j выбран 5-летний горизонт прогноза: j = 1, 2, 3, 4, 5. Данные в табл. 1.2 позволяют увидеть, как быстро с ростом j (при закрепленных N и k) увеличивается компонента дисперсии прогноза α 00 (k , j) (или сама дисперсия, читателю следует представить, что он имеет дело со случаем σ δ2(k ) = 1). Рекомендуя внимательно отнестись к табл. 1.2, как ранее советовали это в отношении табл. 1.1, мы исходим из того, что теоретическая очевидность формулы (1.6.16) не снижает практической ценности приведенных в табл. 1.2 результатов, которые помогут читателю более глубоко изучить свойства и возможности полиномиальных регрессий и эффективно использовать их в задачах прогнозирования временных рядов. Сделаем несколько замечаний относительно схемы прогнозных расчетов. На практике нет необходимости вычислять регрессии для различных начал отсчета времени – это нужно было для разработки табл. 1.2. Нам же достаточно обратиться к уже известному из анализа полиному и найти его значения в точках t = N + j, j = 1,…, p. С помощью также известной из анализа величины σ δ2 (k ) и табл. 1.2 вычисляется дисперсия σ 2 [ Pk ( N + j )] , а затем и относительный показатель качества прогноза σ [Pk ( N + j )] α 00 (k , j )αδ (k ) . (1.6.17) = Pk ( N + j ) Pk ( N + j ) Еще один полезный для характеристики качества прогноза показатель может быть получен, если сопоставить дисперсию прогноB (k , j ) =
за при t = N + j c дисперсией σ2 [Pk (0)] = σ2 (a0 ) в точке t = 0, для которой табл. 1.1 содержит необходимые величины диагональных элементов a00 (k) (k = 1,…, 5): σ2 [Pk ( N + j )] α 00 (k , j ) . (1.6.18) = 00 σ2 [Pk (0)] a (k ) 42
43
20
15
10
N
2 0,1383·101 0,2801·101 0,5145·101 0,8733·101 0,1393·10²
0,7934·100 0,1298·101 0,2027·101 0,3037·101 0,4389·101
0,5535·100 0,8071·100 0,1147·101 0,1588·101 0,2150·101
1
0,4666·100 0,6121·100 0,7818·100 0,9758·100 0,1194·101
0,2952·100 0,3560·100 0,4238·100 0,4988·100 0,5809·100
0,2158·100 0,2489·100 0,2850·100 0,3240·100 0,3661·100
i\r
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
0,1193·101 0,2387·101 0,4447·101 0,7804·101 0,1296·102
0,1839·101 0,4502·101 0,9767·101 0,1925·10² 0,3515·10²
0,3766·101 0,1322·10² 0,3662·10² 0,8641·10² 0,1805·103
3
Диагональные элементы для свободных членов α00 (k, j)
0,2421·101 0,7019·101 0,1743·10² 0,4237·10² 0,8108·10²
0,4111·101 0,1646·10² 0,4878·10² 0,1252·103 0,2807·103
0,1077·10² 0,6859·10² 0,2771·103 0,1025·104 0,1793·104
4
0,4861·101 0,1402·10² 0,4876·10² 0,7112·10² 0,2415·103
0,1089·10² 0,3345·10² 0,1427·103 0,3618·103 0,7574·103
0,4164·10² 0,1865·103 0,8050·103 0,2029·104 0,6681·104
5
Таблица 1.2
Исследуя этот показатель с помощью табл. 1.1 и 1.2, мы приобретаем весьма полезные сведения о тенденции к ухудшению качества прогноза по мере удаления точки N + j от начала координат. (Вместо точки t = 0 можно взять любую другую, например из середины интервала анализа, после чего необходимо провести расчеты диагональных элементов, соответствующих этой новой шкале времени.) Простота и одновременно эффективность представленного выше инструментария прогнозирования подтверждает целесообразность подхода, основанного на изучении специфических свойств исследуемого объекта – полиномиальной регрессии. Обращение к инвариантности по сдвигу позволило выявить особую роль двух коэффициентов этой регрессии: старшего – при проведении анализа и младшего – на этапе прогнозирования. Мы намерены продолжить наши исследования по прогнозированию. Вначале рассмотрим подход, в основе которого лежит разработка модели, отвечающей собственно целям прогнозирования. Это означает, что в процедуру компромисса “точность – надежность” необходимо вместо показателей надежности анализа, характеризующих уравнения регрессии во всех точках периода анализа 1 ≤ t ≤ N , ввести показатель надежности прогноза (характеризующий уравнение регрессии только в точке прогноза t = N + j). Ввиду того, что выбор “наилучшей” модели прогнозирования возможен только среди допустимых регрессионных моделей со степенями полиномов r = r0,…, r1, необходимо сопоставить их с помощью показателей, отражающих надежность прогнозирования (поведение показателей S 2 (r ) и σ2r (r ) известно из задачи анализа). Зафиксируем с этой целью некоторую величину j из диапазона [1, р] и рассмотрим две совокупности полиномиальных регрессий – с полиномами Pr (t ) , r = r0 ,..., r1 , и полиномами Qr (t ) = Pr (t + N + j ) , смещенными на N + j единиц времени “влево”, в сторону отрицательных значений t. Из свойства инвариантности полиномов по сдвигу следует идентичность их показателей S 2 (r ) и σ 2r (r ) соответственно для Pr (t ) и Qr (t ) . 44
Опираясь на свойство (б) из формулы (1.6.14), вычислим прогнозные значения X t = N + j = Pr ( N + j ) = α 0 (r , j ) , а затем их дисперсии σ 2 [α 0 (r , j )] = α 00 (r , j ) σ δ2 (r ), определяемые по формуле (1.6.16). При выборе “наилучшей” регрессии для целей прогнозирования можно руководствоваться тем или иным критерием, важным с содержательных позиций (выбор критерия – не математическая задача). В качестве первого из них рассмотрим минимум дисперсии прогноза на j единиц времени: min σ2 [Pr ( N + j )] = min α 00 (r , j ) σδ2 (r ). (r )
(r )
(1.6.19)
В условиях когда практический диапазон [r0, r1] включает не более пяти значений r (порядков регрессии), простейшая математически реализация критерия (1.6.19) – это перебор значений дисперсий прогноза. Обращаясь вновь к табл. 1.2 (в случае необходимости ее легко рассчитать для промежуточных значений N и j ≥ 6), найдем значение диагональных элементов α 00 (r , j ) для интересующих нас j, N и r, а отвечающие значениям N и r дисперсии σ2r (r ) возьмем из задачи анализа. Учитывая характер изменения
величин α 00 (r , j ) и σ2r (r ) с ростом r, следует ожидать, что для всех j = 1,…, р в качестве “наилучшей” регрессии получим X t = Pr 0 (t ) . Эта регрессия навряд ли была бы признана “наилучшей” для анализа, да мы и не предлагаем ее для этого, так как сейчас решаем другую задачу и руководствуемся при этом другим критерием. Второй подход, использующий в качестве основы для выбора модели прогнозирования изменение показателей σ2 [Pr ( N + j )] в зависимости от r (при заданных N и j), предполагает, что мы располагаем разумной (исходящей из знания реальной динамики σ2
[Pr ( N + j )]
оценкой допустимой дисперсии прогноза σ2j на пери-
од j (j = 1,…, p). Одновременно мы стремимся достичь максимальной близости регрессии и ряда наблюдений, т.е. минимума S2(r) . 45
Совмещение этих двух требований ⎧σ2 [Pr ( N + j )] ≤ σ2j ; ⎪ (1.6.20) ⎨ S 2 (r ), ⎪⎩min (r ) приводит к “наиболее точной из допустимых по дисперсии прогноза” модели прогнозирования. Интересным развитием этих процедур является выбор моделей в условиях изменяющихся периодов обработки наблюдении, когда для данного временного ряда X(t) с ростом периода прогноза j используются данные за отрезок времени t = j, j + 1,..., N (или за какой-либо другой сокращенный отрезок, но, как правило, включающий самые последние наблюдения). Связанное с этим усложнение динамики показателей, входящих в критерии (1.6.19) и (1.6.20), не затрудняет процедуры выбора “наилучших” моделей прогноза, так как их реализация в условиях небольшого диапазона возможных степеней полиномов и периодов обработки наблюдений легко осуществляется методом перебора. Перечень возможных критериев, исходящих из этой абсолютной меры надежности прогноза, нетрудно продолжить. Однако ограничимся изложенным и перейдем к обсуждению процедур выбора “наилучших” моделей прогнозирования, основанных на показателе относительной надежности прогноза:
B0 (r , j ) =
σ [Pr ( N + j )] α 00 (r , j )σδ (r ) . = Pr ( N + j ) Pr ( N + j )
(1.6.21)
Здесь также возможны два критерия, аналогичных по виду (1.6.19) и (1.6.20): min B0 (r , j ), (1.6.22) (r )
и
⎧B0 (r , j ) ≤ bj , ⎪ ⎨min S 2 (r ), ⎪⎩ ( r )
(1.6.23)
где b j в формуле (1.6.23) означает верхнюю допустимую границу коэффициента вариации прогноза на время j. 46
Выбор “наилучших” моделей, отвечающих данным критериям, лучше всего проводить указанным выше способом перебора, так как про динамику (по r) входящего в эти критерии показателя [Pr ( N + j )] и ее воздействие на их результирующее поведение сказать заранее что-либо определенное невозможно. Как и в случае анализа временных рядов, мы считаем показатель относительной надежности B0 (r , j ) в большей мере отвечающим практическим требованиям к качеству модели, чем показатель абсолютной надежности σ 2 [Pr ( N + j )] . Отмечая это обстоятельство, мы ввели для “наилучших” с точки зрения критериев (1.6.22) и (1.6.23) регрессионных моделей прогнозирования специальное название – В0модели (второй символ означает “нуль”, чем подчеркивается особая роль нулевого коэффициента α0 (r, j) в задаче прогнозирования). Среди представляющих интерес модификаций процедур выбора, основанных на критериях (1.6.22) и (1.6.23), отметим уже упоминавшуюся возможность сокращения периода обработки наблюдений. Действуя в соответствии с избранным для конкретной задачи прогнозирования критерием, отберем “наилучший” для каждого j полином Pk (t) (не обязательно одной и той же степени для всех j из диапазона [1, р]) и соответствующие ему показатели, отражающие как надежность прогнозирования (с позиций которых были отобраны эти полиномы), так и точность приближения и надежность оценок коэффициентов аki , i = 0, 1,…, k, полиномов Pk (t) (характеризующие их свойства с позиций задачи анализа). Ввиду того, что строгое сопоставление показателей по r и j возможно только в условиях одного и того же периода наблюдения, этот последний случай (постоянства периода [1, N]) будет рассматриваться в качестве основного как для задач анализа временных рядов, так и их прогнозирования. Заметим в заключение, что для проведения прогнозных расчетов достаточно той информации о допустимых регрессионных моделях, которую мы получили на этапе анализа. Нет и потребности в переходе к сдвинутым по времени регрессиям: необходимые для выбора ‘‘наилучших’’ В0-моделей характеристики качества прогнозирования содержатся в табл. 1.2. 47
1.7. Модель как результат целенаправленного изучения свойств информации
В этом параграфе, заключающем раздел I, дается сводная оценка основных гипотез и принципов использованных при формировании моделей анализа и прогнозирования временных рядов с параболическими трендами. Приступая к исследованию, одним из первых был рассмотрен вопрос о точности исходной формации. То, что нет абсолютно точных наблюдений, известно, но известно и то, что нет и абсолютно точных теорий. Конструктивное разрешение вопроса о точности наблюдений и теории, использующей эти наблюдения, лежит в следующей плоскости. Если точность теории высока и требует повышения исходной точности наблюдений, то обращаться к ней следует в том случае, если имеется возможность улучшить показатели точности наблюдений. Последнее предполагает либо увеличение числа наблюдений, либо наличие априорных знаний о статистических свойствах ошибок. Если точность наблюдений и теории (например, макроэкономических временных рядов и регрессионного анализа и прогнозирования) примерно одинаковы (одного порядка), то возможны два подхода. В первом – теория исходит из наличия ошибок в исходных данных. В уравнения вводится помимо ошибки, отражающей неточность данного уравнения (теории) по отношению к неизвестному истинному, случайная компонента, учитывающая не- точность наблюдений (два источника неточности описания объекта). Этот подход конструктивен только в том случае, если последующая методология оценки параметров модели процесса дифференцированно относится к указанным выше двум ошибкам. Последнее опять-таки предполагает знание статистических свойств ошибки наблюдений. Так как в рассматриваемом нами случае этого нет, то мы избрали другой (второй) подход, а именно – ввели гипотезу о точности наблюдений. Ее суть в предположении, что неточность теории (которую мы намерены применить) позволяет смотреть на исходную информацию Х(t), t = 1,…, N, как на точную. Тем самым мы решили взамен истинного исследовать экономический показатель, несколько отличающийся от него, но такой, что результаты его ана48
лиза (с помощью неточной теории) считаем возможными для распространения и на истинный показатель. Данная гипотеза относится к области философии (рассуждений), но имеет вполне конструктивные последствия. А именно, в стохастической модели временного ряда (уравнении регрессии) мы имеем теперь дело только с одной ошибкой – отражающей неточность теории. Можно было бы не принимать (явно) гипотезу о точности, что обычно и делается. Но в этом случае мы просто оставили бы этот вопрос в неконструктивной плоскости, что является также решением, только не лучшим. Мы решили поступить иначе, так как принятие этой гипотезы вносит ясность в постановку задачи и одновременно упрощает ее решение, давая строгую (детерминистскую, а не вероятностную) меру точности S2 (r). Опираясь на свойства показателя S2 (r), мы обосновали важнейшую процедуру обработки исходной информации – разбиение временного ряда Х (t), t = 1,..., N, на полиномы Рr (t) и невязки δr (t) для значений r от 1 до N – 1. Особый интерес представляет область значений r0′ < r < r1′ , где показатель S2 (r) после быстрого убывания до значений r0′ начинает убывать медленно. Геометрическая интерпретация этого явления весьма очевидна, а именно, векторы {1, t,..., t r } при подходе r к r1′ становятся практически коллинеарными (“смотрят примерно в одну и ту же сторону”). Разбиение Х (t), t = 1,..., N, для r = 1, ..., N – 1 и определение области r0′ < r < r1′ дали возможность подойти к анализу временного рада с позиций двух наиболее важных для практики критериев – точности и надежности приближающих полиномов. Чтобы разработать вопрос об оценке надежности, необходимо было обратиться к новому взгляду на проведенные разбиения временного ряда, а именно, в области значений r0 < r < r1 (r0′ < r0 , r0 < r1′) этим разбиениям были поставлены в соответствие стохастические (регрессионные) модели. Гипотеза о свойствах белого шума для ошибок этих моделей позволила обратиться к теореме Гаусса – Маркова и применить для получения необходимых нам эффективных оценок параметров метод наименьших квадратов. 49
В качестве критериальных показателей надежности были использованы дисперсии оценок коэффициентов полиномов и коэффициенты вариации этих оценок, т.е. точечные оценки. Отказ от интервальной меры надежности в виде доверительных интервалов объясняется нашим стремлением не выходить за рамки двухмоментных характеристик случайной компоненты уравнения регрессии и не привлекать ее к анализу необходимой для интервальных оценок гипотезы о нормальности. Затруднения с ее проверкой в условиях небольших N уменьшают достоверность выводов, делая их зависимыми от дополнительного звена “если …, то”. Тем самым мы предпочли ограничиться простым, но надежным показателем, чем ввести более изощренный, но уменьшающий достоверность выводов. Сведение вопроса о выборе модели к сопоставлению только двух указанных выше качеств удовлетворяет высказанному в работе принципу, учитывающему специфику регрессионных моделей временных рядов: единственное назначение факторов {1, t ,..., t r } – точное и надежное представление значений Х (t), t = 1,…, N, с помощью регрессий X t = Pr (t ) + δrt . Последующее изучение проблемы выбора “наилучших” моделей выявило целесообразность дифференцированного подхода к ним в зависимости от цели исследования. В качестве последней были рассмотрены задачи анализа временных рядов, исследование свойств многофакторных регрессий и два типа прогнозных расчетов. Опираясь на свойство инвариантности по сдвигу полиномов, мы предложили ряд конкретных критериев для выбора “наилучшей” регрессии. При этом оказалось, что два коэффициента полиномов (и связанные с ними меры надежности) играют наиболее существенную роль: старший коэффициент – в задачах анализа и младший в задачах прогнозирования временных рядов. Ориентация в процессе исследования не только на общие, но и на специфические свойства полиномиальных регрессий была одним из основных принципов нашего подхода. Итак, с самого начала мы шли к определенной цели разработать прямые и надежные (с короткими цепочками прямых рассуждений в условиях минимального числа гипотез) методы анализа и прогно50
зирования временных рядов. Помимо этой (конечной) цели были цели промежуточные: обеспечить строгую меру точности приближения, сделать простыми и наглядными показатели надежности, дифференцировать требования к показателям качества моделей, исходя из цепей анализа и прогноза, и т.д. Для этого мы обратились к следующим гипотезам: о точности исходных наблюдений; о стохастической независимости (белом шуме) компонент δrt; о полиномиальном тренде как оценке математического ожидания временного ряда. Это был минимум гипотез, без них мы не могли ни строго ввести показатели точности и надежности, ни обеспечить применимость метода наименьших квадратов. Можно спросить: как же обстоит дело с самой первой и, возможно, с самой главной предпосылкой проведенного исследования – о принадлежности временных рядов к классу рядов с полиномиальными трендами? Ведь единственное, в чем мы убедились – это, что, приняв в качестве рабочей одну из ‘‘наилучших’’ моделей (типа В, Вr или В0), можно быть уверенным лишь в ее согласии с исходными наблюдениями и целью исследования. Но то, что модель с полиномиальными трендами находится в согласии с наблюдениями (не отвергается), не означает, что она истинная и мы действительно имеем дело с временным рядом данного класса. Ведь неотвергнутыми могут оказаться и другие модели. На это следует сказать, что такова логика проверки любых моделей (гипотез) в математической статистике (да и не только в ней): принимая в качестве рабочей некоторую (неотвергнутую) модель, мы имеем дело не с абсолютной истиной, а с относительной (всего лишь не противоречащей практике, в данном случае наблюдениям). Однако в практических задачах прежде всего важно знать, что данная (относительная) истина близка к абсолютной, “хорошо аппроксимирует” ее, и когда мы получаем “точную и надежную” модель временного ряда, то как раз и имеем дело с “хорошей аппроксимацией” абсолютной истины, которая по своим статистическим (вычислительным) свойствам вправе представлять ее в дальнейшей обработке информации. Что касается представленных выше трех гипотез, то это гипотезы в буквальном смысле слова, строго проверить которые (не от51
вергнуть или отвергнуть) исходная информация и существующие статистические методы не позволяют. Принимая их, мы исходим исключительно из конструктивных соображений – возможности апеллировать к теореме Гаусса – Маркова, являющейся теоретической основой оценивания параметров линейных регрессионных моделей с помощью метода наименьших квадратов. При реализации поставленных целей исследования мы опирались на ряд методологических принципов. Их можно было изложить в самом начале работы, но тогда это были бы принципы, которыми автор (всего лишь) намеревается руководствоваться, что, естественно, менее интересно, чем в случае, когда излагаются принципы, которыми он действительно руководствовался. В последнем же можно убедиться только после прочтения. Поэтому мы считаем своевременным привести эти принципы именно сейчас. Вот они: целенаправленность изучения свойств временных рядов (исходной информации) и их моделей; минимум гипотез о статистических свойствах информации и моделей; обращение к прямым и коротким цепочкам выводов; учет специфичности свойств полиномиальных уравнений регрессии; выбор инвариантности по сдвигу в качестве основного специфического свойства полиномиальных регрессий; подход к точности и надежности как к единственным мерам (показателям) качества этих регрессий; обращение к компромиссу “точность – надежность” как к конструктивному инструменту выбора “наилучших” регрессий; дифференцированность процедур выбора “наилучших” регрессий в зависимости от поставленной цели. Дальнейшая логика исследований ведет нас к вопросам построения и оценки параметров многофакторных регрессий, связывающих временные ряды с полиномиальными трендами.
52
Раздел 2. МНОГОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ
Исследование уравнений множественной регрессии, которому посвящен данный раздел работы, проводится под различными углами зрения, но всегда с позиций согласования их свойств со свойствами временных рядов функций и факторов (аргументов) уравнений. Вначале, опираясь на выявленные с помощью методов, описанных в разделе I, свойства временных рядов, рассмотрим те регрессии, для которых в силу теоремы Гаусса – Маркова возможны статистически надежные оценки их параметров. Учитывая, что при этом мы не оказываем никакого активного воздействия на свойства отдельных временных рядов и связывающих их уравнений, о данном подходе будем говорить как о пассивном согласовании свойств временных рядов и уравнений множественной регрессии. Затем перейдем к вопросам оценки параметров уравнений в отклонениях. Обсудим тесно связанную с ними теорему Фриша – Воу о равенстве оценок уравнения множественной регрессии, полученных двумя способами – на основе временных рядов с исключенными полиномиальными трендами (т.е. с помощью одних только отклонений δj (t), j = 0, 1,..., n) и при введении в уравнение с исходными временными рядами полинома с неопределенными коэффициентами. Это подготовит читателя к рассмотрению измерительных особенностей уравнений множественной регрессии для показателей с полиномиальными трендами при наличии в уравнениях свободных членов, или в более общем случае – полинома с неопределенными коэффициентами. Полученные при этом результаты будут использованы для разработки подходов к согласованию двух функций уравнения множественной регрессии: как модели, отображающей содержание и структуру исследуемого экономического процесса (функция – описание процесса), и как модели, позволяющей корректно оценить параметры исследуемого процесса (функция – измерение параметров процесса). Обращение наряду с уравнениями регрессии общего вида к двум частным случаям – производственным функциям и 53
уравнениям с распределенными лагами – позволит более наглядно и всесторонне исследовать как саму проблему согласования указанных двух функций, так и применяемые для ее решения средства. Эти последние являются ни чем иным, как методами активного воздействия на свойства уравнений регрессии и входящих в них временных рядов. Их цель – привести уравнение множественной регрессии, построенное в соответствии с требованиями адекватного описания существа исследуемого процесса, к виду, для которого возможна корректная оценка параметров на основе теоремы Гаусса – Маркова, а следовательно, отыскание той формы, в которой уровнение регрессии успешно соединяет в себе обе указанные выше функции. 2.1. Основные свойства уравнений множественной регрессии для временных рядов с параболическими трендами
Совместное исследование свойств уравнений множественной регрессии и входящих в них временных рядов функции и факторов позволяет проверить, соблюдены ли важнейшие условия теоремы Гаусса – Маркова (линейная независимость факторов и отсутствие тренда у ошибок уравнений) еще до проведения решения уравнений (оценивания е помощью наименьших квадратов). Поэтому оно является инструментом не только анализа, но и синтеза уравнений, для которых возможно получить несмещенные и эффективные оценки параметров исследуемого экономического процесса. В п. 1.5 было показано, что если для временных рядов факторов X j (t ) определить c помощью Вr-моделей “наиболее точные из допустимых по надежности старших коэффициентов” полиномы Pk ( j ) (t ) , то все регрессии n
Yt = ∑ c j X j (t ) +εt
(2.1.1)
j =1
с числом переменных в правой части n > max k ( j ) + 1 можно зараj
нее исключить из рассмотрения как уравнения с мултиколлинеарными (практически линейно-зависимыми) факторами. 54
Продолжим исследование, предположив, что для всех временных рядов факторов и функции, т.е. включая Y(t), были определены с помощью Br-моделей “наилучшие” полиномы Pk ( j ) (t ) , j = 0, 1,…, n, где Pk (0) (t ) – полином для Y(t), а вместе с ними и соответствующие им компоненты δ j (t ) . Из условий теоремы Гаусса – Маркова следует, что факторы уравнения (2.1.1) {X1(t),…, Хn(t)} должны быть линейнонезависимыми функциями, а ошибка εt – белым шумом. Как уже отмечалось, в практических ситуациях точной линейной зависимости факторов никогда не бывает, но возможна их мультиколлинеарность n
∑ c j X j (t ) = ζ(t ),
(2.1.2)
j =1
в условиях которой коэффициенты c j не равны 0, а величина ζ (t) имеет нулевой тренд и близка в среднеквадратическом к нулю. Помимо указанного выше случая n > max k ( j ) + 1 , мультиколлинеj
арность будет наблюдаться и в тех ситуациях, когда имеется хотя бы одно подмножество факторов, в котором их число превышает более чем на 1 максимальную степень соответствующих этим факторам полиномов. Имея в виду, что пропорциональность (коллинеарность) двух полиномов одной и той же степени, т.е. равенство Pk (i ) (t ) = aPk ( j ) (t ) , – весьма маловероятное событие для реальных временных рядов, отмеченные только что ситуации будут практически единственно опасными. Их выявление с помощью полученных на основании Вr-моделей степеней полиномов k ( j ), j = 1,..., n, является простым и одновременно действенным инструментом селекции уравнений множественной регрессии, пригодных для оценки параметров интересующих нас экономических процессов. Однако лишь одной линейной независимости полиномиальных трендов факторов недостаточно, чтобы гарантировать соблюдение другого важного условия теоремы – нулевого тренда у ошибки уравнения (белый шум – стационарный процесс с нулевым математическим ожиданием). Может оказаться, что у εt вопреки теорети55
ческим предположениям имеется временной тренд. Это будет в том случае, если вся совокупность полиномов Pk (0) (t ) , Pk (1) (t ) ,…,
Pk ( n) (t ) , т.е. включая и полином для временного ряда функции, будет также линейно-независимой. Поэтому, чтобы условие M εt = 0 выполнялось, необходимо также наличие линейной зависимости указанных полиномов n
∑ c j Pk ( j ) (t ) = 0, j =0
c0 = 1.
(2.1.3)
На практике при использовании метода наименьших квадратов среди оценок c1 ,..., cn не будет ни одной в точности равной 0, поэтому можно говорить о линейной зависимости (2.1.3) при c j ≠ 0, j = 0, 1,…, n. Cледует заметить, что ненулевая величина коэффициентов c j неслучайна, что может быть обосновано и теоретически (до проведения вычислений), ведь имея дело с конкретными экономическими процессами, мы под “факторами” всегда понимаем реальные, т.е. с ненулевыми воздействиями на функцию, причины. Нулевое воздействие означает ортогональность фактора по отношению к функции, которая столь же маловероятна, как и отмеченная выше коллинеарность двух факторов. В условиях когда функция уравнения регрессии Yt является результатом аддитивного действия n немультиколлинеарных факторов с ненулевыми весами, степень ее трендового полинома k(0) будет равна максимальной степени трендовых полиномов факторов max k ( j) . Учитывая далее линейную независимость полиномов 1≤ j ≤ n
Pk ( j) (t ) , j = 1,…, n, и то обстоятельство, что известна максимальная
степень этих полиномов max k ( j) , будем иметь следующие нера1≤ j ≤ n
венство: n ≤ max k ( j ) + 1 . Наряду с этим неравенством должно со1≤ j ≤ n
блюдаться неравенство n + 1 ≥ max k ( j ) + 1, отражающее в указан1≤ j ≤ n
ной выше ситуации необходимое условие для равенства (2.1.3). Совмещая представленные здесь неравенства, будем иметь n = max k ( j ) + 1. 1≤ j ≤ n
56
Проведенные рассуждения позволяют прийти к выводу, что необходимыми и достаточными условиями отсутствия временного тренда у ошибки εt уравнения множественной регрессии (2.1.1) с немультиколлинеарными факторами являются два следующих равенства: ⎧⎪k (0) = max k ( j ) 1≤ j ≤ n (2.1.4) ⎨ ⎪⎩n = k (0)+ 1. Возможно, что в реальной ситуации степени полиномов, оцененные с помощью Br-моделей, и число факторов уравнения регрессии не будут удовлетворять условиям (2.1.4), и тогда возникает необходимость в коррекции свойств уравнения и (или) временных рядов (активный подход к согласованию). Однако на данном этапе исследования, при пассивном подходе к согласованию свойств уравнения регрессии и временных рядов, будем считать, что условия (2,1.4) соблюдены и тем самым интересующие нас свойства рядов и уравнения регрессии согласованы. Заметим, что в уравнении (2.1.1) не выделен в качестве самостоятельного слагаемого так называемый свободный член. Мы не сделали этого сейчас по той причине, что в дальнейшем намереваемся специально рассмотреть вопрос об уравнениях регрессии со свободными членами. Если условия (П.1.4) соблюдены, а ошибка уравнения (2.1.1) является белым шумом, то в силу теоремы Гаусса – Маркова мы имеем возможность точно и надежно (с несмещенными и эффективными оценками коэффициентов) разложить вектор-функцию Yt по образующей линейно-независимый базис системе вектор-факторов {X1 (t ),…, Х n (t )} , используя с этой целью метод наименьших квадратов: 2 N ⎡ n ⎤ min ∑ ⎢∑ c j X j (t ) − Y (t )⎥ (2.1.5) cj ⎢ j =1 t =1 ⎣ ⎦⎥ Именно эта интерпретация оценки уравнения множественной регрессии как результата разложения вектор-функции в целом (а не какой-либо его части в виде отклонений от тренда или от среднеарифметического значения ряда) по экономически содержательным вектор-факторам, причем также в целом (а не по их частям указан57
ного вида), принимается нами как адекватная задаче измерения роли вклада факторов при их аддитивном воздействии на функцию, когда эти последние заданы временными рядами с параболическими трендами. Апелляция к указанному механизму оценки позволяет еще до разработки самого уравнения регрессии определить, сколько параметров исследуемого экономического процесса может быть оценено, если известна степень трендового полинома у функции Yt . Для этого необходимо исследовать временной ряд Y(t), t = 1,…, N, с помощью изложенной в первом разделе работы методологии. Построение Br-модели дает ответ на вопрос: какую степень имеет “наиболее точный из допустимых по надежности оценок старших коэффициентов” полином Pk (0) (t ) ? Это означает, что установлен предел надежности разложения вектор-функции Yt по вектор-факторам, являющимися полиномами с произвольными, но фиксированными коэффициентами. В качестве таких полиномов (не конкретизируя их) можно мыслить полиноминальные тренды факторов будущего уравнения регрессии. Так как полиномы линейно-независимы, то соответствующие им факторы немультиколлинеарны. Предельное число таких (немультиколлинеарных) факторов равно k (0) + 1. Тем самым мы доказали возможность заранее указать число параметров исследуемого экономического процесса, которое может быть оценено с помощью метода регрессии. Сформулируем полученный результат в виде следующей теоремы. Основная теорема об измерении с помощью метода множественной регрессии Число параметров n исследуемого процесса с показателями в виде временных рядов с полиномиальными трендами, которое может быть оценено с помощью метода множественной регрессии, равно k (0) + 1, где k(0) – степень полинома у тренда функции Yt . 2.2. Уравнения регрессии для отклонений от трендов и теорема Фриша – Воу
Обращение к общим свойствам классических уравнений регрессии (для функций и факторов в виде случайных величин) с одно58
временным учетом специфики рассматриваемого нами случая временных рядов с полиномиальными трендами оказалось конструктивным приемом исследования, позволившим решить ряд поставленных в первой части работы проблем. Теперь мы воспользуемся этим приемом для исследования уравнений множественной регрессии функции, и факторы которых заданы временными рядами с полиномиальными трендами, и постараемся ответить на следующие вопросы: почему отклонения от математических ожиданий случайных величин и стационарных временных рядов приводят к тем же оценкам коэффициентов регрессии, что и показатели в целом? Сохраняется ли это свойство для интересующих нас регрессий? Верна ли теорема Фриша – Воу (о равенстве оценок уравнений для исходных переменных и их отклонений от трендов)? Начнем с первого из указанных вопросов. Вновь обратимся к линейной регрессии для случайных величин y = a0 + a1 x1 + ... + an xn ;
(2.2.1)
будем считать, что для нее выполняются условия теоремы Гаусса – Маркова и поэтому несмещенные и эффективные оценки коэффициентов a0 , a1 ,..., an могут быть получены с помощью метода наименьших квадратов: N
min ∑ (a0 + a1 x1 j + ... + an xnj − y j ) . 2
(ai ) j =1
(2.2.2)
Дифференцируя выражение (2.2.2) по a0 и приравнивая результат 0, получаем y = a0 + a1 x1 + ... + an xn , (2.2.3) N
N
∑ xij где
xi =
j =1
∑ yj , i = 1,…, n; y =
j =1
– среднеарифметические N N значения (оценки математических ожиданий) факторов и функции. Уравнение (2.2.3) выражает свойство линейных регрессий, а именно: точка среднеарифметических значений функции и факторов ( x1 ,..., xn , y ) принадлежит линии (гиперплоскости) регрессии (2.2.1). Ввиду того, что условие (2.2.3) всегда выполняется для 59
уравнений регрессии со свободными членами, можно заранее (до применения метода наименьших квадратов) из уравнения (2.2.1) вычесть равенство (2.2.3): y − y = a1 ( x1 − x1 ) + ... + an ( xn − xn )
(2.2.4)
и проводить оценку коэффициентов a1 ,..., an сразу для уравнения регрессии (2.2.4). Введем следующие обозначения: δ0 j = y j − y , δij = xij − xi , i = 1,… , n, и представим уравнение (2.2.4) с помощью только что введенных величин: δ0 j = a1δ1 j + … + an δnj + ε j , j = 1,…, N ,
(2.2.5)
где ε j – ошибка уравнения (одна и та же величина для данного и исходного уравнений). Так как входящие в уравнение регрессии (2.2.5) величины являются не чем иным, как отклонениями исходных значений (наблюдений) функции и факторов от оценок их математических ожиданий (среднеарифметических значений), то про данное уравнение можно говорить как про уравнение в отклонениях. В исходном уравнении регрессии (2.2.1) на свободный член a0 можно смотреть как на коэффициент при 1, а эту последнюю рассматривать как величину того же самого класса, что и математические ожидания функции и факторов (константы). Иначе говоря, 1 можно интерпретировать как величину, пропорциональную результирующему воздействию на функцию y всей совокупности математических ожиданий факторов xi , i = 1,…, n, а само слагаемое а0 · 1 – как равное этому воздействию. Представленное выше позволяет сделать утверждение, практически повторяющее содержание теоремы Фриша – Воу1 (относящейся к временным рядам с полиномиальными трендами): оценки коэффициентов a1 ,..., an , полученные с помощью метода наименьших квадратов для уравнения в отклонениях (2.2.5), будут равны соответствующим оценкам для уравнения в целом (2.2.1); 1
См., например, Тинтнер Г. Введение в эконометрию. М.: Статистика, 1965, с. 292–293. 60
при этом (следствие утверждения) совсем не обязательно находить математические ожидания функции и факторов и вычитать их из наблюденных значений y j и xij , xit = 1,..., n, достаточно ввести в уравнение в целом слагаемое a0 ⋅ 1 с неопределенным коэффициентом a0 , отражающее воздействие на функцию совокупности математических ожиданий факторов (констант). Аналогичное утверждение можно сделать и в отношении уравнений множественной регрессии для показателей заданных стационарными временными рядами: yt = b0 + δ0t , xit = bi + δit , i = 1,…, n; t = 1,…, N, где b0 и bi , i = 1,…, n, – постоянные во времени математические ожидания, а δ0t и δit , i = 1,…, n, – отклонения от них – стационарные временные ряды с нулевыми математическими ожиданиями. В отношении только что написанных уравнений можно по аналогии с моделями временных рядов с параболическими трендами ( yt = a0 + a1t + ... + ar t r + δ0t и т.д.) сказать, что они являются моделями разбиения временных рядов на детерминированную составляющую (“тренд” в виде прямой, параллельной оси времени) и случайную стационарную компоненту с нулевым математическим ожиданием. Принципиальным отличием этих моделей от случая моделей временных рядов с параболическими трендами является единственность (однозначность) гипотезы о виде тренда (прямая, параллельная оси времени). Поэтому метод наименьших квадратов N
N
min ∑ (b0 − yt ) ; min ∑ (bi − yit ) , i = 1,..., n, b0
2
bi
t =1
2
(2.2.6)
t =1
совмещает в данном случае как процедуру поиска “наилучшей” модели, так и оценки ее параметров bi , i = 0, 1,…, n. Для последних мы получаем оценки в виде среднеарифметических значений покаN
зателей b0 =
∑ yt t =1
N
= y и bi =
∑ xit t =1
= xit , i = 1,..., n, что совпадает с N N только что рассмотренными оценками математических ожиданий для случайных величин. 61
Доказательство утверждения, аналогичного теореме Фриша – Воу, для уравнения множественной регрессии со свободным членом и показателями в виде стационарных временных рядов полностью повторяет только что рассмотренное (для случайных величин). Теперь обратимся к уравнениям множественной регрессии для временных рядов с параболическими трендами и к сформулированному в отношении них Фришем и Воу утверждению о равенстве оценок коэффициентов c1 ,..., cm , полученных для двух следующих уравнений регрессии: m
Yt = ∑ c j X j (t ) +
и
j =1
n
∑
j = m+1
cjt j −m −1 + εt
(2.2.7)
m
δ0t = ∑ c j δ j (t ) + εt , t = 1, ..., N . j =1
В первое уравнение входят временные ряды в целом (суммы полиномов и отклонений), а во второе – одни отклонения. Чтобы получить из первого второе, необходимо располагать выражением, подобным условию (2.2.3), но связывающим не среднеарифметические значения функции и факторов (которые в данном случае уже не являются оценками математических ожиданий показателей регрессии), а их полиномиальные тренды (оценки математических ожиданий). В качестве такового может быть взято одно из условий, обеспечивающих применимость теоремы Гаусса – Маркова к уравнениям множественной регрессии рассматриваемого нами класса, а именно – условие линейной зависимости полиномиальных трендов функции и факторов. Эти последние представлены m временными рядами X j (t ), j = 1,…, m, и n – m степенными функциями X j (t ) = t j − m −1 , j = m + 1,…, n. Соответствующие им полиномиаль-
ные тренды равны Pk ( j) (t ), j =1,…, m, и Pk ( j) = t j − m −1 , j = m + 1,…, n (n – m – 1 = k (0)). Напишем для них и полинома Pk ( j) (t ) ) – тренда функции условие линейной зависимости: m
Pk (0) (t ) = ∑ c j Pk ( j) (t ) + j =1
62
n
∑
j = m +1
c j t j −m −1.
(2.2.8)
Вычитая выражение (2.2.8) из первого уравнения регрессии (2.2.7), получим интересующее нас уравнение в отклонениях – второе в формуле (2.2.7). Так как мы рассматриваем только такие регрессии, для которых условие (2.2.8) выполняется, то всегда наряду с первым из уравнений (2.2.7) существует и второе. Вместе с условием (2.2.8) это второе уравнение будет эквивалентно первому. Поэтому можно сделать вывод (как считают авторы теоремы) о равенстве оценок коэффициентов c1 ,..., cm в обеих регрессиях (2.2.7), а также о том (следствие теоремы), что совсем не обязательно вычитать тренды из функции и факторов, а достаточно ввести в уравнение регрессии в целом полином с неопределенными коэффициентами (максимальной степени по отношению к трендовым полиномам). Мы поставили вопрос, верна ли теорема Фриша – Воу, и тем самым выразили сомнение в ее верности. На первый взгляд, в теореме нет логических погрешностей. Однако данная теорема формулирует не только (и не столько) математические свойства эквивалентности двух рассматриваемых в ней уравнений регрессии, но и (прежде всего) статистические (вычислительные) свойства, необходимые для равенства оценок (численных значений) коэффициентов этих уравнений. Поэтому следует более внимательно проанализировать достоверность сделанных авторами утверждений. Чтобы разобраться в этом, обратимся к исследуемым в данной работе моделям временных рядов X t = Pt (t ) + δ rt , характерной особенностью которых является малость (в среднеквадратическом) случайной компоненты δrt по отношению к Pt (t ) . Хотя условие малости случайной компоненты не фигурирует в явном виде в разработанных нами в разделе I работы методах анализа и прогнозирования временных рядов, косвенно оно присутствует в критериях качества решений (см. формулы 1.4.8), (1.5.2) и подобные им). Поэтому для количественной оценки степени малости σδ по сравнению с Pk (t ) (в некоторой точке t или в среднем за период [1, N]) необходимо обратиться к модели временного ряда, отобранной как “наилучшая” с точки зрения поставленной цели σδ σδ исследования, и вычислить для нее отношение или Pk (t ) Pk (t ) 63
σδ
, поскольку δ(t ) = 0). В практических расчетах эти X (t ) отношения имеют обычно величину порядка нескольких процентов и редко превышают 15–20 % (имеются в виду случаи, для которых существуют “наилучшие” модели). Принятые в качестве окончательных (“наилучших”) модели так распределяют вариацию временного ряда Х(t) на отрезке [1, N], что ее абсолютно большая часть (о чем также свидетельствуют близкие к единице коэффициенты детерминации) оказывается сосредоточенной в полиномиальном тренде. Последний в силу теоремы Гаусса – Маркова станет эффективной оценкой математического ожидания, т.е. хотя и незначительно, но все же будет отличаться от него из-за случайной природы оценок. Но то, что несущественно для полинома, может быть весьма существенным для отклонений, и тем в большей степени, чем эти отклонения будут меньше. По этой причине реальные уравнения в отклонениях будут всегда содержать значительную (относительно самих случайных отклонений) ошибку оценки полиномов и вследствие этого отличаться по своим свойствам от тех, которые “получаются” в теореме математически (т.е. в условиях, когда оценка математического ожидания считается фактически равной самому математическому ожиданию). Указанное расхождение (вычислительной природы) с теоремой приводит в практических измерениях к различным оценкам коэффициентов c1 ,..., cm в этих двух постановках задачи множественной регрессии. Необходимо заметить, что мы обсудили теорему Фриша – Воу применительно к интересующему нас случаю небольших отклонений. Поэтому может показаться, что теорема, не будучи верной для любых σδ и Pk (t ) , остается таковой для относительно больших σδ , сопоставимых с Pk (t ) или даже превышающих Pk (t ) . Ведь в этом случае ошибки в оценках полиномиальных трендов, столь опасные для небольших отклонений, уже не могут существенно изменить новые (большие) отклонения. Однако и здесь имеются свои трудности вычислительной природы, возникающие из-за высокой неопределенности разбиения каждого временного ряда на две указанные компоненты. Эта неопределенность характеризуется не только возрастанием случайной ошибки оценки тренда, но и по(равное
64
явлением нового элемента неопределенности в виде большой вероятности ошибки в принятии конкретных гипотез о степенях полиномов у трендов функции и факторов. Низкая надежность гипотез о полиномах Pk ( j) (t ) , j = 1,…, m (и их степенях), эквивалентна низкой надежности условия (2.2.8), включенного в теореме Фриша – Воу непосредственно в процедуру оценки параметров (именно с его помощью мы получаем уравнения в отклонениях). Данное обстоятельство объясняет, почему надежность процедуры оценки коэффициентов c1 ,..., cm с помощью уравнения в отклонениях будет отличаться (в сторону ухудшения) от надежности процедуры оценки уравнения в целом. Но если надежность двух процедур существенно разнится, то маловероятно, что они приведут к одним и тем же оценкам параметров. В проведенном анализе теоремы находим дополнительные аргументы в пользу высказанного ранее принципа – стремиться ограничить число гипотез, привлекаемых к статистическим измерениям объекта. Каждая гипотеза, и тем в большей мере, чем ниже ее надежность, может только снизить достоверность результата (статистического решения, оценок параметров). В предлагаемом подходе к оценке уравнений множественной регрессии мы также опираемся на условие линейной зависимости трендов (2.2.8), однако не включаем его в собственно процедуру оценки параметров, а используем лишь на предварительном этапе – для проверки соблюдения одного из необходимых условий теоремы Гаусса – Маркова. Поэтому и степень его воздействия на достоверность результатов измерений в этом случае будет совершенно иной. Сказанное не означает, что, доказав вычислительную (статистическую) неэквивалентность двух уравнений и соответствующих им процедур оценки параметров, мы рекомендуем первое из них, а именно – уравнение регрессии с аддитивным полиномом в качестве “наилучшей” модели для рассматриваемого в работе класса временных рядов. Соответствующие проблемы выбора модели и ее активной коррекции будут рассмотрены несколько позднее, а сейчас вернемся к рассматриваемому вопросу и продолжим его изучение. 65
Итак, мы установили, что одной из причин, нарушающих теорему Фриша – Воу, является статистическая неэквивалентность уравнений регрессии (2.2.7) и соответствующих им процедур оценки коэффициентов. Но ведь и в рассмотренных ранее утверждениях для случайных величин и стационарных рядов, аналогичных теореме Фриша – Воу, которые признаны нами справедливыми как с математических, так и со статистических (вычислительных) позиций, имеем дело также с двумя уравнениями – в целом и в отклонениях. Причем в процедуры оценки параметров уравнений в отклонениях включены условия, связывающие оценки математических ожиданий функции и факторов соответствующих уравнений в целом. В чем же дело? А дело в том, что процедура оценки каждого из указанных уравнений в целом с помощью метода наименьших квадратов органически включает в себя вывод уравнения связи для оценок математических ожиданий (приравненная нулю производная от критериальной функции по параметру а0). Тем самым уравнение в отклонениях – это простое следствие исходного уравнения и уравнения связи математических ожиданий его показателей. Иначе говоря, мы имеем дело с двумя эквивалентными математически и статистически задачами оценки параметров. Развивая эту мысль применительно к рассматриваемому в теореме Фриша – Воу случаю временных рядов с параболическими трендами, отметим, что условие (2.2.8) искусственно введено в процедуру наименьших квадратов, оно не входит в число его нормальных (получающихся дифференцированием критерия по неизвестным параметрам) уравнений. Поэтому и уравнение в отклонениях не будет следствием исходного уравнения и одного из нормальных. Это позволяет говорить о наличии еще одной важной причины статистической неэквивалентности как самих уравнений, так и соответствующих им процедур оценки параметров. Каждое из уравнений (2.2.7) вне зависимости от того, что установлена их статистическая неэквивалентность, можно рассматривать как модели-измерители свойств некоторого экономического процесса. Первое из них отличается от принятого нами в качестве “адекватного измерителя” – уравнения (2.1.1) – тем, что в него помимо экономических временных рядов входят искусственные (математические) ряды факторов {1, t, …, tk} t = 1,…, N, а второе – тем, что связывает не ряды в целом, а их отклонения от оценок ма66
тематических ожиданий (полиномиальных трендов временных рядов). Представляется интересным выяснить особенности этих уравнений регрессии как моделей-измерителей. Поднятые вопросы тесно соприкасаются с только что рассмотренными в связи с теоремой Фриша – Воу, однако исследование различий в измерительных свойствах уравнений множественной регрессии трех следующих видов: только для экономических временных рядов в целом, при введении в такие уравнения искусственных рядов факторов {1, t, ..., tk}, t = 1,…, N, и для рядов отклонений – более общая статистическая проблема, чем поднятая в указанной теореме, и поэтому ее целесообразно рассмотреть в специальном параграфе. 2.3. Свойства уравнений множественной регрессии как моделей-измерителей
Как в теории, так и в измерительной практике рассматриваются различные типы уравнений регрессии – с предварительно исключенными трендами (в отклонениях), с показателями в целом (для исходных временных рядов) и с введенными наряду с исходными показателями искусственными временными рядами вида X(t) = 1, X(t) = t,…, X(t) = tm, t = 1,..., N. Каждому из этих уравнений теория, а вслед за ней и исследователи, ведущие конкретные разработки, вменяют те или иные достоинства и указывают на назначение их отдельных членов при изучении свойств экономических процессов. В частности, авторы рассмотренной в части 2.2 теоремы считают уравнения в отклонениях и уравнения с включенными в них искусственными переменными эквивалентными с измерительных позиций. Другие исследователи исходят из того, что назначение искусственных переменных заключается не в отражении эффекта исключения трендов показателей регрессии (как у Фриша и Воу), а в учете воздействия на функцию совокупности неидентифицированных факторов или, как это имеет место в случае производственной функции Кобба – Дугласа, признают за искусственными переменными способность отражать воздействие на функцию определенного фактора (в виде так называемого нейтрального научнотехнического прогресса). 67
Однако одно дело предполагать и даже доказывать математически, что длинное уравнение и его отдельные члены предназначены для изучения (отражения) определенных свойств исследуемого экономического процесса, и совсем другое – установить что это обеспечивается свойствами исходной информации, моделью исследуемого процесса и применяемыми для изучения свойств информации и оценки параметров модели статистическими методами. Конечно, и в этом последнем случае мы будем находиться на некотором уровне абстракции, но значительно более низком, приближенном к конкретному посредством изучения вычислительных возможностей. В качестве исходных показателей функции и факторов исследуемого экономического процесса рассматриваются только такие временные ряды с параболическими трендами, в отношении которых развитая в первой части работы методология позволяет построить “наилучшие“ Br-модели. От их структуры, включающей детерминированную компоненту (в виде “наиболее точного из допустимых по надежности оценок старшего коэффициента“ полинома Pk ( j) (t ) степени k ( j )) и случайную (неавтокоррелированный стационарный процесс с нулевым математическим ожиданием, в отношении которого принимается гипотеза о белом шуме), зависит решение интересующих нас проблем анализа уравнений множественной регрессии в отклонениях и уравнений в целом, в том числе и содержащих в правой части полиномы с неопределенными коэффициентами. Поэтому сделаем несколько дополнительных замечаний о характере детерминированной и случайной компонент. Специфика случайной компоненты, являющейся, с одной стороны, продуктом разбиения конкретного временного ряда на детерминированную и случайную составляющие, а с другой – статистическим средством (основой) оценки параметров детерминированной компоненты и расчета характеристик их надежности, объясняет, почему “точными и надежными” могут быть только регрессии с небольшими отношениями случайной компоненты (ее среднеквадратической величины σδ) к детерминированной (к значению Pk (t ) в некоторый момент времени или в среднем за период).
68
Отмечая эту особенность “наилучших” полиномиальных моделей, мы уже говорили, что в отличие от случайных величин и стационарных процессов основная часть их вариации (меры разброса значений временного ряда) аккумулирована не в случайной, а в детерминированной компоненте. Поэтому и свойства исходной информации, и прежде всего интересующие нас при исследовании уравнений множественной регрессии свойства линейной зависимости и независимости (мультиколлинеарности или ее отсутствия) переменных, определяются в основном свойствами полиномиальных трендов. Это не означает, что мы собираемся заменить исходные временные ряды на полиномиальные тренды, но заведомо не согласны и с той “статистической” точкой зрения, что информация о характере корреляционно-регрессионной взаимосвязи экономических временных рядов сосредоточена в их случайных компонентах. Именно эта точка зрения и послужила основанием ввести в эконометрию уравнения множественной регрессии в отклонениях для временных рядов с полиномиальными трендами (с теоретическим обоснованием в виде теоремы Фриша – Воу). Попытка “уточнить” эту теорему, сказав, что в ней рассматриваются временные ряды с большими σδ отношениями , несостоятельна, так как в этом случае следует Pk (t ) спросить у авторов: а как вы узнали, что имеете дело с временными рядами данного класса, и, более того, смогли оценить в этих условиях сами полиномы? Ведь точно и надежно это сделать невозможно, а в противном случае неизвестно, с какими трендами, а как следствие – и с какими отклонениями вы имеете дело. Обращаясь к уравнениям множественной регрессии в отклонениях, следует различать две следующие постановки задачи оценивания их параметров. В первой тренды исключаются и в дальнейших измерениях не участвуют, тем самым обработке подвергается только уравнение в отклонениях m
δ0t = ∑ c j δ j (t ) + εt .
(2.3.1)
j =1
Результаты его оценки с помощью метода наименьших квадратов интерпретируются сторонниками “статистической” точки зрения 69
(информация о корреляционно-регрессионной взаимосвязи показателей сосредоточена в отклонениях от трендов их временных рядов) как относящиеся к исследуемому процессу в целом. Ввиду того, что на несостоятельность аналогии со случаем стационарных временных рядов мы уже указывали, рассмотрим эту точку зрения на измерения с ее собственных – стохастических позиций. При этом зададимся вопросом: когда она может считаться оправданной? Существуют две возможности, когда по “части” можно судить о “целом” с высокой достоверностью. Первая представляет собой известный статистический прием выборочного анализа и требует, чтобы отобранная для анализа часть (выборка) обладала рядом необходимых для достоверности выводов свойств, в том числе свойством представительности. Однако измерительные принципы, которыми руководствуются при разбиении временных рядов на тренды и отклонения, ничего общего не имеют с методологией выборочного анализа. В этих условиях отклонения показателей функции и факторов лишь случайно (с практически нулевой вероятностью) будут относиться к одной и той же совокупности “элементов” процесса, обладающей к тому же свойством представительности. Вторая возможность может быть реализована, если процесс однороден по входящим в его состав “элементам”, а отклонения от трендов временных рядов таковы, что им соответствует одинаковая по объему совокупность указанных “элементов” (не обязательно одних и тех же). Требование однородности весьма сильное, но даже если оно выполнено, вряд ли будет соблюдено дополняющее его условие “равенства объемов” отклонений по образующим их элементам у функции и факторов. Здесь снова следует сослаться на чистую случайность (практически нулевую вероятность) того, что измерительные принципы разбиения временных рядов обеспечат указанное условие. Таким образом, видеть в случайных компонентах временных рядов некоторую статистическую выборку, позволяющую делать заключения о свойствах экономических процессов в целом, возможно, и заманчивая гипотеза, но, к сожалению (ведь она уже долгое время живет в эконометрии, привлекая многих исследователей своей “очевидностью”), ошибочная. 70
Во второй постановке задачи измерения взаимосвязи показателей с пощью отклонений в число уравнений, используемых для оценки параметров, наряду с нормальными вводят уравнение для трендов m
Pk (0) (t ) = ∑ c j Pk ( j) (t ).
(2.3.2)
j =1
При этом общее число уравнений выбирается равным числу оцениваемых параметров (в данном случае m). Приведенные выше разъяснения в отношении первой постановки позволяют сделать отрицательное заключение и по данной. Можно было бы этим и ограничитьс, если бы не возможность расширения проводимого здесь анализа, связанная с условием (2.3.2). Дело в том, что уравнение для оцененных (с конкретными коэффициентами) полиномов совсем не эквивалентно одному условию, наложенному на искомые параметры c1 ,..., cm . Более того, при значении m, на 1 большем степени старшего из полиномов, условие (2.3.2) позволяет определить их полностью, без привлечения указанных выше нормальных уравнений. Последнее равнозначно устранению отклонений из задачи оценки и определению параметров интересующей нас взаимосвязи по одним трендам. Учитывая, что в точно и надежно оцененных полиномах заключена абсолютно большая часть вариации показателей, метод оценки по трендам следовало бы признать более предпочтительным, чем метод оценки по отклонениям. Однако и в данном случае измерительный принцип и свойства оценки по трендам не соответствуют решаемой здесь задаче и ее измерительным свойствам, а именно – оценке параметров уравнения регрессии для показателей в целом с помощью метода наименьших квадратов (с теоретическим обоснованием в виде теоремы Гаусса – Маркова). Поэтому ни оценка по отклонениям, ни по трендам, ни промежуточный случай оценки по уравнению в отклонениях с привлечением условия (2.3.2) как не отвечающие критериям развиваемого в данной работе измерительно-целевого подхода в дальнейшем не рассматриваются.
71
2.4. Уравнения со свободными членами и полиномами различных степеней
В классической регрессии для случайных величин и при изучении взаимосвязи стационарных временных рядов введение в уравнения свободных членов находится в полном соответствии со статистическими свойствами указанных переменных. Действительно, применяя метод наименьших квадратов к уравнению регрессии m
y j = ∑ ci xij + c0 + ε j ,
j = 1,… , N ,
(2.4.1)
j =1
и дифференцируя критериальную функцию по свободному члену с0, получаем (нормальное) уравнение, связывающее оценки математических ожиданий переменных – среднеарифметические значения y и xi : m
y = ∑ ci xi + c0 .
(2.4.2)
j =1
Прежде чем идти дальше, рассмотрим ряд свойств уравнения (2.4.2), имеющих непосредственное отношение к поднятым здесь вопросам. Несмотря на общность вида уравнения, его трактовка для случайных величин и стационарных рядов принципиально отличаются. Те же самые средние арифметические означают в первом случае оценки математических ожиданий, являющихся координатами точки, через которую проходит линия регрессии, а во втором – оценки трендов стационарных рядов являющихся прямыми, параллельными оси времени. Для наглядности последнего следует обратиться к моделям этих рядов в виде X (t ) = mx + δt , t = 1,..., N , где δt – стационарный процесс с нулевым математическим ожиданием. Поэтому уравнение (2.4.2) можно интерпретировать как условие линейной зависимости трендов стационарных рядов функции и факторов. Оно тривиально, поскольку никаких ограничений на динамику (уровень) трендов не накладывает: допустимыми являются ряды с любыми уровнями трендов. Этот же вывод можно выразить другими словами: физическая реализуемость уравнения (2.4.2) не вызывает сомнения. Его следует запомнить, так как вскоре будет рассматриваться аналогичное условие для 72
временных рядов с параболическими трендами, где также встанет вопрос о его физической реализуемости, однако уже не носящий столь тривиального характера. Вновь обратимся к нашим рассуждениям. Так как уравнение (2.4.2) является следствием наличия в регрессии (2.4.1) свободного члена, то это же можно сказать и про уравнение регрессии в отклонениях m
δ0 j = ∑ ci δij + ε j ,
j = 1,..., N .
(2.4.3)
i =1
Тем самым, введение в уравнение свободного члена сводит проблему оценки взаимосвязи показателей в целом к применению метода наименьших квадратов к уравнению в отклонениях. В то же время, статистические свойства случайных величин и стационарных рядов таковы, что вся информация о их взаимосвязи заключена в отклонениях от математических ожиданий. Поэтому уравнения регрессии со свободными членами (2.4.1) адекватны целям изучения соответствующих экономических процессов в целом. При введении свободного члена в уравнение множественной регрессии для временных рядов с параболическими трендами m
Yt = ∑ ci X i (t ) + c0 + εt , t = 1,..., N ,
(2.4.4)
i =1
мы также приходим к нормальному уравнению для среднеарифметических значений показателей m
Y = ∑ ci X i + c0 ,
(2.4.5)
i =1
и как следствие – к уравнению в отклонениях m
γ 0t = ∑ ci γ it , t = 1,..., N .
(2.4.6)
i =1
Но это отклонения не от трендов (оценок математических ожиданий), а от средних значений показателей за время их наблюдения t = 1,..., N: N
Y=
N
∑ Y (t ) t =1
N
Xi =
и 73
∑ X i (t ) t =1
N
.
(2.4.7)
При изменении периода наблюдения средние значения показателей будут изменяться, а вместе с ними и отклонения, входящие в уравнение (2.4.6). Поэтому говорить о неизменной стохастической природе величин γ 0t и γ it (что было справедливо в отношении отклонений δ0t и δit ) уже не приходится: у них изменяются как средние значения, так и дисперсии. Вследствие этого даже сторонники “стохастической” точки зрения не могут апеллировать к таким “отклонениям”. Продолжим анализ, для чего обратимся к моделям временных рядов функции и факторов: Yt = Pk (0) (t ) + δ0t , X it = Pk (i ) (t ) + δit , i = 1,..., m; t = 1,..., N .
(2.4.8)
Учитывая равенство нулю среднеарифметических значений δ0 и δi ; i = 1,…, m, имеем Yt = Pk (0) (t ) и X it = Pk (i ) (t ) . Это означает, что
уравнение (2.4.5) является уравнением для средних значений трендов: m
Pk (0) (t ) = ∑ ci Pk (i ) (t ) + c0 .
(2.4.9)
i =1
Если представить на графиках поведение Pk (0) (t ) и Pk (i ) (t ) в зависимости от времени, то горизонтальные линии Pk (0) (t ) = const и Pk (i ) (t ) = const пересекут эти полиномы при значениях t = t0 и t = ti , i = 1,..., m, соответственно. Учитывая, что характер динамики трендов весьма разнообразен, в частности они совсем не обязательно должны быть линейными функциями времени, или, что более обобщенно, принадлежать после вычитания константы к классу симметричных относительно средней точки интервала наблюдения функций, то маловероятно, чтобы указанные моменты времени практически, т.е. в пределах точности решения задачи оценки трендов и способа определения точек t0 и ti , i = 1,..., m, совпали. Как правило, они будут отличаться и притом существенно. 74
Вместе с тем, из условия (2.4.9) вытекает, что среднеарифметические значения трендов Pk (0) (t ),..., Pk ( m ) (t ) удовлетворяют уравнению регрессии m
Y (t ) = ∑ ci X i (t ) + c0
(2.4.10)
i =1
(связывающему показатели функции и факторов в некоторые, общие для них моменты времени) и, следовательно, являются одной из его точек. Так как эта точка динамической, а не только пространственной траектории, то ей должны соответствовать общие, одни и те же для всех координат моменты времени. Налицо противоречие (проблема физической реализуемости условия (2.4.5), а вместе с ним и самого уравнения регрессии (2.4.4)). Проведенный анализ говорит о том, что измерительный эффект от введения в уравнение регрессии для временных рядов с параболическими трендами свободного члена находится в противоречии со свойствами исходной информации и не отвечает поставленной цели – исследованию показателей экономического процесса в целом с помощью метода наименьших квадратов. Анализ последствий измерительного характера от введения в уравнения множественной регрессии полиномов различных степеней начнем со случая линейной функции времени m
Yt = ∑ ci X i (t ) + a0 + a1t + εt , t = 1,..., N .
(2.4.11)
i =1
Наличие в данном полиноме, как и в полиноме произвольной степени, свободного члена a0 с неизбежностью ведет к только что рассмотренным последствиям, и поэтому в отношении уравнений регрессии такого типа можно было бы ограничиться только что сделанным заключением. Однако эти уравнения дают возможность обсудить один из основных методологических вопросов эконометрического моделирования с интересующих нас позиций, а именно: в какой мере совпадает функция (назначение) полиномов, которая им вменяется дедуктивно, исходя из математического (логического) анализа свойств модели, с их измерительной ролью? Ведь, если последняя не совпадает с первой, то это может перечеркнуть практическую ценность модели в целом. 75
Уравнение с линейной функцией времени выбрано в качестве отправной точки анализа еще и потому, что к такой регрессии сводится одна из самых известных эконометрических моделей – производственная функция Кобба – Дугласа Y (t ) ≅ A0 K α (t ) Lβ (τ)e a1t ,
t = 1,..., N
(2.4.12)
с известной, происходящей от дедуктивного (но не измерительного) анализа свойств этой функции, интерпретацией ее параметров a0 и a1 . Так экспоненциальному сомножителю вменяется функция отражения нейтрального научно-технического прогресса, его независимого, минуя факторы, воздействия на производство (выпуск продукции), а параметру a1 – соответственно среднего за рассматриваемый период времени темпа прироста этого воздействия. Параметру A0 предназначается служить масштабирующим коэффициентом, приводящим входящие в производственную функцию экономические показатели к единой размерности. Чтобы провести анализ измерительной роли этих величин, преобразуем производственную функцию (2.4.12) к тому виду, в котором она используется для оценки с помощью метода наименьших квадратов, т.е. к линейной регрессии. С этой целью обратимся к свойству положительности по знаку функции, факторов и параметра A0 на отрезке анализа – Y(t) > 0, K(t) > 0, R(t) > 0, A0 > 0 и вытекающей из него возможности их следующего однозначного представления: Y(t) = еy(t), К(t) = еk(t), R(t) = еr(t), А0 = e a0 . Это позволяет записать (II.4.12) в виде эквивалентных ему выражений: e y (t ) ≅ e αk (t ) ⋅ eβr (t ) ⋅ e a0 + a1t
или
(2.4.13)
y (t ) ≅ α k (t ) + β r (t ) + a0 + a1t , t = 1,..., N .
Заменяя наблюденные значения функции у(t) на их вероятностный образ – случайный временной ряд yt и вводя в правую часть последнего выражения случайную ошибку теории ε t , приходим к указанному ранее линейному уравнению множественной регрессии yt ≅ αk (t ) + βr (t ) + a0 + a1t + εt . 76
(2.4.14)
Аддитивной случайной ошибке уравнения (2.4.14) соответствует мультипликативный член eε (t ) , превращающий первое из уравнений (2.4.13) в точное равенство. Заметим также, что, будучи строго положительной, случайная ошибка eεt в полной мере (с вероятностью 1) отвечает условию положительности функции e yt на всем интервале наблюдения, чего нельзя было бы сказать про соответствующую аддитивную ошибку (знакопеременную). По-видимому, нет необходимости выяснять измерительную роль (последствия введения) свободного члена уравнения а0 – она уже рассмотрена. Поэтому обратимся к члену а1t, которому вменяется функция отражения воздействия темпов прироста нейтрального научно-технического прогресса на темпы прироста выпуска уt. Ранее, исследуя свойство инвариантности полиномов по сдвигу во времени, мы одновременно указывали на отсутствие преимущественного начала отсчета времени при анализе экономических процессов. Это позволяло утверждать, что, имея временные ряды показателей, длительностью в N единиц времени, следует руководствоваться лишь соображениями удобства вычислений, решая, чему положить t0 в записи интервала наблюдений t = t0 + 1, …, t0 + + N – нулю либо некоторому другому числу. Если положить t0 = − 1, то возникает вопрос: что это за специфическая точка (момент времени) экономического процесса, в которой воздействие научнотехнического прогресса не имеет места (a1t)t = 0 = 0, но возникает после нее? Если же рассмотреть случай N = 2n + 1 и положить t0 = − n − 1 (t = − n, …, 0,…, n), то вопрос приобретает следующую форму: что же это за форма прогресса, воздействие которой на выпуск на концах отрезка анализа одинаково по абсолютной величине, но противоположно по знаку, а тем самым равно нулю в среднем за период? Объяснения указанным парадоксам нетрудно дать, если обратиться к свойству инвариантности полиномов по сдвигу во времени. Дело в том, что, проводя дедуктивный (математический, логический) анализ свойств производственной функции, различные авторы допускали одну и ту же некорректность, когда считали, что полином частного вида а1t (неинвариантный по сдвигу во времени) может адекватно отражать вменяемую ему функцию. 77
Из сказанного не следует, что, устранив данную некорректность в форме полинома, мы признаем за полиномом 1-ой степени общего вида способность и математически и измерительно отражать этот вид научно-технического прогресса. Математически возможно (но вопросы математической экономики не обсуждаются здесь), однако измерительно это заведомо не так, поскольку полином 1-й степени общего вида содержит свободный член, играющий совершенно иную, неадекватную математически вменяемую ему роль в процессе оценки параметров уравнения регрессии (2.4.14) с помощью метода наименьших квадратов. О весьма важных последствиях наличия в уравнении регрессии (2.4.14) полинома 1-й степени с неопределенными коэффициентами а0 + а1t для результатов оценивания, независимо от вменяемых априори этим коэффициентам предназначений, позволяет судить и следующая, измерительно адекватная интерпретация этого полинома. Как уже отмечалось, при статистической оценке параметров уравнений регрессии вида (2.4.14) в роли факторов, по которым производится разложение функции, выступают не только экономически содержательные показатели, но и сомножители коэффициентов полиномов, в данном случае 1 и t, определенные нами как искусственные факторы. В процессе вычислений последние выступают в качестве временных рядов m(t) = 1 и n(t) = t, t = 1,…, N, с которыми метод наименьших квадратов оперирует совершенно таким же образом, как и с естественными временными рядами k(t) и r(t), t = 1,..., N. Следовательно, с измерительных позиций имеем дело не с двухфакторной, а с четырехфакторной регрессией Yt = αk (t ) + β r (t ) + a0 m(t ) + a1n(t ) + εt , t = 1, … , N .
(2.4.15)
При близости исходных (коротких) временных рядов Y(t), K(t) и R(t) к экспоненциальному характеру (что часто имеет место для макроэкономических показателей) соответствующие им ряды у(t), k(t) и r(t) будут иметь линейные (по t) тренды. И если бы исследуемая регрессия была двухфакторной, например зависела только от k(t) и r(t), то последние были бы практически линейнонезависимыми (немультиколлинеарными). Однако факторов с линейными трендами не два, а четыре, и поэтому они заведомо мультиколлинеарны. Уже одно это объясняет, почему производствен78
ные функции Кобба – Дугласа с нейтральным научно-техническим прогрессом приводят к статистически ненадежным оценкам параметров. В этих условиях наблюдается еще один эффект, на который ссылаются многие исследователи, проводившие расчеты данной производственной функции на макроуровне. А именно – чрезмерно большой вес, который берет на себя при объяснении уt полином а0 + а1t. Ввиду того что данное обстоятельство не есть нечто специфическое, связанное только с производственной функцией (2.4.15), а более того является всего лишь частным проявлением более общего эффекта введения в уравнения регрессии полиномов с неопределенными коэффициентами, то и перейдем к рассмотрению этого последнего. С этой целью обратимся к уравнению множественной регрессии m
Yt = ∑ ci X i (t ) + a0 + a1t + … + an t n + εt
(2.4.16)
i =1
и исследуем результаты воздействия на процедуру оценки его параметров двух случаев соотношения степеней полиномов – у тренда функции Yt (обозначим его через k) и у введенного в уравнение (n). Первым рассмотрим случай n ≥ k. Применяя в этой ситуации к уравнению (2.4.16) метод наименьших квадратов, мы не можем никакими математическими (дедуктивными) соображениями о предназначенной полиному а0 + + а1t + … + an tn роли запретить ему полное объяснение тренда функции Y(t), а если n > k, то и включая часть вариации ее (функции Yt) случайной компоненты. Тем самым, ничто не мешает такому полиному превратить задачу множественной регрессии (оценку вклада факторов) в задачу регрессионного анализа временного ряда (см. раздел I данной работы). То, что при этом коэффициенты с1,..., cm не обязательно получаются нулевыми, объясняется возникающей в данной ситуации мультиколлинеарностью факторов и вызванным ею большим разбросом оценок. В случае n < k полином а0 + а1t + … + аn tn не в состоянии объяснить весь тренд функции Yt, но вполне может быть (см. с этой целью поведение показателя точности S2 (r) с ростом r) близким к нему. Даже при n = 1 и реальных k, исследованных в разделе I ра79
боты, полином а0 + а1t способен принять на себя основную нагрузку тренда функции. Тогда оценки весов других факторов вопреки ожиданиям будут малы, что и наблюдается на практике. Если же и в данном случае (n < k) имеет место мультиколлинеарность то она может увеличить оценки коэффициентов с1, ..., сm по абсолютной величине, но придать им не те знаки, которые соответствуют смыслу задачи. Проведенное изучение уравнений в отклонениях, со свободным членом и с полиномами различных степеней является одновременно конструктивной аргументацией в пользу той формы уравнения, которая бы отвечала как цели исследования, так и измерительным свойствам исходной информации и применяемого к уравнению метода оценки (наименьших квадратов). Соответствующее уравнение множественной регрессии и условия, накладываемые на входящие в него показатели, фактически уже известны из материала 2.1 данного раздела: n
Yt = ∑ c j X j (t ) + εt , j =1
где
⎧ X (t ), j = 1, …, n – немультиколлинеарны, ⎪⎪ j ⎨k (0) = max k ( j ), 1≤ j ≤ n ⎪ ⎪⎩n = k (0) + 1.
(2.4.17)
Условия, приведенные в (2.4.17), конструктивным образом уточняют теорему Гаусса – Маркова, рекомендуя проверять не свойство линейной независимости факторов (которое в строгом смысле всегда выполняется для численно заданных рядов), а их немультиколлинеарность, и не постулируют отсутствие тренда у ошибки εt, а обеспечивают это заранее, до проведения оценки уравнения. Остается подтвердить, что в правой части уравнения находятся только экономические (естественные) факторы, в разложении по которым мы и видим адекватную поставленной цели возможность определения их весов. На этом завершается часть исследования, позволяющая понять, каковы должны быть уравнения множественной регрессии и их свойства для рассматриваемого класса временных рядов (пассивное согласование). В то же время конструктивный подход требует 80
развития и на тот случай, когда, несмотря на первоначальное рассогласование свойств временных рядов и связывающих их уравнений регрессии, имеется возможность привести задачу к ее представленной выше корректной постановке (активное согласование). Понятно, что не любые рассогласования позволяют сделать это, как и не любые временные ряды можно связать линейными уравнениями регрессии. 2.5. Допустимые уравнения множественной регрессии. Активное согласование свойств исходной информации, уравнений и метода оценки параметров
При выборе “наилучших” моделей для временных рядов мы опирались на предварительно построенные множества допустимых полиномиальных регрессий. Теперь нам предстоит показать, какие возможности имеются у исследователя, чтобы построить регрессии, удовлетворяющие условиям (2.4.17). Будем также называть такие регрессии допустимыми (строгое соблюдение условий теоремы Гаусса – Маркова требует дополнительного принятия гипотезы о белом шуме для εt). При этом проблемой выбора единственной (“наилучшей”) модели среди допустимых заниматься не будем, так как считаем, что, имея дело с совокупностью допустимых моделей, отличающихся по своему виду и свойствам, можно получить более полную и всестороннюю информацию об изучаемом процессе, чем с помощью только одной “наилучшей”. Исследование возможностей активного согласования начнем со случая производственной функции Кобба – Дугласа, анализ которой привел к уравнению (2.4.15) с мультиколлинеарными факторами. Тем самым про уравнение (2.4.15) можно сказать, что оно не относится к числу допустимых (и не только по этой причине). Итак, в уравнение (2.4.12) нельзя вводить ни “масштабирующего” коэффициента А0, ни “нейтрального” научно-технического прогресса в виде члена e a1t , иначе гарантированно получим бессмысленные оценки параметров уравнения регрессии (2.4.15). Но ведь содержательно (экономически) их присутствие оправдано. Где же выход из положения? 81
Обратимся вначале к более простому виду производственной функции (без учета нейтрального научно-технического прогресса) Y (t ) = A0 K α (t ) Rβ (t ) eε(t ) , t = 1,..., N .
(2.5.1)
Соответствующее ему уравнение регрессии имеет вид y (t ) = αk (t ) + βr (t ) + a0 + εt , t = 1,..., N .
(2.5.2)
Если назначение А0 – приведение к единой размерности (“масштабу”) левой и правой частей уравнения (2.5.1), а не учет некоторого неидентифицированного фактора, то его величина (размерность) может быть определена заранее, до оценки параметров уравнения α и β. В этом случаев регрессию (2.5.2) будет входить известное число а0, а не свободный член (неопределенный параметр), приводящий к неприемлемым для нас измерительным последствиям. Известное число можно вычесть из левой части, образовав новую случайную функцию yt′ = yt − a0 с теми же статистическими свойствами (в частности, с той же надежностью коэффициентов тренда), что и у первоначальной функции yt . Тогда уравнение регрессии примет вид аналогичный представленному в формуле (2.4.17): yt′ = αk (t ) + βr (t ) + εt . (2.5.3) Если, как это предполагалось ранее, тренды функции и факторов – полиномы 1-й степени, а εt – белый шум, то уравнение регрессии (2.5.3) является допустимым и можно рассчитывать на получение экономически содержательных оценок его параметров. Это не означает, что гарантирована их высокая статистическая надежность – статистическая процедура оценки никогда не может обещать этого с вероятностью, равной 1, но все, что было необходимо сделать для достижения высокой надежности оценок, осуществлено (активное согласование). В действительности совсем не обязательно переносить константу а0 в левую часть уравнения регрессии и переходить к новой функции yt′ . Уравнение (2.5.2), являясь двухфакторным (с подлежащими оценке двумя параметрами α и β), может быть оценено методом наименьших квадратов столь же успешно (и с теми же самыми значениями оценок), что и уравнение (2.5.3). Наличие в правой части уравнения известной величины, не обязательно в ви82
де числа, но и в виде полинома с известными коэффициентами Р1 (t) (т.е ряда чисел в моменты времени 1, …, N), не разрушает согласованности свойств исходной информации, уравнения и метода оценки и поэтому оставляет его допустимым. Это означает, что, не имея возможности оценить воздействие на выпуск нейтрального научно-технического прогресса (отражаемого полиномом 1-й степени с неизвестными коэффициентами) одновременно с факторами k(t) и r(t), мы могли бы ввести полученную из другой модели его оценку в виде полинома с известными коэффициентами b0 + b1t в уравнение регрессии yt = αk (t ) + βr (t ) + a0 + b0 + b1t + εt
(2.5.4)
и оценить “чистый вклад” факторов k(t) и r(t). Вполне возможно, что получить указанную выше оценку в виде полинома b0 + b1t не удастся. Но наша цель заключается не в том, чтобы доказать недоказуемое, а именно, что любые трудности согласования преодолимы; но показать, когда и каким образом это возможно для данной производственной функции (первоначально вообще не имевшей шансов на корректную оценку параметров). Одновременно мы указали на имеющий общий характер способ учета экономических показателей, не отраженных в исходной информационной базе в виде соответствующих временных рядов (предварительно доказана неадекватность их учета с помощью полиномов с неопределенными коэффициентами). Что касается порядков вводимых в уравнение регрессии полиномов с известными коэффициентами, то в соответствии с условиями (2.4.17) они не должны превосходить степени трендового полинома функции, иначе уравнение перестает быть допустимым. Возможности дальнейшего развития метода активного согласования рассмотрим на примере отраслевой производственной функции, которая в отличие от народно-хозяйственной функции (2.5.4) связывает выпуск с тремя факторами: уже известными k(t) и r(t) и новым – материальными затратами p(t). Считая, как и ранее, что трендами временных рядов темпов прироста валового выпуска продукции отрасли y(t), основных производственных фондов k(t) и занятых r(t) являются полиномы 1-го порядка, мы обеспечим допустимость уравнения регрессии 83
yt = αk (t ) + βr (t ) + γp(t ) + a0 + b0 + b1t + εt ,
(2.5.5)
если вклад фактора p(t) будет заранее оценен (например, с помощью суммирования соответствующих элементов материальных затрат, отражаемых в первом квадранте межотраслевого баланса) и уравнение останется с измерительных позиций двухфакторным – с подлежащими оценке параметрами α и β. В следующей ситуации, когда трендами функции уt и хотя бы одного из факторов, например k(t), являются полиномы 2-й степени (а остальные тренды либо 1-й, либо 2-й степени), возможна оценка трех параметров уравнения (2.5.5) – α, β и γ. Одновременно встает вопрос, что делать в данной ситуации указанных степеней полиномов, если необходимо исследовать народно-хозяйственную производственную функцию yt = αk (t ) + βr (t ) + a0 + εt ,
(2.5.6)
где а0 известно. Ведь уравнение (2.5.6), как это видно из условий (2.4.17), не относится к числу допустимых. Возникший вопрос используем как подходящий момент для того, чтобы высказать свое отношение к способу отражения в производственной функции Кобба – Дугласа научно-технического прогресса. Мы считаем, что более адекватной формой отражения научнотехнического прогресса в материальном производстве (чем “нейтральная”) является учет его воздействия во времени на эффективность факторов производства и их способность к взаимозамещению. В данном случае это означает введение в производственную функцию (2.5.6) зависящих от времени коэффициентов эластичности выпуска по фондам α(t) и занятым β(t): yt = a (t )k (t ) + β(t )r (t ) + a0 + εt .
(2.5.7)
Рассмотрим следующие ситуации, при которых уравнение (2.5.7) будет допустимым. Первая: тренды yt и k(t) описываются полиномами 2-й степени, а r(t) – полиномом 1-й степени. Построим регрессию Yt = αk (t ) + (β0 + β1t ) r (t ) + a0 + εt . (2.5.8) Она эквивалентна следующей: 84
yt = αk (t ) + β0 r (t ) + β1tr (t ) + a 0 + εt = = αk (t ) + β0r (t ) + β1r1 (t ) + a0 + εt ,
(2.5.9)
где r1(t) = tr(t). С измерительных позиций уравнение регрессии (2.5.9) является трехфакторным, и если исследование временного ряда r1(t), t = 1,…, N, помощью Br-модели установит, что соответствующий тренд является полиномом 2-й степени, то оно будет допустимым. В редких случаях умножение временного ряда на t не повышает степени его трендового полинома, но и тогда регрессия (2.5.9) остается допустимой. Что касается экономической интерпретации результатов, то она проводится в отношении исходного уравнения регрессии (2.5.8). Вторая ситуация: тренды yt и r(t) – полиномы 2-й степени, k(t) – полином 1-й степени. Обращаясь к регрессии
yt = (a0 + a1t ) k (t) +βr(t ) + a0 + εt = = a0k (t ) + a1k1(t ) +βr(t) + a0 + εt ,
(2.5.10)
где k1(t) = tk(t), мы приходим к аналогичному, только что рассмотренному случаю. Третья ситуация: тренд yt – полином 3-й степени, тренд k(t) – 2-й степени, а r(t) – 1-й. Здесь можно образовать два следующих уравнения регрессии: yt = (a0 + a1t ) k (t ) + (β0 + β1t ) r (t ) + a0 + εt и yt = αk (t ) + (β0 + β1t + β 2t 2) r (t ) + a0 + εt .
(2.5.11)
В измерительном плане они эквивалентны четырехфакторным уравнениям: y t = a0 k (t ) + a1k1 (t ) + β0r (t ) + β1r1 (t ) + a0 + εt (2.5.12) и yt = αk (t ) + β0 r (t ) + β1r1 (t ) + β 2r2 (t ) + a0 + εt , где k1(t) = tk(t), r1(t) = tk(t) и r2(t) = t2r(t). Если анализ трех “новых” временных рядов с помощью соответствующих им моделей покажет, что трендом временного ряда k1(t), t = 1,..., N, является полином 3-й степени, трендом ряда r1(t) – полином 2-й степени, а трендом r2(t) – полином 3-й степени (или 85
хотя бы один из полиномов для k1(t) и r2(t) будет 3-й степени), оба уравнения (2.5.12) будут допустимыми. Экономическая интерпретация результатов их оценки, как и ранее, проводится для исходного вида уравнений, заданных формулой (2.5.11). Четвертая ситуация подобна предыдущей: тренд временного ряда у(t) – полином 3-й степени, k(t) – 1-й степени, а r(t) – 2-й степени. Для нее аналогичным приемом получаем два уравнения регрессии с переменными параметрами: yt = (a0 + a1t ) k (t ) + (β0 + β1t ) r (t ) + a0 + εt yt = (a0 + a1t + a2t 2 ) k (t ) + βr (t ) + a0 + εt .
(2.5.13)
Напомним также, что в соответствии с развиваемым подходом целью исследования является не выбор единственной “наилучшей” модели реального процесса, а его возможно более всесторонний содержательно и допустимый измерительно анализ. В соответствии с этим следует толковать и формы представленной здесь динамики коэффициентов а(t) и β(t): каждая из них в отдельности и обе они в совокупности помогают понять происходящие под воздействием научно-технического прогресса изменения в эффективности факторов производства. Не претендуя на отыскание истинной (единственной) динамики коэффициентов, мы ограничиваемся той ее формой, которая является вычислительно допустимой, а содержательно – способной указать на тенденцию истинной динамики а(t) и β(t). Может быть, это вызывает некоторое разочарование в возможностях предлагаемого подхода, но заметим, что пренебрежение измерительными свойствами исходной информации, модели и метода оценки заведомо приведет к еще большему разочарованию. Руководствуясь изложенной методологией, мы по крайней мере знаем, что сделано все, чтобы получить разумные ответы на поставленные вопросы, и если статистическая оценка не подтверждает наших ожиданий, то имеем все основания для объяснения причины этого – свойственный статистическим методам случайный разброс оценок. В любом случае установить измерительные возможности (их предел) для класса моделей более конструктивно, чем заниматься оценкой единственной модели, пусть даже такой известной, как производственная функция Кобба – Дугласа. (По86
следний аргумент можно усилить, напомнив про измерительную неадекватность этой функции.) Мы могли бы и дальше наращивать число допустимых уравнений регрессии, пока не исчерпаем установленного в разделе I работы диапазона практически интересных значений степеней трендовых полиномов. Однако описание соответствующих ситуаций после разбора принципа – дело техники, и мы оставляем его читателю, который, столкнувшись с одной из них, без труда построит отвечающие ей допустимые производственные функции. Для нас более важно подчеркнуть, что успех достигается здесь прежде всего за счет модификации формы и свойств уравнений. Предлагаемый ниже метод развивает арсенал средств “активного согласования”, перенося центр тяжести усилий по согласованию с формы уравнения на модификацию самих временных рядов показателей. Чтобы представить новые возможности, которые открывает этот метод, обратимся к рассмотренной выше первой ситуации: степени полиномов трендов уt и k(t) равны 2, а r(t) – 1. Соответствующее ей допустимое уравнение включает один переменный параметр β(t) = = β0+ β1t, то время как другой мы вынуждены были зафиксировать (α(t) = а). Это означает, что, измерял воздействие научнотехнического прогресса на эффективность факторов производства, мы в состоянии определить тенденцию роста (падения) лишь для эластичности выпуска по занятым, а реально имеющие место изменения в эластичности по основным фондам оценить в виде усредненного (за период анализа) эффекта. В то же время, для третьей ситуации, отличающейся от данной только тем, что степень полинома тренда функции в ней на 1 выше, среди допустимых уравнений имеется уравнение с обеими переменными эластичностями. Понятно, что оперирование с таким уравнением более адекватно содержательной (экономической) постановке задачи. Сказанное наводит на мысль, что если бы удалось найти средство такого воздействия на временные ряды, которое, не изменяя сколько-нибудь значительно динамику рядов (их значения), было бы в состоянии изменить их свойства (в данном случае повысить степени их трендовых полиномов), то наши возможности согласования свойств временных рядов, уравнений и метода оценки, с одной стороны, с требованиями содержательного характера – с другой, были бы существенно расширены. 87
Возвратимся с этой целью к процедуре построения Br-модели интересующего нас временного ряда у(t), t = 1,..., N. Проводя его анализ, мы опирались на две характеристики качества: точность приближения S2(r) и надежность оценки старших коэффициентов Вr(r). Разнонаправленность динамики данных характеристик с ростом степеней полиномов r явилась основой для выбора компромиссного решения о “наилучшей” полиномиальной регрессии как “наиболее точной из допустимых по надежности оценки старшего коэффициента полинома”. В указанной выше первой ситуации в качестве таковой был признан полином 2-й степени. При описанном ранее (в разделе I) характере динамики отдельных компонент показателя Вr(r) это означает, что у следующего по порядку полинома (r = 3) резко уменьшилась абсолютная величина старшего коэффициента аr и одновременно увеличился диагональный элемент аrr. При этом изменение дисперсии случайной компоненты σδ2 (при переходе от r = 2 к r = 3), носящее медленный характер, не сказалось сколько-нибудь заметно на показателе Вr(r). В результате надежность коэффициента а3 стала неприемлемо низкой – его коэффициент вариации вырос в несколько раз по сравнению со значением В2 (2) и превысил границу допустимой надежности b. В этих условиях в качестве отвечающего требованию несущественного изменения значений временного ряда воздействия, которое одновременно в состоянии уменьшить в нужное число раз показатель Вr(r), является сокращением диапазона флюктуаций случайной компоненты δrt. С этой целью случайная компонента δrt умножается на величину, меньшую 1 (обозначим ее через q: 0 < q < 1). a rr qσδ (r ) ≤b, Чтобы подобрать ее значение, в условие Br (r ) = ar которое не выполнялось для интересующего нас (например, для ряда у(t) это было r = 3), следует подставить показатель q на столько меньший 1, насколько это необходимо для того, чтобы новое условие
Br (r ) =
rr a q σ δ (r ) ≤b ar
стало выполняться. 88
(2.5.14)
Указанное преобразование приводит к новому, близкому по своим значениям в каждой точке t и имеющему ту же самую сумму значений в целом на отрезке [1, N] временному ряду y′(t ) = Pr (t ) + δ′r (t ) t = 1,… , N .
(2.5.15)
Исследуя его с помощью Вr-моделей, мы получаем в качестве “наилучшего” полином со степенью на 1 выше, чем у первоначального ряда. Здесь следует указать на два практически важных обстоятельства. Во-первых, использование данного метода для повышения степени на 2 и более вызывает необходимость столь значительного “подавления” случайной компоненты, которое может вступить в противоречие с требованием незначительного изменения рядов и самой возможностью построения Br-моделей, связанной с наличием двух явно обозначенных компонент у исследуемого ряда (вторая может практически исчезнуть, став “неразличимой” в условиях реальной точности вычислений). Во-вторых, при r = 5 (предельная степень полиномов у реальных Br-моделей) применение метода даже с его прямой целью повысить степень полинома на 1 становится невозможным по причине плохой (даже в условиях двойной точности расчетов на ЭВМ) обусловленности матриц для систем нормальных уравнений, соответствующих полиномам 6-й и более высоких степеней. Поэтому диапазон степеней полиномов, которые на практике могут быть повышены, включает значения r от 1 до 4. В частности, это означает, что повышение степени вполне возможно для рассмотренного ранее случая производственной функции. На практике могут возникнуть и ситуации, требующие понижения степеней. Однако соответствующие преобразования со значениями q > 1 ведут к ухудшению обеих характеристик качества моделей временных рядов и могут вступить в противоречие с самим их назначением – точно и надежно отражать динамику рядов наблюдений (особенно очевидным это становится при стремлении понизить порядок точного и надежного полинома со 2-го до 1-го). Сказанное объясняет, почему мы ограничиваемся методом повышения степеней полиномов на 1 и рекомендуем в ситуации, в которой для приведения уравнения к допустимому виду можно было бы понизить степень функции (фактора), обратиться к другому 89
средству, а именно – к повышению степени фактора (или функции). Представленные в данном параграфе методы активного согласования были изложены применительно к уравнениям и рядам частного вида, однако подобранным таким образом, чтобы без потери общности, но более наглядно, чем это возможно при обсуждении абстрактно-общей ситуации, охарактеризовать эти методы. Поэтому, обращаясь к уравнениям регрессии общего вида, можно констатировать следующее: 1) уравнение регрессии остается допустимым при введении в него заранее оцененного свободного члена, полинома с известными коэффициентами и степенью, не превышающей степени полинома у функции, а также нового фактора, заданного временным рядом, если коэффициент при нем оценен вне данного уравнения и степень соответствующего ему полинома не выше, чем у функции; 2) если степень полинома у функции на 1 превышает максимальную степень полиномов у факторов (k (0) = max k ( j ) + 1), а 1≤ j ≤ n
число факторов n равняется k(0) + 1, то для приведения уравнения к допустимому виду необходимо повысить на 1 степень старшего из полиномов у факторов; 3) если степень полинома у функции на 1 ниже максимальной степени полиномов у факторов (k (0) = max k ( j ) − 1), а число фак1≤ j ≤ n
торов n равняется (k (0) = max k ( j ) + 1), то для приведения уравне1≤ j ≤ n
ния к допустимому виду необходимо повысить на 1 степень полинома у функции; 4) если одно из условий допустимости уравнения соблюдено k (0) = max k ( j ), а вместо другого имеем n = k(0) + 2 (число факто1≤ j ≤ n
ров на 1 больше, чем это допустимо), то для приведения уравнения к допустимому виду необходимо повысить на 1 степени полиномов у функции и фактора со старшей степенью полинома; 5) если нарушение условий носит такой характер, что повышением степеней полиномов оно не устраняется, то следует проверить эффективность перехода к уравнениям с переменными коэффициентами (либо его одного, либо в сочетании с методом повышения степеней полиномов), при этом в качестве естественного 90
ограничения на данные методы активного согласования выступает установленный в первой части работы диапазон практически возможных степеней полиномов у Br-моделей. В заключение параграфа рассмотрим вопрос о свойствах ошибки уравнений множественной регрессии. В соответствии с теоремой Гаусса – Маркова она должна быть белым шумом. В практических ситуациях, когда временные ряды показателей имеют небольшую длину, мы вынуждены ограничиться проверкой лишь важнейших свойств εt, относящихся к числу необходимых для белого шума, а именно: имеет ли она нулевое математическое ожидание и нет ли у нее автокорреляции. Вначале обсудим вопрос о математическом ожидании. Понятно, что никакое априорное постулирование типа “математическое ожидание εt должно равняться нулю” ничего не дает, если это не будет подкреплено измерительными свойствами временных рядов показателей, самого уравнения и применяемого к нему метода оценки. Так, в случае уравнений множественной регрессии для показателей в виде случайных величин и стационарных рядов нулевая величина математического ожидания εt обеспечивается наличием в этих уравнениях свободного члена а0. Действительно, преобразуя с этой целью уже знакомое нам уравнение для отклонений к следующему виду: m
εt = δ0t − ∑ ci δi (t )
t = 1,… , N ,
(2.5.16)
i =1
и заменяя в нем случайные величины на наблюденные (εt на ε(t) и δ0t на δ0 (t)), будем иметь m
ε(t ) = δ0 (t ) − ∑ ci δi (t ), t = 1,..., N .
(2.5.17)
i =1
Поскольку среднеарифметические значения δ0 (t) и δi (t), i = 1,..., m, равны 0, то и ε(t ) = 0. Для случайных величин доказательство завершено, так как среднеарифметическое является несмещенной и эффективной оценкой математического ожидания. Что касается стационарных рядов, то здесь необходимо обратиться к свойству эргодичности, а именно: к условию M εt = ε(t ) . Из него вытекает интересующий нас результат M ε t = 0 , т.е. тренд ошибки уравнения εt тождественно (по времени) равен 0. 91
Но как мы уже знаем, допустимые уравнения множественной регрессии для временных рядов с параболическими трендами не содержат (не допускают) подлежащих оценке свободных членов. Каким же средством (условием) обеспечивается здесь равенство нулю M εt ? Нетрудно видеть, что этим условием является линейная зависимость совокупности полиномиальных трендов функции и факторов (мультиколлинеарность временных рядов функции и факторов уравнения регрессии). Замечательно и то, что в данном случае нет необходимости прибегать к условию эргодичности для ошибки уравнения. Вопрос о проверке на отсутствие автокорреляции у ошибки уравнений множественной регрессии начнем со следующего замечания. Исследуя в разделе I работы свойства временных рядов, мы не могли сказать, какова причина автокорреляции у компоненты δt – “остаточный” временной тренд или стохастическая, т.е. подлинно корреляционная, зависимость ее соседних значений. Поэтому практически нулевая автокорреляция одновременно означала и отсутствие тренда у δt . В данной ситуации нулевой тренд у εt обеспечивается заранее (к числу допустимых уравнений мы относим лишь те, у которых полиномы функции и факторов связаны линейной зависимостью). Это позволяет применять метод наименьших квадратов как при отсутствии автокорреляции у εt , так и при ее наличии. Понятно, что качество (надежность) получаемых в последнем случае оценок параметров уравнения будет хуже. Чтобы оценить меру происходящего ухудшения, мы рекомендуем следующую процедуру. Вначале оценим несколько первых (обычно не более трех) коэффициентов автокорреляции ρ1 (τ), ρ2 (τ), ρ3 (τ) ... для сдвинутых относительно друг друга двух рядов ε (t) на один шаг, на два, на три... Затем проинтерполируем их значения на промежуточные (нецелые) сдвиги, определив тем самым непрерывную зависимость ρ(τ), и отыщем такое τˆ , для которого гипотеза об отсутствии автокорреляции впервые не отвергается. Тем самым найдем “шаг” τˆ , соответствующий неавтокоррелированным значениям εt . Деля длину ряда N на τˆ , узнаем число “независимых” наблюдений Nˆ . На этом 92
завершим рассмотрение методов активного согласования применительно к уравнениям регрессии общего вида. Это не означает, что потенциал данных методов уже исчерпан. Обсуждение наряду с общими уравнениями регрессии их частного случая – производственной функции Кобба – Дугласа – позволило расширить число важных для приложений аспектов развиваемого подхода. Интересные дополнительные возможности представляет нам еще один частный случай уравнений множественной регрессии, так называемые уравнения с распределенными лагами. 2.6. Уравнения с распределенными лагами
Если в уравнении множественной регрессии n
Yt = ∑ ai X i (t ) + ε t
t = 1,..., N ,
(2.6.1)
i =0
осуществить замену переменных следующего вида X i (t ) = X (t − i ),
i = 0, 1, …, n
и ввести условие неотрицательности параметров a i ≥ 0 i = 0, 1, …, n,
то новое уравнение n
Yt = ∑ ai X (t − i) + εt , t = n + 1,..., N ,
(2.6.2)
i =0
как раз и будет представлять собой известное уравнение с распределенными лагами. Интерес к данному виду уравнений объясняется важностью учета широко распространенного в экономических процессах явления запаздывания “эффекта” по отношению к вызвавшим его “затратам”. Рассмотрим с этой целью процесс расширенного воспроизводства основных производственных фондов. Первую стадию этого процесса, изучаемого в аспекте материально-вещественного воспроизводства используемых средств труда, образует инвестиционный процесс. Он начинается с момента вложений инвестиций (“затраты”) и заканчивается их овеществлением во вновь введенных основных фондах (“эффект”). Проанализируем этот процесс с 93
позиций формирования вводов основных фондов года t. В их объем входит некоторая часть капитальных вложений того же года, т.е. с нулевым лагом, часть капитальных вложений предшествующего года, т.е. с годовым лагом, и т.д. И, наконец, часть капитальных вложений наиболее удаленного от рассматриваемого года, т.е. с максимальным лагом. Следует подчеркнуть, что объектом изучения являются в данном случае не индивидуальные строительные программы (объект, стройка или даже более сложный комплекс) с присущими именно им, а потому неприменимыми к другим программам особенностями освоения капитальных вложений во времени, а макроэкономические процессы капитального строительства народно-хозяйственного и отраслевых уровней. В силу массовости и объемности строительных программ на этих уровнях лаговые показатели формирования вводов основных фондов являются достаточно инерционными и устойчивыми. Поэтому их оценка является основой как более глубокого анализа процесса, так и повышения надежности прогнозирования показателя вводов основных фондов, связанного в своем поведении предысторией. Вторая стадия процесса воспроизводства основных фондов относится к их функционированию в качестве средств труда и может быть описана с помощью подобной только что рассмотренной для первой стадии схемы: вновь созданные основные фонды после их ввода в эксплуатацию становятся частью действующих основных фондов, некоторое время “живут” в их составе, а затем выбывают из-за физического и морального износа. Нетрудно видеть, что выбытие основных фондов в году t аккумулирует в своем составе некоторые части вводов основных фондов предшествующих лет, т.е. также может быть описано с помощью уравнения с распределенными лагами (2.6.2), хотя и с иными экономическим смыслом и значениями его параметров. Анализ освоения проектной мощности у совокупности объектов, образующих вводы основных производственных фондов данного года, показывает, что одна их часть достигает проектной мощности в том же году (с нулевым лагом), другая через год (с годовым лагом) и т.д. Наконец, некоторая последняя часть достигает проектной мощности через интервал лет, называемый максимальным лагом. Следовательно, и в данном случае мы имеем дело с экономическим процессом с распределенными лагами, где соответ94
ствующие коэффициенты (освоения проектной мощности) и интервалы времени являются его лаговыми параметрами. Исследование соотношения между приростом продукции и капитальными вложениями, к которым относят этот прирост (проблема исчисления показателя капиталоотдачи), также приводит к изучению процесса с распределенными лагами. Действительно, капитальные вложения, к которым следует отнести прирост продукции данного года, являются не чем иным, как участвовавшими в производстве вновь введенными основными фондами, образованными, в свою очередь, некоторыми долями (искомых) капитальных вложений прошлых лет. Расчеты соответствующих лаговых показателей позволяют соотнести “эффект” (прирост продукции) и “затраты” (найденную часть капитальных вложений прошлых лет), т.е. экономически обоснованно проанализировать показатель капиталоотдачи (фондоотдачи). Анализ и планирование демографических процессов, и в частности важные для экономики расчеты контингента населения в трудоспособном возрасте, на плановый период основаны на тех же принципах изучения связи показателей с распределенными лагами и использования в дальнейшей обработке информации достаточно устойчивых на уровне страны и ее крупных регионов лаговых показателей. На этом ограничимся рассмотрением конкретных процессов с распределенными лагами и перейдем к обсуждению методов оценки представленного выше уравнения (П.6.2). Именно данное уравнение было объектом внимания широкого круга исследователей, включая таких известных, как Ян Тинберген и Ирвинг Фишер. Интерес к нему не ослабевает и в наши дни, о чем свидетельствует большое количество публикуемых статей и специальных монографий, в частности переведенная – на русский язык книга американского эконометрика Ф.Д. Драймса “Распределенные лаги” (М.: Финансы и статистика, 1982). Проблема оценки распределенных лагов формулируется в отношении несколько преобразованного уравнения (2.6.2), а именно: n
Yt = β∑ wi X (t − i ) + εt i =0
95
t = n + 1,..., N ,
(2.6.3)
n
где β = ∑ , ai > 0. При этом совокупность новых неотрицательных i =0
параметров
n ai ≥ 0, i = 0, 1, ..., n, ∑ wi = 1 , (2.6.4) β i =0 как раз и называется законом распределения вероятностей лагов или лаговой структурой. Задача ставится следующим образом. На основании информации о показателях экономического процесса “затраты” и “эффект” временных рядов Х(t), Y(t), t = 1,…, N, необходимо оценить параметры уравнения (2.6.3), когда ни их истинное число п + 1, ни математическая зависимость, которой удовлетворяют величины w0, w1,…, wn (вид закона распределения лагов), заранее не известны. К сожалению, успешному решению сформулированной таким образом проблемы мешает мультиколлинеарность факторов, являющихся произвольной (неизвестной по числу) совокупностью запаздывающих значений одного и того же ряда Х(t), t = 1,..., N. Именно ссылаясь на это обстоятельство (хотя, как мы покажем, не только мультиколлинеарность факторов мешает решению проблемы в ее приведенной выше постановке), авторы известных методов единодушно признают невозможность общего решения проблемы и предлагают различные частные подходы. Все они основаны на одной и той же идее замены априори неизвестного закона распределения лагов на конкретные малопараметрические законы или на связанные с ними через Фурье-преобразование так называемые лаговые производящие функции. Приведем некоторые из них: 1) бесконечно убывающая геометрическая прогрессия (метод Л.М. Койка, 1954 г.): wi = (1 − λ ) ⋅ λ i , 0 < λ < 1, i = 0, 1,..., ∞; (2.6.5) 2) линейно-убывающая (с ростом i) функция (метод И. Фишера, 1957 г.): ⎧ 2(n + 1 − i ) , i = 0,1, ..., n, ⎪ (2.6.6) wi = ⎨ (n + 1)(n + 2) ⎪0, для остальных i; ⎩
wi =
96
3) распределение Паскаля (метод Р.М. Солоу, 1960 г.): wi = C ir +i −1(1 − λ) r ⋅ λ i , 0 < λ < 1, i = 0,1,..., ∞;
(2.6.7)
4) “перевернутое V” (закон, названный так его автором Д. Лью, 1962 г.): ⎧ i + 1 , i = 0,1,..., m, ⎪ (m + 1) 2 ⎪ wi = ⎨ (2.6.8) ⎪ 2m + 1 − i , i = m + 1,..., 2m, (случай n = 2m); ⎪⎩ (m + 1) 2 5) равномерное (прямоугольное) распределение (в литературе по проблеме распределенных лагов оно фигурирует без указания авторства): ⎧ 1 , i = 0,1,..., n, ⎪ (2.6.9) wi = ⎨ n + 1 ⎪⎩0, для остальных i; Рассматривая решение проблемы распределенных лагов с помощью представленных выше законов-гипотез, необходимо помнить о логике статистической проверки гипотез, которая исходит из того, что неотвергнутая гипотеза весьма правдоподобная, но не единственно возможная. Чтобы показать всю сложность возникающей при этом проблемы окончательного выбора (наряду с воздействием самих гипотез на свойства оценок лаговых параметров), предположим, что среди неотвергнутых находится либо часть, либо все пять указанных законов-гипотез. Предварительно воспользуемся следующими зависимостями между их важнейшими параметрами – математическими ожиданиями υ1 и дисперсиями лагов σ2 указанных 5 гипотетических законов: 1 1 1) σ 2 = ν12 + ν1; 2) σ2 = (ν12 + ν1 ); 3) σ2 = (ν12 + 2ν1 ), 2 2 1 что соответствует параметру r = 2; 4) σ 2 = (ν12 − 1); 6 1 (2.6.10) 5) σ 2 = (ν12 + ν1 ). 3 97
Ввиду того, что истинные параметры ν1 , σ 2 могут быть любой точкой области ν1 > 0, σ 2 > 0 (т.е. теоретически любой точкой первого квадранта в данной системе координат), а поиск этих параметров ведется только в точках, лежащих на указанных кривых, каждый из этих методов может привести к далеким от истинных значений оценкам лаговых параметров. В то же время, наличие совокупности кривых σ2 = f (ν1 ) в области возможных значений истинных параметров позволяет ожидать, что точка (ν1 , σ 2) окажется достаточно близкой к одной из них, и тогда соответствующий метод следует признать “наилучшим”. Остается выяснить, какой же это метод, и воспользоваться полученными с его помощью оценками. Напрашивается предположение, что это тот метод, которому соответствует наивысшая точность приближения теоретического показателя Yt (регрессии) к исходному временному ряду Y(t). Однако в условиях, когда каждый из методов может приводить к смещенным оценкам, невозможно доказать, что наименьшая дисперсия ошибок уравнения является достаточным условием для минимума смещения оценок относительно истинных величин лаговых параметров. Поэтому указанная выше возможность носит чисто умозрительный характер: весьма вероятно, что один из методов приводит к оценкам с небольшим смещением, но какой именно, мы не знаем. Следует отметить, что представленные здесь методы замены основаны на однопараметрических законах распределения лагов, которые не могут (без того, чтобы не приводить к смещению оценок параметров) использоваться для оценки истинного (неизвестного нам) закона, если последний имеет хотя бы два независимых параметра. Конечно, методы, использующие конкретные законы-гипотезы с двумя независимыми параметрами, как, например, закон Паскаля с переменным параметром r, лучшим образом справились бы с оценкой истинных значений ν1 и σ2. Но, к сожалению, мы опять не бу98
дем знать, сколько независимых параметров у истинного закона лагов – два или, может быть, более1. Методы гипотетической замены имели своей целью устранение опасной для статистического качества оценок мультиколлинеарности факторов уравнения (11.6.3). Эта цель достигается, так как при малом числе параметров соответствующих им законов-гипотез у новых уравнений будет столь же небольшое число новых факторов. Однако цена за достижение этой цели оказывается слишком высокой: наиболее вероятно, что полученные с их помощью оценки будут смещенными и притом значительно. Предлагаемый нами метод решения проблемы распределенных лагов основан на уже описанном принципе согласования свойств временных рядов функции и факторов, самого уравнения (с распределенными лагами) и применяемого для оценки его параметров метода (наименьших квадратов). Наряду с ними обратимся и к свойству инвариантности, но не только в отношении временных рядов (инвариантность по сдвигу, положенная в основу развиваемой в работе методологии в целом), а и применительно к новой форме лаговых параметров (в виде начальных моментов закона распределения) в эквивалентном уравнении. Разработку метода начнем по традиции с этапа пассивного согласования, задавшись вопросом: какие свойства временных рядов и самого уравнения необходимы для того, чтобы уравнение с распределенными лагами (2.6.1) было допустимым? Специфика его факторов, являющихся совокупностью сдвинутых по t значений одного и того же временного ряда, позволяет ограничиться разработкой Br-модели лишь для одного из них, например для исходного ряда X(t), t = 1,..., N. Поэтому будем исходить из того, что проведенный анализ данного временного ряда привел к соответствующей Br-модели, и известны как степень k, так и сам “наиболее точный из допустимых по надежности старших коэффициентов” полином Pk (t). Одновременно это означает, что в построенной стохастической модели X t = Pk (t ) + δt (2.6.11) 1
Более полный анализ известных методов см. Седелев Б.В. Оценка распределенных лагов в экономических процессах. М.: Экономика, 1977, с. 20–40. 99
случайная компонента δt является белым шумом с дисперсией σδ2 (на основании проверки на отсутствие автокорреляции была принята гипотеза о белом шуме). Опираясь на свойство инвариантности, по сдвигу во времени у данного класса временных рядов мы заключаем, что все n + 1 факторов уравнения (“затраты”) имеют идентичные, с точностью до сдвига, стохастические модели: X t −i = Pk (t − i) + δt −1 , i = 0,1,..., n.
(2.6.12)
Обратимся к временному ряду функции – “эффекту” Y(t), t = 1,..., N. Первое, что необходимо для согласования его свойств со свойствами временных рядов факторов – “затрат”, это равенство степеней их трендовых полиномов. Поэтому будем считать, что в построенной для него модели Yt = Pk* (t ) + γ t (2.6.13) полином Pk* (t ) , отличаясь от Pk (t ) своими коэффициентами, имеет ту же степень k ( γ t – белый шум с дисперсией σδ2 ). Рассмотрим последовательно три возможных случая соотношений между числом факторов уравнения (2.6.1) n + 1 и степенью трендовых полиномов показателей k : n + 1 > k + 1, n + 1 < k + n и n + 1 = k + 1. В первом случае число факторов таково, что соответствующая им совокупность запаздывающих значений одного и того же полинома будет линейно-зависимой, а сами факторы – мультиколлинеарными. Во втором случае факторов меньше, чем это необходимо для того, чтобы совокупность полиномов Pk* (t ) и Pk (t − i ) , i = 0, 1,..., n, можно было связать линейной зависимостью нетривиального характера (не со всеми нулевыми коэффициентами). Поэтому у ошибки уравнения εt будет наблюдаться “нескомпенсированный” (“остаточный”) тренд, и корректная оценка уравнения с помощью метода наименьших квадратов так же, как и в первом случае, невозможна. В третьем случае число факторов и степени трендовых полиномов функции и факторов согласованы таким образом, что факторы в отдельности немультиколлинеарны, а в совокупности с функцией 100
могут быть связаны линейной стохастической зависимостью интересующего нас вида, т.е. уравнением множественной регрессии (2.6.1) со случайной ошибкой εt, имеющей нулевое математическое ожидание (нулевой тренд). Из сказанного следует, что только в том случае, когда степени полиномов у трендов показателей “затраты” и “эффект” одинаковы, величина максимального лага n равна этой (общей) степени k, а случайная ошибка уравнения εt является белым шумом, условия теоремы Гаусса – Маркова будут соблюдены и для лаговых параметров уравнения (2.6.1) могут быть получены несмещенные и эффективные оценки. Нетрудно видеть, что фигурирующие здесь условия являются частным случаем условий допустимости уравнений множественной регрессии с функциями и факторами, имеющими в качестве трендов полиномы различных степеней (формула (2.4.17)). Полученный результат оформим в виде следующей леммы. Уравнение с распределенными лагами в его исходном виде (2.6.1) может быть корректно оценено, если выполняются следующие условия: полиномы трендов показателей “затраты” и “эффект” имеют равные степени k, величина максимального лага п равна k, а ошибка уравнения εt является белым шумом. Если говорить не о строгом соблюдении условий теоремы Гаусса – Маркова, требующей от ошибки уравнения свойств белого шума, то здесь (с учетом рассмотренной в конце 2.5 процедуры) возможен и случай автокоррелированной ошибки εt. Однако, как и ранее, должны выполняться условия, гарантирующие отсутствие у нее “остаточного” тренда. Зафиксированный в лемме результат носит слишком частный характер, чтобы рассматривать его как метод решения проблемы распределенных лагов. Однако он интересен двумя следующими моментами. Во-первых, он показывает, что методы замены – не адекватный путь ее решения. А во-вторых, подтверждает конструктивность подхода, основанного на согласовании свойств временных рядов показателей, самого уравнения регрессии и метода оценки (хотя и не содержит в прямой форме указаний на то, каким должно быть решение в общем случае). Чтобы воспользоваться возможностями идеи “согласования” во всем ее объеме, необходимо предварительно преобразовать исход101
ное уравнение с распределенными лагами. Но это преобразование существенным образом отличается от рассмотренных выше подстановок в уравнение вместо априори неизвестного закона конкретных малопараметрических законов-гипотез: оно переводит исходное уравнение в более удобное для наших целей эквивалентное уравнение. Итак, приступим к выводу эквивалентного уравнения с распределенными лагами, для чего заменим в уравнении (2.6.3) запаздывающие значения Х(t – i) на следующие тождественные им суммы левосторонних конечных разностей: i
(−1) j i (i − 1)… (i − j + 1) j Δ X (t ), j! j =0
X (t − i) = ∑
где
Δ j X (t )
(2.6.14)
⎧ X (t ) для j = 0, ⎪ = ⎨ X (t ) − X (t − 1) для j = 1, ⎪ j −1 j −1 ⎩Δ X (t ) − Δ X (t − 1) для j > 1.
Дальнейшие преобразования зависят от соотношений n и k. Первым рассмотрим случай n > k. Входящее в формулу для Х(t – i) выражение i (i – 1) … (i – j + 1) является частным случаем (для целых i) известного в исчислении конечных разностей факториального многочлена gi (х) = х(х – 1) ... (х – j + 1). В целях удобства последующих аналитических операций распространим конечноразностное представление для Х(t – i) на значения j = i + 1,…, n, при этом все его члены, начинал с j = i + 1, будут равны 0, поскольку содержат нулевой сомножитель в соответствующем факториальном многочлене. Для факториального многочлена возможно следующее преобразование в полином по степеням i: j
g j (i ) = i(i − 1) ... (i − j + 1) = ∑ S ( j , r ) ⋅ i r
(2.6.15)
r =0
где S ( j , r ) – числа Стирлинга первого рода.1 Их значения могут быть получены по схеме: для j = 1 g1 (i) = S (1, 0) + S (1, 1) i, откуда 1
См., например, Хемминг Р.В. Указ. соч., с. 32. 102
S (1, 0) = 0, S (1, 1) = 1; для j > 1 они могут быть определены из рекуррентного соотношения S ( j + 1, r) = S ( j,r – 1) – jS ( j, r) ,
(2.6.16)
при этом для всех j ≥ 1 справедливо S ( j, j) = 1 и S ( j, 0) = 0. Ввиду того что в формулу (2.6.14) входит значение j = 0, а числа Стирлинга первого рода определены для j ≥ 1, их целесообразно доопределить, положив S (0, 0) = 1. Используя указанные преобразования (2.6.14)–(2.6.16), представим исходное уравнение в виде n n (−1) j Δ j X (t ) n Yt = β∑ wi ∑ S ( j , r )i r + εt . (2.6.17) ∑ j! i =0 j =0 r =0 Проведем суммирование по i, обозначив
n
∑ wi i r через
i =0
ν r . Ве-
личины υr являются ни чем иным, как начальными моментами искомого (неизвестного нам) закона распределения лагов w0, w1,…, ⎛ n ⎞ wn ⎜ ∑ wi = ν 0 = 1⎟ . ⎝ r =0 ⎠ В полученной таким способом форме исходного уравнения n
Yt = β ∑
(−1) j Δ j X (t )
j
(2.6.18) ∑ S ( j , r ) ν r + εt jr r =0 изменим порядок суммирования (по треугольной области 0 ≤ j ≤ n, 0 ≤ r ≤ j) и введем обозначение j =0
n
xr ,n (t ) = ∑ j =r
(−1) jS ( j , r ) j Δ X (t ). j!
(2.6.19)
В результате данной последовательности тождественных преобразований будем иметь следующее эквивалентное исходному уравнение: n
Yt = β ∑ ν r xr ,n (t ) + εt
t = n + 1,… , N .
(2.6.20)
r =0
Свойства новых факторов xr ,n (t ) определяются прежде всего тем, имеют ли они в своем составе конечные разности до k-го порядка включительно или нет. Это позволяет разбить их сово103
купность на две части: xr ,n (t ) при r = 0, 1, …, k и xr ,n (t ) при r = k + 1,…, n. В свою очередь каждая из величин xr ,n (t ) , r = 0, 1,…, k может быть разбита на два слагаемых:
k
∑ j =r
(−1) jS ( j , r ) j Δ X (t ) , содержаj!
щее разности не выше k-го порядка, и
k
∑
j = k +1
(−1) jS ( j , r ) j Δ X (t ) , в j!
котором самая младшая разность имеет (k + 1)-й порядок. Преобразуем в соответствии с этим правую часть уравнения (2.6.20), выделив в ней в особую группу членов с конечными разностями порядков r = 0, 1,…, k: k k (−1) jS ( j, r ) j Yt = β ∑ ν r ∑ Δ X (t ) + j! r =0 j =r (2.6.21) j n k (−1) jS ( j, r ) j +β ∑ ∑ ν r Δ X (t ) + εt = β ∑ ν r xr ,k (t ) + ζ(t ) + εt , j! j = k +1 r =0 r =0 где
(−1) jS ( j , r ) j Δ X (t ) j!
k
xr ,k (t ) = ∑ j =r
и ζ (t ) = β
n
j
∑ ∑ νr
j = k +1 r =0
(−1) jS ( j , r ) i Δ X (t ). j!
Обратимся к выражению для ζ(t) и прежде всего заменим в нем j j конечные разности ∆ Х(t) на ∆ δ(t), так как при j ≥ k + 1 справедливо j j j равенство ∆ Х(t) = ∆ [Pk(t) + δ(t)] = ∆ δ(t). Затем представим ζ(t) в несколько иной, более удобной для дальнейших преобразований форме: j n ( −1) jS ( j , r ) j ζ (t ) = β ∑ ∑ ν r Δ δ(t ) − j! j =0 r =0 (2.6.22) j k (−1) jS ( j , r ) j −β ∑ ∑ ν r Δ δ(t ). j! j = 0 r =0 104
Первая из двойных сумм, как нетрудно видеть, тождественно равна
n
β ∑ wm δ(t − m) . m=0
k
β ∑ wm δ(t − m) и β m=0
Разобьем
n
∑
m = k +1
ее
на
два
слагаемых:
wm δ(t − m) . Во второй двойной сумме,
входящей в правую часть равенства (2.6.22), заменим конечную j разность ∆ δ(t) на следующее, тождественное ей выражение: j j! Δ j δ(t ) = ∑ (−1) m δ(t − m). (2.6.23) − ( j m )!m ! m=0 Подставляя эти эквивалентные исходным величины в формулу для ζ(t) и изменяя в ней порядок суммирования (по треугольной области 0 ≤ j ≤ k, 0 ≤ m ≤ j), получим k ⎡ (−1) m ζ(t ) = β ∑ δ (t − m) ⎢wm − m! m =0 ⎣⎢ n
+β
∑
m= k +1
k
∑
j =m
⎤ (−1) j j S ( j , r )ν r ⎥ + ∑ ( j − m)! r =0 ⎦⎥
(2.6.24)
wmδ(t − m).
Теперь предстоит выяснить, чем же является второй член выражения, заключенного в квадратные скобки. Структура формулы (2.6.24) позволяет сделать предположение, что он каким-то образом связан с величиной wm , возможно, представляя ее значение через начальные моменты ν r . Постараемся разрешить этот вопрос прямым образом, получив необходимую формулу для зависимости параметров w0 ,..., wn от начальных моментов ν 0 , ν1 ,..., ν n (где ν r > 0, r = 1,..., n; ν 0 = 1).
Учитывая, что величины wi ≥ 0, i = 0, 1,..., n, удовлетворяющие условию
n
∑ wi = 1,
являются вероятностями соответствующих ла-
i =0
гов i = 0, 1,..., n, построим для них известную из теории вероятностей производящую функцию n
f ( z ) = ∑ wi z i . i =0
105
(2.6.25)
С точностью до обозначений она совпадает с упоминавшейся ранее производящей функцией лагов, в отношении которой авторы известных методов осуществляли те или иные замены-гипотезы (наряду с гипотезами о виде самого закона w0 , w1 ,..., wn ). Приступим к выводу интересующего нас выражения с того, что возьмем m-ю производную от f (z) n
f ( m)( z ) = ∑ wi i (i − 1)...(i − m + 1) ⋅ z i − m
(2.6.26)
i =0
и рассмотрим ее значение при z = 0: f ( m)(0) = wm m(m − 1)...1 = wm ⋅ m!
(2.6.27)
Отсюда, как и следовало ожидать, f ( m)(0) (2.6.28) , m = 0,1,..., n, m! а сама функция f (z) может быть представлена в следующей эквивалентной форме: n n f ( m)(0) m (2.6.29) f ( z ) = ∑ wi z i = ∑ z . m! i =0 m=0 Воспользуемся выражением (2.6.26) и определим значение ( m f ) ( z ) при z = 1: wm =
n
f ( m)(1) = ∑ wi i (i − 1)...(i − m + 1).
(2.6.30)
i =0
Представленный здесь факториальный многочлен g m (i) заменим на полином по степеням i, используя с этой целью уже известную нам формулу (2.6.15): n
m
m
i =0
r =0
r =0
f ( m)(1) = ∑ wi ∑ S (m, r )i i = ∑ S (m, r ) ⋅ ν r .
(2.6.31)
Чтобы выразить вероятности лагов через начальные моменты, воспользуемся следующей связью f ( m ) (0) и f ( m) (1) : f ( m)(0) = f ( m)(1 − 1) =
n −m
∑
p =0
(−1) p ( m+ p ) (1), m = 0,1,..., n, (2.6.32) f p! 106
а затем заменим в ней f ( m+ p ) (1) на ее значение из формулы (2.6.31): n−m (−1) p −m m+ p f ( m)(0) = (−1) m ∑ ∑ S (m + p, r ) ⋅ ν r , m = 0,1,..., n. (2.6.33) p ! r =0 p =0 Вводя новый индекс j = m + р и деля обе части последнего выражения на m!, получим искомую зависимость: wm =
(−1) m m!
n
∑
j =m
j
(−1) j
∑
S ( j, r ) ⋅ ν r ,
( j − m) ! r = 0
m = 0,1,..., n.
(2.6.34)
Возвращаясь к выражению (2.6.24) для ζ(t), получаем возможность сказать, что интересующий нас (второй) член в квадратных скобках является приближенной (вместо n стоит k, а нами исследуется случай n > k) оценкой wm . С учетом этого k
ζ (t ) = β ∑ ( wm − wˆ m ) δ (t − m) + β m =0
или окончательно ζ (t ) ≅
n
∑
m = k +1
n
∑
m = k +1
wm δ(t − m).
wm δ(t − m),
(2.6.35)
(2.6.36)
Теперь нетрудно оценить дисперсию величины ζ(t), являющейся линейной комбинацией неавтокоррелированных величин δ(t – m), m = k + 1,..., n, с нулевыми средними и одинаковыми (и уже известными нам из анализа временного ряда Х(t)) значениями их дисперсий σ δ2 . : σ ξ2
≅ β2
n
∑
m = k +1
2 2. σδ wm
(2.6.37)
Чтобы величина ζ(t) не изменила (практически) свойств белого шума исходной ошибки уравнения εt , необходимо, чтобы она в среднеквадратическом была значительно меньше: (2.6.38) σ ξ2 k (зависимые объясняющие переменные) и n ≤ k (независимые переменные). Первый уже был рассмотрен и пределы его возможностей установлены. Что касается второго слу109
чая, то для него должна быть обеспечена оценка закона в полном объеме, т.е. всех n + 1 вероятностей w0, w1, …, wn. Опишем достаточно простой прием, который позволяет привести исходное уравнение к новой форме, тождественной форме уравнения (2.6.40) и одновременно эквивалентной исходной при n ≤ k. Преобразования начнем с введения в уравнение (2.6.3) фиктивных вероятностей wn +1 = ... = wk = 0. Понятно, что они не изменят ошибки исходного уравнения k
Yt = β∑ wi X (t − i) + εt , n ≤ k .
(2.6.41)
i =0
Применяя к уравнению (2.6.41) те же самые преобразования, что и при выводе уравнения (2.6.20), эквивалентного исходному, получим k
Y t = β∑ ν r xr ,k (t ) + εt ,
(2.6.42)
i =0
Уравнение (2.6.42) является в точном смысле слова эквивалентным исходному при n ≤ k, а его новые факторы xr ,k (t), r = 0, 1,..., k, в соответствии со свойствами временного ряда Х (t), t = 1,..., N, образуют систему линейно-независимых векторов, по которым с высокой (исходной) точностью и надежностью производится разложение показателя “эффекта” Yt . Проделанные преобразования, основанные на согласовании свойств временных рядов, уравнения с распределенными лагами и метода оценки, позволяют отнести проблему измерения лаговых параметров к одному общему для случаев n > k и n ≤ k уравнению k
Yt = β ∑ ν r xr ,k (t ) + ut , t = k + 1,..., N .
(2.6.43)
r =0
При равенстве степеней трендовых полиномов у показателей “затраты” и “эффект” факторы уравнения (2.6.43) будут линейнонезависимыми векторами как для случая n > k, так и для n ≤ k. При этом в последнем случае устраняется первоначально имеющая место опасность возникновения “остаточного” тренда у ошибки уравнения. 110
Таким образом, ut есть случайная величина с нулевым средним значением, совпадающая с ошибкой исходного уравнения εt при n ≤ k, а при n > k – с ошибкой ηt уравнения (2.6.40). В предположении, что первая из них является белым шумом, а вторая близка к нему, метод наименьших квадратов в соответствии с теоремой Гаусса – Маркова позволяет получить несмещенные и эффективные оценки линейных параметров β и ν′r = βν r , а тем самым и начальных моментов ν r , r = 1,..., k. По оцененным начальным моментам можно рассчитать величину максимального лага (например, на основе неравенства Чебышева, если k = 2, или применяя с этой целью более тонкие неравенства “по вероятности”, оценивающие “ширину” закона распределения с помощью моментов при k > 2). Если при этом оказалось, что n ≤ k, то имеется возможность оценить закон в полном объеме – все n + 1 вероятностей лагов w0 , w1 ,..., wn . Для этого следует воспользоваться оценками первых n (независимыx начальных моментов и выведенной формулой (2.6.34). Приведенные выше преобразования и доказательства позволяют сформулировать следующую (первую) теорему о распределенных лагах. Если степени полиномов у трендов показателей “затраты” и “эффект” одинаковы и равны некоторому k, а ошибка “усеченного” уравнения практически эквивалентна исходной ошибке (белый шум), то, каково бы ни было истинное значение максимального лага n, метод наименьших квадратов позволяет получить k + 1 несмещенных и эффективных оценок параметров β и ν1,…, νk – начальных моментов априори неизвестного закона распределения вероятностей лагов. Следствие из теоремы: в случае п ≤ k возможна оценка априори неизвестного закона распределения вероятностей лагов в полном объеме – всех п + 1 вероятностей лагов w0 , w1 ,..., wn . Итак, метод согласования (приведение исходного уравнения к допустимому виду) позволил выявить предельное количество объективной информации о законе распределения вероятностей лагов, 111
содержащееся во временных рядах экономических показателей “затраты” и “эффект”. При этом в случае n > k имеется выбор: либо ограничиться анализом полученных оценок β, ν1,…, νk , либо, если того требует экономический анализ, использовать знание начальных моментов для “восстановления” закона, применив с этой целью метод аппроксимации по совпадению теоретических и расчетных моментов. Выбор конкретного k-параметрического закона (формулы аппроксимации) напоминает методы замены априори неизвестного закона на тот или иной конкретный закон-гипотезу. Но это лишь внешняя аналогия: в предложенном нами методе выбор конкретного (содержательно правдоподобного) закона производится после решения и поэтому не может разрушить выявленную ранее объективную информацию о лаговых параметрах ν1,…, νk . В то же время, мы не говорим (в случае n > k), что найден истинный закон: параметры νr инвариантны по отношению к возможным k-параметрическим законам распределения лагов. Мы утверждаем лишь, что получили “наилучшую” аппроксимацию, которая, с одной стороны, содержательно правдоподобна (как и в методах замены), а с другой – основана на несмещенных и эффективных оценках k параметров (чего нет в методах замены). Отсюда следует также, что выбор времени и места для введения гипотез неинвариантен по отношению к получаемым результатам. Характер предложенного метода согласования для уравнений с распределенными лагами с выявлением предельного количества объективной информации об априори неизвестном законе говорит о том, что дополнительной эффективной процедурой активного согласования из двух рассмотренных ранее (для уравнений регрессии общего вида) может служить лишь повышение на 1 степеней полиномов у одного из показателей “затраты” и “эффект”. Действительно, процедура активного согласования свойств временных рядов функции и факторов со свойствами уравнения с помощью перехода от постоянных параметров к переменным ведет к повышению числа членов уравнения с распределенными лагами. Это означает, что перед нами возникает альтернатива оценить либо меньшее количество переменных лаговых параметров, либо большее количество постоянных. Учитывая невысокую информатив112
ность временных рядов макроэкономических показателей (измеряемую числом независимых параметров их моделей), мы предпочитаем получить большее количество постоянных параметров. Ведь при реальных (небольших) значениях k и заранее неизвестном максимальном лаге n мы, как правило (случай n > k более часто встречается на практике), получаем меньшее количество параметров, чем это необходимо для оценки закона в полном объеме – всех n + 1 вероятностей лагов. И лишь в том случае, когда решение уравнения (2.6.43) показывает, что мы имеем дело со случаем n < k, появляется (потенциально) возможность замены постоянных параметров на переменные. Чтобы выяснить реальность этой замены, необходимо учитывать, что даже простейший случай перехода к переменным параметрам требует удвоения числа членов (и новых постоянных параметров) уравнения. Последнее же с высокой степенью вероятности приведет к случаю превышения числа оцениваемых параметров по отношению к возможному. Поэтому реальное дополнительное согласование ограничивается следующими случаями. Если проведенный анализ временных рядов Х(t), Y(t), t = 1,..., N, показывает, что степень полинома у тренда “затрат” на 1 меньше, чем у “эффекта”, то строится новая Brмодель для временного ряда “затрат” (со степенью полинома, на 1 превышающей старую степень). Если же меньшая (на 1) степень у “эффекта”, то новая Br-модель строится для него. Дальнейшие процедуры согласования свойств временных рядов со свойствами уравнения аналогичны уже описанным. Задача прогнозирования с помощью уравнения с распределенными лагами интересна прежде всего тем, что в годы прогноза t = N + 1,.., N + n связывает возможный “эффект” не только с прогнозными значениями “затрат”, но и с их фактическими (наблюденными) величинами. Так, в частности, в год t = N + j (1 ≤ j ≤ n) прогноз “эффекта” равен j −1
n
i =0
i= j
Y ( N + j ) = β∑ wi Pk ( N + j − i ) + β∑ wi X ( N + j − i ),
(2.6.44)
где β, wi , n – оценки параметров закона распределения лагов; Х (N + j – i) – наблюденные значения “затрат”; Рk (N + j – i) – про113
гнозные значения “затрат”, полученные с помощью описанного в разделе I работы метода. Этим уравнения с распределенными лагами выгодно отличаются от традиционных (одновременных) уравнений регрессии, прогноз функции по которым целиком определяется прогнозными значениями факторов и в силу этого является менее надежным. Исторически сложилось так, что проблема распределенных лагов возникла и существует до сих пор в зарубежной литературе как теория анализа и оценки параметров лишь одного уравнения (2.6.З). Тем самым признается важность оценки зависимости ввода основных фондов от капитальных вложений прошлых лет, выбытий основных фондов от совокупности вводов основных фондов предшествующего периода времени, числа умерших в некотором году от родившихся в нем и в предшествующем ему годы и т.д. Но почему-то не возник интерес к тому, как оценить процесс формирования незавершенного строительства (из капитальных вложений прошлых лет), объема действующих основных фондов (из вводов предшествующего периода времени), численности живущих в данном году и т.д. Возможная здесь ссылка на то, что и последние показатели определяются тем же самым законом распределения лагов, несостоятельна, так как заранее не ясно – будет ли новое (второе) уравнение обладать теми же самыми статистическими свойствами (в частности, будет ли оно допускать корректную оценку того же самого или большего числа лаговых параметров), что и первое. Изучение вопроса о роли и возможностях нового (второго) уравнения в теории и практике оценки параметров и структуры макроэкономических процессов столь же важно, как и исследование рассмотренного выше (первого) уравнения. 2.7. Модель процессов с распределенными лагами из двух уравнений
Экономико-математическая модель процессов в виде “основного” уравнения с распределенными лагами описывает связь показателей в цепочке “затраты – эффект” и не затрагивает другую, не менее важную для экономического анализа характеристику этих процессов – формирование кумулятивных показателей, описы114
вающих промежуточные накопления “затрат” в процессе их преобразования в выходной “эффект”. Следует сказать, что привлечение к анализу дополнительного уравнения связи показателей с теми же искомыми параметрами и соответственно новых наблюдений в виде временного ряда указанного показателя позволит не только углубить характер исследования таких процессов, но и расширить статистические возможности метода оценки лаговых параметров. В данном параграфе мы рассмотрим экономико-математическую модель процессов с двумя уравнениями связи показателей, включая вывод второго уравнения, его эквивалентной и усеченной форм, и новый, соответствующий этой модели метод оценки параметров априори неизвестного закона распределения лагов. Экономические показатели кумулятивного характера, такие как, например, объем незавершенного строительства, основные производственные фонды или численность населения в трудоспособном возрасте, обычно представлены в статистической отчетности своими значениями на начало или конец года. Ввиду того что в качестве основного содержательно-интерпретирующего объекта исследования мы избрали инвестиционный процесс, а показатель незавершенного строительства задается на конец года, то в выводимом ниже уравнении интересующий нас показатель также представлен его величиной на конец года. Это означает, что если в случае другого процесса с распределенными лагами мы будем интересоваться представлением соответствующего показателя на начало года, то выведенный нами показатель на конец года t следует применять как его значение на начало года t + 1. Чтобы не употреблять излишне пространное выражение – показатель промежуточного накопления в процессе преобразования ‘затрат” в выходной “эффект”, закрепим за ним обозначение Z(t) и в дальнейшем будем говорить о нем как о показателе Z(t). Итак, показатель Z(t) формируется следующим образом по значениям показателя X(t): Z (t ) = ( w1 + ... + wn )βX (t ) + ( w2 + ... + wn )βX (t − 1) + ... + n −1
+ wnβX (t − n + 1) = β ∑
n
∑
m = 0 i = m +1
115
wi X (t − m).
(2.7.1)
Действительно, в конце года t из общего объема “затрат” за этот же год Х(t) в объем показателя Z(t) перешло все то, что не успело стать “эффектом”, т.е. βX (t ) − w0βX (t ) = ( w1 + ... + wn )βX (t )
от объема “затрат” за предыдущий год X(t – 1) в “эффект” перешли его следующие части: w0βX (t – 1) – в еще предыдущий (t – 1)-й год и w1βX (t – 1) – в рассматриваемый t-й год. Поэтому в объем Z(t) на конец года t вошла его оставшаяся часть, т.е. βX (t − 1) − w0βX (t − 1) − w1βX (t − 1) = ( w2 + ... + wn )βX (t − 1) .
Рассуждая аналогичным образом, нетрудно показать, что от “затрат” (t – n + 1)-го года в объем Z(t) вошла их часть wnβX (t – n + 1). Чтобы описать данную связь экономических показателей с помощью стохастического (регрессионного) уравнения, будем рассматривать показатель Zt как случайный временной ряд, а в само уравнение введем случайную ошибку (белый шум): n −1
Zt = β ∑
n
∑
m = 0 i = m +1
wi X (t − m) + ζ t .
(2.7.2)
В отношении временного ряда Z(t) предполагается, что его статистические свойства, выявленные с помощью Br-модели, аналогичны свойствам временных рядов X(t) и Y(t): Z t = Pk** (t ) + γ t ,
(2.7.3)
где Pk** (t ) – полином степени k, а γ t – белый шум. Поэтому для уравнения (2.7.2), так же как и для уравнения (2.6.3), непосредственная оценка параметров невозможна: в условиях произвольного соотношения между величиной максимального лага n и степени полиномов k возникает одна из рассмотренных ранее ситуаций – либо факторы уравнения становятся мультиколлинеарными, либо у ошибки уравнения появляется остаточный (нескомпенсированный) тренд. Наши дальнейшие действия по активному согласованию определяются уже известной из предыдущего параграфа схемой: переход от исходного уравнения к эквивалентному, а от него – к усеченному, свойства новых факторов которого устраняют как опас116
ность мультиколлинеарности, так и возможность появления остаточного тренда у ошибки уравнения. Преобразования, обеспечивающие согласование свойств временных рядов, уравнения регрессии и метода оценки параметров, начнем со случая n > k. Первое, что мы сделаем, это изменим порядок суммирования по индексам m и i в двойной сумме уравнения (2.7.2): n
i −1
i =1
m=0
Z t = β∑ wi ∑ X (t − m) + ζ t .
(2.7.4)
Пользуясь конечно-разностным представлением для Х (t – m) (−1) pm(m − 1)...( m − p + 1) p Δ X (t ) p!
m
∑
X (t − m) =
p =0
и учитывая, что факториальный многочлен g p (m) = m (m – 1)…(m – – p + 1) при всех р > m будет обращаться в нуль, распространим суммирование по индексу р до n – 1. Тогда n
n −1
i =1
p =0
Z t = β∑ wi ∑
(−1) pΔ p X (t ) i −1 ∑ g p ( m) + ζ t . P! m=0
(2.7.5)
Просуммируем g p (m) по m: i −1
∑ g p ( m) =
g p +1(i ) − g p +1(0) p +1
m =0
=
g p +1(i) p +1
и подставим результат в (2.7.5): n −1
n
Z t = β∑ wi ∑ i =1
p =0
(−1) p g p +1(i ) ( p + 1)!
Δ p X (t ) + ζ t .
(2.7.6)
Введем новый индекс суммирования j = р + 1 и применим известное нам из 2.6 представление факториального многочлена через степенной полином с аргументом i и с коэффициентами – числами Стирлинга первого рода: n
n
i =1
j =1
Z t = β∑ wi ∑
( −1) j −1Δ j −1X (t ) j S ( j, r )i r + ζ t . ∑ j! r =0 117
(2.7.7)
Проведем суммирование по индексу i: n
n
i =1
i =0
∑ wi i r = ∑ wi i r = νr , где ν r – начальный момент закона распределения вероятностей лагов r-го порядка. Учитывая, что S ( j ,0) = 0 для j ≥ 1, получим n
j
j =1
r =1
Z t = β∑ wi ∑
( −1) j −1S ( j , r ) j −1 Δ X (t ) + ζ t . j!
(2.7.8)
Изменяя в этом выражении порядок суммирования и вводя обозначение (−1) j −1S ( j , r ) j −1 Δ X (t ) , j!
n
z r , n (t ) = ∑
j =1
приходим к следующей эквивалентной исходной форме уравнения: n
Z t = β∑ ν r zr ,n (t ) + ζ t .
(2.7.9)
r =1
Наконец, используя в отношении (2.7.9) аналогичные проделанным в 2.6 преобразования, получаем усеченное уравнение k +1
Z t = β∑ ν r zr ,k +1 (t ) + ν′t ,
(2.7.10)
r =1
где
k +1
zr ,k +1 (t ) = ∑
j =1
(−1) j −1S ( j , r ) j −1 Δ X (t ), j! 2
n −1
⎛ n ⎞ ≅ β ∑ ⎜ ∑ wi ⎟ ⋅ σδ2 , (2.7.11) и оценку ⎠ m = k +1 ⎝ i = m +1 показывающую, насколько возрастает в результате усечения дисперсия новой ошибки ν′t по сравнению с дисперсией σζ2 исходной
σμ2
2
ошибки. Новые факторы zr ,k +1 (t ) представляют собой суммы полиномов, убывающих от k-й до 0-й степени, и наблюденных значений случайных стационарных величин с нулевыми средними. Они немультиколлинеерны – их нельзя связать линейным уравнением связи с ошибкой, имеющей нулевое среднее и небольшой средний квадрат. 118
Это позволяет рассматривать совокупность факторов zr ,k +1 (t ) , r = 1,..., k + 1, в качестве базиса линейнонезависимых векторов, по которому статистически надежно (с небольшими дисперсиями оценок параметров) производится разложение вектор-функции Zt . Применяя метод наименьших квадратов для оценки линейных параметров ν′r = βν r , r = 1,..., k + 1, мы предполагаем, что новая ошибка уравнения практически сохранила свойства исходной (белый шум). Из этого следует необходимость проверки условия ма2
n −1
⎛ n ⎞ лости величины ∑ ⎜ ∑ wi ⎟ по сравнению с 1, что, как и раm = k +1 ⎝ i = m +1 ⎠ нее, становится возможным лишь после аппроксимации закона распределения лагов по методу совпадения моментов. Для случая n ≤ k соотношения между величиной максимального лага n и степенью полиномов k факторы аналогичного (по виду, повторяющему усеченное) уравнения сохраняют только что перечисленные свойства, а ошибка в точности совпадает с исходной ошибкой, т.е. является белым шумом (см. также 2.6). Это позволяет отнести оценку параметров априори неизвестного закона распределения лагов к одному общему для случаев n > k и n ≤ k допустимому уравнению k +1
Z t = β∑ν r zr ,k +1 (t ) + ν t .
(2.7.12)
r =1
В отличие от “основного” усеченного уравнения данное уравнение позволяет оценить начальные моменты до (k + 1)-го, а не до k-го порядка, что в условиях реальных (небольших) значений k представляется ценным увеличением количества информации об искомом законе распределения лагов. Чтобы реализовать такую возможность, требуется предварительно оценить параметр β, а уже затем, разделив на него значения ν′r , r = 1, ..., k + 1, определить искомые начальные моменты. Для оценки параметра β можно использовать балансовые уравнения связи показателей Х(t), Y(t) и Z(t): Z(t)= Z(t – 1) + β(t) X(t) – Y(t). (2.7.13) 119
Усредняя найденные из уравнений (2.7.13) величины β(t) по периоду решения t = k + 1,..., N, получим интересующий нас параметр β. Это позволяет сформулировать новую (вторую) теорему о распределенных лагах. Если степени полиномиальных трендов у временных рядов Х(t) и Z(t), t = 1, …, N, одинаковы и равны некоторому k, ошибка “усеченного” уравнения практически совпадает с исходной (белый шум), а параметр β известен (определен вне данного уравнения), то каково бы ни было истинное значение максимального лага п, метод наименьших квадратов позволяет получить несмещенные и эффективные оценки k + 1 начальных моментов априори неизвестного закона распределения лагов ν1, …, νk+1. Следствие теоремы: если п ≤ k, то возможна оценка закона в полном объеме – всех п + 1 вероятностей лагов w0, w1,…, wn. Их вычисление по п (независимым) начальным моментам производится с помощью формулы (2.6.34). Оцененное в соответствии с теоремой уравнение регрессии можно использовать для прогнозирования показателя – функции Zt по отчетным и прогнозным (по соответствующей параболе) значениям показателя – фактора Х(t). При этом не обязательно переходить, как это делалось в предыдущем параграфе, к исходной форме уравнения регрессии (через посредство соответствующей аппроксимации по совпадению теоретических и расчетных моментов или с помощью формулы, связывающей wi и νr), а достаточно использовать регрессию k +1 k +1 (−1) j −1S ( j , r ) j −1 Zt = ∑ ∑ Δ X (t ), t = N + 1,..., N + p, (2.7.14) j! r =1 j = r где ν′r , r = 1, ..., k + 1 – найденные оценки линейных параметров; Х(t) – известные (отчетные) значения фактора до момента времени t = N, а начиная с t = N + 1 – прогнозные (параболические) величины. Ограничивая анализ экономических процессов с распределенными лагами двумя уравнениями регрессии, можно рассматривать объясняемые переменные (функции) Yt и Zt как стохастически независимые. Введение в анализ третьей регрессии – относительно 120
случайной переменной Хt (с объясняющими переменными факторами Y(t) и Z(t) и тем же самым законом распределения лагов) сделало бы объясняемые переменные Yt, Zt и Хt зависимыми, так как они должны были бы удовлетворять соответствующему балансовому уравнению. В условиях двух уравнений (с независимыми случайными переменными Yt и Zt) на процедуры оценки параметров можно смотреть, как на два независимых способа измерения одного и того же закона распределения лагов, Чтобы различать соответствующие этим уравнениям оценки некоторого параметра ν′r , обозначим их через ν′yr и ν′zr . Каждая из оценок рассматривается как случайная величина. Из условия несмещенности оценок лаговых параметров, получаемых с помощью каждого из уравнений, следует, что их математические ожидания M ν′yr и M ν′zr являются одинаковыми величинами, равными искомому (неслучайному) параметру ν′r , M ν′yr = M ν′zr = ν′r .
(2.7.15)
Оценки ν′yr и ν′zr не только несмещенные, но и эффективные. При этом для их дисперсий справедливы формулы: σ 2(ν′yr ) = a rry σu2′ 2 σ 2(ν′zr ) = a rr z σν′ ,
(2.7.16)
rr где a rr y и a z – диагональные элементы обратных матриц соответ-
ствующих систем нормальных уравнений, а σu2 и σν2 – дисперсии ошибок ut и νt . Возникает идея объединить совокупности оценок ν′yr , r = 0, 1,..., k и ν′yr r = 1,..., k + 1, сохранив при этом свойства несмещенности и эффективности у новых оценок параметров. Такое объединение дало бы два имеющих практическую ценность результата: во-первых, позволило бы получить больше несмещенных и эффективных оценок лаговых параметров, чем это возможно только с помощью первого (нет оценки ν′k +1 ) или второго (нет оценки β) 121
уравнения, а во-вторых, вследствие объединения измерений одинаковых параметров привело бы к уменьшению дисперсий их оценок (повышение эффективности оценок по отношению к случаю измерений для каждого из уравнений в отдельности). Для объединения каждой пары оценок ν ′yr и ν ′zr общих параметров ν ′r , r = 1, ..., k, воспользуемся известной в математической статистике схемой оценки одного и того же объекта по независимым неравноточным измерениям.1 Чтобы сохранить свойство несмещенности у новой (взвешенной) оценки (2.7.17) ν′r = g1ν′yr + g 2 ν′zr , необходимо ввести условие g1M ν′yr + g 2M ν′zr = ν′r ,
(2.7.18)
откуда, учитывая выражение (2.7.15), получаем g1 + g2 = 1. (2.7.19) Оценка (2.7.17) будет иметь наименьшую возможную дисперсию (свойство эффективности) 2 (2.7.20) σ 2(ν′r ) = g 1 σ 2(ν′yr ) + (1 − g1 ) 2 σ 2(ν′zr ), если условие экстремума (приравненная нулю производная σ2 (ν′r ) по g1 ) 2 g1σ2 (ν′yr ) − 2(1 − g1 )σ2 (ν′zr ) = 0
(2.7.21)
соответствует минимуму. Нетрудно видеть, что равенство (2.7.21) или, иначе, g1σ 2 (ν′yr ) = g 2 σ2 (ν′zr ) (2.7.22) обращает в минимум дисперсию (2.7.20). Отсюда следует правило: все g1 и g2 должны быть обратно пропорциональны дисперсиям оценок 1 1 . (2.7.23) : 2 g1 : g 2 = 2 σ (ν′yr ) σ (ν′zr ) Предположим, что g1 и g2 – положительные числа, удовлетворяющие формуле (2.7.23). Чтобы еще удовлетворялось и норми1
Смирнов Н.В., Дунин-Барковский И.В. Указ.соч., с. 196. 122
рующее условие (2.7.19), достаточно разделить g1 и g2 на их сумму, g1 g2 и . т.е. взять в качестве весов величины g1 + g 2 g1 + g 2 Тогда из (2.7.17) получаем σ 2(ν′yr ) σ 2(ν′zr ) ν′r = 2 ν′yr + 2 ν′zr , (2.7.24) σ (ν′yr ) + σ 2(ν′zr ) σ (ν′yr ) + σ 2(ν′zr ) а формула (2.7.20) принимает вид σ 2(ν′yr ) ⋅ σ 2(ν′zr ) 2( ν ′ ) = . (2.7.25) σ r σ 2(ν′yr ) + σ 2(ν′zr ) Рассмотренная модель из двух допустимых уравнений регрессии k
k
r =0
j =0
Yt = ∑ ν′r ∑ k +1
k +1
r =1
j =r
Z t = ∑ ν′r ∑
(−1) jS ( j, r ) j Δ X (t ) + ut , j!
(2.7.26)
(−1) j −1S ( j , r ) j −1 Δ X (t ) + ν r , t = k + 1,..., N , j!
позволяет оценить k + 2 лаговых параметров ν′r , r = 0, 1,..., k + 1, из которых k параметров ν′r , r = 1,..., k, являются общими и объединяются в соответствии с условием (2.7.24), а их дисперсии вычисляются по формуле (2.7.25). Параметр β находится, как и ранее, с помощью первого уравнения регрессии, а его дисперсия вычисляется по первой формуле (2.7.16) при r = 0. Оценка параметра ν′k +1 производится с помощью второго из уравнений (2.7.26), а дисперсия определяется по второй формуле (2.7.16) при r = k + 1. Возможности оценки параметров β и ν r , r = 1,..., k + 1, окончательно формулирует следующая (третья) теорема о распределенных лагах. Если выполнены условия двух предыдущих теорем о распределенных лагах, то модель (2.7.26) и описанный способ расчета оценок ее параметров позволяют получить несмещенные и эффективные оценки параметра β и k + 1 начальных моментов априори неизвестного закона распределения лагов ν1 ,…, ν k +1 . Следствие теоремы: 123
если величина максимального лага n не превосходит степени k полиномов Pk (t ), Pk* (t ), Pk** (t ) , то возможна оценка закона распределения лагов – всех n + 1 вероятностей w0, w1, …, wn по значениям первых n начальных моментов ν1 ,…, ν n . Для определения wi используется формула (2.6.34). Что касается дополнительных возможностей активного согласования для второго лагового уравнения и для только что рассмотренной модели из двух уравнений, то в отношении них справедливы высказанные ранее (в отношении первого из уравнений) замечания. Читатель, возможно, скажет, что не так уж много информации о лагах мы получаем с помощью метода согласования, применив его как к каждому из уравнений в отдельности, так и к модели из двух уравнений. Да, действительно немного, но все же больше, чем это позволяют рассмотренные выше методы замены априори неизвестного закона распределения лагов на малопараметрические законыгипотезы (не говоря уже о том, что соответствующие им оценки смещены и поэтому непригодны для практических целей анализа). Самое же главное в этом подходе – это то, что, во-первых, установлен предел возможному числу несмещенных и эффективных оценок лаговых параметров, т.е. предел выявления объективной информации о законе распределения вероятностей лагов, содержащейся в исходных временных рядах показателей X(t), Y(t) и Z(t). (В силу основной теоремы об измерениях этот предел для каждого из уравнений равняется числу членов “точных и надежных” разложений временных рядов показателей-функций по степеням t, т.е. k + 1.) А во-вторых, реализовали эту потенциальную возможность с помощью описанных выше конструктивных процедур активного согласования свойств временных рядов показателей, самих уравнений и метода оценки их параметров (три теоремы о распределенных лагах суть итоги этих процедур согласования). Поэтому вопрос о максимально возможном количестве оценок параметров следует перевести из плоскости “мало – велико” в другую, конструктивную, плоскость: если агрегирование временных рядов, проведенное не с целями анализа (оценивания) закона распределения лагов, а совсем с другими целями (отчет о ходе выполнения плана за годы t = 1,…, N), приводит к безвозвратной потере информации 124
о параметрах и структуре макроэкономических процессов, то нельзя ли это агрегирование проводить согласно целям исследования, чтобы сохранить всю интересующую нас информацию. Вопрос этот не может быть решен в общем виде ввиду его зависимости как от состояния информационной базы дезагрегированных показателей исследуемых (конкретных) процессов, так и от поставленных (также конкретных) целей и способов обработки этой информации с помощью соответствующих методов и моделей. Поэтому возможности подхода к формированию (статистическому агрегированию) временных рядов, согласованному с целями исследования, рассмотрим на примере инвестиционного процесса, посвятив ему специальный (III) раздел работы, Однако прежде обсудим еще один метод оценки структуры, относящийся к широкому классу макроэкономических процессов. 2.8. Сбалансированный прогноз структуры макроэкономических процессов
К числу имеющих большой практический интерес задач оценки параметров и структуры макроэкономических процессов относится сбалансированный прогноз компонент (составных элементов, структуры) для совокупности показателей процессов. Так при исследовании динамики межотраслевых связей показатели валовой продукции отраслей экономики и промышленности разбиваются на такие компоненты, как потоки промежуточной продукции, идущей на дальнейшее производственное потребление, и компоненты (потоки) продукции, идущей на конечное потребление. Изучая половозрастную и образовательную структуру занятых в отраслях, мы также имеем дело с разбиением показателей (отраслевой численности занятых) на соответствующие компоненты. Запись о состоянии каждого из таких процессов в некотором году t представляет собой матрицу (таблицу), суммы элементов которой по строкам и столбцам называются окаймлениями. Так, суммы элементов каждой строки (окаймление справа) для указанных выше матриц показывают объемы валовой продукции и численность занятых в каждой из отраслей, а суммы элементов каждого столбца (окаймление снизу) определяют затраты материальных ресурсов 125
отрасли в текущем производстве, функциональные элементы конечного продукта, а также численность занятых в народном хозяйстве, приходящуюся на каждую половозрастную и образовательную группу соответственно. Как правило, подробная матричная информация о структуре процесса имеется лишь за отдельные годы (например, годы составления отчетных межотраслевых балансов или проведения переписей), в то время как значений самих агрегатов в виде итоговых окаймлений бывают представлены временными рядами за довольно продолжительный период. Кроме того, в динамике окаймлений обычно проявляются более устойчивые тенденции, чем в динамике их составляющих. В этих условиях естественно необходимы различные подходы для оценки на перспективу окаймлений и самих элементов матрицы. Прогноз окаймлений осуществляется либо с использованием методов прогнозирования временных рядов и многофакторных уравнений регрессии, либо путем построения сценариев (вариантов) их роста. В данном параграфе не будем повторять возможные способы расчета динамики рядов окаймлений, а перейдем к обсуждению интересующих нас методов прогнозирования их структурных компонент. Существуют две специфические особенности, которые следует учитывать в методах структурного прогнозирования. Во-первых, должна быть обеспечена сбалансированность структурных компонент с итоговыми показателями. Во-вторых, необходимо ориентироваться на ограниченную отчетную информацию о структуре процесса, имеющуюся лишь за ряд отдельных лет исследуемого (отчетного) периода. Формализованное отображение этих условий может быть представлено в следующем виде. Предполагается, что для некоторых лет t1,..., tk отчетного периода известны матрицы At1 , …, Atk с неотрицательными элементами aijtr , i = 1,..., m; j = 1,
..., n; r = 1,…, k. Наряду с отчетной статистической информацией о динамике окаймлений иногда имеются оценки их поведения на перспективу (либо в полном объеме, либо в виде сумм элементов только по строкам или только по столбцам). Конкретные методы прогнозирования структурных компонент тесно связаны с объемом и составом используемой информационной базы. Отметим два 126
применяемых в практических исследованиях подхода к прогнозированию элементов матрицы. Для первого подхода характерно наиболее полное и последовательное использование двух типов информации – отчетных данных, содержащихся во временных рядах экономических показателей за ряд лет t = 1,..., N и единовременной информации о структуре этих показателей за годы t1,..., tk . В то же время, ограниченность возможностей ранее предложенного в НИЭИ Госплана СССР метода по числу надежно оцениваемых параметров не позволяет рассмотреть вопросы согласования структур компонент в целом1. Возникновение данного подхода связано с задачей прогнозирования структурных компонент ряда, согласованных с его отчетной динамикой, при исследовании межотраслевых связей в условиях ограниченности информации об их развитии. Метод основан на объединении двух взаимодополняющих видов статистической информации – временных рядов выпуска валовой продукции отрасли и информации о коэффициентах прямых затрат за годы составления отчетных межотраслевых балансов. Естественно, что предварительно предполагается преобразование всей информации к сопоставимому виду (в одной и той же методологии и неизменных ценах). Распределение валовой продукции i-й отрасли по отраслям – потребителям ее продукции j ∈ { ji } представляется с помощью следующего уравнения: X i (t ) =
∑
j∈{ j j }
aij (t ) X j (t ) + Fi (t ),
(2.8.1)
где X i (t ), X j (t ), t = 1,…, N – значения объемов валовой продукции; aij (t ) – коэффициенты прямых затрат; t ∈{tk }, k – количество лет, за которые имеются балансы; Fi (t ) – суммарный поток продукции, идущей во второстепенные отрасли-потребители и на конечное потребление.
1
Николаева И.Г. Анализ и прогноз межотраслевых связей. М.: Экономика, 1981. 127
На первом этапе на основе анализа динамики статистических (за годы отчета) коэффициентов прямых затрат для них осуществляется подбор (определение типа) двухпараметрических кривых, линейных в отношении неизвестных параметров. Выбор наиболее подходящего вида функций проводился из нескольких типов кривых, которые на практике достаточно гибко аппроксимируют различного вида убывающие и возрастающие динамики представленных за отдельные годы коэффициентов прямых затрат. В данном случае оказалось достаточно следующих 14 функций: p
α(t + 1) 2 + β, p = ±1, ± 2, … , ± 6, α ln(t + 1) + β, α + β. ln(t + 1) Для аппроксимации показателя Fi (t ) предлагается использовать параболу 2-го порядка F i (t ) = q2 t 2 + q1t + q 0. На втором этапе осуществляется статистическая оценка параметров основных производственных связей отраслей X i (t ) =
∑
j∈{ ji }
⎡⎣α ij f ij (t ) + βij ⎤⎦ X j (t ) + q 2t 2 + q1t + q 0 + εi (t ), (2.8.2)
где f ij (t ) – определенный на первом этапе вид временного члена для отображения динамики соответствующего коэффициента прямых затрат; ε i (t ) – ошибка приближения расчетного ряда выпуска к фактическому. Вычислительная процедура оценки параметров уравнения (2.8.2) реализуется путем минимизации некоторого квадратичного функционала. Этот функционал с помощью заданных весов предусматривает одновременное приближение расчетной траектории X i (t ) к фактическим значениям валовой продукции за период t = 1,..., N, а также – приближение теоретических коэффициентов прямых затрат к содержащимся в статистической отчетности коэффициентам в годы составления межотраслевых балансов. Характеристиками качества решения при этом являются показате128
ли точности приближения теоретических и фактических значений. Отмечая особенности данного метода, следует указать, вопервых, на применимость его к прогнозированию лишь отдельных элементов структуры в виде коэффициентов прямых затрат. Вовторых, в реальных условиях количество используемых для анализа наблюдений позволяет одновременно оценить только 2–3 (основные) производственные связи, т.е. лишь частично восстановить структурную матрицу. Можно сказать, что для метода характерно ограниченное использование пространственной информации о структуре процесса в условиях дополнения ее отображением временной тенденции. В-третьих, этот метод, исследуя взаимосвязи с позиции распределения созданной в отраслях продукции, не обеспечивает сбалансированности элементов межотраслевого баланса по вертикальным составляющим (по затратам). В противоположность этому второй известный подход обеспечивает согласование элементов некоторой структурной матрицы с заданными окаймлениями, абстрагируясь от учета k – 1 матриц Atk из k имеющихся. Предполагается, что имеется некоторая базовая матрица А0 с элементами aij0 , I = 1,…, m; j = 1,…, n. Далее считается известным набор окаймлений, представляющих суммы элементов по строкам ci , i = 1,…, m, и суммы элементов по столбцам d j , j = 1,…, n. Требуется определить, как следует изменить элементы исходной матрицы A0, чтобы обеспечить выход на заданные окаймления. Очевидно, что в такой постановке решение может быть получено неоднозначно. Чтобы сузить число возможных вариантов вводятся дополнительные гипотезы о характере формирования элементов прогнозируемой матрицы А. Наиболее естественно это достигается за счет конкретизации формы воздействия новых окаймлений ci и d j на элементы базовой матрицы aij0 . Так, широко используемый в экономических расчетах метод RAS базируется на допущении, что элементы матрицы А образуются путем преобразования элементов базовой матрицы А0 под воздействием изменения окаймлений, причем действие новых окаймлений ci и d j однородно для всех элементов i-й строки и j-го столбца. 129
В данном методе задача сводится к нахождению для матрицы А0 таких диагональных матриц R, m-го порядка, и S, n-го порядка, что новая матрица А, представленная произведением матриц А = RА0 S, имеет наперед заданные суммы элементов по строкам и столбцам. Диагональные матрицы R и S находятся в результате приближенного решения системы m + n уравнений с m + n о неизвестными: n
∑ ri aij0 s j = ci,
i = 1, ..., m,
j =1
(2.8.3)
m
∑ ri aij0 s j = d j ,
j = 1, … , n.
i =1
Для определения приближенного решения системы (2.8.3) служит итерационная процедура, представленная на k-м шаге формулами: dj ci , si( k ) = m , s 0j = 1. (2.8.4) ri( k ) = n (k ) 0 0 ∑ aij s j (k − 1) ∑ aij ri j =1
i =1
В результате поочередного нормирования строк и столбцов структурной матрицы достигается баланс с выходом на заданные суммы либо по строкам, либо по столбцам. Доказано, что для неотрицательных элементов aij0 такой итерационный процесс является сходящимся. Элементы прогнозной матрицы aij получаются путем умножения элементов матрицы aij0 на поправочные коэффициенты ri s j , где множитель ri является общим для i-й строки, а множи-
тель s j – общим для элементов j-го столбца. Такого рода равномерное распределение изменения окаймлений будет тем адекватнее реальному процессу, чем большая однородность динамики свойственна элементам структурной матрицы (рост или падение всех элементов) и чем меньше наблюдается разброс элементов по абсолютной величине. Улучшить соизмеримость элементов возможно подключением к данному методу процедур агрегирования и дезагрегирования исходной информации. Следует также отметить, что поскольку не все элементы базовой 130
матрицы aij0 должны быть строго положительны (некоторые из них могут принимать нулевые значения), то это позволяет нормативно задавать в прогнозируемой матрице А наиболее “нетипичные” по величине элементы с одновременным вычитанием их из прогнозных окаймлений. Хотя в отличие от первого подхода метод RAS позволяет построить сбалансированный прогноз для всей совокупности структурных компонент, однако ряд важных, на наш взгляд, моментов не может быть отражен с помощью обслуживающих этот метод процедур. Так, желательно введение в форму взаимосвязи элементов в явном виде фактора времени, поскольку интенсивность переходных процессов зависит от периода, за который предполагается осуществить выход на новые окаймления. Целесообразно также отразить в методе возможность наращивания информационной базы, т.е. использование не одной, а нескольких имеющихся структурных матриц за отчетный период. Указанное развитие и совершенствование методов структурного прогнозирования осуществлялось в соавторстве с Л.В. Журавлевой (старший научный сотрудник лаборатории, возглавляемой автором) и было направлено на объединение и одновременное отображение положительных свойств как первого, так и второго рассмотренных подходов. В общем виде это означало построение таких траекторий изменения матричных элементов, которые, с одной стороны, были бы согласованы с имеющейся прогнозной информацией, а с другой – обладали бы достаточной степенью близости к отчетным данным. Отправным моментом исследования послужил способ учета временного фактора в процессе изменения элементов матрицы А0 под воздействием заданных прогнозных окаймлений. А именно, предполагалось, что относительный прирост любого элемента структурной матрицы в году t формируется из двух аддитивных составляющих, одна из которых является общей для всех элементов данного столбца, другая – общей для всех элементов данной строки: a tij = a ij0 (1 + r i f i (t ) + s j g j (t )), i = 1, ..., m; j = 1, ..., n. (2.8.5) Функции f i (t ) и g j (t ), t ≥ t0 ( fi (t0 ) = 0, g j (t0 ) = 0) определяют характер изменения составляющих относительных темпов прирос131
та во времени. Их вид считается известным (определяется на предыдущем этапе исследования), и характер проведения в основном зависит от отчетной динамики их изменения и прогноза окаймлений структурной матрицы. Для макроэкономических процессов обычно это достаточно гладкие функции, в простейшем случае fi (t ) = t , g j (t ) = t. Указанная аддитивная форма коррекции элементов исходной матрицы под воздействием прогноза окаймлений предпочтительна по нескольким причинам. Во-первых, получающаяся в результате линейная форма зависимости расчетных элементов матрицы от параметров ri и s j , i = 1,…, m; j = 1,…, n, упрощает процедуры их оценки. Во-вторых, использование относительных темпов прироста (нормированных на величину aij0 ) позволяет прогнозировать матрицы, элементы которых имеют существенный разброс по абсолютным значениям. В-третьих, с помощью выбора соответствующих функций времени fi (t ) и g j (t ) можно отразить достаточно разнообразные тенденции в динамике окаймлений и самих элементов. Так как каждая из составляющих зависит от одного неизвестного параметра – либо ri , либо s j , то формальное обеспечение условий выхода на заданные прогнозные окаймления приводит к системе из (m + n) линейных уравнений с (m + n) неизвестными: n
n ri fi (t ) + ∑ si g j (t ) = ci − ci0 , i = 1,..., m, j =1
(2.8.6)
m
m s j g j (t ) + ∑ ri f i (t ) = d j − d 0j , j = 1,..., n, i =1
n
m
j =1
i =1
где c i0 = ∑ aij0 , d 0j = ∑ aij0 . Однако эта система не обладает единственным решением, поскольку между входящими в нее уравнениями существует линейная зависимость. Легко показать, что сумма первых m уравнений тождественно совпадает с суммой последующих n уравнений. Конструктивное осмысливание подобной ситуации предполагает по132
строение таких процедур оценки параметров, в которых, с одной стороны, исключена зависимая информация, а с другой – используется дополнительная независимая информация. В процессе разработки численных методов оценки параметров вначале были сформулированы дополнительные условия, затем из общей совокупности уравнений выделено множество линейно-независимых и произведена корректная оценка их параметров. Наиболее естественным требованием к поведению расчетных траекторий является их близость к имеющимся в отдельные годы отчетного периода t1 ,..., tk элементам матриц At1 ,..., Atk . В качестве совокупной меры близости целесообразно принять сумму квадратов отклонений расчетных элементов от фактических по всем отчетным годам. Формализованная запись этого условия порождает некий квадратичный функционал, который следует минимизировать. Согласование расчетных траекторий со значениями прогнозных окаймлений в году T возможно путем подсоединения к исходному функционалу дополнительных ограничений с использованием множителей Лагранжа. Причем достаточно обеспечить совпадение по окаймлениям в году Т для m строк и (n – 1) столбцов. Тогда для n-го столбца прогнозируемой матрицы в силу соотношения m
n
i =1
j =1
∑ ci = ∑ d j автоматически выполняется равенство m
∑ a in0 (1 + r i f i(T ) + sn g n(T )) = d n . i =1
Итак, приходим к следующей постановке задачи на условный экстремум: min
n
m
n
∑ ∑∑
( ri S j ) t∈{t } i =1 j =1 k
2
⎡⎣aij0 (1 + ri f i (t ) + s j g j (t )) − aijt ⎤⎦ +
m ⎡n ⎤ + ∑ μi ⎢∑ aij0 (1 + ri f i (T ) + s j g j (T )) − ci ⎥ + i =1 ⎣⎢ j =1 ⎦⎥ n ⎡m ⎤ + ∑ λ j ⎢∑ aij0 (1 + ri fi (T ) + s j g j (T )) − d j ⎥ . ⎣ i =1 ⎦ j =1
133
(2.8.7)
Дифференцирование функционала (2.8.7) по параметрам ri , i = 1,..., m, s j , j = 1,..., n, μi , i = 1,…, m, λ j , j = 1,…, n – 1, приводит к линейной системе из 2(m + n) – 1 уравнений с 2(m + n) – 1 неизвестными. Решение системы, а также расчетные траектории элементов матрицы находятся с помощью простейших операций обращения и умножения матриц. С этой целью используется математическое обеспечение современных ЭВМ, содержащее пакет стандартных программ по основным численным процедурам линейной алгебры. Характеристикой качества решения служит точность приближения теоретических значений элементов к их фактическим величинам в моменты времени t1 ,..., tk . Адаптация рассмотренной модели к конкретной статистической информации, а также возможность внесения в нее элементов управления осуществляются путем исследования и отбора временных зависимостей для отображения динамики строчных и столбцовых окаймлений. Значения окаймлений могут быть представлены как сплошными временными рядами, так и показателями, известными в отдельные моменты времени t1 ,..., tk . При выборе вида временных функций целесообразно учитывать также информацию прогнозного периода. Предложенный метод может быть использован не только при прогнозировании элементов матрицы на определенный год Т. В качестве прогнозного периода возможно задать некоторый временной интервал [Т1, Т2]. В рамках данного метода существуют два способа прогнозирования матриц на многолетний период. При первом способе следует сформировать значения строчных и столбцовых окаймлений для каждого из годов прогнозного периода и решить столько отдельных задач на условный экстремум, на сколько лет строится прогноз. Естественно, что функции f i (t ) и g j (t ) , t = 1,…, m; j = 1,..., n, должны быть одними и теми же при
повторном решении задачи. Второй способ не требует сплошной информации об окаймлениях. В результате однократной оценки параметров ri и s j из условия (2.8.7) он позволяет “восстановить” поведение элементов 134
матрицы как в промежуточные годы отчетного периода, так и на интервале прогнозирования. При различных значениях времени t вычисляются расчетные значения элементов матрицы a tij = = a ij0 (1 + ri fi (t ) + s j g j (t )) в виде явных функций времени. Следует
отметить, чем адекватнее реальному процессу временные функции fi (t) и gj(t) учитывают динамику окаймлений, тем менее отличаются друг от друга результаты прогноза элементов, полученные по каждому из этих способов. Продолжая обсуждение предложенного метода, остановимся подробнее на вопросе о выборе базовой матрицы А0. В сформулированной выше постановке базовым годом является год t0. В ходе решения определяются такие траектории изменения элементов матрицы, которые в году t0 находятся в базовом состоянии, затем максимально приближаются (в совокупности) к известным состояниям в годах t1 ,..., tk и обеспечивают в году Т выход на заданные окаймления. Очевидно, что при сохранении условий приближения к отчетной информации и условий согласования с прогнозными окаймлениями выбор базового состояния не единственен. Поскольку базовое состояние определяет тот момент времени, для которого расчетная и отчетная структурная информация совпадают, то из экономических соображений предпочтительнее в качестве базовой матрицы выбрать последнюю из имеющихся отчетных матриц как содержащую наиболее современную информацию. В этом случае модификация вычислительных процедур состоит лишь в том, что, подбирая функции f i (t ) и g j (t ) , следует предусмотреть их прохождение через нуль в новом базовом году. Дальнейшее развитие методов сбалансированного прогнозирования структурно-динамической информации проведено с учетом явно выраженной разнонаправленности изменения элементов в пределах каждой строки (столбца) матрицы. Такая ситуация возникает, например, когда общая динамика какого-либо показателя не совпадает по направлению с изменениями всех его компонент. Так увеличение выпуска валового продукта может сопровождаться ростом объема промежуточной продукции и падением конечного потребления (их отдельных элементов), или при общем росте заня135
тых в некоторой отрасли может наблюдаться сокращение численности отдельных образовательных и половозрастных групп. Поскольку для оценки направления изменения элементов в прогнозном периоде достаточно иметь две отчетные матрицы, то предлагаемый ниже метод может быть реализован при весьма ограниченной информации матричного вида (всего лишь на одну матрицу больше, чем у метода RAS). Для учета разнонаправленности поведения элементов (либо в сторону увеличения, либо в сторону уменьшения) по двум их значениям в годы t1 и t2 целесообразно обратиться к простейшим функциям f i (t ) и g j (t ) , а именно – к линейным. Выберем также в качестве базового (последнего) года значение t2 = 0. Если в году t2 = 0 по отношению к году t1 ( t1 < 0) наблюдается
(
)
рост (неубывание) элемента a ij0 a ij0 ≥ a tij1 , то расчетная траектория (регрессия) для этого элемента имеет вид a tij = a ij0 (1 + r it + s jt ) ,
(2.8.8)
где ri и s j – искомые неотрицательные числа ( ri ≥ 0, s j ≥ 0). Слагаемое ri t отражает относительный вклад элемента аtij в изменение окаймления по i-й строке в году по сравнению с базовым годом. Слагаемое s j t имеет аналогичный смысл для окаймления по j-му столбцу. При уменьшении значения элемента в базовом году t1 по отношению к году он аппроксимируется зависимостью (2.8.9) a tij = a ij0 (1 − ri t − s j t ). Компоненты – ri t и – s j t при ri ≥ 0, s j ≥ 0 оказывают относительные (через aij0 ) воздействия на соответствующие окаймления в сторону их уменьшения. Итоговое поведение окаймлений формируется в процессе взаимодействия совокупности тенденций у всех элементов матрицы. Совместная оценка параметров ri , s j , i = 1,..., m; j = 1,…, n осуществляется из условия максимального приближения расчет136
ных значений элементов к отчетным в году t1 , а также с учетом выхода получаемых с их помощью окаймлений в году Т на прогнозные (известные) окаймления ciT и d Tj . Чтобы обеспечить неотрицательность оценок ri и s j , предлагается свести процедуру оценивания к задаче линейного программирования. В качестве меры близости теоретических (расчетных) и фактических значений элементов в году в этом случае принимается сумма модулей невязок, которая определяет минимизируемый функционал: m
n
∑∑ ( ri , s j ) min
i =1 i =1
t
t
r aij1 − aij1 r .
(2.8.10)
Целевая функция содержит (m + n) неизвестных ri и s j . Требуется ее минимизировать при (m + n – 1) линейных ограниченияхравенствах: n
∑ aTij = cTi ,
i = 1,..., m,
j =1 m
∑
j =1
(2.8.11) aTij
= d Tj ,
j = 1,..., n,
и (m + n) линейных ограничениях-неравенствах ri ≥ 0, i = 1,..., m s j ≥ 0, j = 1,..., n.
(2.8.12)
Таким образом левые концы прямолинейных траекторий, проходящих в году t2 = 0 через базовые значения элементов, приближаются возможно близко к значениям элементов отчетной матрицы At1 , а правые в своей совокупности (по i и по j) обеспечивают абсолютное приближение к суммам элементов прогнозной матрицы ciT и d Tj . С помощью перехода к 2(m + n) новым переменным хk содержащая сумму модулей целевая функция (2.8.10) может быть приведена к принятой в задачах линейного программирования стандартной форме 137
F ( x) = c1 x1 + c2 x2 + ... + c2m + 2n x2m + 2 n .
(2.8.13)
Одновременно происходит видоизменение ограничений при сохранении общего количества равенств и удвоений числа неравенств. Поиск оптимального решения такой (стандартной) задачи осуществляется одним из общих методов линейного программирования, входящих в математическое обеспечение ЭВМ. На основе полученного решения задачи определяются параметры ri и s j и по выбранному для каждого элемента матрицы типу зависимости (рост, убывание) строится его прогноз на момент времени Т. Естественно, что суммы элементов прогнозной матрицы по строкам и столбцам согласованы с заданными окаймлениями. Анализ поведения расчетных траекторий также позволяет судить о динамике изменения элементов исследуемой матрицы в промежуточные годы периода [0, Т]. Учет разнонаправленности прироста элементов (структуры, состава показателей) придает данному методу такие качества, которые делают его более адекватным задаче сбалансированного прогноза структуры реальных макроэкономических процессов, чем рассмотренный выше метод RAS. Что касается сопоставления с первым из предложенных методов, то оно не столько затруднительно (очевидна общность первого и специфичность второго), как нецелесообразно, поскольку данные методы призваны не конкурировать, а дополнять друг друга. Характеризуя в заглавии и тексте параграфа представленные методы как прогнозные, мы имели в виду то обстоятельство, что оценка структуры на перспективу – более важная и интересная экономическая проблема, чем восстановление (интерполяция) структуры в каком-либо году (ряде лет) отчетного периода. В то же время, сами методы таковы, что, не требуя никаких принципиальных изменений, они могут быть легко превращены в методы интерполяции структуры. Понятно, что последняя, как и прогноз, возможна только в том случае, если в соответствующие годы имеется информация о макроэкономических показателях в виде окаймлений (искомых) матриц структуры исследуемого экономического процесса.
138
Раздел 3.
СТРУКТУРНО-ДИНАМИЧЕСКАЯ МОДЕЛЬ ИНВЕСТИЦИОННОГО ПРОЦЕССА
В соответствии со вторым подходом к проблеме оценки параметров и структуры экономических процессов мы обращаемся к дезагрегированной информации, анализируем ее свойства и возможности, а затем приступаем к такому ее агрегированию во временные ряды отраслевых (общеэкономических) показателей, которые отвечают поставленным целям структурно-динамического анализа и прогнозирования инвестиционного процесса. 3.1. Краткий анализ свойств исходной информации
Анализ свойств информации, содержащейся в отчетных титульных списках, начнем с выяснения возможностей ее использования для оценки балансовой и лаговой структуры (распределения лагов) процесса. В экономической литературе достаточно определенно говорится не только о такой возможности, но и том, что титульные списки представляют собой наилучшую информацию для этой цели. Чтобы выяснить это, обратимся к титульным спискам за отчетный период (вплоть до величины максимального лага) и дополним их информацией из титульных списков за предыдущие годы для всех строек, которые по отношению к указанному отрезку времени являются переходящими. Из полученных таким образом для каждой стройки временных рядов, раскрывающих ожидаемый (по нормативам) и фактический ход строительства, ограничимся последними, поскольку именно с их помощью определяются лаги. Для оценки распределенных лагов в году t следует вначале определить, какие капитальные вложения образовали ввод фондов года t на каждой стройке, а затем и в целом по совокупности строек. Ввод фондов года t как этап строительства означает завершение на стройке одного или нескольких объектов. Что касается зарегистрированных в соответствующем временном ряду капитальных вложений, поступивших на стройку в данном году и в предшествующие годы, то они относятся ко всей совокупности введенных 139
до года t включительно и строящих в этом году объектов. И разделить этот ряд капитальных вложений в многообъектную стройку на составляющие по отдельным объектам не представляется возможным. Лишь в том случае, если стройка представляет собой сооружение единственного объекта, временной ряд капитальных вложений от начала строительства до года ввода фондов (t) раскрывает лаговую структуру (период формирования и состав) ввода основных фондов. Следовательно, оценка наиболее известных и практически важных лаговых показателей, характеризующих формирование ввода основных фондов, возможна лишь для совокупности однообъектных строек. При обработке представленной в титульных списках информации о процессе капитального строительства будем среди строек отчетного периода различать следующие их типы: 1) начатые строительством в данном году, 2) продолжаемые строительством, 3) завершенные в данном году. Такая классификация предполагает, что реальные сроки строительства однообъектных, а тем более многообъектных строек превышают год. При этом у строек со сроком строительства более 2 лет все указанные фазы разделены во времени, а у строек, продолжающихся 2 года, вторая и третья фаза совмещены. Для однозначности классификации этих последних строек в первом году они объединяются с начатым строительством, а во втором – с завершенным. О принадлежности каждой стройки (ее показателей) к тому или иному типу будем судить по специальному индексу j, принимающему в соответствии с фазами строительства три значения: j = 1, 2, 3. Обозначим всю совокупность строек года t через J (t), а ее части, относящиеся к фазам j = 1, 2, 3, – соответственно через J1 (t ), J 2 (t ) и J 3 (t ) . О принадлежности стройки i в году t к типу j свиде-
тельствует символ i ∈ J j (t ) . Для обозначения множества однообъектных строек будем применять штрих, а многообъектных – два штриха. Например, i ∈ J ′j (t ) свидетельствует о том, что стройка i однообъектная и в году t относится к типу (фазе строительства) j. Аналогичный смысл, только для многообъектной стройки, имеет обозначение i ∈ J ′′j (t ) . 140
3.2. Системы динамических структурно-балансовых уравнений инвестиционного процесса
Вывод структурно-балансовых уравнений начнем со случая однообъектных строек. Рассмотрим произвольный год t отчетного периода и опишем состояние строительства на стройке i, находящейся в этом году в фазе j с помощью следующей совокупности показателей: Sij′ (t ) – сметная стоимость; kij′ (t ) – объем капитальных вложений в году t; K ij′ (t ) – сумма капитальных вложений, освоенных от начала строительства до года t включительно; Rij′ (t ) – объем предстоящих (после года t) капитальных вложений, или остаток сметной стоимости; N ij′ (t ) – объем незавершенного строительства на конец года t; ν′ij (t ) – ввод основных фондов в году t. Если стройка i относится к типу j = 1, то для нее справедливы следующие соотношения показателей: N i′1 (t ) = K i′1 (t ) = ki′1 (t ) ; Ri′1 (t ) = Si′1 (t ) – ki′1 (t ) ; ν′i1 (t ) = 0. В случае j = 2: N i′2 (t ) = K i′2 (t ) ; Ri′2 (t ) = Si′2 (t ) – Ki′2 (t ) ; ν′i 2 (t ) = 0. Для j = 3: N i′3 (t ) = Ri′3 (t ) = 0; ν′i 3 (t ) = K i′3 (t ) = Si′3 (t ) . Отсюда для стройки i, находящейся в году t в произвольной фазе j, справедливы следующие балансовые уравнения: (3.2.1) Sij′ (t ) = ν′ij (t ) + N ij′ (t ) + Rij′ (t ) ; K ij′ (t ) = N ij′ (t ) + ν′ij (t ) ;
(3.2.2)
Rij′ (t ) = Sij′ (t ) − K ij′ (t ) .
(3.2.3)
В приведенных соотношениях ввод основных фондов отождествлен с суммой освоенных капитальных вложений, а последние – со сметной стоимостью. Именно это позволило получить балансовые уравнения (3.2.1) и (3.2.2) для отдельной стройки и будет позволять описывать связи показателей в виде точных (балансовых) уравнений для всей совокупности однообъектных строек. Если же в дальнейшем при обращении с системой структурно-балансовых уравнений для агрегированных показателей мы захотим учесть тот факт, что не все капитальные вложения аккумулируются во вводе фондов (часть их расходуется на содержание администрации, обу141
чение рабочей силы в период строительства и на постройки временного типа), то для этого с высокой степенью точности может быть проведена коррекция показателей с помощью среднеотраслевого коэффициента, равного доле фондообразующих капитальных вложений от общего их объема. Проведем агрегирование показателей, характеризующих ход строительства на отдельных стройках, и проанализируем, каким соотношениям они будут подчиняться. В результате суммирования по i ∈ J ′j (t ) образуем совокупность величин, раскрывающих фазово-временное состояние процесса: S ′j (t ) , k ′j (t ) , K ′j (t ) , N ′j (t ) , R′j (t ) , и ν′j (t ) , где j = 1, 2, 3. Суммируя последние по j, найдем
значения показателей для всей совокупности однообъектных строек года t: S ′(t ) , k ′(t ) , K ′(t ) , N ′(t ) , R′(t ) , и ν′(t ) . В дальнейшем показатели, обозначенные строчными буквами, будем в соответствии с их смыслом называть годовыми, а обозначенные прописными буквами – интегральными. Первая группа балансовых уравнений наиболее проста – она раскрывает фазово-временную структуру агрегированных показателей: S ′(t ) = S1′ (t ) + S 2′ (t ) + S3′ (t ); (3.2.4) k ′(t ) = k1′ (t ) + k 2′ (t ) + k3′ (t ) ; (3.2.5) K ′(t ) = K1′ (t ) + K 2′ (t ) + K 3′ (t ); N ′(t ) = N1′ (t ) + N 2′ (t );
(3.2.6)
R′(t ) = R1′ (t ) + R2′ (t ); ν′(t ) = ν′3 (t ) .
(3.2.8)
(3.2.7) (3.2.9)
При этом отдельные показатели совпадают по величине: N1′ (t ) = k1′ (t ) = K1′; N 2′ (t ) = K 2′ (t ); ν′3 (t ) = K3′ (t ) = S3′ (t ),
о чем необходимо помнить при анализе уравнений. Так, уравнение (3.2.4) показывает, что интегральная сметная стоимость совокупности однообъектных строек года t состоит из трех частных интегральных сметных стоимостей: начатых в этом году строек, продолжаемых и завершенных. Будучи определенными для конкретных титульных списков, они количественно отразят 142
состав показателя S ′(t ) в каждом году отчетного периода. Располагая динамикой соответствующих показателей, можно наблюдать и происходящие в них сдвиги, в частности в абсолютном и относительном значении S3′ (t ) , равном вводу основных фондов. Аналогичными возможностями проникновения в структуру процесса обладают и другие уравнения данной группы. Наряду с анализом каждого уравнения интересно рассмотреть динамику векторов {S ′(t ) , k ′(t ) , K ′(t ) , N ′(t ) , R′(t ) , ν′(t )} и {S ′j (t ) , k ′j (t ) , K ′j (t ) , N ′j (t ) , R′j (t ) , и ν′j (t )} , j = 1, 2, 3, дающих комплексную характеристику
хода капитального строительства в целом (на всех однообъектных стройках) и его отдельных фаз. Вторая группа структурно-балансовых уравнений получается при агрегировании по соответствующим i выражений (3.2.1)– (3.2.3): S ′(t ) = N ′(t ) + v′(t ) + R′(t ) ; (3.2.10) K ′(t ) = N ′(t ) + v′(t ) ; (3.2.11) R′(t ) = S ′(t ) − K ′(t ) ; (3.2.12) (3.2.13) S ′j (t ) = N ′j (t ) + ν j (t ) + R j (t ), j = 1, 2, 3 ; K ′j (t ) = N ′j (t ) + ν′j (t ), j = 1, 2, 3 ;
(3.2.14)
R j (t ) = S ′j (t ) − K ′j (t ), j = 1, 2, 3 .
(3.2.15)
При конкретизации фазовых индексов уравнений (3.2.13)– (3.2.15) следует учесть, что показатели ν1′ (t ), ν′2 (t ), N 3′ (t ), и R3′ (t ) имеют нулевые значения. Уравнения данной группы раскрывают взаимосвязи показателей приведенных выше комплексных характеристик. Так, уравнения (3.2.10) и (3.2.13) отражают в динамике функциональный состав соответствующих интегральных сметных стоимостей, а именно: какая часть необходимых для их реализации капитальных вложений овеществлена в незавершенном строительстве, во вводе фондов и должна быть овеществлена в последующий (после года t) период. С помощью уравнений (3.2.11) и (3.2.14) можно проследить за изменением объема освоенных на стройках капитальный вложений, а на основе уравнений (3.2.12) и (3.2.15) – узнать, какой объем 143
капитальных вложений потребуется для завершения строительства. Остановимся на уравнении (3.2.10). Оно позволяет охарактеризовать весьма существенные стороны процесса капитального строительства. Рассмотрим, например, ситуацию, когда показатель N ′(t ) имеет тенденцию к росту, причем столь быстрому, что моN ′(t ) жет возрастать его доля в S ′(t ), и увеличиваться отношение . k ′(t ) Свидетельствует ли это, как принято обычно считать, об ухудшении дел в капитальном строительстве? Ответ совсем не однозначен и зависит от того, какие тенденции и соотношения характерны для других показателей процесса. Если при указанном характере роста N ′(t ) в объеме S ′(t ), уменьшается доля R′(t ), и одновременно увеличивается (не обязательно доля) ν′(t ), то очевидно, что мы имеем дело с положительными явлениями в процессе (позитивный рост незавершенного строительства). Если же рост N ′(t ) сопровождался убыванием ν′(t ), и увеличением R′(t ), то налицо отрицательные явления (негативный рост незавершенного строительства). При другом характере изменения показателей ν′(t ), и R′(t ), могут возникнуть состояния процесса, о которых заранее невозможно сказать, что они будут заведомо положительными или отрицательными. Уменьшение N ′(t ) , как абсолютное, так и по доле в S ′(t ), , также не обязательно говорит об улучшении дел в капитальном строительстве, ведь оно может сопровождаться падением ν′(t ), и резким возрастанием R′(t ). Все это доказывает, что о состоянии процесса и его тенденциях нельзя судить по отдельным показателям, а следует рассматривать их в совокупности и взаимодействии. Для иллюстрации возможностей такого (опирающегося на систему показателей) анализа продолжим начатое исследование и выясним, какой объем незавершенного строительства характерен для “желательного” развития процесса. Естественно, что это предполагает конкретизацию последнего. Осуществим ее, задавшись следующими требованиями: 1) строительство должно вестись по нормативным графикам со сроком освоения сметной стоимости 3 года; 144
2) при этом должна быть обеспечена необходимая для развития экономики динамика выходного показателя процесса – ввода основных фондов. Пусть эта последняя определена объемом ν′(t ), в году t и темпами роста в последующем периоде. Обратимся к уравнению (3.2.9) и воспользуемся равенством ′ ν 3 (t ) = S3′ (t ). Поскольку необходимый объем ввода основных фондов ν′3 (t ) в году t известен, будет известна и величина третьего слагаемого уравнения (3.2.4) – S3′ (t ) . Чтобы определить второе слагаемое, воспользуемся тем обстоятельством, что в условиях трехгодичного срока строительства интегральная сметная стоимость строек второго года строительства S 2′ (t ) определяет величину ввода фондов года t + 1: именно к этому периоду будут завершены стройки второго (по отношению к году t) года строительства (и только они). Так как необходимая величина ν′(t + 1) известна, то известно и какой должна быть в году t величина S 2′ (t ) . Подобным же образом определяется значение первого слагаемого – интегральной сметной стоимости строек первого года строительства. В году t + 2 эти стройки (и только они) будут завершены и введены в состав действующих основных фондов. Необходимая величина ввода фондов года t + 2 может быть обеспечена только в том случае, если S1′ (t ) будет равно ν′(t + 2) . В результате определены все три слагаемые правой части уравнения (3.2.4), а тем самым и его левая часть S ′(t ) . Показатель S ′(t ) относится к числу важнейших характеристик процесса и, как мы только что видели, должен иметь в каждом конкретном варианте развития экономики свое, строго определенное значение. Продолжим поиск “желательного” объема N ′(t ) и постараемся найти значения интегральных капитальных вложений на вновь начатых и продолжаемых стройках K1′ (t ) и K 2′ (t ) . Для этого воспользуемся нормативными графиками и определяемыми ими долями освоения сметных стоимостей в каждом году строительства (в действительности требуется лишь усредненный по совокупности строек график). Умножая первую долю на S1′ (t ) , а сумму первой и 145
второй долей – на S 2′ (t ) , найдем значения K1′ (t ) и K 2′ (t ) . Из равенств N1′ (t ) = K1′ (t ) , N 2′ (t ) = K 2′ (t ) и уравнения (3.2.7) следует, что мы отыскали искомый объем незавершенного строительства N ′(t ) . Можно пойти дальше и определить необходимые для поддержания требуемых уровней рассмотренных выше показателей объемы капитальных вложений. Равенство k ′(t ) = K1′ (t ) дает первое слагаемое уравнения (3.2.5), а умножение нормативных долей освоения сметных стоимостей для второго и третьего годов на S 2′ (t ) и S3′ (t ) , соответственно второе и третье слагаемые. Итак, от выходного показателя процесса мы пришли к его входному показателю. Однако этим не исчерпывают возможности построенных уравнений из выражения (3.2.12). По известным величинам в его правой части можно найти величину остатка сметной стоимости R′(t ) , а из формулы (3.2.15) – его компоненты R1′ (t ) и R2′ (t ) (компонента R3′ (t ) равна 0). Принятый в расчетах трехгодичный средний нормативный срок строительства позволил установить однозначную связь между показателями и полностью раскрыть их содержание по всем фазам строительства. Если бы мы имели дело с двухгодичным сроком, то картина не была бы столь полной, так как вторая фаза (продолжение строительства) отсутствовала бы. При среднем нормативном сроке 4 года и более возникает следующая особенность: расчетные показатели, соответствующие второй фазе, будут определяться через суммы выходных показателей. Так, при сроке строительства 4 года показатель S 2′ (t ) (сметная стоимость строек, начатых в годы t – 1 и t – 2) должен быть равен сумме вводов основных фондов ν′(t + 1) + ν′(t + 2) ‚ так как именно в эти годы и завершаются стройки, входящие в S 2′ (t ) . Соответственно, показатель K 2′ (t ) , определяемый умножением суммы долей освоения сметной стоимости второго и третьего годов строительства (получаемых из усредненного нормативного графика) на величину S 2′ (t ) , также будет выра146
жаться через указанную сумму ввода фондов. И так далее по цепочке расчетов. Начав с вопроса о “желательном” объеме незавершенного строительства, мы по существу рассмотрели схему расчета (прогнозирования) показателей процесса, обеспечивающих необходимые для развития экономики вводы основных фондов. При этом были учтены лишь те связи показателей, которые отражены в уравнениях (3.2.4)–(3.2.15). Одним из конструктивных элементов данной схемы было предложение вместо индивидуальных (по каждой стройке) нормативных графиков строительства воспользоваться их обобщенным образом – усредненным по совокупности однообъектных строек нормативным графиком. Одновременно использовалась и другая характеристика капитального строительства в прогнозном периоде – средний нормативный срок строительства, являющийся составным элементом усредненного нормативного графика. Соотношение между показателями, оказавшимися столь продуктивными в прогнозных расчетах, то же самое, что и между усредненными распределенными лагами и максимальным (также усредненным по совокупности строящихся объектов) лагом, характеризующими фактическое развитие процесса. Последние, как известно – наиболее эффективные и адекватные природе капитального строительства средства установления связи между его входными и выходными показателями. Все это позволяет рекомендовать усредненный нормативный график строительства объектов для систематического использования в качества одного из эффективных экономико-математических инструментов прогнозирования и управления процессом капитального строительства. Вернемся к вопросам анализа и попытаемся вывести третью группу структурно-балансовых уравнений – с распределенными лагами. С этой целью рассмотрим совокупность однообъектных строек, завершенных в году t отчетного периода. Информация, полученная из титульных списков, позволяет восстановить для каждой стройки i ∈ I 3′ (t ) картину освоения ее сметной стоимости Si′3 (t ) от начала строительства в году ti 0 до завершения: Si′3 (t ) = ki′(ti 0 ) + ... + ki′(t ). 147
(3.2.16)
Определим величину t0 = min ti 0 – самый ранний год начала i∈I3′ (t )
строительства у данной совокупности строек, и разность n(t) = t – t0 – максимальный срок строительства. Образуем три следующих временных ряда: капитальные вложения, освоенные на совокупности строек I 3 (t ) в годы t0 ,..., t , k * (t0 ) =
∑
i∈I 3′ (t )
ki′(t0 ),…, k * (t ) = ∑ k ′i (t ) ; i∈I ′3(t )
(3.2.17)
капитальные вложения, освоенные на совокупностях однообъектных строек I ′(τ) в годы τ = t0 ,..., t , k ′(t0 ) =
∑
i∈I ′(t )
ki′(t0 ),…, k ′(t ) =
∑
i∈I ′(t )
ki′(t ) ;
(3.2.18)
отношение членов 1-го и 2-го рядов w 0 (t ) =
k *(t0 ) k *(t ) k *(t − 1) , w1(t ) = , …, w n(t ) = . k ′(t ) k ′(t − 1) k ′(t0 )
Просуммируем величины Si′3 (t ) :
∑
i∈I3′ (t )
(3.2.19)
Si′3 (t ) = S3′ (t ) и учтем, что
S3′ (t ) = ν′3 (t ) = ν′(t ).
В результате получена возможность связать показатели ν′(t ) и k ′(t − m), m = 0,1, …, n(t ) , с помощью уравнения ν′(t ) =
n (t )
∑ wm (t )k ′(t − m),
(3.2.20)
m =0
раскрывающего структуру и период формирования ввода основных фондов года t. Совокупность величин w0 (t ),…, wn (t ) – долей капитальных вложений данного года и предшествующих лет, которыми они были овеществлены во вводе фондов данного года, характеризует распределенные лаги года t. Если усреднить эту совокупность по t (за отчетный период), то связь показателей приобретает уже известную нам форму – лагового уравнения регрессии с независящими от t параметрами n и wm : 148
ν′t =
n
∑ wm k ′(t − m) + εt .
(3.2.21)
m =0
При формировании системы структурно-балансовых уравнения для совокупности однообъектных строек будем опираться на неусредненное уравнение (3.2.20), характеризующее точно (в виде баланса) состояние процесса в году t отчетного периода. Построим второе и третье уравнения, для чего обратимся к показателям незавершенного строительства N ij′ (t ) на стройках i, относящихся в году t к множествам I1′ (t ) и I 2′ (t ) , т.е. к N i′1 (t ) и N i′2 (t ) . Состав первого из них наиболее простой – это капитальные вложения, овеществленные в том же году: N i′1 (t ) = ki′1 (t ) . (3.2.22) Суммируя по соответствующим i показатели равенства (3.2.22), получим уравнение N1′ (t ) =
∑
i∈I1′ (t )
ki′1 (t ) = k1′ (t ) .
(3.2.23)
k1′ (t ) – долю капитальных вложений года k ′(t ) t, идущую на вновь начинаемые стройки, и представим уравнение (3.2.23) в следующем виде: N1′ (t ) = μ 0(t )k ′(t ) . (3.2.24) Такова тривиальная лаговая структура этого показателя. Вывод третьего уравнения начнем с того, что раскроем ход овеществления капитальных вложений на стройках i ∈ I 2 (t ) :
Введем параметр μ 0(t ) =
N i′2 (t ) = ki′(ti 0 ) + ... + ki′(t ) ,
(3.2.25)
где ti 0 – год начала стройки i. Введем величины t0 = min ti′0 – наиболее ранний год начала i∈I 2′ (t )
строительства и p(t ) = t − t0 – его максимальный период. Сформируем следующие агрегированные ряды: капитальные вложения, освоенные на совокупности строек в годы t0 , … , t , 149
k (t0 ) =
∑
i∈I 2′ (t )
ki′(t0 ),..., k (t ) =
∑
i∈I 2′ (t )
ki′(t ) ,
(3.2.26)
капитальные вложения, освоенные на совокупностях однообъектных строек I ′(τ) в годы τ = t0 , … , t (этот ряд за годы t0 ,..., t был построен ранее), k ′(t0 ), … , k ′(t ) ; (3.2.27) отношения членов 1-го и 2-го рядов k (t0 ) k (t ) k (−1t ) . (3.2.28) γ 0 (t ) = , γ1 (t ) = ,..., γ 0 (t ) = k ′(t ) k ′(t − 1) k ′(t0 ) Они позволяют записать уравнение связи агрегированных показателей N 2′ (t ) и k (t − q ), q = 0, 1, ..., p (t ) , в уже знакомой нам форме N 2′ (t ) =
p (t )
∑ γ q (t )k ′(t − q) .
(3.2.29)
q =0
Коэффициенты γ 0(t ), … , γ p (t ) показывают, какие доли капитальных вложений данного года и предшествующих лет пошли на образование незавершенного строительства у совокупности продолжаемых строительством в году t объектов. Это и есть лаговая структура (распределенные лаги) показателя N 2′ (t ) . Как следует из определения нулевых коэффициентов рассмотренных выше лаговых структур w0 (t ), μ 0(t ) и γ 0(t ) , они удовлетворяют условию w0 (t ) + μ 0(t ) + γ 0(t ) = 1. (3.2.30) При усреднении лаговой структуры γ 0(t ) + μ 0(t ), γ1(t ), γ 2(t ), …, γ p (t ) по t (за отчетный период) связь незавершенного строительства у совокупности вновь начинаемых и продолжаемых строек с образующими его объем капитальными вложениями можно описать регрессионным уравнением с независимыми от времени параметрами n −1
N t′ = ∑ γ ′q ⋅ k ′(t − q ) + δt .
(3.2.31)
q =0
Заметим также, что его коэффициенты γ q будут соответствующим образом связаны с коэффициентами w m уравнения (3.2.21). 150
Представленная выше третья группа структурно-балансовых уравнений – (3.2.20), (3.2.24) и (3.2.29) – открывает принципиально новые возможности для анализа процесса капитального строительства. Если уравнения (3.2.4) – (3.2.15) раскрывают структуру и механизм связи его показателей в году (анатомия разреза процесса на момент времени t), то уравнения с распределенными лагами раскрывает временную картину формирования кумулятивных показателей этого года (анатомия происхождения их состояния в году t). Так, с помощью уравнений (3.2.24) и (3.2.29) раскрывается состав слагаемых в правой части уравнения (3.2.7), а следовательно, и их суммы – незавершенного строительства N ′(t ) в целом для совокупности однообъектных строек. Теперь можно наблюдать не только изменение объемов N ′(t ) по годам отчетного периода, но и сдвиги в структуре и периодах освоения образующих эти объемы капитальных вложений. С помощью всех трех лаговых уравнений и с учетом равенств N1′ (t ) = K1′ (t ), N 2′ (t ) = K 2′ (t ), ν′(t ) = ν′3 (t ) = K 3′ (t )
вскрывается лаговая структура освоенных к году t (включительно) капитальных вложений на исследуемой совокупности строек – показатель K ′(t ) в уравнении (3.2.6). Привлечение лаговых уравнений к исследованию уравнения (3.2.4) позволяет увидеть картину “созревания” интегральной сметной стоимости и ее отдельных элементов. Проанализируем более подробно последний из них. Из равенства S3′ (t ) = ν′(t ) и уравнения (3.2.20) следует, что в последнем году строительства объектов осваивается w0 (t )k ′(t ) капитальных вложений, а в предыдущие годы [от t – n (t) до t – 1] – остальная их часть, равная S3′ (t ) − w0 (t )k ′(t ) . Представляется интересным оценить, какая же часть сметы осваивается в последнем ⎛ w (t )k ′(t ) ⎞ году ⎜ 0 ⎟ . Учитывая неравенство k ′(t ) > ν′(t ) , получаем ⎝ S3′ (t ) ⎠ w0 (t )k ′(t ) w0 (t )ν′(t ) = w0 (t ) . > S3′ (t ) S3′ (t ) 151
Как показывают расчеты на уровне экономики в целом, доля капитальных вложений w0 · 100 %, идущая на пусковые объекты, близка к 50 %. Таким образом, в последнем году строительства осваивается более 50 % сметной стоимости S3′ (t ) (и менее 50 % за все предшествующие годы), что свидетельствует о низкой средней степени готовности пусковых объектов. Четвертая группа уравнений устанавливает связи интегральных показателей в году t с их предшествующими (в году t – 1) значениями. Так, интегральная сметная стоимость уменьшается в году t – 1 на величину S3′ (t – 1) и увеличивается в году t на S1′ (t). Отсюда получаем первое уравнение: S ′(t ) = S ′(t − 1) + S1′ (t ) − S3′ (t − 1) .
(3.2.32)
Второе – для интегральных капитальных вложений – выводится аналогичным образом: K ′(t − 1) уменьшается в году t – 1 на величину K 3′ (t − 1) (или, иначе, на S3′ (t − 1)) и увеличивается в году t на k ′(t ) : K ′(t ) = K ′(t − 1) + k ′(t ) − S3′ (t − 1). (3.2.33) Из уравнений (3.2.33) и (3.2.11) следует справедливость третьего уравнения N ′(t ) = N ′(t − 1) + k ′(t ) − ν′(t ). (3.2.34) Это общеизвестное балансовое уравнение для незавершенного строительства (в данном случае оно получено как следствие других балансовых уравнений). Уравнения этой группы, устанавливая характер взаимодействия показателей капитального строительства в двух временных разрезах (t и t – 1), существенно расширяют возможности проникновения в механизм и структуру процесса. При объединении уравнений всех четырех групп в систему ограничимся независимыми уравнениями, учитывая при этом, что если для исследования процесса понадобится какое-либо уравнение-следствие, то оно легко может быть получено из уравнений системы: 152
I группа 1. S ′(t ) = S 1(t ) + S 2′ (t ) + S3′ (t ), 2. K ′(t ) = K1 (t ) + K 2′ (t ) + K 3′ (t ), 3. k ′(t ) = k1′ (t ) + k2′ (t ) + k3′ (t ), 4. ν′(t ) = ν′3 (t ); II группа 1 − 3 S ′j (t ) = N ′j (t ) + ν′j (t ) + R′j (t ), 4 − 6 K ′j (t ) = N ′j (t ) + ν′j (t ), j = 1, 2, 3;
(3.2.35)
III группа 1. ν′(t ) =
n (t )
∑ wm (t )k ′(t − m),
m =0
2. N1′ (t ) = μ 0(t )k ′(t ), 3. N 2′ (t ) =
p (t )
∑ γ q (t )k ′(t − q);
q =0
IV группа 1. S ′(t ) = S ′(t − 1) + S1′ (t ) − S3′ (t − 1), 2. K ′(t ) = K ′(t − 1) + k ′(t ) − S3′ (t − 1).
Для исследования процесса применительно к многообъектным стройкам необходимо ввести следующие дополнительные показатели: Vij′′(t ) – объем вводов основных фондов, осуществленных на стройке от ее начала до года t включительно; U ij′′(t ) – объем предстоящих (после года t) вводов основных фондов. Вывод уравнений для множества I ′′(t ) отличается от случая I ′(t ) тремя следующими моментами: с введением новых переменных появляются соответствующие им уравнения, аналогичные по форме уже известным уравнениям системы (3.2.35); исчезают уравнения с распределенными лагами для ввода основных фондов и незавершенного строительства и, наконец, появляются новые, менее известные лаговые уравнения, раскрывающие состав и период формирования интегральных показателей ввода основных фондов и капитальных вложений. 153
При описании системы используем знак ′′, идентифицирующий принадлежность входящих в нее показателей к совокупности I ′′(t ) : I группа 1. S ′′(t ) = S1′′(t ) + S2′′(t ) + S3′′(t ), 2. K ′′(t ) = K1′′(t ) + K 2′′(t ) + K 3′′(t ), 3. V ′′(t ) = V1′′(t ) + V2′′ (t ) + V3′′ (t ), 4. k ′′(t ) = k1′′(t ) + k2′′ (t ) + k3′′(t ), 5. ν′′(t ) = ν1′′(t ) + ν′′2 + ν′′3 (t ); II группа 1 − 3. S ′′j (t ) = N ′′j (t ) + V j′′(t ) + R′′j (t ), 4 − 6. K ′′j (t ) = N ′′j (t ) + V j′′(t ), 7 − 9. U ′′j (t ) = N ′′j (t ) + R′′j (t ), j = 1, 2, 3 III группа 1. K1′′(t ) = μ 0(t )k ′′(t ), 2. K 2′′ (t ) = 3. K 3′′(t ) =
p (t )
∑ γ m (t )k ′′(t − m),
(3.2.36)
m=0 q (t )
∑ δm (t )k ′′(t − m),
m=0 r (t )
4. V2′′(t ) = ∑ γ m (t )ν′′(t − m), q =0
5. V3′′(t ) =
s (t )
∑ δm (t )ν′′(t − m);
m =0
IV группа 1. S ′′(t ) = S ′′(t − 1) + S1′′(t ) − S3′′(t − 1), 2. K ′′(t ) = K ′′(t − 1) + k ′′(t ) − S3′′(t − 1), 2. V ′′(t ) = V ′′(t − 1) + ν′′(t ) − S3′′(t − 1). При обращении с данной системой уравнений следует учитывать ряд равенств, справедливых для частных значений ее показателей: 154
K 3′′(t ) = V3′′(t ) = S ′′3(t ), V1′′(t ) = ν1′′(t ) = N 3′′(t ) = R3′′(t ) = R′′(t ) = U 3′′(t ) = 0, μ 0 + γ 0 + δ 0 = 1 и μ 0 + γ 0 + δ0 = 1. Как и в предыдущем случае, в систему (3.2.36) введены одни независимые уравнения. Естественно, при анализе процесса могут рассматриваться и их следствия, хотя собственной новой информации они не несут. Например, интересны по содержанию следствия уравнений II группы – их суммы по j, в частности уравнение S ′′(t ) = N ′′(t ) + V ′′(t ) + R′′(t ) , раскрывающее состав интегральной сметной стоимости всей совокупности многообъектных строек года t. Заведомо интересно и следствие уравнений IV группы: N ′′(t ) = N ′′(t − 1) + k ′′(t ) − v′′(t ) – общеизвестное балансовое уравнение для незавершенного строительства. Но все, что из них можно извлечь, содержится в уравнениях, из которых они получены. Совокупность уравнений системы (3.2.36) позволяет глубоко, многосторонне исследовать ход капитального строительства по данному множеcтву строек. Чтобы убедиться в этом, достаточно внимательно проанализировать каждое из них, и тогда станут ясны их возможности, как это было ранее, при разборе уравнений системы (3.2.35).
155
Раздел 4. ОПЕРАТОРЫ СДВИГА И КОМПРОМИСС “ТОЧНОСТЬ – НАДЕЖНОСТЬ” В АНАЛИЗЕ ВРЕМЕННЫХ РЯДОВ С АПРИОРИ НЕИЗВЕСТНОЙ СТРУКТУРОЙ
В этом разделе применим процедуру компромисса “точность – надежность” и преобразования, основанные на операторах конечных разностей и сдвигов по времени (линейных фильтрах), к анализу временных рядов более широкого класса. При ограниченной длине “современных” экономических рядов, являющихся предметом данного исследования, требования к статистической надежности оценок коэффициентов вынуждают ограничиться невысокими степенями полиномов. Соответствующие полиномы являются, как известно, достаточно гладкими функциями времени и поэтому непригодны для приближения временных рядов с явно выраженным колебательным характером. Для описания последних более адекватны суммы простых гармонических колебаний, называемые также тригонометрическим полиномами. Тригонометрические полиномы были использованы А. Шустером для обоснования метода оценки значимых частот у рядов с явно выраженным колебательным характером, а Р. Фишер предложил способ проверки статистической надежности оценок этих частот. Приблизительно до начала пятидесятых годов этот метод, известный в литературе под названием “периодограмм-анализ”, оставался основным эконометрическим инструментом исследования сильно колеблющихся рядов, пока на смену ему не пришли методы анализа стационарных процессов (прежде всего спектральный анализ). Априорное незнание структуры исследуемого временного ряда и неопределенность в отношении способов описания его компонент (вида функций, числа их параметров) делают проблему слишком сложной, чтобы какой-либо отдельный метод мог претендовать на общее решение быть пригодным для всего множества экономических рядов и обеспечивать проверку статистической надежности всех оцениваемых компонент. Предлагаемый ниже метод относится к таким экономическим рядам, в спектре которых могут быть выделены две-три важные узкие полосы частот, и поэтому также является частным методом, к 156
его достоинствам следует отнести то, что оценка указанных выше компонент (двух – трех, помимо случайных колебаний типа белого шума) производится одновременно, и в силу этого для них возможна проверка их статистической надежности. 4.1. Краткий анализ основных методов исследования временных рядов
Исследование свойств любого временного ряда предполагает проникновение в специфику его структуры и динамики. Наиболее известной и часто используемой является классификация структуры и динамики, исходящая из следующих четырех компонент временного ряда: векового уровня, напоминающего по характеру поведения апериодические гладкие функции или колебания с периодами, близкими по величине к интервалу наблюдения; сезонных колебаний с двенадцатимесячным периодом; колебаний с большим периодом, чем сезонные, но с меньшим, чем у соответствующих колебаний векового уровня; случайных колебаний – широких по диапазону периодов, но небольших по интенсивности.1 Вековой уровень отражает общую тенденцию развития экономического процесса за длительный промежуток времени и представляется в виде некоторого плавного и непрерывного компонента, сглаживающего месячные и годовые “зубцы”, характерные для любого абсолютного или относительного показателя. Что касается сезонных колебаний, то они обнаруживаются во многих экономических рядах с квартальными и месячными данными, и хотя их амплитуда может изменяться с течением времени, период будет оставаться равным 12 месяцам. Возникновение колебаний с периодами больше года, но меньше интервала наблюдения необязательно вызывается сменой подъемов и падений абсолютных объемов производства. Они могут отражать некоторую цикличность в темпах роста экономического показателя и при общем увеличении абсолютных объемов производства за весь рассматриваемый период. 1
См., например, Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике. М.: Статистика, 1972, с. 62–64. 157
Поведение случайной компоненты временного ряда принято объяснять наличием множества некрупных событий, как правило, не связанных между собой. Итак, в соответствии с приведенной классификацией структуры экономических временных рядов в случае месячных или квартальных данных следует различать четыре компоненты: X (t ) = X 1 (t ) + X 2 (t ) + X 3 (t ) + δ(t ), t = 1,..., N ,
(4.1.1)
а в случае годовых данных – три: X (t ) = X 1 (t ) + X 3 (t ) + δ(t ), t = 1,..., N .
(4.1.2)
Различные методы исследования структуры и динамики экономических временных рядов отличаются друг от друга как предположениями о природе и виде указанных компонент, т. е. моделями процесса, так и методами оценки количественных характеристик компонент – коэффициентов функции времени (если компонента описывается с помощью некоторой формулы) или значений компоненты в интересующие нас моменты времени (если она представляется таблично). Как мы помним, метод исследования временных рядов с полиномиальными трендами не сводится к простому применению метода наименьших квадратов и включает, в частности, проверку статистической надежности у подходящих по точности приближения полиномов. Только статистически надежное решение может быть использовано для практических целей анализа и прогноза временного ряда. Поэтому при анализе известных методов мы будем обращать внимание на обе процедуры: собственно выделение, или, иначе говоря, оценку соответствующих компонент временного ряда, и на проверку их статистической надежности. Первым рассмотрим метод скользящих средних. Анализ начнем со случая простых скользящих средних1. При использовании этого метода вычисляется значение средней для какого-либо определенного числа наблюдений (лет, месяцев), и это значение относят к средней точке выбранного промежутка времени. Например, трехлетняя скользящая средняя для 2000 г. есть 1
См., например, Миллс Ф. Статистические методы. М.: Госстатиздат, 1958, сс. 314–330 и 353–384. 158
средняя из данных за 1999, 2000 и 2001 гг. Так же вычисляются и другие скользящие средние за промежутки времени, содержащие N наблюдений. В дальнейшем мы подробно рассмотрим именно этот случай. В результате применения скользящей средней получается более плавная кривая, чем исходный ряд экономических данных. Поэтому операция использования скользящей средней называется также сглаживанием временных рядов. Степень сглаженности возрастает с увеличением промежутка скольжения. Выбор этого единственного управляющего параметра простой скользящей средней m 1 X (t − i ), t = m + 1,..., N − m , ∑ 2m + 1 i =− m
(4.1.3)
зависит как от того, выделяется ли в данном случае вековой уровень, сезонная компонента или колебания со средними величинами периодов, так и от характера динамики каждой из указанных компонент. При выделении векового уровня используются, как правило, ряды с годовыми данными. Если соответствующий временной ряд характеризуется линейным уровнем и колебаниями с некоторым периодом или суммой колебаний с кратными периодами и неизменными во времени амплитудами, то скользящая средняя с промежутком, равным или кратным периоду колебаний, даст тот же линейный уровень. Если же использовать скользящую среднюю с отличным от указанного промежутком скольжения, то получатся новые колебания с теми же периодами, но с меньшими амплитудами. При некратных периодах колебаний выбор промежутка становится затруднительным. Вопрос еще более усложняется, когда вековой уровень не является линейным: в случае уровня с положительным ускорением скользящая средняя будет завышать, а при отрицательном ускорении – занижать истинный уровень. Расхождения будут особенно заметны для малых значений временного ряда, где величина векового уровня плохо различается на фоне колебаний. Чтобы уменьшить такое смещение оценки нелинейного уровня, прибегают к сокращению промежутка скольжения. В этом случае сглаженные значения приближаются к исходным наблюдениям и 159
тем самым сокращают величину смещения оценки уровня. Однако при этом будут слабо устраняться колебания с периодами, превышающими новый промежуток, что противоречит самой идее выделения векового уровня. Если временной ряд составлен из месячных или квартальных данных, то в нем может присутствовать сильная сезонная компонента, которую необходимо оценить. Отличительной чертой этой компоненты является то, что ее период заранее известен и не изменяется во времени. В условиях, когда вековой уровень близок к линейному, применение скользящей средней с двенадцатимесячным промежутком скольжения позволяет оценить эту компоненту. Причем вначале рекомендуется сгладить данные, а потом вычесть результаты сглаживания из исходных наблюдений. В действительности же здесь предполагается нечто большее, чем линейность векового уровня и практическое постоянство амплитуды сезонных колебаний, а именно: предполагается, что двенадцатимесячная скользящая средняя не воздействует на те колебания с периодом, близким к одному году, которые входят в состав компонент со средней величиной периодов. Выделение сезонной компоненты на практике значительно усложняется из-за изменений ее амплитуды во времени и нелинейного характера векового уровня для большинства экономических рядов. Чтобы хотя бы частично устранить возникающие в этих случаях несоответствия найденных колебаний истинным сезонным колебаниям, применяются дополнительные процедуры обработки данных1. Еще более сложна в условиях реальных экономических рядов проблема выделения колебаний со средними величинами периодов. Не рассматривая в деталях процедуры оценки данной компоненты, отметим, что ее сущность сводится к образованию разности между исходным временным рядом и суммой ранее оцененных векового уровня и сезонных колебаний, а также к коррекции возможных при этом ошибок2. Последние объясняются присутствием в такого рода оценке элементов других компонент, и в частности случайной составляющей временного ряда. 1 2
См. Миллс Ф. Указ.соч., с. 355–366. См. Миллс Ф. Указ.соч., с. 369–384. 160
Достаточная для практических целей точность приближения обеспечивается в этом методе с помощью указанного приема выделения третьей компоненты. Поэтому рассматривать показатель точности как решающий для предпочтения данной совокупности трех компонент какой-либо другой их совокупности, полученной теми же средствами, вряд ли имеет смысл. Что касается свойств несмещенности и эффективности оценок компонент, то, понятно, метод простых скользящих средних их не обеспечивает. Из взвешенных скользящих средних, по-видимому, наиболее известной и чаще всего применяемой на практике является средняя с экспоненциальными весами: m
m
i =− m
i =− m
∑ ai X (t − i) = ω0 ∑
ω\i \ X (t − i ), t = m + 1,..., N − m, (4.1.4)
где ω0 > 0 и 0 < ω < 1. При обосновании ее использования обычно указывают на факт уменьшения “ценности” данных по мере их удаления от рассматриваемого момента времени. Считая, что по отношению к “цене” информации в данный момент, принимаемой за ω0, “цена” информации о значениях экономического показателя в моменты (t ± i) падает в ω i раз, получаем веса ai = ω0 ⋅ ω i , i = 0, ± 1,..., ± m, и cоответствующую им скользящую среднюю (4.1.4). У нее уже не один управляющий параметр m, как у простой скользящей средней, а три: m, ω0 и ω. Поэтому от нее можно ожидать большей гибкости в приспособлении к индивидуальным особенностям каждого временного ряда. Другой известной скользящей средней является средняя с весами, подчиненными линейному закону: m
∑
r =− m
αi X (t − i) = ω0
m
∑
(m + 1 − i ) X (t − i),
r =− m
(4.1.5)
t = m + 1,..., N − m,
где ai = ω0 (m + 1 − i ), i = 0, ±1,..., ± m, ω0 > 0. Здесь также предполагается падение “цены” информации по мере удаления данных от рассматриваемого момента времени, но уже по линейному, а не экспоненциальному закону. 161
В ряде случаев рассматриваются односторонние скользящие средние с экспоненциальным и линейными весами: m
ω0 ∑ ωi ⋅ X (t − i), t = m + 1,..., N ;
(4.1.6)
i =0
m
ω0 ∑ (m + 1 − i ) ⋅ X (t − i), t = m + 1,..., N .
(4.1.7)
i =0
Несмотря на то что взвешенные скользящие средние являются потенциально более совершенным инструментом, чем простые скользящие средние, трудности подбора “управляющих” параметров m и αi , i = 0, ±1,…, ±m, существенно ограничивают их использование для анализа экономических временных рядов общей структуры. В настоящее время наиболее важной сферой их практического применения, точнее простейших из них, является сглаживание рядов в целях выделения векового уровня1. Тем самым, модель временного ряда при использовании метода взвешенных скользящих средних сводится к упрощенному виду X t = X1 (t ) + ξt ,
(4.1.8)
где ξt – флюктуационный остаток, или, иначе, сумма всех прочих компонент. Следует также отметить, что соответствующих доказательств о несмещенности и эффективности оценок параметров компоненты векового уровня, насколько это нам известно, не существует. Метод подбора подходящей функции времени, по-видимому, не менее популярен в практических исследованиях временных рядов, чем только что рассмотренные методы простых и взвешенных скользящих средних. Более того, желание использовать результаты обработки временного ряда для прогнозирования часто заставляет предпочесть именно данный, хорошо приспособленный для указанной цели метод, несмотря на его очевидные недостатки. Сущность метода подбора подходящей функции времени составляют две следующие процедуры: собственно подбор подходящей функции времени и последующая оценка ее параметров. Примером процедуры подбора подходящей функции времени является 1
См., например, Гренджер К., Хатанака М. Указ. соч., с. 144–154. 162
рассмотренный в 1.4 компромисс “точность–надежность”, позволяющий для данного временного ряда подобрать “наилучший” полином k
Pk (t ) = ∑ aˆi t i .
(4.1.9)
i =0
Другим примером этой процедуры может служить тест проверки “на пригодность” экспоненциальной функции времени f (t ) = aebt ,
(4.1.10)
использующий свойство постоянства отношений ее последовательных значений, называемых темпами роста, однако для большинства применяемых в данном методе функций нет соответствующих статистических процедур подбора наилучшей среди данного класса функции времени, несмотря на то что для многих из них это можно было бы сделать, опираясь на те или иные их “инварианты”. Поэтому в целом процедура собственно подбора является в большей мере искусством, чем формализованной операцией. Что касается оценки параметров отобранной функции времени, то она основывается на каком-либо математико-статистическом методе, чаще всего на методе наименьших квадратов, и поэтому является строго формализованной. Метод наименьших квадратов как в стандартной форме, так и с ограничениями на параметры (что часто бывает важно в экономическом анализе) применяется к оценке функций времени с линейно входящими параметрами или сводящихся к таковым после некоторых элементарных преобразований. К ним относятся степенные полиномы (4.1.9), экспоненциальная функция с линейным показателем (4.1.10) или с более сложным по виду показателем f (t ) = e Pk (t ) ,
(4.1.11)
превращающаяся после логарифмирования в линейную по параметрам. К указанным относятся и такие известные функции, как степенные f (t ) = at b , (4.1.12) показательно-степенные f (t ) = at Pk (t ) , (4.1.13) 163
дробно-рациональные m
f (t ) = ∑ i =0
f (t ) =
ai ti
1 m
∑ ai t
(4.1.14)
,
;
(4.1.15)
i
i =0
при этом последняя функция превращается в линейную по параметрам после взятия обратной величины. Поэтому будем считать, что после соответствующего преобразования мы всегда имеем дело с функциями вида m
f (t ) = ∑ ai ft (t ) ,
(4.1.16)
i =0
где fi (t ), i = 0, 1,…, m, – известные функции времени, не зависящие от искомых параметров. Применяя к оценке параметров таких функций метод наименьших квадратов, мы, естественно, рассчитываем на соблюдение условий теоремы Гаусса – Маркова. В отношении функции fi (t ), i = 0, 1,…, m, таким условием является их линейная независимость; что касается случайной составляющей временного ряда, то она должна быть белым шумом. В этом случае метод наименьших квадратов не только обеспечивает наилучшие в смысле минимума дисперсий несмещенные оценки параметров aˆi i = 0,1,..., m, но и позволяет получить интересующие нас оценки точности и статистической надежности решения – дисперсий σ δ2 и σ 2(ai ), i = 0,1,..., m. Располагая количественными характеристиками качества решения в виде абсолютных или относительных показателей точности приближения и статистической надежности оценок параметров, мы можем с большей уверенностью, чем в рассмотренном выше случае скользящих средних, доверять проведенному исследованию. Но является ли метод подбора подходящих функций подлинным методом исследования структуры и динамики временных рядов, с помощью которого можно выделять во временном ряду ранее указанные компоненты? Теоретически – да, но нетрудно видеть, что 164
функции, используемые в практических вычислениях, являются апериодически гладкими функциями времени, пригодными прежде всего для описания векового уровня, но совершенно неподходящими для приближения сезонной компоненты. Что касается компоненты со средними по величине периодов колебаниями, то только для достаточно длинных временных рядов и преобладания в спектре этой компоненты низкочастотных составляющих можно рассчитывать на подбор подходящей, заведомо многопараметрической функции. Так как мцогопараметричность, как правило, приводит к “нехорошему” поведению функции между узлами и, что не менее важно, к такому же поведению на отрезке прогноза, то в этом случае мы можем лишиться одного из явных преимуществ данного метода – удобства его решений для прогнозирования временных рядов. Поэтому практические исследования с помощью метода подбора подходящей функции времени, так же как и в методе взвешенных скользящих средних, относятся к случаю двухкомпонентной модели временных рядов X t = X1 (t ) + δt ,
(4.1.17)
хотя и более частного вида (δt – белый шум). Одновременно с этим определяется и сфера применимости рассмотренного метода – временные ряды годовых данных с явно выраженными вековыми уровнями. Следующий метод исследования временных рядов, известный в статистической литературе как периодограмм-анализ А. Шустера1, в определенном смысле является дополняющим по отношению к только что рассмотренному методу, так как он хорошо приспособлен для исследования рядов флюктуационного характера. В то же время, в отличие от метода скользящих средних с его раздельным выделением компонент X 2 (t ) и X 3 (t ) и связанной с этим невозможностью оценить статистическую надежность каждой из них, метод периодограмм-анализа основан на совместном исследовании колебательных компонент временного ряда и для него существует тест проверки статистической надёжности решения. 1
См., например, У и л к с С. Указ. соч., с. 529 и далее. 165
Моделью временного ряда здесь служит сумма тригонометрического полинома неизвестного порядка m случайной компоненты m
X t = X 2 (t ) + X 3 (t ) + δt = ∑ (bi cos ωi t + ci sin ωi t ) + δt , (4.1.18) i =1
где предполагается, что δt – белый шум. В основе метода лежит анализ периодограммы I (ω) , имеющей для временных рядов с нечетным числом наблюдений N = 2m + 1 следующий вид: 2m + 1 2 ⎡α (ω) + (α′)(ω)⎤ , I 2m +1 (ω) = (4.1.19) ⎦ 2π ⎣ где α(ω) =
m 1 2m +1 ( ) cos X t ω t = ∑ ∑[bi ui (ω) + ci νi (ω)] + γ (ω); 2m + 1 t =1 i =1
u i (ω) =
1 2m +1 ∑ cos ωi t ⋅ cos ωt; 2m + 1 t =1
ν i (ω) =
1 2m +1 ∑ sin ωi t ⋅ cos ωt ; 2m + 1 t =1
γ (t ) =
1 2 m +1 ∑ δ ⋅ cos ωt . 2m + 1 t =1 t
(4.1.20)
Аналогично α′(ω) =
m 1 2m +1 X (t )sin ωt = ∑ [bi ui′ (ω) + ci ν′i (ω)] + γ ′(ω) , (4.1.21) ∑ 2m + 1 t =1 i =1
где ui′ (ω), ν′i и γ ′(ω) получаются соответственно из ui (ω), νi и γ (ω) заменой cos ωt на sin ωt. Величины α(ω) и α'(ω) являются своеобразными ковариациями рассматриваемого временного ряда X(t) с косинусами и синусами “подозреваемых” частот 2πi , i = 1,..., m. 2m + 1 Если последние близки к соответствующим частотам разложения Фурье для временного ряда, то на периодограмме I 2 m +1 (ω) им ωi =
166
будут соответствовать более интенсивные, чем в противном случае, “всплески”. Используя то обстоятельство, что при N → ∞ математические ожидания ковариаций α(ω) и α'(ω) обладают свойствами ⎧0, ω ≠ ωi , ⎪ M α(ω) → ⎨b i ⎪⎩ 2 , ω = ωi , i = 1,..., m; ⎧0, ω ≠ ωi , ⎪ ′ M α (ω) → ⎨ с i ⎪⎩− 2 , ω = ωi , i = 1,..., m;
(4.1.22)
2π
, i = 1,..., m от ωi ложных, так и измерять с помощью величин α(ω) и α'(ω) амплитуды соответствующих гармоник. После того как решение в виде суммы гармонических колебаний с определенными периодами и амплитудами получено, нетрудно разделить его на компоненты X 2 (t ) и X 3 (t ) . Для этого нужно разбить указанную сумму гармоник на две частные суммы, частоты которых попадают в соответствующие интервалы:
можно как отличать истинные периоды длины
X 2 (t , ω0 < ωi < ω1 ) + X 3(t , ω1 < ωi < ω2 ).
(4.1.23)
Ввиду того, что данный метод основан на сходимости по вероятности величин α(ω) и α'(ω), его следует применять к длинным временным рядам. Именно для таких рядов Р. Фишером был разработан тест проверки значимости решений, получаемых методом периодограмм-анализа1. Метод авторегрессии, так же как и метод периодограмм-анализа применяется к исследованию временных рядов частного характера, а именно – с флюктуационными компонентами2.
1
См. Уилкс С. Указ. соч., с. 530–533. См. Юл Д. Э., Кэндел М. Д. Теория статистики. М.: Госстатиздат, 1960, с. 717–729. 2
167
Свое название метод получил по ассоциации с уравнениями регрессии, так как исследуемые стохастические модели, например, X t +1 = μX t + δt +1 (4.1.24) X t + 2 = −αX t +1 − βX t + δt + 2
или
(4.1.25)
где δt – белый шум, аналогичны по своему виду уравневиям регрессии какого-либо из членов временного ряда относительно предшествующих ему значений. Из формулы (4.1.24) следует, что X t включает δt , δt−1 и т. д., но не содержит δt+1, δt+2 и т. д. Умножим обе части уравнения на X t − k и просуммируем все значения ряда. Так как1 ковариация {X t + m , X t − k } = ρ k + m ⋅ дисп. X t −k , где ρ k + m есть (k + m)-я автокорреляция, получаем
(ρk +1 − μρk ) ⋅ дисп. X t −k = ковариация {δt +1 , X t −k } ; и поскольку ковариация в правой части исчезает, если k > – 1, то ρk +1 − μρk = 0, k > −1. (4.1.26)
В частном случае, когда k = 0 и, следовательно, ρ0 = 1 , будет
и отсюда
ρ1 = μ ,
(4.1.27)
ρk = μ k = ρ1k .
(4.1.28)
Из (4.1.27) можно усмотреть, что приемлемы только те значения μ, которые меньше 1. Подобным же образом исследуется модель авторегрессии второго порядка. Умножая (4.1.25) на X t − k и суммируя все члены ряда, получаем ρ k + 2 + αρk +1 + βρk = 0, k > −2. (4.1.29) Так как ρ0 = 1 и ρ1 = ρ−1 , то для k = – 1 и k = 0 из формулы (4.1.29) следует ρ1 (1 + β) + α = 0 ; ρ2 + αρ1 + β = 0 , 1
Здесь мы сохраняем обозначения авторов – Б.С. 168
что приводит к ρ1 (1 − ρ 2) ⎧ ; ⎪α = − 1 − ρ12 ⎪ ⎨ ⎪β = −1 + 1 − ρ 2 . ⎪ 1 − ρ12 ⎩
(4.1.30)
Из теории уравнений в конечных разностях следует, что решение уравнения (4.1.29) есть ρk
где
cos θ =
( β) = −α , 2 β
k
⋅ sin(k θ + ψ )
,
(4.1.31)
1+ β tg θ . 1− β
(4.1.32)
sin ψ tg ψ =
Величина β должна быть положительной, чтобы β было действительным числом, и так как cos θ не может быть больше 1, то α2 ≤ 4β. Далее, так как ρk не может превысить 1, то β ≤ 1. Поэтому должны выполняться неравенства 0 < β ≤ 1 и α ≤ 2. В противном случае амплитуда колебаний ряда будет неограниченно возрастать. По определению Д.Э. Юла и М.Д. Кендэла, результаты данного исследования служат следующим двум основным целям: “Вопервых, если нам известно, что ряды суть линейного авторегрессивного типа, то (следует указание на формулы (4.1.27) и (4.1.30) – Б.С.) и аналогичные уравнения для более сложных рядов дают нам возможность выразить постоянные μ, α и β через коэффициенты автокорреляции, которые, по крайней мере при больших выборках, мы можем принять за наблюденные коэффициенты серийной корреляции. Во-вторых, требования, которым должны удовлетворять последовательные коэффициенты автокорреляции, вроде приведенных в равенствах (следует указание на формулы (4.1.28) и (4.1.31) – Б. С.), достаточны для суждения, принадлежит ли данный ряд к авторегрессивному типу”1. 1
Юл Д.Э., Кендел М.Д. Указ.соч., с. 722. 169
Важной для практики особенностью схемы авторегрессии является возможность предсказывать значение ряда на момент времени N + 1 с точностью до случайной компоненты δt : Xˆ ( N + 1) = μX ( N ) ,
или
Xˆ ( N + 1) = −αX ( N ) − βX ( N − 1) ,
(4.1.33)
т.е. делать то, что принципиально невозможно в методе скользящих средних и периодограмм-анализе А. Шустера. Для метода авторегрессии существуют статистические процедуры проверки значимости получаемых решений. В их разработке большая заслуга принадлежит Э. Хеннану1. Краткое ознакомление с методом спектрального анализа мы проведем на основе исследований К. Гренджера и М. Хатанаки2 – участников Проекта временных рядов Принстонского университета (США). Судя по высказываниям О. Моргенштерна в предисловии к книге указанных авторов3, именно от метода спектрального анализа ожидались наибольшие успехи в решении проблемы исследования экономических временных рядов сложной структуры. Моделью временного ряда, содержащего гладкий вековой уровень и флюктуационные компоненты, служит уже знакомое нам по формуле (4.1.8) уравнение X t = X1 (t ) + ξt ,
(4.1.34)
где X 1 (t ) – вековой уровень, ξt – псевдостационарный процесс, образованный суммой флюктуационных компонент ряда и белого шума. Чтобы исследовать с помощью метода спектрального анализа обе эти составляющие временного ряда (4.1.34), авторы рекомендуют различать две следующие постановки проблемы. Первая – оценка X 1 (t ) в целях изучения векового уровня. В этом случае рекомендуется метод фильтрации, но спектр псевдостационарного процесса не исследуется. И вторая – устранение X 1 (t ) методами 1
См. Хеннан Э. Анализ временных рядов. М.: Наука, 1964. См. Гренджер К., Хатанака М. Указ соч. 3 См. там же, с. 5. 2
170
подбора подходящих полиномов и последующего их вычитания в целях изучения спектра колебаний ξt1. Вначале рассмотрим первую постановку проблемы, в которой рекомендуется для оценки векового уровня применить фильтрацию. Фильтр определяется как следующее линейное преобразование временного ряда: L [ X (t )] =
m
∑ ai X (t − i),
t = m + 1,..., N − m.
(4.1.35)
i =− m
Чтобы познакомиться с воздействием фильтра на временной ряд, можно обратиться к уже знакомому примеру фильтров – простым скользящим средним. С этой целью рассмотрим трехлетнюю (трехмесячную) среднюю 1 1 (41.36) ∑ X (t − i) 3 i =−1 и исследуем ее воздействие на единственную гармонику eiωt в комплексной форме, что более удобно для анализа: e iω(t +1) + eiωt + e iω(t −1) e iω + 1 + e −iω iωt = e . 3 3
(4.1.37)
Из (4.1.37) следует, что в результате данного преобразования гармоника умножилась на независящий от времени коэффициент α(ω) =
1 + e iω + e −iω , 3
(4.1.38)
или, если рассматривать представляющую интерес действительную часть α(ω), то на 1 + 2cos ω . (4.1.39) S (ω) = 3 Величина S(ω) называется передаточной функцией фильтра, а ее квадрат – коэффициентом фильтрации. Последняя величина показывает, на что умножилась амплитуда данной гармоники в спектре: 1
См. Гренджер К., Хатанака М. Указ. соч., с. 154. 171
(1 + 2cos ω) 2 1 + 4 cos ω + 4cos 2ω . (4.1.40) = S 9 9 Так как ω произвольна, то фактически имеем возможность изучить воздействие фильтра на весь диапазон частот, хотя первоначально интересовались единственной гармоникой. Из формулы (4.1.40) следует, что функция S2(ω) имеет при ω = 0 2π абсолютный максимум, равный 1, далее в точке ω = убывает до 3 нуля, снова возрастает и достигает при ω = π второго по величине 1 максимума (первый “промежуточный”), равного . Дальнейшее 9 поведение S2(ω) можно не рассматривать, так как наивысшая частота, о которой имеется объективная информация, содержащаяся ω 1 во временном ряду Х(t), t = 1,…, N, есть ω = π или f = = . Она 2π 2 называется частотой наложения и объясняется равнодискретным характером моментов наблюдения и неразличимостью частот, пре1 вышающих половину шага, т.е. . 2 Делая естественное предположение, что спектр векового уровня расположен в достаточно узкой полосе (0, ω0) вблизи нулевой частоты, и понимая, что при оценке векового уровня нельзя допускать сколько-нибудь значительного воздействия на его спектр, мы убеждаемся, насколько фильтрация с помощью указанной простой скользящей средней является неэффективной. Ввиду того, что при повторной фильтрации спектр дополнительно умножается на соответствующий коэффициент фильтрации, а само умножение приводит к подавлению “промежуточных” пиков и повышению крутизны первого пика, результирующее воздействие на спектр векового уровня значительно уменьшается. Именно поэтому К. Гренджер рекомендует “оценивать тренд, пользуясь сочетанием двух или больше простых скользящих средних”1. Итак, компонента оценена. Каков же уровень доверия к полученной оценке? Мы его не знаем, как не знали и ранее при иссле2(ω)
1
=
Гренджер К., Хатанака М. Указ. соч., с. 154. 172
довании рядов с помощью скользящих средних. По-видимому, раздельный характер оценки компонент является методологическим камнем преткновения” для разработки процедур оценки значимости. Так как соответствующие исследования показали, что спектр стационарной компоненты ряда претерпевает при таком способе оценки векового уровня заметные изменения, то для исследования “чистого” спектра для ξt рекомендуется способ снятия векового уровня. К. Гренджер дает следующие две рекомендации: “Для снятия тренда, когда вас не интересуют низкочастотные полосы, и когда длина последовательности невелика (скажем, N ≤ 400), достаточно эффективной будет полиномиальная регрессия и вычитание. Редко бывает необходимо подбирать полином степени выше второй, и очень часто бывает достаточно линейной регрессии”. “Для снятия тренда, когда, кроме того, нас интересует возможность присутствия составляющих с большим периодом, наиболее приемлемым методом оказывается гармоническая регрессия и вычитание”1. Поскольку мы уже знакомы с методами исследования временных рядов с помощью таких регрессий, то ограничимся лишь указанием на следующее, на наш взгляд весьма парадоксальное, обстоятельство. Подбор степеней полиномов, не говоря уже об оценке их коэффициентов, проводится в данном случае в условиях модели (4.1.34), когда ξt – псевдостационарный процесс, существенно отличающийся от белого шума δt модели (4.1.17), а присутствие компоненты X 1 (t ) противоречит обоснованию метода оценки тригонометрических полиномов модели (4.1.18). Чтобы обеспечить надежное устранение тренда, необходимо знать статистические свойства процесса ξt или, что в данном случае эквивалентно, знать его матрицу ковариаций. Но именно она и является фактическим объектом нашего исследования. Поэтому, исходя из ее незнания, нельзя рассчитывать на хорошее качество устранения векового уровня с помощью указанных выше полиномов. Плохое же качество снятия уровня и его дальнейшее вычита1
Гренджер К., Хатанака М. Указ. соч., с. 154. 173
ние могут оказаться по своему воздействию на спектр ξt ничем не лучше первого способа – оценки векового уровня. Если же рассчитывать на знание матрицы ковариаций, теряет смысл сама идея предлагаемого способа устранения векового уровня. Но предположим, что некоторым образом удалось получить такую оценку векового уровня, вычитание которой привело к менее заметному изменению спектра флюктуационных компонент, чем в первом способе (оценка с помощью повторной фильтрации). Рассмотрим дальнейшую схему исследования спектра для стационарной составляющей ξt . Располагая оценкой векового уровня Xˆ (t ) , можем получить 1
реализацию ряда ξ(t) ξ(t ) = X (t ) − Xˆ 1(t ), t = 1,....., N ,
(4.1.41)
и с ее помощью оценить ковариации ck =
N N −k ⎫ 1 ⎧N −k 1 ξ t ∑ ξ t⎬ . ⎨ ∑ ξt ξt +k − ∑ N − k ⎩ t =1 N − k t =k +1 t =1 ⎭
(4.1.42)
Тогда интересующие нас спектральные оценки получаются следующим образом: m ⎫ 1 ⎧ 2 fˆ (ω j ) = λ c + λ k ck cos ω j k ⎬ , (4.1.43) ⎨ 0 0 ∑ 2π ⎩ ⎭ k =1 π⋅ j где ω j = , j = 0, m, ck – ковариации, а λ k – веса, назначение m которых – улучшить качество оценки спектра в области промежуточных частот. Например, веса λ k , могут иметь следующий вид1: ⎧ 6k 2 ⎛ k ⎞ m ⎪1 − 2 ⎜1 − m ⎟ ; 0 ≤ k ≤ 2 ; ⎠ ⎪ m ⎝ λk = ⎨ 3 ⎪2 ⎛1 − k ⎞ , m ≤ k ≤ m. ⎪⎩ ⎜⎝ m ⎟⎠ 2
1
См. Гренджер К., Хатанака М. Указ. соч., с. 68. 174
(4.1.44)
Если же все λ k = 1, k = 0, 1,..., m, то формула (4.1.43) превращается в известное Фурье-преобразование от ковариационной функции процесса ξt . Располагая весами λ k и оценками ковариаций ck , вычисляем значения fˆ (ω ) во всей интересующей полосе частот j
0 < ω < π. Следует отметить, что проблема получения спектральных оценок для процессов со спектрами внутри частотного диапазона 0 < ω < π считается крайне сложной в физических измерениях. “Чтобы оценить трудности, возникающие при оценивании спектрального пика, расположенного внутри частотного диапазона, по сравнению с рассмотренным выше случаем пика на крайней (нулевой, как при выделении векового уровня. – Б.С.) частоте, рассмотрим процесс авторегрессии второго порядка X t = X t −1 − −0,5 X t −2 + Zt ”1. Используя аналогичную рассмотренной К. Гренджером схему, авторы приходят к следующему заключению: “Следовательно, у нас не было бы полной ясности относительно истинной формы спектра, если бы мы заранее не знали, какое L (аналог “m” в формуле (4.1.43). – Б.С.) лучше всего соответствует теоретическому спектру”2. Отмечая специфику способов оценки спектра в условиях известного и неизвестного m, целесообразно сослаться на аналогичную ситуацию оценки параметров полинома неизвестной – степени k, существенно отличающуюся по своей сложности от оценки коэффициентов полинома известной степени. В целом у методов исследования временных рядов “полной” структуры по сравнению с методами исследования рядов частной структуры имеются не только преимущества, связанные с большей общностью подхода, но и весьма существенные недостатки, проистекающие от этой же общности. В прикладных исследованиях, как уже отмечалось, важно не просто получить некоторые результаты, но и знать их статистическую надежность. В этом плане методы анализа временных рядов частного вида используют каждый свою, 1
Дженкинс Г., Ваттс Д. Спектральный анализ и его приложения. Вып. 2. М.: Мир, 1972, с. 19. 2 Там же, с. 21. 175
но единую по отношению ко всем оцениваемым параметрам компонент временного ряда статистическую процедуру. Так, оценка коэффициентов линейной комбинации функций (4.1.16) производится с помощью метода наименьших квадратов, причем одновременно для всех ai , i = 0, 1,..., m. Та же одновременность оценки параметров в пределах единой процедуры характерна и для метода авторегрессии, и для периодограмм-анализа. В этих условиях вся совокупность оценок, рассматриваемых как случайные величины, будет описываться с помощью также единого (совместного) распределения вероятностей, что и позволяет рассчитать их статистическую надежность. В противоположность этому оценка неизвестных параметров общими методами осуществляется раздельно с помощью двух и более статистических процедур. Поэтому корректное построение указанного выше совместного распределения вероятностей для всей совокупности параметров возможно лишь в случае независимости соответствующих частных распределений (по группам параметров каждой из процедур). Независимость же этих частных распределений определяется независимостью соответствующих им процедур. Но ни скользящие средние, ни фильтрация, ни регрессии, используемые в этих методах для оценки и снятия векового уровня, не могут рассматриваться как независимые (не влияющие на последующую оценку колебательных компонент) процедуры. Это приводит к той, весьма нежелательной в практических разработках ситуации, когда решение получено, а в какой степени ему можно доверять – неизвестно. Какие же конструктивные выводы могут быть сделаны на основе проведенного анализа? Во-первых, априорное незнание числа и расположения узких важных полос (“пиков”) в спектре исследуемого временного ряда обязывает исходить из его произвольной (в рамках указанных ранее трех-, четырехкомпонентных моделей) структуры. Тем самым, оценку структуры необходимо сделать составной частью самого метода. Во-вторых, применяемую в методе статистическую процедуру оценивания следует отнести сразу ко всем компонентам рядов. В-третьих, для исследования экономических временных рядов с помощью единой статистической процедуры оценивания необхо176
димо построить модель, исходящую из единства математических свойств класса функций, порождающих как вековой уровень, так и колебательные компоненты. 4.2. “Наиболее подходящий” оператор сдвига и анализ временных рядов с априори неизвестной структурой
Обоснование модели и процедуры одновременной оценки компонент временных рядов начнем со следующей модификации рассмотренного в 4.1 метода взвешенных скользящих средних. Вместо известной постановки проблемы в отношении взвешенной средней, ставящей своей целью выделение (оценку) какой-либо одной из компонент временного ряда, например векового уровня, как в модели (4.1.18), сформулируем вопрос иначе, а именно: нельзя ли использовать взвешенную среднюю для разбиения временного ряда на сумму всех компонент, помимо случайной, и на эту последнюю? Этим были бы достигнуты не только единство математической природы описания векового уровня и колебательных составляющих, задаваемых в виде (неслучайной) функции времени – взвешенной средней, но и возможность одновременной оценки их параметров. Заметим, что здесь важны оба момента. Одной общности математической природы компонент еще недостаточно: использование для описания векового уровня степенных, а для колебательных оставляющих – тригонометрических полиномов (см. 4.1), являющихся, так же как и взвешенная средняя, инвариантными по сдвигу неслучайными функциями времени, не привело к развитию метода анализа рядов с общей структурой, так как не была указана соответствующая процедура совместной (одновременной) оценки параметров этих функций. Предлагая первоначально разбивать временные ряды на “суммарную детерминированную” и случайную составляющие, мы одновременно обеспечиваем большую общность подхода, так как вместо использования априорной информации о структуре делаем ее (структуру рядов) объектом исследования. В соответствии с общей схемой трехэтапной процедуры, описанной в 4.1, на первом этапе исследования временных рядов с помощью взвешенных средних 177
Xˆ (t , m, ai ) =
m
∑ ai X (t − i),
m = 0,1,...;
i =− m
t = m + 1,…, N – m,
(4.2.1)
мы также хотели бы отобрать те из них, на которые могли бы смотреть как на “подходящие” по точности приближения к исследуемому ряду X(t), t = 1,..., N. Однако попытка непосредственно воспользоваться аналогией с этапом подбора “подходящих” полиномов Pr (t ) и применить для сопоставления различных средних квадратическую меру близости 2
S
2 ( m)
N −m ⎡ m ⎤ 1 min ∑ ⎢ ∑ ai X (t − i ) − X (t )⎥ , = N − 2m ai t =m +1 ⎣i =− m ⎦
m = 0, 1,…,
(4.2.2)
наталкивается на следующее препятствие: при любом (допустимом) значении m очевидные решения aˆ 0 = 1, a i = 0, i ≠ 0 не только обращают все показатели “точности” в нуль, но и ввиду своей тривиальности ничего не дают для анализа исследуемого ряда. Поэтому модифицируем скользящую среднюю (4.2.1), сделав в ней “дырку” при i = 0: Xˆ 0 (t , m, ai ) =
m
∑
i =− m i ≠ 0
ai X (t − i), m = 1, 2,..., m′,
t = m + 1,…, N – m.
(4.2.3)
Теперь можно говорить о классе взвешенных средних (4.2.3) с числом параметров 2m, m = 1, 2,..., m′, для которых определена упорядоченная по m последовательность показателей точности приближения: ⎛⎡ N ⎤⎞ (4.2.4) S 2(1) > S 2(2) > ... > S 2 ⎜ ⎢ ⎥ ⎟ , ⎝⎣ 4 ⎦⎠ N ⎡N ⎤ . где ⎢ ⎥ – целая часть числа 4 ⎣4⎦ Для значений N = 4n и m = n система алгебраических неоднородных уравнений 178
⎧a − nX (2n + 1) + ... + a −1X (n + 2) + a1X (n) + ... + a nX (1) = X (n + 1), ⎪ ⎨. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (4.2.5) ⎪a X (4n) + ... + a (3n + 1) + a X (3n − 1) + ... + a X (2n) = X (3n), ⎩ −n −1 1 n
позволяет определить нетривиальную взвешенную среднюю “точного совпадения”, проходящую аналогично интерполяционному полиному через все узлы информации и поэтому обращающую показатель “точности” в нуль. Предположение о кратности числа наблюдений четырем не имеет существенного значения, так как мы можем отбросить либо одно, либо два, либо самое большее три “старых” наблюдения и превратить ряд с произвольным числом наблюдений в интересующий нас. На самом деле в этом нет необходимости, так как нетривиальная средняя “точного совпадения” представляет собой чисто теоретический интерес: для практических целей используются лишь средние с числом параметров m′, заметно меньшим количества наблюдений на интервале решения. Поведение показателей “точности” S 2 (m) с ростом m носит подобный ранее рассмотренному характер: на начальном участке изменения m они убывают быстро, а затем, по мере роста m, убывание замедляется. Участок повторного быстрого убывания при при⎡N ⎤ ближении m к ⎢ ⎥ , как уже отмечалось, практического интереса ⎣4⎦ не представляет. Это позволяет отобрать в качестве “подходящих” по точности приближения те из взвешенных средних, которым соответствуют S 2 (m) из окрестности точки перехода от их быстрого к медленному убыванию: Xˆ 0 (t , m, aˆi ), m0′ ≤ m ≤ m1′ , (4.2.6) где отрезок (m0′ , m1′ ) так же, как и в случае с полиномами, выбирается с некоторым “запасом”. Cущность второго этапа процедуры статистического анализа свойств предполагаемых стохастических моделей исследуемого временного ряда X t = Xˆ 0 (t , m, ai ) + δ mt , m = m0′ ,..., m1′ , (4.2.7) 179
заключается в том, чтобы определить среди “подходящих” по точности разбиений ряда наблюдений X (t ) = Xˆ 0 (t , m, ai ) + δ m(t ), m = m0′ ,..., m1′ ; t = m + 1,…, N – m,
(4.2.8)
те, которым будут соответствовать неавтокорреллированные случайные составляющие в стохастических моделях (4.2.7). Если проверка на автокорреляцию показывает отсутствие таковой для целой совокупности случайных составляющих, δ mt , m = m0 ,..., m1 (m0′ ≤ m0 , m1 ≤ m1′ ) , то соответствующие им стохастические модели признаются допустимыми – удовлетворяющими условиям разбиения переменной Хt на детерминированную (взвешенная средняя Xˆ 0 (t , m, ai )) и неавтокоррелированную случайную составляющую (δ mt ) . Определив “допустимые” модели исследуемого временного ряда X t = Xˆ 0 (t , m, ai ) + δ mt , m = m0 ,…, m1 ,
(4.2.9)
приступаем к завершающему (третьему) этапу процедуры – выбору “наиболее подходящей” взвешенной средней. Для принятия решения, как и прежде, используется метод компромисса “точность – надежность”. Отсутствие в данном случае формулы для оценки величины главного определителя и соответствующих алгебраических дополнений для диагональных элементов матрицы системы нормальных уравнений не позволяет провести аналитического доказательства быстрого роста сомножителей a ii (m) с увеличением m в формулах для дисперсий оценок (4.2.10) σi2(m) = a ii (m) ⋅ σδ2(m) . Тем не менее, по-прежнему можно утверждать, что с ростом числа оцениваемых параметров и связанного с ним улучшения “точности” происходит падение статистической надежности оценок параметров. Причина этого состоит в том, что при переходе от быстрого убывания показателей S2(m) к медленному векторы {Х(t + m),…, Х (t + 1), Х (t – 1),..., Х (t – m)} становятся (практически) линейно180
зависимыми, а матрицы соответствующих систем нормальных уравнений – плохо обусловленными. Именно поэтому в условиях временных рядов реальной (небольшой) длины почти никогда не получаются статистически надежными оценки для большего числа неизвестных параметров, чем 5–6. Обращение к другой мере “точности” и соответственно другому методу оценки параметров (не наименьших квадратов) этой проблемы не снимает. Рассматривая аналогичную ситуацию, К. Ланцош пишет: “Не следует надеяться, что какой-нибудь иной математический прием мог бы привести к лучшим результатам, ибо трудность заключается не в способе вычисления...” (см., например, метод ортогональных полиномов)1. Для практической реализации компромисса “точность надежность” используются значений относительных показателей статистической надежности оценок параметров допустимых моделей (коэффициенты вариации): σi (aˆi ) , i = ± 1, ..., ± m; aˆi
m = m0 ,..., m1 .
(4.2.11)
Характер процедуры принятия решения остается прежним. В результате получаем “наиболее подходящую” взвешенную среднюю (линейный фильтр) Xˆ 0 (t , p, aˆi ) =
p
∑
i =− p , i ≠ 0
aˆi X (t − i ),
t = p + 1,..., N − p, (4.2.12)
и соответствующую ей модель “наилучшего” разбиения исследуемого временного ряда X t = Xˆ 0 (t , p, aˆi ) + δ pt . (4.2.13) Фильтр (4.2.12) “впитал” в себя все компоненты ряда, помимо случайной – белого шума δ pt , что позволяет говорить о нем, как о согласованном фильтре. В дальнейшем нам предстоит выделить (оценить) эти компоненты, а пока укажем на следующее свойство полученного решения. Будучи двухсторонним, фильтр (4.2.12) от1
Ланцош К. Практические методы прикладногоанализа. М.: Физматгиз, 1961, с. 287. 181
брасывает (не подвергает сглаживанию) не только “старые” (на левом конце отрезка t = 1,…, N), но и самые “современные” наблюдения экономического показателя Х(t) при t = N – р + 1,..., N. Это существенно снижает практическую ценность проводимого с его помощью анализа. В то же время в условиях описанной выше процедуры подбора “наиболее подходящей” взвешенной средней применение другой (также с “дыркой”) односторонней средней r
Xˆ 0 (t , r , ai ) = ∑ ai X (t − i ),
t = r + 1,..., N ,
(4.2.14)
i =1
не только сохраняет все свойства “точного и надежного” приближения к исследуемым временным рядам с априори неизвестной структурой, но и приводит к новому практически важному свойству – способности анализировать наиболее “современные” (последние) наблюдения. Поэтому в качестве основного, “рабочего” инструмента анализа временных рядов конечной и, как правило, небольшой длины мы принимаем одностороннюю среднюю (4.2.14). Проблема оценки параметров уравнения регрессии с правой частью, равной (4.2.14), решается с помощью компромисса “точность – надежность” столь же успешно, сколь и для уравнения с распределенными лагами. Имея в виду, что математикостатистические свойства последнего допускают случай переменной Yt , тождественно равной по величине X t , на исследуемую нами регрессию можно смотреть как на частный (специфический) случай лаговой регрессии с индексом i, изменяющимся уже не от 0, а от 1. Если иметь в виду, что для экономических рядов проблема интерполяции либо не представляет особого интереса, либо вообще не имеет смысла, то с точки зрения анализа поведения рядов на отрезке t = 1,..., N регрессионные модели с таблично задаваемыми детерминированными составляющими практически ничем не уступают моделям с детерминированными составляющими в виде явных функций времени. Единственное, чего они не позволяют делать – это проводить исследование на левом конце ряда, при самых “старых” наблюдениях. 182
Однако сфера применения “точных” и “надежных” приближающих функций не ограничивается анализом прошлого; повидимому, еще более значительна их роль для прогнозирования экономического развития. В этом плане таблично задаваемые детерминированные составляющие заметно проигрывают решениям в виде явных функций времени. Так, для “наиболее подходящей” односторонней взвешенной средней возможности предсказания ограничиваются единственным, (N + 1)-м, моментом времени – k
Xˆ ( N + 1) = ∑ aˆi X ( N + 1 − i ).
(4.2.15)
i =1
Представляется интересным выяснить, нельзя ли от данной формы решения перейти к явным функциям времени? Дополнительным аргументом в пользу перехода к явным функциям времени является невозможность разбиения табличной функции на компоненты в целях проведения анализа структуры исследуемого ряда. Можно ожидать, что соответствующая суммарная (“впитавшая” все компоненты временного ряда, помимо случайной) функция времени будет более просто подвергаться разбиению. С этой целью представим “наиболее подходящее” разбиение ряда наблюдений в следующей форме: k
X (t ) − ∑ ai X (t − i) = δk (t ),
t = k + 1,..., N .
(4.2.16)
i =1
Линейную комбинацию неслучайных запаздывающих функций времени, стоящих в левой части равенства (4.2.19), запишем с помощью операторов сдвига L: k k ⎛ ⎞ L0 X (t ) − ∑ aˆi Li X (t ) = ⎜ L0 − ∑ aˆi Li ⎟ X (t ) = Lk [ X (t )] = δk (t ), (4.2.17) ⎝ ⎠ i =1 i =1
где через Lk , обозначена линейная комбинация операторов сдвига k
от нулевого1 до k-го порядков: L0 − ∑ aˆi Li . i =1
1
Характер воздействия на X(t) оператора L0 определяется условием L0 X(t) = X(t), иначе говоря, L0 – единичный оператор. 183
Из формулы (4.2.17) следует, что “наиболее подходящий” линейный оператор сдвига Lk (как в дальнейшем мы будем называть данный оператор) при воздействии на Х(t) пропускает на “выход” случайную компоненту и задерживает (“съедает”) неслучайную. Постараемся выяснить, какие же неслучайные функции оператор Lk “съедает” полностью. С этой целью подставим в равенство Lk [ X (t )] = 0
(4.2.18)
функцию Xˆ (t ) = λt , где λ является в общем случае комплексным числом: k
k
i =1
i =1
Lk [λt ] = λt − ∑ aˆi λt −i = λt −k (λ k − ∑ aˆi λ k −i ) = 0.
(4.2.19)
Ввиду того, что сомножитель λt −k при всех t отличен от нуля, условие (4.2.19) равносильно уравнению k
λ k − ∑ aˆi λ k −i = 0.
(4.2.20)
i =1
Уравнение (4.2.20) называется характеристическим и имеет в силу основной теоремы алгебры k корней – λˆ 1 ,..., λˆ k . С их помощью восстанавливается (определяется) явный вид функций времени Xˆ (t ) – общих решений уравнения в конечных разностях (оно же – линейный фильтр L [ Xˆ (t )]: k
Lk [ Xˆ (t )] = Xˆ (t ) − aˆ1 Xˆ (t − 1) − ... − ak Xˆ (t − k ) = 0.
(4.2.21)
Для того чтобы убедиться, что определяемый с помощью уравнений в конечных разностях класс функций времени действительно предоставляет широкие возможности для анализа временных рядов с априори неизвестной структурой, рассмотрим частный случай решения при k = 3. Ознакомление с ним имеет не только познавательный интерес: данный случай важен как один из наиболее вероятных результатов при исследовании временных рядов с годовыми данными. Уравнению в конечных разностях третьего порядка (4.2.22) X (t ) − aˆ Xˆ (t − 1) − aˆ Xˆ (t − 2) − aˆ Xˆ (t − 3) = 0 1
2
3
184
соответствует характеристическое уравнение 2 (4.2.23) λ 3 − aˆ1λ − aˆ2 λ − aˆ3 = 0, имеющее три корня – λ1, λ2 и λ3 . Они могут принадлежать к одной из следующих четырех комбинаций: 1. λ1, λ2 и λ3 – действительные и различные. 2. λ1, λ2 и λ3 – действительные и λ1 = λ2 ≠ λ3. 3. λ1, λ2 и λ3 – действительные и λ1 = λ2 = λ3 = λ (имеется один, но кратный корень). 4. λ1 – действительный, а λ2 и λ3 – комплексные сопряженные (α ± iβ). Этим четырем комбинациям корней соответствуют следующие 11 основных различных по своему виду и свойствам функций – общих решений уравнения: 1. c1λ1t + c2 λt2 + c3λ3t .
2. c1λ1t + c2λt2 + c3 . t 3. (c1t + c2 )λ1,2 + c3λ3t .
4. c1t + c2 + c3λt3 . t +c . 5. (c1t + c2 )λ1,2 3
6. (c1 t 2 + c2t + c3 )λ t . 7. c1 t 2 + c2t + c3 .
(4.2.24)
8. c1λ1t + a t (c2 cos ωt + c3 sin ωt ). 9. c1 + a t (c2 cos ωt + c3 sin ωt ). 10. c1λ1t + c2 cos ωt + c3 sin ωt. 11. c1 + c2 cos ωt + c3 sin ωt. В свою очередь, каждая из приведенных функций может существенно видоизменять характер поведения в зависимости от конкретных значений корней и коэффициентов с1, с2 и с3. Первые семь функций из (4.2.24) включают такие важные для практического анализа рядов функции, как сумма экспонент (частный случай показательных функций при λi > 0), полином второй степени, функции с “насыщением” – вторая и пятая при 0 < λi < 1, 185
и ряд других не менее интересных функций. Являясь апериодическими гладкими функциями времени, они будут соответствовать тому же классу временных рядов с моделью “вековой уровень плюс белый шум”, что и в случае метода подбора подходящих функций времени. В то же время функции данного вида и подобные им при k = 4 и k = 5 дают существенно большие возможности для приближения рядов, чем функции линейные в отношении своих параметров. Функции 8–11 из (4.2.24), а также аналогичные им при k = 4 и k = 5 включают помимо апериодических членов флюктуационные составляющие и будут соответствовать временным рядам, содержащим циклические компоненты. Амплитуда колебаний у этих функций может либо изменяться во времени – случаи 8, 9, либо оставаться неизменной – случаи 10, 11. Задавшись вопросом, какая функция времени полностью “съедается” наиболее подходящим оператором сдвига Lk , мы получили ответ не в виде единственной функции, а в виде их целого класса – решений уравнений в конечных разностях. Ситуация оказалась подобной той, которая имела место при выяснении реакции фильтра (в виде простой средней) на единственную синусоиду в комплексной форме, когда в качестве ответа также была получена информация о воздействии фильтра не на единственную гармонику, а на их целую совокупность, приходящуюся на всю полосу частот (0 < ω < π). Полученное множество функций, включающее степенные полиномы, показательные функции (синус и косинус) одинаковых частот, их линейные комбинации, произведения (различных) функций, а также линейные комбинации этих произведений, является, как это и предполагалось, однородным по своей математической природе. Но не только по причине столь общего характера, что все они – неслучайные функции, а по более тонким и специальным свойствам: данное объединенное множество функций является инвариантным по отношению к сдвигу во времени. Каждая входящая в него функция переходит при сдвиге во времени с точностью до линейных коэффициентов сама в себя: полиномы остаются полиномами тех же степеней, показательные функции не изменяют своих оснований, синусы и косинусы имеют те же частоты. 186
У части функций объединенного множества, включающей полиномы и показательные функции, их линейные комбинации, а также произведения этих (различных) функций спектр будет сосредоточен на нулевой частоте. Ввиду того, что при обработке временных рядов мы имеем дело не с самими математически заданными (на бесконечной прямой) функциями, а с их конечными выборками, реальные спектры будут занимать некоторые конечные (“узкие и важные” – по определению К. Гренджера) полосы частот (0, ω0) вблизи нулевой частоты. Обозначим соответствующие указанной части множества функции (заданные на бесконечной прямой) через Xˆ 1 (t ) , а их конечные выборки – через X 1 (t ) . Тогда, опираясь на схему спектрального анализа, можно представить как X (t ) = p (t ) · Xˆ (t ) , где р(t) = 1 для 1
1
t < T и р(t) = 0 для t > T прямоугольный единичный импульс. Используя теорему свертки, получим спектр для функции конечной длительности: F( f ) =
∞
∫ Fˆ ( f )
−∞
sin 2πT ( τ − f ) d τ. 2πT (τ − f )
(4.2.25)
Для удобства интерпретации этого выражения рассмотрим ˆ X 1 (t ) = ei 2 πfjt – гармонику в комплексной форме. Спектр Xˆ 1 (t ) состоит из единственной частоты f = f j , и свертка представляет собой размазывание” этой частоты в спектр: F( f ) =
sin 2πT ( f j − f ) 2πT ( f j − f )
или, учитывая, что fj = 0, получаем окончательно F( f ) =
sin 2πTf . 2πTf
(4.2.26)
Чем меньше Т, тем шире становится важная полоса частотного спектра (“горб”). В этом “размазывании” первоначально “нулевой” полосы и состоит эффект конечной выборки. Соответствующие выборки из указанной выше части множества инвариантных по сдвигу (порождающих) функций служат оценка187
ми вековых уровней рассматриваемых нами временных рядов с априори неизвестной структурой. Для того чтобы выяснить характер спектра у другой части объединенного множества функций, включающей члены с синусами и косинусами некоторых частот ω j = 2π f j, рассмотрим произведе-
ние одной из функций X 1 (tˆ) на гармонику в комплексной форме − i 2πft
и зададимся вопросом: как преобразуется спектр функции ˆ X 1 (t ) в результате данного умножения? Спектр новой функции Xˆ (t ) = Xˆ (t )e −i 2πfjt получается в соот-
e
1
1
ветствии с формулой Fj ( f ) =
∞
∫
Xˆ i (t ) e −i 2 πft dt =
−∞
∞
∫
Xˆ 1 (t ) e−i 2πt ( fi + f ) dt.
(4.2.27)
−∞
Обозначим fi + f = z , тогда Fj ( f ) = F ( z) =
∞
∫ ⎡⎣Xˆ 1 (t )e −i 2πtfj⎤⎦ e
− i 2 πtf
dt = F ( f j + f ). (4.2.28)
−∞
В результате мы установили, что умножение низкочастотной ( f = 0) функции Xˆ 1 (t ) на экспоненту с комплексным показателем или на cos (ω j t + ϕ) в действительной форме приводит к сдвигу спектра на величину ω j = 2πf j. Это означает, что выборки конечной длительности инвариантных по сдвигу (порождающих) функций времени Xˆ 2,3 (t ) , содержащих произведения показательных функций и полиномов на синусы и косинусы, имеют спектры, сосредоточенные в узких важных полосах (ω j − ω0 , ω j + ω0 ) с центрами на “несущих” частотах ω j . Данные выборки служат оценками колебательных компонент
исследуемых временных рядов. Ввиду того, что реальные возможности получения статистически надежных оценок параметров “наиболее подходящих” операторов сдвига ограничены пятью–шестью оценками (k max = 5 ÷ 6) , 188
максимально возможное число выделяемых компонент в структуре временных рядов не превышает двух-трех (не считая случайную). Поэтому рассмотренные ранее функции (4.2.24) – случай k = 3 – представляют собой среднюю по своей размерности оценку структуры, относящуюся к одно- и двухкомпонентным временным рядам (вековой уровень плюс случайная компонента либо вековой уровень плюс колебания промежуточной частоты плюс случайная компонента). Исследуя в 4.1 схему авторегрессии второго порядка, мы видели, что с ее помощью оценивается несущая частота спектрального “горба” в области промежуточных частот и соответствующая интенсивность флюктуаций. В данном случае с помощью функций типа 8, 11 из (4.2.24) мы не только можем определить несущие частоты “горбов” в области промежуточных частот и их постоянные (случаи 10, 11) или переменные (случаи 8, 9) интенсивности, т.е. оценить характер колебательной компоненты ряда, но и одновременно с этим провести оценку его векового уровня со спектром, сконцентрированным вблизи нулевой частоты. Последнее недоступно не только методу авторегрессии, но и методу спектрального анализа. В то же время, при исследовании колебательных компонент метод спектрального анализа временных рядов ставит своей целью оценку формы и прочих характеристик “горба”, а не только его несущей частоты и суммарной интенсивности, как это имеет место в развиваемом здесь методе. Поэтому интересно выяснить, почему, используя одни и те же наблюдения Х(t), t = 1,..., N, в одном случае получаем более обширную, чем в другом случае, информацию о его колебательных компонентах. Если исходные данные одни и те же, то, стало быть, метод спектрального анализа имеет возможность расширения сведений о временном ряде. Может быть, именно ковариации несут в себе ту дополнительную информацию, которая извлекается затем из них с помощью Фурье-преобразования при оценке спектра флюктуационной компоненты ξt (см. модель (4.1.34)). Это было бы вполне возможным, если бы сведения о величинах ковариаций были получены независимо от исходной информации в виде Х(t) при t = 1,..., N. Но, как известно (см. формулы (4.1.41)–(4.1.43)), оценки кова189
риаций получаются на основе того же временного ряда. В чем же дело? Причина указанных различий в количестве “возможных” оценок заключается в том, что в излагаемом здесь методе мы ограничиваемся статистически надежными оценками, а в методе спектрального анализа используются оценки параметров с неизвестной надежностью, а также те, у которых она недопустимо низкая. Все сказанное относится не только к оценкам колебательных компонент, но и к оценкам векового уровня, выделяемого в методе спектрального анализа в условиях неизвестных статистических свойств ξt . Мы провели краткий анализ общих решений уравнений в конечных разностях, представляющих собой суммарные порождающие функции компонент временных рядов Xˆ (t ) . При исследовании конкретного временного ряда суммарной функции Xˆ (t ) соответствует вполне определенное разбиение на порождающие функции компонент Xˆ (t ) = ∑ Xˆ i (t ), (4.2.29) i
причем, каких именно – заранее не фиксируется, и метод не нуждается в такой (о возможной структуре) информации. В этом проявляются его свойства как метода одновременной оценки компонент временных рядов с априори неизвестной структурой. В результате использования описанного выше метода мы приходим к новой стохастической модели временного ряда X i = ∑ Xˆ (t ) + εt ,
(4.2.30)
i
также разбивающей X t на детерминированную и случайную составляющие, но, в отличие от модели (4.2.13), доводящей это разбиение до уровня компонент. У каждой из функций Xˆ i (t ) известны те параметры, от которых они зависят нелинейным образом, и неизвестны те, от которых они зависят линейно (c1 ,..., ck ) . Поэтому Xˆ (t ) можно представить в уже знакомом по формуле (4.1.16) виде 190
k
Xˆ (t ) = ∑ ci fi (t ),
(4.2.31)
i =1
где функции fi (t ) не зависят от искомых параметров. Для оценки коэффициентов c1 ,..., ck у найденного разложения функции Xˆ (t ) по линейно-независимым функциям f (t ),..., f (t ) i
k
применяем метод наименьших квадратов: min ci
N
∑
t = k +1
2
⎡k ⎤ ⎢∑ ci fi (t ) − X (t )⎥ . ⎣i =1 ⎦
(4.2.32)
В данном случае мы использовали те же пределы суммирования по t, что и при оценке весов “наиболее подходящей” взвешенной средней Xˆ 0 (t , k , aˆ i ), определяющей (через характеристическое уравнение) нелинейные параметры функций fi (t ) , i = 1,..., k. Соответствующие критерию (4.2.32) оценки cˆ1 ,..., cˆk будут в силу теоремы Гаусса – Маркова статистически надежными, если случайная компонента εt – белый шум. Последовательное использование в рассмотренном выше методе двух моделей покомпонентного разбиения временного ряда аналогично схеме квадратуры Гаусса1, также с двухэтапным, но более простым оцениванием указанных двух моделей по МНК. При этом основное назначение первой модели – это выбор “наилучших узлов информации” λˆ 1 ,..., λˆ k (оценка числа и расположения “узких и важных” частотных полос в спектре исследуемого ряда), а целью второй модели является выбор “наилучших весов”, соответствующих этим “наилучшим узлам”, т.е. оценка интенсивностей, приходящихся на указанные частотные полосы. Следует отметить, что данный метод, будучи основанным на идее согласованного (с исследуемым временным рядом) фильтра, обладает более естественным механизмом подбора “наиболее подходящей” функции, чем другие методы. Так, например, задаваясь той или иной конкретной функцией в методе подбора подходящих функций времени (см. 4.1), мы тем самым исходим из того, что и 1
См., например, Хемминг Р.В. Указ. соч., с. 139. 191
полином, и экспонента равновероятны. Но так ли это в действительности? Вряд ли. При исследовании реальных временных рядов описанные выше четыре случая корней характеристического уравнения для k = 3 далеко не равновероятны: случаи различных корней будут встречаться значительно чаще, чем случаи кратных, к тому же равных 1, корней. Способность метода узнавать “наиболее подходящую” функцию объясняется глубокими (адаптивными) свойствами согласованного фильтра по сравнению со всеми прочими фильтрами, которые могли бы быть применены для исследования данного временного ряда. 4.3. О прогнозировании
Располагая суммарной порождающей функцией, можно провести расчет прогнозных значений временного ряда (при t = N + 1,…, N + P). Это известный метод экстраполяции, основанный на гипотезе тождественности порождающих функций на отрезках анализа и прогноза: Xˆ (t ) (прогнозные значения ряда) ≡ Xˆ (t ), t = N + 1,..., N + P. (4.3.1)
Другая возможность прогнозирования временных рядов, правда всего лишь на один, следующий за интервалом анализа момент времени t = N + 1, связана с применением согласованных фильтров (4.2.15). Согласованные фильтры также хорошо приспособлены к анализу динамики детерминированной составляющей временного ряда как и явные (суммарные порождающие) функции времени, но в отличие от последних более просты для оценки параметров. Единственное в чем они уступают суммарным порождающим функциям – это ограниченная (единичная) длина их интервала прогноза. Чтобы устранить данный недостаток согласованных фильтров, предлагается модифицировать их вид r
Xˆ 0 (t + p, r ) = ∑ a pi X (t − i ), p = 1, 2, ...; Er = 1, 2, ..., i =1
(4.3.2)
t = r + p + 1,..., N , и использовать для оценки параметров (при каждом фиксированном p) компромисс “точность-надежность”. 192
Ввиду того, что длина интервала решения с ростом p каждый раз уменьшается, статистическая надежность оценок коэффициентов a pi ухудшается. Это достаточно скоро приводит к прекращению процесса оценивания “точных и надежных” фильтров, чем и устанавливается естественное ограничение на максимально допустимую длину интервала прогноза pmax . Применение (в процессе анализа временного ряда) компромисса “точность – надежность” для оценки согласованного фильтра Xˆ 0 (t , k ) дает оценку сверху для числа параметров модифицированных фильтров r ≤ k. Отметим, что с точки зрения процедуры оценивания данный метод прогноза временных рядов представляет собой непосредственное приложение схемы компромисса “точность – надежность”, изложенной в I разделе.
193
ЗАКЛЮЧЕНИЕ
Приступая к завершающей оценке свойств и возможностей представленных в работе эконометрических моделей и методов, прежде всего обсудим различия в характере и объеме знаний об экономических процессах относительно знаний об естественнонаучных (прежде всего – физических) процессах. С этой целью напомним историю постановки и решения задач регрессионного анализа, осуществленных Гауссом в начале XIX века. В это время основным источником новых идей и методов в математике была физика и ее наиболее развитая часть – механика. Теоретические успехи ученых сопровождались совершенствованием методики экспериментальной работы и необходимых для этого измерительных приборов. Имея в виду, что основополагающей регрессионной моделью физических процессов является таковая для временных рядов наблюдений, проиллюстрируем схему ее порожднния на примере установленного Галилеем закона падения тел под воздействием силы земного притяжения g Xˆ (t ) = X 0 − ν 0t − t 2 , (З.1) 2 где X 0 – начальная высота, ν 0 – начальная скорость, g = = 9,81 м/с2 – постоянная величина ускорения падающего тела. Используя то обстоятельство, что закон падения известен как по смыслу его параметров, так и по форме зависимости от времени (это полином 2-й степени a0 + a1t + a2t 2 ), возникла возможность сформулировать следующую (новую) задачу: опираясь на ряд наблюдений за изменением высоты X(t), t = 1, N , требуется восстановить закон падения Xˆ (t , a , a , a ) как результат статистической 0
1
2
оценки параметров следующего уравнения регрессии X t = a0 ⋅ 1 + a1t + a2t 2 + δt , t = 1, N ,
где δt – случайная ошибка наблюдения. 194
(З.2)
Совокупность функций времени 1, t, t2, называемых факторами регрессии, с очевидностью говорит о их неслучайности и линейной независимости. Что касается случайной ошибки δt , то в отношении нее Гауссом были установлены свойства, общие для измерений с помощью используемых в физике приборов. А именно: 1. При обязательной предварительной юстировке приборов математические ожидания случайных ошибок наблюдения будут равны нулю; 2. При правильно выбранной величине цены деления шкалы приборов ∆ дисперсия ошибки σδ2 будет определенным образом связана с нею, например, при равномерном распределении δt на 2
отрезке ∆ имеет место следующая связь – σδ2 = Δ , откуда при 12 2 ∆ = const имеем и σδ = const; 3. При честном проведении наблюдений, последние будут независимыми случайными величинами, а соответствующие им ошибки δt – неавтокаррелированными (r = 0). Указанные три свойства, установленные Гауссом для физических наблюдений, получили в математической статистике статус основополагающей теории случайных ошибок уравнений регрессии δt в виде так называемого белого шума. Опираясь на знания о свойствах уравнений регрессии, подобные указанным для уравнения (З.2), Гаусс доказал следующую теорему (ныне это теорема Гаусса – Маркова): если в линейной (относительно параметров ai) регрессии ее факторы неслучайны и линейно-независимы, а ошибка δt – белый шум, то метод наименьших квадратов позволяет получить несмещенные и эффективные линейные оценки параметров ai. В случае уравнения регрессии (З.2) это означает, что математические ожидания оценок параметров aˆi будут равны объективно g существующей истине, т.е. maˆ0 = X 0 , maˆ1 = −ν 0 , maˆ2 = − , а их 2 2 дисперсии σ (aˆi ) = min (среди всех прочих возможных дисперсий линейных оценок). 195
В таком виде метод регрессионного анализа с сопутствующими ему теорией ошибок наблюдения и методом наименьших квадратов (обоснованным тем же Гауссом в 1803 г.) вошел в современную математическую статистику и был воспринят всеми учеными не только как строго обоснованный, но и как универсальный (по отношению к различным прикладным дисциплинам) метод. Но является ли он таковым для интересующих нас экономических процессов, может ли он быть для них столь же адекватным, как и для естественнонаучных (физических) процессов? С этой целью укажем на следующие принципиальные различия в характере и объеме знаний о временных рядах наблюдений экономических и естественнонаучных процессов. Первое различие обнаруживается при выборе обоснованной длины рядов наблюдений X(t), t = 1, N . Так для временных рядов естественнонаучных процессов, подобных ряду наблюдений за падающим телом, с неизменным во времени (по форме и смыслу) законом Xˆ (t , ai ), предпочтительнее длинные ряды наблюдений, ибо с ростом числа наблюдений уменьшаются дисперсии оценок параметров aˆi , что отвечает целям регрессионного анализа временных рядов. В то же время, для экономических процессов выбор длины рядов наблюдений X(t), t = 1, N , – это путь компромисса между двумя противоречивыми требованиями. Первое состоит в необходимости повышать степень однородности статистических данных об исследуемом процессе (для России это отвечает отрезку времени не ранее, чем с 1992 г. или даже – с 1999 г.), что означает предпочтительность исследования коротких рядов. Второе – прямо противоположное, исходящее из указанного статистического свойства уменьшения дисперсий оценок параметров уравнений регрессии этих рядов с увеличением длины рядов. Разрешение этого компромисса (возможно, не одноразовое) позволяет заключить, что в основном экономические ряды наблюдений должны быть короткими (поэтому применять к ним, как это имеет место в западной эконометрии, асимптотические методы неправомерно). Второе различие связано с самим понятием “наблюдение” применительно к экономическим и естественнонаучным процессам. 196
Обратимся с этой целью к временному ряду ВВП (внутреннему валовому продукту) на отрезке его однородности (например, за 1992–2008 гг.). Процесс его формирования в Росстате требует от соответствующих специалистов (экономистов-статистиков) знаний о составляющей данный показатель многомиллионной номенклатуре продуктов, о ее изменении за исследуемый отрезок времени, об изменениях в технологиях их производства, о различиях в динамике цен в исследуемое время. Понятно, только согласованная работа и высокая квалификация специалистов, формирующих этот показатель, могут обеспечить научно обоснованное элиминирование указанных изменений во времени по составу, технологиям производства и ценам продуктов в агрегированном показателе, чтобы считать представленный в статистической отчетности временной ряд ВВП “сопоставимым” для всех t на отрезке t = 1, N . Именно такие временные ряды фигурируют в качестве исходной численной информации для целей регрессионного анализа экономических процессов. Указанный процесс формирования сопоставимых рядов совсем не похож на наблюдения за высотой падающего тела или на регистрацию динамики напряжения тока в некоторой электрической цепи и т.п. фиксаций показаний соответствующих физических приборов за исследуемый период времени X(t), t = 1, N . Поэтому в случае экономических процессов мы имеем дело с иными сущностями – сложным образом сформированными (сопоставимыми по t) временными рядами. Понятно также, что для них не существует и каких-либо знаний об ошибках наблюдения, которые в математической статистике и в западной эконометрике фигурируют как в самом понятии случайной ошибки наблюдения δt, так и в различного рода представлениях о ее важнейших статистических характеристиках mδt , σ2r и r1 (чаще всего отвечающих понятию белого шума). Третье, не менее принципиальное различие, относится к проблеме знаний теоретического характера – о виде определенной формулы с известными “факторами” и неизвестными (подлежащими оценке) параметрами, что имело место в формуле (З.2). Совершенно иная ситуация имеет место в случае экономических процессов, а именно – полное отсутствие теоретических знаний в 197
виде научно установленных законов – формул. Более того, соответствующей истины мы не только не знаем, но ее и не существует как таковой. Интересно, что в западной эконометрике применяется процедура проверки оценок параметров регрессии aˆi на предмет их истинности (близости оценок к их истинным значениям m aˆi ) с помощью теста t – Стьюдента. Для этого предварительно устанавливается (вопреки сказанному ранее), что ошибка δt – нормально распределенный белый шум. Тогда, используя таблицу зависимости показателя tα , отвечающего выбранному уровню доверия 1 – α (например, равному 0,95), находят соответствующий “доверительный интервал aˆi ± tα σ(aˆi ) ”, накрывающий с вероятностью 1 – α истинную величину параметра в виде m aˆi . Указанная процедура с необходимыми для ее реализации свойствами ошибки δt полностью согласуется с рассмотренной ранее физической регрессией (З.2) (если дополнить ее знанием о нормальности δt ). В этом случае истинные значения параметров отвечают условию несмещенности их оценок: m aˆ0 = X 0 , m aˆ1 = V0 , g m aˆ2 = − . Последние (истинные значения) могут быть действи2 тельно накрыты указанными доверительными интервалами. Однако накрывать истину можно только тогда, когда она существует. Существует же она только для естественнонаучных процессов (с объективными законами Xˆ (t , ai ) вида (З.1)). Поскольку таковых для экономических процессов нет, то нет и отвечающих им истин в виде m aˆi , а следовательно, и сама проверка по t – Стьюдента – это чисто виртуальная операция (нельзя накрыть то, что не существует). Мы же ставим своей целью разработку регрессионной теории, адекватной свойствам именно экономических, а не каких-либо иных процессов. Как эта цель была реализована – подробно раскрывается в предлагаемой книге, здесь же мы ограничимся подведением итогов. Разработка соответствующей экономическим процессам регрессионной теории основана на следующих принципах. 198
Первый принцип фактически уже обсужден, он заключается в требовании исследовать однородные экономические процессы, которым отвечают короткие временные ряды. Второй принцип – принцип инвариантности (независимости) численных результатов анализа и прогноза, получаемых на основе регрессионных моделей временных рядов, от сдвига этих рядов по оси времени. Он отвечает естественным требованиям экономистов, использующих различную хронологию (христианскую, мусульманскую, буддийскую и т.д.) для расположения одного и того же временного ряда на оси времени, получать одни и те же численные результаты регрессионного анализа и прогноза независимо от его положения. Для обеспечения этого принципа необходимо использовать инвариантные по сдвигу по аргументу t следующие три класса функций: степенные полиномы Pk (t ) = A0 tai t + ...ak t k , линейные комбиk
нации показательных функций
∑ ai λ ti
и синусов и косиносов оди-
i =1
k
наковых частот
∑ ai sin ωi t + bi cos ωi t. i =1
Третий принцип: предпочтительный путь развития теории – это путь от простого к сложному. Он определяет выбор в качестве начальных регрессионных моделей – полиномиальные модели. Их линейность по параметрам ai делает адекватным методом оценки метод наименьших квадратов. В то же время, оценке подлежит и сама степень полинома. Это делает необходимым постадийное применение МНК для возрастающих степеней полиномов с использованием следующего (четвертого) принципа – компромисса “точность – надежность”. Соответствующие ему показатели – “точность” и “надежность” отвечают статистическим свойствам реализуемой в рамках компромисса наилучшей полиномиальной регрессионной модели экономического временного ряда. В разделе, посвященном многофакторным регрессионным моделям и методам оценки экономических процессов, в качестве методологической основы приняты два следующих принципа. Первый – это принцип согласования экономических и статистических 199
знаний, необходимых для построения корректных (согласованных и поэтому возможных) моделей. Второй принцип – согласование математико-статистических свойств моделей отдельных временных рядов и связывающего их уравнения множественной регрессии. Необходимыми условиями указанного согласования являются: немультиколлинеарность факторов и мультиколлинеарность совокупности факторов и функции уравнения множественной регрессии. Тем самым, обеспечивается единственность разложения функции по базису в рамках согласованной (возможной) регрессионной модели. Особый интерес в этом разделе вызывает задача оценки априори неизвестного закона распределения вероятностей лагов или, иначе, оценки параметров специфической регрессии с априори неизвестным числом факторов в виде запаздывающих значений одного и того же временного ряда. Ее углубленное исследование, с переходом к новой математико статистической форме уравнения, позволило во всей полноте использовать конструктивные возможности указанных двух принципов и получить решение общей проблемы распределенных лагов. В западной эконометрике такое (общее) решение сочли невозможным и заменили его так называемыми частными решениями. Последние, как показано в работе, приводят к смещению математического ожидания и дисперсии искомого (априори неизвестного) закона распределения вероятностей лагов. Важным расширением возможностей регрессионных моделей на временных рядах является переход к пространственно-временному описанию процессов, основанному на матричном методе анализа и прогноза, более совершенном, чем известный метод RAS. Его основное назначение – использование в динамических (с переменными матрицами коэффициентов прямых затрат) моделей межотраслевого баланса. Что и было осуществлено в работе автора и сотрудников возглавляемой им лаборатории “Эконометрические межотраслевые модели целевого прогнозирования экономики” (М.: ВНИИСИ, 1987). Более высокая степень экономической адекватности указанного метода по сравнению с известными (с неизвестными во времени коэффициентами прямых затрат) делает эту работу актуальной и в настоящее время. 200
В третьем разделе книги осуществлена не имеющая аналогов в эконометрии идея разработки целевого формирования временных рядов инвестиционного процесса на различных уровнях агрегирования. Это позволило создать наиболее полную систему динамических структурно-балансовых уравнений указанного процесса и использовать ее для целей его системного анализа и прогноза. Характерной особенностью разработанных в первых трех разделах книги моделей и методов была их линейность или простая возможность сводимости к таковой. В то же время, обращение к проблеме исследования временных рядов, модели которых основаны на всей совокупности инвариантных по сдвигу по аргументу функций, сделало необходимым нетривиальное развитие методов оценки входящих в модели нелинейных параметров. К ним относятся находящиеся под знаком показательных функций их основания λi и частоты ωi в функциях синуса и косинуса. В основу указанного (нелинейного по своей сути) метода был положен принцип одновременной оценки всех возможных в рамках априори неизвестной структуры компонент временного ряда: тренда, “расположенного” в исследуемой спектральной полосе частот (0 ≤ ω ≤ π) на нулевой частоте, и циклических компонент – с частотами ωi , лежащими внутри указанной полосы. Способность метода одновременно оценивать все компоненты временного ряда позволила не только оценить все искомые (линейные и нелинейные) параметры, но и определить их статистическую надежность. Последнее недоступно всем известным методам оценки параметров временных рядов сложной структуры (требующим предварительного исключения трендов). Следует отметить, что совместная оценка параметров временных рядов с априори неизвестной структурой производится на основе двух форм их представления – в виде линейной зависимой комбинации запаздывающих (через сдвиг по t) значений временного ряда и в явной форме решения оцененного уравнения в конечных разностях. При этом неизвестными параметрами явной формы являются одни линейные коэффициенты ci при уже оцененных нелинейных λi и ωi в показательных и тригонометрических функциях. Указанная (инструментально простая, но нетривиальная по сути) процедура оценки позволяет ограничиться методом наимень201
ших квадратов, но применяемым дважды – последовательно для каждой из указанных двух форм представления временного ряда. Во всех задачах синтеза регрессионных моделей и методов оценки их параметров автор исходил из системного (органического) единства имеющихся в отношении исследуемых экономических объектов численных и теоретических знаний. Аналогичный системный подход к обоснованию метода постановки и решения сложных задач из теории чисел был реализован автором в публикациях 1996–2007 гг. Их основные итоги представлены в работе “Метод целевого синтеза как инструмент постановки и решения задач о существовании из теории чисел”, М.: МИФИ, 2007. Занимаясь проблемами эконометрии и теории чисел, автор ознакомился с большим числом конкретных и методологических работ как в данных областях знания, так и выходящих за их пределы. С особым интересом автор изучал принципы, положенные в их основу. Среди этих принципов всегда хотелось отыскать самый главный, и автор считает, что нашел его в словах И. Ньютона: “Так должно поступать, чтобы доводы наведения1 не уничтожались предположениями”. К сожалению, этот принцип столь же замечателен, как и трудновыполним на практике, если следовать ему в точности. Без гипотез, восполняющих недостаточность численных и теоретических знаний об объектах исследования, не обошлось и в данной работе. Единственное, что преследовал при этом автор – это свести их к минимуму, а когда был вынужден вводить, то старался найти для них по возможности подходящие формы и место. Принятие гипотез, убедительных как с позиций экономического содержания исследуемых объектов, так и с точки зрения единства математического (абстрактно-логического) и конкретно-численного их познания, как раз и представляет собой конструктивную реализацию указанного методологического принципа И. Ньютона в рассматриваемых здесь регрессионных моделях и методах оценки параметров и структуры экономических процессов. Исключительная роль физиков в развитии различных областей знания имеет фундаментальное основание, заключающееся в нако1
Наведение – синоним индукции. 202
пленной сумме теоретико-методологических и опытных результатов исследований в такой сверхбольшой и сверхсложной системе как окружающая нас природа. Поэтому неудивительно, что в разработке методов анализа и прогнозирования экономических процессов, также относящихся к подобного рода системам, заметную роль играет Экономикоаналитический институт МИФИ, профессорско-преподавательский коллектив которого представлен учеными с базовым образованием в области физики. Среди опубликованных ими трудов по моделям и методам исследования экономических процессов отметим наиболее близкие к эконометрике работы – “Эконофизика”, под редакцией профессора, доктора физико-математических наук В.В. Харитонова, и “Математические методы обработки неопределенных данных”, авторами которой являются профессор, доктор физико-математических наук А.В. Крянев и доцент, кандидат экономических наук Г.В. Лукин. Что касается автора данной книги – профессора, доктора экономических наук Б.В. Седелева, то после окончания механикоматематического факультета МГУ им. М.В. Ломоносова он занимался исследовательской работой в близкой к физике области знания – случайных процессов в радиоэлектронике. После чего долгие годы работал заведующим лабораторией эконометрических исследований в одном из лучших экономических институтов страны – в Научно-исследовательском экономическом институте Госплана СССР. Именно там были заложены новые, более глубокие и адекватные реальным экономическим процессам методы их регрессионного анализа и прогнозирования.
203
ПРИЛОЖЕНИЕ
В данном приложении представлены решенные на семинарах по курсу эконометрики задачи в виде обязательного отчета студентов четвертого курса дневного отделения ЭАИ. Тема 1. Идея регрессионного анализа. Вклад Гаусса
Галилео Галилей исследовал падение тел в пустоте. 34 года работы завершились выводом закона падения тела под действием силы земного притяжения в виде полинома второй степени: g xˆ(t ) = x0 − ν 0t − t 2 . 2 Гаусс переформулировал задачу: как найти вид закона и его параметры по наблюдениям? В результате была создана теория линейного оценивания параметров регрессии: xt = a0 + a1t + a2t 2 + δt , t = 1, N .
Линейное оценивание в таком случае проводится методом наименьших квадратов (МНК) на основе соответствующей теоремы (Гаусса–Маркова) Гаусс впервые в истории создал теорию ошибок. Ошибки модели δl (t ) называются белым шумом, если они удовлетворяют следующим свойствам: 1. M [δ (t )] = o (измерительный прибор хорошо юстирован); 2. σδ2 = const, что имеет место при правильно выбранной цене деления шкалы прибора Δ = const и равномерном распределении Δ ошибки наблюдения в пределах ± ; 2 3. Измерения независимы r1 = 0. Оценка называется несмещенной, если математическое ожидание оценки равно истинному значению величины, установленному законом распределения. 204
Оценка называется эффективной, если она имеет минимальную возможную дисперсию. Тема 2. Принцип инвариантности в анализе и прогнозировании экономических временных рядов. Функции инвариантные по сдвигу по аргументу
Экономические временные ряды обладают интересным свойством: у них нет преимущественного (естественного) начала отсчета времени. Рассматривая в качестве желательной теорию, обеспечивающую независимость численных результатов анализа и прогноза временных рядов от их положения по оси времени (t), вводим принцип инвариантности. Принцип инвариантности: разработанная профессором Б.В. Седелевым теория эконометрики обеспечивает независимость численных результатов анализа и прогноза от сдвига рядов по оси времени. Для реализации этого принципа в ходе анализам используются только инвариантные функции. Определение Функция одного вещественного аргумента является инвариантной по отношению к сдвигу аргумента, если при замене t → t + c она остается функцией того же вида и изменяет лишь свои коэффициенты. Известны три класса инвариантных по сдвигу по аргументу функций: 1. Степенные полиномы l
Pl (t) = a0 + a1 ⋅ t + ... + al ⋅ t l = ∑ ai ⋅ t i . i =0
Действительно, Pl (t + c) = a0 + a1 ⋅ (t + c) + ... + al −1 ⋅ (t + c) l −1 +... + al ⋅ (t + c)l = = a0′ + a1′ ⋅ t + ... + al′−1 ⋅ t l −1 + al ⋅ t l .
Единственным подлинным инвариантом среди всех коэффициентов является старший al . 205
2. Линейная комбинация показательных функций n
P (t ) = ∑ ai ⋅ bit , bi > 0. i =1
Действительно, n
n
n
i =1
i =1
i =1
( )
n
Pn (t + c) = ∑ ai bit + c = ∑ ai bit bic = ∑ ai bic bit = ∑ ai′ bit . i =1
В данном случае инвариантом является основания показательных функций bi , i = 1, n. 3. Линейная комбинация синуса и косинуса одинаковых частот: n
P (t ) = ∑ ai cos ωi t + bi sin ωi t . i =1
Действительно, n
P (t + c) = ∑ ai cos ωi (t + c) + bi sin ωi (t + c) = i =1
n
= ∑ ai (cos ωi t ⋅ cos ωi c − sin ωi t ⋅ sin ωi c) + i =1
+bi (sin ωi t ⋅ cos ωi c + sin ωi c ⋅ cos ωi t ) = n
= ∑ (ai cos ωi c + bi sin ωi c) ⋅ cos ωi t + (− ai sin ωi c + bi cos ωi c) ⋅ sin ωi t = i =1
n
= ∑ ai′ cos ωi t + bi′ sin ωi t. i =1
Инвариантными по сдвигу являются также комбинации указанных функций. Наиболее исследованными и удобными для анализа являются линейные функции. Из трех классов инвариантных по сдвигу по аргументу функций линейными относительно коэффициентов являются только степенные полиномы. Итак, в рамках данного курса будет использовать только степенные полиномы невысоких степеней. Последнее обусловлено тем, что рост степени аппроксимирующей функции дает более точное соответствие ряду в узлах информации, но: 206
• очень плохо описывает ряд между двумя соседними узлами информации; • при степенях выше 6 сказывается плохая обусловленность матрицы. Примеры В качестве аппроксимирующей функции взять: 1. Xˆ (t ) = a0 + a1 t . 2. Xˆ (t ) = a + a ln t . 0
1
3. Xˆ (t ) = a0 + a1t . Решение 1. Xˆ (t ) = a0 + a1 t . 7
2
МНК: min ∑ ⎡⎣a0 + a1 t − X (t )⎤⎦ . a0 , a1
t =1 7
Обозначим
∑ ⎡⎣a0 + a1 t =1
2
t − X (t )⎤⎦ = f (a0 , a1 ) .
Тогда уравнения в нормальной форме будут иметь вид: 6 ⎧ ∂f = 2∑ ⎣⎡a0 + a1 t − X (t )⎦⎤ ⋅ 1 = 0, ⎪ ⎪∂a0 t =1 ⎨ 6 ⎪ ∂f = 2 ⎡a + a t − X (t )⎤ ⋅ t = 0. ∑ ⎣ 0 1 ⎦ ⎪ ⎩∂a1 t =1 Уравнения в каноническом виде: 6 ⎧⎛ 6 ⎞ ⎛ 6 ⎞ ⎪⎜ ∑1⎟ a0 + ⎜ ∑ t ⎟ a1 = ∑ X (t ), ⎪⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎨ 6 6 6 ⎞ ⎛ ⎞ ⎪⎛ t a t a X (t ) ⋅ t . + = ⎜ ⎟ ⎜ ⎟ ∑ ∑ ∑ 0 1 ⎪ ⎝ t =1 ⎠ t =1 ⎩⎝ t =1 ⎠
⎧6 ⋅ a 0 + 10,832 ⋅ a1 = 33 ⎨ ⎩10,832 ⋅ a 0 + 21 ⋅ a1 = 67,837 207
Решая систему методом Крамера, получим: Δ=
6,000
10,832
10,832 21,000 33, 000 10,832
Δ0 =
67,837 21,000
Δ1 =
6,000
33,000
10,832 67,837
a0 = a1 =
= 8, 668 . = −41,810 . = 49,566 .
Δ0 = −4,823 . Δ Δ1 = 5,718 . Δ
Таким образом, Xˆ (t ) = −4,823 + 5,718 t , t = 1, 6,9 . Аналогичные рассуждения проводим для t = 7,12,15 . В указанных уравнениях меняются только пределы суммирования. Уравнения в каноническом виде: 12 ⎧ ⎛ 12 ⎞ ⎛ 12 ⎞ 1 a + t a = ⎪ ⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ∑ X (t ), ⎪ ⎝ t =7 ⎠ ⎝ t =7 ⎠ t =7 ⎨ 12 12 12 ⎞ ⎛ ⎞ ⎪⎛ + = t a t a ⎜ ⎟ ⎜ ⎟ ∑ 1 ∑ X (t ) ⋅ t . 0 ⎪ ∑ ⎝ t =7 ⎠ ⎩ ⎝ t =7 ⎠ t =7
⎧ 6 ⋅ a0 + 18, 417 ⋅ a1 = 33, ⎨ ⎩ 18, 417 ⋅ a0 + 57 ⋅ a1 = 105,977.
Решая систему методом Крамера, получим: Δ= Δ0 =
6,000
18, 417
18, 417 57, 000 33,000
18, 417
105,977 57,000 208
= 2,814 . = −70,778 .
Δ1 =
6, 000
33, 000
18, 417 105,977
a0 =
= 28,101 .
Δ0 = −25,152 . Δ
a1 =
Δ1 = 9,986 . Δ
Таким образом, Xˆ (t ) = −25,152 + 9,986 t , t = 7,12,15 . t
X(t)
Xˆ (t )
t
X(t)
Xˆ (t )
1 2 3 4 5 6 :
1 3 5 7 8 9 :
0,90 3,26 5,08 6,61 7,96 9,18 :
7 8 9 10 11 12 :
1 3 5 7 8 9 :
1,27 3,09 4,81 6,43 7,97 9,44 :
12,33
15
9 1. Xˆ (t ) = a0 + a1 ln t. 6
МНК: min ∑ [ a0 + a1 ln t − X (t ) ] . a0 , a1
2
t =1
6
Обозначим:
∑ [ a0 + a1 ln t − X (t ) ]
2
t =1
= f (a0 , a1 ) .
Тогда уравнения в нормальной форме будут иметь вид: 6 ⎧ ∂f = 2∑ [ a0 + a1 ln t − X (t ) ] ⋅ 1 = 0, ⎪ ⎪ ∂a0 t =1 ⎨ 6 ⎪ ∂f = 2 ∑ [ a0 + a1 ln t − X (t ) ] ⋅ ln t = 0. ⎪ ∂a ⎩ 1 t =1
209
13,52
Уравнения в каноническом виде: 6 ⎧⎛ 6 ⎞ ⎛ 6 ⎞ + = 1 a ln t a X (t ), ⎜ ⎟ ⎜ ⎟ ∑ ⎪ ∑ 0 ∑ 1 t =1 ⎝ t =1 ⎠ ⎪⎝ t =1 ⎠ ⎨ 6 6 6 ⎪⎛⎜ ln t ⎞⎟a + ⎛⎜ ln 2 t ⎞⎟a = X (t ) ⋅ ln t. ∑ ⎠1 ∑ 0 ⎪⎝ ∑ t =1 ⎠ ⎝ t =1 ⎩ t =1
⎧6 ⋅ a0 + 6,579 ⋅ a1 = 33 ⎨ ⎩6,579 ⋅ a0 + 9,410 ⋅ a1 = 46,278 Решая систему методом Крамера, получим: Δ= Δ0 = Δ1 =
6,000 6,579 6,579 9, 410
= 13,177 .
33, 000 6,579 46, 278 9, 410 6,000 33,000 6,579 46, 278
= 6, 067 . = 60,561 .
a0 =
Δ0 = 0, 460 . Δ
a1 =
Δ1 = 4,596 . Δ
Таким образом, Xˆ (t ) = 0, 460 + 4,596ln t , t = 1, 6,9 . Аналогично для t = 7,12,15 . Уравнения в нормальной форме будут иметь вид: 12 ⎧ ∂f = 2∑ [ a0 + a1 ln t − X (t ) ] ⋅ 1 = 0, ⎪ ⎪ ∂a0 t =7 ⎨ 12 ⎪ ∂f = 2 ∑ [ a0 + a1 ln t − X (t ) ] ⋅ ln t = 0. ⎪ ∂a ⎩ 1 t =7
210
Уравнения в каноническом виде: 12 ⎧ ⎛ 12 ⎞ ⎛ 12 ⎞ 1 a + ln t a = ⎜ ⎟ ⎜ ⎟ ⎪ ∑ ∑ 0 1 ∑ X (t ), ⎪ ⎝ t =7 ⎠ ⎝ t =7 ⎠ t =7 ⎨ 12 12 12 ⎪ ⎛ ln t ⎞ a + ⎛ ln 2 t ⎞ a = X (t ) ⋅ ln t. ⎜ ⎟ ⎜ ⎟ ∑ ∑ ∑ 0 1 ⎪ ⎠ ⎝ t =7 ⎠ ⎩ ⎝ t =7 t =7 ⎧ 6 ⋅ a0 + 13, 408 ⋅ a1 = 33, ⎨ ⎩ 13, 408 ⋅ a0 + 30,165 ⋅ a1 = 76,836.
Решая систему методом Крамера, получим: Δ= Δ0 = Δ1 =
6,000
13, 408
= 1, 216 .
13, 408 30,165 33,000 13, 408 76,836 30,165 6,000
= −34, 772 .
33,000
= 18,552 .
13, 408 76,836
Δ0 = −28,595 . Δ Δ a1 = 1 = 15, 257 . Δ ˆ X (t ) = −28,595 + 15, 257 ln t , t = 7,12,15 . Заносим все полученные данные в таблицу. a0 =
t
X(t)
Xˆ (t )
t
X(t)
1 2 3 4 5 6 : 9
1 3 5 7 8 9 :
0,46 3,65 5,51 6,83 7,86 8,69 : 10,56
7 8 9 10 11 12 : 15
1 3 5 7 8 9 :
211
ˆˆ((tt)) XX 1,09 3,13 4,93 6,54 7,99 9,32 : 12,72
Уже по первому примеру для t = 1 и для t = 7 соответственно относительная ошибка расчетов составила около 40 %. Это недопустимая погрешность для эконометрических исследований. В следующем примере рассмотрим функцию, инвариантную по сдвигу по времени. 3. Xˆ (t ) = a0 + a1t . 6
∑ [ a0 + a1t − X (t ) ] a0 , a1
2
МНК: min
t =1 6
Обозначим:
.
∑ [ a0 + a1t − X (t ) ]
2
t =1
= f (a0 , a1 ) .
Тогда уравнения в нормальной форме будут иметь вид: 6 ⎧ ∂f = 2 ∑ [ a0 + a1t − X (t ) ] ⋅1 = 0, ⎪ ⎪ ∂a0 t =1 ⎨ 6 ⎪ ∂f = 2 ∑ [ a0 + a1t − X (t ) ] ⋅ t = 0. ⎪ ∂a ⎩ 1 t =1 Уравнения в каноническом виде: 6 ⎧⎛ 6 ⎞ ⎛ 6 ⎞ 1 a + t a = ⎜ ⎟ ⎜ ⎟ ⎪ ∑ ∑ 1 ∑ X (t ), 0 ⎪ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎨ 6 6 6 ⎪ ⎛ t ⎞ a + ⎛ t 2 ⎞ a = X (t ) ⋅ t . ⎜ ⎟ ⎜ ⎟ ∑ ∑ ∑ 0 1 ⎪ ⎝ t =1 ⎠ ⎩ ⎝ t =1 ⎠ t =1 6 ⋅ a + 21 ⋅ a = 33, ⎧ 0 1 ⎨ ⋅ + ⋅ 21 a 91 a ⎩ 0 1 = 144. Решая систему методом Крамера, получим: Δ= Δ0 = Δ1 =
6,000
21,000
21,000 91,000 33,000
21,000
144, 000 91,000 6, 000
33, 000
21, 000 144,000 212
= 105,000 . = −21,000 . = 171,000 .
Δ0 = −0, 200 . Δ Δ a1 = 1 = 1,629 . Δ ˆ Таким образом, X (t ) = −0, 2 + 1, 629t , t = 1, 6,9 . a0 =
Аналогично для t = 7,12,15 . Уравнения в нормальной форме будут иметь вид: 12 ⎧ ∂f = 2 [ a0 + a1t − X (t ) ] ⋅ 1 = 0, ∑ ⎪ ⎪ ∂a0 t =7 ⎨ 12 ⎪ ∂f = 2 [ a0 + a1t − X (t ) ] ⋅ t = 0. ∑ ⎪ ∂a ⎩ 1 t =7 Уравнения в каноническом виде: 12 ⎧ ⎛ 12 ⎞ ⎛ 12 ⎞ ⎪ ⎜ ∑1 ⎟ a0 + ⎜ ∑ t ⎟ a1 = ∑ X (t ), ⎪ ⎝ t =7 ⎠ ⎝ t =7 ⎠ t =7 ⎨ 12 12 12 ⎛ ⎞ ⎛ ⎞ ⎪ 2 + = t a t a ⎪ ⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ∑ X (t ) ⋅ t . ⎝ t =7 ⎠ ⎩ ⎝ t =7 ⎠ t =7 ⎧ 6 ⋅ a0 + 57 ⋅ a1 = 33 ⎨ ⎩ 57 ⋅ a0 + 30,165 ⋅ a1 = 342 Решая систему методом Крамера, получим: 6,000
Δ= Δ0 =
57,000
57,000 559,000 33,000
57,000
342,000 559,000
Δ1 =
6,000
33,000
57,000 342,000
= 105,000 . = −1047, 000 . = 171,000 .
Δ0 = −9,971 . Δ Δ a1 = 1 = 1,629 . Δ
a0 =
213
Xˆ (t ) = −9,971 + 1,629t , t = 7,12,15 .
t
X(t)
Xˆ (t )
t
X(t)
ˆˆ((tt)) XX
1 2 3 4 5 6 :
1 3 5 7 8 9 :
1,43 3,06 4,69 6,32 7,95 9,57 :
7 8 9 10 11 12 :
1 3 5 7 8 9 :
1,43 3,06 4,69 6,32 7,95 9,58 :
14,46
15
9
14,46
Таким образом, только полином из рассмотренных функций обладает свойством инвариантности численных результатов анализа и прогноза от сдвига по оси времени. Тема 3. Анализ и прогнозирование временных рядов с полиномиальными трендами. Метод компромисса “точность-надежность”
Постановка задачи Имеется исходный временной ряд X(t), t = 1, N . Необходимо построить наиболее точную и надежную функцию регрессии выбранного вида: xt = a0 + a1 ⋅ t + ... + al ⋅ t l + δt , т. е. нужно ai и l.
Как решает такую задачу Запад? По МНК находят оценки коэффициентов регрессии, назначают уровень значимости и говорят, что с такой-то вероятностью доверительный интервал “накрывает” истинное значение коэффициента регрессии. Но для экономических процессов, как уже говорилось в теме 1, нет закона, нет истинных значений оценок. Не понятно, как можно накрыть то, чего вообще не существует, с какой бы то ни было вероятностью. Таким 214
образом, западные методики приводят только к удалению от значения на сколь угодно большую величину. Методология Б.В. Седелева идет совершенно другим путем. А именно: в качестве аппроксимирующих функций рассматриваются только функции определенного вида (степенные полиномы) – объяснение в теме 1. Временной ряд разбивается на полином и невязки: X (t ) = Pl (t ) + δl (t ) Невязками называют рассогласование между теоретическими значениями и наблюдаемыми ( δl (t ) = X (t ) − Pl (t ) ). МНК применяется последовательно для разбиений на полиномы различных степеней и невязки. Далее проводится исследование невязок по триаде: 1. Исследование графика динамики невязок δl (t ) . Если график невязок имеет нулевой тренд, то на невязки можно смотреть как на реализацию белого шума. При этом число пересечений графика δ l (t ) с осью t должно составлять 5-6 раз. 2. Построение поля автокорреляции. Если с ростом предшествующего значения последующее имеет в среднем тенденцию к росту (рис. 1) или падению, то имеет место автокорреляция. При этом в данной задаче тренд поля автокорреляции обязательно проходит через нуль. Это следует из первого нормального уравнения МНК: N N ∂f = 2∑ ⎡⎣ a0 + a1t + ... + al t l − X (t ) ⎤⎦ = 2∑ δl (t ) = 0 ∂a0 t =1 t =1 1 N ∑ δl (t ) = 0. N t =1
(необходимое условие минимума), т. е. δl (t ) = 3. Коэффициент автокорреляции N
r1 (l ) =
∑ δl (t − 1) ⋅ δl (t )
t =2 N
N
∑ δl2 (t − 1) ⋅ ∑ δl2 (t )
t =2
t =2
215
.
В идеальной ситуации хорошо было бы, чтобы r1(l)=0 для признания невязок реализацией белого шума. Но на практике это невозможно. Поэтому для признания невязок реализацией белого шума достаточно, чтобы r1 (l ) ≤ r0 , из практики r0 = 0,3. Разбиение временного ряда проводится до тех пор, пока на этапе разбиения исходного ряда на полином степени l0 и невязки δl0 (t ) исследование по указанной триаде не даст оснований смотреть на невязки δl0 (t ) как на практическую реализацию белого шума. Тогда
в
отношении
разбиения
( l0 ≤ l ≤ l1 )
l
{
l
+ aˆ1t + ... + aˆl t + δl (t ) , где факторы 1, t ,..., t
n
xt = aˆ0 +
} линейно независимы,
а невязки δl (t ) можно рассматривать как реализацию белого шума, можно применить теорему Маркова–Гаусса. Для выбора оптимальной регрессионной модели применяется метод компромисса “точность-надежность”. Точность рассматривается в виде: N
S 2 (l ) =
∑ δl2 (t ) t =1
N
.
N
При этом σδ2 (l ) =
∑ δl2 (t )
N ⋅ S 2 (l ) t =1 = (где N – l – 1 – число стеN − l −1 N − l −1
пеней свободы). S 2 (1) > S 2 (2) > ... > S 2 ( N − 1) = 0 . Выполняется неравенство: Случай l = N – 1 – это построение полинома в точках совпадения ряда с функцией (максимальная точность).
Надежность оценивается как надежность определения старшего коэффициента (в силу того, что только он является подлинным инвариантом). Наиболее удобный показатель есть коэффициент ва216
риации оценки старшего элемента полинома (среднеквадратичное отклонение оценки старшего коэффициента к ее абсолютному значению): σ ( aˆll ) . Bl (l ) = aˆll Причем σ 2 ( aˆll ) = all (l , N ) ⋅ σδ2 (l ). Первый диагональный элемент обратной матрицы соответствующей системы нормальных уравнений ( a ll (l , N ) ) не зависит от значений временного ряда, поэтому может быть затабулирован (см. табл. 1.1). Надежной считается оценка, для которой Bl (l ) < b0 . Из практики b0 = 0,3 . Особый интерес представляет собой поведение критериальных показателей: критерий точности резко снижается в области l0 , затем темп убыли снижается, критерий надежности, наоборот, растет на отрезке [l0 , l1 ] (рис. 1).
Рис. 1. Графическая иллюстрация метода компромисса “точность–надежность”
Оптимальная регрессионная модель выбирается согласно критерию компромисса “точность-надежность”. Критерий компромисса “точность-надежность” В качестве наилучшей по компромиссу “точность–надежность” в эконометрической линейной полиномиальной модели мы выбираем наиболее точную из допустимых по надежности оценок старших коэффициентов полинома. 217
Примеры Задача Построить наилучшую регрессионную модель для ряда инвестиций. t
Х(t)
P1(t)
δ1 (t )
P2(t)
δ 2 (t )
P3(t)
δ3 (t )
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
10,8 12,1 12,7 15,0 16,5 19,1 21,6 24,5 27,4 30,8 31,9 34,0 36,1 39,4 42,7 45,8 49,4 53,6 55,8 62,5
6,91 9,56 12,21 14,86 17,51 20,16 22,81 25,46 28,11 30,76 33,41 36,06 38,71 41,36 44,01 46,66 49,31 51,96 54,61 57,26
3,89 2,54 0,49 0,14 –1,01 –1,06 –1,21 –0,96 –0,71 0,04 –1,51 –2,06 –2,61 –1,96 –1,31 –0,86 0,09 1,64 1,19 5,24
10,32 11,89 13,58 15,39 17,32 19,37 21,54 23,83 26,24 28,77 31,42 34,19 37,08 40,09 43,22 46,47 49,84 53,33 56,94 60,67
0,48 0,21 –0,88 –0,39 –0,82 –0,27 0,06 0,67 1,16 2,03 0,48 –0,19 –0,98 –0,69 –0,52 –0,67 –0,44 0,27 –1,14 1,83
9,83 11,71 13,63 15,59 17,60 19,67 21,82 24,05 26,38 28,81 31,35 34,02 36,82 39,76 42,86 46,13 49,57 53,20 57,02 61,05
0,97 0,39 –0,93 –0,59 –1,10 –0,57 –0,22 0,45 1,02 1,99 0,55 –0,02 –0,72 –0,36 –0,16 –0,33 –0,17 0,40 –1,22 1,45
N
∑ δl ( t − 1 ) δl ( t )
t =2
40,74
4,19
3,56
50,66
11,85
11,87
62,97
14,97
13,04
0,72
0,31
0,29
N
∑ δl 2 ( t − 1 )
t =2
N
∑ δl 2 ( t )
t =2
r1(l)
218
Решение 20
l=1) МНК: min ∑ [ a0 + a1t − X (t ) ] . a0 , a1
2
t =1
20 ⎧ ⎛ 20 ⎞ ⎛ 20 ⎞ 1 a + t a = ⎪ ⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ∑ X (t ), ⎪ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎨ 20 20 20 ⎪ ⎛ t ⎞ a + ⎛ t 2 ⎞ a = X (t ) ⋅ t . ⎪⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ∑ ⎝ t =1 ⎠ ⎩ ⎝ t =1 ⎠ t =1
⎧ 20 ⋅ a0 + 210 ⋅ a1 = 641,7, ⎨ ⎩ 210 ⋅ a0 + 2870 ⋅ a1 = 8499,9.
Решив это уравнение методом Крамера, получим, что a0 = 4, 263, a1 = 2,650. Таким образом, P1 (t ) = 4, 263 + 2,650 ⋅ t , t = 1, 20 . Невязки рассчитываются по формуле: δ1 (t ) = X (t ) − P1 (t ), t = 1, 20 . Проводим исследование невязок на степень соответствия их свойств свойствам белого шума.
Рис. 2. График динамики невязок
Число пересечений с осью времени мало, в колебаниях наблюдается квадратичный тренд. Таким образом, динамика невязок не дает оснований рассматривать невязки как практическую реализацию белого шума. 219
Рис. 3. Поле автокорреляции при l = 1
В поле автокорреляции наблюдается тренд, что дает основания полагать, что автокорреляция есть. Следовательно, нельзя рассматривать ряд невязок как реализацию белого шума. Коэффициент автокорреляции для всех трех случаев представлен. Для l = 1 он составляет 0,72, что говорит о наличии автокорреляции. 20
∑ ⎡⎣ a0 + a1t + a2t 2 − X (t ) ⎤⎦ a0 , a1 , a2
l = 2) МНК: min
2
.
t =1
20 ⎧ ⎛ 20 ⎞ ⎛ 20 ⎞ ⎛ 20 2 ⎞ + + = 1 a t a t a ⎪ ⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ⎜ ∑ ⎟ 2 ∑ X (t ), ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎪ ⎝ t =1 ⎠ ⎪ ⎛ 20 ⎞ 20 20 20 ⎛ ⎛ ⎪ 2 ⎞ 3 ⎞ + + = t a t a t a ⎨ ⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ⎜ ∑ ⎟ 2 ∑ X (t ) ⋅ t , ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎪ ⎝ t =1 ⎠ ⎪ ⎛ 20 ⎞ 20 20 20 ⎛ ⎞ ⎛ ⎞ ⎪ ⎜ ∑ t 2 ⎟ a0 + ⎜ ∑ t 3 ⎟ a1 + ⎜ ∑ t 4 ⎟ a2 = ∑ X (t ) ⋅ t 2 . ⎪⎩ ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1
⎧ 20 ⋅ a0 + 210 ⋅ a1 + 2870 ⋅ a2 = 641,7, ⎪ ⎨ 210 ⋅ a0 + 2870 ⋅ a1 + 44100 ⋅ a2 = 8499,9, ⎪ 2870 ⋅ a + 44100 ⋅ a + 722666 ⋅ a = 130137,7. ⎩ 0 1 2
Решим систему методом Крамера и получим: a1 = 1,39, a2 = 0,06. 220
a0 = 8,87,
Полином будет имеет вид: P1 (t ) = 8,87 + 1,39 ⋅ t + 0,06t 2 , t = 1, 20.
Рис. 4. Исследование свойств невязок
Число пересечений с осью времени возросло до 6, тренд уже не наблюдается.
Рис. 5. Поле автокорреляции при l = 2 В поле автокорреляции тренд наблюдается слабо. Значение коэффициента автокорреляции составило 0,31, что очень близко к ограничению для белого шума. Исследование свойств невязок позволяет рассматривать их как практическую реализацию белого шума. Модель l = 2 является первым претендентом на наилучшую. 20
l = 3) МНК:
∑ ⎡⎣a0 + a1t + a2t 2 + a3t 3 − X (t )⎤⎦ a0 , a1 , a2 , a3 min
t =1
221
2
.
20 ⎧⎛ 20 ⎞ ⎛ 20 ⎞ ⎛ 20 2 ⎞ ⎛ 20 3 ⎞ 1 a + t a + t a + t a = ⎪⎜ ∑ ⎟ 0 ⎜ ∑ ⎟ 1 ⎜ ∑ ⎟ 2 ⎜ ∑ ⎟ 3 ∑ X (t ), ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎪⎝ t =1 ⎠ ⎪⎛ 20 ⎞ 20 20 20 20 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎪⎜ ∑ t ⎟ a0 + ⎜ ∑ t 2 ⎟ a1 + ⎜ ∑ t 3 ⎟ a2 + ⎜ ∑ t 4 ⎟ a3 = ∑ X (t ) ⋅ t , ⎪⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎨ 20 20 20 20 20 ⎪⎛ t 2 ⎞ a + ⎛ t 3 ⎞ a + ⎛ t 4 ⎞ a + ⎛ t 5 ⎞ a = X (t ) ⋅ t 2 , ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ∑ ∑ ∑ ∑ ∑ 0 1 2 3 ⎪ ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ t =1 ⎪⎝ t =1 ⎠ 20 20 20 ⎪⎛ 20 ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎪⎜ ∑ t 3 ⎟ a0 + ⎜ ∑ t 4 ⎟ a1 + ⎜ ∑ t 5 ⎟ a2 + ⎜ ∑ t 6 ⎟ a3 = ∑ X (t ) ⋅ t 3 . ⎩⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎝ t =1 ⎠ ⎧20 ⋅ a0 + 210 ⋅ a1 + 2870 ⋅ a2 + 44100 ⋅ a3 = 641,7, ⎪ ⎪210 ⋅ a0 + 2870 ⋅ a1 + 44100 ⋅ a2 + 722666 ⋅ a3 = 8499,9, ⎪ ⎨2870 ⋅ a0 + 44100 ⋅ a1 + 722666 ⋅ a2 + 12333300 ⋅ a3 = 130137,7, ⎪44100 ⋅ a + 722666 ⋅ a + 12333300 ⋅ a + 0 1 2 ⎪ ⎪⎩+216455810 ⋅ a3 = 2136701,1.
Решим систему методом Крамера и получим:
a0 = 7,97,
a1 = 1,85, a2 = 0,006, a3 = 0,002.
Полином будет имеет вид:
P1 (t ) = 7,97 + 1,85 ⋅ t + 0,006t 2 +
+0,002t 3 , t = 1, 20 . Исследование свойств невязок сводится к трем позициям.
Рис. 6. График динамики невязок при l = 3 222
Рис. 7. Поле автокорреляции при l = 3
График динамики невязок, поле автокорреляции и значение коэффициента автокорреляции (0,29) дают основания рассматривать ряд невязок как реализацию белого шума. В ходе исследования было получено, что два полинома (второй и третьей степени) могут претендовать на оптимальную модель. Для того чтобы выбрать один из них, проведем анализ точности и надежности: l=1
l=2
l=3
3,90
0,76
0,70
0,89
0,87
0,00
0,00
0,0000509
0,0000020
0,12
0,83
N
Точность
S 2 (l ) =
σδ2 (l ) =
∑ δl2 (t ) t =1
N
N ⋅ S 2 (l ) N − l −1
σ2 ( aˆll ) = all (l, N) ⋅σδ2 (l). a ll (l , N ) Надежность
Bl (l ) =
σ ( aˆll ) aˆll
Таким образом, исходя из правила компромисса “точностьнадежность” и полученных расчетных данных, наилучшей должна быть признана регрессионная модель с полиномом второй степени. 223
Задача Построить наилучшую регрессионную модель для ряда вводов основных фондов. t
Y(t)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
10,81 10,59 11,58 13,56 14,66 16,57 18,54 23,20 24,40 27,30 28,10 31,90 35,40 37,40 39,20 41,80 45,20 46,50 50,99 58,50
P1(t) 6,12 8,56 11,00 13,44 15,88 18,33 20,77 23,21 25,65 28,09 30,53 32,97 35,41 37,85 40,29 42,74 45,18 47,62 50,06 52,50
δ1(t)
P2(t)
4,69 2,03 0,58 0,12 –1,22 –1,76 –2,23 –0,01 –1,25 –0,79 –2,43 –1,07 –0,01 –0,45 –1,09 –0,94 0,02 –1,12 0,93 6,00
9,34 10,76 12,30 13,95 15,71 17,59 19,57 21,68 23,89 26,22 28,66 31,21 33,88 36,66 39,55 42,56 45,68 48,91 52,26 55,72
δ2(t) 1,47 –0,18 –0,72 –0,39 –1,05 –1,02 –1,04 1,52 0,50 1,08 –0,57 0,68 1,51 0,73 –0,36 –0,77 –0,49 –2,42 –1,27 2,78
P3(t) 9,41 10,79 12,30 13,92 15,68 17,55 19,54 21,65 23,88 26,22 28,67 31,24 33,92 36,71 39,60 42,61 45,71 48,92 52,24 55,65
δ3(t) 1,40 –0,20 –0,72 –0,36 –1,02 –0,98 –1,00 1,55 0,52 1,08 –0,57 0,66 1,48 0,69 –0,40 –0,81 –0,51 –2,42 –1,25 2,85
N
∑ δl (t − 1) δl (t )
t =2
28,24
4,67
4,47
49,63
21,84
21,42
63,64
27,41
27,58
0,50
0,19
0,18
N
∑ δ l 2 (t − 1)
t =2 N
∑ δ l 2 (t )
t =2
r1(l)
224
Все рассуждения аналогичны рассуждениям в предыдущей задаче. Откуда: l=1
l=2
l=3
4,28
1,48
1,48
N ⋅ S 2 (l ) N − l −1
1,74
1,85
σ 2 ( aˆll ) = a ll (l , N ) ⋅ σδ2 (l ).
0,00
0,00
N
Точность
S 2 (l ) =
σδ2 (l ) =
∑ δl2 (t ) t =1
N
a ll (l , N )
Надежность
Bl (l ) =
0,0000991 0,0000042
σ ( aˆll ) aˆll
0,18
8,47
Согласно критерию компромисса “точность–надежность” мы выбираем регрессионную модель с трендом в виде полинома второй степени: P2 (t ) = 8,031 + 1, 254 ⋅ t + 0,057 ⋅ t 2 , t = 1, 20 . Тема 4. Автономный анализ и прогноз временных рядов
Постановка задачи Пусть в результате применения компромисса “точность– надежность” получена модель: xt = aˆ0 + aˆ1t + ... + aˆl t l + δ l (t ) . Найти значение Xˆ ( N + p ) = aˆ0 + aˆ0 ( N + p ) + ... + aˆl ( N + p)l и оценить надежность прогнозирования в виде дисперсии Xˆ ( N + p ) . 225
На Западе не удалось решить указанную задачу. Для применения формулы σ2 ( Pˆl ( N + p )) = σ2 ( aˆ0 + aˆ1 ( N + p) + ... + aˆl ( N + p )l ) = = σ 2 ( aˆ0 ) + ( N + p ) 2 σ 2 ( aˆ1 ) + ... + ( N + p ) 2l σ2 ( aˆl ) оценки коэффициентов aˆ должны быть независимы. Однако они были получены по МНК, следовательно, они зависимы. Характер этой зависимости нам неизвестен. Поэтому указанную формулу для расчета ошибки использовать нельзя.
Исходя из принципа инвариантности, можно решить эту задачу следующим образом. Рассмотрим сдвиг временного ряда таким образом, чтобы прогнозная точка приходилась на t = 0, N – на (–p), первая точка – на (–N – p + 1). Из принципа инвариантности получим полином вида Ql (t ) = αˆ 0 + αˆ 1t + ... + αˆ l t l , удовлетворяющий свойствам: 1. Полином Q той же степени, что и P; 2. Численные результаты анализа и прогноза те же, что в исходной задаче; 3. Значение старшего коэффициента то же. Из указанных свойств получаем: Pˆl ( N + p ) = Qˆ l (0) = αˆ 0 , Pˆl ( N ) = Ql (− p), ....................., Pˆ (1) = Q (− N − p + 1). l
Опираясь
на
принцип
l
инвариантности:
= σ2 ( αˆ 0l ) , σ 2 ( aˆil ) = a ii (l , N ) ⋅ σδ2 (l ).
Отсюда
σ2 [ Pl ( N + p )] =
σ2 [ Pl ( N + p )] = a 00 (l , N , p ) ⋅ σδ2 (l ).
Значения a 00 (l , N , p) могут быть затабулированы (см. табл. 1.2).
226
Пример Задача Построить прогноз для первой задачи темы 3 для p = 1, 2, 3, 4, 5, подсчитать надежность прогноза. Решение Для прогнозирования Xˆ (t ) = 8,87 + 1,39 ⋅ t + 0,06t 2 .
используем
найденную
модель:
Xˆ (21) = 8,87 + 1,39 ⋅ 21 + 0,06 ⋅ 212 = 64,53, Xˆ (22) = 8,87 + 1,39 ⋅ 22 + 0,06 ⋅ 222 = 68, 49, Xˆ (23) = 8,87 + 1,39 ⋅ 23 + 0,06 ⋅ 232 = 72,58, Xˆ (24) = 8,87 + 1,39 ⋅ 24 + 0,06 ⋅ 242 = 76,79, Xˆ (25) = 8,87 + 1,39 ⋅ 25 + 0,06 ⋅ 252 = 81,12.
Для вычисления надежности используем формулу: σ2 [ Pl ( N + p )] = a 00 (l , N , p ) ⋅ σδ2 (l ),
σ2 [ P2 ( N + p )] = a 00 (2,20, p) ⋅ σδ2 (2), 20 S 2 (2) = 0.89, 20 − 2 − 1 σ2 [ P2 (20 + 1)] = 0,5535 ⋅ 100 ⋅ 0,89 = 0, 493, σδ2 (2) =
σ2 [ P2 (20 + 2)] = 0,8071 ⋅ 100 ⋅ 0,89 = 0,718, σ2 [ P2 (20 + 3)] = 0,1147 ⋅ 101 ⋅ 0,89 = 1,021, σ2 [ P2 (20 + 4)] = 0,1588 ⋅ 101 ⋅ 0,89 = 1,413, σ2 [ P2 (20 + 5)] = 0, 2150 ⋅ 101 ⋅ 0,89 = 1,914.
Как видим, данная методика позволяет численно оценить дисперсию прогноза и показать, что она возрастает с ростом горизонта прогноза.
227
Тема 5. Многофакторные эконометрические регрессионные модели, связывающие временные ряды показателей, входящих в модели
Общая модель: Y1 = a1 ⋅ X 1 (t ) + ... + an ⋅ X n (t ) + εt , t = 1, N . Есть предварительные знания о функциях и факторах из раздела I:
Y1 = Pl ( 0) (t ) + δ 0t ,
X 1t = Pl (1) (t ) + δ1t , ..............,
X nt = Pl ( n ) (t ) + δ nt . Для корректной оценки параметров на факторы накладываются следующие ограничения: Pl (0) (t ) + δ0 (t ) = a1 ⎡⎣ Pl (1) (t ) + δ1 (t )⎤⎦ + ... + an ⎡⎣ Pl ( n) (t ) + δ n (t )⎤⎦ + ε(t ).
Для того чтобы в правой части была ε(t ) такая, чтобы ее математическое ожидание было равно нулю, нужно: Pl (0) (t ) − a1Pl (1) (t ) − ... − an Pl ( n ) (t ) + δ0 (t ) − a1δ1 (t ) − ... − −an δn (t ) = ε(t ), M [ Pl (0) (t ) − a1Pl (1) (t ) − ... − an Pl ( n) (t )] + M [δ0 (t ) − a1δ1 (t ) − ... − −an δn (t )] = M [ε(t )] = 0,
Так как M [δ0 (t ) − a1δ1 (t ) − ... − an δn (t )] = 0, M [ Pl (0) (t ) − a1Pl (1) (t ) − ... − an Pl ( n ) (t )] = 0,
что возможно только в случае, если Pl (0) (t ) − a1Pl (1) (t ) − ... − an Pl ( n) (t ) ≡ 0 .
Тогда имеем: Y1 − a1 ⋅ X 1 (t ) − ... − an ⋅ X n (t ) = ε(t ), где M[ε(t)] = 0. 228
Экономические временные ряды задаются таблично, но для строгой линейной зависимости необходимы показатели в виде формул. Поэтому вводится понятие мультиколлинеарности. Определение Мультиколлинеарность – практически линейная связанность табличных рядов данных. Необходимое условие существования разложения Функция Y1 и факторы X 1 (t ),..., X n (t ) должны быть мультиколлинеарны, а в отдельности факторы – немультколлинеарны. Принцип согласования содержательного и измерительного аспектов многофакторной регрессионной модели: n = l (0) + 1, l (0) = max l (i). i
Принцип согласования легко иллюстрировать на практике. Рассмотрим функцию Кобба–Дугласа. Существуют два взгляда на аналитический вид этой функции. Сторонники одного взгляда придерживаются мнения, что случайная ошибка должна входить в выражение закона аддитивно: Yt = A0 X 1α (t ) X 2β (t ) ⋅ e λt + εt .
Сторонники второго взгляда указывают на проблемы исследования нелинейного уравнения и полагают, что ошибка должна входить мультипликативно: Yt = A0 X 1α (t ) X 2β (t ) ⋅ eλt ⋅ e εt .
В обоих вариантах приняты следующие обозначения: Y(t) – объем выпуска, Х1(t) – количество основных фондов, X2(t) – количество труда, А0 – коэффициент масштаба производства (экстенсивная характеристика), 229
∂Y ΔY α = Y ≈ Y – эластичность выпуска по фондам, ∂X 1 ΔX 1 X1 X1 ∂Y ΔY Y β= ≈ Y – эластичность выпуска по труду, ∂X 2 ΔX 2 X2 X2 eλ⋅t – воздействие НТП (интенсивная характеристика). Указывается на простоту приведения данной модели к линейному виду. В силу положительности А0, Х1(t), X2(t), Y(t) можно провести замену на экспоненциальные функции: A0 = e a0 , X 1 (t ) = e x1 ( t ) , X 2 (t ) = e x2 ( t ) , Y (t ) = e y ( t ) . Тогда yt = α ⋅ x1 (t ) + β ⋅ x2 (t ) + a0 + λ ⋅ t + εt , и проблемы нелинейности не возникает. Однако идея представления научно-технического прогресса в виде полинома неверна по своей сути. Это связано с несколькими соображениями. Во-первых, если ввести в правую часть линии регрессии НТП в виде полинома, в результате прогонки его через МНК интересующие нас коэффициенты α и β могут обнулиться, а вся нагрузка ляжет на коэффициенты полинома, характеризующего НТП. Дело в том, что МНК – это всего лишь алгоритм, в котором нельзя задать приоритеты коэффициентов и “объяснить” назначение каждого из них. Для МНК все коэффициенты равнозначны, апеллировать к его сознанию нельзя. МНК использует все возможности уменьшения средних квадратов, поэтому не выбирает, какие коэффициенты обнулять, а какие – нет. Это чисто математический, технический аргумент. Во-вторых, существует серьезный содержательный аргумент против такого представления НТП. Представить НТП умозритель230
но через непонятную прибавку к производственной функции Кобба–Дугласа значит нарушить согласование модели и реальной экономики. Откуда создается НТП? Это же не подарок на Рождество, взявшийся невесть откуда! Рассмотрение НТП как экзогенного фактора неверно: в этом мире все материально. Единственный носитель прогресса – это капитал и труд. В капитал поступают новые технические орудия, инструменты и приборы. Труд отражает качественные изменения под действием НТП (более квалифицированный труд более производителен). Поэтому НТП нельзя отражать никак иначе, чем через динамику характеристик капитала и труда (эластичности по соответствующим факторам) во времени, т. е.: yt = α(t ) ⋅ x1 (t ) + β(t ) ⋅ x2 (t ) + εt .
В-третьих, в представлении аддитивного НТП нарушен принцип инвариантности по сдвигу по времени. Действительно, если отдельно изобразить НТП в виде луча λt, то получается, что сдвиг по оси времени приводит к изменению численных значений анализа и прогноза, а в среднем за период вклад НТП равен 0. Таким образом, необходимо проводить согласование измерительных и содержательных аспектов модели, а не превращать НТП в умозрительные конструкции из полиномов. Тема 6. Методы согласования экономических и измерительных свойств модели
Итак, в прошлой теме было выявлено, что содержательные и измерительные аспекты модели необходимо согласовывать. Но не всегда найденные уравнения факторов и функции согласуются сразу. Возможны два варианта рассогласования функции и факторов. Первый вариант: степень полинома функции больше максимальной степени полиномов факторов, т е. l (0) > max l (i). Соглаi
сование в этом случае проводится методом перехода к переменным коэффициентам. Приведем пример. Допустим, что в результате предшествующего исследования было получено, что l (0) = 2, l (1) = l (2) = 1 , т.е. 231
yt ⇒ l (0) = 2, x1 (t ) ⇒ l (1) = 1, x2 (t ) ⇒ l (2) = 1. Тогда согласование проводится путем перехода к переменной эластичности выпуска по основным фондам: yt = (α 0 + α1t ) x1 (t ) + βx2 (t ) + εt = α 0 x1 (t ) + α1[tx1 (t )] + βx2 (t ) + εt .
После замены x1′ (t ) = tx1 (t ) → l ′(1) = 2 получим yt = α 0 x1 (t ) + α1 x1′ (t ) + βx2 (t ) + εt .
Теперь соблюдаются оба условия согласования: n = l (0) + 1 = 3, l (0) = max l (i ) = 2. i
Из уравнения вида 2 1 1 получили 2 1 2 1. Конечно, объективно оба коэффициента регрессии (альфа и бета) зависят от времени. Но в данном случае нельзя их одновременно рассматривать как переменные, так как не получится правильно согласовать модель. Поэтому первый коэффициент рассматривается как переменный, а второй оценивается как средний за период. Приведенным методом можно согласовать любую систему, в которой степень полинома функции больше максимальной степени полиномов факторов. Второй вариант: степень полинома функции меньше максимальной степени полиномов факторов, т.е. l (0) < max l (i ). Соглаi
сование в этом случае проводится методом повышения степени полинома функции на единицу, что достигается уменьшением невязок по амплитуде, т. е. осуществляется переход от модели x(t ) = Pl (t ) + δl (t ) к модели x′(t ) = Pl (t ) + δ′l (t ) , где δ′l (t ) = qδl (t ) , 0 n, i =0
где Yt – вводы основных производственных фондов года t; X(t) – инвестиции года t; n (максимальный лаг) – средний срок строительства объектов. Средняя доля фондообразующий инвестиций в их общем объеме брутто рассчитывается по формуле: n
β = ∑ ai , ai > 0, β > 0. i =0
Для проектов производственного назначения β составляет около 0,95. Вероятности лагов рассчитываются по формуле n a ωi = i > 0, ∑ ωi = 1. β i =0 Вероятности лагов трактуются следующим образом: если взять наугад единицу в объеме ввода года t овеществленных капитальных вложений, то с вероятностью ωi он будет относиться к году i. Задача состоит в том, чтобы в данной модели оценить максимальный лаг (n) и вероятности лагов (ωi ). Проблема заключается в том, что для необходимости однозначного разложения ввода года t по факторам-инвестициям необходимо, чтобы факторы были базисом. Но, как утверждает западная эконометрика, неизвестное n нужно искать перебором. В ходе перебора n может стать больше степени полинома, а при больших l факторы становятся мультиколлинеарными в силу плохой обу233
словленности матрицы. В итоге для западной науки данная задача в общем виде неразрешима. Тема 8. Метод оценки априори неизвестного закона распределения вероятности лагов на основе принципа согласования
Задача, представляемая западной эконометрикой неразрешимой, на самом деле имеет решение. Основная проблема конструирования из факторов хорошего базиса снимается за счет превращения запаздываний в конечные разности. При этом используется положение о том, что полином степени l полностью уничтожается (l+1) конечной разностью. Понятие конечной разности вводится рекуррентно. Возможны два варианта моделей. Первый: n > l. Факториальный многочлен записывается с помощью формул Стирлинга первого рода: j
g j (i ) = i(i − 1)...(i − j + 1) = ∑ S ( j, k )i k . k =0
При этом имеет место следующая рекуррентная формула: S ( j + 1, k ) = S ( j , k − 1) − jS ( j , k ) .
Так как конечные разности степени (l + 1) уничтожают полиномы степени l, проблема мультиколлинеарности факторов снимается и возникает проблема остаточного члена, которая также успешно решается. Таким образом, все “лишние” члены после (l + 1) отбрасываются, роль базиса выполняют младшие конечные разности. Для того чтобы остаточный член не вышел за рамки белого шума (невязки), колеблясь около 0, достаточно, чтобы β2
n
∑
m =l +1
wm2