МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образ...
21 downloads
194 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования«Оренбургский государственный университет»
Кафедра статистики
В.Е. КУЗНЕЦОВА, В.А. СИВЕЛЬКИН
СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДА КЛАССИЧЕСКОЙ СЕЗОННОЙ ДЕКОМПОЗИЦИИ (метод Census I) ППП Statistica 5.5 МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО КУРСУ «АНАЛИЗ ВРЕМЕННЫХ РЯДОВ И ПРОГНОЗИРОВАНИЕ»
Рекомендовано к изданию Редакционно-издательским советом государственного образовательного учреждения высшего профессионального образования«Оренбургский государственный университет»
Оренбург 2002
ББК 60.6 я73 К 89 УДК 311:681.3 (075)
Рецензент кандидат технических наук, доцент А.Г. Реннер
К 89
Кузнецова В.Е., Сивелькин В.А. Статистическое моделирование временных рядов с использованием метода классической сезонной декомпозиции (метод Census 1) ППП Statistica: Методические указания.-Оренбург: ГОУ ВПО ОГУ, 2002.– 33 с.
Методические указания содержат рекомендации по использованию модуля ППП Statistica анализа временных рядов, разложению их по факторам, участвующим в формировании анализируемого статистического ряда. Рассмотрено моделирование временного ряда методом Census 1. Приведены данные временных рядов с различной динамикой (годовые, квартальные, месячные). Рекомендуется студентам, обучающимся по специальности 061700 «Статистика».
ББК 60.6 я73
Кузнецова В.Е., Сивелькин В.А., 2002 ГОУ ВПО ОГУ, 2002 2
Введение Моделирование временных рядов в современных условиях достаточно актуально. На природу динамических рядов оказывают влияние регулярные внутригодовые (сезонные) изменения, складывающиеся под влиянием природно-климатических условий, различные модификации моделей, связанные с праздниками, отпускной системой, и другие факторы. Как правило, влияние сезонных факторов является значительным. Учет факторов, участвующих в формировании временного ряда, элиминирование нерегулярной компоненты, все это способствует качественному представлению фактических краткосрочных изменений, лежащих в природе этих рядов. Расчеты при разложении динамического ряда очень однообразны и трудоемки. Цель данных методических указаний определяется необходимостью владения студентами по специальности «Статистика» современными экономико-статистическими пакетами прикладных программ (ППП), в т.ч. модулем анализа временных рядов Time Series/Forecasting ППП Statistica на английском языке, что повышает профессионализ студентов. Этот модуль позволяет максимально приблизить студента к понятию природы динамического ряда, свободно владеть терминологией, инструментарием классического метода сезонной декомпозиции (метод Census 1), оперировать статистическими критериями, оценками соответствующих моделей при проведении самостоятельных глобальных статистических исследований динамического ряда. Студентам предоставляется возможность познакомиться с этапами метода Census 1, выработать основные практические навыки по применению классической сезонной декомпозиции для временных рядов, представленных экономическими, социальными, демографическими и др. показателями.
3
1 Общая модель временного ряда как объекта статистического анализа Эффективность регионального управления экономикой во многом определяется адекватным пониманием сущности регулируемого объекта. Противоречивые и сложные процессы, происходящие в экономике России, вызывают потребность в исследовании тенденции ее развития, перспективы экономической динамики и социальной сферы их природы и факторов, оказывающих влияние на анализируемые процессы. Временным рядом по определению, предложенному С. Айвазяном в работе,1 называется анализируемая величина ξ(t), характеризуемая рядом наблюдений x(t1), x(t2), . . . x(tN), произведенных в последовательные моменты времени t1, t2,...tN. В данной работе рассматриваются дискретные (во времени наблюдения) одномерные временные ряды для равностоящих моментов наблюдения, т.е. t2 -t1= t3 – t2= . . . = tN – tN-1=∆, где ∆ - заданный временной такт (минута, час, сутки, неделя, месяц, квартал, год и т.д.). Вышеприведенное определение временного ряда исходит из понятия случайной величины ξ(t), зависящей от параметров t, т.е. анализируется «…однопараметрическое семейство случайных величин {ξ (t )} …»2. Из чего следует, что закон распределения вероятностей этих случайных величин, и в частности, их первые и вторые моменты, также могут зависеть от времени t. Поскольку, члены временного ряда в отличие от элементов случайной выборки не являются статистически независимыми и одинаково распределенными, т.е. P {x (t1 ) π x} ≠ P{x (t 2 ) π x} при t1 ≠ t2, то на временные ряды нельзя распространять свойства и правила статистического анализа случайной выборки. Подробный генезис наблюдений, образующих динамические ряды приводится в работах отечественных ученых С. Айвазяна, В. Мхитаряна, Г.Громыко, В. Афанасьева, М. Юзбашева и др, и зарубежных - Андерсона Т., Amir D. Aczel, Douglas C. Montgomery, Lynwood A. Johnson, John S. Gardineв и др. Формирование значений элементов временного ряда происходит под воздействием некоторых факторов, среди которых в основном выделяют 4 типа. То есть, временной ряд можно разложить в виде факторов (составляющих):
x (t ) = T тр (t ) + S ( t ) + C (t ) + N(t) ,
t = 1, P ,
(1)
где Ттр(t) - трендовая (неслучайная составляющая); S(t) - сезонная составляющая; C(t) - циклическая и N(t) - нерегулярная (случайная составляющая). 1
Айвазян С.А. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. – Т. 2: Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2001. – С.199. Там же С.201. 4 2
В исследуемых процессах встречается несколько вариантов сочетания этих факторов, однако, следует отметить, что во всех вариантах предполагается обязательное участие случайных факторов. Основными целями статистического анализа временного ряда, представленного аддитивным разложением по имеющейся траектории х(t) исследуемого ряда является: определение неслучайных функций Tтр (t), S(t) и C(t) участвующих в разложении (1); построение "хороших" оценок для присутствующих в разложении (1) неслучайных функций; подбор модели, адекватно описывающей поведение "случайных остатков" N(t), и статистическая оценка параметров этой модели. Существенную роль в решении задач выявления и оценивания трендовой (Ttp(t)), сезонной (S(t)), циклической (C(t)) и нерегулярной (N(t)) составляющих в разложении (1) играет начальный этап анализа на котором: -устанавливается сам факт наличия/отсутствия неслучайной (и зависящей от времени t) составляющей в разложении (1), т.е. осуществляется проверка статистической гипотезы H0 : Eх(t) = a = const
(2)
(включая утверждения о взаимной статистической независимости членов анализируемого временного ряда) при различных вариантах конкретизации альтернативных гипотез типа H1 : Eх(t) ≠ const
(3)
-определяется оценка (аппроксимация) для неизвестной интегральной неслучайной составляющей T(t ) = Tтр (t ) + S(t ) + C(t ) , т.е. решается задача элиминирования случайных остатков N(t) (сглаживания) анализируемого временного ряда x (t). С целью проверки гипотезы о неизменности среднего значения временного ряда (случайности ряда) рассмотрим критерий серий, основанный на медиане. Следуя рекомендациям С. Айвазяна и В. Мхитаряна в работе1, n) определим выборочную медиану x (med по формуле: n) x (med
x n +1 , 2 = 1 x n + x n , +1 2 2 2
если n нечетно, (4) если n четно,
где n – длина временного ряда. 1
Айвазян С.А. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. – Т. 2: Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2001. – С.221. 5
Значение временного ряда сопоставляется с выборочной медианой, n) определенной по формуле (4), и если x (t) > x (med , то для соответствующего наблюдения член(n )последовательности, образующего серии, принимает знак «+», если x (t) < x med , то – знак «-». В методе критерий серий, основанном на медиане выборке, для того чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей), должны выполняться следующие неравенства (для 5% уровня значимости):
{
τ max (n) < [1,43 ln(n + 1)]
(5)
)
1 (n + 2 − 1,96 n - 1 , 2
ν ( n) >
где n – длина временного ряда; ν(n) – число серий; τmax (n) – число подряд идущих плюсов или минусов в самой длинной серии. Если хотя бы одно из неравенств (5) нарушается, то гипотеза (2) об отсутствии тренда отвергается с вероятностью ошибки α, заключенной между 0,05 и 0,0975 (и, следовательно, подтверждается наличие зависящей от времени неслучайной составляющей в разложении (1) исследуемого ряда). Проверка гипотезы по «восходящей» и «нисходящей» серий основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий – слишком маленьким. Критерий «восходящих» и «нисходящих» серий устанавливается исходя из системы неравенств:
{
1
ν (n) > (2n − 1) − 1,96 3 τ max (n) ≤ τ 0 (n)
16n − 29 90
(6) ,
где n – длина временного ряда; ν(n) – число серий; τmax (n) – число подряд идущих плюсов или минусов в самой длинной серии. Следует отметить, что τ0 принимает значения в зависимости от n т.е: если n≤26, то τ0 = 5; если 26