МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение "Оренбургский государственный у...
58 downloads
202 Views
825KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение "Оренбургский государственный университет" Кафедра математических методов и моделей в экономике
А.Г. РЕННЕР, О.А. ЗИНОВЬЕВА, Г.Г. АРАЛБАЕВА
ПРОВЕРКА ГИПОТЕЗ О ХАРАКТЕРЕ РАСПРЕДЕЛЕНИЯ МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ЛАБОРАТОРНОМУ ПРАКТИКУМУ
Рекомендовано к изданию Редакционно-издательским советом государственного образовательного учреждения "Оренбургский государственный университет"
Оренбург 2002
ББК 22.172я7 Р-39 УДК 519.233.5(076.5)
Введение Данные статистических обследований являются основой для принятия одного из нескольких альтернативных решений о свойствах и параметрах генеральной совокупности. При этом любое суждение о генеральной совокупности, сделанное на основе выборочных наблюдений, не может рассматриваться как достоверное утверждение, а лишь как предположительное в силу неполноты информации на основе выборки. Проверка статистической гипотезы заключается в том, чтобы установить, не противоречат ли данные выборочных наблюдений выдвинутой гипотезе. С этой целью производится количественная оценка степени достоверности предлагаемой гипотезы, которая осуществляется с помощью специально построенного статистического критерия. Для статистической проверки гипотез о теоретическом (модельном) виде закона распределения вероятностей исследуемой случайной величины ζ используют критерии согласия. На основании оценки закона распределения в форме ряда распределения, статистической функции распределения, полигона, гистограммы или иных соображений, порой априорного характера, делаем предположение о модельном виде закона распределения (выдвигаем нулевую гипотезу). Наша задача на основании n независимых наблюдений (выборки) случайной величины проверить справедливость гипотезы Н0 или отвергнуть ее. Для проверки гипотезы выбираются (строятся) критические статистики, измеряющие расстояния между эмпирическим законом распределения и гипотетическим семейством.
2
1 Описание лабораторной работы Лабораторная работа включает следующие этапы: - постановку задачи; - ознакомление с порядком выполнения работы в диалоговой системе STADIA; - выполнение расчетов индивидуальных задач; - подготовку письменного отчета; - защиту лабораторной работы.
2 Постановка задачи По выборочным значениям из генеральной совокупности визуально оценить закон распределения данной совокупности, для этого: - построить интервальный вариационный ряд частот (относительных частот); - построить гистограмму плотности относительных частот; - построить кумулятивную функцию (статистическую функцию) распределения относительных частот; На основании полученных оценок выдвинуть и проверить гипотезу о характере распределения с помощью: - проверки нулевой гипотезы соответствия нормальному распределению (если есть основание) по коэффициентам асимметрии и эксцесса; - критерия согласия Пирсона (χ2). Для одной из выборок с помощью критерия Пирсона проверить гипотезу на согласие эмпирического распределения с равномерным распределением. Задача. Даны три выборки, выполненные из различных генеральных совокупностей, распределенных по нормальному, экспоненциальному и равномерному законам, объемом n=50. Выдвинуть и проверить на уровне значимости α= 0,05 гипотезы о характере законов распределения генеральных совокупностей.
3
3 Порядок работы Запускаем систему STADIA. Вводим в электронную таблицу данные своего варианта (Рисунок 1).
Рисунок 1- Таблица данных Для выдвижения гипотезы о характере распределения генеральной совокупности будем использовать оценки числовых характеристик, таких как асимметрия и эксцесс, а также гистограмму. Для этого необходимо вызвать меню статистических методов (F9). Выбираем пункт "1=Описательная статистика", а в бланке выбора переменной можно выделить сразу все переменные. Выдвигаем нулевую гипотезу Н0: Аs=0, Ех=3 (совокупность распределена по нормальному закону) против альтернативной гипотезы Н1: Аs ≠0, Ех ≠3.
4
Рисунок 3- Результаты описательной статистики Для первой и третьей выборок значимость коэффициентов асимметрии и эксцесса больше 0,05. Таким образом, нет основания отвергнуть гипотезу о равенстве эмпирических коэффициентов асимметрии и эксцесса соответственно 0 и 3, что дает основание заподозрить нормальный характер распределения генеральной совокупности. Построим гистограмму и проверим гипотезу о нормальном характере распределения с помощью критериев согласия. В меню статистических методов (F9) выбираем кнопку «2=Гистограмма/нормальность». На странице результатов появится типовой бланк выбора переменой (Рисунок 3), в котором необходимо выбрать подлежащую анализу переменную из электронной таблицы.
Рисунок 3- Бланк выбора переменной По нажатию <Enter> или «Утвердить» появляется новый бланк «Гистограмма», в котором нужно указать число интервалов и область определения гистограммы. В качестве начального числа интервалов подсказывается значение, вычисленное по эвристической формуле: 1 int(1,5+3,3log10(N)) , а область определения принята равной диапазону выборочных значений в масштабе от 0 до 10 (Рисунок 4).
1
Можно указать любое количество интервалов, но не превышающее число значений в совокупности. 5
Рисунок 4- Бланк выбора параметров гистограммы После подтверждения параметров на этой же странице появляются результаты и запрос на сохранение данных в матрице данных (Рисунок 5).
Рисунок 5 Если запрос будет подтвержден, то на странице электронной таблицы в первый свободный столбец запишутся частоты значений в каждом интервале. На новой появившейся страничке графиков будет выведена гистограмма (Рисунок 6), при нажатии «No» программа сразу показывает график.
Рисунок 6 - Гистограмма переменной х1 Графическая выдача содержит изображение гистограммы с наложенной кривой нормального распределения с соответствующими параметрами а и σ. При нажатии на кнопку «Оставить» возвращаемся на страницу с результатами (Рисунок 7).
6
Рисунок 7- Результаты проверки нулевой гипотезы о нормальности заданного распределения Для каждого интервала гистограммы на экран выводятся: - Х-лев. – левая граница интервала в исходных единицах; - Х-станд. – левая граница интервала в единицах стандартного отклонения (из каждого элемента первого столбца вычитается среднее значение выборки и полученная разность делится на стандартное отклонение выборки); - Частота – число выборочных значений, попавших в интервал; - % - относительная частота; - Накопл – накопленное число выборочных значений до текущего интервала включительно; - % - относительная накопленная частота. Далее приводятся результаты проверки нулевой гипотезы об отсутствии различий между выборочным и нормальным распределениями и значения трех статистик: - Колмогорова D с уровнем значимости Р; - омега-квадрат ω2 (Мизеса) с уровнем значимости Р; - хи-квадрат χ2 (Пирсона) с уровнем значимости Р. Интервальный вариационный ряд частот был получен на страничке результатов. Интервалы представлены левыми границами, абсолютные частоты в графе "Частота", и относительная частота в следующей графе "%". На основании гистограммы подтверждаем выдвижение гипотезы о нормальном характере распределения х1. Проверка нулевой гипотезы по критерию Пирсона дала положительную оценку в сравнении с заданным уровнем значимости (0,84>0.05). Критерии Колмогорова и омега-квадрат также не выявили расхождения с нормальным распределением.
7
Оценка асимметрии и эксцесса для второй выборки не дала положительных результатов, таким образом, гипотеза о нормальном распределении была отвергнута. Построим для выборки х2 гистограмму. На основании полученной гистограммы и вариационного ряда делаем предположение, что генеральная совокупность распределена по экспоненциальному закону (рисунок 8).
Рисунок 8 - Гистограмма переменной х2 Для проверки соответствующей гипотезы вызываем меню статистических методов «Статистика» и в нем выбираем «U=Согласие распределений». При этом на экране появится типовой бланк выбора переменной из электронной таблицы (Рисунок 3). После выбора переменной система выдает меню теоретических распределений (Рисунок 9).
Рисунок 9 - Меню выбора теоретических распределений. В этом меню предлагается восемь теоретических распределений. Заданное распределение необходимо проверить на согласие с предполагаемым теоретическим распределением. Таким образом, в меню выбора нажимаем на вторую кнопку 2=экспоненциальное. После этого система выходит на графическую страничку, на которой точками изображена кумулятивная функция распреде8
ления с наложенной на нее линией теоретической функции распределения (Рисунок 10).
Рисунок 10 - График кумулятивной функции распределения и наложенной кривой экспоненциального распределения. После просмотра графика система выходит на страничку результатов. Результаты процедуры проверки на согласие с теоретическим распределением содержат: в строке Распределение – название распределения (в данном случае экспоненциальное), параметры распределения, а также значения статистик Колмогорова и омега-квадрат, их уровни значимости и число степ. своб. Сравнивая полученные значимости с 5%, система выдает заключение Гипотеза 0: Распределение не отличается от теоретического для каждого из указанных выше критериев (Рисунок 11).
Рисунок 11- Результаты проверки гипотезы о согласии с теоретическим распределением Сравнение графиков дает основание подтвердить наше предположение об экспоненциальном распределении переменной х2. значимость критериев согласия Колмогорова и омега-квадрат больше 0,05, таким образом нет оснований отвергнуть гипотезу об экспоненциальном законе распределения совокупности, из которой была сделана выборка х2. 9
Оценки асимметрии и эксцесса для переменной х3 дали основание предположить, что и третья совокупность распределена по нормальному закону распределения. Для подтверждения этой гипотезы мы строим гистограмму. Однако гистограмма дает основание выдвинуть гипотезу не о нормальном, а о равномерном характере распределении (Рисунок 12).
Рисунок 12- Гистограмма переменной х3 Поскольку процедура проверки гипотезы на согласие с равномерным законом распределения в Stadia не предусмотрена, то этот этап лабораторной работы необходимо выполнить самостоятельно (вручную либо с применением других программ, например, Excel). Для того, чтобы проверить гипотезу о равномерном распределении Х, т.е. по закону 1 /(b − a ) в интервале (a, b) f ( x) = вне интервала (a, b) 0 надо: 1. Оценить параметры a и b – концы интервала, в котором наблюдались возможные значения Х, по формулам (через а* и b* обозначены оценки параметров): a* = x − 3 ⋅ €s , b* = x + 3 ⋅ €s . 2. Найти плотность вероятности предполагаемого распределения f ( x ) = 1 /( b * −a*) . 3. Найти теоретические частоты:
10
n1′ = nP1 = n[ f ( x) ⋅ ( x1 − a*)] = n ⋅ n 2′ = n3′ = ... = n s −1′ = n ⋅
1 ( x1 − a*); b * −a *
1 ( xi − xi −1 ), (i = 2,3,..., s − 1); b * −a *
1 (b * − x s −1 ). b * −a * 4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k=s-3, где s – число интервалов, на которые разбита выборка. Значение выборочной средней и дисперсии возьмем из результатов описательной статистики для переменной х3 (Рисунок 13). Найдем тем самым оценки параметров равномерного распределения a и b: ns ′ = n ⋅
Рисунок 13- Результаты описательной статистики для переменной х3 a* = 175 − 3 ⋅ 11.3 = 155.43; b* = 175 + 3 ⋅ 11.3 = 194.57. Определим плотность предполагаемого распределения: f ( x ) = 1 /( b * −a*) = 1 /( 194.57 − 155.43 ) = 0.03. Далее определяются теоретические частоты: ′ n1 = 50 ⋅ 0.03 ⋅ ( 158 − 155.43 ) = 3.9 ; ′ n 2 = 50 ⋅ 0.03 ⋅ ( 163.5 − 158 ) = 8.3. Длины каждого следующего интервала, кроме последнего, равны длине второго интервала, поэтому их теоретические частоты совпадают, т.е. ′ ′ ′ ′ n3 = n4 = n5 = n6 = 8.3; ′ n7 = 50 ⋅ 0.03 ⋅ ( 194.57 − 191 ) = 5.4. Чтобы сравнить эмпирические и теоретические частоты, составим таблицу1. Таблица 1 i n n′ (n − n ′ ) (n − n ′ ) 2 (n − n ′ ) 2 /n ′ 1
i
i
i
i
i
i
i
1
6
3,9
2,1
4,41
1,13
2
9
8,3
0,7
0,49
0,06
3
7
8,3
-1,3
1,69
0,20
4
7
8,3
-1,3
1,69
0,20
5
5
8,3
-3,3
10,89
1,31
6
9
8,3
0,7
0,49
0,06
7
7
5,4
1,6
2,56
0,47
Σ
50
i
3,44 11
2 Из расчетной таблицы получаем χ набл = 3,44 . По таблице критических точек распределения χ2 по уровню значимости α=0,05 и числу степеней свободы k=s-3=7-3=4 находим критическую точку правосторонней критической области χ кр2 ( 0 ,05;4 ) = 9 ,5.
Сравнивая наблюдаемое значение χ2 с критическим (3,44