ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования
С...
58 downloads
457 Views
320KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования
Составитель канд. техн. наук доц. Л. А. Прокушев Рецензент канд. техн. наук доц. В. П. Попов
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ Даются методические указания к выполнению лабораторных работ, посвященных методам моделирования систем, подверженных влиянию случайных факторов. Рассмотрены методы статистического моделирования случайных величин с заданным законом распределения на языке высокого уровня с использованием программного обеспечения ЭВМ. Показаны способы получения выборки случайных чисел и построения статистического ряда, а также его визуализации в виде гистограммы на экране ЭВМ. Приведены формулы для получения оценок параметров распределения случайной величины и аппроксимации статистического распределения методом моментов. Рассмотрен способ проверки гипотезы о законе распределения случайной величины с помощью критерия согласия Пирсона. Предназначены для студентов специальности «Системы автоматизированного проектирования», изучающих дисциплину «Математическое моделирование в САПР». Подготовлены кафедрой компьютерных систем проектирования и рекомендованы к изданию редакционно-издательским советом СанктПетербургского государственного университета аэрокосмического приборостроения.
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В САПР Методические указания к выполнению лабораторных работ № 1–3
Редактор А. В. Подчепаева Верстальщик С.Б. Мацапура Подписано к печати 19.07.06. Формат 60х84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 1,25 Уч.-изд. л. 1,0 Тираж 150 экз. Заказ № Редакционно-издательский отдел Отдел электронных публикаций и библиографии Отдел оперативной полиграфии ГУАП 190000, Санкт-Петербург, ул. Б. Морская, 67
Санкт-Петербург 2006
© ГОУ ВПО СПбГУАП, 2006
2
Лабораторная работа № 1 МОДЕЛИРОВАНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ С ЗАДАННЫМ ЗАКОНОМ РАСПРЕДЕЛЕНИЯ. ПОСТРОЕНИЕ ГИСТОГРАММЫ ВВЕДЕНИЕ При проектировании технических объектов и систем возникают задачи оценки количественных и качественных закономерностей их функционирования. Ограниченные возможности экспериментального натурного исследования приборов и систем, а иногда и невозможность такого исследования в силу различных причин, вызывает необходимость использования математических моделей. Построение математических моделей приборов и систем позволяет в соответствующей форме представить процессы функционирования объекта моделирования, что дает возможность при экспериментах с моделью оценить характеристики исследуемых систем при их проектировании. На математической модели проектируемого объекта или системы можно исследовать стохастический (случайный, вероятностный) характер поведения элементов системы и их взаимовлияния с окружающей средой. Цикл лабораторных работ по дисциплине «Математическое моделирование в САПР » включает работы по моделированию случайных факторов, которые необходимо оценить при проектировании систем с использованием такого инструмента проектировщика как языки высокого уровня.
3
Цель работы: получение выборки значений непрерывной случайной величины, распределенной по нормальному закону, и построение гистограммы, визуально отражающей на экране компьютера статистическое распределение выборки случайных чисел. Содержание работы: разработка и отладка алгоритмов и программных модулей получения случайных чисел, вычисления статистического ряда и представления его в виде таблицы, а также построения его гистограммы. 1.1. Методические указания к выполнению работы Статистическим моделированием случайной величины Х с заданным распределением вероятностей называется процесс получения последовательности выборочных значений xi (I = 1, 2, …, n) этой случайной величины. Случайные величины с заданным законом распределения обычно моделируют на компьютере не непосредственно, а на основе использования базового распределения, удовлетворяющего требованиям простоты получения выборочных значений и удобства преобразования в распределение с заданным законом. Этим требованиям удовлетворяет равномерное распределение [1, с. 31–34]. Пусть дана последовательность чисел, являющихся выборочными значениями случайной величины R, имеющей равномерное распределение в интервале [0, 1]. Конкретные значения ri (i = 1, 2, …) такой случайной величины принято называть случайными числами. Для получения последовательностей случайных чисел на компьютере в библиотеке научных программ систем программирования имеется программный генератор (датчик) псевдослучайных чисел с квазиравномерным распределением. Например, в системе программирования языка С++ есть такой генератор-функция random(), который вырабатывает целые случайные числа в интервале [0, 32767].
4
Для получения случайных чисел следует воспользоваться вначале функцией randomize(), задающей начальное число. Равномерно распределенные целые числа получаются функцией random(RAND_MAX) в интервале [0, RAND_MAX], где RAND_MAX = 32767. Равномерно распределенные вещественные числа из интервала [0, 1] можно получить, используя выражение r = (float)random(RAND_MAX)/RAND_MAX. Для проверки равномерности последовательности случайных чисел {ri} можно воспользоваться следующими оценками: среднего значения 1 N r = ∑ ri = 0,5 N i =1 и дисперсии
DR =
1 N 2 ∑ ri = 1/ 3, N i =1
где N – количество чисел. В данной работе предусмотрено изучение случайных величин, распределенных по нормальному закону. Способ преобразования равномерно распределенных чисел в числа с нормальным распределением базируется на использовании центральной предельной теоремы теории вероятностей [2]: пусть Х1, Х2, …, Хn – последовательность взаимно независимых случайных величин с одинаковым распределением, где каждая Хi имеет математическое ожидание а и среднее квадратическое отклонение σ, тогда при n→∞ сумма Х = = Х1+ Х2+ …+ Хn имеет асимптотически нормальное распределение с математическим ожиданием аn = n·a и средним квадратическим отклонением σn = σ n (при этом дисперсия Dn = σn2). Для равномерно распределенной в интервале [0, 1] случайной величины R математическое ожидание а = 1/2 и среднее квадратическое отклонение σ = 1/(2 3) . Если выбрать в качестве слагаемых случайные равномерно распределенные числа ri, получим следую1 n . щие характеристики: an = n / 2, σn = 2 3 На практике можно получить достаточное приближение к нормальному распределению при n = 5÷6, но для удобства вычислений положим n = 12. Тогда для суммы
5
12
xi' = ∑ r j j =1
характеристики аn = 6 и σn = 1, при этом дисперсия Dn = σn2 = 1 (такое нормальное распределение называется нормированным). Путем центрирования математического ожидания придем к стандартному нормальному распределению с характеристиками аn = 0 , σn = 1 и Dn = 1 со значениями, вычисляемыми по формуле: 12
xi' = ∑ r j − 6.
(1)
j =1
График стандартного нормального распределения на декартовой плоскости с координатными осями (Х, Y) имеет вид колоколообразной кривой, симметричной относительно оси Y. Производя обратные операции, из полученной случайной величины можно получить нормально распределенную случайную величину с любыми заданными характеристиками (a, σ) со значениями, вычисляемыми по формуле: (2) xi = σxi' + a. Для оценивания законов распределения случайной величины Х выборочная совокупность случайных чисел {xi } (I = 1, 2, …, n, где n – объем выборки) должна быть соответствующим образом обработана. Одним из способов такой обработки является построение статистического ряда. С этой целью весь диапазон наблюдаемых значений величины Х делится на интервалы (разряды). Шаг h (длина интервала) определяется из соотношения h = (xmax – xmin) / k, (3) где xmax, xmin – соответственно максимальное и минимальное значение xi в выборке; k – число интервалов (k = 10÷15). Левая граница 1-го интервала g0 = xmin, правая граница k-го (последнего) интервала gk = xmax, границы между интервалами gj = xmin + jh, (j = 1, 2, …, k–1). По разделенной на разряды выборочной совокупности строится таблица, которая называется статистическим рядом. Задаются номера разрядов j = 1, 2, …, k; их границы gj–1 – gj ; частота mj – количество значений выборки xi, приходящихся на j-й разряд; относительная частота pj = mj / n; накопленная частота ∑ pj, причем ее зна-
6
чение в последней строке должно быть равно 1 (с точностью машинных вычислений). Таблица Статистический ряд № разряда
Границы разрядов
Частота mj
Относительная частота pj = mj/n
Накопленная частота ∑ pj
1 2 … j … k
xmin – g1 g1 – g2
m1 m2
p1 p2
p1 p1+ p2
gj-1 – gj
mj
pj
p1+…+ pj
gk -1 – xmax
mk
pk
p1+…+ pk
5. Представить на экране гистограмму относительных частот, задав градуировку и значения на осях X и Y. 6. Исходные данные для моделирования необходимо вводить с клавиатуры.
Статистический ряд можно представить графически в виде гистограммы (ступенчатой диаграммы). Для этого на экране компьютера строится декартова плоскость с осям координат (Х, Y). Задав масштаб изображения в окне экрана, позволяющем занять гистограммой большую часть окна, по данным относительных частот (столбцы 1, 2, 4) на каждом разряде строится прямоугольник с высотой, соответствующей в принятом масштабе значению pj. Построенная гистограмма относительных частот является аналогом функции плотности f(x). При увеличении числа объема выборки и уменьшении длины интервалов гистограмма будет приближаться к графику функции плотности распределения случайной величины Х. 1.2. Порядок выполнения работы 1. Составить подпрограмму генератора получения значения равномерно распределенной величины и проверить последовательность таких чисел на равномерность, получив оценки среднего значения и дисперсии для N = 500÷800, и вывести результаты проверки. 2. Составить подпрограмму получения одного значения случайной величины, распределенной по нормальному закону с заданными характеристиками, согласно формулам (1, 2). 3. Получить выборочную совокупность случайных чисел заданного объема. 4. Обработать выборку и представить на экране статистический ряд.
7
8
Лабораторная работа № 2 ОЦЕНИВАНИЕ ПАРАМЕТРОВ И АППРОКСИМАЦИЯ СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Цель работы: по выборке значений статистического распределения вычислить выборочное среднее значение и дисперсию и, рассматривая их как моменты теоретического распределения случайной величины, по этим параметрам построить выравнивающую кривую на графике гистограммы. Содержание работы: разработка и отладка программных модулей для вычисления оценок характеристик случайной величины по выборке и построение выравнивающей кривой на гистограмме на основе метода моментов. 2.1. Методические указания к выполнению работы По имеющейся выборке значений случайной величины Х {x1, x2, …, xn,} можно вычислить характеристики статистического распределения: выборочное среднее 1 n x = ∑ xi (4) n i =1
ные значения называют также статистическим оценками соответствующих характеристик случайной величины. Аналогичным образом могут быть вычислены оценки и других моментов статистического распределения. Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с ограниченностью числа наблюдений и конкретным выбором той или иной совокупности. Для получения более точных сведений и для последующей более удобной обработки можно выполнить аппроксимацию (выравнивание, сглаживание) статистического распределения путем подбора некоторой теоретической кривой, выражающей лишь существенные черты статистического материала, а не случайности, связанные с недостаточностью объема экспериментальных данных. При этом, как правило, вид теоретической кривой выбирается заранее из соображений, связанных с существом задачи. Выравнивание сводится к рациональному выбору тех значений параметров, входящих в аналитическое выражение кривой распределения, при которых соответствие между статистическим и теоретическим распределениями оказываются наилучшими. Для решения этой задачи чаще всего используются метод наименьших квадратов и метод моментов. Рассмотрим метод моментов как более простой. Предположим (т.е. примем гипотезу), что экспериментальные значения в выборке {x1, x2, …, xn} распределены по нормальному закону, функция плотности которого выражается формулой:
и выборочную дисперсию 2
1 n 1 ⎛ n ⎞ DX = ∑ xi2 − 2 ⎜⎜ ∑ xi ⎟⎟ . n i =1 n ⎝ i =1 ⎠
(5)
Согласно закону больших чисел при неограниченном увеличении числа наблюдений (объема выборки) эти характеристики будут приближаться (сходиться по вероятности) к математическому ожиданию и дисперсии случайной величины Х. При ограниченном числе опытов эти величины будут случайными (для разных выборочных совокупностей они будут иметь разные значения), тем не менее они могут быть приняты как приближенные оценки характеристик случайной величины Х, вычисленные на основе данной выборочной совокупности. Поэтому эти выбороч-
9
f ( x) =
1
−
( x −a )2 2σ2
, (6) σ 2π где параметры: а – математическое ожидание; σ – среднее квадратическое отклонение; σ2 – дисперсия. Метод моментов сводится к такому подбору параметров выбранной кривой закона распределения, чтобы несколько важнейших числовых характеристик (моментов) теоретического распределения были равны соответствующим статистическим характеристикам. Для нормального распределения с двумя параметрами – математическим ожиданием а и дисперсией σ2 их следует определить так, чтобы
10
e
обеспечить равенство среднему выборочному x и выборочной дисперсии S2 = DX . Для этого примем а = x , σ2 = S2 и подставим в выражение (6) для функции плотности f ( x) =
1
−
ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
( x − x )2 2S 2
. e (7) S 2π Затем вычисляем значения f(x) в пределах границ выборки статистического ряда [xmin, xmax] и на графике гистограммы строим выравнивающую кривую. 2.2. Порядок выполнения работы 1. Составить подпрограмму вычисления значений выборочного среднего и выборочной дисперсии согласно формулам (4, 5) и вывода на экран. 2. Составить подпрограмму вычисления значений функции плотности в пределах границ выборки по формуле (7) и вывода выравнивающей кривой на графике гистограммы.
11
Лабораторная работа № 3
Цель работы: проверить гипотезу о мере расхождения экспериментального и теоретического распределений с помощью критерия согласия Пирсона. Содержание работы: разработка и отладка программных модулей проверки гипотезы о законе распределения случайной величины. 3.1. Методические указания к выполнению работы При выравнивании статистического ряда принимается гипотеза о том, что закон распределения изучаемой выборочной совокупности значений случайной величины имеет вид f(x), например, в нашей работе – нормальный закон (6). Однако между гипотетической теоретической кривой и статистическим распределением неизбежны явные расхождения. График плавной теоретической кривой накладывается на ступенчатую фигуру гистограммы, и при этом наблюдаются выбросы и провалы последней относительно графика функции. Методы проверки статистических гипотез называются критериями согласия [2]. Критерий согласия – это специально подобранная случайная величина H(x1, x2, …, xn,), являющаяся функцией выборки, определяющая меру расхождения экспериментального и теоретического распределений. Гипотеза, которая проверяется, называется нулевой и обозначается Н0, а гипотеза, которая противопоставляется нулевой, называется альтернативной (или альтернативой) – Н1. Выделение гипотезы Н0 состоит в том, что нулевая гипотеза рассматривается как утверждение, которое более важно, если оно отвергнуто. При проверке гипотез возможны два рода ошибок. Ошибка 1-го рода – когда отвергается верная гипотеза Н0. Ошибка 2-го рода – когда принимается неверная гипотеза Н0. Вероятность ошибки 1-го рода принято обозначать α = р (отвергается Н0 | неверна Н1 ) (символ | обозначает «при условии, что»).
12
Величина α называется уровнем значимости критерия, и ее значения должны быть малыми (α = 0,1; 0,05; 0,01 и т.д.), так как ошибка 1-го рода должна совершаться как можно реже. При этом минимизируют ошибку 2-го рода. Вероятность ошибки 2-го рода принято обозначать β = р (принимается Н0 | верна Н1 ). Вероятность дополнительного события π = 1 – β, т.е. правильного отклонения неверной гипотезы Н0 называется мощностью критерия. После выбора определенного критерия множество всех его значений разбивают на два непересекающиеся множества: одно содержит те значения, при которых гипотеза Н0 отвергается, другое – при которых она принимается. Точку, отделяющую эти два подмножества, называют критической – hкр. Для ее нахождения задаются достаточно малой вероятностью – уровнем значимости α и исходят из требования, чтобы при условии справедливости принятой гипотезы, вероятность того, что критерий Н примет значение больше hкр была равна принятому уровню значимости: р(Н > hкр) = α. Для проверки принятой гипотезы по данным выборки вычисляют частные экспериментальные значения Нэксп критерия Н. Тогда, если Нэксп ≤ hкр, то отклонение считается незначимым и говорят, что данные выборки не противоречат сделанному предположению о виде закона распределения. Если же Нэксп ≥ hкр, то отклонение от теоретического закона распределения считается значимым и принятая гипотеза отвергается. Поэтому вид теоретической кривой требует замены и новой проверки. В статистике разработан ряд критериев согласия как случайных величин, обладающих одной основной особенностью: при достаточно большом числе выборочных значений законы распределения критерия согласия практически не зависят от закона распределения изучаемой совокупности. Одним из наиболее часто применяемых критериев является критерий согласия Пирсона (критерий χ2 – «хи-квадрат» [2]). При вычислении этого критерия пользуются статистическим рядом. За меру расхождения принимают разность между относительными частотами mj /n и гипотетическими теоретическими вероятностями pj попадания значений случайной величины Х в интервалы статистиче-
13
ского ряда, или, иначе говоря, между частотами mj и теоретическими данными npj. Формула для вычисления экспериментального значения Нэксп имеет вид [2] k ( m − np ) 2 j j χ2 = ∑ , (8) np j j =1 где k – количество интервалов статистического ряда; n – объем выборки; mj – частота попадания значений xi в j-й интервал; pj – вероятность попадания в j-й интервал, вычисленная для теоретического распределения. При n→∞ закон распределения этой величины не зависит от закона распределения выборки и стремится к так называемому «распределению χ2» с r = k – l – 1 степенями свободы. Здесь k – количество интервалов статистического ряда; l – число параметров теоретического распределения (для нормального распределения, имеющего два параметра а и σ, l = 2); 1 вычитается, чтобы учесть тот факт, что сумма вероятностей по всем интервалам равна 1. В случае применения критерия Пирсона используется таблица критических точек распределения χ2, которая имеет два входа: α – уровень значимости критерия и r – число степеней свободы. Каждой паре значений α и r в табл. 1 соответствует значение χα2 , удовлетворяющее условию p (χ 2 ≥ χ α2 ) = α . Для проверки принятой гипотезы вычисляется χ 2эксп , затем по заданному уровню значимости α и числу степеней свободы r (в нашем случае r = k – 3) находится χα2 . Если χ 2эксп < χα2 , гипотеза принимается (можно утверждать, что данные выборки не противоречат принятой гипотезе), а в противном случае отвергается. Необходимо учитывать, что критерий Пирсона применяется при частоте попаданий mj ≥ 5÷8. Поэтому, если есть малочисленные разряды, их следует объединить с соседними разрядами. 3.2. Порядок выполнения работы 1. Составить подпрограмму объединения интервалов с малым числом значений величины Х. Разряды, идущие от xmin, следует при-
14
соединять к правым разрядам, а идущие от xmax – к левым. При этом должно измениться число интервалов k и значения их границ gj. 2. Вычисляются вспомогательные величины z j = ( g j − x ) / S , где gj – новые значения границ интервалов; x , S – среднее значение и среднее квадратическое отклонение выборочной совокупности. Тем самым путем центрирования и нормирования мы снова переходим к стандартному нормальному распределению. 3. Составить подпрограмму вычисления интеграла по методу трапеций (или Симпсона), необходимую для вычисления теоретических вероятностей в формуле (8). 4. Для вычисления вероятностей принимается, что левый конец первого разряда g0 = – ∞, а правый конец последнего разряда gk = ∞. Вычисляются вероятности x−x ⎛ ⎞ < z j +1 ⎟ = Φ ( z j +1 ) − Φ ( z j ) p j = p ( g j ≤ x < g j +1 ) = p ⎜ z j ≤ S ⎝ ⎠ согласно гипотезе о нормальности всей совокупности значений случайной величины с использованием формулы интеграла вероятности (функции Лапласа)
Φ( zi ) =
1 2π
zi
∫e
−
t2 2 dt
8. Составить общий отчет по всем работам и защитить его, представив на экране компьютера все этапы моделирования заданного закона распределения случайной величины. Таблица 1 Таблица критических точек распределения Пирсона 5
6
7
8
9
10
11
12
13
χ
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
2 α
Таблица 2 Таблица результатов моделирования нормального закона распределения №
1 … k
,
0
при этом Ф(– ∞) = – Ф(∞), а Ф(∞) = 0,5. 5. Вводится в программу таблица критических точек распределения χ2 с двумя входами: с заданным уровнем значимости α = 0,05 и определяемым числом степеней свободы r = k – 3. Каждой паре значений α и r в табл. 1 сопоставлено число χα2 , удовлетворяющее условию p (χ 2 ≥ χ α2 ) = α . 6. Вычисления χ 2эксп по формуле (8) сводятся в таблицу результатов моделирования заданного распределения (табл. 2). Под таблицей следует вывести сумму трех последних столбцов. Сумма последнего столбца дает значение χ 2эксп . 7. Сравнивая χ 2эксп и χα2 из таблицы критических точек, необходимо сделать вывод о принятой гипотезе.
15
r
16
(gj-1, gj)
zj
Ф(zj)
pj
mj
(mj – n pj)2 / n pj
ЗАДАНИЯ ПО ЛАБОРАТОРНЫМ РАБОТАМ
Библиографический список
Условные обозначения: n – длина выборочной совокупности (объем выборки); a – математическое ожидание случайной величины; σ – среднее квадратическое отклонение; k – число интервалов (разрядов) диапазона выборочных значений случайной величины. Вариант
Значения
Вариант
Значения
1
n = 150, a = 1 σ = 2, k = 10 n = 180, a = 3 σ = 3, k = 12 n = 170, a = 4 σ = 6, k = 13 n = 190, a = 3 σ = 4, k = 11 n = 200, a = 1 σ = 3, k = 13 n = 170, a = 2 σ = 3, k = 11 n = 200, a = 4 σ = 2, k = 12 n = 180, a = 1 σ = 3, k = 10 n = 150, a = 2 σ = 2, k = 11 n = 190, a = 4 σ = 3, k = 12
11
n = 170, a = 2 σ = 5, k = 11 n = 190, a = 3 σ = 2, k = 10 n = 150, a = 1 σ = 4, k = 12 n = 180, a = 2 σ = 3, k = 11 n = 160, a = 3 σ = 2, k = 12 n = 190, a = 1 σ = 2, k = 12 n = 170, a = 4 σ = 4, k = 13 n = 190, a = 3 σ = 2, k = 11 n = 160, a = 3 σ = 4, k = 11 n = 200, a = 5 σ = 4, k = 13
2 3 4 5 6 7 8 9 10
17
12 13 14 15 16 17 18 19 20
1. Сольницев Р. И., Прокушев Л. А. Моделирование в проектировании и производстве: Учеб. пособие / СПбГУАП. СПб., 1992. 95 с. 2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1968. 720 с.
18
СОДЕРЖАНИЕ
Введение .........................................................................................3 Лабораторная работа № 1. Моделирование случайной величины с заданным законом распределения. Построение гистограммы...............................................4 Лабораторная работа № 2. Оценивание параметров и аппроксимация статистического распределения случайной величины.......................................................9 Лабораторная работа № 3. Проверка гипотезы о законе распределения случайной величины...........................12 Задания по лабораторным работам ............................................17 Библиографический список ........................................................18
19