МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образователь...
264 downloads
212 Views
968KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования «Оренбургский государственный университет»
В.Б. ШАШКОВ
ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ И ПОСТРОЕНИЕ ЭМПИРИЧЕСКИХ ФОРМУЛ КУРС ЛЕКЦИЙ
Рекомендовано Ученым советом государственного образовательного учреждения высшего профессионального образования « Оренбургский государственный университет » в качестве учебного пособия для студентов, обучающихся по программам высшего профессионального образования по инженерно-техническим специальностям и для аспирантов
Оренбург 2005
ББК 22.18.7 Ш 12 УДК519.6 (076.5)
Рецензент доктор технических наук, заведующий кафедрой вычислительной техники Тарасов В.Н.
Ш 12
Шашков В.Б. Обработка экспериментальных данных и построение эмпириче ских формул. Курс лекций. : Учебное пособие.- Оренбург: ГОУ ОГУ, 2005. – 150 с. ISBN........... Настоящее учебное пособие посвящено описанию наиболее распространенных методов обработки результатов наблюдений, в частности - регрессионного анализа и линеаризации функций. В изложении сделан упор на практическую сторону применения этих методов для аппроксимации табличнозаданных экспериментальных функций. Пособие содержит также примеры научного планирования экспериментов. На основе разработанного автором метода синтезирования задач многофакторной многостепенной регрессии для учебных целей подготовлены и включены в пособие тридцать учебных задач такого вида. Учебное пособие предназначено для прохождения курса «Обработка экспериментальных данных на ЭВМ » студентами вузов инженерно-технических специальностей, для преподавателей, ведущих учебные дисциплины, связанные с обработкой результатов наблюдений и для аспирантов. Оно может быть использовано инженерами и научными сотрудниками в области технических наук. ББК 22.18.7
Ш-------------------------------------
ISBN.... 2
Шашков В.Б., 2005 ГОУ ОГУ, 2005
Введение Настоящее учебное пособие подготовлено на основе лекционного курса, который автор читал в течение ряда лет студентам и сотрудникам Оренбургского государственного университета. При его подготовке автор ставил перед собой в основном две задачи. Первая – создать для студентов, аспирантов и научных сотрудников практическое пособие для построения эмпирических формул, которые являются математическими моделями объекта исследования в виде полиномов регрессии. Стремление сделать это пособие доступным широкому кругу лиц заставило отказаться от строгого теоретического изложения материала, которое заменено наглядными примерами – как, например, это сделано при выводе основного уравнения регрессионного анализа в разделе 10.1. Вторая задача возникла в связи с тем обстоятельством, что в учебной литературе до сих пор отсутствуют учебные задачи по многофакторной и многостепенной регрессии. В учебных пособиях в лучшем случае содержатся однофакторные задачи для уравнений второй степени. В настоящем пособии приведены задачи построения многостепенных полиномов с любым количеством аргументов-факторов. Разработано содержание и методика практикума по их решению. Пособие предназначено в первую очередь для студентов и преподавателей втузов, а также для всех лиц, перед которыми стоит задача создания математической модели объекта исследования в виде алгебраических степенных полиномов или нелинейных функций парной связи.
3
1 Лекция 1. Эксперимент и обработка экспериментальных данных на примере конкретного объекта исследования 1.1 Объект исследования – тепловой котел. Создание логической модели объекта. Планирование эксперимента на основе этой модели. Чтобы сразу пояснить сущность предмета настоящей учебной дисциплины, рассмотрим конкретный пример постановки и решения исследовательской задачи, не претендуя на объективную строгость ее изложения. Примем за объект исследования тепловой котел как наглядный пример условий и цели эксперимента. Котел производит тепло – например, Q ккал/ч, затрачивая топливо, например, V м3/ч – если топливо газ, или М тн/ч, если топливо мазут. Очевидна Q Q и наглядна задача оптимизации работы котла – отношение q = или q = V М должно быть максимальным, насколько это возможно. Но чтобы этого достичь, нужно иметь математическую модель котла, некую функцию типа q = f ( X 1, X 2, X 3, X 4,......) , где аргументы – это какие-то факторы, определяющие работу котла и выход тепла за какой-то период времени. Имея такое уравнение, величину q можно максимизировать обычными методами математического анализа, а также прогнозировать поведение объекта с изменением условий работы, т.е. с изменением факторов X 1, X 2, X 3, X 4 и т.д. С учетом этих положений начинаем построение и планирование эксперимента. Прежде всего так или иначе определяется круг факторов X 1, X 2, X 3, X 4 и других (например, на заседании совета технических экспертов - профессионалов). Ограничимся для нашего примера всего четырьмя факторами X . Очевидно, что на теплоотдачу котла в первую очередь будут влиять параметры физического состояния теплоносителя – пара. Пусть первым фактором X 1 будет давление пара, а вторым - X 2 - его температура. Третьим фактором эксперты назначим площадь теплообмена между продуктами сгорания топлива и паром, четвертым – вид топлива и т.д. и т.п. Каждый фактор имеет практически допустимый диапазон значений, из которого выходить недопустимо. Эксперимент и будет заключаться в том, что численные значения факторов X 1, X 2, X 3, X 4 будут меняться, а вызванное этим изменение теплоотдачи котла будет фиксироваться. Существует строго научная теория планирования экспериментов, направленная на получение максимальной информации при минимальных затратах средств и времени. Изложение ее является предметом специальных учебных курсов. Пример такого планирования будет приведен в лекции 14. Не касаясь здесь существа этого специального предмета, ограничимся здесь нестрогим примером, чтобы проиллюстрировать существо вопроса. 4
При планировании эксперимента диапазон значений факторов от хmin до xmaх так или иначе должен быть разбит на ряд промежуточных значений. Таким образом, воздействие каждого фактора на объект меняется, соответственно изменяются и показатели теплоотдачи котла. Возьмем для нашего примера для каждого фактора девять таких уровней (с равным шагом), обозначив их номерами от 1 (для хmin) до 9 (для xmaх). Для экспериментального воздействия на объект исследования – тепловой котел - при одном наблюдении (опыте) эти уровни значений разных факторов сочетаются случайным образом. Для нашего примера запланируем пятьдесят наблюдений, при этом сочетания случайных значений факторов x для каждого наблюдения зададим, например, следующим образом: randomize; For i:=1 to 50 do begin x1[i]:=random(9)+1; x2[i]:=random(9)+1; x3[i]:=random(9)+1; x4[i]:=random(9)+1; end; что и задаст по каждому шагу цикла пятьдесят вариантов сочетаний значений факторов х1,х2,…,хк для пятидесяти наблюдений. Проведя компьютерное решение этой задачи, и записав полученные значения в таблицу по колонкам х1,х2,…,хк, получили промежуточную таблицу планирования эксперимента, где в каждой клетке таблицы стоит одно из девяти значений уровней каждого фактора. Таблица 1 – Планирование эксперимента
g
x1
x2
x3
x4
1
8
2
3
7
2
1
9
3
4
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
50
7
3
6
5
y
Подставив в таблицу фактические значения каждого из этих уровней и включив в нее колонку для неизвестных пока откликов объекта исследования 5
ния у, получим таблицу плана эксперимента, приведенную ниже ( где фактические численные значения заменены алгебраическими выражениями. Таблица 2 – План эксперимента
g
x1
x2
x3
x4
1
x11
x21
x31
x41
2
x12
x22
x32
x42
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
50
x150
x250
x350
x450
y
Каждая g-тая строка таблицы и называется одним опытом или наблюдением. Теперь назначается период времени для экспериментальной работы котла по режиму каждой строки таблицы 2 (например, одна неделя). В течение этого периода фиксируется теплоотдача котла и усредненные за этот период ее показатели заносятся в таблицу в виде экспериментального значения величины у1, у2, у3 и т.д.. Когда столбец откликов уg будет заполнен полностью, все числовое содержание таблицы и составит так называемые эксперименталные данные, а сама таблица теперь будет называться таблицей экспериментальных данных. Она представляет собой таблично заданную функцию – зависимость теплоотдачи котла у от факторов X 1, X 2, X 3, X 4 . Любая зависимость между переменными у и х может быть представлена разными способами: в виде графика, таблицы или в аналитическом виде – в виде математической модели –уравнения, системы уравнений или алгоритма (компьютерной программы). При проведении эксперимента его результатом является представление объективно существующей зависимости q = f ( X 1, X 2, X 3, X 4,......) в виде таблицы экспериментальных данных. Пример выходных результатов эксперимента представлен таблицей 3. Каждая строка таблицы экспериментальных данных с индексом "g" и является единичным наблюдением или опытом. Цель обработки экспериментальных данных заключается в том, чтобы эту табличную, аналитически неизвестную зависимость между переменными 6
Таблица 3- Таблица экспериментальных данных G 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
X1 2 79.49 86.57 86.35 87.42 93.39 90.56 91.95 96.93 97.80 97.79 97.60 98.09 97.76 95.39 95.62 95.20 95.08 92.58 91.02 89.75 90.00 88.68 86.61 86.00 84.26 81.12 79.18 78.08 77.23 74.83 72.40 71.41 70.02
X2 3 81.59 73.26 74.05 73.80 53.84 47.03 46.98 34.58 29.56 23.62 18.09 14.82 12.67 12.52 11.88 11.12 9.95 7.87 6.84 5.54 4.87 4.03 3.97 3.15 2.96 2.78 2.74 2.61 2.00 1.78 1.14 1.88 2.54
X3 4 10.30 15.16 11.66 11.98 14.24 15.45 17.03 32.09 32.89 33.66 38.20 40.12 42.92 46.58 66.43 69.19 70.84 75.25 74.63 78.04 81.73 71.31 86.54 91.54 96.33 92.26 92.21 91.03 91.43 105.47 108.82 105.55 102.61
X4 5 17.28 17.63 18.12 19.21 20.35 22.73 24.57 34.99 36.55 35.70 33.91 32.51 31.84 30.20 29.90 29.17 29.01 28.60 28.45 27.40 26.29 27.93 27.00 26.11 25.56 25.74 23.18 22.33 20.41 20.11 19.45 18.67 16.98
X5 6 128.77 127.92 129.38 128.32 120.77 115.62 114.82 91.22 86.88 80.14 72.56 69.79 66.93 53.30 44.72 33.80 31.38 24.18 13.42 10.39 9.48 7.58 6.93 5.21 4.72 5.34 5.38 5.93 6.96 9.53 15.18 15.86 15.93
Yg 7 76.84 105.26 91.93 104.85 88.75 85.58 87.30 104.02 90.49 80.47 80.52 74.77 74.66 83.68 73.69 67.71 63.11 62.94 61.99 59.03 51.75 66.13 62.85 60.44 66.34 76.09 74.95 77.06 78.44 85.09 92.35 88.89 89.71
7
Продолжение таблицы 3 1 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
2 67.07 64.42 62.31 62.19 59.41 55.30 54.90 54.29 51.06 48.18 49.89 48.26 49.46 50.19 51.77 52.88 53.44
3 3.38 4.91 7.25 8.57 12.45 19.13 25.06 32.26 37.43 43.45 44.42 44.65 49.28 43.70 39.10 37.76 35.00
4 118.02 121.80 122.87 123.18 118.37 135.20 136.76 137.59 146.84 144.47 145.10 141.06 140.87 141.92 142.88 143.00 145.01
5 12.03 10.42 9.42 8.17 7.53 6.99 3.87 3.46 4.54 6.00 6.02 6.00 7.86 7.69 9.03 9.11 9.99
6 16.06 19.54 20.60 23.83 24.81 29.13 32.18 37.97 43.52 50.54 50.75 51.76 52.25 46.38 39.51 37.12 35.22
7 109.20 115.02 116.32 110.69 111.45 106.09 95.78 76.53 82.01 75.64 69.94 65.95 63.13 72.14 90.26 93.87 94.99
х и откликами у, представить в виде математической модели, т.е. уравнения, которое "достаточно точно" согласовывала бы расчётные и табличные значения отклика объекта у. 1.2 Эксперимент, наблюдение (опыт), экспериментальные данные – основные термины и положения Объект исследования – это объект любого характера (технического, социального, экономического, астрономического и т.д. и т.п.), который изучается экспериментальным путем. Эксперимент – это специальным образом спланированная и организованная процедура изучения некоторого объекта исследования, при которой на этот объект оказывают запланированные воздействия и регистрируют его реакции на эти воздействия. Факторы – это воздействия на объект. Мы будем обозначать факторы величинами х1,х2,…,хk. Откликами объекта исследования называют его реакции на воздействия; будем обозначать их символом уg. Эксперимент состоит из ряда опытов (или наблюдений), при которых каждый из факторов х1,х2,…,хк имеет разное значение. Номер опыта т.е. но8
мер строки таблицы 2) отражают индексом при факторах и откликах, т.е. для пятого, например, наблюдения будем иметь х15,х25,…,хк5 и у5, а в общем виде будем использовать индекс g, т.е. обозначения х1g,х2g,…,хкg и уg. Экспериментальные данные – все исходные и выходные числовые данные эксперимента, сведенные в таблицу экспериментальных данных. Обработка экспериментальных данных – различные методы построения математической модели объекта по таблице экспериментальных данных. Регрессионный анализ – наиболее распространенный метод обработки данных, который включает в себя метод наименьших квадратов. При регрессионном анализе таблица экспериментальных данных обычно отражается алгебраическими степенными полиномами, которые называют полиномами или уравнениями регрессии. Отсюда термины – задача регрессии, коэффициенты регрессии и т.п. Сам термин регрессия отражает тот факт, что с увеличением степени полинома точность отражения таблицы кспериментальных данных обычно возрастает, а ошибка отражения соответственно уменьшается, регрессирует. Управляемые факторы - это такие воздействия на объект исследования, численные значения которых определяются и контролируются самим экспериментатором. Активный эксперимент – это эксперимент, в котором задействованы только управляемые факторы. Пример – изучение зависимости урожайности какой-либо сельскохозяйственной культуры от объемов орошения. Эти объемы для различных экспериментальных полей посева назначаются самим исследователем. Контролируемые факторы - это такие воздействия на объект исследования, численные значения которых экспериментатором не устанавливаются, но значения их исследователь может измерять, контролировать и фиксировать. Пассивный эксперимент – это эксперимент, в котором задействованы только контролируемые факторы. Пример – изучение зависимости урожайности сельскохозяйственной культуры от объемов атмосферных осадков, которыми экспериментатор управлять не может. Активно-пассивный (или пассивно-активный) эксперимент – это совмещение обоих видов эксперимента, когда зависимость урожайности изучается от совместного объема и орошения и атмосферных осадков. Основным «рабочим инструментом» и эксперимента и обработки экспериментальных данных является численное значение факторов воздействия и откликов объекта исследования, т.е. число. Какова ни была бы природа факторов и откликов, включая в том числе эмоции или впечатления, они должны быть выражены количественно, числом. Числа при экспериментировании получают тремя способами: - подсчетом, - измерением, 9
- методом экспертных оценок. Примером последнего способа является бальная оценка членами жюри выступления спортсменки по художественной гимнастике. Сюда же относится и оценка, выставляемая студенту преподавателем на экзамене.
10
2 Лекция 2. Точность и погрешности вычислений, способы их оценки и уменьшения погрешностей 2.1 Понятие приближенного числа и погрешности Анализ точности результата вычислений является важной составной частью вычислительного процесса. В свое время Гаусс отмечал: “Недостатки математического образования с наибольшей отчетливостью проявляются в чрезмерной точности численных расчетов.” Реальная оценка практически достижимого уровня точности способствует не только экономии сил и средств, но часто связана с вопросами надежности достигнутых результатов и безопасности их прикладного использования. Это тем более существенно для процесса обработки экспериментальных данных, когда к обычным источникам ошибок входных величин и вычислений добавляется случайный характер основной экспериментальной величины - опытного значения изучаемой функции в виде отклика объекта исследования. Анализ точности результата вычислений осуществляется на основе понятия погрешности. Пусть х1 -истинное значение некоторой величины, а xr - то значение, которое мы присваиваем ей в ходе эксперимента или экспертной оценки. Перечисленным процессам всегда присущи некоторые неизбежные ошибки (даже если не брать во внимание факторы случайности - влияние шума при определении отклика объекта исследования). Известно, например, что результат любого измерения в силу самой своей природы содержит ошибку. Поэтому значение xr называют приближенным значением изучаемой величины или просто приближенным числом. Абсолютная погрешность ∆x любого приближенного числа есть абсолютная величина разности между истинным значением величины х1 и ее данным приближенным значением xr, т.е. ∆x = x 1 − xr . Истинное значение величины часто неизвестно и поэтому под оценкой абсолютной погрешности принимают установление неравенства вида
x1− xr ≤ ∆x
p
,
(1)
где ∆x p - предельная абсолютная погрешность. Понятие предельной абсолютной погрешности означает число, которое не меньшее любого возможного значения абсолютной погрешности (причем при наименовании ∆x p термин “предельная” обычно опускают). Существует принятый характер записи приближенных чисел, при котором абсолютная погрешность равна половине единицы последнего разряда, записываемого при обозначении данного числа. Это означает, что контекст записанных чисел 3,14 и 3,1416 требует разной точности указанных величин, а именно 0,005 в первом и 0,00005 - во втором случае. Если же обозна11
чение числа имеет большее количество цифр, чем это требуется по установленной точности, их следует округлить. Правила округления общеизвестны; отметим только, что если требуется отбросить цифру пять, то четная последняя оставшаяся в записи цифра сохраняется, а нечетная - увеличивается на единицу. Такие правила записи чисел действуют при записи экспериментальных данных и в математических таблицах. В этой форме записи все цифры, означающие данное число, являются верными. В окончательных результатах расчета принято записывать числа, сохраняя одну недостоверную цифру за последней верной, причем предельную абсолютную погрешность указывают за этим результатом после знака “±”. Пусть, например, при расчете получено число 271,734 с предельной абсолютной погрешностью 0,043. Тогда последняя верная цифра - 7 после запятой, а последняя записываемая цифра - 3 после 7 и, согласно правилам, результат должен быть записан как 271,73 ± 0,05. Но абсолютная погрешность характеризует точность приближенного числа явно недостаточно. Действительно, что такое абсолютная погрешность в 0,5 метра? Она недопустимо велика для отмеривания куска ткани в магазине и недопустимо мала для измерения расстояния между двумя городами. Таким образом, пригодность абсолютной погрешности выявляется только при сопоставлении с практическим значением данной переменной. При сопоставлении этих величин устанавливается значение так называемой относительной погрешности. Относительная погрешность dx определяется как отношение абсолютной погрешности ∆x (или ∆x p ) к модулю истинного значения x1, т.е.
dx =
∆x . x1
(2)
При оценке относительной погрешности обычно пользуются понятием предельной относительной погрешности dx p , которое удовлетворяет неравенству
dx ≤ dx p .
(3)
Это отношение иногда выражают в процентах умножением на 100 (процентная погрешность). Погрешности в силу разных источников их происхождения классифи цируют как инструментальные, методические и неустранимые или наследственные. Инструментальные погрешности связаны с конечной точностью представления исходной информации. Они вызываются, например, округлением значений входных величин или точностью их измерений. 12
Методические погрешности обусловлены тем, что многие задачи решаются приближенно с использованием специальных численных методов. Это, в частности, относится к тригонометрическим, логарифмическим, показательным и др. функциям. Наследственные погрешности - это погрешности результата вычислений, вызванные распространением или трансформацией погрешностей исходных данных при прохождении их по вычислительному алгоритму через ряд промежуточных результатов. Именно неустранимые погрешности являются объектом нашего изучения. 2.2 Оценка погрешностей вычислительного процесса В связи с изложеным возникают практические задачи, имеющие важное значение. Такими задачами, в частности, являются следующие. Независимая переменная х известна с некоторой точностью. С какой точностью при этом можно найти значение функции y = f ( x ) по конкретной математической зависимости? Аналогично формируется и обратная задача : если необходимо рассчитать значение функции y с определенной точностью, то какова должна быть точность определения входного значения переменной х ? В большинстве технических расчетов удовлетворительным считается такой уровень точности результата, при котором его максимальная относительная погрешность составляет от 0,1 до 5 % . Так, например, при переходе от старых единиц к Международной системе единиц (СИ) перевод килограмма силы в ньютоны можно осуществить введением множителя 10 вместо более точного множителя 9,81. Ошибка при этом составит 10 − 9 ,81 = 2 %, 9 ,81
что в большинстве случаев вполне допустимо. Однако, такой уровень точности бывает и неприемлемым. Так, например, при запуске искусственных спутников Луны с околоземной орбиты вторую космическую скорость (около 11200 м/с) требуется выдержать с ошибкой, не превышающей 0,0002%. В противном случае запускаемый аппарат станет спутником не Луны, а Солнца. Трансформация наследственных погрешностей при осуществлении вычислительного процесса осуществляется по определенным закономерностям. Наиболее важные случаи распространения ошибок приведены в табл. 4. Они, в частности, отвечают следующим правилам: - при сложении ( вычитании) величин, содержащих ошибку, абсолютная погрешность их суммы (разности) равна сумме абсолютных погрешностей слагаемых (или уменьшаемого и вычитаемого); - при умножении (или делении) относительная ошибка произведения (частного) равна сумме относительных ошибок сомножителей (делимого и делителя); 13
- предельная относительная погрешность степени равна предельной погрешности основания, умноженной на абсолютную величину показателя степени. Таблица 4 - Распространение ошибок при вычислительных операциях Операция вычисления Сложение Вычитание Умножение Деление
Возведение в степень*
Вид функции х1+x2 x1-x2 x1×x2 x1/x2 xn
Абсолютная ошибка
Относительная ошибка
∆x1 + ∆ x2 ∆x1 + ∆ x2 ∆x1×x2+∆x2×x1
(∆x1+∆x2)/x1+x2 (∆x1+∆x2)/x1-x2 ∆x1/x1+∆x2/x2 ∆x1/x1+∆x2/x2
(∆x1×x2+∆x2×x1)/ х22 ∆x ×n × x n-1
n× ∆x/x
*Показатель степени n может принимать произвольные значения. Если n правильная дробь, то ошибка уменьшается. Рассмотрим некоторые примеры применения этих положений. Пример 1. Диаметр круга D определен с некоторой погрешностью. Как определить погрешность величины площади круга S, вычисленной по формуле
D2 S =π ⋅ 4
?
В нашем распоряжении мерная линейка и круг, вырезанный ножницами из жести по предварительно нанесенному контуру. Измеренный диаметр D составил 5 см, абсолютную погрешность для данных условий изготовления круга и измерения его диаметра оценивают как ± 2 мм. Тогда предельная относительная погрешность равна
0 ,2 ⋅ 100 = 4 % и поскольку в вычислении за5
ложена операция умножения D×D, то согласно правилу 2, относительная погрешность вычисленной площади S круга составит ∆S/S = ∆D/D + ∆D/D = 4 + 4 = 8 %. Тогда абсолютная погрешность площади круга ∆S = 0,08 ×S = 0,08 ×19,625 = 1,57 см2.
Пример 2. Известно, что площадь квадрата равна 12,34 см2.С какой погрешностью должна быть измерена сторона квадрата, чтобы расчет площади квадрата по ней обеспечил указанную точность? 14
Из выражения площади следует, что она дана с предельной абсолютной погрешностью 0,005 см 2, тогда относительная погрешность составит (0,005/12,34) ×100 = 0,04 %. Так как длина стороны квадрата L есть S в степени 0,5, то согласно третьему правилу распространения ошибок
∆L/L×100=|0,5|×0,04=0,02%, откуда абсолютная погрешность измерения стороны квадрата составит ∆L= S ×0,02/100=0,0007 см. Измерение стороны квадрата с такой малой погрешностью потребует специальных методов. 2.3 Рекомендации по уменьшению погрешностей вычислений Анализ закономерностей формирования наследственных погрешностей результатов вычислений позволяет сделать следующие выводы относительно способов уменьшения значения этих погрешностей: - при сложении и вычитании длинной последовательности чисел следует сначала оперировать с наименьшими по модулю числами; - следует избегать вычитания близких по значению чисел, предпочи тая формулы вида S = π (2r + h)h , где S-площадь кругового кольца, r – внутренний радиус; h – толщина кольца. алгебраически равноценным формулам вида
S = π [(r + h)2 − r 2 ; - нужно избегать сложения чисел, отличающихся на несколько порядков, преобразуя вычисления соответствующим образом ; - при сложении длинной последовательности чисел целесообразно разделение ее на группы. Сложение ведут сначала внутри групп, а затем между группами с учетом требований предыдущего пункта . - для уменьшения погрешностей округления чисел промежуточные действия рекомендуется производить, сохраняя после запятой на 1-2 знака больше, чем требуется в окончательном результате.
15
3 Лекция 3. Математическая модель объекта исследования в виде алгебраического степенного полинома 3.1 Основные задачи исследования и назначение математической модели Термин «исследование» - более широкое понятие, чем «эксперимент», т.к. включает в себя и его предварительную подготовку (сбор, анализ и обработку исходных данных) и проведение самого эксперимента и, наконец, обработку выходных данных. С этой точки зрения основными составляющими исследования являются следующие задачи. Статистический анализ (точечное и интервальное оценивание, проверка статистических гипотез) вовлекаемых в эксперимент факторов, а впоследствии и откликов объекта исследования. Следствием этой работы является отсеивание не существенных по влиянию на объект факторов и выделение факторов, определяющих отклик. В разделе 1.1 лекции 1 приведен упрощенный пример планирования эксперимента в отношении диапазона значений факторов. Но реально дело обстоит гораздо серьезнее. В начале двадцатого века английский статистик Фишер начал разработку теории оптимального планирования эксперимента. В 1935 году вышла его монография на эту тему и этот год считается годом рождения новой математической дисциплины – теории планирования эксперимента. По необходимому количеству опытов, точности и достоверности результатов, объему информации и т.п. показателям научное планирование эксперимента позволяет повысить его эффективность в 3-10 раз. В связи с этим при практическом планировании эксперимента решается задача оптимизации – нахождения опытной комбинации уровней управляемых факторов, которая отвечает экстремуму функции отклика. Табличная функция у = f ( X 1, X 2, X 3, X 4,......) отражает какую-то неизвестную нам аналитическую зависимость , которую для упрощения обозначим как ϕ (x) . В настоящее время нет методов, позволяющих найти точный вид такой функции. Однако, известно, что любая функциональная зависимость может быть с любой степенью точности отражена алгебраическим степенным полином, причем точность отражения зависит от степени (длины) полинома. Поэтому следующей задачей исследования является идентификация функции отклика ϕ (x) - т.е. установление тождественности ϕ (x) своему образу-идентификатору в виде алгебраического степенного полинома
η( x, β ) , где β - идеальные коэффициенты регрессии функции, которую мы будем называть идеальной математической моделью функции отклика ϕ (x) . 16
Такие модели могут быть линейно или нелинейно параметризованными по параметру β . Мы будем работать с линейными функциями рые имеют вид
где
η( x, β ) , кото-
n η( x, β ) = ∑ β j ∗ f j ( x) , j =0 β = ( β0, β1, β 2,..., β j ,..., β k ) - вектор коэффициентов β .
Каждый
βj
при j функции
(4)
f j (x) , которые все вместе образуют век-
тор базисных функций. Элементы этого вектора могут содержать различные сочетания и степени факторов х. Таким образом, по базисным функциям математическая модель является не линейной. Получение математической модели объекта исследования позволяет: - раскрыть наиболее существенные соотношения между факторами (т.е. условиями работы объекта) и его откликами на них; - предсказать значение отклика для заданных комбинаций уровней факторов, решая задачи как интерполяции, так и экстраполяции (последнее – в определенных пределах ; - находить координаты точек минимумов и максимумов найденной математической модели; - уточнять гипотетические и теоретические положения, существующие относительно объекта исследования; - выдвигать новые гипотезы об объекте; уточнять теоретические положения о процессах, в нем протекающих. 3.2 Алгебраический степенной полином регрессии как математическая модель объекта исследования Метод регрессионного анализа использует описание объекта исследования в виде полинома (5) – отрезка ряда Тейлора, в который разлагается неизвестное уравнение связи отклика у и факторов, т.е. функция ϕ (x)
k k M { y} = ϕ ( x , x ,..., x ) = β + ∑ β i x + ∑ βij x x + i j 1 2 0 i =1 i i =1; j >i k k k k 2 β β + x x x + ... + x + ∑ ∑ ii i ∑ β iii xi3 + ... ijq i j q i =1; j >i;q > j i =1 i =1
(5)
где β - коэффициенты регрессии идеальной математической модели, при которой отклик приобретает значение своего математического ожидания. 17
При этом рекомендуется /1/ такая форма полинома, которая в качестве базисных функций
f j (x)
содержит все возможные сочетания факторов х в
первой степени (единичные, парные, тройные и т.д.), а при степени больше единицы – только их единичные индивидуальные комбинации . Тогда в развернутом виде полином и принимает форму (5). Существует ряд причин, в силу которых мы не можем найти полином, расчет по которому давал бы указанный результат. Во-первых, состояние любого сложного реального объекта определяется практически бесчисленным количеством факторов, и любая логическая модель объекта принципи ально не может быть полной, а только приближенной. Во-вторых, точный вид полинома, адекватный функции
ϕ (x) , нам не известен также, как и сама
функция ϕ (x) . Поэтому та зависимость, которую мы находим по таблице экспериментальных данных, не дает точной связи между уg и факторами, включенными в математическую модель, и по результатам эксперимента находится не идеальное уравнение (2), а только его статистическая оценка в виде эмпирического уравнения
k1 k2 k3 yg =b + ∑ b x + ∑ b x x +...+ ∑ b x3+... i i ij i j iii i 0 i=1 i=1, j >i i =1
(6)
где b – «выборочные» эмпирические коэффициенты регрессии. Последние, таким образом, являются лишь оценками для теоретических коэффициентов β, а отклик объекта уg - оценкой для математического ожидания M{yg}.
18
4 Лекция 4. Полиномы регрессии – приближенное отражение идеальной математической модели объекта исследования Все изложенное выше позволяет представить идентификацию функции отклика объекта исследования в виде схемы
)
)
ϕ ( x) = η( x, β ) ≈ η( x,b) = ϕ ( x) = η ( x, β ) , где три последних функции есть статистические оценки
ϕ (x) , а фун-
кции η ( x, β ) и η ( x,b) − сокращенными записями уравнений (5) и (6) соответственно. Вид полинома η ( x,b) , адекватный идеальной модели η ( x, β ) , нам не известен, и если относительно него нет каких-либо теоретических или профессиональных соображений, то приходится прибегать к выработанным практикой рекомендациям. Практика обработки экспериментальных данных показала, что результаты эксперимента в виде табличной функции в большинстве случаев с достаточным приближением отражаются полным кубическим полиномом по форме уравнения (6). Часто третья степень полинома не только достаточна, но и избыточна, т.е. степень и количество членов полинома можно и уменьшить без существенной потери точности. Поэтому при построении и выборе аппроксимирующего уравнения строят систему альтернативных уравнений из полного кубического полинома и его отдельных степенных кусков. Сравнивая характеристики точности отражения таблицы экспериментальных данных этими уравнениями, выбирают наиболее приемлемое. В качестве примера такого подхода рассмотрим кубическое уравнение для 5-ти факторной задачи регрессии. В соответствии с формой (6) полный кубический пятифакторный полином будет иметь следующий вид
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5+b12x1x2+b13x1x3+b14x1x4 + +b15x1x5+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ b123x1x2x3+ +b124x1x2x4+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ +b1234x1x2x3x4++b1235x1x2x3x5+b1345x1x3x4x5++b2345x2x3x4x5+ +b12345x1x2x3x4x5++b11x12+b22x22+b33x32+b44x42+b55x52+b111x13+ b222x23 +b333x33+b444x43 +b555x53, (7) который содержит все возможные сочетания факторов х1,х2,х3 и т.д. в первой степени и члены полинома с единичными факторами в степени более единицы.
19
Полином (7) и будет первым альтернативным уравнением регрессии. Далее приведем все альтернативные уравнения в виде отдельных степенных кусков. Линейное уравнение (как первый степенной кусок)
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5. Неполное квадратичное уравнение, содержащее линейную часть и парные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5. Неполное кубическое уравнение, содержащее линейную часть, парные и тройные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ +b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5. Неполное уравнение четвертой степени, содержащее линейную часть, парные, тройные и четверные сочетания факторов
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ +b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ +b1234x1x2x3x4+…+b1345x1x3x4x5++b2345x2x3x4x5. Следующий степенной кусок по аналогии, с добавлением к предыдущему уравнению члена из сочетания «по пять из пяти»: +b12345x1x2x3x4x5. Это будет уже шестое альтернативное уравнение, на котором комбинации факторов х в первой степени кончаются. Седьмое и последнее уравнение – полный полином второй степени
у= b0+b1x1+b2x2+b3x3+b4x4+b5x5 +b12x1x2+b13x1x3+…+b23x2x3+b24x2x4+... +b35x3x5+b45x4x5+ +b123x1x2x3+...+b135x1x3x5+...+b245x2x4x5+...+ b345x3x4x5+ +b1234x1x2x3x4+…+b2345x2x3x4x5+ b12345x1x2x3x4x5+ +b11x12+b22x22+b33x32+b44x42+b55x52.
20
Таким образом, имеем систему из семи альтернативных уравнений, в которой обычно удается найти приемлемое уравнение регрессии. Такая форма записи уравнений позволяет сократить ее, используя, например, либо запись только коэффициентов с индексами вида
b0+b1+…+b12+…+b123+…+b1234+…+b12345+b11+…+b111+…+b555=y,
либо запись уравнения только в индексах коэффициентов b, т.е. кодовую форму полинома. Полный кубический полином при этом будет иметь такой вид:
0 1 2 3 4 5 12 13 14 15 23 24 25 34 35 45 123 124 125 134 135 145 234 235 245 345 1234 1235 1245 1345 2345 12345 11 22 33 44 55 111 222 (8) 333 444 555 В приложении А приведены индивидуальные задания, содержащие заданную форму искомого полинома именно в такой закодированной (8) форме. Отметим, что построение полинома регрессии по структуре уравнения (6) является только рекомендуемой формой. Одинаково «правомочна» любая другая форма полинома регрессии. По тем или другим соображениям из формы (6) могут быть исключены любые члены, желательно только при удалениях и добавлениях их сохранять принятый порядок индексации во избежание путаницы при анализе результатов. С увеличением числа факторов, включенных в модель объекта исследования, количество членов полинома быстро нарастает. Так, например, полный кубический полином при трех факторах имеет четырнадцать членов, при четырех – 24, при пяти (см. уравнение (8)) – 42. Подсчитаем для наглядности, каково будет количество членов полинома (а значит, и количество коэффициентов регрессии b) при данной форме полинома (6) при десяти факторах х. Его можно определить следующим образом. 1) Коэффициент b0 и еще десять – при единичных факторах х1,х2 и т.д., т.е. всего 11 коэффициентов; 2) Для парных сочетаний факторов их количество С210 =
10! = 45 ; 2!*8!
10! = 120 ; 3!*7! 10! = 210 ; 4) Далее соответственно С410 = 4!*6! 10! = 252 ; 5) С510 = 5!*5!
3) Для тройных сочетаний С310 =
6) Затем пункты 2,3 и 4 повторяются в обратном порядке, образуя такое же количество коэффициентов, т.е. 210+120+45=375; 7) С910 = 10 ; 8) Сочетания по 10 из 10 - один коэффициент; 21
9) Коэффициенты при факторах во второй и третьей степени – по десять штук. Итого: 11+375×2+252+10+1+20=1044 коэффициента. В уравнениях регрессии неизвестными являются значения коэффициентов b (т.к. значения факторов и откликов известны из таблицы экспериментальных данных). Для нахождения каждого коэффициента b необходима одна строка таблицы экспериментальных данных. Достаточно трудно представить себе таблицу, содержащую 1044 опытов (наблюдений), особенно если один опыт занимает, скажем, неделю. Между тем, сложные реальные объекты находятся под влиянием сотен (если не тысяч) факторов. Конечно, здесь придется манипулировать формой искомого полинома, максимально ее укорачивая. Можно, например, включить в полином только единичные факторы в первой и второй степени, опустив все их сочетания по два, по три и т.д. Мы привели здесь данный пример, чтобы показать, что по количеству включенных факторов, модель сложного объекта принципиально не может быть полной, а это означает, что эксперимент приходится проводить на приближенной модели, в условиях недостатка информации об изучаемом объекте.
22
5 Лекция 5. Случайный характер отклика объекта исследования 5.1 Классификация факторов и их влияние на качество модели объекта исследования Реальные сложные объекты характеризуются большим количеством состояний. Состояние объекта определяется входными воздействиями на объект – факторами, и характеризуется выходными величинами – откликами. В предыдущей лекции было показано, что количество факторов, условно говоря, если не бесконечно, то не поддается определению. В то же время в логическую модель объекта исследования экспериментатор может ввести ограниченное количество факторов. Увеличение количества факторов, включенных в математическую модель объекта, "утяжеляет" эксперимент как по срокам проведения, так и по затратам, вплоть до того, что может сделать осуществление эксперимента вообще невозможным. Таким образом, исследователь вынужден неизбежно не включать часть известных ему факторов в эсперимент. Но существуют еще и факторы, либо выпавшие из его поля зрения, либо вообще ему неизвестные. Примерами таковых можно назвать изменение состояния оборудования по ходу эксплуатации (разладка, изменение зазоров и т.п.), старение реактивов, изменение параметров объекта под действием внешней среды (например, зависимость тяги в трубах печей от атмосферного давления), ошибки измерения или воздействия на объект и т.д. и т.п. Все изложенное позволяет разделить факторы на следующие группы: - контролируемые (фиксация значений параметров) и управляемые (назначение этих значений) факторы; - контролируемые , но неуправляемые факторы; мы можем измерять и фиксировать их значение, но не изменять его; - неконтролируемые и неуправляемые факторы. В той или иной степени к искажению модели объекта приводит и неизбежная субъективность процедуры формирования набора факторов, в которой отражаются научные взгляды, интересы и амбиции исследователя. Достаточно вспомнить борьбу различных школ и направлений в науке, перерастающая зачастую в открытую вражду и непримиримость. Именно в силу этого важно, чтобы логическую модель объекта строил совет экспертов. Итак, в силу изложенного принятая модель объекта по факторам всегда (или почти всегда) является неполной. А между тем реальное поведение объекта складывается под влиянием всех факторов – и включенных в эксперимент, и невключенных, и известных экспериментатору, и неизвестных. Тогда значение отклика будет складываться не по зависимости у=ϕ(х1,х2,…,хк), а по зависимости у=ϕ(х1,х2,…,хк,w1,w2,…,wк), где wп – неучтенные фак-
23
торы. Неизвестное нам влияние неучтенных факторов делает отклик объекта уg непредсказуемой по значению величиной, а значит - величиной случайной. Таким образом, снятое в эксперименте значение отклика - случайной величины – можно выразить зависимостью
y = ϕ ( x) + δ (w) ,
(9)
где ϕ (x) - так называемая функция истинного отклика, отражающая влияние включенных в модель контролируемых факторов, значение которых известно;
δ (w) -
функция неучтенных факторов, называемая функцией шума или просто шумом. В связи со случайным характером откликов уg обработку экспериментальных данных приходится вести на базе математического аппарата математической статистики. 5.2 Случайная величина в обработке экспериментальных данных методом регрессионного анализа Математическая статистика любой объект реальности моделирует как некоторый массив численных данных, называемый генеральной совокупностью. Эта совокупность является поименованой случайной величиной. Таким образом, случайная величина – это массив численных значений. Участие (или выпадение) какого-то из этих чисел в какой-то операционной ситуации непредсказуемо, имеет вероятностный характер и определяется законом распределения вероятностей значений данной величины. Примером таких величин является, например, среднемесячная температура июля за сто лет или количество пар мужской обуви, купленной в данном универмаге в обычный будничный день за какой-то период времени. Генеральные совокупности принято именовать заглавными латинскими буквами – A, X, Z и т.д. Конкретные же значения величин из данного массива обозначают строчными буквами с индивидуальным индексом этого значения: z1, z2 и т.д. Генеральные совокупности могут быть конечными или бесконечными, дискретными или непрерывными. Оперировать с данными всей совокупности часто невозможно, поэтому их заменяют так называемыми выборками. Выборка – это ряд значений данной случайной величины, извлеченных из генеральной совокупности случайным образом. Представительная выборка обладает такими же свойствами, что и генеральная совокупность, т.е. является как бы ее «мини-моделью». Они и являются объектами для работы с данной случайной величиной. Обратимся к данным таблицы 3. Весь вектор откликов yg (где g меняется от 1 до 50) по своему характеру является типичной выборкой из всего 24
возможного диапазона функциональных значений откликов y (на которые наложена шумовая составляющая). Очевидно, что эта генеральная совокупность бесконечна. Теперь обратимся к отдельному элементу вектора откликов. Пусть это будет, например, y25 (25-ая строка таблицы 3). Ранее было показано, что отклик y25 (как и другие отклики yg) есть величина случайная. А это означает, что за значением y25=66,34 скрывается массив других значений случайной величины, которую следует назвать «У25». Итак, за каждым yg по всему вектору откликов y будут стоять пятьдесят генеральных совокупностей разных случайных величин с именами У!, У2,…,У25,…,У50. А это, в частности, означает, что если мы продублируем опыт по любой строке таблицы, например, по той же двадцать пятой, мы на этих повторах получим отклик не 66,34, а какие-то другие значения из генеральной совокупности У25. Напомним, как и чем характеризуются случайные величины. При этом будем иметь в виду, что они имеют две ипостаси – это: 1) генеральная совокупность; 2) выборка. Выпадаемые в опыте значения случайной величины непредсказуемы, но не произвольны: они имеют определенный диапазон и массив допустимых значений. Характеристикой случайной величины является генеральное среднее ( оно же – математическое ожидание), которое обычно обозначается как Mx, Mz или M{x}, M{z}. Для математического ожидания какого-то выражения фигурные скобки обязательны, например, M{x+y+z}. Для выборки эквивалентной характеристикой является выборочное среднее рое является статистической оценкой математического ожидания. Среднее выборочное есть отношение
n x = ∑ xi , i =1
х,
кото-
(10)
где n – количество элементов в выборке (объем выборки). Еще одной характеристикой случайной величины является рассеяние отклонений ее текущих значений от центра, т.е. разностей (xi-Mx) для генеральной совокупности и (xi- х ) для выборок. Коллективной оценкой этих разностей для всего массива значений является дисперсия, которая для дискретной случайной величины равна
n 2 ∑ ( xi − Mx) σ 2 = Dx = i =1 n
(11)
25
для генеральной совокупности и
n 2 ∑ ( xi − x) s 2 = i =1 n −1
для выборки. Отметим, что величины Мх и
σ2
12)
являются константами как однознач-
ные характеристики всего массива данных, а х и s 2 являются случайными величинами в связи со случайным характером выборки. Величины х и s 2 , которые есть выборочные оценки Мх и σ 2 , выражаются числом и поэтому называются точечными. Они дополняются интервальными оценками этих величин, смысл которых в следующем. Пусть, например, х =32,88. Интервальная оценка дополняет эту информацию, объявляя, что …« Мх данной случайной величины с такой-то вероятностью лежит в таком-то интервале значений случайной величины», например, в интервале 20.00-50,00. Если оценка х =32,88 не попадает в данный интервал, значит данная выборка непредставительна и должна быть забракована. Приведем пример интервальной оцеика для математического ожидания Мх. Эта оценка при известном значении σ 2 строится с использованием нормированной формы случайной величины х, которая обозначается как функция u /3/ и имеет вид
u= где
х − M {х} , σ/ n
(13)
х - среднее значение случайной величины по выборке; n –объем выборки.
Интервальная оценка для
х−
u pσ n
M {х} представлена неравенством /3/
< M {х} < х +
u pσ n
,
(14)
где up – значение нормированной формы случайной величины х при данной вероятности р. Получение и свойства нормированной величины up мы рассмотрим ниже. Наиболее полной характеристикой случайной величины является закон распределения вероятностей случайной величины, который связывает данное значение случайной величины с вероятностью появления его (т.е. 26
этого значения) в опыте. Наиболее распространенным является закон распределения, получивший название нормального. В аналитическом виде этот закон выражается известным уравнением Гаусса
f ( x) =
1 e σ 2π
−
( x − Mx) 2 2σ 2
,
(15)
где f (x) - плотность вероятностей при данном значении х. Графически это уравнение имеет вид колоколообразной кривой, которая симметрична относительно центра распределения, которым является Мх (максимум функции f (x) ) и концы которой уходят в ±∞ , асимптотически приближаясь к горизонтальной оси х и не достигая ее.
Итак, случайная величина есть обособленный поименоованый массив численных данных, отражающих переменное состояние данного реального объекта (т.е. являющийся моделью этого объекта).
Итак, значение Уg на данной строке таблицы экспериментальных данных есть только одно из случайных значений массива данных, являющихся случайной величиной. Пятьдесят строк таблицы – пятьдесят массивов, т.е. пятьдесят разных случайных величин.
Каждый из этих массивов имеет свои индивидуальные характеристикиматематическое ожидание Мх, дисперсию σ 2 и закон распределения.
27
6 Лекция 6. Ошибки и точность наблюдений (опытов) в эксперименте 6.1 Дисперсия воспроизводимости
My8
My32
My20
Значения функции Yg
Из всего вышеизложенного следует, что при многократном повторении опыта по режиму одной и той же строки таблицы экспериментальных данных мы будем снимать разные значения отклика объекта при одинаковых значениях факторов х, т.к. за единичным случайным значением отклика объекта исследования на данной строке таблицы yg стоит массив случайных величин. Рисунок 1 иллюстрирует это положение.
номер строки Рисунок 1 – Идеальная и экспериментальная функция Уg На горизонтальной оси отложены номера строк таблицы, на вертикальной – условный массив возможных значений откликов yg по 10-ой, 20-ой и 30-ой строкам (т.е. массивы значений величин y10, y20 и y30 ). Каждая из случайных величин У10, У20 и У30 имеет свое математиче2 . В соответствии с этим построим на ское ожидание М{yg} и дисперсию σ yg массивах значений величины yg графики законов распределения этих величин (вертикаль центров распределения расположена горизонтально). Обозначим экспериментальные значения отклика yg светлыми точками и соединим их 28
линией, которая будет имитировать экспериментально найденную зависимость. Линия, проходящая через координаты математических ожиданий (черные точки) М{yg}, будет отвечать той функции истинного отклика ϕ(х), которую мы ищем, т.е. которую мы и должны аппроксимировать полиномом регрессии. Отсюда следует, что если бы в таблице экспериментальных данных вместо случайной величины yg стояли бы постоянные величины М{ yg }, табличная зависимость ϕ(х1,х2,…,хк) потеряла бы свой случайный характер. В этом случае система имела бы единственное решение в виде идеальной математической модели функции истинного отклика ϕ(х), а именно в виде полинома η(х,β), где β - истинные коэффициенты "идеальной" регрессии. Модель η(х,β) адекватна функции ϕ(х) и, таким образом, η(х,β) = ϕ(х). Но в силу случайного характера отклика объекта исследования, полином регрессии η(х,b), найденный по экспериментальным данным, является только статистической оценкой идеальной модели η(х,β). Отсюда следует, что рассчитанное по уравнению регрессии значение yg ( будем впредь обозначать его как yrg) является оценкой математического ожидания М{yg}. Линия, проходящая через светлые точки, и будет графической интерпретацией экспериментально найденного полинома η(х,b). 2 являДисперсия случайной величины yg на данной строке таблицы σ yg ется характеристикой объекта исследования и определяется только его при2 одинаково для всех массивов значеродой. Поэтому значение величины σ yg ний случайных величин на всех строках таблицы данных
σ 12 = σ 22 = ...... = σ g2 = ...... = σ k2 , а сама дисперсия называется дисперсией воспроизводимости
2 σ vos
(т.к. она
воспроизводится для всех пятидесяти массивов по строкам таблицы 3.. Таким образом, графики распределения величины yg отличаются только математическими ожиданиями {М yg}, а дисперсии их одинаковы. Табличное значение величины yg является экспериментальной оценкой М{yg}. Надежность оценок зависит от двух факторов: объема выборки и дисперсии оцениваемой случайной величины. На рисунке 2 представлены графики законов распределения трех случайных величин при одном значении математического ожидания и различных значениях дисперсии /2/. Соотношение F(x)7,5i
(67)
а мы в силу сложившихся обстоятельств можем искать только модель вида
k1 η ( x, β ) = β 0 + ∑ β i x i i =1
.
(68)
Это и будет неадекватностью математической модели функции истинного отклика. В функции (67) к+1 коэффициентов, а мы в (68) находим к0+1 их оценок. Размерность матрицы базисных функций F должна быть n(k+1), а мы имеем матрицу F0 с размерностью n(k0+1). В матрице F0 будут отсутствовать столбцы xij и xii , которые образуют полную или “истинную” матрицу F∗. Соответственно этой ситуации имеем векторы истинных коэффициентов
β 0 , β∗
и их оценок в полиноме регрессии b0 ,b* . Тогда в соответствии с основным уравнением процедуры регрессионного анализа (31)
b0 = ( F0T F0 )−1( F0T Y ) , а также
M {b0} = ( F0T F0 )−1( F0T M {Y }) . Поскольку расчетное значение отклика равно произведению строки матрицы базисных функций на вектор коэффициентов регрессии
y€( x g , β ) = y( x g ,b) = f −T ( xg )b , постольку
M {Y } = F β = F0 β 0 + F∗ β ∗ . Отсюда 76
M {b0} = ( F0T F0 )−1 F0T ( F0 β 0 + F∗ β ∗ ) = = ( F0T F0 )−1( F0T F0 ) β 0 Произведение
+ ( F0T F0 )−1( F0T F∗) β ∗
( F0T F0 )−1( F0T F0 ) есть единичная матрица, а произведение ( F0T F0 )−1( F0T F∗)
есть матрица, которую назовем матрицей смещения В, т.е.
M {b0 } = β 0 + B β ∗ .
(69)
Рассмотрим пример. Имеем таблицу экспериментальных данных при нормированной форме факторов Х (см. таблицу 10). Таблица 10 – План эксперимента G 1 2 3 4
X1 -1 +1 -1 +1
x2 -1 -1 +1 +1
x3 +1 -1 -1 +1
Пусть истинная зависимость есть
ϕ ( x) = β 0 + β1 x1 + β 2 x2 + β 3 x3 + β12 x12 + β13 x13 + β 23 x23 + β123 x123 а мы отражаем табличную функцию уравнением
ϕ ( x) = β 0 + β1 x1 + β 2 x2 + β 3 x3 . Тогда
+1−1−1+1 Матрица
F0=
+1+1−1−1 +1−1+1−1 +1+1+1+1
T
Матрицы (F 0F0)
-1
4000 T
, а матрица (F 0F0)=
0400 0040
.
0004
, (FT0F∗) и В и будут равны соответственно
77
1 000 4 1 0 00 4 1 00 0 4 1 000 4
0004
0001
0040
0010
,
,
.
0400
0100
4000
1000
В соответствии с уравнением (69)
M {b0 } = β 0 + B β ∗
Mb0 Mb1 Mb2 Mb3 т.е.
=
β0 β1 β2 β3
+
β123 β 23 β13 β12
,
Mb0 = β0 + β123; Mb1 = β1 + β 23; Mb2 = β 2 + β13; Mb3 = β3 + β12.
Таким образом, при неадекватной модели получаемые МНК-оценки коэффициентов регрессии содержат систематические ошибки, определяемые матрицей смещения и коэффициентами, не вошедшими в предполагаемую модель. Происходит смешивание теоретических коэффициентов в одной оценке, например, коэфициентов β 0 и β123 в оценке b0 . На практике иногда приходится сознательно работать со смещенными моделями, например, при невозможности обеспечить достаточное количество наблюдений в эксперименте из-за их трудоемкости или высокой стоимости. В таких случаях и возникает смещение, которое нужно оценить хотя бы качественно.
78
16 Лекция 16. Предварительная обработка экспериментальных данных 16.1 Исключение грубо ошибочных данных из вариационного ряда Предварительная обработка экспериментальных данных проводится в основном в двух целях: - отсеивание грубых погрешностей измерения, подсчета или записи цифрового материала; - оценка закона распределения случайной величины, которая является результатом наблюдений и, при необходимости, переход от этой величины к другой, имеющей нормальное распределение. Грубые ошибки при фиксировании значения экспериментальных данных – это аномальные, сильно выделяющиеся значения в вариационном ряду однородных данных. Появление таких значений связано либо с субъективной ошибкой самого экспериментатора, либо с резким нарушением режима проводимых испытаний. Такие значения обычно носят единичный характер и проявляются в одном-двух испытаниях из всей серии. Несмотря на малочисленность, эти значения могут внести существенные искажения в итоговые результаты обработки данных. Поэтому такие аномальные значения должны быть безусловно удалены из массива экспериментальных данных, но...! – аномальные значения не всегда ошибочны и иногда ведут исследователя прямо к нобелевской премии. Ибо существует и такая причина аномального значения экспериментальных данных как скачкообразное изменение показателей состояния объекта испытания при изменении параметров состояния воздействующей на него среды. Так, например, при монотонном изменении химического состава или температуры металлических сплавов в определенном и достаточно узком диапазоне этих изменений, в сплаве образуются новые структурные составляющие (фазы), резко изменяющие макроскопические свойства сплава. Еще шаг в приращении факторов воздействия – и эти фазы растворяются в основе сплава, возвращая исходный уровень свойств. Это и есть аномальный “срыв” значений наблюдаемых экспериментальных данных, исключить которые – значит “прозевать” критическое состояние материала, способное в будущем стать, например, причиной разрушения какойто конструкции. Наилучшим выходом из такой ситуации является повторение серии испытаний, которая содержит аномальные результаты. Это позволяет сделать однозначные выводы о том, случаен аномальный результат или нет. Но этот выход не всегда возможен. Чаще всего “аномальность” обнаруживается при итоговой обработке экспериментального материала. Так или иначе, признание результата наблюдения аномальным требует тщательной профессиональной экспертизы. Кроме вопроса о причине аномальности результатов данного наблюде79
ния есть и другой вопрос – с какого “критического” значения считать данный показатель аномальным? В литературе содержится много рекомендаций для отсева грубых погрешностей наблюдений /9/. Строго научный анализ массива наблюдений в этом отношении может быть проведен только статистическими методами. Каждая грубая ошибка вызывает нарушение закона распределения изучаемой величины, изменение его параметров – нарушается однородность наблюдений. Поэтому выявление грубых ошибок можно трактовать как проверку однородности испытаний или опытов. Показателем ошибочности данного наблюдения может служить лишь величина его отклонения от других наблюдений. Сомнительными могут быть крайние отклонения от среднего – как в ту, так и в другую сторону. Если ориентироваться на закон нормального распределения, то такие отклонения симметричны и исследуются одинаково, т.е. можно говорить об общем “крайнем” значении данной выборки. В случае нормального распределения для единичного значения данной случайной величины х при доверительной вероятности 1-р оценкой однородности будет соблюдение неравенства
х-М{х}U1-p⋅σ, и будет признаком грубой ошибочности данного значения. Для выборки объемом n элементов соответствующая доверительная n вероятность будет равна (1-p) , т.е. вероятность однородности всех n событий уменьшается с ростом n и при n→∞ эта вероятность стремиться к нулю. Если х есть крайний элемент выборки , то доверительной оценке (70)
соответствует вероятность (1-p) ≅1-n×p. Тогда доверительной вероятности 1-р для одного крайнего элемента соответствует оценка /4/ n
х-М{х}U1-p/n⋅σ .
Все вышеизложенное справедливо для случая, когда известны пара 80
метры распределения М{х} и σ. Если же они не известны, то приходится использовать их выборочные оценки xsr и s. Тогда для крайнего элемента рабочей статистикой будет условие
tраб= х-хsr/s,
которое называется максимальным относительным отклонением и подчиняется распределению Стьюдента. Крайнее значение отбрасывается как грубо ошибочное при условии
х-хsr/s>t1-p
где t1-p есть квантиль распределения Стьюдента при данном объеме выборки. После исключения аномального значения из вариационного ряда статистические характеристики данной выборки пересчитываются для нового объема и новый крайний элемент может быть подвергнут новой проверке. Поскольку при использовании выборочных оценок возникает их смещение относительно оцениваемой величины, в рабочую статистику должна быть введена поправка
tраб= х-хsr/(s
n −1 ). n
В работе /5/ показано, что границы критической зоны τр (где р- процентная точка нормированного выборочного отклонения) выражаются через квантили этой точки распределения Стьюдента tр,n-2 по соотношению
τ p, n =
t
p, n − 2
(n − 2) + (t
⋅ n −1 p, n − 2
)2
(72)
С учетом этого уравнения для выборок большого объема (при n больше 25) рекомендуют /5/ следующую процедуру отсева аномальных данных: - выбирают значение xi c максимальным отклонением от среднего; - вычисляют значение рабочей статистики
tраб= х-хsr/(s
n −1 ); n
- по таблице t- распределения находят точки t0,05;n-2 и t0,001;n-2; - по уравнению (72) находят критические границы τ0,05;n и τ0,001;n. Эти точки ограничивают три зоны: - левую до границы t0,05;n-2; 81
- среднюю между границами t0,05;n-2 и t0,001;n-2; - правую от границы t0,001;n-2. Если значение рабочей статистики попадает в левую зону, крайнее значение не является аномальным. Если оно в средней зоне, то необходим профессиональный анализ ситуации и выработка дополнительных аргументов в пользу того или иного решения. Если tраб в правой зоне, крайнее значение безусловно отбрасывается. 16.2 Приведение распределения исследуемой величины кнормальному Предпосылки (условия) процедуры регрессионного анализа содержат требования нормального распределения отклика объекта исследования на данной строке таблицы экспериментальных данных. Нарушение этого условия затрудняет проведение второй части процедуры, т.к. делает невозможным использование параметров распределений, связанных с нормальным: u-
и t- распределений, F-распределения Фишера и χ распределения Пирсона. Нельзя пользоваться квантилями этих распределений, нельзя строить интервальные оценки с их помощью и, соответственно, нельзя проверять гипотезы об адекватности уравнений регрессии истинной математической модели. Обзор методов “экспрессной” проверки нормальности распределения данной выборки дан в работе /5/. Для небольших выборок (менее 120 элементов) рекомендуется использовать значение среднего абсолютного отклонения 2
∆х=∑(xi-xsr)/n.
Для выборки, имеющей приближенно нормальное распределение, справедливо условие
∆xi/s – 0,7979