ББК 22.12 22.1п 22,18 32.81 22.3о
Мышкис Анатолий Дмитриевич Элементы теории математических моделей. Изд. 3-е, исправле...
10 downloads
350 Views
9MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ББК 22.12 22.1п 22,18 32.81 22.3о
Мышкис Анатолий Дмитриевич Элементы теории математических моделей. Изд. 3-е, исправленное. М.: КомКнига, 2007. - 192 с. Настоящая книга посвящена вопросам, связанным с выбором уравнений изучаемого явления, их упрощениями и уточнениями. В ней обсуждаются: понятие математической модели, ее приближенный характер, множественность моделей. Дана классификация моделей по различным признакам. Материал широко иллюстрируется примерами из физики и механики. Книга предназначена для научных работников и инженеров. Может быть использована студентами при изучении курса «Математическое моделирование».
СОДЕРЖАНИЕ Предисловие § 1. Понятие математической модели. Основные требования . . . 1. Понятие математической модели 0 (*)•!• Пусть близкое решение имеет вид у (х) = 1 4- ц (х). Чтобы получить 30
линеаризованное уравнение для TJ, варьируем уравнение (2.16)*): (by)" -f 2y (by) sin у' + (1 + /) (cos yf) (by)f 4- by = 0. Подставив сюда у « у0 (дг) ( з 1), 6у « TJ, получаем искомое уравнение
V + 2t|' + i| = 0, которое легко решается. На последовательной линеаризации основан один из самых эффективных методов приближенного решения нелинейных уравнений различных типов — метод Ньютона. Опишем его сначала на примере решения конечного уравнения общего вида /(*)*0. (2 Л 7) Метод имеет итерационный характер (см. Добавление, п. 4). Пусть мы отправляемся от некоторого нулевого приближения решения: х — х0. Проведем линеаризацию функции / при х = JCQ, для чего разложим ее в ряд Тейлора по степеням х - х0 и отбросим в разложении все нелинейные члены. Тогда взамен (2Л 7) мы получим линеаризованное уравнение /(хо) + /'(*о)(*-*о)-О. *) Вариация функции появляется при рассмотрении операторов (преобразователей функций в функции, см. п. 3) и функционалов (преобразователей функций в числа>. Так, если задан оператор z - F {у}% где У ** у(х) — вход, a z = г (х) — выход, то вариация Ьу = Ьу (х) функции У - У Iх) — это е е приращение, полученное при переходе от у к некоторой д£угой, близкой функции у, т. е. Ьу (х) ~ у (х) - у (х) (см. рис. 7; сравните: dy(x) получается при сохранении функции у(х), но изменении значения х). Вариация оператора bF{y] получается, если в его приращении F [у + Ьу} - F {у} оставить только линейные члены относительно Ьу и отбросить члены высшего порядка малости. Варьирование (вычисление вариации) оператора производится по тем же правилам, что и дифференцирование функции, причем надо полагать Ь (у') ш (Ьу)\ Ь (у") = (Ьу)"н т. д., подобно тому, как это делается при вычислении смешанной производной функции нескольких переменных. Пример вычисления вариации оператора — левой части уравнения (2.16) — приведен в тексте. Аналогично определяется и вычисляется вариация функционала.
31
Его решение назовем приближением JCI решения уравнения (2.17), т. е. /(*о) Затем то же проделаем с jq и т. д. Общая формула для построения последовательных приближений по методу Ньютона такова:
- v - H5»L
v
Сравнение с уравнением (Д.28) показывает, что метод Ньютона состоит в применении метода итераций к уравнению (2.17), переписанному в равносильной форме: Y "
SS
л
Y
— !
Почему полезна именно такая форма? Для ответа, обозначив правую часть А это, в силу п. 4 Добавления, означает, что если только х0 не слишком далеко от Зс, то метод Ньютона сходится со сверхгеометрической скоростью. (Если / ' (Зс) = 0, что бывает весьма редко, то метод сходится со скоростью геометрической прогрессии.) В качестве примера рассмотрим то же уравнение (Д. 29), что и в п. 4 Добавления. Здесь формула (2Л 8) приобретает вид л£ - л» + 0,3 _ 2x1 - 0,3 Начав с х0 = 0, при вычислениях с точностью до 10~6 получаем х$ = х4 « 0,3389362 (проверьте!). Таким образом, сходимость получилась существенно более быстрая, чем в п. 4 Добавления. Расхождение в последней значащей цифре с п. 4 Добавления объясняется округлениями при вычислениях. Покажем еще, как применяется метод Ньютона к системе конечных уравнений на примере системы двух уравнений общего вида /(*>)>) = 0, * ( * , у ) = 0. 32
(Лп + №)* (^ - хп) + ( Д , (у - Уп) = 0, (8)п + (Й)- (* - *.) + (^)« (У - Уп) - 0, где обозначено (/)„ = / (5И, уя), (Л) п = Л (^, ул) и т. д. Решение этой системы и принимается за (хп+и )Wi), т. е. последующее приближение определяется из простой системы уравнений (Л)„**+1 + (Гу)пУп+1 =* (Л)«^ + ( / ; ) ^ - с/)»,
-——• jei s \ * (*)
lf(x)}2
Пусть мы уже имеем некоторое приближение х = х„, у = » >>„. Чтобы перейти к следующему приближению, разложим функции / и g около значений х = хп, у = уп в ряды Тейлора и отбросим в разложениях все нелинейные члены. Тогда взамен (2.19) мы получим систему уравнений первой степени
(2Л9)
Таким образом, исходя из нулевого приближения х = Хо, у s у0, мы можем, положив л = 0, найти первое приближение х ~ jc b у = yi и т - Д- Из последней системы сразу видно также, что если последовательные приближения сходятся при п -» оо, то в пределе получается одно из решений системы (2Л9). На практике обычно факт сходимости или расходимости распознается легко, так как сходимость в методе Ньютона, если она имеет место, происходит с весьма высокой скоростью. Метод Ньютона распространяется и на нелинейные уравнения других типов, в частности на краевые задачи для нелинейных дифференциальных уравнений, путем сведения их к последовательному решению линейных задач. Имеются и другие способы линеаризации уравнений и моделей. 5. Детерминированные и вероятностные модели. Другие типы моделей. Математическая модель может включать случайные компоненты — случайные скалярные или векторные величины, случайные последовательности или функции, случайные структуры и т. п., удовлетворяющие статистическим законам. Такие модели называются вероятностными или стохастическими*), в отличие от детерминированных **) моделей, которые таких компонентов не содержат. Так, если какой-либо элемент изучаемого объекта *) От греческого слова «стохастикос» — умеющий угадывать. **) От латинского слова «детермино» — определяю.
33
является изделием массового производства и на интересующие нас свойства могут заметно повлиять отклонения параметров от их номинальных значений, то эти параметры часто считают случайными величинами. Случайные функции появляются, например, при рассмотрении воздействия ветра на какие-либо сооружения, сигналов на фоне шума, шероховатых поверхностей, турбулентных движений жидкости и т. д. Вероятностные модели изучаются с помощью методов теории вероятностей. К сожалению, довольно часто бывает, что вероятностные характеристики случайных компонентов (математические ожидания и дисперсии случайных величин, тем более законы распределения последних, а также аналогичные характеристики случайных функций) оказываются известными с весьма Невысокой точностью или даже вовсе неизвестными, т. е. модель не удовлетворяет требованию продуктивности (см. п. 5 § 1). Методы математической статистики направлены на определение таких характеристик, но и эти методы не всегда удается эффективно применить. Поэтому при построении вероятностных моделей надо уделять существенное внимание источнику таких характеристик. Если они не поддаются определению с необходимой точностью, то можно попытаться поискать другую модель, быть может более грубую, но и более устойчивую относительно пробелов в знании исходных данных. Например, иногда удается провести исследование и вычисления по максимальным отклонениям рассматриваемых параметров. Приведем пример. Пусть х — решение задачи Коши Yt + я ('; ) х = 0
(0 ^ i < оо),
х (0) = 1,
где а — случайная функция (переменная ш, как это принято в теории вероятностей, имеет смысл элементарного исхода). Тогда и х = х (/; ) — случайная функция, характеристики которой существенно зависят от характеристик функции а. Но пусть не представляете* возможным детально узнать характеристики функции я, известно только, что всегда 1 ^ а «£ 2. Тогда, подставляя крайние возможные значения, мы получаем гарантированную оценку решения: ё~ъ * ^ х < е~'; из нее, например, следует, что х (t; ш) -* 0 с экспоненциальной скоростью при t -* *>. Применяется классификация моделей и по другим признакам. Так, различают статические и динамические (эво34
лкщионныё) модели; для второго типа моделей предметом изучения является изменение рассматриваемого объекта во времени. Промежуточное место занимают квазистатические, стационарные и квазистационарные модели. В квазистатической модели принимается, что изменение объекта происходит столь медленно, что при рассмотрении ситуации в каждый момент можно в первом приближении объект считать статическим (грубо говоря, пренебречь инерционными силами), а время считать добавочным параметром. В стационарной модели считается, что процессы происходят, но изучаемый объект во времени не меняется; простейший пример — электрическая цепь с постоянным током. Естественно определяется и квазистационарная модель. В связи с перечисленными сейчас типами моделей упомянем еще о применяемых здесь терминах: установившимся процессом обычно называют стационарный или периодический процесс; переходным процессом называют процесс перехода от одного статического состояния или установившегося процесса к другому. § 3. ПОСТРОЕНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ
Ь О содержательной модели, Очевидный, но важнейший начальный этап построения или выбора математической модели — это получение по возможности более четкого представления о моделируемом объекте и уточнение его содержательной модели, основанное на неформальных обсуждениях. Нельзя жалеть времени и усилий на этот этап, от него в значительной мере зависит успех всего исследования. Не раз бывало, что значительный труд, затраченный на решение математической задачи, оказывался малоэффективным или даже потраченным впустую из-за недостаточного внимания к этой стороне дела. В задачах тех типов, которые мы здесь рассматриваем, этот этап обычно заключается в уточнении структуры изучаемого объекта, существенных для проводимого исследования свойств его компонентов и характера их взаимодействия. Пусть, например, мы изучаем действие некоторого механическою устройства. Тогда мы начинаем с выяснения TOIX), из каких частей оно состоит, каковы их свойства, как эти части взаимодействуют, какие силы при этом возникают, а также не могут ли какие-либо немеханические процессы 35
(тепловые, электрические и т. д.) заметно повлиять на изучаемую ситуацию. Содержательную модель, особенно при первоначальном исследовании, желательно по возможности упростить (но, конечно, так, чтобы при этом не исказить качественную картину явления): грубую модель можно в дальнейшем уточнить. Так, мы выясняем, нельзя ли принять тот или иной элемент устройства за материальную точку или за абсолютно жесткое тело; если форма этого элемента существенна, то нельзя ли ее считать простой и т. п. При таком упрощении надо использовать аналогии с другими успешно решенными задачами, с другим собственным и чужим опытом. Но, конечно, нельзя бездумно идти на поводу готовых схем, так как решение каждой новой задачи требует новых, порой принципиально новых, соображений. Если твердый элемент устройства обладает податливостью, то необходимо выяснить ее характер, т. е. следует ли считать деформации упругими или пластическими и т. д., можно ли считать материал однородным и изотропным. Если в рассматриваемую систему входят сыпучие тела, грунт или другие «неклассические» среды, то надо уточнить, какие из нужных нам свойств этих сред известны. Аналогично уточняются свойства жидких и газообразных компонент: наличие вязкости, сжимаемости, характер движения (ламинарное, турбулентное) и т. п. При упрощении сложных структур широко применяется осреднение. Так, многокомпонентные среды (композиты, взвеси и т, п.) заменяются на однокомпонентные с соответственно подобранными свойствами; повторяющиеся дискретные нагрузки, соединения (типа заклепочных швов), другие конструктивные элементы — на непрерывные, если это упрощает исследование (п. 2 § 2); осредняются также быстро колеблющиеся внешние воздействия (п. 5 § 4). Важную роль играет выяснение сил, действующих в системе, как внешних, так и внутренних. И здесь стараются произвести упрощения: малосущественные силы игнорируются (их можно учесть при уточнении исследования); при возможности производится группировка сил с заменой их на равнодействующие и т. п. Приведем простой пример. Пусть в примере п. 1 § 1 массой тп пружины пренебрегать нельзя; как учесть это обстоятельство? Отметим, прежде всего, что если один конец однородной пружины массы тп закреплен, а другой движется вдоль линии ее действия со 36
скоростью v> то, приняв растяжение равномерным *) и обозначив /п ее длину в ненагруженном состоянии, получаем выражение для кинетической энергии пружины:
Поэтому закон сохранения энергии в применении к рассматриваемой системе имеет вид (dx)2
1 т
2Щ
+
I m
(dx\2
+
6 «pJ 2
I , 2 k x =COnSt
-
После дифференцирования и сокращения на dx/dt лучаем
по-
Сравнивая с уравнением (1Л), мы видим, что в приведенных предположениях можно считать массу пружины равной нулю — это, конечно, упростит модель,— но к массе груза добавить т п / 3 . Это поправочное слагаемое называется присоединенной массой пружины в рассматриваемой задаче. Отметим, что при анализе содержательной модели надо уточнить, какие именно данные мы можем считать известными,— в частности, не проще ли непосредственно измерить величину, которую в принципе можно и вычислить. *) При каком условии это допущение приемлемо? Естественно считать, что это можно сделать, если характерное время Т п , связанное с собственными продольными колебаниями пружины, существенно меньше характерного времени 7Y, связанного с колебаниями груза, так как тогда неравномерность растяжения пружины будет за время ТТ успевать выравниваться. Рассуждая, как в п, 1а Добавления, можно вывести (попробуйте!) уравнение
продольных колебаний прижины. Отсюда, в силу п. 5 § 5, получаем скорость уЩ/шп распространения возмущений вдоль по пружине. За Тп можно принять время прохождения возмущения вперед и назад вдоль пружины, т. е. Тп = 2/n/VT$/wn ~ 2 /ж£7£. За 7V можно принять период колебаний груза, т. е., в силу п. 1 § 1, 7> = ТлЫТпРИ. Таким образом, допущение о равномерном растяжении пружины можно считать приемлемым, если 2 vmJJ7Jf
У = Уь Уъ •••> УнТогда, если N не слишком велико, обычно начинают с нанесения этих данных на координатную ось в виде 41
отдельных точек. При этом становятся видны точки, выпадающие из общего хода зависимости. Они могут свидетельствовать о каких-то важных эффектах, требующих специального исследования, но чаще получаются из-за существенных ошибок при эксперименте или вычислениях — тогда эти точки просто игнорируются. Затем надо выбрать вид формулы, которой мы будем пользоваться. Если этот вид не вытекает из каких-либо общих соображений, то обычно выбирают одну из простейших элементарных функций или их простую комбинацию (сумму степенных или показательных функций и т. п.); конечно, для этого надо хорошо представлять себе возможные графики таких функций. При этом следят за тем, чтобы подбираемая функция fix) имела те же характерные особенности, что и изучаемая функция у(х). Так, если по своему содержательному смыслу функция у(х) четная, то и функция fix) должна быть четной и т. п.; очень важно правильно передать поведение функции при больших и малых значениях х, возможную смену ее знака и другие ее существенные черты. На малом интервале изменения х часто применяют наиболее простую — линейную функцию, а вблизи точки экстремума — квадратичную функцию. Иногда не удается подобрать единую формулу на всем интервале изменения х и приходится разбивать этот интервал на части и на каждой подбирать свою формулу. После выбора вида формулы нужно определить значения входящих в нее параметров. Рассмотрим сначала случай, когда экспериментальные точки подсказывают линейную зависимость у от х, т. е. мы полагаем fix) = ах + b и нам надо найти значения параметров а и А. Если высокой точности не требуется (тем более, что формула все равно приближенная), то это можно сделать непосредственно с помощью графика, проведя прямую — лучше всего применив прозрачную линейку,— к которой экспериментальные точки лежат ближе вс^го, а затем определить ее параметры. Если требуется бблыыая точность или если мы хотим обойтись без геометрических построений, ограничившись линейными приближениями, то наиболее часто для подбора параметров а я b применяется метод наименьших квадратов. Он состоит в минимизации суммы квадратов разностей между эмпирическими значениями функции и соответствующими ее значениями, полученными из 42
приближенной формулы, N
2 Ьг - (axi + b) f ~» min. Применение необходимого условия экстремума (равенство нулю производных первого порядка по каждому аргументу) к этой сумме, рассматриваемой как функция величин a, by приводит к простой системе уравнений для определения а и Ь:
Этот метод можно применить и к формулам другого вида, даже содержащим более одной независимой переменной и (или) любое число параметров, если эти параметры входят линейно в искомую формулу. Если это не так, то иногда оказывается возможным ввести новые переменные так, чтобы это условие было выполнено. Приведем пример. Пусть эксперимент привел к значениям: х = 0,00; 0,10; 0,20; 0,30; 0,40; 0,50; 0,60; 0,70; 0,80; 0,90; 1,00; у = 0,00; 0,01; 0,03; 0,08; 0,17; 0,29; 0,45; 0,66; 0,91; 1,22; 1,57. Изображение экспериментальных точек на миллиметровке, которое мы предоставляем сделать читателю, напоминает о ь степеннбй функции вида у = ах у в которую параметр b входит нелинейно. Поэтому прологарифмируем это равенство и обозначим In у = У, In х = X, In a » А Мы приходим к формуле У = ЬХ + А, в которую параметры А и b входят линейно. В новых переменных таблица имеет вид X = — 1,0000; — — 0,3010; — 0,2218; 0,0000; У = — 2,0000; — — 0,5376; — 0,3468; —
0,6990; — 0,5229; — 0,1549; — 0,0969;
— 0,3979; — 0,0458;
1,5229; — 1,0969; — 0,7696; 0,1805; — 0,0410; 0,0864; 0,1959.
Применение метода наименьших квадратов дает значения Ъ = 2,2734, А в 0,16079, откуда а = 1,4481, и с учетом точности исходных данных мы получаем приближенную формулу у = 1,45JC2' . Отметим, что на полученные значения параметров могут существенно повлиять погрешности при измерении малых значений у. Для повышения 43
достоверности результата следует либо повысить точность этого измерения, либо игнорировать эти значения при применении метода. 5. О размерностях величин, В приложениях математики — в отличие от курса самбй математики — рассматриваемые величины, как правило, размерны. Этому важному вопросу не всегда уделяется необходимое внимание, что может послужить источником ошибок. Напомним, что по определению две величины имеют одинаковую размерность, если их можно выразить в одних и тех же единицах измерения. Так, величины vx = 5 км/с и ify = 3 фут/ч имеют одинаковую размерность; это записывают так: [Vi] = [v2]. Обычно размерности некоторых величин принимаются за основные, а размерности других величин выражаются через основные. Так, в задачах, связанных с механикой, за основные берутся размерности длины (эта размерность обозначается буквой L), времени (Г) и массы (М), так что, например, При решении задач в буквенной форме обычно все формулы без особой оговорки считаются размерно однородными, т. е. не связанными с определенными единицами измерения участвующих величин. Но в числовых ответах эти единицы обычно присутствуют, т. е. размерная однородность нарушается. Например, широко известная формула 2 для пути при свободном падении s = at /! размерно однородна, тогда как та же формула, записанная в виде 2 s = 4,90* , уже не обладает этим свойством, она требует, чтобы s было выражено в метрах, a t — в секундах. Как перейти в размерно неоднородной формуле к другим единицам измерения? Пусть, например, мы хотим в последней формуле перейти к километрам и минутам. Для этого представим S (м) = — =
^
—,
t (С) = 7~ = -—:
,
где s и t — размерные путь и время. Отсюда получаем подробно s (км) = ~
3
3
2
= l(T s (м) = 1(Г -4,90 [*(с)] =
6 0 - 1 мин
60 2
или окончательно в новых единицах 5 = 17,65* . 44
Если размерность какой-либо величины не сразу видна из ее определения, то ее легко получить из любой размерно однородной формулы, содержащей эту величину и другие величины, размерность которых известна. Выясним, например, размерность коэффициента температуропроводности из формулы (1.4). Так как дифференциал любой величины имеет ту же размерность, что и сама величина, то, приравнивая размерности левой и правой частей формулы, получаем [в]
2
[В]
~ = [ а ] ^ ,
[X]
откуда
(y где к» = >Щ. Далее, мы видим, что плотность жидкости на данной стадии несущественна. Кроме того, обозначив буквой t время какой-либо фазы процесса, получаем безразмерную комбинацию t/gt2, равенство которой для модели и натуры приводит к соотношению /м =* ktu где kt - VTq, откуда выводим формулу для пересчета времени: t = tM/yflq. Если мы рассматриваем больший промежуток времени, чтобы исследовать затухание колебаний, то надо учесть и вязкость жидкости. Эта вязкость характеризуется кинематическим коэффициентом v, который надо причислить к заданным параметрам процесса. Так как [v ] = L2T~l, то здесь появляется еще один критерий подобия — число Рейнольдса Re = vl/v, которое тоже надо сохранить при переходе к модели. Отсюда получаем, что должно быть vM = *vV, где ку = kyfri- к?2. Таким образом, для соблюдения подобия вязкость в модели надо существенно уменьшить; например, если модель меньше оригинала в 10 раз, то кинематическую вязкость жидкости при переходе от оригинала к модели надо уменьшить в 103/2 « 32 раза, что примерно соответствует переходу от нефти к воде. Отметим еще, что модель не должна быть слишком малой, чтобы в ней не стали играть существенную роль капиллярные силы. В самом деле, эти силы пропорциональны площади свободной поверхности жидкости, т. е. квадрату линейного размера, тогда как объемные силы пропорциональны кубу этого размера. Поэтому при уменьшении размеров капиллярные силы становятся преобладающими. Вопросы, связанные с размерностью и подобием, подробно разобраны в [28 ]. 7. Конечные уравнения. В этом и последующих пунктах мы коротко опишем наиболее распространенные типы уравнений, встречающихся в приложениях математики в качестве компонентов математических моделей, а также упомянем о методах их решения; подробное изложение этих методов можно найти в курсах приближенных вычислений. Конечное уравнение (алгебраическое или трансцендентное, т. е. неалгебраическое) после переноса всех его членов в левую часть имеет общий вид
/(х) = 0, . 48
(3.3)
где / — скалярная функция скалярного аргумента; система конечных уравнений с несколькими неизвестными имеет вид /i (*i, хъ
..., хп) = О,
h (*ь хъ ..., хп) = 0,
(3,4)
/«(*ь хъ ..., хп) ~ 0. Если имеется в виду точное решение такой системы, то надо следить за тем, чтобы уравнений было столько же, сколько неизвестных, и чтобы эти уравнения были независимыми, т. е. чтобы ни одно из них не было следствием остальных. Наиболее благоприятен случай, когда все уравнения (3.4) — алгебраические уравнения первой степени. Тогда для построения решения в общем случае применяется тот или иной вариант метода Гаусса (последовательного исключения неизвестных). Стандартные программы для ЭВМ позволяют решать подобные системы, в которых число неизвестных может исчисляться сотнями. Разработан также ряд методов, эффективных при решении специальных классов линейных систем, возникающих в различных приложениях математики. Отметим одно осложнение, которое может проявиться даже при решении линейных систем уравнений: такая система может оказаться плохо обусловленной, т. е. малое изменение исходных данных может существенно изменить решение, а поскольку исходные данные известны лишь приближенно, то решение тогда получается совершенно недостоверным. В качестве примера приведем систему уравнений 1,756* + 2,315у = 4,726, 1,261л: + 1,662^3,393.
(3.5)
3
Ее решение с точностью до 10~ таково: х - 0,246; у = 1,857. Заменив же правую часть второго уравнения на 3,394, мы получаем решение х = 3,362; у = - 0,509. Ясно, что эти результаты не внушают доверия. Кстати, вычисление «вручную» сразу показывает, в чем здесь дело: определитель системы равен - 0,000743, т. е. хотя формально и не равен нулю, но очень близок к нему, а значит, уравнения «почти зависимы». Но ЭВМ, если не принять необходимых мер 49
предосторожности, выдаст каждый из приведенных результатов как достоверный •), Имеются различные способы распознавания плохой обусловленности системы уравнений. Самый простой из них состоит в пересчете решения при произвольном изменении исходных данных в рамках их точности. Если при этом обнаружится неприемлемый разброс результатов, то обычно стараются как-то существенно изменить систему уравнений задачи, другими словами, заменить математическую модель. Нелинейное уравнение (3.3) решают чаще всего «вручную», а систему вида (3,4) — на ЭВМ обычно с помощью какого-либо из вариантов метода Ньютона 2 аргументов поясним, взяв п = 3: /(х, у, z)-»min. (3.16) Наиболее ясен случай, когда функция / определена при всех значениях своих аргументов и непрерывна вместе со своими частными производными; тогда обычно применяется один из методов спуска. Так, метод наискорейшего спуска основан на том, что антиградиент функции /, т. е. вектор — grad / с проекциями - /J (Л:, у, Z), ~ fy (х, yy z), - Л (*> У, 2), указывает направление наибыстрейшего убывания этой функции в точке (х, у, z). Отправляясь от некоторой начальной точки М 0 (х 0 , Уо, z0) по направлению антиградиента в ней и следя вдоль (прямой) линии движения за значением функции /, т. е. переходя к функции одного аргумента /о (0 = / (*о - kofl (х0, уОу ZQ) U Уо - kofy (х0, Уо, z0) t, zo ~ *оЛ (хо, Уо, zQ) t),
мы можем найти точку Мх(хи Уь ^i)> в которой функция / минимальна вдоль этой линии. Затем мы отправляемся от 63
точки Mi по направлению антиградиента в ней, т. е. вновь переходим к функции одного аргумента Л (0 = / C*i - kjfx (* ь уи zx) U Ух - kj; (хи уь *i) U z\ " № (xi, уь zi) t) и т. д, (Множители к, вводятся для того, чтобы при приближении к точке минимума движение не слишком замедлялось; например, можно положить kt = ((grad/l^,)"" 1 .) Применяются и другие методы спуска: покоординатный спуск, спуск по случайным направлениям и др. Направление спуска может и непрерывно подправляться: так, в методе градиентного спуска мы задаемся малым шагом А и переходим от точки Мг к точке Af,+i по формулам *i+i = *« - kfx (х„ уп z) h
и аналогично yt+lt
zt+i.
Известны многочисленные варианты этих методов, приспособленные к решению различных классов задач. Функция / может иметь несколько локальных минимумов, а данный метод приводит лишь к одному из них, быть может, не самому глубокому. Для поиска более глубокого минимума можно попробовать повторить процесс несколько раз, начиная с различных точек Мо. Однако достаточно представительный выбор таких точек можно получить, только если число аргументов не слишком велико — скажем, порядка 10 или менее (чем меньше, тем лучше). Впрочем, выбор М о вблизи от искомой точки минимума позволяет увеличить число аргументов и существенно ускорить процедуру. Поэтому неформальные обсуждения и прикидки, позволяющие хотя бы грубо нащупать искомую точку, весьма желательны. Если задача на минимум содержит параметр, то можно, найдя точку минимума при некотором начальном значении параметра, последовательно ее перестраивать, совершая шаги по параметру наподобие п. 5. Впрочем, при таком продолжении точка минимума может для некоторого критического значения параметра пропасть; кроме того, если рассматриваемый минимум был первоначально самым глубоким, то в процессе продолжения он может перестать быть таковым. Не менее часто встречаются задачи на условный экстремум, в которых аргументы целевой функции связаны конечными уравнениями (связями), причем число независимых связей должно быть меньше числа аргументов. Так, в задаче (3.16) может быть одна или две таких связи; рассмотрим для 64
определенности случай одной связи * ( * , y , z ) = 0,
(3.17)
так что полная задача имеет вид (3.16), (3.17). В ней остается 3 — 1 = 2 степени свободы. Наиболее благоприятен случай, когда совокупность уравнений связи можно заменить эквивалентным параметрическим представлением аргументов. Для задачи (3.16), (3.17) это означает, что переменные х, у, z, удовлетворяющие уравнению (3.17), можно представить в виде х = х ( и , v ) , у - у ( и , v ) , z - z ( и , и).
Тогда рассматриваемая задача сведется к задаче на безусловный минимум / (х (и, v), у (и, v), z (и, v)) -* min, к которой можно применить указанные выше методы. Однако чаще такой переход осуществить не удается и тогда приходится проводить спуск в пространстве аргументов вдоль поверхности (5), определенной уравнением (3.17) (в общем случае — вдоль многообразия, определенного совокупностью уравнений связи). Так, в градиентном методе мы, отправляясь от точки М о € (5), совершаем шаг^по^ направлению — (grad /)щ, получаем точку Мх (Зсь уъ zx), приближенно проецируя которую на (S) (для этого приходится приближенно решить конечное уравнение 8 (*i + g'x (xOy УОУ ZQ) U
ух + g'y (*ь, 3>о, zo) U
*i + * И * ь Л , *ь)0 = 0), находим точку Mi G (5). Далее проделываем ту же процедуру» отправляясь от точки Мъ и т. д. В последние годы в качестве математических моделей широко распространились задачи на экстремум с ограничениями, т. е. задачи, в которых аргументы целевой функции связаны конечными неравенствами (высвобождающими связями), число которых в отличии от уравнений связи может быть любым. Рассмотрим для определенности задачу (3.16), в которой аргументы связаны неравенствами hx (x, у, z) ^ 0,
h2 (x, у, 2) < 0,
(3.18)
и обозначим (V) (трехмерную) область в пространстве х, у, z, определенную этими неравенствами. Пока оба они являются строгими, мы можем пользоваться градиентным методом в простейшем варианте. Но пусть после очередного 65
шага одно из неравенств (3.18), например первое, оказалось нарушенным. Это означает, что точка вышла за пределы (V) и потому ее нужно спроецировать на поверхность Ai(x, у у г) = 0 этой области. При дальнейших шагах, пока вектор - grad / направлен из (V) (что распознается по знаку Л]), мы производим проецирование точек на эту поверхность, как при отыскании условного экстремума* Может оказаться, что через какое-то число шагов вектор - grad / будет направлен внутрь (V) и тогда при дальнейшем спуске неравенства (ЗЛ8) становятся строгими, т. е. связь снимается (во всяком случае, до следующего выхода на границу). Но может получиться и так, что при спуске по поверхности hx = 0 мы приходим к точке, где и второе неравенство (ЗЛ8) нарушено. Тогда надо ее спроецировать на ребро {hx = 0, h2 = 0} и в дальнейшем в соответствии с направлением вектора - grad / спускаться либо по этому ребру, либо по примыкающим к нему граням (hi = 0 и h2 = « 0). Для выбора того, по какому именно многообразию надо идти, здесь и в общем случае имеется алгоритм, определяемый так называемой теоремой Куна — Такера и содержащийся в курсах нелинейного программирования. Аналогично решается задача на условный экстремум с ограничениями, в которой аргументы целевой функции связаны не только неравенствами, но и уравнениями. Отметим, что если область (Ю, определенная всеми этими неравенствами и уравнениями, неограниченная (простирается в бесконечность), то задача на экстремум может и не иметь решения; обычно это свидетельствует о ее неправильной формулировке. Некоторые классы задач на экстремум с ограничениями разработаны особенно далеко. Так, если целевая функция является линейной, равно как и все уравнения и неравенства, связывающие ее аргументы, то мы имеем задачу линейного программирования. Имеются стандартные программы для ЭВМ, позволяющие решать такие задачи, даже если целевая функция имеет несколько сотен аргументов. Известны также алгоритмы решения задач линейного целочисленного программирования, is е. задач, для которых аргументы целевой функции по своему смыслу могут принимать только целочисленные значения. Если целевая функция и левые части высвобождающих связей, записанных по образцу (3.18), являются выпуклыми функциями, а все невысвобождающие связи линейные, то перед нами — задача выпуклого программирования. При этом функция /Ось х2, ..., хп) называется выпуклой, если для 66
любых хи Уи *2> Уг, .«, хпу уп выполнено неравенство
/ (Xi + yi £L±2i 1
I
2
'
2
Хп + Уп) ' ""
2
I *
< 2 ^ (*ь
Хъ
-• *») + * (Уь Л» •••» Уп)1
(Для функции одного аргумента это означает, что ее график выпуклый книзу; если же функция /0с ь хъ ..., хп) имеет непрерывные производные второго порядка, то ее выпуклость равносильна неотрицательности всех собственных зна2
d/
n
u
.) Задачи выпуклого про! граммирования обладают важным свойством: они не могут иметь более одного решения, и если решение есть, то метод спуска обязательно приводит к нему. Задача выпуклого программирования, для которой целевая функция квадратична, а высвобождающие связи линейны, называется задачей квадратичного программирования; для таких задач алгоритм решения особенно стандартизован. Отметим, что задача на нахождение экстремального значения целевой функции несколько отличается от задачи на нахождение точки экстремума (т. е. значений аргументов, при которых экстремум достигается). В самом деле, пусть, как это чаще всего бывает, все участвующие функции имеют непрерывные частные производные. Тогда точка безусловного экстремума задачи без ограничений является стационарной для целевой функции /, т. е. в этой точке все производные первого порядка функции / равны нулю. Отсюда следует, что малая погрешность при определении точки экстремума влечет за собой погрешность второго порядка малости для экстремального значения функции /. Таким образом, если цель исследования состоит только в том, чтобы придать функции / по возможности меньшее значение, то для рассматриваемого класса задач не требуется слишком точно находить точку минимума, так как это практически не повлияет на значение функции. (См, пример в конце п. 8 & 5.) То же относится к задаче на условный экстремум без ограничений, если только соблюдение уравнений связи обеспечено с достаточной точностью. (Что касается задач с ограничениями, то подобное «шатание» точки экстремума возможно только вдоль содержащей ее грани наименьшей размерности области (F).) ——
67
В заключение укажем на один специфический класс задач с дискретным временем, для решения которых применяется так называемый метод динамического программирования, получивший в последние годы разнообразные применения. Пусть состояние некоторого объекта характеризуется величиной х (непрерывной или дискретной) и этот объект надо перевести из заданного состояния х0 в момент to в заданное состояние xN в момент tN, подобрав для этого промежуточные состояния хи #2> • • • » * * - i в моменты гъ hi •••> 2/v-i* Пусть при этом известна стоимость /,0с, у) перевода объекта из состояния х в момент £ в состояние у в момент £+1. Задача состоит в том, чтобы минимизировать общую сумму затрат: /о (*о> *i) + /1 (*ь *а) + ... + /*-1 G*jv-i, хы) -* min. В курсах динамического программирования приводятся алгоритмы решения этой и родственных ей задач, в частности аналогичной задачи с непрерывным временем. Все описанные в этом пункте задачи могут включать те или иные случайные компоненты. Тогда значение целевой функции становится случайной величиной и цель задачи состоит в минимизации математического ожидания этой величины. По поводу задач, упомянутых в этом пункте, см. [7, 20, 24, 26] и т. д. 11. Задачи на экстремум с искомой функцией. Одной из самых наглядных задач подобного рода является задача о кривой наибыстрейшего спуска, поставленная еще Галилеем: среди всех кривых, лежащих в плоскости х,ус вертикальной осью у и имеющих заданные концы А(а, И) и В(Ь, 0), где а < by h > 0, найти такую, двигаясь по которой под действием только силы тяжести, материальная точка, отправляясь из А без начальной скорости, достигнет В за минимально возможное время. Для формулировки математической модели допустим, что некоторая кривая с концами А и В и с уравнением у = = у(х) задана; тогда можно проверить (попробуйте!), что время спуска по ней равно
а
где g — ускорение земного тяготения. Этот интеграл принимает определенное значение, если функция у(х) задана. Подобного рода соотношение, когда каждой ф у н к ц и и 68
из некоторого класса отвечает определенное значение некоторой в е л и ч и н ы , называется функционалом. Таким образом, для функционала те функции, на которых он определен, являются как бы значениями независимой переменной. Чтобы подчеркнуть это обстоятельство, будем в этом пункте, как это сейчас часто делают в математической литературе, различать обозначения у и у(х), понимая под у (пишут также у( •) > саму функцию как закон зависимости, а под у(х) — значение этой функции при значении х аргумента. Тогда сформулированную задачу можно, обозначив функционал буквой /, записать в виде Ь
у
^> : = = J v Ш ^ Ш
-*min
dx
a
при заданных краевых условиях у(а) = А, у(Ь) = 0. Эта задача принадлежит к следующему общему классу: найти функцию у, для которой ъ
/ (у):» / F(x,y (х), у' (х)) dx - min
(3.19)
а
при заданных краевых условиях У(а) = у., у(Ь) = уь. (3.20) Такие задачи изучаются в курсах вариационного исчисления, где рассматриваются и разнообразные варианты: функционал / может включать и производные более высокого порядка функции у, функция у может принимать векторные значения (другими словами, искомыми будут не одна, а несколько функций) и зависеть от нескольких аргументов, краевые условия могут быть заданы не на всей границе или даже вовсе не заданы и т. д. Рассматриваются также задачи на условный экстремум — например, если в задаче (ЗЛ9), (3.20) заданы одно или несколько добавочных условий вида ь 1 g (у) := / G (х, у (х), у (JC)) dx = 0. а
Такая вариационная задача называется изопериметрической; название происходит от следующей знаменитой задачи: среди всех линий заданной длины на плоскости найти такую, которая ограничивает фигуру наибольшей площади. 69
Подобно задачам на экстремум с конечным числом степеней свободы задача (3.19), (3.20) более проста, если функция F определена для всех значений своих аргументов и имеет непрерывные производные. В этих предположениях функция уу на которой функционал принимает экстремальное значение, является стационарной точкой функционала /. (Это означает, что при малом варьировании функции j>, т. е- при переходе к функции у 4- by, где Ьу и (Ъу)' малы, с сохранением условий (3.20) значение функционала / изменяется на величину высшего порядка малости.) А из условия стационарности легко выводится дифференциальное уравнение — так называемое уравнение Эйлера,— которому должна удовлетворять искомая функция у. Так, для функционала (ЗЛ9) уравнение Эйлера имеет вид ^
dx
и>
у
формулу прямоугольников, получим
1*1
при этом надо учесть, что значения у0 и уп заданы в силу условий (3.20). Таким образом, мы приходим к задаче на экстремум функции п—1 аргументов у ь у2, ..., уп~ъ которую можно приближенно решать одним из методов, упомянутых в п. 8. Аналогично решаются задачи на условный экстремум и экстремум с ограничениями для функционала (3.19) и функционалов более сложной структуры. Другой распространенный прямой метод приближенного решения вариационных задач — метод Ритца — по классификации п. 6 принадлежит к числу непрерывных. Так, для задачи (3.19), (3.20) этот метод состоит в том, что приближенное решение строится в виде у « фо + aiipi + а2г|>2 + ... + antyn.
или, подробнее, Fy (*, у, у') - i y (х, у, у') - 4
!
(*. 3% У) У -
-FyZ(xty9y')y"
= Q.
Таким образом, вместе с (3.20) мы получаем краевую задачу для дифференциального уравнения второго порядка. В некоторых довольно редких случаях эту задачу удается решить точно. Так, в задаче о кривой наибыстрейшего спуска (см. начало этого пункта) оказывается, что решением служит дуга циклоиды с точкой возврата в А, проходящая через В. Но гораздо чаще точное решение найти не удается и краевую задачу решают приближенно тем или иным способом. Однако еще чаще применяются прямые методы, с помощью которых приближенное решение задачи на экстремум функционала уводится без обращения к уравнению Эйлера к аналогичной задаче с конечным числом степеней свободы. Один из таких методов, предложенный еще Эйлером, состоит в следующем. Разобьем интервал [а, А] на л равных частей длины h = (h — а)/п и обозначим xt = а + ih,
yt = уОс,),
i = 0, 1, ..., п.
После этого напишем приближенное выражение интеграла (ЗЛ9) с помощью одной из квадратурных формул, причем производные также заменим приближенным выражением через значения yt. Например, применяя квадратурную 70
(3.21)
Здесь функция , (а) = ^ (Ь) = 0, а а, — искомые постоянные. Подстановка выражения (3.21) в интеграл (3.19) сводит исходную задачу к задаче на экстремум с конечным числом степеней свободы. В последние годы весьма широко распространился еще один класс экстремальных задач с искомой функцией — задачи оптимального управления. Поясним их на простом примере. Пусть вдоль оси х движется материальная точка массы т под действием только силы инерции и внешней силы Fit), которая находится в нашем распоряжении, но не может по модулю превышать заданное значение Fo. Требуется так выбрать внешнюю силу, чтобы за кратчайшее время («задача о быстродействии») точка пришла в начало координат JC = 0 и там остановилась. Математическая формулировка этой задачи имеет вид "(()
тх
x (0) = jc0,
= F(0,
\F(t)\
^Fo,
O^t 0 ( < 0), то надо полагать Fit) = -FQ (соответственно Fit) = F o ), пока оно не обратится в равенство; после этого переключить Fit) на противоположное крайнее значение и ожидать прихода точки в начало координат, после чего отключить силу. Это 71
правило действий наглядно показано на «фазовой плоскости» JC, v (v — скорость точки; рис. 8), где жирная линия имеет уравнение 2Fox + mv \ v\ = 0, а тонкие линии показывают изменение х и v при указанном выборе Fit) для различных начальных условий. Одна из возможных общих форм подобных задач такова: задана система дифференциальных уравнений х'х (t) = ft {U xi (t), х2 (0, - э хп (Г), их (О, иг (0, ..., ит (0), х'г (0 = Si {U Хх (О, х2 (0, •.., *« (0> «1 (0. «2 (0» •••* и* (0), *« (0 = & (*, Xi (0, Х2 (/), ..., ДГЯ (0, «1 (0» «2 (0. • • • » Um (0)» а также начальные и конечные условия * 1 (*Ь)
=
*10» Х2 (to) = *2(Ъ ••*> * л (*б) — Хп$,
xi (T) = л:1Г, х2 (Т) = х 2 г , ..., хп (Г) = x w r . Здесь функции хи хъ ...» хл описывают эволюцию управляемой системы, а функции &ь &2> • • • » ^m — управление, стесненное заданными ограничениями, например, вида
к (01 < и*о ( / * 1, 2, ..., т ) . Требуется так подобрать управление, чтобы минимизировать заданный целевой функционал, например, вида т f(x, и): = / < р (*, *i (0, *2 (0> 'о -м Хй (0, «1 (0» U2 (0» -» "т (0) * "* m i n * Имеются разнообразные варианты этой постановки задачи. Отметим, в частности, что различают программное управление, когда все величины ut строятся как функции времени /, и позиционное управление, когда они зависят также от Xi(t)> x2it)> .,., xn(t),
т. е. в про-
цессе управления мы учитываем, как система эволюционирует, другими словами, имеется обратная связь* Точное решение подобных задач, как в приведенном выше примере, возможно лишь в весьма редких случаях. Разнообразные методы приближенного построения решения содержатся в курсах оптимального управления. 72
Подчеркнем в заключение, что решение любой задачи на оптимизацию самым существенным образом связано с выбором критерия оптимальности, т. е. целевого функционала. При смене критерия решение может измениться, так что не существует «оптимизации вообще» без указания критерия, он должен быть явно указан или подразумеваться. Невнимание к этому вопросу, неправильный выбор критерия порождали многочисленные недоразумения и ошибки. Приведем простой пример, взятый из книги [37 ]. Пусть три города А, В, С, расположенные в вершинах правильного треугольника на ровной местности, надо соединить автодорогами; как это лучше всего сделать? Решение этой, казалось бы, совсем простой задачи существенно зависит от выбора критерия. Если мы поставим целью минимизацию стоимости строительства, т. е. минимизацию общей длины дорог, то решение окажется таким, как показано на рис. 9,a (AD = = BD = CD); если же мы захотим минимизировать время проезда из одного города в другой, то решение изменится — оно показано на рис. 9,6. Отметим, что «классические» математические методы можно применять, если критерий оптимальности в задаче только один. Поэтому распространенные выражения типа «получить максимальную пользу при минимальных затратах» математически некорректны; надо говорить «получить максимальную пользу при заданных затратах» (тогда критерий — максимизация пользы) или «получить заданную пользу при минимальных затратах» (критерий — минимизация затрат). Многокритериальные задачи на оптимизацию обычно стараются как-то свести к единому критерию, но это далеко не всегда удается. (Что лучше — быть богатым, но больным или бедным, но здоровым?) Тогда приходится привлекать экспертные оценки и т. п. Численные методы решения задач на экстремум, упомянутых в этом пункте, приведенные во многих книгах; см., в частности, [7], [18] и др. 12. О применимости математического анализа. Все основные понятия и соотношения математического анализа в прикладном исследовании получаются в результате идеализации, упрощения свойств реального объекта, и это 73
необходимо иметь в виду при построении его математической модели. Рассмотрим несколько примеров. Пусть в электрическую цепь в момент t = to включается постоянное напряжение U = Uo. Тогда зависимость U(t) обычно принимается такой, как показано на рис. 10,а, она имеет при t = ^ скачок. Но если более детально проследить за ней, то окажется, что она имеет вид примерно такой, как показано на рис. 10,6, т. е. скачка не имеет. Надо ли учитывать это обстоятельство, т. е. законна ли идеализация U(t) в виде скачка? Ответ зависит от того, какие свойства изучаются, и от значений параметров задачи. В подавляющем большинстве
вопросов характер и время нарастания напряжения несущественны, важно только, что длительность х переходного процесса мала по сравнению с характерным временем Т основного изучаемого процесса — например, периода колебаний, возникающих в контуре. (Кстати, каков смысл выражения «мала по сравнению с ... »? Обычно это означает переход к следующим порядкам величины, т. е. уменьшение по крайней мере в 10 раз. Более детальный разбор этого понятия содержится в п. 6 § 4.) Тогда можно упростить реальную быстро нарастающую зависимость, заменив ее идеализированной — разрывной. Если же х сравнимо с Г, то такая замена может оказаться неадекватной и тогда надо так или иначе учесть нарастающий характер U(t). Наконец, сама эта зависимость может оказаться предметом изучения. Тогда следует принять х за характерное время и в дифференциальных уравнениях, определяющих U(t), перейти к безразмерному времени ГЬ = t/т.
В качестве другош примера рассмотрим определение (Д. 30) понятия плотности неоднородного тела в точке. В математических курсах считается, что область (AQ) бесконечно мала, т. е. в процессе ее изменения размеры этой 74
области становятся меньше любого заданного положительного значения. Но ясно, что реально область (AQ) не может уменьшаться безгранично, ее размеры должны быть существенно больше межмолекулярных расстояний. Как же пбнимать формулу (Д. 30)? Если речь идет о реальном неоднородном теле, то в формуле (Д. 30) под (AQ) надо понимать не математически, а физически (говорят также — практически) бесконечно малую область, т. е. переменную или даже постоянную область, размеры которой должны быть не слишком большими, но и не слишком малыми. Смысл этого требования зависит от свойств изучаемого тела и от постановки задачи. Так, если рассматривается плотность газа, жидкости или аморфного твердого тела, то эти размеры / должны быть велики по сравнению с межмолекулярными размерами X, но малы по сравнению с характерным макроразмерами L, на протяжении которых интересующая нас плотность может заметно измениться. (Можно принять / порядка vTL .) Если перед нами дисперсная структура типа грунта, то / должно быть велико и по сравнению с микронеоднородностями среды и т. п. Когда говорят о элементах объема и массы (см. Добавление, п. б), соответственно dQ и dm = pdQ, то обычно имеют в виду объем и массу физически бесконечно малой области. Формулу (Д. 30) можно понимать и в традиционном математическом смысле, если от реального тела предварительно перейти с помощью осреднения (п. 2 § 2) к его непрерывной математической модели — сплошной среде; при этом осреднение надо производить по областям (AQ) указанных выше размеров. Этот переход называют размазыванием или континуализацией *). Рассмотрим еще математическое понятие устойчивости по Ляпунову равновесного состояния некоторой системы (S). Содержание этого понятия состоит в том, что при бесконечно малых возмущениях координат и скоростей системы (S) в некоторый начальный момент времени эти возмущения останутся бесконечно малыми на протяжении всего дальнейшего бесконечного интервала времени (тогда исходное невозмущенное состояние называется устойчивым) либо могут принять конечные значения (тогда оно неустойчиво). Но как такое понятие можно применять к реальным системам, для которых, казалось бы, рассматриваемые возмущения и интервал времени всегда конечны? *) От латинского слова «континуум* — непрерывное. 75
Ответ на этот вопрос, как и на предыдущий, состоит в отличии математической бесконечности от физической. Математическому бесконечному интервалу времени реально соответствует время перехода из заданного равновесного состояния к другому или к некоторому незатухающему режиму движения, а бесконечно малым начальным возмущениям отвечают любые малые непредвиденные возмущения, которые могут реально появиться в рассматриваемых условиях. В зависимости от этих условий одни и те же возмущения при переходе к математической модели могут квалифицироваться как конечные или как бесконечно малые, а потому одна и та же система — как устойчивая или как неустойчивая. В яркой книге В. И. Феодосьева [30] приведен эффектный пример по этому поводу: сооружение из трех поставленных друг на друга табуреток можно считать устойчивым, если сверху ставится модель в классе для рисования, но должно рассматриваться как неустойчивое, если при его помощи собираются сменить в люстре перегоревшую лампочку. Сказанное сейчас можно описать также следующим образом. Рассмотрим положение равновесия q = 0 для системы (S) с одной степенью свободы (q — обобщенная координата) и потенциалом, показанным на рис, 11 сплошной линией. Тогда, если характерная амплитуда а энергии непредвиденных внешних воздействий значительно меньше «потенциального барьера» Д{/, т. е. а x dt>
+
kXxX
A
e
'
(4.3)
ш' :« а>4, В' := В/х*.
Разделив уравнение (4.3) на коэффициент при старшей лроизводной, получаем безразмерный вариант уравнения (4.1):
*И+ [А] £
+
Щ х. = i i r v
,4)
(4
Он включает четыре безразмерных параметра (три, взятых в скобки, а также со'); однако путем выбора хх, 4 их число можно уменьшить на два. Это можно сделать различными способами в соответствии с условиями задачи и целями исследования. Пусть нас интересует в основном зависимость амплитуды вынужденных колебаний от трения и частоты возбуждения, причем силы инерции и упругости считаем примерно одного порядка. Тогда естественно положить в уравнении (4.4) безразмерные коэффициент упругости kt\/m и амплитуду внешнего воздействия Atl/mxx равными единице, откуда получаем
Таким образом, мы связываем здесь характерное время с периодом свободных колебаний при отсутствии трения (см. формулу (1.2)), тогда как характерное значение ко-
зо
ординаты просто равно ее статическому значению, если внешняя сила постоянна. Выбор таких единиц масштаба определила постановка задачи. После указанной замены уравнение (4.4) принимает вид
и содержит всего два безразмерных параметра /' = f/^mk и u>' = o>Vm/k. Зависимость безразмерной амплитуды |JB'| колебаний от безразмерной частоты со' («амплитудно-частотную характеристику») при различных значениях безразмерного коэффициента трения /' нетрудно представить графически. Зная зависимость \В'\ = F(