МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ
В. А. Густомесов
ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ Учебное пособие
Екатеринбург 2005
УДК 517.5
ББК 22.162
НАУЧНЫЙ РЕДАКТОР: доктор физико-математических наук, профессор Т. Ф. Филиппова
РЕЦЕНЗЕНТ: доктор физико-математических наук Б. И. Ананьев
Густомесов В. А. Функции нескольких переменных. Учебное пособие / Урал. гос. пед. ун-т. – Екатеринбург, 2005. – 118 с.
ISBN
Излагается раздел «Функции нескольких переменных», входящий в базовый курс математического анализа. Изложение базируется на теории функций одной переменной и на теории функций на метрических пространствах. Предназначено для студентов дневного и заочного отделений математических факультетов педагогических вузов.
Библиогр.: 10 назв.
Оглавление Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1 Функции на метрических пространствах 1.1 Определение метрического пространства. Шары и сферы . . . . . . . . . 1.2 Линейные нормированные пространства, их связь с метрическими пространствами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Евклидовы пространства, их связь с линейными нормированными и метрическими пространствами . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Открытые и замкнутые множества в метрических пространствах . . . . . 1.5 Предел последовательности точек метрического пространства . . . . . . 1.5.1 Определение и свойства . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Смысл сходимости в пространстве Rm . . . . . . . . . . . . . . . . 1.5.3 Смысл сходимости в пространстве C[a, b] . . . . . . . . . . . . . . . 1.5.4 Критерий предельной точки . . . . . . . . . . . . . . . . . . . . . . 1.6 Предел функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Непрерывность функции. Локальные свойства непрерывных функций . . 1.8 Глобальные свойства непрерывных функций . . . . . . . . . . . . . . . . . 1.8.1 Функции, непрерывные на линейно связных множествах . . . . . . 1.8.2 Функции, непрерывные на компактных множествах . . . . . . . .
5 5
2 Дифференциальное исчисление функций нескольких переменных 2.1 Приращение функции. Определение непрерывности функции на языке приращений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Частные производные . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Частные производные первого порядка . . . . . . . . . . . . . . . 2.2.2 Частные производные высших порядков . . . . . . . . . . . . . . . 2.3 Дифференцируемость функции . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Дифференцируемость и дифференциал . . . . . . . . . . . . . . . 2.3.2 Необходимые условия дифференцируемости . . . . . . . . . . . . 2.3.3 Достаточные условия дифференцируемости . . . . . . . . . . . . . 2.4 Геометрический и физический смысл частных производных первого порядка. Геометрический смысл дифференцируемости и дифференциала . 2.5 Вычисление производных и частных производных сложных функций . . 2.6 Дифференциалы функции нескольких переменных . . . . . . . . . . . . . 2.7 Формула Тейлора для функции нескольких переменных . . . . . . . . . . 2.8 Производная функции нескольких переменных по направлению . . . . . 2.9 Экстремумы функции нескольких переменных, необходимые условия экстремума . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10 Достаточные условия экстремума . . . . . . . . . . . . . . . . . . . . . . .
3
7 11 13 17 17 19 21 22 22 26 28 28 29 33 33 34 34 35 38 38 40 41 42 43 45 49 52 53 55
2.11 Нахождение наименьшего и наибольшего значений функции нескольких переменных на компактном множестве . . . . . . . . . . . . . . . . . . . . 2.12 Неявные функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.1 Неявные функции одной и нескольких переменных . . . . . . . . . 2.12.2 Системы неявных функции нескольких переменных . . . . . . . . 2.13 Условные экстремумы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Кратные интегралы 3.1 Квадрируемые фигуры . . . . . . . . . . . . . . . . . . . . . 3.2 Определение двойного интеграла . . . . . . . . . . . . . . . 3.3 Существование двойного интеграла . . . . . . . . . . . . . . 3.4 Свойства двойного интеграла . . . . . . . . . . . . . . . . . 3.5 Вычисление двойного интеграла сведением к повторному . 3.6 Замена переменных в двойных интегралах . . . . . . . . . 3.7 Геометрический смысл двойного интеграла . . . . . . . . . 3.8 Тройные интегралы . . . . . . . . . . . . . . . . . . . . . . . 3.9 Приложения кратных интегралов . . . . . . . . . . . . . . . 3.9.1 Вычисление площадей плоских фигур и объемов тел 3.9.2 Определение и вычисление площади поверхности . 3.9.3 Физические приложения кратных интегралов . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
58 59 59 62 64 66 67 68 70 74 75 79 82 84 86 86 86 89
4 Криволинейные интегралы 92 4.1 Криволинейные интегралы первого рода . . . . . . . . . . . . . . . . . . . 92 4.1.1 Определение криволинейного интеграла первого рода . . . . . . . 92 4.1.2 Существование и вычисление криволинейного интеграла первого рода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 4.1.3 Физические приложения криволинейных интегралов первого рода 95 4.2 Определение, свойства, существование криволинейных интегралов второго рода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.3 Физический смысл криволинейных интегралов второго рода . . . . . . . 101 4.4 Формула Грина . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 4.5 Выражение площади плоской фигуры в прямоугольных и криволинейных координатах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 4.6 Условия независимости криволинейного интеграла от пути интегрирования107 4.7 Первообразная дифференциальной формы, ее физический смысл . . . . 111
4
Предисловие Учебное пособие «Функции нескольких переменных» предназначено для студентов очного и заочного отделений математических факультетов педагогических вузов. В нем излагаются разделы базового курса математического анализа, посвященные дифференциальному и интегральному исчислению функций нескольких действительных переменных. Пособие соответствует государственному стандарту подготовки специалистов (специальность 032100 «Математика»). При написании книги использован опыт автора по преподаванию курса математического анализа на математическом факультете Уральского государственного педагогического университета. Студенты педвузов изучают многомерный математический анализ сразу после знакомства с одномерным анализом. Идеология обеих ветвей одинакова: математический анализ иcследует функции различной природы методом пределов. Однако многомерность делает изложение многих вопросов существенно сложнее. В первой главе пособия рассмотрена теория предела и непрерывности функций, заданных на метрических пространствах. Вторая глава посвящена дифференциальному исчислению функций нескольких переменных. Значительное внимание уделено экстремальным задачам (локальные экстремумы, глобальные экстремумы на компактных множествах, условные экстремумы). В третьей и четвертой главах рассмотрены двойные и криволинейные интегралы соответственно. Для углубленного изучения материала можно рекомендовать учебники [1]-[7] и методическую разработку [8]. Задачи по данному разделу можно найти в книгах [9, 10]. Автор признателен научному редактору д. ф.-м. н., проф. Т. Ф. Филипповой и рецензенту д. ф.-м. н. Б. И. Ананьеву за внимание к работе и ценные замечания.
5
Глава 1 Функции на метрических пространствах Читатель, открывая эту книгу, уже познакомился с первым большим разделом классического математического анализа, связанным с функциями одной переменной. Впереди — рассмотрение еще одного классического раздела, посвященного изучению функций нескольких переменных. Однако перед этим мы изучим важную, более общую главу современного анализа — основы теории метрических (в частности, линейных нормированных) пространств, а также функций, аргументами и значениями которых являются элементы таких пространств 1 . Здесь мы поставим целью обобщить теорию предела и непрерывности, построенную применительно к функциям одной переменной, на достаточно широкий класс функций f : X → Y 2 . Поскольку названная теория базируется на понятии предела, которое вводится, исходя из понятия расстояния между точками, то предварительно вводятся и изучаются метрические пространства (МП), наделенные отношением расстояния между их элементами. Мы выделим важный класс МП – линейные нормированные пространства (ЛНП) и, в частности, евклидовы пространства – ЛНП со скалярным произведением. Все эти пространства вводятся аксиоматически. Используется геометрическая терминология, понимаемая обобщенно. Теория метрических пространств в основном была построена в первые десятилетия XX века. Определение метрического пространства дано Фреше 3 в 1906 году.
1.1
Определение метрического пространства. Шары и сферы
Определение 1.1. Пусть X — непустое множество и на нем задана функция ρ (ρ : X × X → R) со следующими свойствами: 10 . ∀ x, y ∈ X ρ(x, y) > 0, ρ(x, y) = 0 ⇔ x = y (аксиома неотрицательности метрики); 20 . ∀ x, y ∈ X ρ(x, y) = ρ(y, x) (аксиома симметрии); 1
Напомним, что классический этап развития математического анализа как науки в основном завершился в XIX веке, современный этап охватывает более позднее время. 2 Эта символика означает, что рассматриваемая функция f имеет область определения X, а ее значения содержатся во множестве Y ; функция не обязательно инъективна. 3 Морис Фреше (Maurice Rene Frechet, 1878-1973) — французский математик.
6
30 . ∀ x, y, z ∈ X ρ(x, z) 6 ρ(x, y) + ρ(y, z) (аксиома треугольника). Тогда пара (X, ρ) называется метрическим пространством. Множество X называется носителем метрического пространства (X, ρ), его элементы — точками этого пространства. Число ρ(x, y) называют метрикой (расстоянием) между точками x, y. Замечание 1.1. На множестве X можно задать разные метрики; поэтому возможны различные МП с одним носителем. Замечание 1.2. Если (X, ρ) — метрическое пространство и X1 ⊂ X, то пара (X1 , ρ) также образует метрическое пространство. Задание 1.1. Доказать, что свойство ∀ x, y ∈ X ρ(x, y) > 0
(1.1)
вытекает из аксиомы 30 треугольника. Задание 1.1 показывает, что стандартная система аксиом метрического пространства несколько избыточна. Пример 1.1. X = R, ρs (x, y) = |x − y|. Убедимся, что (R, ρs ) — метрическое пространство. Запишем аксиому 10 в нашем случае: ∀ x, y ∈ R |x − y| > 0, |x − y| = 0 ⇔ x = y. Но это прямо следует из свойств модуля вещественного числа. На свойствах модуля основывается проверка и остальных аксиом. Действительно, 20 . ∀ x, y ∈ R |x − y| = |y − x|; 30 . ∀ x, y, z ∈ R |x − z| 6 |x − y| + |y − z|. • Метрика ρs нам уже знакома; будем ее называть стандартной метрикой, заданной на числовой прямой R. Задание 1.2. X 6= ∅ — произвольное непустое множество, ½ 0, если x = y , (1.2) ρt (x, y) = 1, если x 6= y . (тривиальная метрика). Доказать, что пара (X, ρt ) образует МП. Замечание 1.3. Любое непустое множество может быть носителем метрического пространства. Дадим ряд необходимых определений. Пусть x0 ∈ X, ε > 0. Определение 1.2. Открытым шаром с центром в точке x0 радиуса ε, или ε−окрестностью точки x0 называется множество U (x0 , ε) : = {x ∈ X| ρ(x, x0 ) < ε}. Определение 1.3. Замкнутым шаром с центром в точке x0 радиуса ε называется множество U (x0 , ε) : = {x ∈ X| ρ(x, x0 ) 6 ε}. Определение 1.4. Сферой с центром в точке x0 радиуса ε называется множество S(x0 , ε) : = U (x0 , ε) \ U (x0 , ε) = {x ∈ X| ρ(x, x0 ) = ε}.
7
В дальнейшем мы введем в метрических пространствах открытые и замкнутые множества и убедимся, что открытый (замкнутый) шар — открытое (замкнутое) множество. Структура шаров и сфер в различных метрических пространствах существенно различна; она зависит как от носителя X, так и от выбранной на нем метрики ρ. Для любого метрического пространства (X, ρ) справедливы включения (необязательно строгие) U (x0 , ε) ⊂ U (x0 , ε), S(x0 , ε) ⊂ U (x0 , ε), при ε1 < ε2
1.2
U (x0 , ε1 ) ⊂ U (x0 , ε2 ), U (x0 , ε1 ) ⊂ U (x0 , ε2 ).
Линейные нормированные пространства, их связь с метрическими пространствами
Часто в математической практике приходится работать с линейными (векторными) пространствами X. Напомним определение линейного пространства над произвольным полем K. Определение 1.5. Линейным (векторным) пространством над полем K называется множество X, состоящее из элементов, называемых векторами, в котором определены операции сложения элементов и умножения элементов на числа из поля K, удовлетворяющие следующим условиям (x, y, z ∈ X, α, β ∈ K) : 1) x + y = y + x; 2) (x + y) + z = x + (y + z); 3) существует нулевой вектор θ ∈ X такой, что ∀ x ∈ X x + θ = x; 4) для любого вектора x существует противоположный ему вектор y такой, что x+ y = θ; 5) 1 · x = x; 6) α(βx) = (αβ)x; 7) (α + β)x = αx + βx; 8) α(x + y) = αx + αy. Будем рассматривать линейные пространства над полем действительных чисел R. Убедимся, что линейное пространство X становится метрическим, если удается ввести норму (длину) ||x|| элементов пространства. Определение 1.6. Говорят, что на линейном пространстве X задана норма, если каждому элементу x ∈ X сопоставлено вещественное число ||x|| такое, что 1) ∀ x ∈ X ||x|| > 0; ||x|| = 0 ⇔ x = θ (неотрицательность нормы); 2) ∀ x ∈ X ∀ λ ∈ R ||λx|| = |λ| · ||x|| (однородность нормы); 3) ∀ x, y ∈ X ||x + y|| 6 ||x|| + ||y|| (неравенство треугольника). В этом случае число ||x|| называют нормой элемента x ∈ X, пару (X, ||x||) — линейным нормированным пространством (ЛНП). Теорема 1.1 Линейное нормированное пространство становится метрическим, если положить ρ(x, y) : = ||x − y||. (1.3) Доказательство. Проверим, что из аксиом 1)-3) ЛНП и формулы (1.3) вытекают аксиомы 10 − 30 МП. 1)
10 . ρ(x, y) = ||x − y|| > 0,
1)
ρ(x, y) = 0 ⇔ ||x − y|| = 0 ⇔ x − y = θ ⇔ x = y. 8
2)
20 . ρ(y, x) = ||y − x|| = || − 1 · (x − y)|| = | − 1| · ||x − y|| = ρ(x, y). 3)
30 . ρ(x, z) = ||x − z|| = ||x − z ∓ y|| = ||(x − y) + (y − z)|| 6 ||x − y|| + ||y − z|| = ρ(x, y) + ρ(y, z). • Отметим следующие свойства метрики (1.3): 1. ρ(x, θ) = ||x||, то есть ||x|| — расстояние между x, θ; 2. a) ∀ x, y, a ∈ X ∀ λ ∈ R ρ(x + a, y + a) = ρ(x, y); b) ρ(λx, λy) = |λ| · ρ(x, y). Следствие 1.1. ∀ x0 ∈ X ∀ ε > 0 U (x0 , ε) = {x0 + x |x ∈ U (θ, ε)}. Доказательство вытекает из равенства ρ(x, x0 ) = ρ(x−x0 , θ) и определения окрестности точки. Следствие 1.2. ∀ ε > 0 ∀ λ > 0 U (θ, λε) = {λ · x|x ∈ U (θ, ε)}. Таким образом, окрестности точек в ЛНП имеют одинаковую структуру. Можно поэтому рассматривать, например, окрестность θ. Пример 1.1 (продолжение). Вернемся к МП (R, ρs ). R — линейное пространство, введем в нем норму ||x|| : = |x|. (1.4) Справедливость аксиом 1)-3) сразу следует из свойств модуля. Применив теорему 1.1, приходим к нашему МП (R, ρs ). Таким образом, стандартная метрика на числовой прямой порождена нормой (1.4). Рассмотрим важное для дальнейшего линейное пространство Rn (n > 1) n-мерных векторов (n-ок) вещественных чисел над полем R. Пусть x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn . Напомним, что операции сложения и умножения на скаляр в пространстве Rn вводятся покоординатно: x + y : = (x1 + y1 , . . . , xn + yn ),
λx : = (λx1 , . . . , λxn ).
Рассмотрим две различные нормы в пространстве Rn — кубическую ||x||C и евклидову ||x||E (вторую норму определим ниже с использованием другого понятия, см. пример 1.4). Пример 1.2. (пространство Rn с кубической нормой). Пусть ||x||C : = max |xi |. 16i6n
(1.5)
Убедимся в справедливости свойств нормы, используя свойства максимума. 1) max |xi | > 0; 16i6n
max |xi | = 0 ⇔ |xi | = 0 (1 6 i 6 n) ⇔ x = θ.
16i6n
2) ||λx|| = max |λxi | = |λ| max |xi | = |λ| · ||x||C . 16i6n
16i6n
3) Вначале зафиксируем произвольно индекс i, 1 6 i 6 n и оценим по модулю i-ую координату n−ки x + y : |xi + yi | 6 |xi | + |yi | 6 max |xi | + max |yi | = ||x||C + ||y||C . 16i6n
16i6n
Мы видим, что каждое из чисел |xi + yi | (1 6 i 6 n) 9
(1.6)
не превышает величины ||x||C + ||y||C . Поэтому и наибольшее из чисел (1.6) не превышает ее: (1.5) max |xi + yi | = ||x + y||C 6 ||x||C + ||y||C . 16i6n
n
Таким образом, (R , ||x||C ) — линейное нормированное пространство. Оно порождает метрическое пространство (Rn , ρC ), где ρC (x, y) = max |xi − yi |. 16i6n
(1.7)
Определим в этих пространствах вид шаров и сфер. Пусть вначале n = 2, тогда пространство Rn = R2 можно интерпретировать как множество точек плоскости. Выделим сферу S(θ, ε) = {x ∈ R2 | max{|x1 |, |x2 |} = ε} с центром в начале координат θ. Условие |x1 | = |x2 | определяет на плоскости биссектрисы координатных углов x2 = ±x1 . Они разбивают плоскость на 4 множества (угла). При этом |x1 | > |x2 | в двух углах, примыкающих к оси x1 , и |x1 < |x2 | в двух других углах. Проводя в первых двух углах отрезки |x1 | = ε, а в остальных углах — отрезки |x2 | = ε соответственно, убеждаемся, что сфера S(θ, ε) представляет собой квадрат с центром в точке θ со сторонами длиной 2ε, параллельными координатным осям. Но тогда открытый шар U (θ, ε) — внутренность этого квадрата, а при переходе к замкнутому шару U (θ, ε) добавляется и сам квадрат. Если же взять множества S(x0 , ε), U (x0 , ε), U (x0 , ε), то, в силу следствий 1.1- 1.2 они отличаются от уже рассмотренных множеств S(θ, ε), U (θ, ε), U (θ, ε) лишь тем, что их центром будет точка x0 , а не θ. Вообще, в пространстве (Rn , ||x||C ) (n > 2) сфера S(x0 , ε) — n-мерный куб с ребрами длиной 2ε, грани которого параллельны координатным плоскостям, открытый шар U (x0 , ε) — внутренность этого куба, замкнутый шар U (x0 , ε), помимо точек открытого шара, включает и сам куб. Удобно иметь и аналитические описания этих множеств. Пусть x0 = (x01 , . . . , x0n ), тогда S(x0 , ε) = {x ∈ Rn | |xi − x0i | = ε, 1 6 i 6 n}; U (x0 , ε) = {x ∈ Rn | |xi − x0i | < ε, 1 6 i 6 n}; U (x0 , ε) = {x ∈ Rn | |xi − x0i | 6 ε, 1 6 i 6 n}. Существенной особенностью пространства Rn с кубической нормой (метрикой ) является однотипность вхождения в шары и сферы всех координат xi их точек. Поэтому, если n = m + k, m, k ∈ N, то Rn = Rm × Rk и
4
S(a, ε)×S(b, ε) = S((a, b), ε); U (a, ε)×U (b, ε) = U ((a, b), ε); U (a, ε)×U (b, ε) = U ((a, b), ε). Здесь a ∈ Rm , b ∈ Rk . Таким образом, декартово произведение сфер, открытых и замкнутых шаров точек a ∈ Rm , b ∈ Rk радиуса ε есть соответственно сфера, открытый и замкнутый шар радиуса ε точки (a, b) ∈ Rm+k . • Сейчас рассмотрим очень важный пример функционального ЛНП, элементами (точками) которого являются функции. Пример 1.3. (пространство C[a,b] функций, непрерывных на отрезке [a,b], с чебышевской нормой). Пусть X = X[a, b] — множество функций, непрерывных на 4
Полагаем R1 = R.
10
[a, b]. Оно представляет собой линейное пространство над полем R : если x = x(t), y = y(t) — элементы множества X[a, b], то x + y = (x + y)(t) : = x(t) + y(t),
λx : = λx(t);
нулевой элемент θ = 0 — функция, равная нулю в точках отрезка. Докажем, что линейное пространство X[a, b] становится нормированным, если положить ||x|| : = max |x(t)|.
(1.8)
t∈[a,b]
Прежде всего, для всякой непрерывной на отрезке [a, b] функции x(t) число max |x(t)| существует (по теореме Вейерштрасса, обосновать!).
t∈[a,b]
Справедливость аксиом нормы 1)-3) следует из свойств модуля и операции нахождения максимума множества. 1) ||x(t)|| = max |x(t)| > 0; max |x(t)| = 0 ⇔ ∀ t ∈ [a, b] |x(t)| = 0 ⇔ t∈ [a,b]
t∈ [a,b]
∀ t ∈ [a, b] x(t) = 0 ⇔ x = θ. 2) ∀λ ∈ R ||λ · x|| = max |λx(t)| == |λ| · max |x(t)| = |λ| · ||x||. t∈[a,b]
t∈[a,b]
3) Зафиксируем произвольно точку t ∈ [a, b] и оценим сверху |x(t) + y(t)| : |x(t) + y(t)| 6 |x(t)| + |y(t)| 6 max |x(t)| + max |y(t)| = ||x|| + ||y||. t∈[a,b]
t∈[a,b]
Так как непрерывная функция |x(t) + y(t) принимает в некоторой точке t0 ∈ [a, b] наибольшее значение (почему?), то max |x(t) + y(t)| = |x(t0 ) + y(t0 )| 6 ||x|| + ||y||
t∈[a,b]
и, значит, ||x + y|| 6 ||x|| + ||y||. Таким образом, (X[a, b], ||x||) — ЛНП. Его обозначают символом C[a, b]. Как следует из формулы (1.8), чебышевская норма функции есть наибольшее отклонение от нуля функции x(t) на отрезке [a, b] 5 . Конечно, пространство C[a, b] является и метрическим, с метрикой ρ(x, y) = max |x(t) − y(t)|. t∈[a,b]
(1.9)
Расстояние между функциями x(t), y(t) в пространстве C[a, b] есть наибольшее отклонение функции x(t) от функции y(t) на отрезке [a, b]. Укажем геометрический смысл шаров и сфер в пространстве C[a, b]. Пусть x0 (t) ∈ C[a, b], ε > 0. Рассмотрим на плоскости (t, x) ε-полоску Π(x0 , ε) : = {(t, x) ∈ R2 | t ∈ [a, b], |x − x0 (t)| < ε} и замкнутую ε-полоску Π(x0 , ε) : = {(t, x) ∈ R2 | t ∈ [a, b], |x − x0 (t)| 6 ε} графика функции x0 (t). Открытый шар U (x0 , ε) (замкнутый шар U (x0 , ε)) составлен из непрерывных функций, графики которых содержатся в Π(x0 , ε) (Π(x0 , ε) ). Сфера S(x0 , ε) образована теми функциями из Π(x0 , ε), графики которых пересекаются хотя бы с одной из граничных кривых x = x0 (t) ± ε, t ∈ [a, b]. • 5
Русский математик П.Л.Чебышев (1821-1894) за несколько десятилетий до построения теории метрических и линейных нормированных пространств применял величину ||x|| при изучении вопросов аппроксимации функций.
11
1.3
Евклидовы пространства, их связь с линейными нормированными и метрическими пространствами
Рассмотрим важный способ введения нормы в ЛНП — через скалярное произведение. Определение 1.7. Говорят, что на линейном пространстве X над полем R задано скалярное произведение, если определена функция, сопоставляющая каждым двум элементам x, y из X вещественное число (x, y) так, что выполнены следующие условия (аксиомы скалярного произведения): a) ∀ x ∈ X (x, x) > 0; (x, x) = 0 ⇔ x = θ; b) ∀ x, y ∈ X (x, y) = (y, x); c) ∀ λ ∈ R ∀ x, y ∈ X (λx, y) = λ · (x, y); d) ∀ x, y, z ∈ X (x + y, z) = (x, z) + (y, z). Линейное пространство со скалярным произведением называют евклидовым. В дальнейшем окажутся полезными следующие следствия аксиом евклидового пространства: Следствие 1.3. ∀ x ∈ X (θ, x) = 0. Следствие 1.4. ∀ λ, µ ∈ R ∀ x, y, z ∈ X (λx + µy, z) = λ(x, z) + µ(y, z), (x, λy + µz) = λ(x, y) + µ(x, z). c)
Доказательство следствия 1.3. 0 · x = θ, (θ, x) = (0 · x, x) = 0 · (x, x) = 0. Задание 1.3. Доказать следствие 1.4. Теорема 1.2 В любом евклидовом пространстве X справедливо неравенство КошиБуняковского ∀ x, y ∈ X (x, y)2 6 (x, x) · (y, y). (1.10) Доказательство. 1) Как вытекает из следствия 1.3, при x = θ неравенство (1.10) верно: (θ, y)2 = 0 6 0 · (y, y) = 0. 2) Зафиксируем произвольно x, y ∈ X, x 6= θ и рассмотрим функцию относительно λ ϕ(λ) : = (λx + y, λx + y). Она представляет собой квадратный трехчлен: по следствию 1.4 ϕ(λ) = (x, x) · λ2 + 2(x, y) · λ + (y, y), a)
a)
но (x, x) 6= 0. С другой стороны, ϕ(λ) > 0. Поэтому дискриминант квадратного трехчлена неположителен: 4((x, y)2 −4(x, x)·(y, y)) 6 0. Отсюда и следует требуемое неравенство (1.10). • Теорема 1.3 Евклидово пространство X становится нормированным, если положить p (1.11) ∀ x ∈ X ||x|| : = (x, x). Доказательство. Проверим для функции (1.11) справедливость аксиом 1)-3) нормы, при этом последняя проверка потребует привлечения неравенства Коши-Буняковского. a) p p a) 1) (x, x) > 0; (x, x) = 0 ⇔ x = θ. 12
p p 2) ||λx|| = (λx, λx) = λ2 (x, x) = |λ| · (x, x) = |λ| · ||x||. 3) Вначале оценим сверху · ¸ (1.10) p p 2 (1.11) ||x+y|| = (x+y, x+y) = (x, x)+2(x, y)+(y, y) = (x, y) 6 |(x, y)| 6 (x, x) · (y, y) 6 ³p ´2 p p p 6 (x, x) + 2 (x, x) · (y, y) + (y, y) = (x, x) + (y, y) = (||x|| + ||y||)2 , откуда и следует справедливость аксиомы 3). • В условиях последней теоремы мы будем говорить, что норма (1.11) порождена скалярным произведением. В свою очередь, по теореме 1.1 эта норма определяет метрику p (1.12) ρ(x, y) = (x − y, x − y). Пример 1.4. Введем в пространстве Rn скалярное произведение формулой n X
(x, y) : =
xi y i .
(1.13)
i=1
Справедливость аксиом легко проверяется (сделать это!). Запишем неравенство КошиБуняковского (1.10) для нашего евклидова пространства: Ã n X
!2 xi yi
n X
6
i=1
x2i ·
i=1
n X
yi2 .
i=1
Согласно теоремам 1.3, 1.1, мы приходим к нормированному, а также к метрическому пространствам с евклидовой нормой v u n uX ||x||E = t x2i (1.14) i=1
и евклидовой метрикой
v u n uX ρE (x, y) = t (xi − yi )2 .
(1.15)
i=1
Теперь шары и сферы имеют «привычный» вид. Именно, в МП (Rn , ρE ) U (x0 , ε) — n-мерный шар, U (x0 , ε) — его внутренность, S(x0 , ε) − n-мерная сфера. У всех этих множеств центром является точка x0 , радиусом — число ε. • Пример 1.5. Введем в линейном пространстве X[a, b] непрерывных на отрезке [a, b] функций (см. пример 1.3) скалярное произведение Z
b
(x, y) : =
x(t)y(t) dt. a
Справедливость аксиом скалярного произведения проверяется. Неравенство КошиБуняковского теперь запишется через интегралы: µZ
¶2
b
x(t)y(t) dt a
Z
b
6
Z
b
2
x (t) dt · a
13
a
y 2 (t) dt.
Укажем метрику, отвечающую нашему евклидову пространству: Z b ρ1 (x, y) = (x(t) − y(t))2 dt.
(1.16)
a
В метрическом пространстве (X[a, b], ρ1 ) близкими будут функции, для которых интегралы (1.16) близки (ср. пример 1.3 ). • Замечание 1.4. Мы выделили важные классы метрических пространств – линейные нормированные пространства, евклидовы пространства. В свою очередь, метрические пространства входят в более общую совокупность топологических пространств [7, с. 18].
1.4
Открытые и замкнутые множества в метрических пространствах
Введем несколько важных понятий, связанных с множествами в метрических пространствах (некоторые из них рассматривались ранее применительно к МП (R, ρs )). Пусть (X, ρ) — метрическое пространство, A ⊂ X, x0 ∈ X (в некоторых случаях x0 ∈ A, обращайте на это внимание!). Определение 1.8. Проколотой ε−окрестностью точки x0 ∈ X называется множество ◦ U (x0 , ε) : = U (x0 , ε) \ {x0 } = {x ∈ X| 0 < ρ(x, x0 ) < ε}. Определение 1.9. Точка x0 ∈ X называется предельной точкой множества A, если в любой ее проколотой окрестности найдется хотя бы одна точка этого множества, то есть если ◦ ∀ ε > 0 U (x0 , ε) ∩ A 6= ∅. Замечание 1.5. Предельная точка множества может и не быть точкой этого множества. Замечание 1.6. Точка x0 ∈ X не является предельной точкой множества A тогда и только тогда, когда ◦ ∃ ε > 0 U (x0 , ε) ∩ A = ∅. Определение 1.10. Точка x0 ∈ A называется внутренней точкой множества A, если она входит в A вместе с некоторой своей окрестностью, то есть если ∃ε > 0 :
U (x0 , ε) ⊂ A.
Замечание 1.7. Всякая внутренняя точка множества A является его предельной точкой. Определение 1.11. Множество называется открытым, если все его точки — внутренние точки этого множества. Определение 1.12. Множество называется замкнутым, если оно содержит все свои предельные точки. Определение 1.13. Точка x0 ∈ X называется граничной точкой множества A, если в каждой ее окрестности найдется как точка множества A, так и точка, не принадлежащая A. Множество всех граничных точек множества называется его границей ∂A. 14
Замечание 1.8. Любая точка множества — либо его внутренняя, либо граничная точка. При этом внутренние точки обязательно входят во множество, а граничные — не всегда. Пример 1.6. Изучим свойства конечных промежутков на числовой прямой R (разумеется, выбрана стандартная метрика ρs ). Пусть A1 = (a, b), A2 = [a, b], A3 = [a, b). Рассмотрим вначале наименьший из этих промежутков — интервал A1 . Все его точки являются внутренними точками множества (доказать!), поэтому интервал — открытое множество. Чтобы выяснить, является ли интервал и замкнутым множеством, найдем его предельные точки. По замечанию 1.7 все точки интервала A1 — предельные для A1 . Но в силу замечания 1.5 множество может иметь предельные точки, и не входящие в него. Точки a, b суть предельные точки множества A1 (доказать!). Точки множества R \ [a, b] по замечанию 1.6 — уже не предельные для A1 . Итак, предельные точки интервала (a, b) заполняют отрезок [a, b]. Отсюда следует также, что интервал (a, b) — не замкнутое множество. Действительно, его предельная точка a не входит в него. Наконец, ∂A = {a, b}; обе граничные точки интервала не содержатся в нем. Перейдем к отрезку A2 , отличающемуся от интервала A1 добавлением точек a, b. Поскольку они, очевидно, не внутренние для A2 , то отрезок не является открытым множеством. Далее, множества предельных точек интервала (a, b) и отрезка [a,b] совпадают. Это следует из того, что в определении предельной точки участвуют лишь ее проколотые окрестности. Таким образом, два множества — точек отрезка и предельных точек отрезка равны. Отрезок — замкнутое множество. Кроме того, ∂A2 = {a, b}, но теперь ∂A2 ⊂ A2 . Что касается полуинтервала A3 , то он не является открытым множеством: его точка a — не внутренняя для A3 . Предельные точки множества A3 , как и промежутков A1,2 , заполняют отрезок [a, b], поэтому полуинтервал — не замкнутое множество. Действительно, b — предельная точка множества A3 , но b 6∈ A3 . Далее, ∂A3 = {a, b}, при этом a ∈ A3 , b 6∈ A3 . • Напомним некоторые свойства операции дополнения множества. Обозначим дополнение множества A ⊂ X (до множества X) через CA : CA : = X \ A. Рассмотрим семейство множеств Aα , α ∈ B, B — множество индексов (конечное или бесконечное). Тогда справедливы законы де Моргана, связывающие операции ∪, ∩, \ : Ã ! Ã ! [ \ \ [ C Aα = CAα , C Aα = CAα . (1.17) α
α
α
α
Теорема 1.4 Пусть (X, ρ) — метрическое пространство, A ⊂ X. 1) Множество A открыто тогда и только тогда, когда множество CA замкнуто. 2) Объединение любой совокупности открытых множеств — открытое множество. 3) Пересечение конечного числа открытых множеств — открытое множество. 4) Пересечение любой совокупности замкнутых множеств — замкнутое множество. 5) Объединение конечного числа замкнутых множеств — замкнутое множество. Доказательство. 1. Пусть множество A открыто. Докажем замкнутость его дополнения CA. Выберем произвольную точку x ∈ A; в силу открытости A существует ◦ окрестность U (x, ε) ⊂ A, но тогда U (x, ε) ∩ CA = ∅ и тем более U (x, ε) ∩ CA = ∅. 15
По замечанию 1.6 x — не предельная точка множества CA, поэтому предельные точки множества CA содержатся в нем и CA — замкнутое множество. Пусть теперь множество CA замкнуто, докажем открытость множества A. Выберем x ∈ A, тогда x — не предельная точка дополнения CA и снова по замечанию 1.6 ◦ ◦ U (x, ε) ∩ CA = ∅, то есть U (x, ε) ⊂ A. Поскольку и точка x принадлежит множеству A, то U (x, ε) ⊂ A, поэтому x — внутренняя точка множества A и оно открыто. S 2. Пусть A = Aα , где каждое из множеств Aα , α ∈ B открыто. Выберем проα∈B
извольную точку x множества A. По определению операции объединения множеств существует такое множество Aα0 , α0 ∈ B, что x ∈ Aα0 . В силу открытости этого множества существует окрестность U (x, ε) ⊂ Aα0 ⊂ A. По определению 1.11 множество A открыто. n T Ak , где каждое из множеств Ak открыто. Выберем произ3. Пусть теперь A = k=1
вольную точку x множества A. По определению операции пересечения множеств точка содержится во всех множествах Ak . В силу их открытости существуют окрестности U (x, εk ) ⊂ Ak . Пусть ε : = min εk , тогда U (x, ε) ⊂ U (x, εk ) ⊂ Ak при всех k, 1 6 k 6 n. n T Значит, U (x, ε) ⊂ ak = A. Поэтому x — внутренняя точка множества A и оно открыk=1 то. 4. Опираемся на доказанные утверждения 1-2 теоремы и законы де Моргана. РасS смотрим множество A = Aα , где каждое из множеств Aα , α ∈ B замкнуто. Тогда α∈B (1.17)
CA =
\
CAα .
α∈B
По утверждению 1 каждое из множеств CAα открыто, откуда в силу утверждения 2 следует открытость дополнения CA, но тогда (опять по утверждению 1) множество A = C(CA) замкнуто. 5. Это утверждение доказывается аналогично утверждению 4. • Задание 1.4. Доказать утверждение 5 теоремы. Следствие 1.5. Если A — замкнутое множество, а B ⊂ A — открытое множество, то их разность A \ B — замкнутое множество. Доказательство следует из теоремы и формулы A \ B = A ∩ CB, поскольку множество CB замкнуто. Замечание 1.9. а) Пересечение бесконечной совокупности открытых множеств может не быть открытым множеством. б) Объединение бесконечной совокупности замкнутых множеств может не быть замкнутым множеством. Обоснованием утверждения а) может служить следующий Пример 1.7. Рассмотрим в метрическом пространстве (R, ρs ) бесконечную совокупность открытых множеств µ ¶ 1 Ak = 1, 2 + , k ∈ N. k Пусть A =
∞ T
Ak . Так как (1, 2] ⊂ Ak при всех k ∈ N, то (1, 2] ⊂ A. Но любая точка x > 2
k=1
уже не входит в A, поскольку lim 1/k = 0 и при достаточно больших k и поэтому x 6∈ Ak , пример 1.6). •
k→∞
2 + 1/k < x
x 6∈ A. Окончательно, A = (1, 2], но множество A не открыто (см.
16
Задание 1.5. Доказать утверждение б) замечания 1.9. Рассмотрим интересный пример замкнутого множества на числовой прямой (конечно, в метрическом пространстве (R, ρs )). Пример 1.8. (канторово множество P ). Это множество получается удалением из отрезка [0, 1] бесконечной совокупности попарно непересекающихся интервалов. Процесс удаления интервалов состоит из бесконечного множества этапов. На первом этапе исходный отрезок [0, 1] разбивается на 3 промежутка длиной 1/3 и средний интервал (1/3, 2/3) удаляется. В итоге остается замкнутое множество [0, 1/3] ∪ [2/3, 1], состоящее из двух отрезков первого этапа длиной 1/3. На втором этапе с каждым из отрезков первого этапа происходит аналогичная операция — удаляется средний интервал длиной 1/9. В результате получается замкнутое множество [0, 1/9] ∪ [2/9, 1/3] ∪ [2/3, 7/9] ∪ [8/9, 1], составленное из 4 отрезков второго этапа. Такой процесс продолжается бесконечно. В итоге и получаем канторово множество P. Его замкнутость вытекает из построения множества и следствия 1.5. • Теорема 1.5 Пусть (X, ρ) — метрическое пространство, x0 ∈ X, ε > 0. Тогда открытый шар U (x0 , ε) — открытое множество, замкнутый шар U (x0 , ε) и сфера S(x0 , ε) — замкнутые множества. Доказательство. 1) Обозначим A : = U (x0 , ε). Выберем произвольно x0 ∈ U (x0 , ε), тогда ρ(x0 , x0 ) = ε − α, α > 0. Докажем, что U (x0 , α) ⊂ A,
(1.18)
откуда будет следовать открытость множества A. Выберем теперь x ∈ U (x0 , α), при этом ρ(x, x0 ) < α. Нужно проверить, что x ∈ A, то есть что ρ(x, x0 ) < ε. По аксиоме треугольника 30 метрического пространства ρ(x, x0 ) 6 ρ(x, x0 ) + ρ(x0 , x0 ) < α + (ε − α) = ε. 2) Для доказательства замкнутости замкнутого шара U (x0 , ε) достаточно убедиться в открытости его дополнения A1 : = CU (x0 , ε) = {x ∈ X| ρ(x, x0 ) > ε}. Пусть x0 ∈ A1 , тогда ρ(x0 , x0 ) = ε + α,
α > 0. Выясним, что
U (x0 , α) ⊂ A1 , откуда и будет следовать справедливость теоремы для множества U (x0 , ε). Зафиксируем произвольно точку x ∈ U (x0 , α), при этом ρ(x, x0 ) < α. Нужно проверить, что ρ(x, x0 ) > ε. Для этого оценим сверху по аксиоме треугольника 30 расстояние ρ(x0 , x0 ) : ρ(x0 , x0 ) 6 ρ(x0 , x) + ρ(x, x0 ), но тогда ρ(x, x0 ) > ρ(x0 , x0 ) − ρ(x0 , x) = [−ρ(x0 , x) > −α] > (ε + α) − α = ε. 3) Сфера S(x0 , ε) = C(A ∪ A1 ) замкнута по теореме 1.4 в силу открытости множеств A, A1 . • 17
1.5 1.5.1
Предел последовательности точек метрического пространства Определение и свойства
Рассмотрим метрическое пространство (X, ρ). Определение 1.14. Множество A ⊂ X называется ограниченным в метрическом пространстве (X, ρ), если оно содержится в некотором замкнутом шаре, то есть если существуют x0 ∈ X, ε > 0 такие, что A ⊂ U (x0 , ε).
(1.19)
Замечание 1.10. Свойство ограниченности множества не зависит от выбора центра замкнутого шара: если множество содержится в замкнутом шаре с центром в точке x0 , то оно содержится в некотором замкнутом шаре с центром в любой другой точке x1 ∈ X. Действительно, если A ⊂ U (x0 , ε) , то есть если справедливо неравенство ρ(x, x0 ) 6 ε при всех x ∈ A, то 30
ρ(x, x1 ) 6 ρ(x, x0 ) + ρ(x0 , x1 ) 6 ε + ρ(x0 , x1 ). Это означает, что A ⊂ U (x1 , ε + ρ(x0 , x1 )). Из замечания следует, что при исследовании множества X на ограниченность в качестве центра замкнутого шара, содержащего множество, можно выбирать любую удобную точку множества X. Преобразуем условие (1.19) ограниченности множества применительно к МП (R, ρs ), выбирая x0 = 0 : ∃ ε > 0 A ⊂ U (0, ε), ∃ ε > 0 ∀ x ∈ A |x| 6 ε.
(1.20)
Пришли к известному определению ограниченного числового множества. Поэтому определение ограниченности множеств в МП (R, ρs ) эквивалентно данному ранее. Пусть {xn } — последовательность точек метрического пространства (X, ρ), a — точка этого пространства. Определение 1.15. Говорят, что последовательность {xn } сходится к точке a : lim xn = a или xn → a,
n→∞
если ∀ ε > 0 ∃ N ∈ N ∀n ∈ N (n > N ⇒ xn ∈ U (a, ε)).
(1.21)
Геометрический смысл сходимости: все члены последовательности, начиная с некоторого номера, содержатся в произвольной, сколь угодно малой окрестности точки a. Оказывается, свойство xn → a равносильно бесконечной малости числовой последовательности {ρ(xn , a)}, то есть свойству ρ(xn , a) → 0 (в метрическом пространстве (R, ρs )). Теорема 1.6 xn → a ⇔ ρ(xn , a) → 0. Доказательство. По определению предела lim ρ(xn , a) = 0 тогда и только тогда, когда
числовой
последовательности
n→∞
∀ ε > 0 ∃ N ∈ N ∀ n ∈ N (n > N ⇒ |ρ(xn , a) − 0| = ρ(xn , a) < ε). 18
Но это и есть условие (1.21). • Из этой теоремы и теоремы 1.1 вытекает Следствие 1.6. Если на множестве X введена норма ||x||, то xn → a тогда и только тогда, когда ||xn − a|| → 0. Используя теорему 1.6, следствие 1.6 и доказанные ранее свойства пределов числовых последовательностей, установим свойства пределов последовательностей в метрических пространствах, а также в линейных нормированных пространствах ( последние связаны с операциями сложения и умножения на действительное число). Теорема 1.7 Пусть {xn }, {yn } — последовательности в МП (X, ρ), a, b — точки этого пространства. 1) Если xn → a, то последовательность {xn } ограничена. 2) Если xn → a, xn → b, то a = b. 3) Если xn → a и {xnk } — произвольная подпоследовательность последовательности {xn }, то xnk → a при k → ∞. Предположим дополнительно, что метрика на X порождена нормой ||x|| и (X, ||x||) — ЛНП. 4) Если xn → a, yn → b, то xn + yn → a + b. 5) Если xn → a, то при любом λ ∈ R λxn → λ · a. Доказательство. 1) Пусть xn → a, тогда по теореме 1.6 ρ(xn , a) → 0. Числовая последовательность {ρ(xn , a)} сходится и поэтому ограничена. По определению (1.20) ограниченного числового множества ∃ ε > 0 ∀ n ∈ N ρ(xn , a) 6 ε, а это означает, что {xn } ⊂ U (a, ε). 2) Из условий xn → a, xn ρ(xn , a) → 0, ρ(xn , b) → 0. Но тогда
→
b
и
теоремы
1.6
следует,
ρ(xn , a) + ρ(xn , b) → 0
что (1.22)
(почему?). Оценим ρ(a, b) : 30
0 6 ρ(a, b) 6 ρ(xn , a) + ρ(xn , b). Учитывая соотношение (1.22) и то обстоятельство, что постоянная (состоящая из нулей) последовательность 0 → 0, по теореме о пределе зажатой (числовой) последовательности получаем, что другая постоянная последовательность ρ(a, b) → 0. Но тогда ρ(a, b) = 0 и по аксиоме 10 МП a = b. 3) Доказывается аналогично утверждению 1 теоремы. Доказательства утверждений 4, 5 опираются на следствие 1.6. 4) Поскольку по следствию 1.6 ||xn − a|| → 0, ||yn − b|| → 0, то ||xn − a|| + ||yn − b|| → 0. Преобразуем 3
||(xn + yn ) − (a + b)|| = ||(xn − a) + (yn − b)|| 6 ||xn − a|| + ||yn − b||. Поэтому ∀ n ∈ N 0 6 ||(xn + yn ) − (a + b)|| 6 ||xn − a|| + ||yn − b|| 19
(1.23)
и по теореме о пределе зажатой последовательности с учетом соотношения (1.23) ||(xn + yn ) − (a + b)|| → 0. В силу следствия 1.6 xn + yn → a + b. 5) Используется соотношение 0 6 ||λx − λa|| = |λ| · ||x − a||. • Задание 1.6. 1) Сформулировать теоремы о пределах числовых последовательностей, на которые опирается доказательство теоремы 1.7. 2) Доказать теорему 1.7 полностью. Замечание 1.11. Если одновременно рассматривается несколько метрических пространств с носителем X, то сходимость последовательности в метрическом пространстве ρ (X, ρ) обозначают так: xn → a.
1.5.2
Смысл сходимости в пространстве Rm
В пространстве Rm ранее введены 6 две нормы (кубическая и евклидова) v u m uX x2i , ||x||C = max |xi |, ||x||E = t 16i6m
i=1
а тем самым и две метрики ρC (x, y) = max |xi − yi |, 16i6m
v u m uX ρE (x, y) = t (xi − yi )2 . i=1
Докажем их эквивалентность в смысле следующего определения. Определение 1.16. Пусть (X, ρ1 ), (X, ρ2 ) — метрические пространства с носителем X. Говорят, что метрики ρ1 , ρ2 эквивалентны, если ∀ {xn } ∈ X
ρ1
ρ2
xn → a ⇔ xn → a.
Предварительно докажем лемму, связывающую ||x||C , ||x||E . Лемма 1.1 ∀ x ∈ Rm
||x||C 6 ||x||E 6
√
m · ||x||C .
(1.24)
Доказательство. Достаточно проверить. что ∀ x ∈ Rm
||x||2C 6 ||x||2E 6 m · ||x||2C .
(1.25)
Докажем вначале левое из неравенств (1.25), оценив ||x||2E снизу: µ ||x||2E
=
x21
+ ··· +
x2m
> max
16i6m
x2i
2
= max |xi | = 16i6m
6
¶2 max |xi |
16i6m
= ||x||2C .
Мы теперь пишем Rm , поскольку символ n используется для обозначения аргумента последовательностей.
20
При оценивании снизу мы оставили лишь наибольшее из неотрицательных слагаемых x2i , отбросив остальные, а затем воспользовались очевидным свойством максимума µ max
16i6m
x2i
=
¶2 max |xi |
16i6m
.
(1.26)
Действительно, множества неотрицательных чисел {|xi |}, {x2i }, 1 6 i 6 m имеют наибольшие элементы при одинаковом значении k индекса i (если |xi | 6 |xk |, то x2i 6 x2k , и наоборот). Поэтому max |xi | = |xk |, max x2i = x2k . 16i6m
16i6m
Теперь оценим ||x||2E сверху, заменив каждое слагаемое наибольшим: (1.26)
||x||2E = x21 + · · · + x2m 6 max x2i + · · · + max x2i = m · ||x||2C . • 16i6m
16i6m
Замечание 1.12. В кубической окрестности точки a ∈ Rm содержится евклидова окрестность точки a и, наоборот, в евклидовой окрестности точки a содержится ее кубическая окрестность. Поэтому при работе с пространством Rm можно выбирать любой из этих видов окрестностей. Рассмотрим в пространстве Rm последовательность {xn } и точку a = (a1 , . . . , am ), при этом xn = (xn1 , . . . , xnm ). Теорема 1.8 Метрики ρC , ρE в пространстве Rm эквивалентны и порождают покоординатную сходимость, то есть xn1 → a1 ρC ρE ........ xn → a ⇔ xn → a⇔ xnm → am (здесь {xn1 }, . . . , {xnm } — числовые последовательности, сходящиеся в метрическом пространстве (R, ρs )). Доказательство опирается на лемму 1.1 и теорему о пределе зажатой последовательности. Оно состоит из двух этапов. 1. Докажем эквивалентность метрик ρC , ρE . ρC a) Пусть xn → a. По следствию 1.6 ||xn − a||C → 0. Оценим ||xn − a||E : (1.24)
0 6 ||xn − a||E 6
√
(1.27)
m · ||xn − a||C .
По теореме о пределе зажатой последовательности с учетом (1.27) отсюда следует, что ρE ||xn − a||E → 0, но тогда xn → a. ρE b) Пусть теперь, наоборот, xn → a и, значит, ||xn − a||E → 0. Оценим ||xn − a||C : (1.24)
0 6 ||xn − a||C 6 ||xn − a||E , ρ
C поэтому ||xn − a||C → 0 и xn → a.
21
2. Докажем, что
xn1 → a1 ........ xn → a ⇔ xnm → am . ρE
ρ
E a) Пусть xn → a. Зафиксируем произвольно номер i, 1 6 i 6 m. Оценим снизу
||xn − a||2E = (xn1 − a1 )2 + · · · + (xnm − am )2 > (xni − ai )2 . Поэтому 0 6 (xni − ai )2 6 ||xn − a||2E , 0 6 |xni − ai | 6 ||xn − a||E .
(1.28)
Поскольку ||xn − a||E → 0, то |xni − ai | → 0 ⇔ xni − ai → 0 ⇔ xni → ai . b) Пусть последовательность {xn } сходится покоординатно, то есть xn1 → a1 , . . . , xnm → am . Тогда для любого i, 1 6 i 6 m xni − ai → 0, |xni − ai | → 0, (xni − ai )2 → 0. Отсюда из теоремы о пределе суммы числовых последовательностей но тогда v u m uX t (xni − ai )2 = ||xn − a||E → 0. •
m P
(xni − ai )2 → 0,
i=1
i=1
1.5.3
Смысл сходимости в пространстве C[a, b]
Докажем, что сходимость последовательности xn → y в метрическом пространстве C[a, b] непрерывных на отрезке [a, b] функций есть равномерная сходимость функциональной последовательности {xn (t)} к предельной функции y(t) на отрезке [a, b]. Этот факт сразу вытекает из соответствующих определений. Напомним, что в пространстве C[a, b] определены норма и метрика соотношениями ||x(t)|| = max |x(t)|, t∈[a,b]
ρ(x(t), y(t)) = max |x(t) − y(t)| t∈[a,b]
соответственно. Поэтому xn → y ⇔ ∀ ε > 0 ∃ N ∈ N ∀ n (n > N ⇒ max |xn (t) − y(t)| < ε). t∈[a,b]
С другой стороны, по определению равномерной сходимости [1, с. 447] [a,b]
xn (t) =⇒ y(t) ⇔ ∀ ε > 0 ∃ N ∈ N ∀ n > N ∀ t ∈ [a, b] |xn (t) − y(t)| < ε. Но из определения максимума и теоремы Вейерштрасса вытекает эквивалентность max |xn (t) − y(t)| < ε ⇔ ∀ t ∈ [a, b] |xn (t) − y(t)| < ε.
t∈[a,b]
Задание 1.7. Доказать соотношение (1.29). 22
(1.29)
1.5.4
Критерий предельной точки
Укажем характеристическое свойство предельной точки множества, связанное с последовательностями. Пусть (X, ρ) — метрическое пространство, A ⊂ X, {xn } ⊂ A, a ∈ A. Теорема 1.9 Точка a является предельной для множества A тогда и только тогда, когда во множестве A\{a} существует последовательность {xn } такая, что xn → a. Доказательство. 1) Пусть a — предельная точка множества A. Тогда ◦
∀ ε > 0 ∃ x ∈ U (a, ε) ∩ A.
(1.30)
Выберем последовательность {εn } положительных чисел такую, что εn → 0. Как вытекает из (1.30), ∀ n ∈ N ∃ xn ∈ A 0 < ρ(xn , a) < εn . Тем самым выделена последовательность {xn } ⊂ A \ {a}. По теореме о пределе зажатой последовательности из последнего двойного неравенства следует, что ρ(xn , a) → 0 и, значит, xn → a. 2) Пусть существует последовательность {xn } ⊂ A \ {a} такая, что xn → a. Зададимся числом ε > 0. Тогда ∃N ∈ N ∀n > N
0 < ρ(xn , a) < ε.
◦
При всех натуральных n > N
xn ∈ U (a, ε). Мы доказали, что в проколотой окрест◦ ности U (a, ε) содержатся точки множества A и поэтому a — предельная точка этого множества. • Замечание 1.13. Утверждение теоремы 1.9 оправдывает название «предельная точка множества». Замечание 1.14. Наряду с теоремой 1.9, справедливо следующее утверждение: точка a является предельной для множества A тогда и только тогда, когда в каждой ее проколотой окрестности существует бесконечное множество точек, содержащихся в A. Задание 1.8. Доказать сформулированный в замечании 1.14 критерий предельной точки. Воспользоваться тем, что одно из его утверждений, по существу, содержится в доказательстве теоремы 1.9, 2.
1.6
Предел функции
Рассмотрим два (вообще (X, ρX ), (Y, ρY ) и функцию
говоря,
различных)
метрических
пространства
f :X→Y с областью определения X и со значениями в метрическом простанстве Y. Будем множество X обозначать также через D(f ). Если точки множеств X, Y обозначать символами x, y соответственно, то функцию f : X → Y можно записать и так: y = f (x), x ∈ X, y ∈ Y.
23
Впрочем, если множества X, Y фиксированы, то часто будем говорить кратко: функция f. Определение 1.17. Графиком Γ(f ) функции f называется множество Γ(f ) : = {(x, y) ∈ X × Y | x ∈ X, y = f (x)}. Однако далеко не во всех случаях (в отличие от функций f : R → R) график Γ(f ) допускает удобную геометрическую интерпретацию. Пример 1.9. Пусть X = C1 [a, b] ⊂ C[a, b] — множество непрерывно дифференцируемых на отрезке [a, b] функций с метрикой (1.8), Y = C[a, b], f : x(t) → x0 (t). Например, f (t3 ) = 3t2 , f (et ) = et . • Если точками МП (X, ρX ), (Y, ρY ) являются функции, то функцию f : X → Y иногда называют оператором. Функцию f примера 1.9 естественно назвать оператором дифференцирования. Выделим важный класс числовых функций, значения которых — действительные числа. Определение 1.18. Если Y = R, то функция f : X → Y называется числовой. Пример 1.10. X = C[a, b], f : x(t) → max x(t). f — функция, сопоставляющая t∈[α,β]
каждой точке x(t) пространства C[a, b], то есть непрерывной на отрезке [a, b] функции ее наибольшее значение на этом отрезке. Например, f (ln t) = ln b, f (log1/2 t) = log1/2 a. • Поскольку R — поле, то на нем введены бинарные арифметические операции сложения, вычитания, умножения действительных чисел, а на множестве R\{0} — и операция деления таких чисел. Эти свойства поля R порождают арифметические операции над числовыми функциями. Пусть f, g — числовые функции, определенные на множестве X. Вводятся функции f ± g, f · g, f /g — сумма, разность, произведение, частное функций f, g соотношениями (f ± g)(x) : = f (x) ± g(x), (f · g)(x) : = f (x) · g(x), (f /g)(x) : = f (x)/g(x), D(f ± g) = D(f · g) : = X, D(f /g) : = X \ {x ∈ X| g(x) = 0}. Мы подробно рассмотрели числовые функции действительного переменного, то есть числовые функции в случае X ⊂ R. В ближайшее время мы займемся изучением их обобщений — числовых функций нескольких переменных 7 . Определение 1.19. Числовая функция f : X → R называется функцией m переменных ( m ∈ N, m > 1), если X ⊂ Rm . График Γ(f ) функции m переменных есть некоторая поверхность в (m + 1)-мерном пространстве Rm+1 . В случае функции двух переменных 8 (m = 2) график можно представить достаточно наглядно. Аргумент таких функций — точку на плоскости R2 удобно обозначать через (x, y), их значения — символом z. Таким образом, говорят о функции z = f (x, y) двух переменных, при этом составляющие x, y пары (x, y) называют аргументами функции. Ее график Γ(f (x, y)) = {(x, y, z) ∈ R3 | (x, y) ∈ D(f ), z = f (x, y)}. 7
Числовые функции одной и нескольких переменных — основной объект изучения в классическом математическом анализе. 8 Этот самый простой случай будет для нас основным при построении теории функций нескольких переменных.
24
Пусть теперь заданы две функции f : X → Y, g : X → Y, где Y — линейное нормированное пространство. На множестве Y введены бинарные операции сложения, вычитания и операция умножения на вещественный скаляр. Поэтому над функциями f, g на множестве X определяются операции сложения и вычитания (f ± g)(x) (так же, как для числовых функций) и операция умножения на действительное число ∀x ∈ X
(λ · f )(x) : = λ · f (x).
Важным и достаточно простым классом функций являются отображения отрезка I = [α, β] ⊂ R ϕ : I → Y. (1.31) Такое отображение наглядно называют (ориентированным) путем, точки ϕ(α), ϕ(β) — началом и концом пути. Часто рассматриваются пути (1.31) в случае Y = Rm . Тогда говорят также о векторфункции ~r(t) = (a1 (t), . . . , am (t)), t ∈ [α, β]. Вектор-функция определяет в пространстве Rm параметрически заданную кривую (с параметром t). Введем два определения предела функции f : X → Y в точке — по Коши и по Гейне, обобщив соответствующие определения относительно числовых функций одной переменной. Пусть a — предельная точка множества X, b ∈ Y. Определение 1.20. (определение предела функции по Коши). Говорят, что lim f (x) = b, если x→a
∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ x ∈ X
◦
(x ∈ U X (a, δ)) ⇒ f (x) ∈ UY (b, ε)).
(1.32)
Импликацию в определении можно уточнить, записав через неравенства следующим образом: 0 < ρX (x, a) < δ ⇒ ρY (f (x), b) < ε. Определение 1.21. (определение предела функции по Гейне). Говорят, что lim f (x) = b, если
x→a
ρ
ρ
X Y ∀ {xn } ⊂ X \ {a} (xn → a ⇒ f (xn ) → b).
(1.33)
Из критериев предельной точки (теорема 1.9, замечание 1.14) следует, что импликации в обоих определениях предела функции нетривиальны. Теорема 1.10 Определения 1.20, 1.21 предела функции f : X → Y в точке a равносильны, то есть lim f (x) = b по определению 1.20 тогда и только тогда, когда x→a
lim f (x) = b по определению 1.21.
x→a
Доказательство теоремы 1.10 проводится так же, как и в случае числовых функциий одной переменной. Задание 1.9. Доказать теорему (см. [8, с. 22]). Свойство функции f иметь предел в точке a (или не иметь предела) — локальное свойство функции, оно полностью определяется поведением функции в сколь угодно малой проколотой окрестности точки a. Определение 1.22. Числовая функция f называется бесконечно малой (БМ) в точке a, если lim f (x) = 0. x→a
25
Запишем определение предела по Коши для функции двух переменных z = f (x, y). Удобно выбирать кубическую окрестность 9 рассматриваемой точки (a, b) ◦
2 U c ((a, b), δ) = {(x, y) ∈ R | 0 < |x − a| < δ, 0 < |y − b| < δ}.
Далее, ρY (x, y) = ρs (x, y) = |x − y|. Определение 1.23. (определение предела функции двух переменных по Коши). Говорят, что lim f (x, y) = B, если (x,y)→(a,b)
∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ (x, y) ∈ D(f ) (0 < |x − a| < δ, 0 < |y − b| < δ ⇒ |f (x) − B| < ε). (1.34) Часто вместо lim f (x, y) пишут lim f (x, y). x→a y→b
(x,y)→(a,b)
Пример 1.11. Доказать по определению Коши, что lim (2x − 3y) sin xy = 0.
x→0 y→0
Нужно проверить, что ∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ (x, y) ∈ R2
(0 < |x| < δ, 0 < |y| < δ ⇒ |(2x − 3y) sin xy| < ε).
Выберем произвольно ε > 0. Преобразуем и оценим сверху |(2x−3y) sin xy| = |2x−3y|·| sin xy| 6 [| sin xy| 6 1] 6 |2x−3y| = |2x+(−3y)| 6 2|x|+3|y| < ε. Поэтому, если |x| < ε/5, |y| < ε/5, то |(2x − 3y) sin xy| < ε. Можно выбрать, например, δ : 0 < δ 6 ε/5. • Пример 1.12. Доказать, что предел x2 − y 2 x→0 x2 + y 2 lim
y→0
не существует. Он представляет собой неопределенность типа [0/0]. Функция f (x, y) =
x2 − y 2 x2 + y 2
рациональна относительно x, y. Воспользуемся определением предела по Гейне. Чтобы убедиться в отсутствии предела, нужно найти такие две последовательности точек плоскости (xn , yn ) → (0, 0), (x0n , yn0 ) → (0, 0), что lim f (xn , yn ) 6= lim f (x0n , yn0 ).
n→∞
n→∞
1) Выберем xn = 1/n, yn = 0, тогда xn → 0, yn → 0 и по теореме 1.8 (xn , yn ) → (0, 0). Находим 1/n2 = 1, lim f (xn , yn ) = 1. f (xn , yn ) = n→∞ 1/n2 2) Пусть теперь x0n = yn0 = 1/n. Вычисляем (x0n , yn0 ) → (0, 0), f (x0n , yn0 ) = 0 → 0 6= 1. • 9
См. замечание 1.12.
26
Теорема 1.11 (свойства пределов функций) Рассмотрим метрические пространства (X, ρX ), (Y, ρY ) и функции f : X → Y, g : X → Y. 1) Если lim f (x) = b1 , lim f (x) = b2 , то b1 = b2 . x→a x→a Пусть Y — линейное нормированное пространство и существуют пределы lim f (x) = b, lim g(x) = c. Тогда x→a
x→a
2) существует lim (f + g))(x) = b + c, x→a
3) при любом λ ∈ R существует lim λ · f (x) = λ · b. x→a Пусть теперь Y = R. Тогда 4) существует lim (f · g)(x) = b · c, x→a
5) при c 6= 0 существует lim (f /g)(x) = b/c, x→a
6) функция f · g является БМ в точке a, если функция f ограничена в некоторой проколотой окрестности точки a, функция g — БМ в этой точке. Доказательство вытекает из определения предела функции по Гейне 1.21 и соответствующих свойств последовательностей: при доказательстве утверждений 1-3 применяется теорема 1.7, при доказательстве остальных утверждений — свойства числовых последовательностей, известные из начальных разделов курса. Докажем, для примера, утверждение 4. Нужно проверить, что ρ
X ∀ {xn } ⊂ X \ {a} (xn → a ⇒ (f · g)(xn ) → bc).
Зафиксируем произвольно последовательность {xn } с требуемым свойством: {xn } ⊂ X \ {a},
ρ
X xn → a.
(1.35)
Так как lim f (x) = b ∈ R, то по определению 1.21 из условий (1.35 ) вытекает, что x→a
f (xn ) → b.
(1.36)
Так как lim g(x) = c ∈ R, то из условий (1.35 ) вытекает также, что x→a
g(xn ) → c.
(1.37)
Из соотношений (1.36), (1.37) по теореме о пределе произведения числовых последовательностей f (xn ) · g(xn ) = (f · g)(xn ) → bc. •
1.7
Непрерывность функции. Локальные свойства непрерывных функций
Пусть (X, ρX ), (Y, ρY ) — метрические пространства, точка a ∈ X — предельная точка множества X, задана функция f : X → Y. Определение 1.24. (основное определение непрерывности). Функция f называется непрерывной в точке a, если lim f (x) = f (a).
x→a
27
(1.38)
Учитывая определения 1.20, 1.21 предела, получаем новые определения непрерывности функции в точке, эквивалентные определению 1.24. Определение 1.25. (определение непрерывности по Коши). Функция f называется непрерывной в точке a, если ∀ ε > 0 ∃ δ = δ(ε) > 0 ∀ x ∈ X
(x ∈ UX (a, δ)) ⇒ f (x) ∈ UY (f (a), ε)).
Как и в случае числовой функции одной переменной, мы теперь не отбрасываем точку a, поскольку a ∈ X и последнее включение при x = a истинно: ρY (f (a), f (a)) = 0 < ε. Определение 1.26. (определение непрерывности по Гейне). Функция f называется непрерывной в точке a, если ρ
ρ
X Y (xn → a ⇒ f (xn ) → f (a)).
∀ {xn } ⊂ X
Теорема 1.12 (непрерывность композиции непрерывных функций) Пусть (X, ρX ), (Y, ρY ), (Z, ρZ ) — метрические пространства и заданы функции f : X → Y, g : Y → Z, причем функция f непрерывна в точке a, функция g непрерывна в соответствующей точке f (a). Тогда их композиция (сложная функция) g ◦ f : X → Z непрерывна в точке a. Доказательство опирается на определение 1.26 непрерывности по Гейне и проводится по схеме доказательства теоремы 1.11, 4. Нужно проверить, что ∀ {xn } ⊂ X
ρ
ρ
X Z (xn → a ⇒ (g ◦ f )(xn ) → (g ◦ f )(a)).
Зафиксируем произвольную последовательность {xn } с требуемыми свойствами. Тогда ρ
ρ
X Y xn → a [f непрерывна в точке a] =⇒ f (xn ) → f (a) [g непрерывна в точке f (a)] =⇒
ρ
Z g(f (xn )) = (g ◦ f )(xn ) → g(f (a)) = (g ◦ f )(a). •
Теперь установим локальные свойства непрерывных функций, связанные с арифметическими операциями (включая операцию умножения точки ЛНП на скаляр). Конечно, они формулируются лишь для тех классов функций, где такие операции определены. Теорема 1.13 Рассмотрим функции f : X → Y, g : X → Y, где (X, ρX ) — МП, Y — ЛНП, и функции f, g непрерывны в точке a. Тогда 1) функция f + g непрерывна в точке a, 2) при любом λ ∈ R функция λ · f непрерывна в точке a. Если, вдобавок, Y = R, то 3) функция f · g непрерывна в точке a, 4) при g(a) 6= 0 функция f /g непрерывна в точке a. Доказательство вытекает из основного определения непрерывности 1.24 и теоремы 1.11 о свойствах предела функции. Докажем, например, утверждение 1. Поскольку функции f, g в точке a непрерывны, то по определению 1.24 lim f (x) = f (a), lim g(x) = x→a
x→a
g(a). Но тогда из теоремы 1.11, 2 вытекает, что lim (f + g)(x) = f (a) + g(a) = (f + g)(a). x→a
Это и означает (опять по определению 1.24) непрерывность в точке a функции f +g. • Иногда полезно следующее замечание, вытекающее из определения непрерывности 1.25. Замечание 1.15. Если числовая функция f непрерывна и положительна (отрицательна) в точке a, то она положительна (отрицательна) в некоторой окрестности этой точки. Задание 1.10. Доказать утверждение замечания 1.15. 28
1.8
Глобальные свойства непрерывных функций
Определение 1.27. Функция f : X → Y называется непрерывной на множестве A ⊂ X, если она непрерывна в каждой его точке. В теории числовых функций одной переменной важными являются следующие свойства функций, непрерывных на отрезке: теорема Больцано-Коши о промежуточных значениях [1, с. 126], теоремы Вейерштрасса [1, с. 125], Кантора [1, с. 268]. Однако они опираются на разные свойства отрезка на числовой прямой — линейная связность и компактность. Введем эти понятия для метрических пространств и, используя их, рассмотрим обобщения названных выше теорем.
1.8.1
Функции, непрерывные на линейно связных множествах
Пусть (X, ρ) — метрическое пространство, A ⊂ X. Определение 1.28. Множество A называется линейно связным в МП (X, ρ), если для любых различных точек x1 , x2 множества X существует непрерывное отображение отрезка [0, 1] ϕ : [0, 1] → A такое, что ϕ(0) = x1 , ϕ(1) = x2 . Любую пару точек линейно связного множества A можно во множестве A связать непрерывным путем. Определение особенно наглядно при X = Rm : тогда линейная связность множества A есть возможность соединения произвольной пары его точек непрерывной кривой, содержащейся во множестве. Пример 1.13. 1.X = R. Промежутки < a, b > — линейно связные множества. Оказывается, других линейно связных множеств на прямой не существует (см. [1, с. 29]). В то же время, например, объединение двух интервалов A = (0, 1) ∪ (2, 3) — уже не линейно связное множество. 2. X = R2 . Круг, полуплоскость, прямая — линейно связные множества, гипербола — не линейно связное множество. • Важно, что свойство линейной связности сохраняется при непрерывных отображениях. Теорема 1.14 Пусть (X, ρX ), (Y, ρY ) — метрические пространства, A ⊂ X, функция f : X → Y непрерывна на линейно связном множестве A. Тогда его образ f (A) — линейно связное множество. Доказательство. Докажем линейную связность множества f (A) по определению, опираясь на теорему 1.12. Выберем произвольно точки y1 , y2 ∈ f (A). По построению множества f (A) существуют точки x1 , x2 ∈ X такие, что f (x1 ) = y1 , f (x2 ) = y2 . Так как множество A линейно связно, то существует отображение ϕ : [0, 1] → A со свойствами ϕ(0) = x1 , ϕ(1) = x2 . Тогда сложная функция (f ◦ϕ)(t) по теореме 1.12 непрерывна на отрезке [0, 1], при этом f ◦ ϕ : [0, 1] → f (A). Находим (f ◦ ϕ)(0) = f (x1 ) = y1 , (f ◦ ϕ)(1) = f (x2 ) = y2 . • Теорема доказана для произвольной непрерывной функции. Теперь рассмотрим числовые функции и распространим на них теорему о промежуточных значениях числовых функций одной переменной. 29
Теорема 1.15 (о промежуточных значениях числовой функции) Пусть (X, ρ) — метрическое пространство, числовая функция f : X → R непрерывна на линейно связном множестве A ⊂ X, x1 , x2 — точки множества A и f (x1 ) < f (x2 ). Тогда для каждого значения C ∈ (f (x1 ), f (x2 )) существует такая точка x ∈ A, что f (x) = C. Доказательство. В силу линейной связности множества A существует непрерывный путь ϕ : [0, 1] → A, соединяющий точки x1,2 : ϕ(0) = x1 , ϕ(1) = x2 . Зафиксируем произвольно число C ∈ (f (x1 ), f (x2 )). Рассмотрим сложную функцию F (t) : = f (ϕ(t)),
t ∈ [0, 1].
Это — числовая функция одной переменной t. Она непрерывна на отрезке [0, 1] (почему?) и принимает на его концах разные значения: F (0) = f (ϕ(0)) = f (x1 ), F (1) = f (ϕ(1)) = f (x2 ). Для нее выполнены условия теоремы о промежуточных значениях для функции одной переменной и поэтому существует на интервале (0, 1) точка t такая, что F (t) = C, но F (t) = f (ϕ(t)) = f (x) ∈ A. •
1.8.2
Функции, непрерывные на компактных множествах
Напомним, что доказательство теорем Вейерштрасса и Кантора для числовых функций одной переменной опирается на теорему Больцано-Вейерштрасса, которую можно сформулировать так. Теорема 1.16 (теорема Больцано-Вейерштрасса для R) Если числовая последовательность {xn } содержится в отрезке [a, b], то из нее можно выделить подпоследовательность {xnk }, сходящуюся к точке этого отрезка. Это свойство отрезка лежит в основе понятия компактного множества в МП. Определение 1.29. Пусть (X, ρ) — метрическое пространство, A ⊂ X. Множество A называется компактным в МП (X, ρ), если для всякой последовательности точек {xn }, содержащейся во множестве A, существует подпоследовательность {xnk }, сходящаяся к точке x0 этого множества: ∀ {xn } ⊂ A ∃ {xnk } ∃ x0 ∈ A xnk → x0 . Замечание 1.16. Для метрических пространств это определение компактности эквивалентно следующему определению компактного множества в топологическом пространстве: множество A компактно, если из любого открытого покрытия этого множества (то есть семейства открытых множеств, покрывающих A) можно выделить конечное подпокрытие (то есть конечное подсемейство, покрывающее A)[5, с. 27]. Установим свойства компактных множеств и укажем компактные множества в пространствах Rm . Пример 1.14. X = R. Отрезок [a, b] — компактное множество по теореме 1.16. Интервал (a, b) не компактен, поскольку из последовательности {a + (b − a)/n} нельзя выделить подпоследовательности, сходящейся к точке интервала (почему?). Далее, бесконечный интервал (a, +∞) также не компактен (доказать, рассмотрев последовательность {a + n}). Полуинтервал (a, b] некомпактен (доказать). 30
Теорема 1.17 (необходимые условия компактности) Если пактно, то оно 1) ограничено, 2) замкнуто.
множество
ком-
Доказательство. 1) Проверим, что неограниченное множество A не компактно. Пусть a ∈ A. Множество A в силу неограниченности не может полностью содержаться в замкнутом шаре U (a, n) при любом n ∈ N. Поэтому существуют точки xn 6∈ U (a, n), xn ∈ A, n ∈ N. Тем самым определена последовательность {xn } ⊂ A такая, что ρ(xn , a) > n. Но тогда ρ(xn , a) → +∞ (почему?) и, значит, любая ее подпоследовательность {xnk } обладает свойством ρ(xnk , a) → +∞. Поэтому все подпоследовательности {xnk } последовательности {xn } не ограничены и в силу теоремы 1.7, 1 не сходятся, но тогда множество A не компактно. 2) Пусть x0 — предельная точка множества A. Из критерия предельной точки 1.9 следует существование такой последовательности {xn } ⊂ A, что xn → x0 . В силу компактности множества A найдутся ее подпоследовательность{xnk } и точка x0 ∈ A такие, что xnk → x0 . Однако по теореме 1.7, 3 о пределе подпоследовательности x0 = x0 и, значит, x0 ∈ A. Поэтому множество A замкнуто. • Теорема 1.18 (теорема Больцано-Вейерштрасса для Rm ) Всякая ограниченная последовательность {xn } ⊂ Rm (m ∈ N) содержит сходящуюся подпоследовательность {xnk }. Доказательство проведем для случая m = 2. Пусть последовательность 2 {(xn , yn )} ⊂ R ограничена, тогда она содержится в замкнутом шаре U C (θ, ε). Поэтому ∀ n ∈ N |xn | 6 ε, |yn | 6 ε и, значит, числовые последовательности {xn }, {yn } ограничены. По теореме 1.16 ∃ {xnk }, ∃x0 ∈ [−ε, ε] xnk → x0 .
(1.39)
В свою очередь, для ограниченной числовой последовательности {ynk } существуют подпоследовательность {ynkl } и точка y0 ∈ [−ε, ε] такие, что ynkl → y0 при l → ∞. Из (1.39) следует, что xnkl → x0 . Поэтому в силу теоремы 1.8 (xnkl , ynkl ) → (x0 , y0 ). • Теорема 1.19 (критерий компактности в Rm ) Множество A ⊂ Rm (m ∈ N) компактно тогда и только тогда, когда оно ограничено и замкнуто. Доказательство. Необходимость вытекает из теоремы 1.17. Достаточность. Пусть множество A ⊂ Rm ограничено и замкнуто. Выберем произвольно последовательность {xn } ⊂ A. Требуется выделить из нее подпоследовательность, сходящуюся к точке множества A. Рассмотрим отдельно 2 случая: 1) множество E значений последовательности {xn } конечно, 2) множество E бесконечно. 1) Хотя бы одно из значений α ∈ E повторяется у последовательности {xn } бесконечно много раз (если бы все значения принимались последовательностью лишь конечное число раз, то она имела бы конечное число членов). Поэтому существует подпоследовательность{xnk } последовательности {xn } такая, что xnk = α, k ∈ N, но тогда xnk = α → α ∈ E ⊂ A. 2) Так как последовательность{xn } ограничена вместе с A, то по теореме 1.18 ∃ {xnk } ∃ x0 ∈ Rm 31
xn k → x0 .
Если xnk 6= x0 (k ∈ N), то в силу критерия 1.9 x0 — предельная точка множества A; из его замкнутости вытекает, что x0 ∈ A. Если же некоторые члены последовательности {xnk } совпадают с x0 , то рассмотрим ее подпоследовательность{xnkl } : xnkl 6= x0 , l ∈ N (так как множество E бесконечно, то после отбрасывания точек последовательности xnk = x0 остается бесконечное множество членов, и образующее подпоследовательность{xnkl } ). При этом по теореме о пределе подпоследовательности xnkl → x0 . Так как {xnkl } ⊂ A \ {x0 }, то, вновь применяя критерий 1.9, убеждаемся, что x0 — предельная точка множества A, поэтому x0 ∈ A. • Теорема 1.20 Пусть (X, ρX ), (Y, ρY ) — метрические пространства и функция f : X → Y непрерывна на компактном множестве A ⊂ X. Тогда множество f (A) также компактно. Доказательство. Рассмотрим произвольную последовательность {yn } ⊂ f (A). Для каждой точки yn множества f (A) существует точка xn множества A с условием f (xn ) = yn . Тем самым определена последовательность {xn } ⊂ A. В силу компактности множества A существует такая ее подпоследовательность {xnk }, что она сходится к некоторой точке x0 множества A : xnk → x0 . Поскольку f непрерывна в этой точке, то последнее соотношение влечет f (xnk ) → f (x0 ) ∈ Y (почему?). Значит, множество f (A) компактно. • Теорема 1.21 (обобщенная теорема Вейерштрасса) Пусть (X, ρ) — метрическое пространство, числовая функция f : X → R непрерывна на компактном множестве A. Тогда функция f 1) ограничена на этом множестве, 2) принимает на множестве A наименьшее и наибольшее значения (то есть достигает на множестве своих точной нижней границы и точной верхней границы). Доказательство. 1) Так как по предыдущей теореме множество f (A) компактно, то в силу теоремы 1.17 оно ограничено, то есть функция f ограничена на множестве A. 2) Поскольку функция f числовая, то f (A) ⊂ R. Обозначим m : = inf f (A), M : = sup f (A). Из утверждения 1 нашей теоремы вытекает, что m ∈ R, M ∈ R. Нужно доказать, что ∃ x0,1 ∈ A : f (x0 ) = M, f (x1 ) = m. (1.40) Докажем свойство (1.40) для числа M. По определению супремума числового множества число M − 1/n при любом n ∈ N уже не является верхней границей множества f (A), поэтому существует точка xn ∈ A такая, что f (xn ) > M − 1/n. С другой стороны, f (xn ) 6 M. Итак, определена такая последовательность{xn } ⊂ A, что ∀n ∈ N M −
1 < f (xn ) 6 M. n
(1.41)
По теореме о пределе зажатой последовательности из (1.41) вытекает, что f (xn ) → M.
(1.42)
В силу компактности множества A существуют подпоследовательность{xnk } ⊂ A и точка x0 ∈ A такие, что (1.43) xn k → x0 . 32
Поскольку функция f непрерывна в точке x0 , то соотношение (1.43) влечет f (xnk ) → f (x0 ).
(1.44)
Но из (1.42) по теореме 1.7, 3) (о пределе подпоследовательности) f (xnk ) → M. Учитывая еще и (1.44), в силу теоремы 1.7, 1) убеждаемся, что f (x0 ) = M. • Задание 1.11. Доказать соотношение (1.40) для числа m. Снова рассмотрим общий случай функции f : X → Y, где (X, ρX ), (Y, ρY ) — метрические пространства. Определение 1.30. Функция f называется равномерно непрерывной на множестве A ⊂ X, если ∀ ε > 0 ∃ δ > 0 ∀ x1,2 ∈ A (ρX (x1 , x2 ) < δ ⇒ ρY (f (x1 ), f (x2 )) < ε). Из равномерной непрерывности функции на множестве вытекает ее непрерывность на этом множестве (почему?); обратное утверждение неверно. Теорема 1.22 (обобщенная теорема Кантора) Если функция f непрерывна на компактном множестве A ⊂ X, то она на нем равномерно непрерывна. Доказательство проводится аналогично доказательству теоремы Кантора для числовых функций одной переменной. Задание 1.12. Доказать обобщенную теорему Кантора.
33
Глава 2 Дифференциальное исчисление функций нескольких переменных Основные понятия темы «Дифференциальное исчисление функций одной переменной» — дифференцируемость, производные и дифференциалы различных порядков – обобщаются на случай функции нескольких переменных. Построенный аппарат применяется для исследования таких функций. Существенно, что при фиксировании у функции нескольких переменных всех аргументов, кроме одного, она становится функцией лишь этого аргумента, то есть функцией одного переменного. Для компактности записей основное внимание здесь будет уделено функциям двух переменных z = f (x, y).
2.1
Приращение функции. Определение непрерывности функции на языке приращений
Пусть M0 (x0 , y0 )— внутренняя точка области определения D(f ) функции z = f (x, y). Введем ненулевой вектор приращения (смещения ) точки M0 (∆x2 + ∆y 2 6= 0).
∆M = (∆x, ∆y)
Его координатами являются приращения ∆x, ∆y аргументов x, y функции f. Вектор ∆M связан лишь тем ограничением, чтобы новая точка M : = M0 + ∆M (x0 + ∆x, y0 + ∆y) содержалась во множестве D(f ). Разность ∆z = ∆f (M0 , ∆M ) : = f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 )
(2.1)
называется приращением функции f в точке M0 , отвечающим вектору приращений ∆M . Таким образом, приращение ∆z функции f полностью определяется точкой M0 (x0 , y0 ) и вектором ∆M (∆x, ∆y), то есть является функцией четырех вещественных переменных x0 , y0 , ∆x, ∆y. Рассмотрим евклидову норму вектора ∆M p (2.2) ρ : = ||∆M ||E = ∆x2 + ∆y 2 . 34
Для дальнейшего важно, что ½ ∆M → θ ⇔
∆x → 0 ⇔ ρ → 0. ∆y → 0
(2.3)
Переход от точки M0 к точке M возможен по любому направлению. Если, в частности, двигаться по направлениям осей координат Ox, Oy (тогда ∆y = 0, ∆x = 0 соответственно), то придем к частным приращениям функции f в точке M0 по координатам x, y ∆x z = f (x0 + ∆x, y0 ) − f (x0 , y0 ), ∆y z = f (x0 , y0 + ∆y) − f (x0 , y0 ). Согласно основному определению непрерывности 1.24, функция x = f (x, y) называется непрерывной в точке M0 (x0 , y0 ), если lim f (x, y) = f (x0 , y0 ).
x→x0 y→y0
(2.4)
Преобразуем это условие: lim (f (x, y) − f (x0 , y0 )) = 0,
x→x0 y→y0
lim ∆z = 0.
∆x→0 ∆y→0
(2.5)
Поскольку соотношения (2.4),(2.5) равносильны, приходим к следующему определению непрерывности функции двух переменных в точке на языке приращений. Определение 2.1. Функция z = f (x, y) называется непрерывной в точке M0 (x0 , y0 ), если справедливо соотношение (2.5), то есть бесконечно малым приращениям аргументов x, y отвечает бесконечно малое приращение функции.
2.2
2.2.1
Частные производные
Частные производные первого порядка
Обобщая понятие производной с функции одной переменной на функции нескольких переменных, приходим к понятию частных производных (ЧП) по различным переменным. Пусть, как и ранее, M0 (x0 , y0 )— внутренняя точка области определения D(f ) функции z = f (x, y). 1) Зафиксировав y = y0 , рассмотрим функцию f (x, y0 ) переменной x. Определение 2.2. Частной производной по переменной x функции z = f (x, y) в точке M0 (x0 , y0 ) называется производная функции f (x, y0 ) при x = x0 : ¯ d f (x, y0 ) ¯¯ ∂f (x0 , y0 ) . (2.6) := ∂x d x ¯x=x0 35
Применяют также следующие обозначения этой частной производной: ∂z , ∂x
zx0 ,
fx0 (M0 ).
Обязательно указание в каждом из этих символов переменной x, по которой вычисляется частная производная; например, запись z 0 лишена смысла. 2) Зафиксировав теперь x = x0 , рассмотрим функцию f (x0 , y) переменной y. Определение 2.3. Частной производной по переменной y функции z = f (x, y) в точке M0 (x0 , y0 ) называется производная функции f (x0 , y) при y = y0 : ¯ ∂f (x0 , y0 ) d f (x0 , y) ¯¯ . (2.7) := ¯ ∂y dy y=y0 Другие обозначения частной производной по переменной y: ∂z , ∂y
zy0 ,
fy0 (M0 ).
Вспоминая определение производной функции одной переменной, приходим к определению частных производных первого порядка (ЧП-1) через предел: ∂f (x0 , y0 ) ∆x z ∂f (x0 , y0 ) ∆y z : = lim , : = lim . ∆x→0 ∆x ∆y→0 ∆y ∂x ∂y
2.2.2
(2.8)
Частные производные высших порядков
Частные производные высших порядков функции нескольких переменных вводятся индуктивно: ЧП n-го порядка определяются как частные производнык от ЧП (n−1)- го порядка. 00 00 00 00 Введем частные производные второго порядка zxx , zxy , zyx , zyy : 00 00 00 00 zxx : = (zx0 )0x , zxy : = (zx0 )0y , zyx : = (zy0 )0x , zyy : = (zy0 )0y .
Аналогично задаются частные производные более высоких порядков; например, 000 zxyx : = ((zx0 )0y )0x .
Используются и более объемные обозначения ЧП высших порядков: 00 zxy
∂ 2z ∂ 2 z 000 ∂ 3z 00 = , z = , z = ∂x ∂y xx ∂x2 xyx ∂x ∂y∂x
и т.д 1 . Частные производные высших порядков, взятые по разным переменным, называются смешанными. 1
Иногда, особенно в технической литературе, при строчном обозначении частных производных верхние индексы опускаются, например, zx , fxyx . Такая символика принята в учебнике [1].
36
Пример 2.1. Найдем ЧП-1 и ЧП-2 функции f (x, y) = x2 y 3 : zx0 = [y = const] = 2xy 3 , zy0 = [x = const] = 3x2 y 2 . 00 00 00 00 zxx = (2xy 3 )0x = 2y 3 , zxy = (2xy 3 )0y = 6xy 2 , zyx = (3x2 y 2 )0x = 6xy 2 , zyy = (3x2 y 2 )0y = 6x2 y.
Аналогично вводятся частные производные различных порядков функции m переменных f (x1 , . . . , xm ), m > 2. Определение 2.4. Говорят, что f (x1 , . . . , xm ) — функция класса C (n) = C (n) (D) (n ∈ N ∪ {0}), если она имеет на множестве D ⊂ Rm непрерывные частные производные порядков до n включительно. В этом случае пишут f ∈ C (n) (D). Функция класса C 1 (D) называется гладкой на множестве D. Говорят, что f — функция класса C (∞) = C (∞) (D), если ∀ n ∈ N f ∈ C (n) (D). Поскольку частные производные нулевого порядка функции f совпадают с самой функцией, то символика f ∈ C (0) (D) означает, что функция f непрерывна на множестве D. Пример 2.2. Рассмотрим функцию двух переменных f (x, y) = x|x|, постоянную по переменной y. Поэтому ∀ n ∈ N ∀(x, y) ∈ R2
∂ n f (x, y) = 0. ∂y n
Так как функция одной переменной |x| не имеет производной в точке x = 0, а при x 6= 0 |x|0x = sign x, то ∀ (x, y) 6= (0, y) Если же x = 0, то
∂f = (x|x|)0x = |x| + x · sign x = 2|x|. ∂x
¯ ∂f (0, y) d(x|x|) ¯¯ ∆x|∆x| = = lim = 0. ¯ ∂x dx x=0 ∆x→0 ∆x
Поэтому рассматриваемая функция имеет на R2 непрерывные ЧП-1 ∂f ∂f = 2|x|, = 0. ∂x ∂y 2
Однако в любой точке (0, y) ∂∂xf2 не существует, поскольку функция одной переменной 2|x| не имеет производной в нуле. Таким образом, f (x, y) ∈ C (1) (R2 ), но f (x, y) 6∈ C (2) (R2 ). Задание 2.1. Доказать, что g(x, y) = x2 |x| ∈ C (2) (R2 ). Пример 2.3. Рассмотрим многочлен степени (порядка) n ∈ N от m переменных (относительно x1 , . . . , xm ) X Pn (x1 , . . . , xm ) = ai1 ,...,im xi11 · · · · ximm , i1 +···+im 6n
при этом существует слагаемое с условием i1 + · · · + im = n. Так, функция примера 2.1 — многочлен пятой степени относительно x, y. При вычислении частной производной степень многочлена уменьшается на единицу. Поэтому любой многочлен — функция класса C (∞) (Rm ). Однако все ее ЧП порядков выше n — нулевые функции. 37
Теорема 2.1 (достаточное условие равенства смешанных ЧП-2) Если смешан00 00 ные частные производные второго порядка fxy , fyx функции z = f (x, y) 1) существуют в некоторой окрестности точки (x0 , y0 ), 00 00 2) в точке (x0 , y0 ) непрерывны, то fxy (x0 , y0 ) = fyx (x0 , y0 ). Доказательство основано на неоднократном применении теоремы Лагранжа, причем всякий раз возникает число θi , удовлетворяющее неравенствам 0 < θi < 1.
(2.9)
Существует такое положительное число h, что указанная в формулировке теоремы окрестность точки M0 (x0 , y0 ) включает квадрат [ x0 , x0 + h] × [y0 , y0 + h]. Введем функцию от h, содержащую значения функции f в вершинах квадрата: δ(h) : = f (x0 + h, y0 + h) − f (x0 , y0 + h) + f (x0 , y0 ) − f (x0 + h, y0 ).
(2.10)
Докажем,что
δ(h) 00 = fxy (x0 , y0 ), (2.11) h→0 h2 δ(h) 00 (x0 , y0 ), (2.12) lim 2 = fyx h→0 h откуда и будет следовать теорема. Из существования в окрестности точки M0 смешан00 00 ных ЧП-2 fxy , fyx вытекает существование в этой окрестности ЧП-1 fx0 , fy0 (почему?). 1) Рассмотрим функцию аргумента x, x0 6 x 6 x0 + h lim
ϕ(x) : = f (x, y0 + h) − f (x, y0 ). Она имеет на отрезке [x0 , x0 + h] производную ϕ0 (x) : = fx0 (x, y0 + h) − fx0 (x, y0 ).
(2.13)
Объединив крайние и средние члены правой части формулы (2.10), представим функцию δ(h) в виде приращения функции ϕ(x) на отрезке [x0 , x0 + h], а к последней применим теорему Лагранжа: δ(h) = (f (x0 + h, y0 + h) − f (x0 + h, y0 )) − (f (x0 , y0 + h) − f (x0 , y0 )) = ϕ(x0 + h) − ϕ(x0 ) = (2.13)
= ϕ0 (x0 + θ1 h) · h = (fx0 (x0 + θ1 h, y0 + h) − fx0 (x0 + θ1 h, y0 )) · h. Поскольку выражение в скобках есть приращение функции от y fx0 (x0 + θ1 h, y) на 00 (x0 +θ1 h, y), то по теореме Лагранжа отрезке [y0 , y0 +h], а ее производная — функция fxy 00 (x0 + θ1 h, y0 + θ2 h) · h2 . δ(h) = fxy
Найдем
δ(h) 00 (x0 + θ1 h, y0 + θ2 h). = lim fxy 2 h→0 h→0 h Так как с учетом неравенств (2.9) lim
lim (x0 + θ1 h, y0 + θ2 h) = (x0 , y0 ),
h→0
38
00 а функция fxy в точке (x0 , y0 ) непрерывна (см. условие 2) теоремы), то приходим к равенству (2.11). 2) Доказательство формулы (2.12) аналогично, только теперь переменные x, y меняются ролями. Введем функцию переменной y, y ∈ [y0 , y0 + h]
ψ(y) : = f (x0 + h, y) − f (x0 , y). Ее производная ψ 0 (y) : = fy0 (x0 + h, y) − fy0 (x0 , y).
(2.14)
Убедимся, что функция δ(h) представима в виде приращения функции ψ(x) на отрезке [y0 , y0 + h], и вновь применим теорему Лагранжа: δ(h) = (f (x0 + h, y0 + h) − f (x0 , y0 + h)) − (f (x0 + h, y0 ) − f (x0 , y0 )) = ψ(y0 + h) − ψ(y0 ) = (2.14)
= ψ 0 (y0 + θ3 h) · h = (fy0 (x0 + h, y0 + θ3 h) − fy0 (x0 , y0 + θ3 h)) · h. Воспользуемся теоремой Лагранжа теперь применительно к функции переменной 00 x fy0 (x, y0 + θ3 h), x ∈ [x0 , x0 + h], производная которой равна fyx (x, y0 + θ3 h) : 00 δ(h) = fyx (x0 + θ4 h, y0 + θ3 h) · h2 .
Поэтому
δ(h) 00 00 = lim fyx (x0 + θ4 h, y0 + θ3 h) = fyx (x0 , y0 ). • h→0 h2 h→0 Замечание 2.1. Методом математической индукции доказывается, что у функции f класса C (n) (D), где D ⊂ Rm — открытое множество, смешанные частные производные порядков не выше n не зависят от порядка вычисления частных производных, то есть, например, 000 000 000 zxyy = zyxy = zyyx . lim
2.3
2.3.1
Дифференцируемость функции
Дифференцируемость и дифференциал
Пусть M0 (x0 , y0 ) — внутренняя точка области определения D(f ) функции z = f (x, y). Определение 2.5. Функция z = f (x, y) называется дифференцируемой в точке M0 , если ее произвольное приращение в этой точке ∆z представимо в виде ∆z = A∆x + B∆y + α(M0 , ∆M )ρ,
(2.15)
где A, B не зависят от ∆x, ∆y, lim α(M0 , ∆M ) = 0.
ρ→0
39
(2.16)
Линейная относительно ∆x, ∆y часть приращения ∆z называется дифференциалом функции z = f (x, y) в точке M0 dz = d f (M0 , ∆M ) : = A∆x + B∆y.
(2.17)
Более развернутый символ дифференциала d f (M0 , ∆M ) подчеркивает, что дифференциал (а не функция f !) зависит как от точки M0 (x0 , y0 ), так и от вектора приращений ∆M = (∆x, ∆y); подробнее — от x0 , y0 , ∆x, ∆y. Напомним, что от этих же вещественных переменных зависит и приращение ∆z = ∆ f (M0 , ∆M ) функции двух переменных f. Убедимся, что выражение α(M0 , ∆M )ρ есть бесконечно малая функция более высокого порядка, чем ρ, при ρ → 0 2 , то есть что α(M0 , ∆M )ρ = o(ρ), ρ → 0. Действительно,
(2.18)
α(M0 , ∆M )ρ (2.16) = lim α(M0 , ∆M ) = 0. ρ→0 ρ→0 ρ lim
Поэтому формулу (2.15) можно представить более кратко: ∆z = dz + o(ρ), ρ → 0.
(2.19)
В этом смысле дифференциал dz — главная линейная часть приращения ∆z функции. Смысл дифференцируемости: приращение функции в окрестности точки M0 «почти линейно», то есть является с точностью до слагаемого o(ρ) линейной функцией приращений ∆x, ∆y ее аргументов. В некоторых случаях удобна более подробная, чем (2.15), форма приращения дифференцируемой функции, содержащая, наряду с дифференциалом, два слагаемых. Лемма 2.1 Функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ) тогда и только тогда, когда существуют такие функции ε1,2 (M0 , ∆M ), обладающие свойством lim ε1,2 (M0 , ∆M ) = 0,
∆x→0 ∆y→0
(2.20)
что приращение ∆z функции в точке M0 имеет вид ∆z = A∆x + B∆y + ε1 (M0 , ∆M )∆x + ε2 (M0 , ∆M )∆y.
(2.21)
Доказательство состоит в построении по функции α функций ε1,2 и, наоборот, по функциям ε1,2 — функции α. При преобразованиях соответствующих выражений происходит умножение и деление на ρ; учитывается также тот факт, что в силу (2.2) |∆y| 6 1. ρ
|∆x| 6 1, ρ
(2.22)
1) Пусть функция f дифференцируема в точке M0 , ρ 6= 0. Преобразуем µ ¶ µ ¶ ρ2 (2.2) ∆x ∆y α·ρ=α· = α ∆x + α ∆y. ρ ρ ρ 2
Символика g = o(f ), x → a, где функции одного переменного f, g БМ при x → a, означает, что lim f (x)/(g(x)) = 0.
x→a
40
Поэтому при ∆M 6= θ ε1 (M0 , ∆M ) : = α(M0 , ∆M ) ·
∆x , ρ
ε2 (M0 , ∆M ) : = α(M0 , ∆M ) ·
∆y . ρ
Учитывая (2.3), (2.16), (2.22) и теорему 1.11, 6), находим lim ε1 (M0 , ∆M ) = lim α(M0 , ∆M ) ρ→0
∆x→0 ∆y→0
∆x = 0. ρ
Аналогично проверяется, что lim ε2 (M0 , ∆M ) = 0.
∆x→0 ∆y→0
Если же ρ = 0, то есть ∆M = θ, то положим ε1,2 (M0 , θ) : = 0. 2) Пусть справедливы формулы (2.21), (2.20). Преобразуем при ρ 6= 0 (ε1 ∆x + ε2 ∆y) ·
ρ ∆x ∆y = (ε1 + ε2 ) · ρ. ρ ρ ρ
Поэтому полагаем при ∆M 6= θ α(M0 , ∆M ) : = ε1 (M0 , ∆M ) ·
∆x ∆y + ε2 (M0 , ∆M ) · . ρ ρ
Тогда (2.20)
lim α(M0 , ∆M ) = 0.
ρ→0
Наконец, полагаем α(M0 , θ) : = 0. • Задание 2.2. Дать определение дифференцируемости функции m переменных (m > 2) z = f (x1 , . . . , xm ) в точке M0 (x01 , . . . , x0m ).
2.3.2
Необходимые условия дифференцируемости
Установим два важных необходимых условия дифференцируемости функции нескольких переменных. Теорема 2.2 Если функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ), то в этой точке существуют ее ЧП-1, причем A=
∂f (M0 ) , ∂x
B=
∂f (M0 ) . ∂y
(2.23)
Доказательство. Докажем первую из формул (2.23). Выберем вектор приращений ∆M : = (∆x, 0), тогда ∆y = 0, ∆z = ∆x z = f (x0 + ∆x, y0 ) − f (x0 , y0 ) и формула (2.21) упрощается: ∆x z = A∆x + ε1 ∆x. (2.20)
При этом lim ε1 = 0. Поэтому существует ∆x→0 (∆y=0)
∆x z (2.8) ∂f (M0 ) = lim (A + ε1 ∆x) = A = . • ∆x→0 ∆x ∆x→0 ∂x Задание 2.3. Доказать вторую из формул (2.23). Следствие 2.1. Если в точке (x0 , y0 ) не существует хотя бы одной из ЧП-1 функции z = f (x, y), то она в ней недифференцируема. lim
41
Теорема 2.3 Если функция z = f (x, y) дифференцируема в точке M0 (x0 , y0 ), то она в этой точке непрерывна. Доказательство. Так как (2.21)
lim ∆z =
∆x→0 ∆y→0
(2.20)
lim (A∆x + B∆y + ε1 (M0 , ∆M )∆x + ε2 (M0 , ∆M )∆y) = 0,
∆x→0 ∆y→0
то по определению 2.1 функция f непрерывна в точке M0 . • Следствие 2.2. Если функция z = f (x, y) разрывна в точке (x0 , y0 ), то она в ней недифференцируема. Замечание 2.2. В теоремах 2.2, 2.3 указаны лишь необходимые условия дифференцируемости функции нескольких переменных, не являющиеся достаточными. Построим соответствующие контрпримеры. 1) Пусть ½ 0, если xy = 0 , f (x, y) = 1, если xy 6= 0 . Так как вдоль осей координат f (x, y) = 0, то ∆x f (θ) = f (∆x, 0) − f (0, 0) = 0,
∆y f (θ) = 0
и поэтому fx0 (θ) = fy0 (θ) = 0. В то же время функция разрывна в точке θ, поскольку в любой ее окрестности она принимает значения 0, 1. Но тогда по следствию 2.2 она недифференцируема в рассматриваемой точке. 2) Рассмотрим теперь непрерывную функцию p g(x, y) = x2 + y 2 . (2.24) Поскольку g(x, 0) = |x|, g(o, y) = |y|, то не существуют gx0 (θ), gy0 (θ), но тогда функция недифференцируема в точке θ.
2.3.3
Достаточные условия дифференцируемости
Теорема 2.4 Если частные производные первого порядка fx0 , fy0 функции z = f (x, y) 1) существуют в окрестности U (M0 , δ) точки M0 (x0 , y0 ), 2) непрерывны в точке M0 , то функция дифференцируема в этой точке. Доказательство. Достаточно проверить условия (2.21), (2.20) (см. лемму 2.1). Пусть (x0 + ∆x, y0 + ∆y) ∈ U (M0 , δ), тогда и (x0 , y0 + ∆y) ∈ U (M0 , δ). Преобразуем ∆z к сумме разностей функций одной переменной (2.1)
∆z = f (x0 +∆x, y0 +∆y)−f (x0 , y0 )±f (x0 , y0 +∆y) = (f (x0 +∆x, y0 +∆y)−f (x0 , y0 +∆y))+ +(f (x0 , y0 + ∆y) − f (x0 , y0 )). Применим к каждой разности теорему Лагранжа: ∆z = fx0 (x0 + θ1 ∆x, y0 + ∆y) · ∆x + fy0 (x0 , y0 + θ2 ∆y) · ∆y; 42
(2.25)
здесь величины θ1,2 вновь удовлетворяют неравенствам (2.9) (обосновать формулу (2.25)!). Поскольку lim (x0 + θ1 ∆x, y0 + ∆y) = lim (x0 , y0 + θ2 ∆y) = (x0 , y0 ),
∆x→0 ∆y→0
∆x→0 ∆y→0
а ЧП-1 fx0 , fy0 непрерывны в точке (x0 , y0 ), то lim fx0 (x0 + θ1 ∆x, y0 + ∆y) = fx0 (x0 , y0 ), lim fy0 (x0 , y0 + θ2 ∆y) = fy0 (x0 , y0 ).
∆x→0 ∆y→0
∆x→0 ∆y→0
(2.26)
Введем функции ε1 : = fx0 (x0 + θ1 ∆x, y0 + ∆y) − fx0 (x0 , y0 ), ε2 : = fy0 (x0 , y0 + θ2 ∆y) − fy0 (x0 , y0 ). В силу (2.26) lim ε1,2 = 0. Но тогда из (2.25) вытекает, что ∆x→0 ∆y→0
∆z = (fx0 (x0 , y0 ) + ε1 )∆x + (fy0 (x0 , y0 ) + ε2 )∆y. Таким образом, соотношения (2.21), (2.20) справедливы. • Внимательный читатель безусловно заметил идейную близость доказательств этой теоремы и теоремы 2.1. Задание 2.4. Переформулировать лемму 2.1 и теоремы 2.2-2.4 на случай функции f (x1 , . . . , xm ) m переменных. Следствие 2.3. Функция f, гладкая на открытом множестве D ⊂ Rm , дифференцируема в каждой точке этого множества.
2.4
Геометрический и физический смысл частных производных первого порядка. Геометрический смысл дифференцируемости и дифференциала
Укажем геометрический смысл частной производной fx0 (x0 , y0 ) функции двух переменных z = f (x, y), опираясь на определение 2.2. Рассекая график функции плоскостью y = y0 , получим кривую z = f (x, y0 ). Проводя касательную Tx к ней в точке (x0 , y0 , f (x0 , y0 ))
(2.27)
(она также лежит в этой плоскости), найдем угол α между Tx и положительным направлением оси Ox. Тогда fx0 (x0 , y0 ) = tg α. Иначе говоря. fx0 (x0 , y0 ) — угловой коэффициент касательной Tx к кривой z = f (x, y0 ). Аналогично, fy0 (x0 , y0 ) — угловой коэффициент касательной Ty к кривой z = f (x0 , y), проведенной в точке (2.27). Физический смысл ЧП-1. Частная производная по x fx0 (M0 ) есть скорость изменения функции z = f (x, y) в точке M0 в направлении координатного орта ~i = (1, 0). Аналогично, частная производная по y fy0 (M0 ) есть скорость изменения функции в точке M0 в направлении координатного орта ~j = (0, 1). 43
Геометрический смысл дифференцируемости функции связан с понятием касательной плоскости к ее графику. Пусть функция z = f (x, y) дифференцируема в точке M0 , тогда приращение функции в этой точке представимо формулой (2.19). Запишем ее подробнее: f (x, y) = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ) + o(ρ), ρ → 0.
(2.28)
Определение 2.6. Касательной плоскостью к графику функции z = f (x, y) в точке (2.27) называется плоскость T : z = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ).
(2.29)
Таким образом, касательная плоскость T характеризуется тем свойством, что точка (x, y, f (x, y)) графика функции уклоняется от точки (x, y, z) ∈ T на величину o(ρ). Геометрический смысл дифференцируемости. Функция z = f (x, y) дифференцируема в точке (x0 , y0 ) тогда и только тогда, когда к ее графику можно провести в точке (2.27) касательную плоскость. Можно доказать, что касательная плоскость T образована касательными к кривым, проходящим на графике функции через точку (2.27) [4, с. 472]. Так как fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ) = dz, то из формулы (2.29) вытекает равенство dz = z − f (x0 , y0 ).
(2.30)
Поэтому дифференциал функции равен приращению аппликаты касательной плоскости T. В этом заключается геометрический смысл дифференциала функции двух переменных. Посмотрим теперь на дифференцируемую функции с точки зрения аппроксимации (приближения) функций. Дифференцируемая в точке M0 функция z = f (x, y) допускает линеаризацию в ее окрестности. Точнее, она представима с погрешностью o(ρ) линейной функцией z = f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ),
(2.31)
графиком которой является касательная T. При этом линейная функция с названным свойством единственна. На практике часто, отбрасывая в формуле (2.19) слагаемое o(ρ), полагают приближенно ∆z ≈ dz. (2.32) Более подробно, f (x, y) ≈ f (x0 , y0 ) + fx0 (x0 , y0 )(x − x0 ) + fy0 (x0 , y0 )(y − y0 ).
(2.33)
Формулы (2.32), (2.33) применяются для приближенного вычисления значений функции в точках, близких к точке M0 .
44
2.5
Вычисление производных и частных производных сложных функций
Формулы, которые мы выведем в этом пункте, специфичны для функций нескольких переменных. Пусть функции z = f (x, y), x = ϕ(t), y = ψ(t) образуют сложную функцию z = F (t) : = f (ϕ(t), ψ(t)) одного переменного t. Теорема 2.5 Если функции x = ϕ(t), y = ψ(t) имеют производные в точке t0 , а функция z = f (x, y) дифференцируема в соответствующей точке (x(t0 ), y(t0 )), то сложная функция z = f (ϕ(t), ψ(t)) имеет производную в точке t0 , вычисляемую по формуле ∂z dx ∂z dy dz = · + · . dt ∂x dt ∂y dt
(2.34)
Доказательство. Придадим переменной t такое приращение ∆t в точке t0 , чтобы t0 + ∆t ∈ D(F ). Тогда и функции x = ϕ(t), y = ψ(t) испытают приращения ∆x = ϕ(t0 + ∆t) − ϕ(t0 ), ∆y = ψ(t0 + ∆t) − ψ(t0 ). Так как внешняя функция z = f (x, y) дифференцируема в точке (x0 , y0 ), то ее приращение представимо в виде ∆z = Но тогда
∂z ∂z ∆x + ∆y + ε1 ∆x + ε2 ∆y. ∂x ∂y
∆z ∂z ∆x ∂z ∆y ∆x ∆y = + + ε1 + ε2 . ∆t ∂x ∆t ∂y ∆t ∆t ∆t
(2.35)
Поскольку функции x = ϕ(t), y = ψ(t) имеют производные в точке t0 , то ∆x dx ∆y dy = ϕ0 (t0 ) = , lim = ψ 0 (t0 ) = . ∆t→0 ∆t dt ∆t→0 ∆t dt lim
Отсюда следует также, что эти функции непрерывны в точке t0 , но тогда по определению непрерывности функции одной переменной на языке приращений lim ∆x = 0, lim ∆y = 0.
∆t→0
Так как lim ε1,2 ∆x→0 ∆y→0
∆t→0
(2.20)
= 0, то и lim ε1,2 = 0. Поэтому существует предел при ∆t → 0 ∆t→0
выражения, стоящего в правой части формулы (2.35): µ ¶ ∂z ∆x ∂z ∆y ∆x ∆y ∂z dx ∂z dy lim + + ε1 + ε2 · + · . = ∆t→0 ∂x ∆t ∂y ∆t ∆t ∆t ∂x dt ∂y dt Переходя к пределу в равенстве (2.35) при ∆t → 0, и приходим к формуле (2.34). • Следствие 2.4. Производная сложной функции z = f (x, g(x)) вычисляется по формуле ∂z ∂z dy dz = + · . (2.36) dx ∂x ∂y dx 45
Доказательство. Теперь t = x, поэтому dx = 1. • dt Следствие 2.5. Частные производные первого порядка сложной функции нескольких переменных z = f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )) (k ∈ N, k > 1) определяются следующим образом: ∂z ∂x ∂z ∂y ∂z ∂z ∂x ∂z ∂y ∂z = + ,..., = + . · · · · ∂t1 ∂x ∂t1 ∂y ∂t1 ∂tk ∂x ∂tk ∂y ∂tk
(2.37)
Предполагается, что функции x = ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk ) имеют ЧП-1 в точке (t01 , . . . , t0k ), а внешняя функция z = f (x, y) дифференцируема в соответствующей точке (x0 , y0 ) такой. что x0 = ϕ(t01 , . . . , t0k ), y0 = ψ(t01 , . . . , t0k ). Доказательство. При нахождении частных производных сложной функции по каждому аргументу ti (1 6 i 6 k) остальные аргументы фиксируются и рассматривается функция лишь одной переменной ti . Поэтому приходим к формулам типа (2.34), только теперь все производные становятся частными. • Замечание 2.3. Формулы (2.34), (2.37) обобщаются на случай, когда внешняя функция зависит от m (m > 2) переменных: z = f (x1 , . . . , xm ), x1 = ϕ1 (t1 , . . . , tk ), . . . , xm = ϕm (t1 , . . . , tk ). Задание 2.5. Записать указанные обобщения формул (2.34), (2.37).
2.6
Дифференциалы функции нескольких переменных
Перейдем к рассмотрению дифференциалов функции нескольких переменных различных порядков. Важно, что дифференциал функции некоторого порядка объединяет все ее частные производные этого порядка. Пусть функция z = f (x, y) дифференцируема в каждой точке открытого множества D ⊂ D(f ). Тогда в каждой точке M (x, y) ∈ D она имеет и дифференциал dz = d f (M, ∆M ) =
∂z ∂z · ∆x + · ∆y. ∂x ∂y
Чтобы получить однотипную символику, введем дифференциалы аргументов dx : = ∆x, dy : = ∆y. Тогда приходим к следующей основной формуле dz = d f (M, dM ) =
∂z ∂z · dx + · dy. ∂x ∂y
Здесь dM : = ∆M = (dx, dy) = (∆x, ∆y) 46
(2.38)
— вектор, составленный из дифференциалов аргументов. Иногда дифференциал (2.38) функции z = f (x, y) называют полным, в отличие от ∂z ∂z ее частных дифференциалов ∂x · dx, ∂y · dy по переменным x, y соответственно. Формула (2.38) обобщается на функции m переменных dz = d f (M, dM ) =
∂z ∂z · dx1 + · · · + · dxm , ∂x1 ∂xm
(2.39)
где M (x1 , . . . , xm ), dM : = ∆M = (dx1 , . . . , dxm ) = (∆x1 , . . . , ∆xm ). Как и в случае функции одной переменной, формы (2.38), (2.39) дифференциала функций двух и m переменных инвариантны относительно замены переменных. Сформулируем и докажем это свойство применительно к функциям двух переменных. Свойство инвариантности формы дифференциала. Пусть z = f (x, y) — гладкая функция на открытом множестве D ⊂ R2 , а x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk ) (k ∈ N, k > 1) — гладкие функции на открытом множестве T ⊂ Rk , где определена сложная функция z = f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )). Тогда она дифференцируема на T, причем ее дифференциал вычисляется по формуле (2.38). Доказательство. Рассматриваемая сложная функция по следствию 2.5 имеет ЧП1, определяемые формулами (2.37). Так как эти ЧП являются суммами произведений непрерывных функций (каких?), то они непрерывны на T. Поэтому в силу теоремы 2.4 сложная функция дифференцируема на T и, значит, имеет дифференциал. Он, в соответствии с общей формулой (2.39), определяется так: dz =
∂z ∂z · dt1 + · · · + · dtk . ∂t1 ∂tk
Преобразуем, применяя формулы (2.37): µ ¶ µ ¶ ∂z ∂x ∂z ∂x ∂z ∂y ∂z ∂y dz = · + · · dt1 + · · · + · + · · dtk = ∂x ∂t1 ∂y ∂t1 ∂x ∂tk ∂y ∂tk µ µ ¶ ¶ ∂z ∂x ∂x ∂y ∂y ∂z ∂z ∂z = · · dt1 + · · · + · dtk + · · dt1 + · · · + · dtk = · dx + · dy. ∂x ∂t1 ∂tk ∂y ∂t1 ∂tk ∂x ∂y Пришли к той же форме дифференциала. Однако здесь dx, dy — не произвольные приращения аргументов, а дифференциалы функций x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk ). Действительно, по формулам (2.39) dx =
∂x ∂y ∂y ∂x · dt1 + · · · + · dtk , dy = · dt1 + · · · + · dtk . • ∂t1 ∂tk ∂t1 ∂tk
Следствие 2.6. (правила нахождения дифференциалов). Пусть u = u(x1 , . . . , xm ), v = v(x1 , . . . , xm ) — дифференцируемые функции m переменных (m > 1), c — константа. Тогда 10 . d(cu) = c · du; 20 . d(u ± v) = du ± dv; 47
(2.40)
30 . d(uv) = du · v + dv · u; ³ u ´ du · v − dv · u 0 4 .d = . v v2 Доказательство. Докажем, например, свойство 40 . Пусть вначале u, v — независимые переменные, то есть рассмотрим функцию z = u/v. Тогда по формуле (2.38) ³ u ´ ³ u ´0 ³ u ´0 ³ u´ 1 du · v − dv · u . d = · du + · dv = · du + − 2 · dv = v v u v v v v v2 Значит, для рассматриваемой частной ситуации получили нужную формулу. Но в силу свойства инвариантности она сохранится и в случае, когда u, v — дифференцируемые функции (2.40). • Дифференциалы высших порядков функций нескольких переменных Дифференциалы высших порядков функции f m переменных, как и производные высших порядков, определяются индуктивно (рекуррентно). Осложняющая дело специфика дифференциалов заключается в том, что они зависят как от аргументов функции f, так и от их приращений, являясь, по существу, функциями уже 2m переменных. Пусть m = 2. Будем предполагать, что z = f (x, y) — функция класса C (n) (D) на открытом множестве D ⊂ R2 при всех рассматриваемых n, но тогда по замечанию 2.1, с. 38 ее смешанные ЧП высших порядков не зависят от порядка вычисления частных производных. Будем исходить из формулы (2.38) (первого) дифференциала функции. Определение 2.7. Дифференциал n-го порядка (n > 1), или n-ый дифференциал функции z = f (x, y) определяется соотношением dn z : = d(dn−1 )z
(2.41)
dx = const, dy = const.
(2.42)
в предположении, что Отталкиваясь от формулы (2.38) и используя свойства дифференциалов, найдем формулу вычисления дифференциала второго порядка: µ ¶ µ ¶ ∂z ∂z ∂z (2.42),10 ,20 2 d z = d(dz) = d · dx + · dy = d · dx+ ∂x ∂y ∂x µ 2 ¶ µ 2 ¶ µ ¶ ∂ z ∂ z ∂z ∂ 2z ∂ 2z (2.38) +d · dy = dx + dy · dx + dx + 2 dy · dy = ∂y ∂x2 ∂x ∂y ∂y∂x ∂y · 2 ¸ 2 2 2 2 ∂ z ∂ z ∂ z ∂ z ∂ z = · dx2 + 2 = = · dx dy + 2 · dy 2 . 2 ∂x∂y ∂y∂x ∂x ∂x∂y ∂y Таким образом, ∂ 2z ∂2z ∂ 2z 2 · dx + 2 · dx dy + · dy 2 . (2.43) d2 z = ∂x2 ∂x∂y ∂y 2 Задание 2.6. Доказать формулу вычисления дифференциала третьего порядка d3 z =
∂ 3z ∂ 3z ∂ 3z ∂3z 3 2 2 · dx + 3 · dx dy + 3 · dx dy + · dy 3 . ∂x3 ∂x2 ∂y ∂x ∂y 2 ∂y 3
(2.44)
Замечание 2.4. Методом математической индукции можно доказать следующую формулу для дифференциала произвольного n-ого порядка: dn z =
∂ nz n ∂ nz ∂ nz n−1 2 dx + n dx dy + C dxn−2 dy 2 + · · · + n n n−1 n−2 2 ∂x ∂x ∂y ∂x ∂y 48
+Cnk
∂nz ∂nz ∂ nz n n−k k n−1 dx dy + · · · + n dx dy + dy : = ∂xn−k ∂y k ∂x ∂y n−1 ∂y n
µ
∂ ∂ dx + dy ∂x ∂y
¶n z. (2.45)
Здесь
n(n − 1) . . . (n − k + 1) (1 6 k 6 n), k! В случае функции m переменных (m > 2) Cnk =
Cn0 = 1.
z = f (M ) = f (x1 , . . . , xm )
(2.46)
формулы вычисления дифференциалов высших порядков усложняются. Так, m X ∂ 2 f (M ) d z = d f (M, dM ) = dxi dxj , ∂xi ∂xj i,j=1 2
n
n
d z = d f (M, dM ) =
2
m X i1 ,...,in
∂ n f (M ) dxi1 . . . dxin ∂xi1 . . . ∂xin =1
(ik ∈ N ∪ {0}) .
(2.47)
(2.48)
Сумма, стоящая в правой части формулы (2.48), содержит много одинаковых слагаемых, поскольку смешанные частные производные не зависят от порядка дифференцирования. Этим формула (2.48) отличается от аналогичной формулы (2.45) для функции двух переменных. Определение 2.8. Функция (2.46) называется однородной степени однородности α ∈ R, если ∀ M ∈ D(f ) ∀ t ∈ R : tM ∈ D(f ) f (tM ) = tα · f (M ). (2.49) Пример 2.4. Функции
√ x+y , x+y 2 2 x +y являются однородными степеней (−1), 1/2 соответственно. • Важным классом однородных функций являются однородные многочлены (формы) нескольких переменных степени однородности n ∈ N X Pn (M ) = Pn (x1 , . . . , xm ) = ai1 ...im xi11 . . . ximm (ik ∈ N ∪ {0}). (2.50) i1 +···+im =n
Сумма показателей степеней i1 , . . . , im при переменных x1 , . . . , xm у каждого слагаемого, входящего в многочлен Pn , в точности равна n. Как видно из формулы (2.48), n-ый дифференциал dn f (M, dM ) относительно дифференциалов переменных dx1 , . . . , dxm является однородным многочленом степени однородности n. В частности, первый дифференциал (2.39) — однородный многочлен первой степени (линейная форма), а второй дифференциал (2.47) — однородный многочлен второй степени (квадратичная форма) относительно dx1 , . . . , dxm . Замечание 2.5. Дифференциалы высших порядков функции нескольких переменных, вообще говоря, не обладают свойством инвариантности формы относительно замены переменных. Убедимся в этом для d2 z, рассматривая функцию двух переменных. Пусть z = f (x, y), x = ϕ(t1 , . . . , tk ), y = ψ(t1 , . . . , tk ) и все эти функции класса C (2) на соответствующих множествах. Тогда существуют дифференциалы dz, d2 z, причем dz обладает свойством инвариантности формы: dz = d f (ϕ(t1 , . . . , tk ), ψ(t1 , . . . , tk )) = 49
∂z ∂z · dx + dy. ∂x ∂y
Здесь dx = dϕ(t1 , . . . , tk ), dy = dψ(t1 , . . . , tk ). Находим µ ¶ µ ¶ µ ¶ ∂z ∂z ∂z ∂z ∂z 2 ∂z 2 20 ,30 2 d z=d dx + dy = d dx + d dy + d x+ dy= ∂x ∂y ∂x ∂y ∂x ∂y =
∂2z 2 ∂ 2z ∂ 2 z 2 ∂z 2 ∂z 2 dx + 2 dx dy + dy + d x+ d y. 2 2 ∂x ∂x∂y ∂y ∂x ∂y
Так как d2 x = d2 ϕ(t1 , . . . , tk ), d2 y = d2 ψ(t1 , . . . , tk ) — вторые дифференциалы функций ϕ, ψ, то они, вообще говоря, ненулевые функции своих аргументов. Таким образом, d2 z теперь определяется по более сложной, чем (2.43), формуле. Замечание 2.6. Дифференциалы высших порядков функции двух переменных z = f (x, y) обладают свойством инвариантности формы относительно линейной замены переменных x = a1 t1 + · · · + ak tk + ak+1 , y = b1 t1 + · · · + bk tk + bk+1
(ai , bi − const).
Подробнее, если f ∈ C (n) (D), то сложная функция аргументов t1 , . . . , tk f (a1 t1 + · · · + ak tk + ak+1 , b1 t1 + · · · + bk tk + bk+1 ) имеет на соответствующем множестве D1 ⊂ Rk дифференциалы порядков до n включительно, определяемые по формулам (2.45). Задание 2.7. Доказать этот факт методом математической индукции по числу n. Задание 2.8. Обобщить утверждение задания 2.6 на случай функции m переменных (2.46).
2.7
Формула Тейлора для функции нескольких переменных
Будем исходить из формулы Тейлора для функции одной переменной y = f (x). Если в окрестности точки x0 функция имеет производные порядков до (n + 1) включительно (n ∈ N∪{0}), то в каждой точке x = x0 +∆x окрестности справедлива формула Тейлора с остаточным членом в форме Лагранжа f 0 (x0 ) f 00 (x0 ) f (n) (x0 ) 2 f (x) = f (x0 ) + (x − x0 ) + (x − x0 ) + · · · + (x − x0 )n + 1! 2! n! +
f (n+1) (x0 + θ(x − x0 )) (x − x0 )n+1 , (n + 1)!
где 0 < θ < 1 [1, с. 475]. Преобразуем эту формулу, записав ее через приращение и дифференциалы функции. Поскольку f (x) − f (x0 ) = ∆y = ∆f (x0 , ∆x), f (k) (x0 )(x − x0 )k = d k f (x0 , ∆x), то приходим к формуле ∆ f (x0 , ∆x) = d f (x0 , ∆x) +
1 2 1 d f (x0 , ∆x) + · · · + d n f (x0 , ∆x)+ 2! n! 50
+
1 d n+1 f (x0 + θ∆x, ∆x). (n + 1)!
(2.51)
Формула Тейлора в дифференциалах (2.51) и обобщается на функции нескольких переменных. Теорема 2.6 Пусть (2.46) — функция класса C (n+1) (U (M0 , δ)) (n ∈ N ∪ {0}). Тогда для каждой точки M = M0 + ∆M ∈ U (M0 , δ) найдется такое число θ, 0 < θ < 1, что ∆ f (M0 , ∆M ) = d f (M0 , ∆M ) + +
1 2 1 d f (M0 , ∆M ) + · · · + d n f (M0 , ∆M )+ 2! n!
1 d n+1 f (M0 + θ∆M, ∆M ). (n + 1)!
(2.52)
Доказательство проведем для случая функции двух переменных z = f (x, y). Выберем произвольную точку M (x0 + ∆x, y0 + ∆y) ∈ U (M0 , δ). Соединим точки M0 , M отрезком прямой [M0 , M ] ½ x(t) = x0 + t∆x, [M0 , M ] : t ∈ [0, 1] y(t) = y0 + t∆y, и рассмотрим сужение функции f на отрезке [M0 , M ] — функцию одной переменной t F (t) : = f (x0 + t∆x, y0 + t∆y).
(2.53)
При этом F (0) = f (M0 ), F (1) = f (M ). Поэтому приращение функции f есть в то же время приращение функции F, где ∆t = 1 − 0 = 1 : ∆f (M0 , ∆M ) = ∆F (0, 1).
(2.54)
Как следует из замечания 2.6, при всех t ∈ [0, 1] существуют дифференциалы функции F всех порядков до (n + 1) включительно и ∀ t ∈ [0, 1] ∀ k 1 6 k 6 n + 1 d k F (t, 1) = d k f (M0 + t · ∆M, ∆M ).
(2.55)
Значит, на отрезке [0, 1] существуют производные функции F этих порядков, но тогда по формуле Тейлора (2.51) для функции одной переменной при некотором 0 < θ < 1 ∆F (0, 1) = d F (0, 1) +
1 2 1 1 d F (0, 1) + · · · + d n F (0, 1) + d n+1 F (θ, 1). 2! n! (n + 1)!
Возвращаясь в силу равенств (2.54), (2.55) к функции f, и приходим к требуемой формуле (2.52). • Замечание 2.7. Отбрасывая в формуле Тейлора (2.52) остаточный член Rn (M0 , ∆M ) =
1 d n+1 f (M0 + θ∆M, ∆M ), (n + 1)!
получаем приближенное равенство ∆ f (M0 , ∆M ) ≈ d f (M0 , ∆M ) +
1 2 1 d f (M0 , ∆M ) + · · · + d n f (M0 , ∆M ). 2! n!
(2.56)
Тем самым мы функцию f приближаем многочленом n-ой степени относительно ∆x1 , . . . , ∆xn . Его называют многочленом наилучшего приближения функции f в окрестности точки M0 . 51
Следствие 2.7. (обобщенная формула Лагранжа). Полагая в формуле (2.52) n = 0, приходим к формуле ∆f (M0 , ∆M ) = df (M0 + θ∆M, ∆M ). Запишем ее более подробно: f (M ) = f (M0 )+fx0 1 (M0 +θ(M −M0 ))(x1 −x01 )+· · ·+fx0 m (M0 +θ(M −M0 ))(xm −x0m ). (2.57) Здесь предполагается гладкость функции f на множестве U (x0 , δ). Из обобщенной формулы Лагранжа (2.57) вытекает следующая важная Теорема 2.7 (критерий постоянства функции нескольких переменных) Пусть функция (2.46) является гладкой на открытом линейно связном множестве D ⊂ Rm . Она постоянна на множестве D тогда и только тогда, когда ∀M ∈ D
fx0 1 (M ) = · · · = fx0 m (M ) = 0.
(2.58)
Доказательство. Если функция (2.46) постоянна на множестве D, то условия (2.58) справедливы. Докажем обратное утверждение. 1) Проверим вначале, что функция f постоянна на любом открытом шаре U (M0 , δ) ⊂ D. Зафиксируем такой шар и выберем произвольную точку M = M0 + ∆M ∈ U (M0 , δ). Применим формулу (2.57): f (M ) = f (M0 ) + 0 = f (M0 ). Значит, в каждой точке шара функция принимает постоянное значение f (M0 ). 2) Теперь докажем постоянство функции f на всем множестве D. Нужно проверить, что ∀ M0 , M1 ∈ D f (M0 ) = f (M1 ). (2.59) Зафиксируем произвольно точки M1 , M2 ∈ D. В силу линейной связности их можно соединить непрерывным путем ϕ : [0, 1] → D таким, что ϕ(0) = M0 , ϕ(1) = M1 . Иначе говоря, на множестве D задана непрерывная ориентированная кривая L : M (t) = ϕ(t), t ∈ [0, 1] с началом в точке M0 и с концом в точке M1 . В силу открытости множества D существует открытый шар U (M0 , δ) ⊂ D. Из доказанного в 1) следует, что ∀ M ∈ U (M0 , δ) f (M ) = f (M0 ).
(2.60)
Так как кривая L непрерывна, то ее часть, примыкающая к начальной точке M0 , содержится в открытом шаре; подробнее, существует число τ > 0 такое, что {ϕ(t), 0 6 t 6 τ } ⊂ U (M0 , δ). Тогда, как вытекает из (2.60), ∀ t ∈ [0, τ ] f (ϕ(t)) = f (M0 ). Введем число T : = sup τ, 52
(2.61)
где верхняя граница берется по всем числам τ ∈ (0, 1], удовлетворяющим условию (2.61). Из непрерывности функции f (ϕ(t)) в точке t = T следует, что можно переходить в равенстве (2.61) к пределу при τ → T : f (ϕ(T )) = f (M0 ).
(2.62)
Для проверки условия (2.59) нужно убедиться, что T = 1. Докажем это от противного. Пусть T < 1 и поэтому ϕ(T ) 6= M1 , f (M1 ) 6= f (M0 ). Тогда существует такое число ∆t > 0, что (2.62)
∀ t ∈ [T, T + ∆t] f (ϕ(t)) = f (ϕ(T )) = f (M0 ). Но это противоречит выбору числа T. • Замечание 2.8. Условия (2.58) можно записать более компактно следующим образом: ∀ M ∈ D d f (M ) = 0. (2.63) Определение 2.9. Градиентом функции (2.46) в точке M называется вектор ¶ µ ∂f (M ) ∂f (M ) ,..., . (2.64) grad f (M ) = ∇f (M ) : = ∂x1 ∂xm Понятие градиента — одно из основных в теории функций нескольких переменных. Оно, в частности, позволяет записать дифференциал функции f через скалярное произведение: d f (M, ∆M ) = (grad f (M ), ∆M ). (2.65) Наряду с градиентом grad f (M ), полезно иногда говорить об антиградиенте (−grad f (M )). Важное свойство градиента рассмотрим в следующем пункте.
2.8
Производная функции нескольких переменных по направлению
Пусть ~s = (s1 , . . . , sm ) — единичный вектор в пространстве Rm . Определение 2.10. Производной функции (2.46) по направлению ~s в точке M0 называется конечный предел f (M0 + ρ~s) − f (M0 ) ∂f (M0 ) : = lim ∈ R. ρ→0 ∂~s ρ
(2.66)
Производная по направлению (2.66) характеризует скорость изменения функции в точке M0 по направлению вектора ~s. Если она положительна (отрицательна), то функция в точке M0 в данном направлении возрастает (убывает). Понятие производной функции по направлению — обобщение понятия ЧП-1. Дей∂f (M0 ) ∂f (M0 ) ствительно, если ~s — k-ый координатный орт: ~s = ~ek , то = . ∂~s ∂xk Теорема 2.8 Если функция (2.46) дифференцируема в точке M0 , то она имеет в этой точке производную по любому направлению ~s ∂f (M0 ) = (grad f (M0 ), ~s). ∂~s 53
(2.67)
Доказательство. Из дифференцируемости функции (2.46) в точке M0 в силу равенства (2.19) f (M0 + ∆M ) − f (M0 ) = d f (M0 , ∆M ) + o(ρ),
ρ → 0.
Выберем нужный вектор приращений ∆M = ρ~s : (2.65)
f (M0 + ρ~s) − f (M0 ) = d f (M0 , ρ~s) + o(ρ) = (grad f (M0 ), ρ~s) + o(ρ),
ρ → 0.
Отсюда
f (M0 + ρ~s) − f (M0 ) o(ρ) = (grad f (M0 ), ~s) + , ρ → 0. ρ ρ Переходя в равенстве (2.68) к пределу при ρ → 0 и учитывая, что lim
ρ→0
(2.68)
o(ρ) = 0, ρ
получаем равенство (2.67). Значит, производная по направлению (2.66) существует и определяется формулой (2.67). • Следствие 2.8. Если grad f (M0 ) 6= θ, то функция (2.46) в точке M0 имеет наибольшую, притом положительную производную по направлениию градиента, наименьшую, притом отрицательную производную по направлению антиградиента. Таким образом, скорость изменения функции в точке наибольшая (наименьшая) в направлении градиента (антиградиента) 3 . На этом свойстве градиента основаны численные методы поиска экстремума функции нескольких переменных, называемые градиентными. Мы сейчас рассмотрим аналитический способ нахождения экстремума.
2.9
Экстремумы функции нескольких переменных, необходимые условия экстремума
В теории экстремума будем рассматривать дифференцируемые функции нескольких переменных. Пусть M0 (x01 , . . . , x0m ) — внутренняя точка области определения D(f ) функции (2.46). Определение 2.11. Точка M0 называется точкой локального минимума функции (2.46), если существует такая ее окрестность U (M0 , δ), что ∀ M ∈ U (M0 , δ) f (M ) > f (M0 ).
(2.69)
Точка M0 называется точкой локального максимума функции (2.46), если существует такая ее окрестность U (M0 , δ), что ∀ M ∈ U (M0 , δ) f (M ) 6 f (M0 ).
(2.70)
Если при M 6= M0 неравенства в соотношениях (2.69), (2.70) строгие, то говорят о строгом локальном минимуме и о строгом локальном максимуме соответственно. Точки локального минимума и максимума функции называются точками ее локального экстремума. 3
Термин «градиент» принадлежит английскому физику Джеймсу Максвеллу (James Clerk Maxwell, 1831-1879), создателю математической теории электромагнитного поля, и происходит от латинского слова gradior — расти.
54
Эпитет «локальный» ради краткости будем опускать, но надо все время иметь в виду локальный характер этого свойства функции (2.46). Замечание 2.9. При переходе от функции f к функции (−f ) ее точки эстремума сохраняются, но точка минимума становится точкой максимума и наоборот. Неравенства в соотношениях (2.69), (2.70) можно записать через приращение ∆ f (M0 , ∆M ) функции (2.46) в точке M0 : ∆f (M0 , ∆M ) 6 0,
∆f (M0 , ∆M ) > 0.
Отсюда вытекает важное Замечание 2.10. Точка M0 является точкой минимума (максимума) функции (2.46) тогда и только тогда, когда приращение ∆f (M0 , ∆M ) при ∆M ∈ U (θ, δ) неотрицательно (неположительно). Точка M0 является точкой строгого минимума (строгого максимума) функции (2.46) тогда и только тогда, когда это приращение положительно ◦
(отрицательно) при ∆M ∈U (θ, δ). Теорема 2.9 (обобщенная теорема Ферма) Пусть M0 точка экстремума функции (2.46) и в ней существуют ЧП-1. Тогда ∂f (M0 ) ∂f (M0 ) = 0, . . . , = 0. ∂x1 ∂xm
(2.71)
Доказательство вытекает из теоремы Ферма для функций одной переменной [1, с. 168]. Пусть, ради определенности, M0 — точка минимума функции (2.46) и, стало быть, справедливо условие (2.69). Докажем, что ∂f (M0 ) = 0. ∂x1
(2.72)
Зафиксировав переменные x2 = x02 , . . . , xm = x0m , придем к функции одной переменной g(x1 ) : = f (x1 , x02 , . . . , x0m ). Из (2.69) получаем, в частности, что ∀ x1 ∈ (x01 − δ, x01 + δ) g(x1 ) > g(x01 ). Но это означает по определению, что x01 — точка минимума функции g(x1 ). Так как существует ∂f (M0 ) , g 0 (x01 ) = ∂x1 то по теореме Ферма g 0 (x01 ) = 0, что и означает выполнение условия (2.72). Проверка остальных равенств системы (2.71) проводится аналогично. • Следствие 2.9. (геометрический смысл теоремы при m = 2). Если M0 (x0 , y0 ) — точка экстремума функции z = f (x, y), дифференцируемой в этой точке, то касательная плоскость к графику функции в точке (x0 , y0 , f (x0 , y0 )) параллельна плоскости xOy. • Доказательство. Так как fx0 (M0 ) = fy0 (M0 ) = 0, то уравнение (2.29) касательной плоскости записывается в виде z = f (x0 , y0 ). Замечание 2.11. Необходимые условия (2.71) не являются достаточными условиями экстремума. Обоснуем это, рассмотрев следующий Пример 2.5. Пусть f (x, y) = xy. Тогда fx0 = y, fy0 = x. Система (2.71) имеет единственное решение x0 = y0 = 0. Но в точке θ = (0, 0) нет экстремума функции, поскольку при xy > 0 f (x, y) > f (0, 0) = 0, а при xy < 0 f (x, y < f (0, 0)) и в 55
любой окрестности точки θ ни одно из условий (2.69), (2.70) не выполнено. Так как рассматриваемая функция всюду имеет ЧП-1, то по доказанной теореме она не имеет точек экстремума. • Определение 2.12. Внутренняя точка M0 (x01 , . . . , x0m ) области определения D(f ) функции (2.46), являющаяся решением системы ∂ f (x1 , . . . , xm ) = 0, ∂x1 ... ................ (2.73) ∂ f (x , . . . , x ) 1 m = 0, ∂xm называется стационарной точкой функции. Замечание 2.12. Систему (2.73) можно записать одним векторным равенством grad f (M ) = θ.
(2.74)
Если функция (2.46) всюду имеет ЧП-1, то из теоремы 2.9 следует, что все ее точки экстремума содержатся среди стационарных точек. В силу замечания 2.11 каждую стационарную точку надлежит подвергнуть дальнейшему исследованию посредством достаточных условий экстремума.
2.10
Достаточные условия экстремума
При доказательстве сформулированных ниже достаточных условий экстремума функции (2.46) основную роль играет проверка знака ее второго дифференциала d2 f (M, ∆M ), являющегося квадратичной формой относительно ∆x1 , . . . , ∆xm . Поэтому предварительно напомним аппарат изучения квадратичных форм. Квадратичная форма (однородный многочлен второй степени) относительно переменных h1 , . . . , hm представима в виде P2 (H) = P2 (h1 , . . . , hm ) =
m X
ai,j hi hj .
(2.75)
i,j=1
Она полностью определяется матрицей квадратичной формы (2.75) a11 a12 . . . a1m a21 a22 . . . a2m A = (aij ) = ... ... ... ... . am1 am2 . . . amm A — квадратная матрица порядка m, она является симметричной (aij = aji ). Для любой квадратичной формы P2 (0, . . . , 0) = P2 (θ) = 0. Определение 2.13. Матрица A квадратичной формы (2.75) называется 1) положительно определенной, если ∀ H 6= θ
P2 (H) > 0;
2) отрицательно определенной, если ∀ H 6= θ
P2 (H) < 0; 56
3) знакопеременной, если квадратичная форма P2 (H) принимает как положительные, так и отрицательные значения. Замечание 2.13. Квадратичная форма с матрицей A отрицательно определена тогда и только тогда, когда квадратичная форма с матрицей (−A) положительно определена. Рассмотрим главные миноры ¯ ¯ ¯ a11 a12 . . . a1k ¯ ¯ ¯ ¯ a21 a22 . . . a2k ¯ ¯ (1 6 k 6 m) dk = ¯¯ ¯ ¯ ... ... ... ... ¯ ¯ ak1 ak2 . . . akk ¯ матрицы A. При этом d1 = a11 , dm = detA. Замечание 2.14. Главный минор k-ого порядка матрицы (−A) определяется формулой (−1)k dk . Задание 2.9. Доказать замечание, опираясь на соответствующее свойство определителя. Приведем без доказательства следующую теорему [1, с. 300]. Теорема 2.10 (критерий Сильвестра) Матрица квадратичной формы положительно определена тогда и только тогда, когда все ее главные миноры положительны. Рассмотрим теперь квадратичную форму (2.75), матрица которой составлена из частных производных второго порядка функции (2.46): µ 2 ¶ ∂ f (M ) A(M ) : = . (2.76) ∂xi ∂xj Элементы матрицы (2.76) — функции m переменных x1 , . . . , xm . Лемма 2.2 Пусть функция (2.46) принадлежит классу C (2) (G), где G ⊂ Rm — открытое множество, и матрица (2.76) положительно определена в точке M0 ∈ G. Тогда существует окрестность U (M0 , δ) точки M0 такая, что матрица A(M ) положительно определена при M ∈ U (M0 , δ). Доказательство. Из положительной определенности матрицы A(M0 ) и из критерия Сильвестра следует положительность ее главных миноров: dk (M0 ) > 0 (1 6 k 6 m). Так как функции dk (M ) определяются через арифметические операции над ЧП-2 функции (2.46), которые непрерывны на множестве G, то и сами функции dk (M ) непрерывны на G. Поэтому по замечанию 1.15 ∃δk > 0 ∀ M ∈ U (M0 , δk ) dk (M ) > 0. Выберем δ : = min{δk }, тогда ∀ M ∈ U (M0 , δ) dk (M ) > 0. Снова применяя критерий Сильвестра, убеждаемся в положительной определенности матрицы A(M ) в каждой точке M ∈ U (M0 , δ). • 57
Теорема 2.11 (достаточное условие строгого экстремума) Пусть M0 — стационарная точка функции (2.46) и функция в некоторой окрестности точки M0 принадлежит классу C (2) . Тогда, 1) если A(M0 ) — положительно определенная матрица, то M0 — точка строгого минимума функции f ; 2) если матрица A(M0 ) отрицательно определена, то M0 — точка строгого максимума функции; 3) если A(M0 ) — знакопеременная матрица, то M0 не является точкой экстремума функции f. Доказательство вытекает из формулы Тейлора (2.52) при n = 1 : ∆ f (M0 , ∆M ) = d f (M0 , ∆M ) +
1 2 d f (M0 + θ∆M, ∆M ), 2
0 < θ < 1.
(2.77)
Равенство (2.77) справедливо в каждой точке M той окрестности точки M0 , о которой шла речь в формулировке теоремы. Так как M0 — стационарная точка функции, то в ней все ее ЧП-1 обращаются в нуль и поэтому d f (M0 , ∆M ) = 0. Напомним, что второй дифференциал функции в каждой точке M рассматриваемой окрестности есть квадратичная форма относительно приращений ∆x1 , . . . , ∆xm с матрицей A(M ) : m X ∂ 2 f (M ) d f (M ) = ∆xi ∆xj . ∂xi ∂xj i,j=1 2
Поэтому равенство (2.77) преобразуется к виду m 1 X ∂f (M0 + θ∆M ) ∆ f (M0 , ∆M ) = ∆xi ∆xj . 2 i,j=1 ∂xi ∂xj
(2.78)
1) Пусть матрица A(M0 ) положительно определена. В силу леммы 2.2 найдется такое число δ > 0, что при M ∈ U (M0 , δ) матрица A(M ) также положительно определена. Если M0 + ∆M ∈ U (M0 , δ), то отрезок [M0 M ] ⊂ U (M0 , δ) и поэтому точка M0 + θ∆M ∈ U (M0 , δ). Значит, и матрица A(M0 + θ∆M ) положительно определена, но тогда из (2.78) следует, что ◦
∀ ∆M ∈ U (M0 , δ) ∆f (M0 , ∆M ) > 0. Поэтому в силу замечания 2.10 M0 — точка строгого минимума функции f. 2) Если матрица A(M0 ) отрицательно определена, то матрица (−A(M0 )), построенная для функции (−f ), положительно определена, тогда по замечанию 2.9 и в силу доказанного в утверждении 1) M0 — точка строгого минимума функции (−f ) и точка строгого максимума функции f. 3) Пусть A(M0 ) — знакопеременная матрица. Тогда существуют такие векторы приращений ∆M1 , ∆M2 , что d2 f (M0 , ∆M1 ) > 0, d2 f (M0 , ∆M2 ) < 0. Введем функции m переменных x1 , . . . , xm g1 (M ) : = d2 f (M, ∆M1 ), g2 (M ) : = d2 f (M, ∆M2 ). 58
(2.79)
Так как они непрерывны в рассматриваемой окрестности точки M0 , а (2.79)
g1 (M0 ) = d2 f (M0 , ∆M1 ) > то
в
силу
замечания
1.15
существует
0,
число
g2 (M0 ) < 0, δ
>
0
такое,
что
при (2.78)
M ∈ U (M0 , δ) g1 (M ) > 0, g2 (M ) < 0. Поэтому ∀ ∆M ∈ U (θ, δ) ∆f (M0 , ∆M1 ) = 1 2 d f (M0 + θ∆M1 , ∆M1 ) > 0, ∆f (M0 , ∆M2 ) = 12 d2 f (M0 + θ∆M2 , ∆M2 ) < 0 и, стало 2 быть, в точке M0 не выполнены условия определения 2.11 точки экстремума. • Следствие 2.10. (достаточные условия строгого экстремума функции двух переменных). Пусть M0 (x0 , y0 )— стационарная точка функции z = f (x, y). Построим новую функцию ¶2 µ 2 ∂ 2 f (x, y) ∂ 2 f (x, y) ∂ f (x, y) . ∆(x, y) = detA(x, y) = − ∂x2 ∂y 2 ∂x ∂y 1) Если ∆(M0 ) > 0, то M0 — точка строгого экстремума функции: строгого мини∂ 2 f (M0 ) ∂ 2 f (M0 ) мума при > 0 и строгого максимума при < 0. ∂x2 ∂x2 2) Если ∆(M0 ) < 0, то в точке M0 нет экстремума функции f. Доказательство. Из критерия Сильвестра и замечания 2.14 вытекают такие необходимые и достаточные условия положительной (отрицательной) определенности матрицы A(M0 ) в случае m = 2 : d1 (M0 ) > 0, d2 (M0 ) > 0 (d1 (M0 ) < 0, d2 (M0 ) > 0). При этом d2 (M ) = det A(M ), d1 (M ) =
2.11
∂ 2 f (M ) . • ∂x2
Нахождение наименьшего и наибольшего значений функции нескольких переменных на компактном множестве
Задача нахождения экстремумов функции нескольких переменных (2.46) — задача ее локального исследования. Но в математике и ее приложениях часто возникают глобальные экстремальные задачи, связанные с нахождением наименьшего и/или наибольшего значений функции (2.46), стесненной некоторыми ограничениями. Названные ограничения могут быть различной структуры. Сейчас рассмотрим случай, когда ограничения накладываются на множество, где рассматривается функция. Задача. Найти наименьшее и наибольшее значение функции (2.46) на множестве G ⊂ D(f ) ⊂ Rm . Если множество G компактно, а функция дифференцируема на G, то задача имеет единственное решение. Так как дифференцируемая на множестве G функция (2.46) непрерывна на нем, то в силу компактности G по обобщенной теореме Вейерштрасса 1.21, с. 31 она принимает на G наименьшее значение k и наибольшее значение K. Укажем целесообразный путь их нахождения. 1) Вычисляют значения функции (2.46) в ее стационарных точках, находящихся внутри множества G. 59
2) Вычисляют наименьшее и наибольшее значения функции на границе ∂G множества G. 3) Среди чисел, найденных в пунктах 1), 2), выделяют наименьшее k и наибольшее K. В пункте 2) дело часто сводится к нахождению наименьшего и наибольшего значения некоторых функций одной переменной на отрезках. Такая задача решается в рамках темы «Дифференциальное исчисление функций одной переменной».
2.12
Неявные функции
Рассмотрим важный способ задания функции y = f (x) посредством уравнения F (x, y) = θ.
(2.80)
Определение 2.14. Пусть задана функция F : X × Y → Z, где X ⊂ Rm , Y ⊂ Rn , Z ⊂ Rn (m, n ∈ N), причем θ ∈ Z, здесь θ — нуль пространства Rn . Если существуют такие непустые множества D ⊂ X, E ⊂ Y, что при каждом x ∈ D уравнение (2.80) имеет единственное решение y = f (x) ∈ E, то говорят, что уравнение (2.80) определяет неявную функцию y = f (x), x ∈ D, y ∈ E.
(2.81)
∀x ∈ D
(2.82)
При этом F (x, f (x)) = θ
или, что то же самое, ∀(x, y) ∈ D × E
(F (x, f (x)) = θ ⇔ y = f (x)).
(2.83)
Нас будет интересовать локальная задача существования неявной функции в окрестности точки (x0 , y0 ), удовлетворяющей уравнению (2.80), а также способ ее дифференцирования.
2.12.1
Неявные функции одной и нескольких переменных
Рассмотрим вначале простейший случай m = n = 1. Тогда x, y — вещественные числа, а уравнение (2.80) принимает вид F (x, y) = 0.
(2.84)
Геометрический смысл неявной функции одной переменной. Уравнение (2.84) задает на плоскости множество Γ, во многих случаях это – некоторая кривая. Пусть F (x0 , y0 ) = 0, то есть точка M0 (x0 , y0 ) ∈ Γ. Уравнение (2.84) определяет в некоторой окрестности точки M0 единственную неявную функцию тогда и только тогда, когда часть кривой Γ, лежащая в этой окрестности, является графиком функции. Теорема 2.12 (существования дифференцируемой неявной функции) Пусть X = U (x0 , a), Y = U (y0 , b) (a, b > 0), 60
1) функция F (x, y) является гладкой на множестве X × Y, 2) F (x0 , y0 ) = 0, 3) Fy0 (x0 , y0 ) 6= 0. Тогда существуют множества D = U (x0 , δ), E = [y0 − h, y0 + h] (0 < δ 6 a, 0 < h < b) такие, что при x ∈ D уравнение (2.84) определяет единственную неявную функцию (2.81), удовлетворяющую условию f (x0 ) = y0 . Неявная функция имеет на множестве D непрерывную производную F 0 (x, y) f 0 (x) = − x0 . (2.85) Fy (x, y) Доказательство. Уточняя условие 3) теоремы, будем предполагать, что Fy0 (x0 , y0 ) > 0.
(2.86)
I. Существование неявной функции. Так как функция Fy0 в силу условия 1) непрерывна на X × Y, то по замечанию 1.15 из (2.86) следует существование квадрата K = [x0 − h, x0 + h] × [y0 − h, y0 + h] ⊂ X × Y с центром в точке M0 такого, что ∀ (x, y) ∈ K
Fy0 (x, y) > 0.
(2.87)
Зафиксировав произвольно x ∈ [x0 − h, x0 + h], рассмотрим функцию от y F (x, y), y ∈ [y0 − h, y0 + h].
(2.88)
(2.87)
Поскольку ее производная Fy0 (x, y) > 0 при y ∈ [y0 − h, y0 + h], то функция (2.88) строго возрастает. В частности, является строго возрастающей на отрезке [y0 − h, y0 + h] 2)
и функция F (x0 , y). Так как F (x0 , y0 ) = 0, то F (x0 , y) < 0 при y ∈ [y0 − h, y0 ),
F (x0 , y) > 0 при y ∈ (y0 , y0 + h].
Поэтому F (x0 , y0 − h) < 0,
F (x0 , y0 + h) > 0.
(2.89)
Рассмотрим теперь функции переменного x ∈ [x0 −h, x0 +h] F (x, y0 −h), F (x, y0 +h). Они непрерывны на отрезке [x0 − h, x0 + h] и, согласно (2.89), при x = x0 принимают отрицательное и положительное значения соответственно. В силу замечания 1.15 существует число δ > 0 такое, что на интервале D = (x0 − δ, x0 + δ) они сохраняют тот же знак: ∀ x ∈ D F (x, y0 − δ) < 0, F (x, y0 + δ) > 0. (2.90) Докажем, что на множестве D уравнение (2.84) определяет единственную неявную функцию. Выберем произвольную точку x ∈ D. Функция (2.88) непрерывна, строго возрастает на отрезке E = [y0 − h, y0 + h] и, согласно (2.90), при y = y0 − h, y = y0 + h принимает отрицательное и положительное значения соответственно. По теореме Больцано-Коши [1, с. 126] она принимает в некоторой точке y ∈ E нулевое значение, причем в силу строгого возрастания функции точка y единственна. Таким образом, ∀x ∈ D ∃!y ∈ E 61
F (x, y) = 0.
Существование единственной неявной функции (2.81) доказано. II. Непрерывность и непрерывная дифференцируемость неявной функции. Докажем непрерывность и дифференцируемость неявной функции в произвольной точке x ∈ D. Выберем приращение ∆x такое, что x + ∆x ∈ D. Пусть f (x) = y, f (x + ∆x) = y + ∆y, при этом F (x, y) = 0, F (x + ∆x, y + ∆y) = 0. Поэтому приращение функции F в точке (x, y) F (x+∆x, y +∆y)−F (x, y) равно нулю. С другой стороны, по обобщенной формуле Лагранжа (2.57) F (x+∆x, y+∆y)−F (x, y) = Fx0 (x+θ∆x, y+θ∆y)∆x+Fy0 (x+θ∆x, y+θ∆y)∆y,
0 < θ < 1.
Поэтому Fx0 (x + θ∆x, y + θ∆y)∆x + Fy0 (x + θ∆x, y + θ∆y)∆y = 0, откуда
∆y F 0 (x + θ∆x, y + θ∆y) = − x0 , ∆x Fy (x + θ∆x, y + θ∆y) ∆y = −
Fx0 (x + θ∆x, y + θ∆y) ∆x. Fy0 (x + θ∆x, y + θ∆y)
(2.91) (2.92)
Докажем, исходя из формулы (2.92), что lim ∆y = 0,
∆x→0
откуда будет следовать непрерывность неявной функции (почему?). Для этого, согласно теореме 1.11,6), достаточно проверить ограниченность функции Fx0 (x, y) Fy0 (x, y)
(2.93)
на множестве K. Так как на этом множестве функции Fx0 (x, y), Fy0 (x, y) непрерывны, а Fy0 (x, y) 6= 0, то и функция (2.93) на K непрерывна и в силу компактности множества K по обобщенной теореме Вейерштрасса 1.21 ограничена. Убедимся теперь по определению, что неявная функция имеет в точке x производную. Докажем возможность перехода к пределу в равенстве (2.91) при ∆x → 0. Так как lim (x + θ∆x, y + θ∆y) = (x, y), ∆x→0
то в силу непрерывности функций Fx0 , Fy0 на множестве K lim Fx0 (x + θ∆x, y + θ∆y) = Fx0 (x, y), lim Fy0 (x + θ∆x, y + θ∆y) = Fy0 (x, y) 6= 0
∆x→0
и поэтому существует
∆x→0
F 0 (x, y) ∆y = − x0 . ∆x→0 ∆x Fx (x, y) lim
Тем самым существование производной неявной функции на множестве D и формула (2.85) доказаны. 62
В правой части формулы (2.85) символом y обозначено значение в точке x неявной функции (2.81): F 0 (x, f (x)) . (2.94) ∀ x ∈ D f 0 (x) = − x0 Fy (x, f (x)) Из этой формулы, непрерывности на множестве D функций Fx0 (x, f (x))), Fy0 (x, f (x)) и положительности последней функции вытекает непрерывность функции f 0 (x) на множестве D. • Замечание 2.15. Теорема лишь доказывает существование неявной функции, но не дает способа ее нахождения. Неявная функция может и не быть элементарной. Приведем исторический пример. Уравнение Кеплера (1609) 4 y − e sin y − x = 0 (0 < e < 1) играет важную роль в нахождении эллиптических орбит планет. Оно определяет неявную функцию y = f (x). Действительно, теперь F (x, y) = y − e sin y − x и Fy0 = 1 − e cos y 6= 0. Однако функция f (x), определяемая уравнением Кеплера, не является элементарной. Эта функция играет важную роль в астрономии, ее представляют в виде суммы функционального ряда. Замечание 2.16. (дифференцирование неявной функции). Для нахождения производной неявной функции удобнее, вместо прямого применения формулы (2.85), дифференцировать уравнение (2.84) по x, считая y функцией от x : F (x, y(x)) = 0, Fx0 + Fy0 · y 0 = 0, y 0 = −
Fx0 . Fy0
Пришли снова к формуле (2.85). Пример 2.6. Найти производную функции, неявно заданной уравнением x2 ln y = y 2 ln x. Дифференцируем его по x в предположении y = y(x) : 2x ln y + x2 ·
y0 1 y(2x2 ln y − y 2 ) = 2yy 0 ln x + y 2 · , y 0 = . y x x(2y 2 ln x − x2 )
Замечание 2.17. Если в формулировке теоремы условие 3) заменить условием Fx0 (M0 ) 6= 0, то в некоторой окрестности точки M0 уравнение (2.84) будет определять единственную неявную функцию от y x = g(y). Следствие 2.11. (существование дифференцируемой неявной функции нескольких переменных) Теорема 2.12 обобщается на случай m > 1, теперь x = (x1 , . . . , xm ), при этом рассматривается кубическая окрестность точки x0 : U (x0 , a) = UC (x0 , a). Последнее предложение в формулировке теоремы теперь звучит так. Неявная функция является гладкой на множестве D и ее ЧП-1 вычисляются по формулам Fx0 (x, y) ∂f (x) (1 6 k 6 m). = − 0k ∂xk Fy (x, y) 4
Иоганн Кеплер (Johann Kepler, 1571-1630) – немецкий астроном и математик, открывший законы движения планет.
63
2.12.2
Системы неявных функции нескольких переменных
Рассмотрим, наконец, неявные функции общего вида (m > 1, n > 1). Предварительно введем некоторые понятия, связанные с функциями (отображениями) y = f (x), x ∈ D ⊂ Rm , y ∈ Rn .
(2.95)
Так как ∀x ∈ D
f (x) ∈ Rn ,
то f (x) = (f1 (x), . . . , fn (x));
(2.96)
здесь fi (x) = fi (x1 , . . . , xm ) (1 6 i 6 n) — функции m переменных, называемые координатными функциями отбражения (2.95). Если fi (x) ∈ C (k) (G), 1 6 i 6 n, G ⊂ D, то будем говорить, что f ∈ C (k) (G). В частности, при k = 1 отображение f называется гладким на G. Введем матрицу Якоби гладкого отображения f ∂f (x) ∂f (x) ∂f1 (x) 1 1 . . . ∂x2 ∂xm 1 µ ¶ ∂f∂x ∂f2 (x) ∂f2 (x) 2 (x) ∂fi (x) . . . ∂x ∂x2 ∂xm J = Jf (x) : = = 1 (2.97) . ∂xj ... ... ... ... ∂fn (x) ∂fn (x) (x) . . . ∂f∂xn m ∂x1 ∂x2 Она состоит из n строк и m столбцов, ее строки составлены из градиентов координатных функций fi отображения f. Если m = n, то матрица Якоби становится квадратной. Ее определитель называется якобианом системы функций f1 , . . . , fn D(f1 , . . . , fn ) : = detJ. D(x1 , . . . , xn )
(2.98)
Якобиан является обобщением производной функции одной переменной на случай системы n функций n переменных (2.96). Действительно, при n = 1 якобиан упрощается df (x) и становится равным . dx Однако, согласно определению 2.14, мы рассматриваем функцию F : X × Y → Z, то есть отображение F (x, y) = (F1 (x, y), . . . , Fn (x, y)) с координатными функциями Fi (x, y) = Fi (x1 , . . . , xm , y1 , . . . , yn ) (1 6 i 6 n), каждая из которых является функцией m + n переменных.
64
Теорема 2.13 Пусть X = UC (x0 , a) ⊂ Rm , Y = UC (y0 , b) ⊂ Rn
(a, b > 0),
1) функция F (x, y) является гладкой на множестве X × Y, 2) F (x0 , y0 ) = θ, 3) в точке (x0 , y0 ) D(F1 , . . . , Fn ) 6= 0. D(y1 , . . . , yn ) Тогда существуют множества D = UC (x0 , δ), E = UC (y0 , h) (0 < δ 6 a, 0 < h 6 b) такие, что при x ∈ D уравнение (2.84) определяет единственную неявную функцию (2.81), удовлетворяющую условию f (x0 ) = y0 и гладкую на множестве D. Доказательство может быть проведено методом математической индукции по числу n [1, с. 312-315]. Другое доказательство теоремы см. в [7, с. 139-141].
2.13
Условные экстремумы
Кратко рассмотрим важную для приложений задачу нахождения точек (локального) экстремума функции (2.46) при выполнении условий типа равенств ϕ1 (x1 , . . . , xm ) = 0, . . . , ϕn (x1 , . . . , xm ) = 0 (1 6 n < m).
(2.99)
Определение 2.15. Множество Ω ⊂ Rm решений системы (2.99) называется многообразием, порожденным функциями ϕ1 , . . . , ϕn . Многообразие Ω называют невырожденным, если матрица Якоби µ ¶ ∂ϕi (M ) J= (2.100) ∂xj имеет в каждой точке M ∈ Ω максимальный ранг n. Определение 2.16. Пусть M0 ∈ Ω. Говорят, что функция (2.46) имеет в точке M0 условный минимум (максимум) на многообразии Ω, если существует такое число δ > 0, что ∀ M ∈ U (M0 , δ) ∩ Ω f (M ) > f (M0 ) (f (M ) 6 f (M0 )). Если же при M 6= M0 неравенства строгие, то приходим к строгому условному минимуму (строгому условному максимуму). Пусть M0 — точка условного экстремума. Поскольку многообразие Ω невырожденное, то существует минор n-го порядка матрицы Якоби (2.100), отличный в точке M0 от нуля. Пусть это якобиан D(ϕ1 , ϕ2 , . . . , ϕn ) (M0 ) 6= 0. D(xm−n+1 , xm−n+2 , . . . , xm )
(2.101)
Введем обозначения x : = (x1 , . . . , xm−n ) ∈ Rm−n , y : = (xm−n+1 , . . . , xm ) ∈ Rn , тогда M = (x, y). Систему уравнений (2.99) можно записать кратко одним уравнением ϕ(x, y) = θ, 65
(2.102)
где ϕ = (ϕ1 , . . . , ϕn ). Из (2.101) и теоремы 2.13 в окрестности точки x0 уравнение (2.102) определяет единственную неявную функцию y = g(x). При этом для каждой точки названной окрестности, принадлежащей многообразию Ω, исходная функция преобразуется в сложную функцию m − n переменных: f (M )|Ω = f (x, y)|Ω = f (x, g(x)). Поэтому возможны два пути решения рассматриваемой задачи на условный экстремум. 1) В простых случаях, когда уравнение (2.102) явно разрешимо относительно x и мы сможем работать аналитически с функцией f (x, g(x)), дело сводится к нахождению точек экстремума этой функции меньшего числа переменных. 2) К сожалению, подход 1) применим далеко не всегда: неявную функцию g(x), существование которой доказано, часто явным образом получить не удается. В этом, общем случае применяется метод множителей Лагранжа, сводящий задачу на условный экстремум к задаче на безусловный экстремум функции Лагранжа L(M, λ) = L(x1 , . . . , xm , λ1 , . . . , λn ) : = f + λ1 ϕ1 + · · · + λn ϕn .
(2.103)
Теорема 2.14 (необходимые условия условного экстремума) Пусть M0 — точка условного экстремума функции (2.46) на невырожденном многообразии Ω. Тогда существует такой набор множителей Лагранжа λ0 = (λ01 , . . . , λ0n ), что (M0 , λ0 ) — критическая точка функции Лагранжа L(M, λ). Доказательство этой теоремы мы опускаем [1, с. 321-323]. Следствие 2.12. Для нахождения m+n неизвестных величин x1 , . . . , xm , λ1 , . . . , λn имеем систему также из m + n уравнений (2.99), ∂L(M, λ) = 0, ∂xi
1 6 i 6 m.
(2.104)
Замечание 2.18. Как и в теории безусловного экстремума, знак ∆L(M0 , λ0 ) совпадает со знаком второго дифференциала функции Лагранжа d2 L(M0 , λ0 ).
(2.105)
Поэтому достаточным условием условного экстремума является определенность (положительная или отрицательная) квадратичной формы (2.105). В ней учитываются связи между дифференциалами переменных x1 , . . . , xm , которые находятся дифференцированием равенств (2.99).
66
Глава 3 Кратные интегралы Теперь переходим к изучению раздела «Интегральное исчисление функций нескольких переменных». В главах 3,4 построим различные обобщения определенных интегралов — кратные (в частности, двойные и тройные) интегралы, криволинейные интегралы, установим связь между ними. Все эти типы интегралов вводятся как пределы соответствующих интегральных сумм. Укажем важные приложения построенной теории в математике и физике. Напомним определение и условия существования определенного интеграла (Римана). Для функции одной переменной f (x), определенной на отрезке [a, b], вводится разбиение τ отрезка [a, b] на n ∈ N частичных отрезков [xi−1 , xi ] : τ : [a, b] =
n [
[xi−1 , xi ].
i=1
Оно производится точками x1 , . . . , xn−1 такими, что a = x0 < x1 < ... < xi−1 < xi < ... < xn−1 < xn = b. Ранг λτ разбиения τ есть наибольшая из длин ∆xi = xi − xi−1 всех частичных отрезков. Каждому разбиению τ (в случае ограниченности функции f ) отвечает нижняя сумма Дарбу sτ (f ) и верхняя сумма Дарбу Sτ (f ) sτ (f ) =
n X
mi · ∆xi , Sτ (f ) =
i=1
n X
Mi · ∆xi .
i=1
Здесь mi :=
inf
x∈[xi−1 ,xi ]
f (x), Mi :=
sup
f (x).
x∈[xi−1 ,xi ]
Для введения интегральной суммы нужно выбрать произвольно на каждом частичном отрезке [xi−1 , xi ] точку ξi , тогда στ,ξ (f ) =
n X
f (ξi )∆xi .
i=1
Интеграл Римана функции f на отрезке [a, b] определяется как конечный предел ее интегральных сумм при λτ → 0 : Zb f (x)dx := lim στ,ξ (f ) ∈ R. λτ →0
a
67
В этом случае функция f называется интегрируемой (по Риману) на отрезке [a, b.] В курсе математического анализа ранее доказано следующее необходимое условие интегрируемости: если функция f интегрируема на отрезке [a, b], то она ограничена на нем. Для выделения достаточных условий интегрируемости используется аппарат сумм Дарбу. Выясняется, что нижняя сумма Дарбу sτ (f ) и верхняя сумма Дарбу Sτ (f ) являются точными границами множества {στ,ξ (f )}τ интегральных сумм с фиксированным разбиением τ. Кроме того, множество нижних сумм Дарбу {sτ (f )} функции f расположено на числовой прямой левее множества ее верхних сумм Дарбу {Sτ (f )}. Доказывается следующий Критерий интегрируемости. Функция f интегрирума на отрезке [a, b] тогда и только тогда, когда lim (Sτ (f ) − sτ (f )) = 0 ⇔ λτ →0
∀ε > 0 ∃δ > 0 ∀τ
(λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε).
Этот критерий позволил установить следующие достаточные условия интегрируемости функции на отрезке: 1) непрерывность, 2) монотонность.
3.1
Квадрируемые фигуры
Несколько углубим теорию квадрируемости и кубируемости, построенную ранее. Напомним, что плоская фигура P называется квадрируемой (измеримой по Жордану), если ее верхняя площадь s∗ (P ) и нижняя площадь s∗ (P ) совпадают, при этом площадь фигуры есть их общее значение: s(P ) : = s∗ (P ) = s∗ (P ). Здесь s∗ (P ) = sup AP ,
s∗ (P ) = inf BP .
Множество AP состоит из площадей многоугольников q ⊂ P, а множество BP — из площадей многоугольников Q ⊃ P. Вырожденный многоугольник — точка; его площадь равна нулю. Невырожденный многоугольник — замкнутое множество, ограниченное одной или несколькими замкнутыми ломаными; его площадь есть сумма площадей треугольников, на которые он разбивается. В теории кратных интегралов часто будем рассматривать компактные множества пространств Rm , то есть ограниченные замкнутые множества. Установим связь между квадрируемостью плоского множества P ⊂ R2 и площадью его границы ∂P . Определение 3.1. Плоская кривая L называется кривой нулевой площади, если для любого числа ε > 0 найдется такой многоугольник r ⊃ L, что s(r) < ε. Замечание 3.1. Объединение конечного числа кривых нулевой площади есть также кривая нулевой площади. Теорема 3.1 1) Если функция y = f (x) непрерывна на отрезке [a, b], то ее график — кривая нулевой площади. 2) Если функция x = g(y) непрерывна на отрезке [c, d], то ее график — кривая нулевой площади. Доказательство вытекает из критерия интегрируемости функции через суммы Дарбу. Проведем его для утверждения 1) теоремы. Напомним. что график Γf функции f Γf : = {(x, y)|x ∈ [a, b], y = f (x)}. 68
Зафиксируем произвольно положительное число ε. Так как функция f непрерывна на отрезке [a, b], то она на нем интегрируема. Как вытекает из критерия интегрируемости, для выбранного ε найдется такое число δ > 0, что при любом разбиении τ отрезка с условием λτ < δ Sτ − sτ < ε. Выберем любое разбиение τ с рангом λτ < δ. Но разность n X Sτ − sτ = (Mi − mi )∆xi i=1
есть площадь s(r) многоугольника r ⊃ Γf , составленного из прямоугольников с длинами оснований ∆xi и высотами Mi −mi . Поэтому s(r) < ε и для кривой Γf выполнено условие определения 3.1. • Следствие 3.1. Если граница ∂P множества P ⊂ R2 состоит из конечного числа кривых, указанных в теореме 3.1, то она имеет нулевую площадь. Теорема 3.2 Компактное множество P ⊂ R2 квадрируемо тогда и только тогда, когда его граница L = ∂P имеет нулевую площадь. Доказательство опирается на критерий квадрируемости. 1) Пусть компактное плоское множество P квадрируемо. Зададимся произвольно числом ε > 0. По критерию квадрируемости существуют такие многоугольники q, Q, что q ⊂ P ⊂ Q и s(Q) − s(q) < ε. (3.1) Многоугольник Q, содержащий многоугольник q, можно представить в виде объединения многоугольников q, r, не имеющих общих внутренних точек, причем ∂P ⊂ r. По свойству аддитивности площади s(Q) = s(q) + s(r), но тогда из неравенства (3.1) следует, что s(r) < ε. Это и означает по определению 3.1, что кривая ∂P имеет нулевую площадь. 2) Пусть теперь, наоборот, для кривой ∂P выполнено условие определения 3.1. Выберем произвольно число ε > 0 и найдем такой многоугольник r ⊃ ∂P, что s(r) < ε.
(3.2)
При этом можем считать, что этот многоугольник не покрывает всей фигуры P . Тогда из точек множества P, не содержащихся в r, образуется некоторое непустое открытое множество. Присоединяя к нему граничные точки, получим многоугольник q такой, что q ∪ r = Q, q ⊂ P ⊂ Q. Тогда s(Q) = s(q) + s(r). Поэтому из неравенства (3.2) следует, что s(r) = s(Q) − s(q) < ε. • В теории двойных интегралов будем рассматривать лишь компактные множества, границы которых имеют нулевую площадь. В силу теоремы 3.2 они квадрируемы.
3.2
Определение двойного интеграла
Пусть функция двух переменных f (x, y) определена на компактном квадрируемом множестве P ⊂ R2 .
69
Определение 3.2. Разбиением τ компактного множества P называется его представление в виде такого объединения конечного числа квадрируемых компактных множеств n [ τ: P = Pi , i=1
что различные множества Pi не имеют общих внутренних точек. Компактные множества Pi назовем ячейками разбиения τ. Строить разбиение τ удобно посредством выделения на множестве P нескольких кривых нулевой площади. При этом по свойству аддитивности площади n X
s(P ) =
s(Pi );
(3.3)
i=1
предполагается, что s(P ) > 0, s(Pi ) > 0. Определение 3.3. Пусть (X, ρ) — метрическое пространство, множество A ⊂ X ограничено. Диаметром d(A) множества A называется число d(A) : = sup ρ(x, x0 ). x,x0 ∈A
Расстоянием между множествами B ⊂ X, C ⊂ X называется число ρ(B, C) : =
inf
x∈B,y∈C
ρ(x, y).
Определение 3.4. Рангом λτ разбиения τ называется наибольший из диаметров его ячеек: λτ : = max d(Pi ). Выбрав в каждой ячейке Pi произвольным образом точку Mi (ξi , ηi ), составляем интегральную сумму функции f στ,Mi (f ) = σ :=
n X
f (Mi ) · s(Pi ).
i=1
Она определяется разбиением τ и набором {Mi } отмеченных точек Mi , что и выражено в ее полном обозначении. Определение 3.5. Говорят, что существует конечный предел I интегральных сумм στ,Mi (f ) при λτ → 0, если для любого положительного числа ε найдется такое положительное число δ, что для всякого разбиения τ такого, что λτ < δ, независимо от выбора отмеченных точек справедливо неравенство |στ,Mi (f ) − I| < ε, то есть ∀ ε > 0 ∃ δ > 0 ∀τ
(λτ < δ ⇒ |στ,Mi (f ) − I| < ε).
(3.4)
Смысл определения: все интегральные суммы, отвечающие любому разбиению с достаточно малым рангом, отличаются от числа I сколь угодно мало. Определение 3.6. (основное определение). Если существует конечный предел I интегральных сумм функции f (x, y) на множестве P при λτ → 0, то функцию называют интегрируемой (по Риману) на множестве P, а числоRR I называют двойным интегралом функции f на множестве P и обозначают символом f (x, y) dx dy : P
ZZ
f (x, y) dx dy := lim στ,Mi (f ) ∈ R. λτ →0
P
70
(3.5)
Сразу же сможем вычислить важный двойной интеграл. Пусть f (x, y) = 1, P — любое (квадрируемое) компактное множество положительной площади. Тогда произвольная интегральная сумма στ,Mi (1) =
n X
(3.3)
1 · s(Pi ) = s(P ).
i=1
Поэтому условие (3.4) выполнено при I = s(P ) и, значит, ZZ s(P ) = dx dy.
(3.6)
P
Получили универсальную формулу нахождения площади компактной плоской фигуры. В дальнейшем рассматриваются такие вопросы теории двойного интеграла: 1) существование, 2) свойства, 3) вычисление. Многие утверждения и доказательства, связанные с проблемами 1) и 2), практически полностью переносятся из раздела «Интеграл Римана». Это связано с тем, что основная работа идет здесь со значениями функции, а не с аргументами. В то же время задача вычисления двойного интеграла сводится к нахождению двух определенных интегралов, взятых по разным переменным, так что основное внимание будет уделено этой проблеме.
3.3
Существование двойного интеграла
Теорема 3.3 (необходимое условие существования двойного интеграла) Если функция f (x, y) интегрируема на квадрируемом компактном множестве P, то она на нем ограничена. Доказательство проводится методом от противного. Предположение неограниченности функции f на P приводит к тому, что множество {στ,Mi (f )}τ интегральных сумм функции f, отвечающих любому фиксированному разбиению τ, неограничено. Но тогда условие (3.4) не выполнено ни при каком I ∈ R. Задание 3.1. Дать полное доказательство теоремы. Из теоремы 3.3 следует, что неограниченная на множестве P функция f не интегрируема на нем. Поэтому будем рассматривать лишь ограниченные функции. Как и в теории определенных интегралов, введем суммы Дарбу ограниченной на множестве P функции f . Пусть τ — произвольное разбиение множества P. Функция ограничена на каждой ячейке Pi , 1 6 i 6 n разбиения и поэтому существуют mi : =
inf f (x, y),
Mi : = sup f (x, y).
(x,y)∈Pi
(3.7)
(x,y)∈Pi
Тогда нижняя сумма Дарбу sτ = sτ (f ) и верхняя сумма Дарбу Sτ = Sτ (f ) функции f, отвечающие разбиению τ, определяются равенствами sτ (f ) =
n X
mi · s(Pi ), Sτ (f ) =
i=1
n X
Mi · s(Pi ).
i=1
Укажем следующие основные свойства сумм Дарбу. 1. ∀ τ sτ (f ) = inf{στ,Mi (f )}τ ; Sτ (f ) = sup{στ,Mi (f )}τ . 2. ∀ τ ∀ τ1 sτ (f ) 6 Sτ1 (f ). 71
Теорема 3.4 (критерий интегрируемости) Функция f (x, y), ограниченная на квадрируемом компактном множестве P, интегрируема на нем тогда и только тогда, когда lim (Sτ (f ) − sτ (f )) = 0, λτ →0
то есть когда ∀ε > 0 ∃δ > 0 ∀τ
(λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε).
(3.8)
Следствие 3.2. Если функция f интегрируема на множестве P, то ZZ ZZ lim sτ (f ) = f (x, y) dx dy, lim Sτ (f ) = f (x, y) dx dy. λτ →0
(3.9)
λτ →0
P
P
Доказательства указанных утверждений проводятся по той же схеме, что и для определенных интегралов. Отметим, что ZZ f (x, y) dx dy = sup{sτ (f )} = inf{Sτ (f )} P
и поэтому
ZZ ∀τ
sτ (f ) 6
f (x, y) dx dy 6 Sτ (f ).
(3.10)
P
Теорема 3.5 (достаточное условие существования двойного интеграла) Если функция f (x, y) непрерывна на квадрируемом компактном множестве P, то она на нем интегрируема. Доказательство опирается на обобщенную теорему Кантора 1.22 и критерий интегрируемости 3.4. Зафиксируем любое число ε > 0. По обобщенной теореме Кантора для числа ε/s(P ) > 0 найдется такое число δ > 0, что µ ¶ ε 0 0 0 0 0 0 ∀ (x, y) ∈ P ∀ (x , y ) ∈ P ρ((x, y), (x , y )) < δ ⇒ |f (x, y) − f (x , y )| < . (3.11) s(P ) Выберем произвольно разбиение τ со свойством λτ < δ. Пусть Pi , 1 6 i 6 n — произвольная ячейка этого разбиения. Если (x, y), (x0 , y 0 ) — любые ее точки, то ρ((x, y), (x0 , y 0 )) 6 d(Pi ) 6 λτ < δ и в силу (3.11) |f (x, y) − f (x0 , y 0 )| < ε/s(P ). Выбирая точки (x, y) ∈ Pi , (x0 , y 0 ) ∈ Pi так, чтобы f (x0 , y 0 ) = mi
f (x, y) = Mi ,
(почему это возможно?), приходим к неравенствам ∀ i 1 6 i 6 n Mi − mi
0, что ∀ (x, y) ∈ P
|f (x, y)| 6 K, |g(x, y)| 6 K.
(3.15)
В силу интегрируемости функции f на множестве P ZZ lim στ,Mi (f ) = f (x, y) dx dy = I.
(3.16)
λτ →0
P
Нужно убедиться в том, что существует lim στ,Mi (g) = I,
λτ →0
то есть что ∀ ε > 0 ∃ δ > 0 ∀τ
(λτ < δ ⇒ |στ,Mi (g) − I| < ε).
(3.17)
Зафиксировав произвольное разбиение τ множества P, преобразуем интегральные суммы функций f, g. Ячейки разбиения τ разделяются на две группы {Pi }, 1 6 i 6 l,
{Pj }, l + 1 6 j 6 n
так, что Pi ∩ L = ∅,
Pj ∩ L 6= ∅
(возможно, потребуется перенумерация ячеек). Тогда 0
00
0
στ,Mi (f ) = σ (f ) + σ (f ),
σ (f ) =
l X
f (Mi )s(Pi ),
00
σ (f ) =
i=1
n X
f (Mj )s(Pj ).
(3.18)
j=l+1
Аналогично преобразуются и интегральные суммы функции g (соответствующие формулы получаются из (3.18) заменой символа f на символ g). Так как, в силу условия (3.13), на множестве l [ Pi i=1
функции f, g совпадают, то
0
0
σ (f ) = σ (g).
(3.19)
Преобразуем и оценим сверху выражение |στ,Mi (g)−I|, стремясь выделить слагаемое |στ,Mi (f ) − I| : 0
00
(3.19)
0
00
00
|στ,Mi (g) − I| = |σ (g) + σ (g) − I| = |σ (f ) + σ (g) − I ± σ (f )| = 73
0
00
00
00
0
00
00
00
= |(σ (f ) + σ (f ) − I) − σ (f ) + σ (g)| 6 |σ (f ) + σ (f ) − I| + |σ (f )| + |σ (g)| = 00
00
= |στ,Mi (f ) − I| + |σ (f )| + |σ (g)|. Зафиксируем произвольно число ε > 0. Для доказательства свойства (3.17) проверим, что при разбиениях множества P с достаточно малым рангом каждое из трех слагаемых 00 00 |στ,Mi (f ) − I|, |σ (f )|, |σ (g)| меньше ε/3. 1) Из (3.16) следует, что для числа ε/3 > 0 найдется такое положительное число δ1 , что при любом разбиении τ множества P с условием λτ < δ1 независимо от выбора точек Mi справедливо неравенство ε |στ,Mi (f ) − I| < . 3
(3.20)
2) Поскольку L — кривая нулевой площади, то она покрывается многоугольником сколь угодно малой площади. Но множество n [
PL : =
Pj
j=l+1
также покрывает кривую L, поэтому при достаточно малом ранге λτ разбиения τ его площадь n X s(Pj ) s(PL ) = j=l+1
тоже сколь угодно мала. Значит, существует такое число δ2 > 0, что ³ ε ´ ∀ τ λτ < δ2 ⇒ s(PL ) < . 3K
(3.21)
00
Оценим по модулю слагаемое σ (f ) интегральной суммы στ,Mi (f ), отвечающее множеству PL , предполагая, что λτ < δ2 : 00
|σ (f )| = |
n X
f (Mj )s(Pj )| 6
n X
|f (Mj )s(Pj )| 6 K
(3.21)
s(Pj ) = K · s(PL )
0, ϕ ∈ [0, 2π]) 2 . Тогда формулы (3.38) принимают вид ½ x = r cos ϕ, y = r sin ϕ. Вычислим якобиан
¯ ¯ ¯ 0 ¯ xr x0ϕ ¯ ¯ cos ϕ −r sin ϕ ¯=¯ ¯ J(r, ϕ) = ¯ 0 yr yϕ0 ¯ ¯ sin ϕ r cos ϕ
1 2
(3.43)
¯ ¯ ¯ = r(cos2 ϕ + sin2 ϕ) = r > 0. ¯
Желательно, чтобы они были координатными линиями. Вместо отрезка [0, 2π] иногда удобнее выбрать другой отрезок длиной 2π, например, [−π, π].
82
Поэтому |J(r, ϕ)| = r. В случае полярных координат координатные линии r = const — окружности с центром в точке O(0, 0), а координатные линии ϕ = const — лучи, выходящие из этой точки. Формула (3.39) теперь преобразуется к виду ZZ ZZ f (r cos ϕ, r sin ϕ) r dr dϕ. (3.44) f (x, y) dx dy = P0
P
Сводя полученный двойной интеграл в полярных координатах к повторному, внешнее интегрирование обычно проводят по переменной ϕ. Если, например, P можно задать в полярных координатах следующим образом: ½ α 6 ϕ 6 β, P : (3.45) r1 (ϕ) 6 r 6 r2 (ϕ), то приходим к формуле ZZ
Zβ f (x, y) dx dy =
rZ 2 (ϕ)
dϕ α
P
Пример 3.1. Вычислить
f (r cos ϕ, r sin ϕ)r dr.
(3.46)
r1 (ϕ)
ZZ ex
2 +y 2
dx dy,
P
где P : 1 6 x2 + y 2 6 4, y > 0. Граница множества P состоит из частей координатных линий, поэтому ½ 0 6 ϕ 6 π, P : 1 6 r 6 2. Пределы изменения обеих полярных координат для множества P постоянны, приходим к простому повторному интегралу: ZZ e
x2 +y 2
(3.46)
dx dy =
Zπ
1 e d(r ) = 2 r2
dϕ 0
3.7
Z2 1
Z2
Zπ 2 er |21
2
1 dϕ = 2
0
2
er r dr =
dϕ 0
P
1 = 2
Zπ
1
Zπ
e(e3 − 1) (e − e) dϕ = · π. • 2 4
0
Геометрический смысл двойного интеграла
Известно, что определенный интеграл от функции f (x), непрерывной и неотрицательной на отрезке [a, b], равен площади криволинейной трапеции D : {(x, y) ∈ R2 |x ∈ [a, b], 0 6 y 6 f (x)},
83
(3.47)
то есть
Zb s(D) =
f (x) dx.
(3.48)
a
Обобщим формулу (3.48) на функции двух переменных. Поскольку теперь речь пойдет об объемах, приведем некоторые факты теории кубируемости тел T ⊂ R3 . Для любого ограниченного тела T вводятся понятия нижнего объема v∗ (T ) = sup{v(u)} и верхнего объема v ∗ (T ) = inf{v(U )}. Здесь u, U — многогранники, u ⊂ T ⊂ U, v(u) — объем многогранника u. Множество T называется кубируемым, если его верхний и нижний объемы совпадают, тогда его объем v(T ) = v∗ (T ) = v ∗ (T ). Говорят, что множество q ⊂ R3 имеет нулевой объем, если для каждого числа ε > 0 найдется такой многогранник u ⊃ q, что v(u) < ε. Если поверхность q — график непрерывной функции z = f (x, y), (x, y) ∈ P, P – квадрируемое компактное множество, то q имеет нулевой объем. Лемма 3.1 Прямой цилиндр T0 высоты h с квадрируемым основанием P — кубируемое тело и v(T0 ) = s(P )h. Теорема 3.9 Тело T кубируемо тогда и только тогда, когда ∀ε > 0 ∃ кубируемые тела T1 , T2 , T1 ⊂ T ⊂ T2
v(T2 ) − v(T1 ) < ε.
(3.49)
Пусть функция двух переменных f (x, y) непрерывна и неотрицательна на квадрируемом компактном множестве P. Аналогом понятия криволинейной трапеции (3.47) является цилиндрический брус T : = {(x, y, z) ∈ R3 | (x, y) ∈ P, 0 6 z 6 f (x, y)}.
(3.50)
Сверху он ограничен графиком функции f (x, y), снизу — множеством P, лежащим в координатной плоскости Oxy, сбоку — цилиндрической поверхностью, направляющей которой является ∂P, а образующие параллельны оси z. Теорема 3.10 Цилиндрический брус T — кубируемое тело и ZZ v(T ) = f (x, y) dx dy.
(3.51)
P
Доказательство включает 1) проверку кубируемости тела T (по критерию кубируемости 3.9, при этом тела T1 , T2 составляются из прямых цилиндров), 2) вывод формулы (3.51) (по следствию 3.2, с. 71). 1) Зафиксировав произвольно разбиение τ множества P — основания цилиндрического бруса T, выявим геометрический смысл сумм Дарбу sτ (f ) =
n X
mi · s(Pi ),
Sτ (f ) =
i=1
n X
Mi · s(Pi ).
i=1
Проведем через границы ∂Pi ячеек Pi разбиения цилиндрические поверхности, параллельные оси z. Тогда цилиндрический брус T разобьется на n столбиков Ti : = {(x, y, z) ∈ R3 | (x, y) ∈ Pi , 0 6 z 6 f (x, y)}. 84
По лемме 3.1 mi · s(Pi ) (Mi · s(Pi )) — объем прямого цилиндра с основанием Pi и высотой mi (Mi ), содержащегося в Ti (содержащего Ti ). Составим из всех меньших (больших) цилиндров тело T1 (T2 ). При этом T1 ⊂ T ⊂ T2 , v(T1 ) = sτ (f ),
(3.52)
v(T2 ) = Sτ (f ).
(3.53)
Так как функция f (x, y) непрерывна на множестве P, то она на нем интегрируема и по критерию интегрируемости 3.4 ∀ε > 0 ∃δ > 0 ∀τ
(λτ < δ ⇒ Sτ (f ) − sτ (f ) < ε).
Зафиксировав произвольно число ε > 0, найдем соответствующее ему число δ > 0 и выберем любое разбиение τ множества P с рангом λτ < δ. Учитывая равенства (3.53), приходим к условию (3.49). Значит, тело T по теореме 3.9 кубируемо. Из соотношений (3.52) и свойства монотонности объема ∀τ
sτ (f ) 6 v(T ) 6 Sτ (f ).
(3.54)
2) По следствию 3.2 ZZ lim sτ (f ) = lim Sτ (f ) =
λτ →0
f (x, y) dx dy.
λτ →0
P
Поэтому, переходя в двойном неравенстве (3.54) к пределу при λτ → 0, приходим к искомой формуле (3.51). •
3.8
Тройные интегралы
Пусть функция трех переменных f (x, y, z) определена на кубируемом компактном множестве T ⊂ R3 . Рассмотрим произвольное разбиение τ множества T на кубируемые компактные ячейки Ti без общих внутренних точек n [
τ: T =
Ti ,
i=1
введем ранг λτ = max d(Ti ) разбиения τ и зафиксируем некоторый набор отмеченных точек {Mi }, Mi ∈ Ti . Определим интегральную сумму функции f на множестве T σ = στ,Mi (f ) : =
n X
f (Mi )v(Ti ).
i=1
Определение 3.10. Если существует конечный предел интегральных сумм функции f (x, y, z) на множестве T при λτ → 0, то его называют тройным интегралом функции на этом множестве: ZZZ f (x, y, z) dx dy dz = lim στ,Mi (f ) ∈ R; λτ →0
T
85
функцию f (x, y, z) в этом случае называют интегрируемой на множестве T. Задание 3.2. Дать определение конечного предела интегральных сумм функции f (x, y, z) при λτ → 0. Если f (x, y, z) = 1, то все интегральные суммы функции равны v(T ) : n X
στ,Mi (1) =
v(Ti ) = v(T )
i=1
и поэтому
ZZZ v(T ) =
dx dy dz.
(3.55)
T
Пришли к универсальной формуле вычисления объема тела. Всякая интегрируемая на множестве функция ограничена на нем. Из непрерывности функции на множестве следует существование тройного интеграла. В то же время изменение значений ограниченной интегрируемой функции на множестве нулевого объема не влияет на величину тройного интеграла. Задание 3.3. Сформулировать свойства тройного интеграла, полностью аналогичные свойствам двойного интеграла. Вычисление тройного интеграла сводится к последовательному нахождению нескольких интегралов меньшей размерности — двойного и определенного интеграла или трех определенных интегралов. Приведем одну из таких формул. Определим множество T через неравенства относительно координат x, y, z (именно в таком порядке). Пусть проекция P тела T на координатную плоскость xOy задается неравенствами ½ a 6 x 6 b, P : ϕ1 (x) 6 y 6 ϕ2 (x), где функции ϕ1,2 (x) непрерывны на отрезке [a, b]. Пусть, далее, прямая, параллельная оси Oz и проходящая через любую точку (x, y, 0), (x, y) ∈ P, пересекает ∂T не более чем в двух точках и аппликаты всех ее точек, лежащих в T, удовлетворяют условиям z1 (x, y) 6 z 6 z2 (x, y). Здесь z1,2 (x, y) — функции, непрерывные на множестве P. Таким образом, тело задается через неравенства следующим образом: a 6 x 6 b, ϕ1 (x) 6 y 6 ϕ2 (x), T : (3.56) z1 (x, y) 6 z 6 z2 (x, y). Если при этом функция f (x, y, z) непрерывна на множестве T, то справедлива формула ZZZ
Zb f (x, y, z) dx dy dz =
ϕZ2 (x)
dx a
T
z2Z(x,y)
dy
ϕ1 (x)
Пример 3.2. Вычислить тройной интеграл ZZZ I= y dx dy dz, T
86
z1 (x,y)
f (x, y, z) dz.
(3.57)
где T — тетраэдр, ограниченный плоскостями x = 0, y = 0, z = 0, x + y + z = 1. Тело T через неравенства записывается так: 0 6 x 6 1, 0 6 y 6 1 − x, T : 0 6 z 6 1 − x − y. Применим формулу (3.57): Z1 I=
Z1−x dx
0
Z1 =
dy 0
µ
1−x−y Z
Z1 y dz =
0
0
y2 y3 dx (1 − x) − 2 3
Z1−x Z1 Z1−x z=1−x−y dx y dy(z|z=0 )= dx ((1 − x)y − y 2 ) dy = 0
0
0
µ ¶¯ ¶ Z1 Z1 ¯y=1−x 1 1 1 ¯y=0 = (1 − x)3 dx = − − (1 − x)3 d(1 − x) = ¯ 2 3 6 0
0
0
1 (1 − x)4 1 1 1 =− · |0 = − (0 − 1) = . • 6 4 24 24
3.9
3.9.1
Приложения кратных интегралов
Вычисление площадей плоских фигур и объемов тел
Напомним выведенные ранее формулы: • площади плоской фигуры (с. 70, (3.6)) ZZ s(P ) =
dx dy; P
• объема тела (с. 85, (3.55)) ZZZ v(T ) =
dx dy dz; T
• объема цилиндрического бруса (с. 83, (3.51)) ZZ v(T ) = f (x, y) dx dy. P
3.9.2
Определение и вычисление площади поверхности
Рассмотрим поверхность F : z = f (x, y), (x, y) ∈ P, являющуюся графиком функции f (x, y), дифференцируемой на квадрируемом компактном множестве P. 87
Определим площадь поверхности F через предел, локально приближая ее частями касательных плоскостей (через предел площади «чешуйчатого покрытия» поверхности). n S Рассмотрим произвольное разбиение τ : P = Pi множества P. Тогда и поверхi=1
ность F также можно представить в виде объединения F =
n S
Fi частей Fi , не имеющих
i=1
общих внутренних точек. Множество Fi проектируется на ячейку Pi . Зафиксировав любой индекс i, 1 6 i 6 n, выберем произвольно точку Mi (xi , yi ) ∈ Pi и построим касательную плоскость Ti к поверхности F в точке (xi , yi , f (xi , yi )). Ее уравнение (см. (2.29)) Ti : z = f (Mi ) + fx0 (Mi )(x − xi ) + fy0 (Mi )(y − yi ). (3.58) Обозначим через ti часть касательной плоскости Ti , проектирующуюся на Pi (отметим, что ti , Pi — плоские фигуры). Из квадрируемости Pi следует квадрируемость и множества ti . Проведя указанное построение при любом i, в итоге приходим к поверхности t=
n [
ti ,
i=1
которая и представляет собой «чешуйчатое покрытие» поверхности F. Введем сумму Aτ : =
n X
s(ti ),
(3.59)
i=1
являющуюся суммарной площадью всех частей ti множества t. Определение 3.11. Если существует конечный предел сумм Aτ при λτ → 0, не зависящий от выбора разбиений τ и отмеченных точек Mi , то его называют площадью поверхности F : s(F ) : = lim Aτ . (3.60) λτ →0
Теорема 3.11 Если функция f (x, y) гладкая на квадрируемом компактном множестве P, то поверхность F имеет площадь, вычисляемую по формуле ZZ q s(F ) = 1 + fx02 (x, y) + fy02 (x, y) dx dy. (3.61) P
Доказательство. Так как функция q h(x, y) : = 1 + fx02 (x, y) + fy02 (x, y) непрерывна на множестве P (почему?), то она интегрируема и двойной интеграл, стоящий в правой части равенства (3.61), существует. Преобразуем сумму Aτ к виду интегральной суммы функции h(x, y). Поскольку Pi — проекция ti , то 3 s(Pi ) = s(ti ) cos γi , 3
(3.62)
Формула (3.62) выведена в элементарной математике для многоугольников; опираясь на этот факт, формулу можно доказать и в общем случае (с использованием теории квадрируемости).
88
где γi — острый угол между касательной поскостью Ti и координатной плоскостью xOy → − − → или, что то же самое, между их нормальными единичными векторами n0i , k . Из курса геометрии известно, что координаты единичного вектора — направляющие косинусы, − → поэтому cos γi — третья координата единичного вектора n0i . Преобразовав уравнение (3.58) касательной плоскости Ti к виду Ti :
−fx0 (Mi )(x − xi ) − fy0 (Mi )(y − yi ) + z − f (Mi ) = 0,
убеждаемся, что
− → n i : = (−fx0 (Mi ), −fy0 (Mi ), 1)
— нормальный вектор к Ti . Так как его длина q − → | ni | = 1 + fx02 (Mi ) + fy02 (Mi ), то
− → − →0 ni 1 ni = − = (−fx0 (Mi ), −fy0 (Mi ), 1) → |n~i | | ni |
и поэтому
1
cos γi = q
.
(3.63)
1 + fx02 (Mi ) + fy02 (Mi )
Преобразуем теперь (3.62)
s(ti ) =
s(Pi ) q = 1 + fx02 (Mi ) + fy02 (Mi )s(Pi ) = h(Mi )s(Pi ). cos γi
Но тогда Aτ =
n X
s(ti ) =
i=1
n X
h(Mi )s(Pi ) = στ,Mi (h).
(3.64)
i=1
В силу интегрируемости функции h(x, y) на множестве P существует ZZ lim στ,Mi (h) = h(x, y) dx dy. λτ →0
P
Поэтому можно перейти в равенстве (3.64) к пределу при λτ → 0 : ZZ lim Aτ = lim στ,Mi (h) = h(x, y) dx dy. λτ →0
λτ →0
P
Таким образом, поверхность F по определению 3.11 имеет площадь, определяемую формулой (3.61). • Замечание 3.8. Справедливо более общее утверждение, чем теорема 3.11. Если гладкая поверхность F задана, как в дифференциальной геометрии, параметрически F :
− → → r =− r (u, v), (u, v) ∈ P,
где P — квадрируемое компактное множество на плоскости параметров u, v и − → − → − → → − − → − → E = ru0 · ru0 , F = ru0 · rv0 , G = rv0 · rv0 89
— коэффициенты ее первой квадратичной формы, то поверхность F имеет площадь ZZ √ s(F ) = EG − F 2 du dv. P
Пример 3.3. Найти площадь части параболоида x2 + y 2 = 2z, вырезаемого цилиндром x2 + y 2 = 1. Рассматриваемая поверхность определяется уравнением F :
1 z = (x2 + y 2 ), (x, y) ∈ P, 2
где P : x2 + y 2 6 1 — единичный круг на плоскости xOy. Находим 1 zx0 = (x2 + y 2 )0x = x, 2 Поэтому (3.61)
s(F ) =
zy0 = y, 1 + zx2 + zy02 = 1 + x2 + y 2 . ZZ p
1 + x2 + y 2 dx dy.
P
Двойной интеграл вычислим, переходя к полярным координатам: Z2π s(F ) =
dϕ 0
1 = 2
µ
Z2π dϕ
Z1 √
1+
r2 r dr
1 = 2
Z2π dϕ 0
0
Z1 √
1 + r2 d(1 + r2 ) =
0
¶ √ ¯ ¯2π 2 1 2π √ 2 3/2 ¯1 ¯ (1 + r ) = · (2 2 − 1) · ϕ = (2 2 − 1) . • 0 0 3 3 3
0
3.9.3
Физические приложения кратных интегралов
Основное внимание уделим приложениям двойных интегралов. Будем рассматривать материальные фигуры — «тяжелые» плоские фигуры, вдоль которых непрерывно распределены массы. Пусть P — квадрируемая компактная материальная фигура. Распределение масс вдоль нее характеризуется поверхностной плотностью — непрерывной неотрицательной функцией ρ(x, y), (x, y) ∈ P. В случае ρ(x, y) = const материальная фигура называется однородной. Понятие материальной фигуры является удобной математической моделью тонких пластинок. Средствами интегрального исчисления вводятся важные физические характеристики материальных фигур, например, масса, центр масс, статические моменты, моменты инерции. Остановимся на первых трех понятиях. Масса материальной фигуры Введем понятие массы материальной фигуры, исходя из того, что масса однородной фигуры P с постоянной поверхностной плотностью ρ выражается формулой m(P ) = ρ · s(P ).
(3.65)
Зафиксируем некоторое разбиение τ множества P и точки Mi ∈ Pi , 1 6 i 6 n. При малых λτ непрерывная функция ρ(x, y) во всех точках каждой ячейки Pi будет близка к ρ(Mi ) : ∀ (x, y) ∈ Pi ρ(x, y) ≈ ρ(Mi ) = const, 90
а масса ячейки в силу формулы (3.65) близка к произведению ρ(Mi )s(Pi ).
(3.66)
Поэтому приближенное значение массы всей материальной фигуры P определяется суммой n X ρ(Mi )s(Pi ). (3.67) i=1
Определение 3.12. Если существует конечный предел сумм (3.67) при λτ → 0, не зависящий от выбора разбиений τ и отмеченных точек Mi , то его называют массой m(P ) материальной фигуры P . Поскольку сумма (3.67) является интегральной суммой интегрируемой функции ρ(x, y) : n X ρ(xi , yi )s(Pi ) = στ,Mi (ρ), i=1
то существует lim
λτ →0
n X
ZZ ρ(xi , yi )s(Pi ) = lim στ,Mi (ρ) =
ρ(x, y) dx dy.
λτ →0
i=1
P
Тем самым пришли к формуле вычисления массы материальной фигуры ZZ m(P ) = ρ(x, y) dx dy.
(3.68)
P
Статические моменты и центр масс материальной фигуры Будем опираться на понятие статического момента системы материальных точек относительно оси. Пусть на плоскости расположены ось l и система n материальных точек Mi (xi , yi ) с массами mi . Тогда статическим моментом системы относительно оси l называется сумма n X mi di , (3.69) i=1
где di — ориентированное расстояние от точки Mi до оси (оно снабжено знаком (+) или (-) в зависимости от того, с какой стороны от оси находится данная точка). Введем понятия статических моментов материальной фигуры P M omx (P ), M omy (P ) относительно осей координат Ox, 0y соответственно. Снова зафиксируем разбиение τ и точки Mi ∈ Pi . Заменим материальную фигуру системой n материальных точек {Mi }, предполагая, что масса каждой ячейки Pi , определяемая по приближенной формуле (3.66), сосредоточена в точке Mi . Формулы (3.69) позволяют записать такие приближенные значения рассматриваемых моментов M omx (P ), M omy (P ) : n X
n X
yi ρ(Mi )s(Pi ),
i=1
xi ρ(Mi )s(Pi ).
(3.70)
i=1
Определение 3.13. Статическими моментами материальной фигуры P относительно осей координат Ox, Oy называются конечные пределы сумм (3.70) соответственно при λτ → 0. 91
Поскольку (3.70) — интегральные суммы непрерывных функций yρ(x, y), xρ(x, y), то существуют ZZ ZZ n n X X lim yi ρ(Mi )s(Pi ) = yρ(x, y) dx dy, lim xi ρ(Mi )s(Pi ) = xρ(x, y) dx dy. λτ →0
λτ →0
i=1
P
Поэтому
i=1
P
ZZ M omx (P ) =
ZZ yρ(x, y) dx dy,
M omx (P ) =
P
xρ(x, y) dx dy.
(3.71)
P
Центр масс M (x, y) материальной фигуры P определяется как такая точка, что если в ней сосредоточить массу m(P ) всей фигуры, то статические моменты точки M относительно обеих осей координат совпадут со статическими моментами относительно этих осей фигуры. Отсюда вытекают следующие равенства: m(P )x = M omy (P ), Поэтому
1 x= m(P )
m(P )y = M omx (P ).
ZZ
1 y= m(P )
xρ(x, y) dx dy, P
ZZ yρ(x, y) dx dy.
(3.72)
P
В частном случае однородной материальной фигуры эти формулы упрощаются: RR RR x dx dy y dx dy P P x= , y= . (3.73) s(P ) s(P ) Пример 3.4. Найти центр масс однородного полукруга P : x2 + y 2 6 R2 , y > 0. Применим формулы (3.73). Так как в полярных координатах ½ 0 6 ϕ 6 π, P : 0 6 r 6 R, то находим ZZ
Zπ x dx dy = Zπ
y dx dy = P
dϕ 0
P
ZZ
ZR r cos ϕ r dr =
cos ϕ dϕ
0
ZR
Zπ r sin ϕ dr =
0
r 3 R R3 | = (sin ϕ)|π0 = 0, 3 0 3
0
2
dϕ 0
Zπ
sin ϕ dϕ
r 3 R R3 R3 2R3 |0 = (− cos ϕ)|π0 = − (−1−1) = . 3 3 3 3
0 2
Поскольку s(P ) = πR /2, то 2R3 · 2 4 = · R ≈ 0.4244 R. • 2 3 · πR 3π Замечание 3.9. Аналогичным образом, но с применением тройных интегралов определяются и вычисляются физические характеристики материального пространственного тела T по известной пространственной плотности распределения его масс ρ(x, y, z). Например, масса материального тела T находится по формуле ZZZ m(T ) = ρ(x, y, z) dx dy dz. x = 0, y =
T
92
Глава 4 Криволинейные интегралы
4.1
4.1.1
Криволинейные интегралы первого рода
Определение криволинейного интеграла первого рода ^
Пусть функция f (x, y) задана вдоль спрямляемой плоской кривой Γ =AB (здесь A — начало, B — конец кривой, случай замкнутой кривой A = B не исключается). Задавшись натуральным числом n, разобъем произвольно кривую Γ на n частичных дуг Mi−1 Mi . Для этого, двигаясь от точки A к точке B, вставим между A, B произвольно новые точки: A = M0 , M1 , . . . , Mi−1 , Mi , . . . , Mn−1 , Mn = B. Тем самым определяется разбиение τ : Γ=
n [
Mi−1 Mi .
i=1
На каждой частичной дуге Mi−1 Mi выберем точку Mi∗ . Тогда сможем записать интегральную сумму функции f (x, y) вдоль кривой Γ σ(f ) = σ
τ,Mi∗
(f ) : =
n X
f (Mi∗ )l(Mi−1 Mi ).
(4.1)
i=1
Здесь l(Mi−1 Mi ) — длина частичной дуги Mi−1 Mi . Зададим ранг разбиения τ λτ : = max l(Mi−1 Mi ). Определение 4.1. Говорят, что существует конечный предел I интегральных сумм στ,Mi∗ (f ) при λτ → 0, если ∀ε > 0 ∃δ > 0 ∀τ
(λτ < δ ⇒ |στ,Mi∗ (f ) − I| < ε).
(4.2)
Определение 4.2. Если существует конечный предел I интегральных сумм στ,Mi∗ (f ) при λτ → 0, то его называют криволинейным интегралом первого рода (КИ-1) от функции f (x, y) вдоль кривой Γ : Z I = f (x, y) dl : = lim στ,Mi (f ) ∈ R. λτ →0
Γ
93
Найдем произвольную интегральную сумму функции f (x, y) = 1 : στ,Mi :∗ (1) =
n X
1 · l(Mi−1 Mi ) = l(Γ).
i=1
Поэтому условие (4.2) выполнено при I = l(Γ) и, значит, Z l(Γ) = dl.
(4.3)
Γ
Специфическим свойством криволинейного интеграла первого рода является его независимость от ориентации кривой Γ. Множества интегральных сумм функции f ^ вдоль кривых Γ и Γ− =BA совпадают. Действительно, взяв произвольную интегральную сумму (4.1) и перейдя к кривой Γ− , можно выбрать те же граничные точки частичных дуг, их длины также сохраняются (l(Mi−1 Mi ) = l(Mi Mi−1 )); правда, слагаемые интегральной суммы теперь запишутся в противоположном порядке. Поэтому в случае R R R существования f (x, y) dl существует также и f (x, y) dl = f (x, y) dl. Γ
4.1.2
Γ−
Γ
Существование и вычисление криволинейного интеграла первого рода
Криволинейные интегралы сводятся к определенным интегралам. Формулы перехода к определенным интегралам зависят от вида параметрического задания (параметризации) кривой Γ. Будем считать, что функция f (x, y) непрерывна вдоль кривой Γ. Пусть вначале параметром произвольной точки M (x, y) кривой Γ является длина дуги, отсчитываемой от начальной точки A : ^
s = l(AM ). Кривая задается соотношениями ½ x = x(s), Γ: y = y(s),
s ∈ [0, l(Γ)],
(4.4)
где функции x(s), y(s) непрерывны на отрезке [0, l(Γ)]. Символами si , s∗i обозначим значения параметра s, отвечающие точкам Mi , Mi∗ соответственно, тогда Mi (x(si ), y(si )), Mi∗ (x(s∗i ), y(s∗i )). Обозначим также s0 = 0, sn = l(Γ), ∆si = si − si−1 . Разбиение τ кривой Γ порождает разбиение T отрезка [0, l(Γ)] T : [0, l(Γ)] =
n [
[si−1 , si ].
i=1
Отрезок [0, l(Γ)] есть результат спрямления кривой Γ, при этом λτ = λT . 94
Вдоль кривой Γ функция f (x, y) становится сложной функцией от s F (s) : = f (x(s), y(s)),
s ∈ [0, l(Γ)].
Функция F (s) непрерывна на отрезке [0, l(Γ)]. Преобразуем στ,Mi∗ (f ) =
n X
f (Mi∗ )l(Mi−1 Mi )
=
n X
i=1
f (x(s∗i ), y(s∗i ))∆si = στs ,s∗i (F ).
i=1
Таким образом, интегральная сумма функции f для криволинейного интеграла в то же время есть интегральная сумма функции F для определенного интеграла, поэтому Z ∃ lim στ,M (∗i ) (f ) = λτ →0
Zl(Γ) F (s) ds . f (x, y) dl ⇔ ∃ lim στs ,s∗i (F ) = λT →0
0
Γ
Значит, в случае (4.4) справедлива формула Z
Zl(Γ) f (x, y) dl = f (x(s), y(s)) ds,
(4.5)
0
Γ
причем существование одного из интегралов, входящих в нее, влечет существование другого интеграла. Так как криволинейный интеграл первого рода сводится к определенному интегралу, то на него переносятся свойства определенных интегралов. Укажем лишь следующее важное свойство. Свойство аддитивности. Если Γ = Γ1 ∪ Γ2 , то Z Z Z f (x, y) dl = f (x, y) dl + f (x, y) dl. Γ
Γ1
Γ2
Пусть теперь Γ — произвольная гладкая (см определение 3.8 ) спрямляемая кривая: ½ x = ϕ(t), Γ: t ∈ [α, β] (4.6) y = ψ(t), (α < β). Тогда A(ϕ(α), ψ(α)), B(ϕ(β), ψ(β)). Выберем произвольно (переменную) точку M (ϕ(t), ψ(t)), t ∈ [α, β] ^
кривой Γ. Длина s(t) = l(AM ) переменной дуги AM вычисляется так [1, с. 384]: s(t) =
Zt p
ϕ02 (τ ) + ψ 02 (τ ) dτ.
α
95
(4.7)
Тем самым через интеграл с переменным верхним пределом определена функция s = s(t), t ∈ [α, β]. Поскольку подынтегральная функция в формуле (4.7) непрерывна, то по соответствующей теореме [1, с. 367] в каждой точке t ∈ [α, β] существует p s0 (t) = ϕ02 (t) + ψ 02 (t). (4.8) Перейдем в определенном интеграле формулы (4.5) к новой переменной t : Zl(Γ) Zβ Zβ p (4.8) 0 f (x(s), y(s)) ds = f (ϕ(t), ψ(t))s (t) dt = f (ϕ(t), ψ(t)) ϕ02 (t) + ψ 02 (t) dt. 0
α
α
Таким образом, выведена общая формула вычисления криволинейного интеграла первого рода от непрерывной функции, отвечающая произвольной параметризации (4.6) гладкой кривой Γ: Z
Zβ f (x, y) dl =
p f (ϕ(t), ψ(t)) ϕ02 (t) + ψ 02 (t) dt.
(4.9)
α
L
Замечание 4.1. Формула (4.9) справедлива и в случае кусочно-гладкой кривой Γ (это доказывается с привлечением свойства аддитивности криволинейных интегралов). Следствие 4.1. Если кусочно-гладкая кривая Γ является графиком функции g(x) на отрезке [a, b] и Γ : y = g(x), x ∈ [a, b], (4.10) то параметром становится переменная x и формула (4.9) упрощается: Z
Zb f (x, y) dl =
f (x, g(x))
p 1 + g 02 (x) dx.
(4.11)
a
L
Следствие 4.2. Если же кусочно-гладкая кривая Γ является графиком функции h(y) на отрезке [c, d] и Γ : x = h(y), y ∈ [c, d], (4.12) то t = y и приходим к формуле Z
Zd f (h(y), y)
f (x, y) dl = L
4.1.3
p
1 + h02 (y) dy.
(4.13)
c
Физические приложения криволинейных интегралов первого рода
Приложения КИ-1 в первую очередь связаны с физикой. Продолжая тему п. 3.9.3, рассмотрим теперь материальные кривые. Материальная кривая Γ — плоская кусочно-гладкая спрямляемая кривая, вдоль которой непрерывно распределены массы с линейной плотностью ρ(x, y). Здесь ρ(x, y) — непрерывная и неотрицательная на Γ функция. Если ρ(x, y) = const, то материальная фигура однородна. Как и в п. 3.9.3, вводятся понятия массы m(Γ) материальной фигуры Γ, ее статических моментов относительно осей координат M omx (Γ), M omy (Γ), 96
центра масс M (x, y). Приведем соответствующие формулы вычисления этих физических карактеристик через криволинейные интегралы первого рода: Z m(Γ) = ρ(x, y) dl; (4.14) Γ
Z M omx (Γ) =
Z yρ(x, y) dl,
M omy (Γ) =
Γ
1 m(Γ)
x=
Z y=
xρ(x, y) dl,
1 m(Γ)
Γ
Z
xρ(x, y) dl;
(4.15)
Γ
yρ(x, y) dl.
(4.16)
Γ
Если кривая Γ однородна, то формулы (4.16) упрощаются: Z Z 1 1 x= x dl, y = y dl. l(Γ) l(Γ) Γ
(4.17)
Γ
Задание 4.1. Дать определения указанных выше понятий и вывести формулы (4.14)-(4.17). Пример 4.1. Найти центр масс однородной полуокружности Γ : x2 + y 2 = R2 , y > 0 (ср. с примером 3.4). Применим формулы (4.17). Параметризуем кривую Γ: ½ x = R cos t, Γ: t ∈ [0, π]. y = R sin t, Предварительно преобразуем p p ϕ02 (t) + ψ 02 (t) = (−R sin t)2 + (R cos t)2 = R. Вычислим
Z
(4.9)
Zπ R cos tR dt = R2 (sin t)|π0 = 0,
x dl = Γ
Z
Zπ R sin tR dt = R2 (− cos t)|π0 = −R2 (−1 − 1) = 2R2 .
y dl = Γ
0
0
Поскольку l(Γ) = πR, то x = 0, y =
4.2
2 2R2 = · R ≈ 0.637 R. • πR π
Определение, свойства, существование криволинейных интегралов второго рода ^
Пусть вдоль спрямляемой плоской кривой Γ =AB заданы функции P (x, y), Q(x, y). Как и при определении КИ-1, разобъем произвольно кривую Γ на n ∈ N частичных дуг Mi−1 Mi точками Mi (xi , yi ) n [ τ : Γ= Mi−1 Mi . i=1
97
Рангом λτ разбиения τ будем и теперь считать наибольшую из длин частичных дуг: λτ = max l(Mi−1 Mi ). На каждой частичной дуге Mi−1 Mi отметим точку Mi∗ . Введем проекции на координатные оси частичных дуг Mi−1 Mi ∆xi : = xi − xi−1 ,
∆yi : = yi − yi−1 ,
интегральную сумму функции P (x, y) по координате x σx (P ) = σx,τ,Mi∗ (P ) : =
n X
P (Mi∗ )∆xi
(4.18)
i=1
и интегральную сумму функции Q(x, y) по координате y σy (Q) = σy,τ,Mi∗ (Q) : =
n X
Q(Mi∗ )∆yi .
(4.19)
i=1
Определение 4.3. Говорят, что существует конечный предел I интегральных сумм σx (P ) при λτ → 0, если ∀ε > 0 ∃δ > 0 ∀τ
(λτ < δ ⇒ |σx,τ,Mi∗ (P ) − I| < ε).
(4.20)
Аналогично вводится понятие конечного предела интегральных сумм σy (Q) при λτ → 0. Определение 4.4. Если существуют конечные пределы интегральных сумм σx (P ), σy (Q) при λτ → 0, то их называют криволинейными интегралами вдоль кривой Γ — от функции P (x, y) по координате x и от функции Q(x, y) по координате y соответственно: Z Z P (x, y) dx : = lim σx (P ) ∈ R, Q(x, y) dy : = lim σy (Q) ∈ R. λτ →0
λτ →0
Γ
Γ
В случае существования обоих криволинейных интегралов их сумма называется криволинейным интегралом второго рода (КИ-2) вдоль кривой Γ от дифференциальной формы P (x, y)dx + Q(x, y)dy : (4.21) Z Z Z P (x, y) dx + Q(x, y) dy : = P (x, y) dx + Q(x, y) dy. Γ
Γ
Γ
Свойства криволинейных интегралов второго рода Свойство 10 . Если существует криволинейный интеграл второго рода вдоль кривой Γ Z P (x, y) dx + Q(x, y) dy, (4.22) Γ
то существует КИ-2 от этой же дифференциальной формы вдоль Γ− и Z Z P (x, y)dx + Q(x, y)dy = − P (x, y) dx + Q(x, y) dy. Γ−
(4.23)
Γ
Доказательство проведем, например, для криволинейного интеграла по координате x. Каждая из интегральных сумм σx (P ) при переходе от Γ к Γ− — при сохранении наборов точек Mi , Mi∗ — лишь изменит знак, поскольку вместо частичной дуги 98
Mi−1 Mi появится дуга Mi Mi−1 . Поэтому вместо разности (xi −xi−1 ) в интегральной сумме R возникнет противоположная разность (xi−1 − xi ). Значит, в случае существования P (x, y)dx существует также и Γ
Z
Z P (x, y)dx = − Γ−
P (x, y)dx. • Γ
Замечание 4.2. Криволинейный интеграл второго рода — интеграл вдоль ориентированной кривой (как, впрочем, и определенный интеграл). R Свойство 20 (аддитивности). Если существует P (x, y) dx + Q(x, y) dy и Γ
Γ = Γ1 ∪ Γ2 , то Z Z Z P (x, y) dx + Q(x, y) dy = P (x, y) dx + Q(x, y) dy + P (x, y) dx + Q(x, y) dy. Γ
Γ1
Γ2
Замечание 4.3. Если кривая Γ замкнута: A = B, то существует два противоположных направления ее обхода. За положительное выбирают то из направлений, при движении вдоль которого внутренность замкнутой кривой остается слева. В дальнейшем будем замкнутые кривые по умолчанию считать ориентированными положительно. Перейдем к вычислению криволинейного интеграла второго рода по заданной параметризации (4.6) кривой Γ. Подчеркнем, что теперь не обязательно α < β; при движении вдоль кривой Γ в направлении, определяемым ее ориентацией, параметр t изменяется от α до β. КИ-2 сводится к определенному интегралу по отрезку [α, β], причем в дифференциальной форме (4.21) происходит стандартный переход к переменной t в соответствии с формулами (4.6). Теорема 4.1 Если функции P (x, y), Q(x, y) непрерывны вдоль кусочно-гладкой кривой Γ с параметризацией (4.6), то криволинейный интеграл (4.22) существует и вычисляется по формуле Z
Zβ (P (ϕ(t), ψ(t)) · ϕ0 (t) + Q(ϕ(t), ψ(t)) · ψ 0 (t)) dt.
P (x, y) dx + Q(x, y) dy =
(4.24)
α
Γ
Доказательство. Достаточно проверить, что Z
Zβ P (x, y) dx =
Γ
Z 0
P (ϕ(t), ψ(t))·ϕ (t) dt, α
Zβ Q(ϕ(t), ψ(t))·ψ 0 (t) dt. (4.25)
Q(x, y) dy = Γ
α
Докажем первое из равенств (4.25), исходя из определения 4.3, где I =
Rβ α
P (ϕ(t), ψ(t)) ·
ϕ0 (t) dt. В достаточно громоздких преобразованиях, связанных с переходом к параметру t, существенно используются свойства определенного интеграла. Вторая из формул (4.25) доказывается аналогично. Рассмотрим произвольную интегральную сумму σx (P ) = σx,τ,Mi∗ (P ). Пусть точкам Mi , Mi∗ отвечают значения ti , t∗i параметра t соответственно. Тогда t∗i ∈ [ti−1 , ti ], Mi (x(ti ), y(ti )), Mi∗ (x(t∗i ), y(t∗i )). 99
Обозначим также t0 = α, tn = β, ∆ti = ti − ti−1 . Разбиение τ кривой Γ порождает разбиение T отрезка [α, β] T : [α, β] =
n [
[ti−1 , ti ].
i=1
При этом λτ → 0 ⇔ λT → 0.
(4.26)
m · λT 6 λτ 6 M · λT .
(4.27)
Это вытекает из неравенств Здесь m := min
p
ϕ02 (t) + ψ 02 (t) > 0,
t∈[α,β]
M := max
p
ϕ02 (t) + ψ 02 (t) > m.
t∈[α,β]
(4.28)
Действительно, для любого индекса i, 1 6 i 6 n по свойству оценки определенного интеграла Zti p (4.28) (4.28) m∆ti 6 l(Mi−1 Mi ) = ϕ02 (t) + ψ 02 (t) dt 6 M ∆ti , ti−1
откуда и следует (4.27). Требуется доказать, что ∀ε > 0 ∃δ > 0 ∀T
(λT < δ ⇒ |σx (P ) − I| < ε) .
(4.29)
(перешли от λτ к λT , учитывая (4.26) ). Обозначим для компактности записей A(t) : = P (ϕ(t), ψ(t)). Преобразуем σx (P ) =
n X
P (Mi∗ )∆xi
=
i=1
n X
P ((ϕ(t∗i ), ψ(t∗i ))(ϕ(ti )
− ϕ(ti−1 )) =
i=1
n X i=1
Zti A(t∗i )
ϕ0 (t) dt.
ti−1
Используя свойства модуля и определенного интеграла, оценим сверху ¯ ¯ ¯ ¯ ¯ ¯ ¯X ¯X Zti Zβ n Zti n ¯ ¯ ¯ ¯ 0 ∗ ∗ 0 0 (A(ti ) − A(t))ϕ (t) dt¯¯ 6 A(ti ) ϕ (t) dt − A(t) · ϕ (t) dt¯¯ = ¯¯ |σx (P ) − I| = ¯¯ ¯ ¯ ¯ i=1 ¯ i=1 ti−1
ti−1
α
¯ ¯ ¯ n Zti n ¯ Zti X X ¯ ¯ ¯ 6 (A(t∗i ) − A(t))ϕ0 (t) dt¯¯ 6 |A(t∗i ) − A(t)| · |ϕ0 (t)| dt. ¯ ¯ i=1 i=1 ¯ ti−1
ti−1
Зафиксируем произвольно ε > 0. Чтобы доказать (4.29), достаточно проверить, что n Zti X ∃ δ > 0 ∀ T λT < δ ⇒ |A(t∗i ) − A(t)| · |ϕ0 (t)| dt < ε . (4.30) i=1 t
i−1
100
Поскольку функция ϕ0 (t) непрерывна на отрезке [α, β], то по теореме Вейерштрасса она ограничена на этом отрезке и ∃ K > 0 ∀ t ∈ [α, β] |ϕ0 (t)| 6 K.
(4.31)
Так как, далее, функция A(t) также непрерывна на отрезке [α, β], то по теореме Кантора она равномерно непрерывна на нем и потому ¶ µ ε 0 00 0 00 0 00 ∃ δ > 0 ∀ t , t ∈ [α, β] |t − t | < δ ⇒ |A(t ) − A(t )| < . (4.32) 2K|β − α| Докажем, что найденное в соответствии с (4.32) число δ является искомым. Выберем разбиение T такое, что λT < δ. Из включений t ∈ [ti−1 , ti ], t∗i ∈ [ti−1 , ti ] следуют оценки |t − t∗i | 6 |∆ti | 6 λτ < δ. Поэтому в силу (4.32) ∀ i, 1 6 i 6 n ∀ t ∈ [ti−1 , ti ] |A(t∗i ) − A(t)|
2 множеств, удовлетворяющих условию 1) теоремы. Доказательство следствия проведем для ситуации m = 2 : G = G1 ∪ G2 , причем ^ множества G1,2 отделяются линией AB⊂ G, соединяющей две точки A, B замкнутой кривой ∂G. Для каждого из множеств G1 , G2 формула Грина справедлива: ¶ ¶ ZZ µ Z Z ZZ µ ∂Q ∂P ∂Q ∂P − dx dy = P dx + Qdy, − dx dy = P dx + Qdy. ∂x ∂y ∂x ∂y G1
G2
∂G1
∂G2
Складывая эти равенства, приходим к соотношению ¶ ¶ ZZ µ ZZ µ Z Z ∂Q ∂P ∂Q ∂P − dx dy+ − dx dy = P dx+Qdy+ P dx+Qdy. (4.42) ∂x ∂y ∂x ∂y G1
G2
∂G1
∂G2
Оно и позволит нам доказать формулу Грина для всего множества G. Действительно, по свойству аддитивности двойных интегралов ¶ ¶ ¶ ZZ µ ZZ µ ZZ µ ∂Q ∂P ∂Q ∂P ∂Q ∂P − − − dx dy + dx dy = dx dy. ∂x ∂y ∂x ∂y ∂x ∂y G1
G2
G
Запишем границы множеств G, G1 , G2 : ^
^
∂G = Γ1 ∪ Γ2 , ∂G1 = Γ1 ∪ AB, ∂G2 = Γ2 ∪ BA . 105
Применив свойства КИ-2, преобразуем правую часть формулы (4.42): Z Z Z Z Z Z Z Z Z Z Z Z Z + = + + + = + + = + = + ∂G1
∂G2
Γ1
^
AB
Γ2
^
BA
Γ1
^
Γ2
AB
^
BA
Γ1
Γ2
∂G.
Для компактности записи мы опустили одинаковое подынтегральное выражение криволинейных интегралов — дифференциальную форму (4.21). Замечание 4.5. Формулу Грина можно доказать для произвольного множества G с кусочно-гладкой границей ∂G (она может состоять из нескольких замкнутых кривых). Замечание 4.6. Формула Грина является своеобразным обобщением формулы Ньютона-Лейбница, поскольку точки a, b составляют границу отрезка [a, b] на числовой прямой R. В полных курсах анализа рассматриваются и другие ее обобщения, связывающие различные типы интегралов (формулы Гаусса-Остроградского, Стокса).
4.5
Выражение площади плоской фигуры в прямоугольных и криволинейных координатах
Формула Грина (4.39) упрощает решение ряда задач, связанных с вычислением двойных интегралов. Укажем удобные способы нахождения площади плоской фигуры через криволинейный интеграл. Будем исходить из универсальной формулы ZZ s(G) = dx dy. (4.43) G
(см. (3.6)). Подбирая пары функций P (x, y), Q(x, y) так, чтобы ∂Q ∂P − = 1, ∂x ∂y Z s(G) = P dx + Qdy.
сможем записать
(4.44)
∂G
Функции P (x, y), Q(x, y) с условием (4.44) можно выбирать различными способами, например, так: a) P (x, y) = 0, Q(x, y) = x; b) P (x, y) = −y, Q(x, y) = 0; y x c) P (x, y) = − , Q(x, y) = . 2 2 Поэтому получаем следующие формулы вычисления площади плоской фигуры G : Z Z Z 1 s(G) = xdy = − ydx = xdy − ydx. (4.45) 2 ∂G
∂G
∂G
Напомним, что здесь граница ∂G множества G имеет положительную ориентацию. Теперь сможем доказать уже примененную в п. 3.6 формулу площади плоской фигуры через криволинейные координаты u, v ZZ s(G) = |J(u, v)| du dv. (4.46) G0
106
Связь между координатами x, y u, v определяется соотношениями ½ x = ϕ1 (u, v), y = ϕ2 (u, v), причем отображение ϕ(u, v) = (ϕ1 (u, v), ϕ2 (u, v)) регулярно на множестве G0 , G = ϕ(G0 ). ∂ 2y Будем также предполагать, что смешанная ЧП-2 непрерывна на G0 . Из регуляр∂u ∂v ности отображения ϕ следует, что якобиан J(u, v) сохраняет на множестве G0 знак. Действительно, J(u, v) — непрерывная, не обращающаяся на G0 в нуль функция. Пусть Γ0 , Γ = ϕ(Γ0 ) – границы множеств G0 , G соответственно. Это — кусочногладкие кривые (возможно, имеющие разные ориентации). Будем считать, что кривая Γ0 ориентирована положительно; она задана параметрически уравнениями ½ u = u(t), 0 Γ : t ∈ [α, β]. (4.47) v = v(t), Тогда кривая Γ определится так: ½ x = ϕ1 (u(t), v(t)), Γ: y = ϕ2 (u(t), v(t)), Обозначим
½ ε :=
t ∈ [α, β].
если ориентации Γ, Γ0 одинаковы, если ориентации Γ, Γ0 противоположны.
1, −1,
При выводе равенства (4.46) будем исходить из формулы Z s(G) = ε · x dy,
(4.48)
(4.49)
(4.50)
Γ
вытекающей из (4.45), (4.49). 1) Вначале преобразуем криволинейный интеграл формулы (4.50) в криволинейный интеграл по кривой Γ0 , уже в координатах u, v; 2) новый криволинейный интеграл преобразуем к двойному по формуле Грина. 1) Перейдем в криволинейном интеграле равенства (4.50) к определенному, опираясь на формулу (4.24) и параметризацию (4.48) кривой Γ : Zβ ϕ1 (u(t), v(t)) · ϕ02 (u(t), v(t)) dt. α
Преобразуем по формуле (2.34) производной сложной функции второй множитель подынтегрального выражения: ϕ02 (u(t), v(t)) =
∂ϕ2 (u(t), v(t)) 0 ∂ϕ2 (u(t), v(t)) 0 · u (t) + · v (t). ∂u ∂v
Приходим к формуле µ
Zβ s(G) = ε ·
ϕ1 (u(t), v(t)) ·
¶ ∂ϕ2 (u(t), v(t)) 0 ∂ϕ2 (u(t), v(t)) 0 · u (t) + · v (t) dt. ∂u ∂v
α
107
(4.51)
Введем дифференциальную форму P (u, v)du + Q(u, v)dv, где
∂ϕ2 ∂ϕ2 , Q(u, v) : = ϕ1 (u, v) · . (4.52) ∂u ∂v Снова применяя формулу (4.24) (теперь справа налево), убеждаемся, что определенный интеграл формулы (4.51) есть Z P (u, v)du + Q(u, v)dv. P (u, v) : = ϕ1 (u, v) ·
Γ0
Поэтому
Z P (u, v)du + Q(u, v)dv.
s(G) = ε ·
(4.53)
Γ0
2) Для применения формулы Грина преобразуем разность ∂Q ∂P (4.52) ∂ϕ1 ∂ϕ2 ∂ 2 ϕ2 ∂ϕ1 ∂ϕ2 ∂ 2 ϕ2 ∂ϕ1 ∂ϕ2 ∂ϕ1 ∂ϕ2 = − · +ϕ1 · − · −ϕ1 · = · − · = J(u, v) ∂u ∂v ∂u ∂v ∂v ∂u ∂v ∂u ∂u ∂v ∂u ∂v ∂v ∂u (при преобразованиях учтено равенство смешанных ЧП-2). Поэтому, окончательно, ZZ ZZ ZZ s(G) = ε · J(u, v) du dv = ε · J(u, v) du dv = [s(G) > 0] = |J(u, v)| du dv. • G0
G0
G0
Замечание 4.7. Попутно выявлен смысл знака якобиана при регулярном отображении: если J(u, v) > 0 (J(u, v) < 0), то сохраняется (изменяется) ориентация замкнутых кривых при переходе от координат x, y к координатам u, v.
4.6
Условия независимости криволинейного интеграла от пути интегрирования
Определение 4.6. Говорят, что криволинейный интеграл Z P dx + Q dy
(4.54)
Γ
не зависит на линейно связном множестве G от пути интегрирования, если его ^ значение одинаково вдоль всех кусочно-гладких кривых AB⊂ G, соединяющих две произвольные фиксированные точки A(x0 , y0 ), B(x, y) множества G. В этом случае применяют обозначения ZB
(x,y) Z
P dx + Q dy, A
P dx + Q dy. (x0 ,y0 )
Определение 4.7. Линейно связное множество G ⊂ R2 называется односвязным, если внутренность любой кусочно-гладкой замкнутой кривой Γ без точек самопересечения, лежащей во множестве G, также принадлежит этому множеству. Не односвязные плоские множества имеют хотя бы одну «дырку», возможно, точечную; примеры таких множеств – кольцо, плоскость с выколотой точкой. 108
∂P ∂Q , непрерывны на односвязном ∂y ∂x открытом множестве G. Тогда следующие условия равносильны: 10 ) криволинейный интеграл (4.54) не зависит на множестве G от пути интегрирования; 20 ) дифференциальная форма (4.21) является на множестве G (полным) дифференциалом некоторой функции U (x, y) : Теорема 4.3 Пусть функции P (x, y), Q(x, y),
∀ (x, y) ∈ G P (x, y) dx + Q(x, y) dy = dU (x, y); ∂P ∂Q = ; ∂y ∂x 40 ) вдоль любой кусочно-гладкой замкнутой кривой Γ ⊂ G Z P x + Q dy = 0. 30 )
∀ (x, y) ∈ G
(4.55) (A)
(4.56)
Γ
Доказательство проведем по схеме 10 ⇒ 20 ⇒ 30 ⇒ 40 ⇒ 10 . 10 ⇒ 20 . Так как дифференциал функции U (x, y) определяется формулой dU (x, y) =
∂U ∂U dx + dy, ∂x ∂y
то нужно доказать, что при выполнении условия 10 на множестве G существует такая дифференцируемая функция U (x, y), что ∂U ∂U = P (x, y), = Q(x, y). ∂x ∂y
∀ (x, y) ∈ G
(4.57)
Пусть A(x0 , y0 ) ∈ G, B(x, y) ∈ G. Введем криволинейный интеграл (x,y) Z
P dx + Q dy. (x0 ,y0 )
Зафиксировав начальную точку (x0 , y0 ), а конечную точку (x, y) считая, наоборот, переменной, приходим к функции (x,y) Z
U (x, y) : =
P dx + Q dy.
(4.58)
(x0 ,y0 )
Убедимся, что функция (4.58) является искомой. Докажем, исходя из определения ЧП-1 через предел, что справедливо первое из равенств (4.57). Второе равенство доказывается аналогично. Выбрав точку B(x, y) ∈ G, убедимся, что существует ∂U (x, y) . ∂x Для этого возьмем новую точку C(x + ∆x, y) так, чтобы отрезок [BC] ⊂ G, и преобразуем разность (4.58)
(x+∆x,y) Z
U (x + ∆x, y) − U (x, y) =
(x,y) Z
P dx + Q dy − (x0 ,y0 )
109
P dx + Q dy. (x0 ,y0 )
В силу условия 10 рассматриваемые криволинейные интегралы можно вычислить вдоль любых кусочно-гладких кривых, содержащихся в G и соединяющих начальную и конечную точки. Поэтому второй из криволинейных интегралов рассмотрим вдоль некоторой ^ выделенной кусочно-гладкой кривой Γ =AB⊂ G, а первый — вдоль кривой Γ ∪ [BC]. Тогда по свойствам криволинейных интегралов Z Z U (x + ∆x, y) − U (x, y) = P dx + Q dy − P dx + Q dy = Γ
Γ∪[BC]
Z =
Z
Z
P dx + Q dy + Γ
P dx + Q dy −
Z P dx + Q dy =
Γ
[BC]
P dx + Q dy. [BC]
Так как [BC] : y = const, t ∈ [x, x + ∆x], то по формуле (4.24) и теореме о среднем для определенных интегралов x+∆x Z
U (x + ∆x, y) − U (x, y) =
P (t, y) dt = P (x + ϑ · ∆x) · ∆x (0 6 ϑ 6 1). x
Поскольку при ∆x → 0 (x + ϑ · ∆x, y) → (x, y), то в силу непрерывности функции P на множестве G существует U (x + ∆x, y) − U (x, y) P (x + ϑ · ∆x, y) · ∆x = lim = lim P (x+ϑ·∆x, y) = P (x, y). ∆x→0 ∆x→0 ∆x→0 ∆x ∆x lim
20 ⇒ 30 . По условию 20 дифференциальная форма (4.21) есть дифференциал функции U (x, y), а ее ЧП-1 удовлетворяют равенствам (4.57). Преобразуем разность ³ ´ ¡ ¢ ∂U ∂ ∂ ∂U ∂y ∂Q ∂P (4.57) ∂ 2U ∂ 2U ∂x − = − = − . ∂x ∂y ∂x ∂y ∂y ∂x ∂x ∂y Так как смешанные ЧП-2 функции U (x, y) на открытом множестве G непрерывны (почему?), то они совпадают. Поэтому ∀ (x, y) ∈ G
∂Q ∂P − = 0, ∂x ∂y
что и означает справедливость условия (A). 30 ⇒ 40 . Зафиксируем некоторую замкнутую кусочно-гладкую кривую Γ ⊂ G. В силу односвязности множества G замкнутое множество D, ограниченное кривой Γ, содержится в исходном множестве G. Поэтому справедлива формула Грина ¶ ZZ µ Z ∂Q ∂P − dx dy = P dx + Q dy. (4.59) ∂x ∂y D
Γ
Так как по условию 30 подынтегральная функция двойного интеграла обращается в нуль на множестве D, то оба интеграла формулы (4.59) равны нулю. 40 ⇒ 10 . Убедимся, что при выполнении условия 40 криволинейный интеграл (4.54) не зависит на множестве G от пути интегрирования. Зафиксируем произвольно точки 110
A, B ∈ G и рассмотрим две кусочно-гладкие кривые Γ0 ⊂ G, Γ00 ⊂ G, соединяющие выбранные точки. Для завершения доказательства теоремы нужно проверить, что Z Z (4.60) P dx + Qdy = P dx + Qdy. Γ00
Γ0
1) Рассмотрим вначале простой случай, когда кривые Γ0 , Γ00 не имеют, кроме конечных, других общих точек. Тогда замкнутая кусочно-гладкая кривая Γ : = Γ0 ∪ Γ00− не имеет точек самопересечения и в силу условия 40 Z P dx + Qdy = 0. Γ
Используем свойства криволинейных интегралов: Z Z Z Z Z 0 = P dx + Qdy = P dx + Qdy + P dx + Qdy = P dx + Qdy − P dx + Qdy. Γ00 −
Γ0
Γ
Γ0
Γ00
Формула (4.60) доказана. 2) В случаях, когда кривые пересекаются в m (m ∈ N) точках, отличных от A, B, доказательство формулы (4.60) аналогично, только теперь возникает m + 1 замкнутая кривая с условием 40 . Достаточно рассмотреть ситуацию m = 1. Пусть Γ0 ∩ Γ00 = {A, B, M }. Вводя на кривых Γ0 , Γ00 новые точки, представим Γ0 = AK 0 M ∪ M L0 B,
Γ00 = AK 00 M ∪ M L00 B.
Рассмотрим кусочно-гладкие кривые без самопересечений Γ1 := AK 0 M ∪ M K 00 A, По условию 40
Γ2 := M L0 B ∪ BL00 M.
Z
Z = 0,
= 0,
Γ1
откуда
Γ2
Z
Z +
Γ1
Преобразуем последнее равенство: Z Z Z Z Z 0= + = + + Γ1
Γ2
AK 0 M
M K 00 A
Z
= AK 0 M
Z + M L0 B
Γ2
Z +
M L0 B
= 0.
Z =
BL00 M
Z
− AK 00 M
− AK 0 M
Z
Z
Z + M L00 B
+
AK 00 M
Z
=
−
M L0 B
=
M L00 B
Z −
Γ0
Z
. Γ00
Одинаковое подынтегральное выражение криволинейных интегралов — дифференциальную форму (4.21) мы опустили. • 111
Замечание 4.8. Соотношение (A) является удобным аналитическим условием справедливости каждого из утверждений 10 , 20 , 40 теоремы. Замечание 4.9. Условие односвязности множества G в теореме является существенным. Обоснуем это, рассматривая криволинейный интеграл Z x dy − y dx I= (4.61) x2 + y 2 Γ
вдоль окружности Γ : x2 + y 2 = R 2 Здесь P (x, y) = −
x2
(R > 0).
x y , Q(x, y) = 2 , G = R2 \ {(0, 0)}. 2 2 +y x +y
Так как ∂Q x2 + y 2 − 2x2 y 2 − x2 = = , ∂x (x2 + y 2 )2 (x2 + y 2 )2
∂P x2 + y 2 − 2y 2 y 2 − x2 ∂Q =− = = , 2 2 2 2 2 2 ∂y (x + y ) (x + y ) ∂x
то соотношение (A) справедливо. Поскольку окружность Γ охватывает «дырку» — точку (0, 0), то формулу (4.56) применить нельзя. Вычислим интеграл (4.61) непосредственно, используя стандартную параметризацию окружности ½ x = R cos t, t ∈ [α, 2π] : Γ: y = R sin t, Z2π I=
R cos t · R cos t + R sin t · R sin t dt = R2
0
Z2π dt = 2π 6= 0. 0
Интересно, что величина интеграла оказалась не зависящей от радиуса R окружности Γ. Пусть теперь Γ = Γ1 , где Γ1 — замкнутая кусочно-гладкая кривая, не охватывающая точки (0, 0) и не проходящая через нее. Тогда существует односвязное открытое множество G1 ⊂ G, внутри которого находится новая кривая Γ1 . Поэтому на множестве G1 теорема верна и в силу утверждения 40 Z x dy − y dx = 0. • x2 + y 2 Γ1
4.7
Первообразная дифференциальной формы, ее физический смысл
Теперь будем отталкиваться от утверждения 20 теоремы 4.3. Соотношение (4.55) можно рассматривать как обобщение на функции двух переменных равенства dF (x) = f (x) dx, определяющего функцию F (x) как первообразную функции f (x). Поэтому естественным является следующее Определение 4.8. Если выполнено условие (4.55), то функция U (x, y) называется первообразной дифференциальной формы (4.21) на множестве G. 112
В то время как первообразная F (x) существует для любой непрерывной на промежутке функции f (x), функция двух переменных U (x, y) является первообразной дифференциальной формы (4.21) лишь при выполнении условия (A). Теорема 4.4 Если функция U (x, y) является первообразной дифференциальной формы (4.21) на линейно связном открытом множестве G, то совокупность всех первообразных этой дифференциальной формы на множестве G задается равенством U (x, y) + C,
C ∈ R.
(4.62)
Доказательство. 1) Если U (x, y) — первообразная дифференциальной формы (4.21) на множестве G и, значит, справедливы соотношения (4.57), то при C = const ∂U (x, y) ∂(U (x, y) + C) ∂U (x, y) ∂(U (x, y) + C) = , = ∂x ∂x ∂y ∂y Поэтому каждая из функций (4.62) также является первообразной той же дифференциальной формы на множестве G. 2) Пусть U (x, y), V (x, y) — первообразные дифференциальной формы (4.21) на множестве G. Тогда, наряду с (4.57), справедливы соотношения ∀ (x, y) ∈ G
∂V ∂V = P (x, y), = Q(x, y). ∂x ∂y
(4.63)
Введем функцию h(x, y) : = V (x, y) − U (x, y). Из (4.57), (4.63) следуют равенства ∀ (x, y) ∈ G
∂h = 0, ∂x
∂h = 0. ∂y
Тогда по теореме 2.7 об условиях постоянства функций нескольких переменных ∀ (x, y) ∈ G h(x, y) = const = C0 . Поэтому и функция V (x, y) = U (x, y) + C0 содержится во множестве (4.62). • Следствие 4.6. (обобщенная формула Ньютона-Лейбница). Если U (x, y) — первообразная дифференциальной формы (4.21) на линейно связном открытом множестве G и (x0 , y0 ) ∈ G, (x1 , y1 ) ∈ G, то (xZ1 ,y1 )
P dx + Qdy = U (x1 , y1 ) − U (x0 , y0 ).
(4.64)
(x0 ,y0 )
Доказательство. При доказательстве теоремы 4.3 мы убедились, что функция 2 (x,y) Z
V (x, y) : =
P dx + Qdy
(4.65)
(x0 ,y0 ) 2
Из методических соображений нам теперь удобнее обозначить эту функцию символом V (x, y).
113
— также первообразная дифференциальной формы на множестве G. При этом V (x0 , y0 ) = 0 (почему?). По теореме 4.4 найдется такая константа C0 , что ∀ (x, y) ∈ G U (x, y) = V (x, y) + C0 .
(4.66)
Полагаем в формуле (4.66) (x, y) = (x0 , y0 ) : U (x0 , y0 ) = V (x0 , y0 ) + C0 = C0 , откуда находим C0 = U (x0 , y0 ). Подставляем теперь в формулу (4.66) (x, y) = (x1 , y1 ) : U (x1 , y1 ) = V (x1 , y1 ) + U (x0 , y0 ), поэтому V (x1 , y1 ) = U (x1 , y1 ) − U (x0 , y0 ). Отсюда уже следует искомая формула (4.64), поскольку (xZ1 ,y1 )
(4.65)
V (x1 , y1 ) =
P dx + Qdy. • (x0 ,y0 )
Формула (4.64) позволяет вычислять криволинейные интегралы (конечно, только в случае их независимости от пути интегрирования) через первообразную U (x, y). Обратимся теперь к нахождению первообразной. Общий способ уже известен и заключается в определении функции U (x, y) посредством формулы (4.58). Фиксируя различные точки (x0 , y0 ), приходим к разным первообразным, отличающимся на постоянные слагаемые. Вычислять интеграл (x,y) Z
P dx + Qdy (x0 ,y0 )
можно вдоль любой кусочно-гладкой кривой Γ ⊂ G, соединяющей точки (x0 , y0 ), (x, y). Во многих случаях удобно двигаться вдоль отрезков двух прямых, параллельных осям координат. Пусть, например, Γ = [AM ] ∪ [M B], M (x, y0 ). Тогда (x,y) Z
Z P dx + Qdy =
(x0 ,y0 )
Z P dx + Qdy +
[AM ]
P dx + Qdy.
[M B]
Так как в точках отрезка [AM ] y = y0 = const, то dy = 0 и Z
Zx P dx + Qdy =
P (x, y0 ) dx. x0
[AM ]
Вдоль отрезка [M B], наоборот, x = const. Поэтому Z
Zy P dx + Qdy =
Q(x, y) dy y0
[M B]
114
и приходим к формуле 3 Zx
Zy
U (x, y) =
P (x, y0 ) dx + x0
Q(x, y) dy.
(4.67)
y0
Замечание 4.10. Координаты начальной точки (x0 , y0 ) целесообразно выбирать достаточно простыми; если возможно, то следует полагать x0 = y0 = 0. Задание 4.2. Решить пример 4.2, опираясь на понятие первообразной дифференциальной формы. Дадим физическую интерпретацию материала, изложенного в пунктах 4.6-4.7. Как и в пункте 4.3, рассматриваем плоское силовое поле − → F (x, y) = (P (x, y), Q(x, y)). Напомним, что работа A(Γ) поля
− → F (x, y)
^
вдоль кривой Γ =BC определяется криволинейным интегралом (4.37). Определение 4.9. Если существует такая дифференцируемая функция U (x, y), − → что справедливо соотношение (4.55), то силовое поле F (x, y) называется потенциальным (или консервативным), а функция U (x, y) называется потенциальной функцией (потенциалом) поля. Так как для потенциального поля выполнены условия (4.57), то − → F (x, y) = (P (x, y), Q(x, y)) = grad U (x, y); поэтому потенциальное поле есть поле градиента потенциальной функции U (x, y). Сама потенциальная функция задается с точностью до постоянного слагаемого. Соот− → ношение (A) есть удобное аналитическое условие потенциальности поля F (x, y). Как вытекает из утверждений 10 , 40 теоремы 4.3, работа потенциального поля обладает специфическими свойствами. 1) Она не зависит от вида кривой, соединяющей точки точки B(x0 , y0 ), C(x1 , y1 ). Названная работа вычисляется либо через криволинейный интеграл (xZ1 ,y1 )
A=
P dx + Q dy,
(4.68)
(x0 ,y0 )
либо через потенциальную функцию A = U (x1 , y1 ) − U (x0 , y0 ) 3
(4.69)
Она записана не вполне корректно, поскольку в ее правой части одинаковыми символами обозначены и верхние пределы, и переменные интегрирования определенных интегралов. Этого недостатка лишена такая версия той же формулы: Zx U (x, y) =
Zy P (t, y0 ) dt +
x0
Q(x, t) dt; y0
она, однако, менее удобна для применения.
115
как разность значений потенциальной функции в конечной и начальной точках. 2) Работа потенциального поля вдоль любой замкнутой кусочно-гладкой кривой Γ ⊂ G равна нулю. Рассмотрим важное для приложений потенциальное поле — поле ньютоновского притяжения. Пример 4.3. Пусть в начале координат O(0, 0) плоскости R2 находится материальная точка массой m. Она создает в каждой точке M (x, y) 6= (0, 0) силу притяжения p − → µm F (x, y). Эта сила направлена к точке O, ее величина F = 2 . Здесь r = x2 + y 2 — r (евклидово) расстояние между точками M, O, µ = const. − → Найдем функции P (x, y) как проекции вектора F (x, y) на оси координат. Будем считать, что x > 0, y > 0, тогда P (x, y) 6 0, Q(x, y) 6 0. Пусть α — угол между −−→ − → −−→ векторами OM , ~i, F (x, y) = M K, D(x, 0), E — такая точка отрезка [M D], что KE⊥M D. Из прямоугольного треугольника ODM находим cos α =
x , r
y sin α = . r
Рассмотрим теперь подобный ему треугольник KEM, где ∠M KE = α : |KE| = |P (x, y)| = F cos α = µm
x y , |M E| = |Q(x, y)| = F sin α = µm 3 . 3 r r
Поэтому P (x, y) = −µm Так как
x = −µm q r3
x (x2 + y 2 )3
, Q(x, y) = −µm
y = −µm q r3
y (x2 + y 2 )3
.
µ ¶ ∂Q 3 xy = −µmy − (x2 + y 2 )−5/2 (2x) = 3µm 2 , ∂x 2 (x + y 2 )5/2 µ ¶ ∂P 3 xy ∂Q = −µmx − (x2 + y 2 )−5/2 (2y) = 3µm 2 = , 2 5/2 ∂y 2 (x + y ) ∂x
то поле потенциально. Найдем потенциальную функцию по формуле (4.67), полагая x 1 x0 = 1, y0 = 0. Поскольку P (x, y0 ) = P (x, 0) = −µm 3 = −µm 2 , то x x 1 U (x, y) = − µm
Zx 1
=
dx − x2
Zy
ydy = 2 (x + y 2 )3/2
µ
1 x | x 1
¶
1 − 2
0
Zy (y 2 + x2 )−3/2 d(y 2 + x2 ) = 0
¯ 1 1 1 1 1 1 − 1 − (−2)(y 2 + x2 )−1/2 ¯y=y −1+ p − = − 1. y=0 = 2 2 x 2 x x r x +y
Отбрасывая постоянное слагаемое, приходим к формуле U (x, y) =
µm . r ^
Поэтому работа рассматриваемого поля вдоль кривой Γ =BC определяется расстояниями q q 2 2 r0 = x0 + y0 , r1 = x21 + y12 116
ее начальной и конечной точек до точки O и выражается формулой µ ¶ 1 1 − A = µm . r1 r0 Задание 4.3. Доказать потенциальность поля силы тяжести − → F = (0, −g), найти формулу работы этого поля. Замечание 4.11. Построенная здесь теория двойных интегралов и криволинейных интегралов вдоль плоских кривых обобщается на произвольный n-мерный случай (n > 2). При этом вводятся также поверхностные интегралы первого и второго рода.
117
Библиографический список [1] Кудрявцев Л.Д. Краткий курс математического анализа. М.: Наука, 1989. 735 с. [2] Фихтенгольц Г.М. Основы математического анализа. Т. 1. М.: Наука, 1968. 440 с. Т. 2. М.: Наука, 1964. 463 с. [3] Уваренков И.М., Маллер М.З. Курс математического анализа. Т.2. М.: Просвещение, 1976. 479 с. [4] Зорич В.А. Математический анализ. Т. 1. М.: Наука, 1981. 543 с. [5] Зорич В.А. Математический анализ. Т. 2. М.: Наука, 1984. 640 с. [6] Бохан К.А., Егорова И.А., Лащенов К.В. Курс математического анализа. Т.2. М.: Просвещение, 1966. 380 с. [7] Райков Д.А. Многомерный математический анализ. М.: Высшая школа, 1981. 271 с. [8] Метрические пространства: Метод. разработка/ Сост. С.П.Охезин. -Свердловск, СГПИ, 1985. 46 с. [9] Берман Г.Н. Сборник задач по курсу математического анализа. М.: Наука, 1969. 439 с. [10] Демидович Б.П. Сборник задач и упражнений по математическому анализу. М.: Наука, 1972. 544 c.
118
Подписано в печать Формат 60х84/16. Бумага для множ. аппаратов. Печать на ризографе. Усл. печ. л. Тираж 00 экз. Заказ Оригинал-макет изготовлен и отпечатан в отделе множительной техники Уральского государственного педагогического университета 620017 Екатеринбург, просп. Космонавтов, 26 E-mail:
[email protected]