Российский государственный университет нефти и газа имени И. М. Губкина Кафедра высшей математики
В.Т. Харин, М.Г. Голи...
21 downloads
211 Views
5MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Российский государственный университет нефти и газа имени И. М. Губкина Кафедра высшей математики
В.Т. Харин, М.Г. Голицына, Е.С. Калашникова, И.С. Новикова
МАТЕМАТИКА в нефтегазовом образовании ТЕОРИЯ И ЗАДАЧИ
ВЫПУСК 2 Дифференциальное исчисление функций одной переменной Аналитическая геометрия Линейная алгебра
Москва 2003
Предисловие Высшая математика в среде студентов традиционно считается одной из наиболее трудных для усвоения дисциплин. Сложность, в основном, связана с использованием математического аппарата, методов исследования, приемов решения задач, которые значительно выходят за рамки описаний, принятых и применяющихся в привычной, «нематематизированной», жизни. Особенно трудно приходится тем, которые, обучаясь в средней школе, по каким-либо причинам
упустили
математики.
основы
Насыщенная
используемых
программа
там
вузовского
понятий обучения
элементарной практически
оставляет очень мало времени на восстановление имеющихся пробелов. Времени обычно не хватает даже на осмысление вновь проходимого материала: лекции, практические занятия, контрольные, зачеты, экзамены − гонка, завершающаяся только на третьем курсе, когда математика уже “пройдена”. … А дальше − другие заботы. Оглянуться назад некогда. Вот как описывается разница в восприятии времени подростком и пожилым человеком. Для подростка это: первый урок, перемена, второй урок, опять перемена …. Для человека, умудренного годами, время бежит в другом темпе: зима, весна, лето, осень, … . Студенты, скорее всего, занимают промежуточное положение. В результате к середине вузовского периода жизни у многих из них возникает некоторая сумятица, неуверенность в себе, истинное или кажущееся неумение решать даже сравнительно простые задачи, слабое представление об использовании математики в смежных и специальных дисциплинах. А ведь всё это, как принято сейчас говорить, «лечится»! Надо только остановится в гонке, и осмыслить ту информацию, которая была получена ранее в курсе высшей математики. При этом вовсе не обязательно вникать в суть доказательств приводящихся утверждений и теорем, скорее, более важно обратить внимание на введенные определения, на ход рассуждений, на приемы решения задач. В любом возрасте, на каждом этапе жизненного пути, такие краткие остановки иногда необходимы.
1
Пособие «Математика. Теории и задачи», выпущенное на кафедре высшей математики РГУ нефти и газа им. И.М. Губкина, как раз и представляется изданием, которое позволяет читателю (студенту, аспиранту, специалисту, преподавателю) остановиться, чтобы осмыслить великую и «ужасную» науку − МАТЕМАТИКУ. Пособие уникально в том смысле, что оно может быть полезно и для тех, кто в данное время изучает вузовский курс высшей математики, и для тех, которые этот курс формально давно (или недавно) завершили и даже получили вполне устраивающие их оценки, но при этом хотят понять: чему же их, собственно, обучали на заре их студенческой юности − на первом-втором курсах (когда, по терминологии, принятой на Западе, они были “freshmen”, или, по-нашему, «свеженькими»). Несомненна польза этой книги при подготовке к аспирантуре и магистратуре: ведь многим в процессе дальнейшего обучения предстоит решать задачи, связанные с серьезным математическим аппаратом. А уж специалисты, профессионально работающие в математике − преподаватели, исследователи − несомненно, найдут для себя много новых, неожиданно осмысленных подходов, и получат истинное удовольствие от прочтения рукописи. Второй выпуск пособия, в основном, посвящен математическим понятиям, стоящим на стыке школьной и вузовской программ, и изучаемым в самом начале вузовского курса высшей математики. Однако даже известные из средней школы положения здесь рассмотрены без присущей школьному курсу поверхностности. В издание, кроме того, включены некоторые вопросы, традиционно
изучаемые
в
курсах
функционального
анализа,
которые
преподаются далеко не на каждой специальности и не на каждом факультете. Дело вкуса читателя, с какой степенью внимательности и тщательности работать над этой книгой. Ее можно читать как беллетристику, можно прорабатывать и разбирать интересующие разделы, пытаясь ответить на приведенные в каждой главе теоретические вопросы, можно рассматривать как руководство по решению задач.
2
Это издание задумал, разработал и воплотил в жизнь замечательный человек и ученый, заведующий кафедрой высшей математики РГУ нефти и газа им. И.М. Губкина, профессор Виталий Тимофеевич Харин. В книге − результат его многолетнего опыта преподавания математики и смежных с ней дисциплин в нашем ВУЗ’е и в институтах зарубежных стран, где ему довелось работать. Он всегда верил, что в каждой студенческой группе есть люди, которые относятся к изучаемым предметам (и к математике, в частности) не просто как к ничего не значащей, формальной ступеньке, обозначенной лишь строчкой в зачетной книжке, а − творчески, с желанием узнать, откуда берется то или иное понятие, и чему оно приводит. Такие студенты, как переживал Виталий Тимофеевич, иногда находятся в своих группах, на своем факультете в меньшинстве, но именно они должны определять лицо института, и именно они, зачастую, недополучают знаний в процессе своего обучения. Ведь, что греха таить, основная работа преподавателей ВУЗ’а ориентирована на тех, кто послабее, кто самостоятельно не может справиться с курсом. А на ребят, желающих узнать предмет больше и глубже, мы, преподаватели, зачастую обращаем значительно меньше внимания. Вот для таких творческих и ищущих личностей и написана эта книга. Профессор В.Т. Харин не успел только самую малость − собрать материал этого выпуска воедино и окончательно отредактировать рукопись. Это пособие было его последней остановкой и взглядом назад. Постараемся доделать задуманное им. В.В. Калинин
Материалы, связанные с данным изданием, можно найти на сайте кафедры высшей математики РГУ нефти и газа им. И.М. Губкина:
http://kvm.gubkin.ru/Index.html
3
ОГЛАВЛЕНИЕ Предисловие
1
Оглавление
4
Глава 1. Теория пределов
6
1.1. Числовые последовательности
6
1.2. Предел функции
22
1.3. Свойства непрерывных функций
34
1.4. Асимптотическое сравнение функций
45
Теоретические вопросы к главе 1.
53
Задачи к главе 1.
56
Глава 2. Производные и дифференциалы
64
2.1. Исходные понятия
64
2.2. Основные правила дифференцирования
70
2.3. Теоремы о конечных приращениях
78
2.4. Производные и дифференциалы высших порядков. Формула Тейлора
83
Теоретические вопросы к главе 2.
93
Задачи к главе 2.
95
Глава 3. Исследование функций с помощью производных
101
3.1. Экстремумы и монотонность
101
3.2. Выпуклость и точки перегиба
108
3.3. Наклонные асимптоты. Общая схема исследования функции
110
Теоретические вопросы к главе 3.
113
Глава 4. Точки и векторы. Метод координат
115
4.1. Геометрические векторы
115
4.2. Векторные пространства
124
4
4.3. Системы линейных алгебраических уравнений и их исследование методом Гаусса
126
4.4. Координаты точек
134
4.5. Аналитическое представление прямой линии
138
4.6. Аналитическое представление плоскости
143
4.7. Полярные координаты
149
Теоретические вопросы к главе 4.
151
Глава 5. Измерения в векторном пространстве
154
5.1. Скалярное умножение геометрических векторов
154
5.2. Ориентация в пространстве. Векторное умножение геометрических векторов. Смешанное умножение
161
5.3. Определители
167
5.4. Приложения теории определителей к изучению матриц и систем линейных уравнений
178
5.4.1. Ранг матрицы
178
5.4.2. Критерий совместности систем линейных уравнений
183
5.4.3. Крамеровские системы уравнений
184
5.4.4. Анализ линейной системы уравнений общего вида
186
Теоретические вопросы к главе 5.
188
Глава 6. Линейные операторы
190
6.1. Определения. Действия над линейными операторами
190
6.2. Линейные операторы в конечномерных пространствах
194
6.3. Обращение линейных операторов и матриц
200
6.4. Преобразование координат вектора и матрицы оператора при смене базиса
205
6.5. Собственные числа и собственные векторы линейного оператора
211
Теоретические вопросы к главе 6.
213
Глоссарий
215
5
Глава 1. Теория пределов 1.1. Числовые последовательности Пусть дано некоторое множество Х. Сопоставим каждому натуральному числу n ∈ какой-либо определенный элемент xn ∈ X . Получится функция
xn = f (n) :
→X.
(1)
Такая функция называется бесконечной последовательностью элементов из X. Для краткости мы будем в дальнейшем говорить просто последовательность. Чтобы знать последовательность, достаточно знать все элементы x1 , x2 , x3 , … , xn , … (члены последовательности для всех номеров 1, 2, 3, …, n, …). Поэтому последовательность часто определяют как упорядоченный (т.е. пронумерованный последовательными натуральными числами) набор элементов из множества X. В этой главе мы будем рассматривать только числовые последовательности, т.е. такие, что xn - это числа. Существуют два способа наглядной интерпретации числовой последовательности xn = f (n) . Первый из них – геометрический. Это просто график функции
xn = f (n) , представляющий собой неподвижную картинку. Второй
можно назвать кинематическим: на оси x отмечаются все значения xn , и около каждого из них отмечается номер n, которому это значение соответствует. При желании n можно понимать как дискретные значения времени (например, 1 с, 2 с., 3 с и т.д.), а xn – как положение движущейся (перескакивающей со временем из одного положения в другое) точки. ПРИМЕР 1. Стационарная последовательность, или константа (рис.1)
a, a, a, ... , где
(2)
а – фиксированное число.
6
xn
0
а n 1
2
3
4
a x1, x2, x3, …, xn, …
5 (б)
(а)
Рис.1 Стационарная последовательность ПРИМЕР 2. Арифметическая прогрессия
xn = a + d (n − 1) ,
(3)
где а, d - фиксированные числа (параметры прогрессии). Рис.2 а,б соответствует прогрессии с d > 0, а рис. 2 в,г – прогрессии с d < 0. xn
xn
0
0 1
а 1
2
3
4
5
6
2
3
4
5
6
7
7
(а)
(в)
0 … x1 x2 x3 x4 x5 x6 x7 … xn
0 … x7 x6 x5 x4 x3 x2 x1 … xn
(б)
(г)
Рис. 2. Арифметическая прогрессия ПРИМЕР 3. Геометрическая прогрессия
xn = aq n −1 , где
a, q − фиксированы. См. рис.3 а,б,в,г. 7
(4)
xn
xn
q = 1/2
q = – 1/2
n
1 2 3 4 5 6 7 n
1 2 3 4 5 6 7 (а)
(в)
0
0
… x4 x3
x2
x1
xn
x2
(б)
x4 x5
x3
x1
xn
(г)
Рис.3. Геометрическая прогрессия. ПРИМЕР 4. Последовательности десятичных приближений к числу π с недостатком
3; 3,1; 3,14; 3,141; 3,1415; 3,14159; 3,141592; 3,1415926; ... и с избытком
4; 3, 2; 3,15; 3,142; 3,1416; 3,14160; 3,141593; 3,1415927; ... . Этот пример напоминает нам, что бесконечные последовательности изучаются не из абстрактных соображений: конкретное (и весьма важное для практики) число π может быть введено только как результат бесконечного количества приближений к нему. Конечной последовательностью тут не обойдешься. Именно поведение последовательности при неограниченно растущих номерах её членов (как говорят, асимптотическое поведение последовательности при n → ∞) имеет главное значение. Одна из характеристик асимптотического поведения последовательности – это ее "ограниченность" или "неограниченность". Числовая последовательность называется ограниченной (ограниченной снизу, ограниченной сверху), если ограничено (ограничено снизу, ограничено сверху) множество значений этой последовательности. 8
Напомним, что множество M точек числовой оси называется ограниченным сверху (ограниченным снизу), если все числа, принадлежащие множеству M, меньше или равны (больше или равны) некоторого фиксированного числа C. Множество M называется просто ограниченным, если оно ограничено и сверху и снизу. ПРИМЕР 5. Стационарная последовательность (2) ограничена. В самом деле, множество ее значений состоит из единственного числа а. ПРИМЕР 6. Арифметическая прогрессия (3) ограничена снизу и неограничена сверху в случае d > 0 (действительно, добавляя к а число d достаточно много раз, мы, очевидно, превысим любое заранее заданное число). Если же d < 0, то арифметическая прогрессия неограничена снизу и ограничена сверху по аналогичной причине. Любая арифметическая прогрессия неограничена. (Любая ли? Может быть, есть исключение?) ПРИМЕР 7. Геометрическая прогрессия (4) ограничена, если q ≤ 1 и не ограничена, если q > 1 . В самом деле, xn = a ⋅ q
q > 1 , то q
n −1
q = 1+α
n −1
. Поэтому xn ≤ a при q ≤ 1 .
Если же
, где α > 0, и тогда
= (1 + α )n −1 = 1 + (n − 1)α +
(n − 1)(n − 2) 2 α + ... + α n −1 > 1 + (n − 1)α 2
по формуле бинома Ньютона. Тем самым xn
растет быстрее, чем некоторая
арифметическая прогрессия. ПРИМЕР 8. Обе последовательности примера 4 ограничены. Например, первая потому, что все ее члены не меньше 3, но, очевидно, не более 4. Заметим, что любая конечная числовая последовательность ограничена. Для бесконечной же последовательности свойство быть ограниченной (в том или ином смысле) не меняется, если отбросить любое конечное число ее первых членов. Это подтверждает, что свойство ограниченности – асимптотическое свойство последовательности. Мы подошли к самому важному определению настоящего раздела.
9
Числовая последовательность xn называется сходящейся к числу а, если разность между xn и а с ростом номера п становится как угодно малой (см. рис.4). Точнее – если для любого заданного числа ε > 0 найдется номер N ( ε ) такой, что при n ≥ N ( ε ) выполняется соотношение xn − a < ε . При этом число а называется пределом последовательности xn . С помощью сокращающих символов ∀ (для любого) и ∃ (найдется) это определение выражается следующим образом: ∀ε > 0 ∃N (ε ) : {n ≥ N (ε )} ⇒ { xn − a < ε } . (5) Его можно сформулировать еще и так: последовательность xn сходится к а, если для любого ε > 0 все ее члены, начиная с некоторого номера, лежат в ε-окрестности точки а. Факт сходимости xn к а записывается одним из следующих способов:
a = lim xn ; п →∞
xn → a при п → ∞ .
(6)
Символ lim – это сокращение латинского слова limes – предел. Последовательность, не имеющая предела, называется расходящейся. Геометрически (на графике функции xn = f (n) ) утверждение (6) означает: какую бы полосу a − ε < x < a + ε вокруг прямой х = а мы ни выбрали, найдется номер N (ε ) такой, что при n ≥ N (ε ) все точки графика попадают в указанную полосу (см. рис. 4). xn
ε1
ε2
ε3
ε1
ε2
ε3
а
N(ε1)
N(ε2)
N(ε3)
n
Рис. 4. К определению предела последовательности.
10
1
= 0. n2 Решение. Выберем произвольное число ε > 0 . Надо доказать, что нера1 − 0 < ε выполняется для всех натуральных n, начиная с некоторовенство n2 го. Для этого следует просто решить это неравенство относительно п, считая ε 1 заданным. Очевидно, это неравенство переписывается в виде < ε или, еще n2 1 1 проще, в виде n 2 > . Отсюда n > . Т.е. исходное неравенство выполняетПРИМЕР 9. Доказать, что lim
п →∞
ε
ε
ся для всех натуральных чисел, превосходящих 1 \ ε . Например, при ε = 0,1 должно
быть
n>
N ( ε ) = N ( 0,1) = 4 , n>
1 = 10 = 3,16... . 0,1 неравенство
Значит,
верно.
Если
начиная же
с
номера
ε = 0, 01 ,
то
1 = 100 = 10 . Следовательно, N ( 0, 01) = 11 . 0, 01
n → 1 при п → ∞. n +1 Решение. Аналогично предыдущему примеру имеем неравенство n n − (n + 1) − 1 < ε . Упрощая его, получаем последовательно: 0 с ростом номера п. Следовательно, надо рассмотреть неравенство a q
n −1
< ε относительно неизвестного п при задан-
ных а, |q|
a
ε
.
(7) n −1
1 > 1 + ( n − 1)α с положительДействуя, как в примере 7, замечаем, что q a ным α. Очевидно, если будет 1 + (n − 1)α > , то выполнится и (7). Значит,
ε
при
a 1 n > 1 + − 1 получим aq n −1 − 0 , что и требовалось. ε α Выводы: lim аq n −1 = 0 при q < 1 ,
п →∞
lim аq n −1 = a при q = 1.
п →∞
В остальных случаях геометрическая прогрессия расходится. ПРИМЕР 14. Вернемся к приближенным значениям числа π (пример 4). По самой идее построения этих значений (заключение точки π числовой оси в 1 1 1 интервалы длиной 1, , , ..., , ... ) ясно, что разность между π и его n 10 102 10 приближениями делается, с ростом номера приближения, меньше любого числа. Это значит, что π есть предел последовательности своих десятичных приближений. Очевидно, это верно не только для π , но и для любого другого числа. Закончив с серией примеров, поставим следующий вопрос: пусть дана последовательность xn . Как узнать, сходится ли она, и если да, то каков ее предел. Пока для этого у нас есть один инструмент – само определение сходимости 13
последовательности. Чтобы пользоваться им, надо иметь число а – "претендента" на звание предела. Тогда мы можем рассмотреть неравенство xn − a < ε и попытаться решить его относительно неизвестного п. Если удается показать, что при любом ε > 0 ему удовлетворяют все п, начиная с некоторого N (ε ), то a = lim xn . Если окажется, что хотя бы при одном ε > 0 это не так, то а не явп →∞
ляется пределом xn . А что делать, если "претендент" не виден? Как, не зная его, решить поставленный нами вопрос? На этот счет имеются различные рецепты. Они называются признаками сходимости (или расходимости). Самые важные и практичные из них мы ниже рассмотрим. Впрочем, один такой признак мы уже знаем – это теорема 2. Если удастся установить неограниченность последовательности, то она, в силу этой теоремы, наверняка расходится. Теорема 3 (о связи операции перехода к пределу числовой последовательности с арифметическими операциями). Рассмотрим числовые последовательности xn и yn . Если существуют пределы lim xn и lim yn , то: п →∞
п →∞
а) Существует предел последовательности
xn + yn
(суммы данных
последовательностей), причем
lim ( xn + yn ) = lim xn + lim yn
п→∞
n→∞
n→∞
(8)
б) Существует предел последовательности xn ⋅ yn (произведения данных последовательностей), причем
lim ( xn ⋅ yn ) = lim xn ⋅ lim yn
п→∞
n→∞
n→∞
(9)
в) Если, к тому же, lim yn ≠ 0 , то, начиная с некоторого номера, опреп →∞
делена последовательность
хп (отношение данных последовательностей). уп
Она сходится, причем
lim x xn n→∞ n = lim lim yn п →∞ yn
(10)
n →∞
14
Доказательство. Введем обозначения lim xn = x и lim yn = y и зап →∞
п →∞
фиксируем число ε > 0 . а) Оценим разность ( xn + yn ) − ( x + y ) . Имеем
( xn + yn ) − ( x + y ) = ( xn − x) + ( yn − y ) ≤ xn − x + yn − y . Найдутся номера N (ε ) и N′ (ε ) такие, что n ≥ N (ε ) ⇒ xn − x
0 такое, что y < M ′ . Поэтому
xn yn − xy < M yn − y + M ′ xn − x . Подберем номера n0 и n0′
так, чтобы
n ≥ n0 ⇒ yn − y
1 1 1 y . Оценим теперь разность − . 2 yn y
Имеем при n ≥ n0 : 15
y − yn 2 y − yn y − yn 1 1 . − = = < 2 yn y yn y yn y y 2
y ε . Поэтому y − yn < 2
Начиная с некоторого номера n0′ можем написать
{
при n ≥ max n0 , n0′
}
2
получаем
1 1 2 y ε − < ⋅ = ε . Таким образом, 2 yn y 2 y
1 1 = . По доказанному в пункте б) имеем: y п→∞ yn lim
x x 1 1 ∃ lim n = lim ( xn ⋅ ) = lim xn ⋅ lim = . yn y п →∞ yn n→∞ n→∞ n→∞ yn Этим доказательство теоремы завершается. Заметим, что эта теорема не только дает достаточные условия для сходимости некоторых последовательностей (сумм, произведений и отношений сходящихся последовательностей), но и формулы для вычисления их пределов. Следствие. Если xn → x и yn → y при n → ∞ , а α и β - два числа, то α xn + β yn → α x + β y при n → ∞ . Это свойство называется линейным свойством сходящихся последовательностей. В частности, xn − yn → x − y , если xn → x и yn → y . ПРИМЕР 15.
n +1 1 1 1 n +1 2 1 − = lim − 2 lim = ⋅1 − 2 ⋅ 0 = lim 3 n→∞ 3n n→∞ n 2 3 n 2 3 n→∞ n (см. примеры 9,10). 1 1 lim 3 − 3− n 3 n = n→∞ lim = . ПРИМЕР 16. 1 4 1 n→∞ 4+ 2 lim 4 + 2 n n→∞ n
2n . n→∞ 2n − 1 Здесь нельзя непосредственно применить теорему о пределе отношения, т.к. и числитель, и знаменатель предела не имеют, они неограничены. В таких случаях говорят, что асимптотика последовательности представляет собой ПРИМЕР 17. Вычислить lim
16
неопределенность типа
∞ . Однако, простое преобразование решает эту за∞
дачу:
lim 1 2n 2n 1 1 1 n →∞ = lim ⋅ = lim = = = 1. lim 1 1 1 1 n →∞ 2n − 1 n→∞ 2n n→∞ 1 − 1− lim 1 − 2n 2n n→∞ 2n ПРИМЕР 18. Идея предыдущего примера работает во всех случаях, когда ищется предел отношения многочленов относительно п – надо вынести за скобки старшую степень п и вверху и внизу:
3 5 6 n3 2 − 3 + 4 − (2n − 3)(3n + 5)(4n − 6) n n n 2 ⋅3⋅ 4 = lim = = 8. lim 3 1 1 n→∞ n→∞ 3n3 + n − 1 3 n 3 + 2 − 3 n n ПРИМЕР 19. Ту же идею можно использовать и при раскрытии неопре∞ в некоторых иррациональных выражениях. Вычислим пределенности вида ∞ дел
L = lim
3
n + 1 − n3 + 1
n→∞ 4 n + 1 − 5 n5
.
+1 Вынесем из-под радикалов старшую степень п и вверху и внизу. Очевидно, что это первая степень. Получим: 1 1 1 + 2 − 3 1+ 3 n n n n . L = lim n →∞ 1 1 1 n 4 3 + 4 − 5 1+ 5 n n n −1 Неопределенность исчезла, и окончательно имеем L = = 1. −1 Теорема 4 (о переходе к пределу в неравенствах). Пусть x = lim xn и y = lim yn . Если, начиная с некоторого номера, п→∞
п→∞
xn ≤ yn , то x ≤ y . Если x < y , то xn < yn , начиная с некоторого номера.
17
Доказательство. Рассмотрим первое утверждение. Если предположить, что x > y , то (см. рис.6) взяв окрестности точек х, у с радиусами, мень-
1 ( x − y ) , получим, что yn < xn при больших п. Это противоречит усло2 вию. Доказательство второго утверждения очевидно из рис.7. шими
yn y
xn
xn x
x
yn y
Рис.6. Рис.7. К доказательству теоремы 4. Теорема 5 (признак Вейерштрасса существования предела последовательности). Если числовая последовательность xn ограничена сверху, и ее члены не убывают ( xn +1 ≥ xn ), начиная с некоторого номера, то она сходится. Мы не будем приводить строгого доказательства этой теоремы. Сошлемся на ее интуитивную очевидность (если точки xn с ростом номера п могут двигаться только в одну сторону по оси х, причем их суммарный сдвиг ограничен, то они вынуждены вплотную подойти к некоторой фиксированной точке). Заметим только, что заключение теоремы, очевидно, остается в силе, если последовательность xn ограничена снизу, и ее члены не возрастают ( xn +1 ≤ xn ). ПРИМЕР 20. Рассмотрим последовательность
1 xn = lim 1 + n п →∞
n
( n = 1, 2,3,...)
(11)
и докажем, что она сходится, используя признак Вейерштрасса. Теорему о пределе произведения здесь применить нельзя, поскольку число сомножителей не постоянно, а зависит от п. Получается "неопределенность вида 1∞ ". С помощью бинома Ньютона запишем
n( n − 1)...( n − k + 1) 1 1 n( n − 1) 1 ⋅ 2 + ... + ⋅ k +…+ xn = 1 + n ⋅ + n k! 2! n n n n n −1 1 n n −1 n − k +1 1 n( n − 1) ⋅ ... ⋅ 2 ⋅ 1 1 ⋅ + ... + ⋅ ⋅ ... ⋅ ⋅ +…+ + ⋅ n = 1+ + ⋅ n n n n n n k! 2! n! n 18
n n −1 n − ( n − 1) 1 + ⋅ ⋅ ... ⋅ ⋅ = n n n n! 1 1 1 2 k −1 1 = 1 + 1 + 1 − ⋅ + ... + 1 − ⋅ 1 − ⋅ ... ⋅ 1 − ⋅ +…+ n k! n 2! n n 1 2 n −1 1 + 1 − ⋅ 1 − ⋅ ... ⋅ 1 − ⋅ . n n! n n Если заменить в этих формулах п на п + 1, то в получающейся сумме каждое выражение в скобках будет больше соответствующего выражения для xn . Кроме того, в сумме будет на одно слагаемое больше. Поэтому xn +1 ≥ xn . Осталось доказать ограниченность последовательности xn . Продолжая выкладку, имеем
xn < 2 +
1 1 1 + ... + + ... + . k! n! 2!
1 1 1 = < , где в знамеn ! 1 ⋅ 2 ⋅ 3 ⋅ ... ⋅ n 2 ⋅ 2 ⋅ ... ⋅ 2 нателе имеются п – 1 одинаковых множителей. Таким образом, суммируя геометрическую прогрессию, находим
Но для любого п справедлива оценка
1 1 − n −1 1 1 1 1 + ... + = 2+ ⋅ 2 < 3. xn < 2 + + n −1 1 2 22 2 2 1− 2 Итак, последовательность xn не убывает и ограничена сверху. Поэтому она сходится. Ее предел обычно обозначают буквой е : n
1 lim 1 + = e n п →∞
(12)
Можно показать, что число е иррационально. Из наших выкладок видно, что 2 < e < 3. Расчеты показывают, что
e = 2,718281828459045… В математике регулярно применяются логарифмы по основанию е. Они называются натуральными логарифмами. Применяется специальный символ (13) ln x = log e x . 19
Еще один признак сходимости последовательности: Теорема 6 (о двух милиционерах). Если lim xn = lim zn = a и для всех п →∞
n→∞
номеров n, начиная с некоторого, xn ≤ yn ≤ zn , то ∃ lim yn = a . п→∞
Доказательство. Зафиксируем ε > 0. Начиная с некоторого номера имеем
xn − a < ε ,
zn − a < ε
и
−ε < xn − a ≤ yn − a ≤ zn − a < ε , т.е.
yn − a < ε , что и требуется. Среди всех сходящихся числовых последовательностей особой популярностью в теоретических рассуждениях и практических выкладках пользуются бесконечно малые последовательности, т.е. последовательности, сходящиеся к нулю. Причина этого объясняется следующим утверждением. Теорема 7. lim xn = x ⇔ xn = x + α n , где последовательность αп бескоп →∞
нечно мала. Доказательство. Чтобы убедиться в эквивалентности двух соотношений, фигурирующих в формулировке теоремы, достаточно записать на ε -языке, что они означают. А они означают, что начиная с некоторого номера для любого ε > 0 выполняются соответственно неравенства xn − x < ε и ( xn − x) − 0 < ε . Ясно, что эти неравенства совпадают. Теорему можно высказать иначе: члены сходящейся последовательности отличаются от её предела на бесконечно малую. Можно также сказать: член сходящейся последовательности xn можно приближенно заменить пределом этой последовательности; абсолютная ошибка такого приближения бесконечно мала при п → ∞. ПРИМЕР 21. Последовательности
1 ; n
( −1)n
n
1 ; q при q < 1; 1 + − e ; xn = 0 n n2 n
бесконечно малы. Убедитесь в этом.
20
Если
xn → 0
и все xn , начиная с некоторого, положительны, то
последовательность xn называют положительной бесконечно малой и пишут
lim xn = +0 или "xn → +0 при п → ∞ " .
п →∞
Аналогично определяется отрицательная бесконечно малая последовательность, для которой пишут:
lim xn = −0 или "xn → −0 при п → ∞ " .
п →∞
ПРИМЕР 22. Из последовательностей примера 21 выберите положительные бесконечно малые и отрицательные бесконечно малые. Последовательность xn называют бесконечно большой, если последовательность
1 бесконечно мала. хп
Поскольку неравенства
1 1 < ε и xn > эквивалентны, то высказанε хп
ное определение эквивалентно утверждению: последовательность бесконечно велика, если ее члены с ростом номера становятся по абсолютной величине больше любого числа. Тот факт, что последовательность бесконечно велика, записывают обычно так:
lim xn = ∞ , или “xn→ ∞ при n → ∞”.
п→∞
Если, при этом, начиная с некоторого номера, xn > 0 , то говорят, что xn – положительная бесконечно большая последовательность. Это пишут как
lim xn = +∞ , или “xn→ + ∞ при n → ∞”.
п→∞
Аналогично определяется отрицательная бесконечно большая последовательность, для которой пишут
lim xn = −∞ , или “xn→ − ∞ при n → ∞”.
п→∞
ПРИМЕР 23. Из последовательностей примера 21 образуйте бесконечно большие последовательности. Выберите из полученных последовательностей положительные бесконечно большие и отрицательные бесконечно большие.
1.2. Предел функции 21
В предыдущем разделе мы уже изучали предел функции, но там ситуация была довольно специфической: речь шла о последовательности, т.е. о функции дискретного аргумента. С другой стороны, очень многие функции математически моделируют изменение той или иной величины, например, давления, скорости и т.д. в зависимости от времени или пространственной координаты, т.е. в зависимости от непрерывно меняющейся величины. Поэтому теперь мы будем изучать функции вида
y = f ( x) : X →
,
(1)
где X ⊂ есть интервал или совокупность нескольких непересекающихся интервалов числовой оси, т.е. множество, в котором независимая переменная имеет возможность изменяться непрерывным образом. Функция (1) называется ограниченной (ограниченной сверху, ограниченной снизу) на множестве A ⊂ X , если соответствующим свойством обладает множество f ( A ) ее значений на множестве А.
1 : { x ≠ 0} → не ограничена на своей обx ласти определения ни сверху, ни снизу; на множестве {x > 0} она ограничена снизу, но не сверху; на множестве {x ≥ 1} она ограничена. Если вам это не очевидно сразу, постройте график функции. ПРИМЕР 1. Функция
y=
Одной из главных задач исследования функции (1) является определение ее поведения при приближении аргумента х "вплотную" (как угодно близко) к фиксированному числу x0 . Свойства функции, проявляющиеся при таком приближении, называются ее локальными, или асимптотическими свойствами при х → x0 (при х, стремящемся к x0 ). Пусть функция
y = f ( x) определена на некотором интервале, содержащем
точку x0 внутри себя, за исключением, может быть, самой точки x0 . Эта функция называется ограниченной при
x → x0 , если она ограничена на
некотором множестве вида
( x0 − δ , x0 ) ∪ ( x0 , x0 + δ ) , δ
>0
т.е., как говорят иногда, на выколотой δ-окрестности точки x0 . 22
(2)
Аналогичные определения даются для ограниченности f ( х ) сверху или снизу при x → x0 . Мы подошли к центральному определению этого раздела – определению предела функции в точке. Пусть
по-прежнему
y = f ( x)
функция
выколотой окрестности точки x0 .
определена
в
некоторой
Число а называется пределом функции
f ( x) при х, стремящемся к x0 ,
если разность между
f ( x) и а, с
приближением х к x0 , становится как угодно малой (см. рис. 1). Точнее – если для любого заданного числа ε > 0 найдется число δ (ε) такое, что при
x − x0 < δ ( ε ) выполняется соотношение f ( x ) − a < ε . Сокращенно:
∀ε > 0 ∃δ ( ε ) > 0 : { x − x0 < δ ( ε )} ⇒ { f ( x ) − a < ε }
(3)
y
ε1 a ε1
ε2 ε3 ε2
δ(ε3) δ(ε3) δ(ε2)
δ(ε2)
δ(ε1) ε3
δ(ε1) x
xo Рис. 1. К определению предела функции в точке. Если данное определение выполняется, то пишут
lim f ( x ) = a или f ( x ) → a при x → x0 .
x → x0
23
(4)
Говоря геометрически, график функции, имеющей предел в точке x0 , вплотную приближается к точке ( x0 , а), когда х вплотную приближается к x0 , неважно с какой стороны.
15 x 2 − 2 x − 1 = 8 , (найти δ (ε)). ПРИМЕР 2. Доказать, что lim 1 1 x→ x− 3 3 Для этого надо решить неравенство 15 x 2 − 2 x − 1 −8 < ε x − 1/ 3 относительно переменной х. Упрощая выражение под знаком модуля, получаем
9 x2 − 6 x + 1 0
(11)
Аналогично определяется ограниченность f ( x ) сверху или снизу при х → x0 – 0. Число а называется пределом функции f ( x ) при х , стремящемся к x0 слева, если для любого ε > 0 найдется δ ( ε ) > 0 такое, что при x0 − δ ( ε ) < x < x0 выполняется соотношение f ( x ) − a < ε . Если это определение выполняется, то пишут
lim
x → x0 −0
f ( x ) = a , или f ( x ) → a при x → x0 − 0 .
Само значение предела а можно обозначать символом f ( x0 − 0 ) . Читатель легко запишет эквивалентное определение на языке последовательностей. Если, вдобавок, функция f ( x ) определена в точке x0 , и
lim
x → x0 − 0
f ( x ) = f ( x0 ) ,
(12)
то f ( x ) называется непрерывной слева в точке x0 . Совершенно аналогично определяются ограниченность, наличие предела, непрерывность при х, стремящемся к x0 справа. Надо лишь заменить множество (11) множеством
( x0 , x0 + δ ) , δ
> 0,
(13)
символы x → x0 − 0; f ( x0 − 0 ) – символами x → x0 + 0; f ( x0 + 0 ) , слово "слева" – на слово "справа". Понятие одностороннего предела функции в точке (т.е. предела слева или предела справа) обладает многими свойствами, аналогичными свойствам предела функции в точке. Теоремы 1 – 6 можно переформулировать для каждого из односторонних пределов функции.
29
Добавим только следующее свойство, связывающее три введенные выше вида предела функции:
∃ lim f ( x ) ⇔ ∃ lim f ( x ) , lim f ( x ) , lim f ( x ) = lim f ( x ) x → x0 x → x0 + 0 x → x0 −0 x→ x0 + 0 x→ x0 −0 причем
lim f ( x ) =
x → x0
lim
x → x0 − 0
f ( x) =
lim
x → x0 + 0
f ( x).
ПРИМЕР 8. Рассмотрим многочлен P ( x ) , имеющий точку x0 своим корнем кратности k, так что k
P ( x ) = ( x − x0 ) P ( x ) , где P ( x ) – многочлен, P ( x0 ) ≠ 0 . Ясно, что P ( x ) – бесконечно малая при x → x0 . Если k четно, то это бесконечно малая того же знака, что и P ( x0 ) . Если k нечетно, то P ( x ) – бесконечно малая того же знака, что и
P ( x0 ) при
x → x0 + 0 и
противоположного знака при x → x0 − 0 (рис. 3). y
y
P ( xo ) > 0
P ( xo ) > 0
x
xo
xo
P ( xo ) < 0
x
P ( xo ) < 0
(a) k – четное
(б) k – нечетное
Рис. 3. К примеру 8. ПРИМЕР 9. Пусть f ( x ) =
P ( x) – рациональная дробь, т.е. P ( x ) и Q ( x)
Q ( x ) – многочлены. Предположим, что x0 – корень кратности k многочлена
30
k
Q ( x ) , т.е. Q ( x ) = ( x − x0 ) Q ( x ) , Q ( x0 ) ≠ 0 . При этом есть следующие возможности: а) P ( x0 ) ≠ 0 . Тогда f ( x ) – бесконечно большая при x→x0. Её поведение в окрестности x0 зависит от четности k и знака P(x0)/Q(x0). Возможные варианты представлены на рис. 4. y
y
Рис. 4.
x
xo
x
xo
К примеру 9а. l
б) x0 – корень P ( x ) кратности l , т.е. P ( x ) = ( x − x0 ) P ( x ) , P ( x0 ) ≠ 0 , причем l < k. Тогда l x − x0 ) P ( x ) P ( x) ( = , f ( x) = k k −l ( x − x0 ) Q ( x ) ( x − x0 ) Q ( x )
и мы возвращаемся к (а). в) То же, что и выше, но l > k. Тогда l −k
f ( x ) = ( x − x0 )
P ( x) , Q ( x)
и поведение функции f ( x ) вблизи х = x0 такое же, как у многочлена в примере 8. г) То же, что и выше, но l = k . Тогда k x − x0 ) P ( x ) P ( x ) ( = f ( x) = , k Q x ( ) ( x − x0 ) Q ( x ) 31
( x ≠ x0 ) .
Это новая ситуация. Существует lim f ( x ) = x → x0
P ( x0 ) , но он не равен f ( x0 ) , Q ( x0 )
т.к. f ( x ) не определена при х = x0 (рис. 5). Функция f ( x ) не непрерывна (разрывна) при х = x0 . y
xo
Рис. 5.
x
К примеру 9г.
Будем теперь изучать поведение функции не вблизи некоторой точки х= x0 , а при неограниченно растущем или, наоборот, неограниченно убывающем х. В том же порядке идей, что для окрестности точки, получаются определения асимптотических свойств функции при х, стремящемся к плюс бесконечности, или к минус бесконечности, или просто к бесконечности. Говорят, что f ( x ) ограничена при x → +∞ , если она ограничена на некотором множестве вида
( c, +∞ ) ,
(14)
где с – фиксированная константа. Аналогично определяется ограниченность f ( x ) сверху или снизу при x → +∞ . Число а называется пределом функции f ( x ) при х, стремящемся к плюс бесконечности, если для любого ε > 0 найдется такое число М(ε), что при х > М( ε ) выполняется соотношение f ( x ) − a < ε . Если это соотношение выполняется, то пишут 32
lim f ( x ) = c или " f ( x ) → c при x → +∞ " .
x →+∞
Аналогично определяются понятия x → −∞ и её предела при x → −∞ .
ограниченности
функции
при
Наконец, если существуют пределы lim f ( x ) , lim f ( x ) и они равны x →+∞
x →−∞
между собой, то их общее значение называют пределом f ( x ) при х, стремящемся к бесконечности (без знака) и обозначают символом lim f ( x ) . x →∞
Пределы lim f ( x ) , lim f ( x ) , lim f ( x ) обладают многими свойстx →+∞
x →−∞
x →∞
вами, аналогичными свойствам предела функции в точке. Теоремы 1 – 6 можно переформулировать для каждого из этих видов предела. ПРИМЕР 10. а) Функция y = c = const : б) Функция
→
ограничена при x → ∞, ∃ lim x = c . x →∞
y = x n (n = 1, 2,3,...) бесконечно велика при
x → ∞;
x n → +∞ при x → +∞ ; x n → +∞ или x n → −∞ при x → −∞ в зависимости от того, четно или нечетно п. в) Многочлен Pn ( x ) = an x n + an −1x n −1 + ... + a1 x + a0 ( an ≠ 0) может быть приведен к виду
a a a1 + 0 Pn ( x ) = an x n 1 + n −1 + ... + an x an x n −1 an x n
(15)
при x ≠ 0 . Все слагаемые в скобках, кроме единицы, бесконечно малы при x → +∞ и при x → −∞ . Поэтому Pn ( x ) есть бесконечно большая в каждом из этих направлений. Знак этой бесконечно большой зависит от знака an и четности п. Представление многочлена в форме (15) при больших x позволяет исследовать поведение при x → ±∞ рациональной дроби. Для этого надо применить (15) отдельно к числителю и знаменателю дроби. 33
1.3. Свойства непрерывных функций Что такое функция, непрерывная в некоторой точке своей области определения, мы узнали в предыдущем разделе. Функция называется непрерывной на множестве, если она непрерывна в каждой точке этого множества. Мы знаем, что непрерывность функции
f ( x) в точке x0 означает, что
f ( x ) = f ( x0 ) + α ( x) , α ( x) → 0 при x → x0 , т.е. что f ( x) аппроксимируется в окрестности точки x0 числом f ( x0 ) с абсолютной ошибкой, стремящейся к нулю при x → x0 . Теорема 1 (о непрерывности суммы, произведения и отношения). Сумма и произведение двух непрерывных в некоторой точке функций f ( x) и
g ( x) непрерывны в этой точке. Если, к тому же, g ( x) ≠ 0 в указанной точке, то и отношение
f ( x) – непрерывная в этой точке функция. g ( x)
Доказательство этой теоремы немедленно вытекает из аналогичной теоремы для пределов при x → x0 . Следствие. Свойство непрерывности в данной точке или на данном множестве линейно: если f ( x) и g ( x) непрерывны, и α, β – числа, то функция α f ( x) + β g ( x ) также непрерывна. Теорема 2 (о непрерывности сложной функции). Пусть даны функции y = f ( x) : X → Y , z = g ( y ) : Y → Z , где X , Y , Z ∈
. Если
f ( x) непрерывна в точке x0 ∈ X , а g ( y ) непрерывна в точке y0 = f ( x0 ) , то сложная функция h( x) = g ( f ( x) ) : X → Z непрерывна в точке х0. Доказательство. Пусть xn – последовательность точек из Х, сходящаяся к x0 . В силу непрерывности
n → ∞, f ( xn ) ∈ Y .
В
силу
f ( x) в х0 имеем
непрерывности
g ( y)
в
f ( xn ) → f ( x0 ) при y0 = f ( x0 )
h( xn ) = g ( f ( xn ) ) → g ( f ( x0 ) ) = h( x0 ) при n → ∞ , что и требовалось. 34
имеем
Напомним определения, известные, вообще-то, из школьного курса. Функция f ( x) называется возрастающей на множестве Х, если из
x1 , x2 ∈ X ; x1 < x2
(1)
следует, что f ( x1 ) < f ( x2 ) . Если из (1) следует, что f ( x1 ) > f ( x2 ) , то функция f ( x) называется убывающей на Х. В обоих случаях говорят, что функция
f ( x) строго монотонна на Х. f ( x1 ) ≤ f ( x2 )
Если условия (1) обеспечивают лишь неравенство
или
неравенство f ( x1 ) ≥ f ( x2 ) , то функция f ( x) называется, соответственно, неубывающей или невозрастающей. В обоих случаях говорят, что она монотонна на множестве Х. Теорема 3 (о функции, обратной к строго монотонной). Пусть функция y = y ( x) , заданная на некотором интервале [ a, b ] , возрастает на нем и непрерывна во всех его точках. Тогда существует обратная ей функция x = x( y ) , определенная, возрастающая и непрерывная на интервале
[ y (a), y (b)] .
Утверждение остаётся в силе, если слова “возрастает”,
“возрастающая” заменить на “убывает”, “убывающая”. Мы не будем приводить строгого доказательства этой теоремы. Ограничимся ее геометрической очевидностью (рис. 1, для случая возрастания). Непрерывная кривая на рисунке – это график функции y = y ( x) , непрерывной и возрастающей на [ a, b ] . Но она же является графиком обратной функции
x = x( y ) , если считать у – независимой, а х – зависимой переменными. Видно, что заключения теоремы выполняются. y y(b) y(b) y(a)
a
b
Рис. 1. К теореме 3. 35
x
ПРИМЕР 1. Рассмотрим общую степенную функцию
y = xα (α ∈
– константа, x > 0 ).
(2)
Выше мы доказали ее непрерывность только при α = n ∈
, даже на всей
числовой оси (пример 4 из 1.2). Пусть теперь y = x1/ n , ( n ∈ ) . Эта функция обратна по отношению к возрастающей непрерывной функции x = y n на любом замкнутом интервале положительной полуоси, поэтому и сама возрастает и непрерывна на аналогичных интервалах в силу теоремы 3. Тем самым она непрерывна при любом x > 0 . m
( )
m m Пусть, α = , ( m, n ∈ ) . Тогда функция (2) имеет вид y = x n = x1/ n и по n теореме 2 оказывается непрерывной как сложная функция. m
− m 1 (m, n ∈ ) и x > 0 , то функция y = x n = Если α = − непрерывна на m/n n x своей области определения как отношение непрерывных функций. Конечно, это убывающая функция. Таким образом, функция (2) непрерывна в своей области определения при любом рациональном α. Если же α иррационально, то эта функция, строго говоря, ещё не определена, т.е. неясно, что значит возвести число в иррациональную степень. Её определением мы, прежде всего, и займёмся. Итак, пусть α > 0 иррационально, и α k – последовательность его десятичных
приближений с недостатком. Положим сначала х > 1. Последовательность xα к не убывает и ограничена сверху, например, числом xα1 +1 . Поэтому, в силу признака Вейерштрасса, существует предел этой последовательности, который мы и называем значением xα . Если 0 < x < 1, то определение не меняется, просто последовательность xα к не возрастает и ограничена снизу. При α < 0 рассуждения аналогичны. Наконец 1α = 1α к = 1 . Итак, для х > 0 и иррационального α существует число
xα = lim xα к ,
(3)
к →∞
36
где αк – десятичные приближения числа α. Отметим, что формула (3) пригодна не только для иррациональных, но и для рациональных α. Теперь легко доказать непрерывность функции (2) для иррационального α.
Пусть [α ] - целая часть числа α, т.е. максимальное целое число, не превосходящее α. Сначала обоснуем непрерывность (2) при х = 1 и α > 0. Пуста ∆ х – малое отклонение х от единицы. Имеем
(1 + ∆x )[α ] ≤ (1 + ∆x )α ≤ (1 + ∆x )[α ]+1
(∆x > 0)
(1 + ∆x )[α ]+1 ≤ (1 + ∆x )α ≤ (1 + ∆x )[α ]
(∆x < 0) .
В силу непрерывности степенной функции с целым показателем и теоремы о α
полицейских, при переходе к пределу при ∆x → 0 получим (1 + ∆x ) → 1 , что и требовалось. Если х ≠ 1, то α
( x + ∆x )
α
∆x α = x 1 + → x при ∆x → 0 . x α
В случае α < 0 воспользуемся равенством xα = 1/ x −α . Таким образом, любая степенная функция (2) непрерывна в своей области определения. Заметим, что, используя этот факт и формулу (3) , легко распространить правила действий над степенями с рациональными показателями на случаи иррациональных показателей. Но мы не будем на этом останавливаться. ПРИМЕР 2. Перейдём к показательной функции
y = a x ( a > 0, a ≠ 1)
(4)
С её определением сложностей нет, т.к. мы уже умеем возводить любое положительное число в любую действительную степень. Покажем, что функция (4) непрерывна при каждом х. Пусть xn → x . Для любого ε > 0 найдётся десятичное приближение xк числа х такое, что a xк − a x < ε в силу (3). С другой стороны, найдётся n0 такое, что при
xn − x < xк − x а значит a xn − a x < ε , что и требуется. 37
n ≥ n0 будет
ПРИМЕР 3. Вместе с показательными непрерывны и все логарифмические функции y = log a x как обратные к показательным. ПРИМЕР 4. Обратные тригонометрические функции непрерывны как обратные к непрерывным. Учитывая разобранные выше примеры, можно заключить, что любая элементарная функция непрерывна в своей области определения. x
1 ПРИМЕР 5. Рассмотрим функцию y = 1 + , заданную на множест x ве { x > 0} ∪ { x < −1} , и исследуем её поведение при х → ∞. Пусть, сначала, х → +∞. Введём целую часть
[ x ] числа х. Можно записать [ x ]+1
x
x 1 1 1 + ≤ + ≤ + 1 1 1 x [ x] [ x]
[ x]
1 = 1 + [ x]
1 ⋅ 1 + . x [ ]
С другой стороны
[ x]
x
x 1 1 1 + > + ≥ + 1 1 1 + + x x 1 1 [ ] [ ] x
[ x ]+1
1 = 1 + + x 1 [ ]
−1
1 ⋅ 1 + . + x 1 [ ]
Таким образом, если имеется последовательность xn → +∞ , то
[ xn ]+1
1 1 + [ xn ] + 1
1 ⋅ 1 + [ xn ] + 1
−1
1 ≤ 1 + xn
xn
[ xn ]
1 ≤ 1 + [ xn ]
n
1 ⋅ 1 + [ xn ]
1 Поскольку последовательность 1 + , возрастая, стремится к числу е , то и n
[ xn ]
1 + 1 [ xn ]
[ xn ]+1
1 → e , 1 + [ xn ] + 1
→ e.
Кроме того, очевидно, что
1 → 1, 1+ [ xn ]
1 1 + + x 1 [ ] 38
−1
→ 1.
x
1 Поэтому с помощью теоремы о двух милиционерах получаем 1 + → e при x х→+∞. Пусть теперь х → – ∞. Сделаем замену переменной, введя y = − x − 1 . Тогда у → +∞, и y
x
1 1 1 1 + = 1 + ⋅ 1 + → e ⋅1 = e . y y x Окончательно, получаем так называемый "второй замечательный предел": x
1 lim 1 + = e x x →∞
(5)
1 , а затем переобоx значить переменную t на x, получим еще один часто используемый вид записи второго замечательного предела: ПРИМЕР 6. Если в формуле (5) сделать замену t =
lim (1 + x )
x →0
1 x
=e
(6)
ПРИМЕР 7 (экспонента и гиперболические функции). Среди показательных функций y = a x в приложениях особенно часто используется функция
y = ex .
(7)
Её иногда обозначают также y = exp x и называют экспонентой y = a x = e x ln a , или экспоненциальной функцией. Любая показательная функция выражается через экспоненту следующим очевидным образом:
y = a x = e x ln a . (8) Следовательно, график функции (8) получается из графика экспоненты сжатием в ln a раз к оси y и, если 0 < a < 1 , ещё и отражением в этой оси. У экспоненты есть несколько близких родственников, называемых гиперболическими функциями. Они определяются так:
(
)
– гиперболический синус,
(9)
(
)
– гиперболический косинус,
(10)
1 x −x e −e 2 1 ch x = e x + e − x 2
sh x =
39
sh x ch x ch x cth x = sh x th x =
– гиперболический тангенс,
(11)
– гиперболический котангенс.
(12)
Почему у этих функций названия, сходные с названиями тригонометрических функций, и причём здесь слово “гиперболический”? Постепенно мы ответим на эти вопросы. Поскольку гиперболические функции весьма полезны при решении многих прикладных задач, желательно познакомиться с ними поближе. Во-первых, отметим, что все они определены на всей числовой оси. За исключением cth x , который не существует при x = 0 . Во вторых, как легко убедиться, sh x, th x, cth x – функции нечётные, тогда как ch x – чётная функция: sh ( − x ) = − sh x, ch ( − x ) = ch x, th ( − x ) = − th x, cth ( − x ) = − cth x
(13)
(уже начинает просматриваться аналогия с тригонометрическими функциями). В-третьих, для гиперболических функций имеет место целый ряд тождеств, в известном смысле также аналогичных тригонометрическим тождествам. Выпишем основные из них:
ch 2 x − sh 2 x = 1, sh 2 x = 2sh x ⋅ ch x,
(14) (15)
ch 2 x = ch 2 x + sh 2 x, 2 th x th 2 x = , 1 + th 2 x sh ( x ± y ) = sh x ⋅ ch y ± ch x ⋅ sh y,
(16) (17)
ch ( x ± y ) = ch x ⋅ ch y ± sh x ⋅ sh y,
(19)
1 sh ( x + y ) + sh ( x − y ) , 2 1 sh x ⋅ sh y = ch ( x + y ) − ch ( x − y ) , 2 1 ch x ⋅ ch y = ch ( x + y ) + ch ( x − y ) . 2 sh x ⋅ ch y =
(18)
(20) (21) (22)
Эти формулы легко вытекают из определений (9) – (12). Докажем, например, формулу (20):
40
sh x ⋅ ch y =
(
(
1 x e − e− x 4
)( e
y
)
+ e− y =
) ( ) (
(
)
1 x+ y − e− x + y + e x − y − e− x − y = e 4
)
1 x+ y −( x + y) −( x − y ) x− y − + − = e e e e 4 1 1 1 1 − x+ y − x− y = e x + y − e ( ) + e x − y − e ( ) = sh ( x + y ) + sh ( x − y ) . 2 2 2 2 Формулы (21), (22) доказываются аналогично. Складывая или вычитая (20) и такую же формулу с переменой мест x и y, получаем (18). Складывая или вычитая (21) и (22), получаем (19).Полагая в (18) (со знаком +) y = x , имеем формулу (15). Полагая y = x в (19), имеем (14) и формулу (16). Наконец, (17) получается, как в тригонометрии, делением формулы (15) на (16). Графики гиперболических функций имеют вид, изображённый на рис. 2. Ясно, что функции (9) – (12) непрерывны во всех точках своих областей определения. =
(
)
y y
y = th x
1
y = ch x
1 0
x
0 –1
x
y = cth x y = sh x Рис. 2.
Графики гиперболических функций.
Закончив с примерами, вернемся к теории. Говорят, что функция f ( x) имеет изолированную точку разрыва при
x = x0 ,
если
она
непрерывна
на
некотором
множестве
( x0 − δ , x0 ) ∪ ( x0 , x0 + δ ) и не является непрерывной при х = х0 .
41
вида
Принята следующая классификация точек разрыва: I. Если существуют односторонние пределы f ( x0 − 0) и f ( x0 + 0) , то
x0 называется точкой разрыва первого рода, или точкой скачка функции
f ( x) . Число f ( x0 + 0) – f ( x0 − 0) называется скачком f ( x) в точке x0 . В точке скачка разрыв может происходить по одной из двух причин: а) f ( x0 + 0) ≠ f ( x0 − 0) (скачок не равен нулю), поэтому не существует lim f ( x) . Это случай неустранимого разрыва первого рода, или ненулевого
x → x0
скачка. ПРИМЕР 8. Рассмотрим функцию y = x (рис. 3) и введём функцию
y = f ( x) , где f ( x) = тангенсу угла наклона графика y = x к оси х. Очевидно, f ( x) определена при х ≠ 0 и имеет график, изображённый на рис 4. Ясно, что х = 0 является точкой скачка этой функции, причем скачок равен 2.
y
y 1
y = |x|
0
x
–1 0
x
Рис.3.
Рис.4. К примеру 8.
б) f ( x0 + 0) = f ( x0 − 0) (скачок равен нулю), а значит существует lim f ( x) . x → x0
Но этот предел не совпадает с f ( x0 ) , или f ( x0 ) просто не существует. Здесь мы имеем дело с устранимым разрывом первого рода: достаточно соответствующим образом изменить значение функции f ( x) в единственной точке х =
x0 (или придать ей в этой точке нужное значение, если его не было), чтобы получилась функция, непрерывная при х = x0 . 42
ПРИМЕР 9. Точка х = 0 для функции y = имеет функция y =
x2 − 5x + 6 x2 − 2 x
sin x . Аналогичный разрыв x
в точке х = 2 , как читатель легко проверит.
II. Если не существует хотя бы один из односторонних пределов f ( x0 − 0) , f ( x0 + 0) , то x0 называется точкой разрыва второго рода функции f ( x) . Если, к тому же, f ( x) неограничена при x → x0 , то говорят, что x0 есть точка бесконечного разрыва функции f ( x) . При этом прямая x = x0
называется
вертикальной асимптотой графика функции f ( x) . ПРИМЕР 10. Функции, изображённые на рис.4 из 1.2 имеют вертикальные асимптоты. То же можно сказать о функциях y = tg x (в точках
π + π n ), y = ctg x (при x = π n ) и y = cth x (при x = 0 ). Функция 2 1 y = sin имеет при х = 0 разрыв второго рода (но не бесконечный). Проверьте! x
x=
Очень много применений имеет следующая теорема о непрерывных функциях. Теорема 4 (о функции, непрерывной на замкнутом интервале). Пусть функция y = f ( x) непрерывна на замкнутом интервале [ a, b ] . Тогда: а) f ( x) ограничена на [ a, b ] и достигает на этом интервале своих наибольшего и наименьшего значений:
∃ξ ∈ [a, b]: ∀x ∈ [a, b] f (ξ ) ≥ f ( x ) , ∃η ∈ [ a, b]: ∀x ∈ [ a, b] f (η ) ≤ f ( x ) . б) f ( x) принимает на
[ a, b ]
любое значение, промежуточное между наи-
большим и наименьшим:
{ f (η ) ≤ c ≤ f (ξ )} ⇒ {∃x ∈ [ a, b]: f ( x ) = c} .
Мы не будем приводить строгого доказательства этой теоремы. Ограничимся геометрическими пояснениями. 43
По условию теоремы, график функции y = f ( x) есть непрерывная кривая, соединяющая точки ( a, f (a) ) и ( b, f (b) ) (рис.5). y y = f (x)
c
0
a
ξ
x
η
b
x
Рис. 5. К теореме 4. Она не может уйти как угодно далеко вверх, ибо ей надо вернуться в конечную точку, не разорвавшись. Значит, где-то (при x = ξ ) она должна иметь максимальное значение. Аналогично с минимумом. С промежуточным значением также все ясно. ЗАМЕЧАНИЕ. Каждое из условий теоремы – замкнутость интервала [ a, b] и непрерывность функции f ( x) на нём – существенны для её справедливости. Убедимся в этом на следующих трех примерах, где полезно нарисовать графики рассматриваемых функций.
ПРИМЕР 11.
x=0 0 при . Функция определена на интерy = 1 x < ≤ при 0 1 x
вале [ 0,1] и разрывна в точке х = 0 . Она неограничена.
0 при 0 ≤ x < 1 задана на интервале [ 0, 2] , ПРИМЕР 12. Функция y = ≤ ≤ x 1 при 1 2 имеет разрыв при х = 1. Она не принимает значений 0 < y < 1, промежуточных между наименьшим и наибольшим. ПРИМЕР 13. Функция y = x на ( 0,1) хоть и непрерывна, но не принимает ни наименьшего, ни наибольшего значений на своей области определения.
44
Утверждение б) теоремы 4 лежит в основе приближённого метода вилки решения уравнений вида f ( x) = 0 . Для применения этого метода требуется иметь интервал [ a, b ] оси x такой, что: 1) функция f ( x) непрерывна на [ a, b ] ; 2) она принимает в точках a и b значения противоположных знаков; 3) она имеет внутри интервала [ a, b ] только один корень x0 . Если эти условия выполнены, то для приближённого вычисления корня x0 по-
a+b ступают так: вычисляют f , т.е. значение функции f в середине интер 2 a+b a+b = x , то . В противном случае x0 привала [ a, b ] . Если f = 0 0 2 2 надлежит той половине отрезка [ a, b ] , на концах которой f имеет значения
противоположных знаков. Таким образом интервал возможных положений корня x0 укоротился вдвое. К этому новому интервалу применяют ту же про-
цедуру деления пополам, что и выше к отрезку [ a, b ] . Эту процедуру перехода от отрезка к его половине повторяют (итерируют) до тех пор, пока не будет достигнута требуемая точность определения корня x0 .
Процесс нахождения исходного отрезка [ a, b ] , удовлетворяющего условиям 1), 2), 3), называют уединением корня. Его часто можно выполнить, нарисовав эскиз графика функции f ( x ) .
1.4. Асимптотическое сравнение функций Часто приходится сравнивать поведение двух функций f ( x) и g ( x) при х → x0 . Это делают, например, с целью заменить вблизи точки x0 одну из функций другой, более удобной для анализа или вычисления, сделав при этом допустимо малую ошибку. Рассмотрим основные понятия, связанные с таким асимптотическим сравнением функций. Функция f ( x) называется ограниченной по сравнению с g ( x) , если отношение
f ( x) ограничено при х → x0 . g ( x)
45
При этом каждая из функций f ( x) и g ( x) в отдельности вовсе не обязана быть ограниченной при х → x0 . Факт ограниченности f ( x) по сравнению с g ( x) при х → x0 записывают в виде
f ( x) = O ( g ( x) ) при х → x0 , читается "О большое от g ( x) ". Исходя из сказанного выше, эту запись можно расшифровать так: найдутся множество вида ( x0 − δ , x0 ) ∪ ( x0 , x0 + δ ) и число М такие, что на этом множестве выполняется неравенство f ( x) ≤ M g ( x) .
( )
ПРИМЕР 1. x m = O x n Говорят, что f ( x) и g ( x)
при x → 0, если m ≥ n .
- функции одного порядка при х → x0 , если
f ( x) = O ( g ( x) ) , g ( x) = O ( f ( x) ) при х → x0 . Другими словами, это означает, что есть такие положительные числа т и М, что m ≤ Говорят, что f ( x) и g ( x)
f ( x) ≤ M при х → x0 . g ( x)
- функции одного порядка при х → x0 , если
f ( x) = O ( g ( x) ) , g ( x) = O ( f ( x) ) при х → x0 . Другими словами, это означает, что есть такие положительные числа т и М, что m ≤
Частный случай этой ситуации получается, когда самом деле, при этом
f ( x) ≤ M при х → x0 . g ( x)
f ( x) → c ≠ 0 при x → x0 . В g ( x)
f ( x) ограничено при х → x0 так же, как и отношение g ( x)
g ( x) 1 , которое сходится к . c f ( x) Еще более частный случай: функции f ( x) и g ( x) называются асимптотически эквивалентными при х → x0 , если
f ( x) = 1. x → x0 g ( x) lim
В этом случае пишут f ( x) ∼ g ( x) при х → x0 .
46
ПРИМЕР 2. Так как
sin x → 1 при x → 0 , то x при x → 0 .
sin x ∼ x ПРИМЕР 3. Поскольку
(1)
x 1 − cos x = 2sin 2 , то 2 2
x x 2sin sin 1 − cos x 2 = 2 → 1 при x → 0 . = x / 2 x2 / 2 x2 / 2 2
Поэтому
x2 при x → 0 . 1 − cos x ∼ 2
(2) 1 x
ПРИМЕР 4. Исходя из соотношения (1 + x) → e при x → 0 и исполь1 x
зуя непрерывность логарифмической функции, получаем ln(1 + x) → ln e или
1 ln(1 + x) → 1 . Таким образом x ln(1 + x) ∼ x при x → 0 .
(3)
ПРИМЕР 5. Запишем (3) в других обозначениях:
ln(1 + y ) → 1 при y → 0 . y и введем новую переменную
y → 0 , и мы имеем
x x
e −1
x = ln(1 + y ) , т.е. y = e x − 1 . Если x → 0 , то и
→ 1 . Итак
e x − 1 ∼ x при x → 0 .
(4)
(1 + x)α − 1 , где α – фиксированное ПРИМЕР 6. Рассмотрим отношение αx число и x → 0 . Введем переменную y = α ln(1 + x) → 0 . Отношение примет вид 47
e y −1 e y −1 y /α (1 + x)α − 1 = = ⋅ → 1. αx y α (e y / α − 1) e y /α −1 Итак:
(1 + x)α − 1 ∼ α x при x → 0 .
(5)
Асимптотическую эквивалентность удобно применять при вычислении пределов отношений или произведений: каждый член отношения или произведения можно заменить эквивалентной ему функцией, отчего искомый предел не изменится. Функция f ( x) называется бесконечно малой по сравнению с
x → x0 , если
g ( x) при
f ( x) → 0 при x → x0 . Этот факт записывают в виде g ( x) f ( x) = o ( g ( x) )
( x → x0 )
(6)
(читается "о маленькое от g ( x) ". Из (6) не следует, конечно, что f ( x) бесконечно мало при x → x0 . ПРИМЕР 7. а) Утверждение lim f ( x) = c можно записать в виде x → x0
f ( x) = c + o (1)
( x → x0 ).
б) Вместо f ( x ) ∼ g ( x ) при x → x0 можно писать
f ( x) = g ( x) [1 + o(1)]
( x → x0 )
(7)
или
f ( x) = g ( x) + o ( g ( x) ) Это значит, что
( x → x0 )
(8)
f ( x) аппроксимируется при x → x0 функцией g ( x) с
бесконечно малой при x → x0 относительной ошибкой. Поэтому g ( x) в формуле (7) называют главным членом асимптотики f ( x) при x → x0 . Конечно, f ( x) и g ( x) в этой формуле можно поменять местами. Обычно стараются использовать формулы типа (7), (8) , аппроксимируя функцию f ( x) более простой функцией g ( x) . 48
Так, формулы (1) – (5) переписываются в виде (всё при x → 0 ):
sin x = x + o( x) , x2 + o( x 2 ) , cos x = 1 − 2 ln(1 + x) = x + o( x) ,
(9)
e x = 1 + x + o( x ) , (1 + x)α = 1 + α x + o( x) , Геометрические иллюстрации соотношений (9) даны на рис. 1. y
y
2
o(x
y=x
)
1 y = sin x x
x
y = cos x
o(x)
2
y=1–x
y
y o(x)
y =1+ x
y=x
y = ln(1 + x ) x
y =e
1
o(x) x x
49
y =1+ x/2
y o(x)
y = 1+ x
1
x Рис. 1. Геометрическая иллюстрация соотношений (9). Всё сказанное выше в этом разделе (кроме примеров) можно повторить применительно к любому из направлений x → x0 − 0 , x → x0 + 0 , x → −∞ , x → +∞ ,
x → ∞. ПРИМЕР 8. Пусть дан многочлен степени п.
P( x) = an x n + an −1 x n −1 + ... + a1x + a0 . Если a0 ≠ 0 , то
P( x) = a0 [1 + o(1) ] при x → 0 . Если x0 – корень P( x) крат-
ности k, то P ( x) = C ( x − x0 ) k [1 + o(1) ] при x → x0 (С ≠ 0 - константа); другими словами, P ( x) одного порядка с ( x − x0 ) k при x → x0 . Далее,
P ( x) = an x n [1 + o(1) ] при x → ∞ . ПРИМЕР 9. Пусть
Q ( x) = bm x m + bm −1x m −1 + ... + b1x + b0 - ещё один многочлен степени т. Рассмотрим рациональную дробь P( x) . Если x0 - корень кратности k для P ( x) и кратности l для Q ( x) , f ( x) = Q( x) то
f ( x) = C ( x − x0 )k −l [1 + o(1) ] при x → x0 , где С ≠ 0 - константа. Далее,
a f ( x) = n x n − m [1 + o(1) ] bm 50
при x → ∞ .
Приведём ещё одну серию примеров, показывающих эффективность применения соотношений (9) при вычислении пределов самых различных типов. ПРИМЕР 10. Вычислить предел
lim
x →3
x + 13 − 2 x + 1 3
(10)
2
x −9
Здесь переменная x стремится к 3, а не к 0, как во всех соотношениях (9). Поэтому введём новую переменную y = x − 3 → 0 . Выражая в (10) x через y, ви-
y + 16 − 2 y + 4
дим, что вычислению подлежит предел lim
y →0
3
2
y + 6y
. Здесь мы име-
0 . Используем последнее соотношение (9), 0 преобразовывая соответствующим образом радикалы:
ем дело с неопределённостью вида
y y + 16 = 4 1 + 16 y y + 4 = 2 1 + 4 3
1
1
2
2
y = 4 1 + + o ( y), 32
y = 2 1 + + o ( y ) , 8
y y + 6 y = ( 6 y ) 3 1 + 6 2
1
1
3
y = 1 + + o ( y ) . 18
Подставляя эти результаты в искомый предел, имеем после упрощений: 2 2 3 3 + o y 3 y − y + o ( y) 3 = 0. 32 = − 3 lim lim 1 1 y →0 3 8 6 y → 0 1 + o (1) 8 6y 3 + y 3
cos 3 x − cos x . x →π tg 2 2 x
ПРИМЕР 11. Найти предел lim
0 . Аналогично предыдущему примеру, вводим 0 новую переменную y = x − π → 0 . Имеем
Снова имеем неопределённость
51
(
)
3π cos 3x − cos x cos 3 y + 2 − sin ( y + π ) sin 3 y − sin y sin 3 y − sin y = = = ⋅ cos 2 2 y 2 2 2 2 tg 2 x tg ( 2 y + 2π ) tg 2 y sin 2 y Запишем синусы и косинус в соответствии с первой формулой (9). Вычисляем искомый предел:
( 3 y + o ( y ) ) − ( y + o ( y ) ) ⋅ 1 + o 1 = lim ( 2 y + o ( y ) ) (1 + o (1) ) = ( ( )) y →0 2 y →0 4 y2 + o ( y2 ) + y o y 2 ( )) ( lim
= lim
2y + o ( y)
y →0
2
( )
4y + o y
2
=∞
ПРИМЕР 12. Вычислить предел lim
x →π
(
sin x 2 π 2
sin x +1
).
−2
Имеем неопределённость того же типа, что и выше, применяем ту же замену переменной y = x − π → 0 .
( y + π )2
y 2 − sin 2 y + y 2 π + + sin 2 y sin sin x π π π π = = = = sin x +1 1− sin y sin ( y + π ) +1 1− ( y + o ( y ) ) −2 2 2 −2 2 −2 −2 2 −y + o ( y) − y + o ( y) 2y + o ( y) =− = = 1− y + o ( y ) − y + o( y) ln 2 − y + o ( y ) ) − 2 22 2 2 2 − 1 2 e ( 2 − 1
(
2
)
Используем четвёртую формулу (9), приводим полученное выражение к виду
− y + o( y) − y ln 2 2 + o( y ) − 1 2 e
=
− y + o( y) 1 → при y → 0 , т.е. при x → π . y ln 2 ln 2 + o ( y ) − 1 2 1 − 2
23 x − 35 x . ПРИМЕР 13. Вычислить предел lim x → 0 sin 7 x − 2 x После предыдущих примеров здесь можно обойтись без пояснений:
52
e3 x ln 2 − e5 x ln 3 (1 + 3x ln 2 + o ( x ) ) − (1 + 5 x ln 3 + o ( x ) ) 23 x − 35 x = = = sin 7 x − 2 x 7 x − 2 x + o ( x ) 5x + o ( x )
( 3ln 2 − 5 ln 3) x + o ( x ) 1 23 = → ln 5 . 5x + o ( x ) 5 3 ПРИМЕР 14. Вычислить предел функции
еx − e
(
)
sin x 2 − 1
при x → 1 .
Делаем замену y = x − 1 , после чего функция принимает вид
e1+ y − e
(
sin 2 y + y 2
)
=
e ( y + o ( y ))
sin ( 2 y + o ( y ) )
=
e ( y + o ( y )) 2y + o( y)
=
e (1 + o ( y ) ) 2 + o (1)
e → . 2
Теоретические вопросы к главе 1. 1. Дать определения последовательности и числовой последовательности. 2. Дать определения числовой последовательности, ограниченной сверху, ограниченной снизу. 3. Дать определения сходящейся числовой последовательности. Привести примеры. 4. Сформулировать и доказать теорему о единственности предела числовой последовательности. 5. Сформулировать и доказать теорему об ограниченности числовой последовательности, имеющей предел. 6. Что можно сказать о сходимости арифметической прогрессии? Обосновать ответ. 7. Что можно сказать о сходимости геоиетрической прогрессии? Обосновать ответ. 8. Сформулировать и доказать теорему о связи операции перехода к пределу с арифметическими операциями. 9. Сформулировать и доказать теорему о переходе к пределу в неравенствах для числовых последовательностей. 53
10. Сформулировать признак Вейерштрасса существования предела числовой последовательности. n
1 11. Доказать сходимость числовой последовательности 1 + . n 12. Что такое натуральный логарифм? 13. Что такое бесконечно малая последовательность? 14. Записать утверждение lim xn = x с помощью понятия бесконечно маn→∞
лой. 15. Что такое бесконечно большая последовательность? 16. Дать определение ограниченности функции f ( x ) при x → x0 . То же для ограниченности сверху или снизу. 17. Дать определение предела функции f ( x ) при x → x0 «на языке ε − δ » и «на языке последовательностей». 18. Дать определение бесконечно малой и бесконечно большой при x → x0 функции. 19. Для случая функции f ( x ) сформулировать теоремы о единственности предела; ограниченности функции, имеющей предел; пределе суммы, произведения и отношения; переходе к пределу в неравенствах; «о полицейских». 20. Дать определение непрерывности функции в точке. 21. Что можно сказать о непрерывности многочлена, о непрерывности рациональной дроби? sin x 22. Доказать соотношение (первый замечательный предел): lim = 1. x →∞ x 23. Дать определение ограниченности и определение предела функции f ( x ) при x → x0 − 0 ; при x → x0 + 0 . 24. Переформулировать теоремы вопроса 19 применительно к односторонним пределам функции в точке. 25. Дать определение непрерывности функции в точке слева или справа.
54
26. Какова связь между пределом функции в точке и односторонними пределами этой функции в той же точке? 27. Каковы варианты поведения рациональной функции в окрестности фиксированной точки? Ответ обосновать. 28. Дать определение ограниченности функции f ( x ) при x → +∞ ; при
x → −∞ ; при x → ∞ . 29. Дать определение предела функции f ( x ) в направлениях из вопроса 28. 30. Верны ли теоремы из вопроса 19 для пределов из вопроса 28? 31. Каковы варианты поведения многочлена при x → −∞ , x → +∞ . Ответ обосновать. 32. Тот же вопрос для рациональной дроби. 33. Сформулировать теоремы о непрерывности суммы, произведения и отношения функций и о линейности свойства непрерывности функций. 34. Сформулировать и доказать теорему о непрерывности сложной функции. 35. Сформулировать теорему о функции, обратной к строго монотонной. 36. Доказать соотношения (второй замечательный предел): x
1α 1 lim 1 + = e; lim (1 + α ) = e . x x →∞ α →0
37. Дать определения гиперболических функций sh x, ch x, th x, cth x . Указать их области определения, исследовать чётность. 38. Доказать основные тождества для гиперболических функций, аналогичные тригонометрическим тождествам. 39. Сформулировать определение изолированной точки разрыва и дать классификацию таких точек. 40. Сформулировть теорему о функции, непрерывной на замкнутом интервале. Показать на примерах существенность каждого условия теоремы. 41. Сформулировать алгоритм реализации приближённого «вилки» решения уравнений вида f ( x ) = 0 . 55
42. Что означает запись f ( x ) = O ( g ( x ) ) при x → x0 ? 43. Что означает фраза « f ( x ) и g ( x ) – одного порядка малости при
x → x0 ?
44. Дать определение асимптотической эквивалентности функций f ( x ) и
g ( x ) при x → x0 . 45. Показать, что при x → 0 справедливы утверждения sin x ∼ x
x2 1 − cos x ∼ 2 ln (1 + x ) ∼ x ex − 1 ∼ x
(1 + x )a ∼ ax 46. Что означает запись f ( x ) = o ( g ( x ) ) при x → x0 ? 47. Что такое “главный член асимптотики f ( x ) при x → x0 ” ? Задачи к главе 1. 1. Доказать, что последовательность xn = n 2 расходится, пользуясь определением предела. 2. Пусть x = lim xn , y = lim yn . Показать, что: n →∞
n→∞
а) из того, что xn < yn , начиная с некоторого номера, не вытекает, что x< y. б) из того, что x ≤ y , не вытекает, что xn ≤ yn , начиная с некоторого номера. 3. Является ли ограниченная последовательность бесконечно большой? Дать аргументированный ответ. В следующих задачах доказать, что lim xn = а , воспользовавшись опреn→∞
делением предела (найти N (ε ) ): 4.
xn =
3n − 1 3 , a= 5n + 1 5
5. 56
xn =
4n − 3 , a=2 2n + 1
1 − 2n 2
6.
xn =
8.
1 + 3n xn = , a = −3 5−n
2 + 4n 2
, a=−
1 2
9.
2 − 3n 2
3 xn = , a=− 5 4 + 5n 2
10.
xn =
7.
11.
xn = xn =
5n + 1 1 , a= 10n − 3 2 3n 2 + 2 4n 2 − 1 2 n3 n3 − 2
, a=
3 4
, a=2
В следующих задачах вычислить пределы числовых последовательностей:
lim
12.
n→∞ (2n + 1) 2
lim
14. 16.
(2n + 1)3 − (2n + 3)3 (n + 2)4 − (n − 2)4
n→∞ ( n + 5) 2
lim
13.
+ (2n + 3) 2
+ (n − 5)
15.
2
(n + 1)3 + (n − 1)3
17.
n3 + 1
n →∞
lim
n3 − (n − 1)3
n →∞ ( n + 1) 4
lim
(n + 1) 4 − (n − 1) 4
n →∞ ( n + 1)3
lim
− n4 + (n − 1)3
(n + 2)2 − (n − 2)2 (n + 3)2
n →∞
Вычислить пределы числовых последовательностей: 18.
20.
lim
n→∞ ( n − 7
lim
3 2
n 4 11n + 25n 4 − 81
19.
2
n) n − n +1
n →∞ 5 n7
21.
+5 + n−5
lim
lim
n4 − n + 1 5
n + 2 − n3 + 2
n→∞ 7 n + 2 − 5 n 2
n + 2 − 5n 2
n →∞ n −
3
22.
− n +1
3 2
n7 + 5 − n − 5
n→∞ 7 n7
lim
n − n2 + 5
23.
+2
lim
n →∞
n 6 n + 32n10 + 1 3
( n + 4 n ) n3 − 1
Вычислить пределы числовых последовательностей: 24.
lim (n 2 + 1)(n 2 + 2) − (n 2 − 1)(n 2 − 2) n→∞
25.
(n5 + 1)(n 2 − 1) − n n(n 4 + 1) lim n n→∞
26.
(n 4 + 1)(n 2 − 1) − n6 − 1 lim n n→∞
27. 57
lim n − n(n − 1)
n →∞
28.
3 lim 3 n 2 (n6 + 4) − n3 − 1 n→∞
29. lim n n − n(n + 1)(n + 2) n →∞
Вычислить пределы числовых последовательностей: 30.
lim
n2 + n − 1 31. lim n →∞ 2 + 7 + 12 + ... + (5n − 3)
1 + 2 + ... + n
n→∞
n − n2 + 3
3 5 9 2 + 4 + 6 + ... + 2n 1 + 2n 32. lim + + 33. lim + ... + n →∞ 1 + 3 + 5 + ... + (2n − 1) n→∞ 4 16 64 4n 1 − 2 + 3 − 4 + ... − 2n 1 + 5 + 9 + 13 + ... + (4n − 3) 4n + 1 34. lim 35. lim − 3 3 2 n +1 n→∞ n →∞ n + 2n + 2 Доказать следующие утверждения, пользуясь определением предела функции (найти δ (ε ) ).
2 x 2 + 15 x + 7 = −13 x+7 x →−7
36. lim
6 x2 − x − 1 5 38. lim =− 1 3x + 1 3 x →−
37.
2 x2 + 6 x − 8 = −10 x+4 x →−1
39.
x 2 + 2 x − 15 = −8 lim x+5 x →−5
41.
5 x 2 − 51x + 10 = 40 lim x − 10 x →10
lim
3
3x 2 − 40 x + 128 =8 40. lim x −8 x →8
В следующих задачах доказать, что функция f ( x) непрерывна в точке x0 (найти δ (ε ) ). 42. f ( x) = −2 x 2 − 4, x0 = 3
43.
f ( x) = −3x 2 − 5, x0 = −2
44. f ( x) = −4 x 2 − 6, x0 = 1
45.
f ( x) = −5 x 2 − 7, x0 = 1
46. f ( x) = −2 x 2 + 9, x0 = 4
47.
f ( x) = 5 x 2 + 5, x0 = 8
В следующих задачах вычислить пределы функций: 48. lim
x 2 − 3x − 2
x →−1 x 2
50. lim
49.
+ 2x + 1
x4 − 1
x →1 2 x 4
51.
− x2 − 1 58
lim
x2 − 2 x + 1
x →1 x3
lim
− x2 − x + 1
x →−1 x3
x 2 + 3x + 2 + 2 x2 − x − 2
x3 + 2 x − 3
52. lim
x →−3 x3
lim
53.
+ 4 x 2 + 3x
(1 + x)3 − (1 + 3x) x 2 + x3
x →0
Вычислить пределы функций: 54.
3
x /16 − 1/ 4 x →1/ 4 (1/ 4) + x − 2 x lim
3 27 + x
56. lim
3 2
x →0
x
4
58. lim
x →16 3 (
7
x →0 3
− 3 27 − x +3
1+ x − 1− x
lim
55.
lim
57.
x −2
lim
59.
x − 4) 2
8 + 3x − x 2 − 2 3 2
x + x3
x →0
x
x
3
x−6 +2
x →−2 3 x3
+8
Доказать, что при x → a справедливы соотношения:
60. o ( o ( f ( x) ) ) = o ( f ( x) )
61.
O ( o ( f ( x) ) ) = o ( f ( x) )
62. o ( O ( f ( x) ) ) = o ( f ( x) )
63.
O ( O ( f ( x) ) ) = O ( f ( x) )
64. O ( f ( x) ) + o ( f ( x) ) = O ( f ( x) )
65.
O ( f ( x) ) ⋅ o ( f ( x) ) = o ( f ( x) )
66. Доказать, что sh x = x + o ( x ) . 67. Доказать формулу ch x = 1 + 2 sh 2
x и получить из нее соотношение 2
x2 + o x2 . ch x = 1 + 2
( )
Найти главный член асимптотики: а) … вида Cx n при x → 0 для функций: 68.
2 x − 3 x3 + x5
69.
1+ x − 1− x
б) вида C ( x − 1) n при x → 1 для функций: 70.
x3 − 3 x + 2
71.
3
1− x
в) … вида Cx n при x → +∞ для функций: 2
72.
x + 100 x + 1000
73.
74.
3 2
75.
x −x+ x
2 x5 x3 − 3 x + 1 1+ 1+ x 59
n
1 г) … вида C при x → +∞ для функций: x x +1 76. 77. 78. x +1 − x 4 x +1
x + 2 − 2 x +1 + x
n
1 д) … вида C при x → 1 для функций: x −1 x2
79.
1+ x 1− x
80.
x2 − 4
x
81.
3
1 − x3
Вычислить пределы функций: 82.
lim
1 − cos x x →0 x sin x
83.
84.
e4 x − 1 lim x →0 sin (π ( x / 2 + 1) )
85.
86.
lim
x →0
sin 2 x − tg 2 x
lim
x →0
lim
ln 2
2−3 x − 1 1 − cos x
x →0 (e3 x
− 1) 2
arcsin2 x x →0 ln(e − x ) − 1 lim
87.
x4
arcsin2 x
Вычислить пределы функций: 88.
90.
lim
1 − 24− x
2
2 2 x − 3x 2 − 5 x + 2 1 − sin( x / 2) lim π −x x →π x→2
89.
tgπ x x →−2 x + 2
91.
1 − 2 cos x π π − 3x x→
lim
lim
2
92.
arctg( x 2 − 2 x) lim sin 3π x x→2
93.
1 − x2 lim x →1 sin π x
95.
lim
Вычислить пределы функций: 94. 96.
lim
x →1
lim
x →π
2 x + 7 − 2 x +1 + 5 x3 − 1 ( x3 − π 3 )sin 5 x
97.
2 esin x − 1
60
x →π
lim
ln(2 + cos x) (3sin x − 1) 2
x →−1
tg( x + 1) 3 3 2 e x −4 x +6
98.
ln cos 2 x x →π ln cos 4 x lim
99.
ln sin x
lim x→
π (2 x − π ) 2 2
Вычислить пределы функций: 100. 102. 104.
lim
45 x − 9−2 x
e3 x − e2 x 101. lim x →0 sin 3 x − tg 2 x
x →0 sin x − tg x3
lim
52 x − 23 x
9 x − 23 x 103. lim x →0 arctg 2 x − 7 x
x →0 sin x + sin x 2
lim
e x − e −2 x
35 x − 2−7 x 105. lim x →0 2 x − tg x
x →0 x + sin x 2
Вычислить пределы функций: 106. 108.
110.
lim
a x + h + a x − h − 2a x
107.
h2
h →0 35+ x
−2 lim x →3 sin π x
109.
lg x − 1 x →10 x − 9 − 1
111.
1 − cos x x →0 1 − cos x lim
lim x→
lim
2sin 2 x + sin x − 1
π 2sin 2 x − 3sin x + 1 6 x +1
lim
x →0
−3
3
ln 1 + x 1 + xe x
Вычислить пределы функций: 112.
114.
116.
5 lim 6 − cos x x →0
ctg 2 x
2 113. lim 3 − cos x x →0
1 1 + sin x cos 2 x sin 2 x
lim x →0 1 + sin x cos 3 x
115.
1 1 lim 1 + ln arctg 6 x 3 x →0 x2
117.
61
(
lim 2 − e x
x →0
2
cosec 2 x
1 1−cos π x
)
1 x2
1 + tg x cos 2 x lim x →0 1 + tg 2 x cos 5 x
Вычислить пределы функций: 118.
120.
122.
3 ln(1 + x 2 ) x +3
lim
x →0
1+ x
x 119. lim cos π x →0
x2
arcsin x lim x x →0
2( x +5)
arctg 3x 121. lim x x →0
1 2 sin 5 x x + 6
lim x →0 sin x
x+2
e x −1 x
π lim tg − x x →0 4
123.
Вычислить пределы функций: 124.
126.
(
)
lim 2e x − 2 − 1
x →3
sin( x −1)
3x+2 x−2
sin( x − 1) x −1−sin( x −1) 125. lim x →1 x − 1
1 2 − x ln(2− x )
lim x →1 x
127.
1 x cos x
lim ctg π 2 x→ 2
128.
sin(π x / 2) lim ( 2 − x ) ln(2− x ) x →1
129.
lim x→
π 2
18sin x ( sin x ) ctg x
Вычислить пределы функций: 130.
132. 134.
(
lim ln 2 ex
x →1
lim
x →1
(
)
1 2 x +1
esin π x − 1 131. lim x − 1 x →1
π x + 1 arctg x
lim ( cos π x )
tg( x − 2)
x→2
x lim x →1 x − 1
135.
sin(π x / 4) lim 3 x + x − 1
x →1
(
Вычислить пределы функций: 136.
2
lim ln[(e x − cos x) cos(1/ x) + tg( x + (π / 3))]
x →0
62
1 2 −1 x
133.
3
)
x 2 +1
)
137. 138.
139.
lim
x →0
lim
x →1
cos x + ln(1 + x) 2 + cos(1/ x) 2 + ex cos 2π x
x+2 2 + (e x −1 − 1) ⋅ arctg x −1
lim (esin x − 1) cos(1/ x) + 4 cos x
x →0
63
Глава 2. Производные и дифференциалы 2.1. Исходные понятия Мы приступаем к изучению раздела математики, называемого дифференциальным исчислением. В нём продолжается исследование свойств функций, заданных на сплошных множествах (интервалах), с помощью понятия предела функции. Но если в предыдущей главе такое исследование было доведено лишь до выяснения свойств непрерывных функций, то дифференциальное исчисление продвигает его намного дальше. Свойство непрерывности говорит о том, что функция мало отклоняется от своего значения в точке х0 при малом отклонении ∆x аргумента от х0. Поэтому в окрестности точки х0 непрерывную функцию можно приближённо заменить константой – её значением в х0, при этом абсолютная ошибка приближения стремится к нулю при ∆x → 0 . Однако, такая аппроксимация никак не отражает того, как меняется функция при переходе независимой переменной х через точку х0: быстро или медленно, возрастая или убывая. Дифференциальное же исчисление задаёт себе, в первую очередь, именно эти вопросы. Чтобы ответить на них, формулируются понятия производной и дифференциала функции в точке х0, с помощью которых удается построить более точную аппроксимацию функции в окрестности х0, а именно аппроксимацию не константой, а линейной функцией. Такая аппроксимация отражает не только величину, но и тенденцию изменения функции в точке х0. Значение такого подхода к локальному исследованию функции связано с тем, что он позволяет ввести строгое понятие скорости изменения функции в точке. На языке физики это предоставляет, например, возможность дать строгое определение понятию скорости неравномерного движения; на языке геометрии – возможность определить касательную к произвольной линии. С такого рода приложениями и было связано бурное развитие основ дифференциального исчисления во второй половине XVII века – в эпоху расцвета механики и астрономии. Дифференциальное исчисление было создано одновременно и независимо друг от друга Исааком Ньютоном (1643–1727) и Готфридом Вильгельмом Лейбницем (1646–1716). Конечно, они опирались на догадки и частные результаты своих предшественников. Надо отметить, что, как это часто бывает с первооткрывателями, изложение основ дифференциального исчисления Ньютоном 64
и Лейбницем было весьма громоздким, их многочисленные результаты далеко не всегда были строго обоснованы. Понадобилась кропотливая работа их учеников и последователей для того, чтобы дифференциальное исчисление приобрело тот совершенный вид, который присущ ему сейчас. Этапными в этом направлении были работы Огюстена Коши (1789–1857) и уже знакомого нам Карла Вейершрасса (1815–1897). Переходим к систематическому изложению основ дифференциального исчисления. Пусть функция y = f ( x ) задана на интервале I оси R и имеет действительные значения. Зафиксируем внутреннюю точку x0 ∈ I и рассмотрим ещё какую-либо точку x ∈ I . Разность ∆x = x − x0 назовём приращением независимой переменной в точке х0, разность ∆y = f ( x ) − f ( x0 ) – соответствующим приращением функции. Отношение
∆y f ( x ) − f ( x0 ) = ∆x x − x0
(1)
называется разностным отношением функции f ( x ) для точек х0, х. Предел разностного отношения (1) при x → x0 , т.е. число
f ′ ( x0 ) = y ′ ( x0 ) = lim
x → x0
f ( x ) − f ( x0 ) x − x0
(2)
называется производной функции f ( x ) в точке х0. Равенство (2) эквивалентно соотношению
f ( x ) − f ( x0 ) = f ′ ( x0 ) + o (1) , x → x0 , x − x0 а, значит, и соотношению
f ( x ) − f ( x0 ) = f ′ ( x0 )( x − x0 ) + o ( x − x0 ) , x → x0
(3)
Это последнее утверждение означает, что приращение функции разбивается на два слагаемых: первое есть величина, пропорциональная приращению х – х0 независимого переменного с коэффициентом пропорциональности, не меняющимся при изменении х; второе бесконечно мало по сравнению с х – х0 при x → x0 (рис. 1). 65
Функция, для которой разложение (3) возможно, называется дифференцируемой в точке х0 ( от лат. differentiare – разделять на две части). Итак, существование производной в точке эквивалентно дифференцируемости этой функции в той же точке. Слагаемое f ′ ( x0 )( x − x0 ) в (3) называется дифференциалом функции f в точке х0, соответствующим приращению х – х0 независимой переменной. Дифференциал имеет специальные обозначения:
df ( x0 ) = dy ( x0 ) = f ′ ( x0 )( x − x0 )
(4)
y f (x)
M o (∆x)
y = f (x)
df (x)
Mo
f (xo)
xo
∆x
x
x
Рис.1. Геометрический смысл производной и дифференциала. Теорема 1 (о непрерывности дифференцируемой функции). Дифференцируемая в точке х0 функция f(х) непрерывна в этой точке. Доказательство немедленно вытекает из формулы (3): она показывает, что f ( x ) → f ( x0 ) при x → x0 . Обратная теорема не верна, что хорошо видно на примере функции y = x при x → 0. Таким образом, дифференцируемость есть более жёсткое ограничение на функцию, чем непрерывность. Зато, если непрерывную в х0 функцию можно аппроксимировать в окрестности х0 константой с точностью всего лишь о(1) 66
при x → x0 (с абсолютной ошибкой, стремящейся к нулю), то дифференцируемую в х0 функцию можно аппроксимировать линейной функцией со значительно более высокой точностью о(х – х0) при x → x0 (с относительной ошибкой, стремящейся к нулю). Эта последняя аппроксимация даёт представление не только о значениях функции в окрестности точки x0 , но и о тенденции её изменения в этой точке. Осмыслим геометрически наши рассуждения. Разностное отношение (1) есть тангенс угла наклона секущей М0М к оси Ох. Существование предела (2) означает наличие предельного положения
этой секущей при стремлении точ-
ки М на графике функции к фиксированной точке М0. Прямая называется касательной к графику функции f (x) в точке М0. Уравнение касательной есть
y = f ( x0 ) + f ′ ( x0 )( x − x0 )
(5)
Итак, существование производной f ′ ( x0 ) геометрически означает существование касательной (5). При этом исключается наличие в точке М0 графика функции “угла” или ”острия” (см. рис. 2) y
x Рис.2. Примеры отсутствия производной в точке x0 . Поэтому функцию, имеющую в точке х0 производную, часто называют гладкой в этой точке. Дифференцируемость функции f (x) в точке х0 означает возможность заменить график функции в районе этой точки касательной к нему с ошибкой о(х – х0) (рис. 1). При этом приращение функции заменяется её дифференциа67
лом в х0. Понятия производной и дифференциала хорошо интерпретируются на языке механики. Предположим, что переменная х означает время, а функция у = f (x) есть закон движения точки по оси Оу. В этом случае разностное соотношение (1) называется средней скоростью движения за интервал времени от момента х0 до момента х. Мгновенной скоростью движения в момент х0 называется производная f ′ ( x0 ) . Таким образом, существование мгновенной скорости – это существование производной. Отсутствие f ′ ( x0 ) может, в частности, означать то, что в момент времени х0 движение претерпевает мгновенное изменение типа “удара”. При этом скорость в момент х0 не определена. Можно говорить лишь о скоростях непосредственно перед ударом и непосредственно после него. Подчеркнем, что интуитивное физическое представление о мгновенной скорости находит своё точное выражение только в математическом понятии производной. Это классический пример математического моделирования реальных явлений.
f ( x ) − f ( x0 ) её дифференциалом
Замена приращения функции
f ′ ( x0 )( x − x0 ) кинематически означает приближенную замену неравномерного движения у = f (x) равномерным движением y = f ( x0 ) + f ′ ( x0 )( x − x0 ) с постоянной скоростью f ′ ( x0 ) , совпадающей с мгновенной скоростью исходного движения в момент х0. Рассмотрим несколько примеров вычисления производных. ПРИМЕР 1. f ( x ) = c = const . При любом x0 ∈ R имеем
∆y c − c = = 0 → 0 при x → x0 . Значит, ∆x x − x0
f ′ ( x0 ) = 0, df ( x0 ) = 0 . Другими словами,
( const )′ = 0,
d ( const ) = 0
ПРИМЕР 2. f ( x ) = xα ( α ∈ R – константа).
68
(6)
Для любого x0 ≠ 0 из области определения имеем при x → x0 :
∆y = ∆x
( x0 + ∆x )α − xα0 ∆x
α xα0 (1 + ∆x x0 ) − 1 = = ∆x α xα0 (1 + ∆x x0 )α − 1 = ⋅ → α xα0 −1 α ⋅ ∆x x0 x0
Здесь использовано равенство (5) из п. 1.4. Итак,
( xα )′ = α xα α
dx = α x
,
( x ≠ 0)
∆x ,
( x ≠ 0)
α −1
−1
(7)
В случае х0 = 0 (если функция
xα
определена в этой точке)
α
∆y ( ∆x ) − 0 α −1 = = ( ∆x ) . При α > 1 эта величина имеет пределом ноль, при ∆x ∆x α = 1 предел равен единице, т.е. формулы (7) сохраняют силу. Если же α < 1, то производная функции xα в точке х = 0 не существует. ПРИМЕР 3. f ( x ) = e x . Для любого x0 ∈ R имеем при x → x0 (с учетом равенства (4) из п. 1.4):
(
)
x0 ∆x ∆y e x0 +∆x − e x0 e e − 1 = = → e x0 . Поэтому ∆x ∆x ∆x ′ e x = e x , d e x = e x ∆x .
( )
(8)
ПРИМЕР 4. f ( x ) = cos x . При любом x0 ∈ R получаем при x → x0 :
∆y cos ( x0 + ∆x ) − cos x0 cos x0 cos ∆x − sin x0 sin ∆x − cos x0 = = = ∆x ∆x ∆x cos ∆x − 1 sin ∆x = cos x0 − sin x0 → − sin x0 ∆x ∆x Здесь использованы равенства (1), (2) из п. 1.4. Итак,
69
( cos x )′ = − sin x,
d cos x = − sin x∆x .
(9)
Аналогично для любых x ∈ R выводятся формулы
( sin x )′ = cos x,
d sin x = cos x∆x .
(10)
Вернемся к теории. Если в формуле (2) рассматривать предел не при x → x0 , а при x → x0 − 0 (или x → x0 + 0 ), то получится определение левой
(или правой) производной в точке х0. Она обозначается символом f ′ ( x0 − 0 ) (или f ′ ( x0 + 0 ) ).
Понятно, что левая производная функции f (x) совпадает с обычной производной, если х0 есть наибольшее число из области определения f (x): ведь при этом стремление x → x0 может осуществляться только со стороны x < x0. Аналогичное замечание касается правой производной. Если же х0 – внутренняя точка области определения f (x), то производная f ′ ( x0 ) существует тогда и только тогда, когда существуют и равны между собой обе односторонние производные f ′ ( x0 − 0 ) и f ′ ( x0 + 0 ) . При этом f ′ ( x0 ) равна общему значению этих односторонних производных. На языке геометрии существование односторонней производной означает наличие соответствующей односторонней касательной в данной точке (см. рис. 2). На языке кинематики f ′ ( x0 − 0 ) и f ′ ( x0 + 0 ) – это мгновенные скорости ″до и после удара″ в момент x0. Если функция у = f (x) имеет производную в каждой точке интервала I ⊂ R , то говорят, что f (x) дифференцируема на I, или гладкая на I. Производную f ′ ( x ) можно рассматривать в этом случае как функцию, заданную на интервале I.
2.2. Основные правила дифференцирования Из заданных дифференцируемых функций с помощью различных операций (арифметических, образования сложных функций, перехода к обратным функциям и т.д.) можно образовывать новые функции. Будут ли функции, по70
лучающиеся в результате таких операций, тоже дифференцируемыми и как вычислить их производную, зная производные исходных функций? Теорема 1 (о связи дифференцирования с арифметическими операциями). Если функции f (x) и g (x) имеют производные в точке х, то: а) их сумма f (x) + g (x) имеет производную в точке х, причем
f ( x ) + g ( x )′ = f ′ ( x ) + g ′ ( x ) ; б) их произведение f(x)·g(x) имеет производную в точке х, причем
f ( x ) ⋅ g ( x )′ = f ′ ( x ) ⋅ g ( x ) + g ′ ( x ) f ( x ) ; в) при дополнительном условии g ( x ) ≠ 0 их отношение
f ( x) имеет g ( x)
производную в точке х, причем
f ( x ) ′ f ′ ( x ) g ( x ) − g ′ ( x ) f ( x ) . = 2 g x ( ) g x ( ) Доказательство: а) при ∆x → 0
f ( x + ∆x ) + g ( x + ∆x ) − f ( x ) + g ( x ) = ∆x f ( x + ∆x ) − f ( x ) g ( x + ∆x ) − g ( x ) = + → f ′ ( x) + g′ ( x). ∆x ∆x б) при ∆x → 0 , используя непрерывность дифференцируемой функции g (x), получаем f ( x + ∆x ) g ( x + ∆x ) − f ( x ) g ( x ) = ∆x f ( x + ∆x ) − f ( x ) g ( x + ∆x ) − g ( x ) = g ( x + ∆x ) + f ( x) → ∆x ∆x → f ′ ( x) g ( x) + g′ ( x) f ( x). в) при условиях пункта б), получаем
71
f ( x + ∆x ) f ( x ) − g ( x + ∆x ) g ( x ) f ( x + ∆ x ) g ( x ) − g ( x + ∆ x ) f ( x ) = = ∆x g ( x + ∆x ) g ( x ) ∆ x =
g ( x + ∆x ) − g ( x ) f ( x + ∆x ) − f ( x ) 1 − g x f x ( ) ( ) → ∆x ∆x g ( x + ∆x ) g ( x ) f ′( x ) g ( x ) − g′( x ) f ( x ) → . g2 ( x)
Следствия: а) Операция дифференцирования в точке х обладает свойством линейности: если f (x) и g (x) дифференцируемы в х, а α и β – числа, то функция α f (x) + + β g (x) дифференцируема в точке х, причем
α f ( x ) + β g ( x )′ = α f ′ ( x ) + β g ′ ( x ) . б) Пункты а) и б) предыдущей теоремы обобщаются для случая нескольких складываемых или перемножаемых функций, причем
f1 ( x ) + f 2 ( x ) + ... + f n ( x )′ = f1′ ( x ) + f 2′ ( x ) + ... + f n′ ( x ) f1 ( x ) ⋅ f 2 ( x ) ⋅ ... ⋅ f n ( x )′ = f1′ ( x ) ⋅ f 2 ( x ) ⋅ ... ⋅ f n ( x ) + + f1 ( x ) ⋅ f 2′ ( x ) ⋅ ... ⋅ f n ( x ) + ... + f1 ( x ) ⋅ ... ⋅ f n −1 ( x ) ⋅ f n′ ( x ) . ПРИМЕР 1. Пусть имеется многочлен степени n:
Pn ( x ) = an x n + an −1x n −1 + ... + a1x + a0 , Его производная – это многочлен степени n – 1:
( an ≠ 0 ) .
Pn′ ( x ) = an nx n −1 + an −1 ( n − 1) x n − 2 + ... + a1 . ПРИМЕР 2. Имеем 2 2 1 sin x ′ ( sin x )′ cos x − sin x ( cos x )′ cos x + sin x ′ = = . ( tg x ) = = 2 2 2 cos x cos x cos x cos x Отсюда
( tg x )′ =
1 2
cos x
, d tg x =
∆x 2
cos x 72
.
(1)
Аналогично,
( ctg x )′ = −
1 2
sin x
, d ( ctg x ) = −
∆x 2
sin x
.
(2)
Теорема 2 (о дифференцировании сложной функции). Рассмотрим сложную функцию h (x) = g (f (x)). Если функция у = f (x) имеет производную в точке х0, а функция z = g (x) имеет производную в точке у0= f (x0), то h (x) имеет производную в точке х0, причем h′ ( x0 ) = g ′ ( y0 ) f ′ ( x0 ) . Доказательство. Достаточно доказать формулу
h ( x0 + ∆x ) − h ( x0 ) = g ′ ( y0 ) f ′ ( x0 ) ∆x + o ( ∆x ) , ∆x → 0 . Заметим для этого, что при ∆x → 0 ∆y = f ( x0 + ∆x ) − f ( x0 ) = f ′ ( x0 ) ∆x + α ( ∆x ) , α ( ∆x ) = o ( ∆x ) . g ( y0 + ∆y ) − g ( y0 ) = g ′ ( y0 ) ∆y + β ( ∆y ) , β ( ∆ y ) = o ( ∆y ) . По определению о(∆у) имеем β ( ∆y ) = γ ( ∆y ) ∆y , где γ(∆у)=о(1) при ∆у → 0. Поэтому
h ( x0 + ∆x ) − h ( x0 ) = g ( y0 + ∆y ) − g ( y0 ) = g ′ ( y0 ) ∆y + γ ( ∆y ) ∆y = = g ′ ( y0 ) f ′ ( x0 ) ∆x + α ( ∆x ) + γ ( ∆y ) f ′ ( x0 ) ∆x + α ( ∆x ) =
= g ′ ( y0 ) f ′ ( x0 ) ∆x + { g ′ ( y0 ) α ( ∆x ) + γ ( ∆y ) f ′ ( x0 ) ∆x + α ( ∆x ) } .
Очевидно, величина в фигурных скобках есть о(∆х), т.к. ∆у → 0 при ∆х → 0 в силу непрерывности f (x) в точке х0. Теорема доказана. ПРИМЕР 3. Функция f (x) = a x может быть рассмотрена как сложная функция,
составленная
из
функций
(a x )′ = (e x ln a )′ = e y ln a = a x ln a . Итак, (a x )′ = a x ln a, da x = a x ln a∆x .
у = х lna
и
z = ey .
Поэтому
(3)
В частности, мы снова, как частный случай, получили формулу (8) из п. 2.1. Видно, что показательная функция с основанием е (экспонента) дифференцируется значительно проще, чем показательная функция с произвольным основанием. 73
Теорема 3 (о производной обратной функции). Пусть функция y = y ( x ) дифференцируема в точке x0 и имеет обратную функцию x = x ( y ) в окрестности точки y0 = y ( x0 ) . Пусть также y ′ ( x0 ) ≠ 0 . Тогда обратная функция дифференцируема в точке y0 , причем
x ′ ( y0 ) =
1 . y ′ ( x0 )
Доказательство. Пусть ∆уn – произвольная бесконечно малая последовательность приращений независимой переменной обратной функции в точке у0. Ей соответствует последовательность приращений значения этой функции ∆хn = x(y0 + ∆yn) – x(yn). Она также стремится к нулю при n → ∞ в силу непрерывности в у0 функции, обратной к дифференцируемой функции у = у (х). По∆y n не москольку y ′ ( x0 ) ≠ 0 , то последовательность разностных отношений ∆xn жет иметь нулевые члены при достаточно больших n. Поэтому можно написать ∆x n 1 1 = → при n → ∞, что и требовалось доказать. ∆y n ∆y n y ′ ( x0 ) ∆xn Можно убедиться в справедливости теоремы 3 менее строгим, но более наглядным путём. На рисунке 1 изображен график функции y = y ( x ) . Эта же кривая является графиком обратной функции x = x ( y ) , если считать y независимой переменной, а x − функцией. Наличие производной y ′ ( x0 ) означает существование касательной к графику функции y = y ( x ) в точке M 0 , причём y
β yo
Mo
Рис. 1.
α
xo К теореме 3. 74
x
y ′ ( x0 ) = tg α . Конечно, эта касательная является касательной и к графику функции x = x ( y ) в той же точке M 0 . Тем самым существует производная
x′ ( y0 ) = tg β (если только касательная прямая не горизонтальна). Поскольку, очевидно, α + β = π 2 , тангенсы углов α и β , т.е. производные y ′ ( x0 ) и
x′ ( y0 ) являются взаимно обратными числами, что и нужно. ПРИМЕР 4. Функция y = log a x − обратная к функции x = a y , поэтому при любом х > 0 имеем
( loga x )′ =
( loga x )′ =
1
1 1 = y = . Итак, x ln a y ′ a a ln a
( )
∆x 1 . , d ( log a x ) = x ln a x ln a
(4)
В частности,
( ln x )′ =
∆x 1 . , d ( ln x ) = x x
(5)
ПРИМЕР 5. Для обратных тригонометрических функций находим 1 1 1 1 =− =− =− . Итак, ( arccos x )′ = 2 2 y sin ′ ( cos y ) 1 − cos y 1− x
( arccos x )′ = −
1 2
, d arccos x = −
∆x 2
,
( x ≤ 1)
(6)
1− x 1− x Аналогичным же образом получаются формулы 1 ∆x , d arcsin x = , ( x ≤ 1) (7) ( arcsin x )′ = 2 2 1− x 1− x ∆x 1 (8) , d arctg x = , ( x ∈ R) . ( arctg x )′ = 1 + x2 1 + x2 Таким образом, показано, что любая основная элементарная функция имеет производную в каждой точке своей области определения. Из теорем этого раздела вытекает, что все элементарные функции обладают этим же свойством. Часто функция у = у(х) определяется с помощью задания переменных х и у как функций ещё одной переменной t, называемой параметром. Тогда гово75
рят, что функция у(х) задана параметрически. Точнее, пусть даны две функции x = ϕ (t ) , (9) y = ψ (t ) определённые на одном и том же интервале I ⊂ R . Пусть, кроме того, функция х=φ(t) имеет обратную функцию t = ϕ −1 ( x ) , определённую на интервале
J ⊂ R . Тогда существует сложная функция
(
)
y = y ( x ) = ψ ϕ −1 ( x ) ,
(10)
заданная на J. Это и есть функция, заданная параметрическими соотношениями (9). Говоря на языке механики, если известно, как меняются со временем t декартовы координаты x, y движущейся по плоскости точки (формулы (9)), то можно найти траекторию её движения (линию, по которой точка движется) в виде (10). ПРИМЕР 6.
x = cos t (11) ( t ∈ [0,π ]) . sin y t = Функция x = cos t имеет на интервале [ 0, π ] обратную функцию: t = arccos x , определённую при x ∈ [ −1,1] . Поэтому y оказывается на этом интервале сложной функцией от x, имеющей вид y = sin ( arccos x ) = 1 − x 2 . Легко видеть, что график этой функции есть верхняя половина окружности единичного радиуса с центром в начале координат (ибо x 2 + y 2 = 1, и y ≥ 0 ). Заметим, что заменив в (11) интервал [ 0, π ] на, скажем, π , 3π , мы 2 2 не получили бы параметрически заданной функции (10), поскольку на таком интервале функция x = cos t не имеет обратной. В конкретных случаях выписать параметрически заданную функцию аналитически в явном виде (10) бывает трудно или даже невозможно. Тем не менее, её нужно как-то анализировать, например вычислять её производную. На помощь приходит следующая 76
Теорема 4 (о производной функции, заданной параметрически) . Если функции (9) дифференцируемы при некотором t, причем ϕ ′ ( t ) ≠ 0 , то заданная параметрически функция (10) дифференцируема при х = φ(t). Производная у'(x) вычисляется по формуле ψ ′(t ) . (12) y′ ( x ) = ϕ ′(t ) Доказательство следует из теорем 2 и 3. Отметим, что здесь мы встретились со случаем, когда одна и та же переменная (y в данном случае) может рассматриваться либо как функция t, либо как функция x. В подобных ситуациях, чтобы уточнить по какой именно переменной происходит дифференцирование, вместо штриха (или наряду с ним) употребляют соответствующий нижний индекс. Например y ′ ( t ) = yt′ = yt . ПРИМЕР 7. Чтобы продифференцировать параметрически заданную функцию примера 6, действуем так:
( sin t )′ = − cos t = − ctg . t t sin ′ ( cos t ) Эта производная существует при всех t ∈ ( 0, π ) , y′ ( x ) =
т.е. при всех x ∈ ( −1,1) . В
граничных точках этих интервалов она обращается в бесконечность (касательные к графику функции y = y ( x ) вертикальны). Закончив с функциями, заданными параметрически, познакомимся с ещё одним приёмом дифференцирования. Рассмотрим функцию вида g x y = f ( x) ( ),
(13)
где f (x) и g (x) дифференцируемы. Чтобы продифференцировать (13), удобно предварительно прологарифмировать это равенство по основанию е. Получаем ln y = g ( x ) ln ( f ( x ) ) . После этого дифференцирование с использованием теоремы о сложной функции даёт
g ( x) 1 y ′ ( x ) = g ′ ( x ) ln ( f ( x ) ) + f ′( x ) , y ( x) f ( x)
откуда
g ( x) g x y ′ ( x ) = f ( x ) ( ) g ′ ( x ) ln ( f ( x ) ) + f ′ ( x ) . f ( x) 77
Описанный метод называется логарифмическим дифференцированием. Закончим раздел введением некоторых новых обозначений. Мы знаем, что если f(x) = x, то f ′ ( x ) = 1, и d f(x) = dx =1·∆x. Таким образом, приращение ∆x независимой переменной совпадает с дифференциалом dx функции f (x) = x. Поэтому обозначения ∆x и dx рассматриваются как равносильные. Пусть теперь y = y ( x ) – произвольная дифференцируемая функция. По-
dy dy или y ′ ( x ) = . Правая часть ∆x dx последнего равенства очень часто применяется как обозначение производной (обозначение Лейбница). Если вместо y ( x ) применяют символ f ( x ) , то пишут скольку dy=y’(x)∆x, можно записать y ′ ( x ) =
df вместо f ′ ( x ) . dx
2.3. Теоремы о конечных приращениях Так называется группа теорем, связывающих приращение дифференцируемой функции на некотором интервале [a,b] со значениями её производной внутри этого интервала. Эти теоремы служат инструментом для приложений такого “локального” понятия, как дифференцируемость к исследованию ”глобальных” свойств функции, т.е. особенностей её поведения на всем интервале [a,b]. Указанные приложения будут рассмотрены в следующих разделах. Теорема Ролля. (Мишель Ролль, 1652 – 1719). Пусть функция f (x) удовлетворяет следующим условиям: а) f (x) непрерывна на интервале [a,b]; б) f (x) дифференцируема на интервале [a,b]; в) f (a) = f (b). Тогда существует хотя бы одна точка c ∈ ( a, b ) такая, что f’(c) = 0. Доказательство. Из условия а) следует, что f (x) принимает на [a,b] свои наибольшее и наименьшее значения. Если эти значения принимаются ею на концах интервала, то в силу условия в) f (x) = const на [a,b], и теорема доказана. Поэтому рассмотрим случай, когда наибольшее значение принимается функцией f (x) в некоторой точке c ∈ ( a, b ) . В силу условия б):
f ( x ) − f ( c ) = f ′ ( c )( x − c ) + o ( x − c )
при 78
х → с.
Если
f ′(c) ≠ 0 ,
то
f ( x ) − f ( c ) = f ′ ( c )( x − c ) 1 + o (1) при х → с. Когда значения х близки к с, выражение в квадратных скобках положительно. Отсюда вытекает, что знак разности f (x) – f (с) меняется при переходе х через значение с. Следовательно, f (с) не может быть наибольшим значением функции f (х) на [a,b]. Итак, f ′ ( c ) = 0 . Аналогично рассматривается случай, когда внутри [a,b] принимается наименьшее значение функции f . Теорема доказана. Геометрическая интерпретация теоремы Ролля. Если график функции f (x) есть непрерывная кривая, соединяющая точки с абсциссами x = a, x = b и одинаковыми ординатами y (рис. 1), и если в каждой точке графика существует касательная к нему, то на графике имеется хотя бы одна точка, в которой касательная параллельна оси Ох. y
a
с
b
x
Рис. 1. Геометрическая интерпретация теоремы Ролля. Кинематическая интерпретация: уходя в момент времени х = а по прямолинейной дороге (ось Оу) и желая вернуться в исходный пункт в момент х = b, следует сделать хотя бы одну остановку в пути. Следующее утверждение обобщает теорему Ролля. Теорема Лагранжа (Жозеф Луи Лагранж, 1736 – 1813). Пусть функция f (x) удовлетворяет условиям пунктов а) и б) предыдущей теоремы. Тогда найдется хотя бы одна точка c ∈ ( a, b ) такая, что
f ( b ) − f ( a ) = f ′ ( c )( b − a )
(1)
Доказательство. Введем вспомогательную функцию по формуле F(x) = f (x) + λ(b – a), где константу λ подберём так, чтобы F(x) удовлетворяла 79
условиям теоремы Ролля. Очевидно, надо положить λ =
f (b) − f (a ) , после b−a
x−a чего будем иметь F ( x ) = f ( x ) + f ( b ) − f ( a ) . В силу теоремы Ролля b−a f (b) − f (a ) = 0 , что и существует точка c ∈ ( a, b ) такая, что F ′ ( c ) = f ′ ( c ) − b−a требуется доказать. Геометрическая интерпретация теоремы Лагранжа. На графике функции f (x) найдется точка, касательная в которой к графику параллельна хорде, соединяющей концы графика (рис. 2). y
0
a
c
b
x
Рис.2. Геометрическая интерпретация теоремы Лагранжа. Кинематическая интерпретация: при движении точки по прямой в течение интервала времени [a,b], в некоторый момент времени с мгновенная скорость равна средней скорости за время b – a. Ещё более общей является следующая теорема. Теорема Коши. Пусть функции f (x) и g (x) удовлетворяют условиям: а) f (x) и g (x) непрерывны на интервале [a,b]; б) f (x) и g (x) дифференцируемы на интервале (a,b); в) g ′ ( x ) ≠ 0 на интервале (a,b).
80
Тогда существует хотя бы одна точка c ∈ ( a, b ) такая, что
f (b) − f ( a ) f ′( c ) = . g (b) − g ( a ) g′( c )
(2)
Доказательство. Очевидно, что g (b) ≠ g (a) (В противном случае по теореме Ролля нашлась бы точка c ∈ ( a, b ) , для которой g′(с) = 0, что противоречит условию в)). Построим функцию F(x) = f (x) + λg (x), которая удовлетворяла бы условиям теоремы Ролля. Для этого нужно, чтобы f (а) + λ g (а) = f (b) + λ g (b), т.е. f (b) − f (a ) λ=− g (b) − g (a ) В силу теоремы Ролля найдётся точка c ∈ ( a, b ) такая, что
F ′(c) = f ′(c ) −
f (b) − f (a ) g′(c ) , g (b) − g (a )
что и требовалось. Одним из следствий теоремы Коши являются так называемые правила Лопиталя (Гийом Франсуа Антуан де Лопиталь, 1661 – 1704). Первое из них f ( x) позволяет во многих случаях вычислять пределы отношений при х → х0 g ( x) в тех случаях, когда f (x) → 0 и g (x) → 0 при х → х0, т.е. имеет место неопре0 делённость вида . Второе правило применяется для неопределённостей вида 0 ∞ , т.е. при f (x) → ∞ и g (x) → ∞ ( х → х0). ∞ Первое правило Лопиталя. а) Предположим, что наряду с функцией существует функция
f ( x) в окрестности точки х0 g ( x)
f ′( x ) , и что её предел при х → х0 известен. Тогда g′( x )
f ( x) f ′( x ) = lim . x → x0 g ( x ) x → x0 g ′ ( x ) lim
(3) 81
Доказательство. Если f (а) = f (а) = 0, то по формуле Коши запишем для х, близкого к х0: f ( x ) f ( x ) − f (a ) f ′(c) = = , g ( x ) g ( x ) − g (a ) g′(c ) где с лежит между х и х0. Ясно, что при х → х0 имеем с → х0, поэтому f ( x) f ′( x ) = lim , что и требовалось доказать. lim x → x0 g ( x ) x → x0 g ′ ( x ) Может случиться, что f (x0) (или g (x0)) не определено. Тогда следует искусственно доопределить функцию f (x) в точке x0, положив f (x0) = 0. Условия применения формулы Коши от этого не нарушаются. б) Правило Лопиталя (3) остаётся в силе, если отношение
f ′( x ) бескоg′( x )
нечно велико при х → х0. Просто обе части равенства (3) будут при этом означать ∞ (или + ∞, или – ∞). Кроме того, правило (3) годится и для вычисления односторонних пределов в точке х0. в) Наконец, правило остаётся в силе для вычисления предела отношения
f ( x) при х → ∞ (или х → – ∞, или х → + ∞). Это легко проверить, вводя ноg ( x) вую переменную z = 1 x . Тогда
f ( x) f (1 z ) = lim x →∞ g ( x ) z → 0 g (1 z ) lim
и функции f (1 z ) , g (1 z ) удовлетворяют условиям пункта а) при z →0. Второе правило Лопиталя внешне выглядит точно так же, как и описанное выше (формула (3) и аналогичные формулы для других направлений пе∞ , рехода к пределу), но применяется для раскрытия неопределённости вида ∞ т.е. в случае, когда функции f (x) и g (x) бесконечно велики. Его легко обосновать, заменяя функции f (x) и g (x) функциями 1 f ( x ) и 1 g ( x ) , соответственно, и применяя к последним первое правило Лопиталя. 82
e x − e− x ex + ex 2e = lim = . − e 1 x →0 ln ( e − x ) + x − 1 x →0 − 1 + 1 e−x lim
ПРИМЕР 1. ПРИМЕР 2.
lim
2 x − x4 − 3 x
x →1
4
1 − x3
1 − 2 x 3 1 3 16 = lim − − : = . 3 2 4 4 x x →1 2 x − x 4 9 3 x
ПРИМЕР 3.
lim
x →+0
( x ln x ) =
ln x 1x = lim = 0. x →+0 1 x x →+0 −1 x 2 lim
ПРИМЕР 4.
ex ex = lim = +∞ . lim x →+∞ x x →+∞ 1
2.4. Производные и дифференциалы высших порядков. Формула Тейлора Предположим, что функция y = f (x) дифференцируема на некотором интервале I. Тогда её производная f ′ ( x ) есть функция, заданная на I, и можно рассматривать вопрос о её дифференцировании. Производная этой производной называется второй производной функции f (x), или производной второго порядка этой функции и обозначается f ′′ ( x ) . Таким образом,
f ′′ ( x ) = ( f ′ ( x ) )′
(1)
Аналогично определяется производная любого порядка n = 3, 4,… функции f (x):
(
)
′ n n −1 f ( ) ( x) = f ( ) ( x)
(2)
Производной нулевого порядка функции f (x) называют саму эту функцию. Таким образом, формула (2) справедлива при n = 1, 2, 3, … . Функцию f (x), имеющую на интервале I все производные до порядка n включительно, называют n раз дифференцируемой на этом интервале. Если, к n тому же, f ( ) ( x ) непрерывна на интервале I (а, значит, непрерывны и все про83
изводные более низкого порядка), то говорят, что f (x) n раз непрерывно дифференцируема на I . Очевидно, все элементарные функции бесконечно дифференцируемы в своих областях определения, т.е. имеют там производные всех порядков.
0, ПРИМЕР 1. Рассмотрим функцию y = 2 x ,
x≤0
(рис. 1).
x>0
y
y y y’
0
x
0
x
y
y
y ′′′, y IV ,…
2 y” 0 0
x
x
Рис. 1. К примеру 1. При х < 0 имеем y’(x) = 0 (производная константы). При x > 0 получается y’(x) = 2x (производная степенной функции). При x = 0 производную можно вычислить по определению:
y ( x ) − y (0) x2 − 0 = lim = 0, lim y ( x ) − y (0) x→+0 x x →+0 x ⇒ ∃ lim = 0 = y′ (0) x → x 0 − lim y ( x ) y ( 0 ) = 0 − 0 = 0; x→−0 x x 84
Таким образом, y’(x) существует и непрерывна при всех х. Аналогично вычисляя y ′′ ( x ) , находим
0, x < 0 y ′′ ( x ) = , 2, x > 0 а при х = 0 вторая производная не существует, ибо y′ ( x ) − y′ (0) y′ ( x ) − y′ ( 0) ≠ lim . lim x x x →−0 x →+0 Итак, в данном примере функция y (x) лишь один раз непрерывно дифференцируема во всей области определения. Теорема 1. Если функции f ( x ) и g ( x ) n раз дифференцируемы при некотором х, то тем же свойством обладают функции f ( x ) + g ( x ) и
f ( x ) ⋅ g ( x ) , причём f ( x ) + g ( x ) f ( x ) g ( x )
(n)
(n)
n n = f ( ) ( x) + g( ) ( x) n
=
∑ Cnk f
k =0
( n −k ) x g ( k ) x ( ) ( )
Последнее соотношение называется формулой Лейбница. (Напомним, n ( n − 1) ... ( n − k + 1) n! = что Cnk = – биномиальные коэфициенты, и по k ! ( n − k )! 1 ⋅ 2 ⋅ ... ⋅ k определению 0! = 1). Доказательство первой формулы очевидно. Формула же Лейбница выводится методом индукции. Для n = 1 она, конечно, верна. Если она верна для некоторого n, то для n + 1 имеем:
f ( x ) g ( x ) = =
n
∑ Cnk f
k =0 n
∑
k =0
Cnk
= Cn0 f (
( n +1)
n n −k k = ∑ Cnk f ( ) ( x ) g ( ) ( x ) = k =0
( n −k +1) x g ( k ) x + f ( n −k ) x g ( k +1) x = ( ) ( ) ( ) ( )
n +1 n −k +1) k) ( ( f ( x ) g ( x ) + ∑ Cni −1 f ( n −i +1) ( x ) g (i ) ( x ) =
n +1)
i =1
n
( x ) g ( x ) + ∑ Cnk + Cnk −1 f ( n −k +1) ( x ) g ( k ) ( x ) + Cnn f ( x ) g ( n +1) ( x ) . k =1
85
Поскольку Cn0 = Cn0+1, Cnn = Cnn++11, Cnk + Cnk −1 = Cnk+1 , то
f ( x ) g ( x )
( n +1)
=
n +1
∑ Cnk+1 f
k =0
( n +1− k ) x g ( k ) x , ( ) ( )
что и требуется доказать. Заметим, что общая формула для n-ой производной отношения двух функций оказывается настолько громоздкой, что её практичность полностью теряется. Вторым дифференциалом, или дифференциалом второго порядка, функции у = f (x) называется дифференциал её дифференциала, рассматриваемого как функция от х при постоянном приращении dx независимой переменной: 2 d 2 f ( x ) = d ( df ( x ) ) = d ( f ′ ( x ) dx ) = ( f ′ ( x ) dx )′ dx = f ′′ ( x )( dx )
или, окончательно, 2
d 2 f ( x ) = f ′′ ( x )( dx ) .
(3)
Аналогично определяется дифференциал любого порядка n функции f (x):
(
)
n n d n f ( x ) = d d n −1 f ( x ) = f ( ) ( x )( dx ) .
(4)
Последняя формула позволяет использовать для n-ой производной функ-
d n f ( x) dny n) ( ции f (x), кроме обозначения f (или , ( x ) , ещё и обозначение dx n dx n если функция обозначается у(х)). Для краткости условливаются не ставить в скобки dx в знаменателе. Мы видели ранее, что непрерывную в точке х0 функцию f (x) можно локально (в окрестности точки х0) аппроксимировать константой, т.е. многочленом нулевой степени: (5) f ( x ) = f ( x0 ) + o (1) , ( x → x0 ) Ошибка такой аппроксимации стремится к нулю при x → x0 . Далее, функцию f (x), дифференцируемую в точке х0, можно аппроксимировать в окрестности этой точки многочленом первой степени: (6) f ( x ) = f ( x0 ) + f ′ ( x0 )( x − x0 ) + o ( x − x0 ) , ( x → x0 ) 86
с ошибкой, стремящейся к нулю при x → x0 быстрее, чем x − x0 . Формулы (5) и (6) оказываются частными случаями, причём простейшими, следующего общего утверждения: Теорема 2. Пусть функция f (x) определена в некотором интервале I числовой оси и имеет в точке x0 ∈ I все производные до порядка n включительно. Тогда для всех x ∈ I , достаточно близких к х0, имеет место следующая формула Тейлора (Брук Тейлор, 1685 – 1731): (7) f ( x ) = Tn ( x ) + Rn ( x ) , в которой а) Тn (x) есть многочлен степени n, значение которого, так же, как и значения его производных до порядка n включительно в точке x0 , совпадают с соответствующими значениями функции f ( x ) , т.е. n Tn ( x0 ) = f ( x0 ) , Tn′ ( x0 ) = f ′ ( x0 ) , … , Tn( n ) ( x0 ) = f ( ) ( x0 ) ; (8)
б) Функция Rn ( x ) , называемая n-ым остаточным членом (или n-ым остатком) формулы Тейлора, определяется равенством
(
Rn ( x ) = o ( x − x0 )
n
),
( x → x0 ) .
(9)
Доказательство. Сначала убедимся, что свойства (8) действительно определяют, причём однозначно, многочлен степени n. Будем искать его в виде 2
Tn ( x ) = a0 + a1 ( x − x0 ) + a2 ( x − x0 ) + ... + an ( x − x0 )
n
(10)
К такому виду можно привести любой многочлен степени n, записанный в стандартной форме – по степеням х. Для этого следует ввести переменную t = x – x0, подставить в многочлен вместо х сумму х0 + t, выполнить положенные возведения в степень этой суммы и расположить результаты по степеням t. Полагая в (10) х = х0 и используя первое условие (8), получаем а0 = f (x0). Дифференцируя (10), снова полагая х = х0 и используя второе условие (8), находим a1 = f ′ ( x0 ) . Продолжая аналогичным образом, после k -го дифференцирования и подстановки х = х0 в его результат, имеем ak =
1 (k ) f ( x0 ) . Заканk!
чивается эта процедура после n - го дифференцирования. В результате многочлен Тn (x) определяется однозначно и имеет вид:
87
Tn ( x ) = f ( x0 ) + f ′ ( x0 )( x − x0 ) +
1 2 f ′′ ( x0 )( x − x0 ) + ... 2!
n 1 1 ( n) n …+ f ( x0 )( x − x0 ) = ∑ f ( k ) ( x0 )( x − x0 )k n! k =0 k ! Теперь, в соответствии с условием теоремы, надо доказать, что
(
n
)
Rn ( x ) = f ( x ) − Tn ( x ) = o ( x − x0 ) , Для этого рассмотрим отношение
f ( x ) − Tn ( x )
( x − x0 )
n
( x → x0 )
(11)
(12)
. К вычислению его предела
при х → х0 применим (n – 1) раз правило Лопиталя, учитывая при этом условие (8):
lim
x → x0
f ( x ) − Tn ( x )
( x − x0 )
n
= lim
x → x0
f ′ ( x ) − Tn′ ( x ) n ( x − x0 )
n −1
f(
= ... = lim
x → x0
n −1)
( x ) − Tn( n −1) ( x ) n !( x − x0 ) (13)
n Поскольку f ( ) ( x0 ) существует, все производные функции f (x) до по-
рядка n – 1 существуют в некоторой окрестности точки х0 , и в этой окрестности писать соотношения (13) можно. Числитель последнего отношения преобразуем с учетом дифференцируемости его в точке х0 и условий (8):
f(
n −1)
( x ) − Tn ( n −1) ( x ) =
f(
n −1)
( x0 ) − Tn ( n −1) ( x0 ) +
n + f ( ) ( x0 ) − Tn ( n ) ( x0 ) ( x − x0 ) + o ( x − x0 ) = o ( x − x0 )
при x → x0 . После этого последний предел в (13) оказывается равным нулю, что и требовалось. Итак, формула Тейлора (7) доказана. В развёрнутом виде она записывается так: f ( x ) = f ( x0 ) + f ′ ( x0 )( x − x0 ) +
1 2 f ′′ ( x0 )( x − x0 ) + ... + 2!
(
)
1 n n n + f ( ) ( x0 )( x − x0 ) + o ( x − x0 ) , n!
(14)
( x → x0 )
Важный частный случай получается, если положить х0 = 0. Тогда формула Тейлора (14) принимает вид: 88
f ( x) =
( )
n
1 (k ) f (0) xk + o xn , k =0 k !
∑
( x → 0)
(14)
и называется формулой Маклорена (Колен Маклорен, 1698 – 1746). Она менее громоздка. Рассмотрим несколько примеров разложения основных элементарных функций по формуле Маклорена. Читатель легко проверит их справедливость, вычисляя последовательные производные разлагаемых функций в нуле:
x2 xn + ... + + o xn e =1+ x + n! 2!
( )
x
2n x2 x4 x6 n x + − + ... + ( −1) + o x 2n +1 cos x = 1 − 2! 4! 6! ( 2n )!
(
)
2 n +1 x 3 x5 x 7 n x + − + ... + ( −1) + o x 2n + 2 sin x = x − 3! 5! 7! ( 2n + 1)!
(
)
(15)
n x2 x3 n −1 x + − ... + ( −1) + o xn ln (1 + x ) = x − n 2 3 α (α − 1) 2 α (α − 1) ... (α − n + 1) n x + ... + x + o xn (1 + x )α = 1 + α x + n! 2!
( )
( )
В случае необходимости использовать общую формулу Тейлора (14) с x0 ≠ 0 можно зачастую упростить выкладки, сводя дело к формуле Маклорена. Для этого следует ввести новую независимую переменную t = x – x0. Тогда разложение функции f ( x ) в окрестности точки x0 сведётся к разложению функ-
ции f ( t ) = f ( x0 + t ) в окрестности точки t = 0. ПРИМЕР 2. Разложить по формуле Тейлора функцию cos x в окрестности точки x0 ≠ 0 . Имеем, полагая t = x − x0 ,
cos x = cos [ x0 + t ] = cos x0 cos t − sin x0 sin t =
2k 2 k +1 n n k t k t 2 k +1 = cos x0 ∑ ( −1) +o t + o t 2k +2 − sin x0 ∑ ( −1) ( 2k )! ( 2k + 1)! k =0 k =0 cos x0 2 sin x0 3 cos x0 4 sin x0 5 t + t + t − t − ... + = cos x0 − sin x0 ⋅ t − 2! 3! 4! 5! n cos x0 2 n n sin x0 2 n +1 + o t 2n +1 . + ( −1) t − ( −1) t ( 2n )! ( 2n + 1)!
(
)
(
(
89
)
)
=
Осталось заменить t на x − x0 , чтобы получить искомое разложение. Этот пример иллюстрирует выгоду не только от использования формулы Маклорена, но и от наличия “под рукой” определённого запаса уже известных разложений для самых “ходовых” функций. Особенно полезны в этом смысле стандартные разложения (15). ПРИМЕР 3. Разложить по формуле Маклорена функцию e 1+ x до члена порядка x 3 включительно. Сначала разложим функцию u ( x ) = 1 + x с помощью примера 6: 12
u ( x ) = (1 + x )
= 1+
x (1 2 )( −1 2 ) 2 (1 2 )( −1 2 )( −3 2 ) 3 + x + x + o x3 = 2 2 6
( )
x x 2 x3 =1+ − + + o x3 . 2 8 16 Теперь используем пример 2:
( )
( ) = e{1 + x 2 − x 2 8 + x3 16 + o
x 3 ) + ( 2 3 1 1 x 2 − x 2 8 + x 3 16 + o ( x 3 ) + x 2 − x 2 8 + x 3 16 + o ( x 3 ) + 2! 3! 3 2 3 3 +o x 2 − x 8 + x 16 + o ( x ) } = e{1 + x 2 − x 2 8 + x 3 16 + o ( x 3 ) +
e
1+ x
= e⋅e
x 2 − x 2 8+ x 3 16 + o x 3
( )
( )
( ) {
( )}
1 1 + x 2 4 − x 3 8 + o x 3 + x 3 8 + o x 3 + o x 3 } = e 1 + x 2 + 1 48 x 3 + o x 3 6 2 e e 3 Окончательно: e 1+ x = e + x + x + o x3 . 2 48
( )
Вернёмся от примеров к теории и отметим, что если о поведении функции f (x) в окрестности точки х0 известно больше, чем это предполагается условиями теоремы 2, то, соответственно, можно получить и больше информации о поведении остатка Rn(x). Пусть функция f (x) имеет производные не только до порядка n, а до порядка n + 1 включительно, причём не только в точке х0, но и в некоторой её окрестности. Тогда остаточный член формулы Тейлора можно записать в виде 1 n +1 n +1 (16) Rn ( x ) = f ( ) ( c )( x − x0 ) , ( n + 1)!
90
где х – произвольная точка области определения f (x), лежащая в указанной окрестности, а с – некоторая точка, расположенная строго между х0 и х (с зависит, строго говоря, от х0 и х). Эта формула позволяет не только знать, что относительная ошибка от замены функции её многочленом Тейлора стремится к нулю при х → х0, но и дать числовую оценку этой ошибки в заданной окрестности числа х0. Для доказательства формулы (16) преобразуем отношение
f ( x ) − Tn ( x )
( x − x0 )n +1
Rn ( x )
( x − x0 )
n +1
, т.е.
по формуле Коши несколько раз, используя условия (8):
f ( x ) − Tn ( x ) − f ( x0 ) − Tn ( x0 ) f ′ ( c1 ) − Tn′ ( c1 ) = = = n +1 n +1 n +1 n ( x − x0 ) ( n + 1)( c1 − x0 ) ( x − x0 ) − ( x0 − x0 )
f ( x ) − Tn ( x )
f ′ ( c ) − T ′ ( c ) − f ′ ( x ) − T ′ ( x ) 1 n 1 0 n 0 f ′′ ( c2 ) − Tn′′ ( c2 ) = = = n −1 n n n n c x 1 + − ( ) ( 2 0) ( n + 1) ( c1 − x0 ) − ( x0 − x0 ) n f ( ) ( cn ) − Tn ( n ) ( cn ) =…= , ( n + 1) n... ⋅ 3 ⋅ 2 ( cn − x0 ) где точка с1 лежит между х0 и х, точка с2 – между х0 и с1, …, точка сn – между
х0 и сn–1. Теперь применим формулу Лагранжа на интервале [ x0 , cn ] к функции
f ( x ) − Tn ( x ) для преобразования числителя последнего выражения. В результате функция
f ( x ) − Tn ( x )
( x − x0 )
n +1
примет вид
n +1 f ( ) ( c )( cn − x0 ) 1 ( n +1) c , = = f ( ) n +1 n c x n + − + 1 ! 1 ! ( ) ( ) ( ) n 0 ( x − x0 )
f ( x ) − Tn ( x )
где с лежит между х0 и сn, т.е. между х0 и х, что и требовалось. Итак, мы располагаем теперь выражениями (9) и (16) для остаточного члена Rn ( x ) формулы Тейлора. Первое из них называется формой Пеано (Джузеппе Пеано, 1858-1932), а второе – формой Лагранжа остаточного члена. Для иллюстрации преимущества формы Лагранжа рассмотрим пример на применение формулы Тейлора к приближённому вычислению значений функ91
ции. Пусть требуется составить таблицы значений функций cos x, sin x (или компьютерную программу, которая вычисляла бы эти значения). Прежде всего, ясно, что достаточно уметь вычислять указанные значения при 0 ≤ x ≤ π 4 : если х выходит за пределы этого интервала, можно воспользоваться формулами приведения. В интервале же 0 ≤ x ≤ π 4 будем использовать формулы Маклорена из примеров 3 и 4. Каким надо взять n, чтобы остаточный член не превосходил заданной точности вычислений, скажем 10−4 ? Ответ на этот вопрос даёт k форма Лагранжа (16) остаточного члена. Если f (x) = cos x , то f ( ) ( c ) при лю-
бом с не превышает по модулю единицы. Поэтому будет верна оценка 1 R2n ( x ) ≤ (π 4 ) 2 n + 2 . ( 2n + 2 ) ! Требуя, чтобы эта величина не превосходила 10−4 , находим методом перебора (n = 1, 2, 3, …), что достаточно взять n = 3, т.е. использовать приближённую формулу
x 2 x 4 x6 + − . cos x ≈ 1 − 2 24 720 Совершенно аналогично приходим к приближённой формуле для sin x , обеспечивающей ту же точность 10−4 при всех значениях x из интервала 0 ≤ x ≤ π 4:
x 3 x5 + . sin x ≈ x − 6 12 На рис. 2 показан характер приближения функций cos x , sin x их многочленами Тейлора в окрестности точки х0 = 0. Числа на рисунке показывают степень многочлена, которым приближена соответствующая функция. Формула Тейлора – “венец” дифференциального исчисления. В ней сконцентрировано всё, что может сказать это исчисление о функции, имеющей в некоторой точке х0 несколько (n) производных. А именно, эта функция ведёт себя вблизи х0 как многочлен степени n со всеми вытекающими отсюда последствиями, как аналитическими, так и вычислительными.
92
y 0 4
8
y = cos x
0
2 y
x
10
6
1
5
y = sin x
9
0
x
2
7
Рис.2. Характер приближения функций cos x (вверху) и sin x (внизу)их многочленами Тейлора вблизи точки х0 = 0.
Теоретические вопросы к главе 2. 1. Дать определение производной функции в точке. 2. Дать определение дифференцируемости функции в точке и диференциала функции. Показать, что дифференцируемость функции в точке эквивалентна существованию производной в этой точке. 3. Геометрический смысл производной. Уравнение касательной к графику дифференцируемой функции. 4. Геометрический смысл производной и дифференцируемости. 93
5. Вывести формулы для производных следующих функций:
y = const ,
y = xα ,
y = ex ,
y = cos x,
y = sin x .
6. Что такое односторонняя производная и односторонняяя касательная к графику функции? 7. Сформулировать и доказать теорему о производной сложной функции. 8. Найти производную функции y = a x ,
( a = const ) .
9. Сформулировать и обосновать теорему о производной обратной функции. 10. Найти производные функций y = log a x,
y = arccos x,
y = arcsin x .
11. Дать определение функции, заданной параметрически. Пояснить механический смысл параметрического задания функции. 12. Сформулировать и доказать теорему о производной функции, заданной параметрически. 13. В чём состоит метод логарифмического дифференцирования? 14. Дать формулировку теоремы Ролля о конечных приращениях. Указать геометрическую и механическую интерпретации этой теоремы. 15. Сформулировать и доказать теорему Лагранжа о конечных приращениях. Дать её геометрическую и механическую интерпретации. 16. В чём состоят правила Лопиталя? 17. Дать определение производной любого порядка n = 1, 2,3,... функции f ( x ) . 18. Сформулировать теорему об n-кратном дифференцировании суммы и произведения функций. 19. Дать определение дифференциала порядка n = 2,3,... функции и формулу для его вычисления через производные этой функции. 20. Сформулировать и доказать теорему о разложении функции f ( x ) по формуле Тейлора с остаточным членом в форме Пеано. 21. Что такое формула Маклорена? Разложить по этой формуле функции
e x , cos x, sin x, ln (1 + x ) ,
(1 + x )α .
22. Что такое остаточный член формулы Тейлора в форме Лагранжа? Каково преимущество формы Лагранжа перед формой Пеано? 94
Задачи к главе 2. 1. Существует ли производная f / (0) , если
1 x sin , при x ≠ 0 f ( x) = x 0 , при x = 0
?
2. Является ли производная функции f ( x) непрерывной в точке x = 0, если
1 2 x sin , при x ≠ 0 ? f ( x) = x 0 , при x = 0 В следующих задачах найти f ′(0) , исходя из определения производной.
x sin 3 −1 5x , x ≠ 0 4. f ( x ) = e 0, x=0
3.
x 2 sin 2 x − 1 + 2 х, x ≠ 0 f ( x ) = 3 0, x=0
5.
2 1 + ln(1 + 3x 2 cos ) − 1, x ≠ 0 f ( x) = x 0, x=0
6.
2 tg x − 2sin x , x≠0 2 . f ( x) = x 0, x=0
В следующих задачах написать уравнение касательной к графику функции в точке с абсциссой x0 . 7.
9.
y= y=
x2
2
x +1
, x0 = −2
1 + 3x 2 3+ x
2
, x0 = 1
x2 + 3, x0 = 2 11. y = 10 95
8.
x2 − 3x + 3 y= , x0 = 3 3
10.
y = 14 x − 15 3 x + 2, x0 = 1
12.
x2 − 2 x − 3 y= , x0 = 4 4
Найти дифференциал dy.
x + 1) 2
14.
1 y = ( x − 1 − ) ⋅ e2 x −1 2
15. y = ln cos x + x ⋅ tg x
16.
y = ln 2 x + 2 x 2 + x + 1
17. y = x(sin ln x − cos ln x)
17.
y = e x (cos 2 x + 2sin 2 x)
13. y = arctg(tg
Вычислить приближенно с помощью дифференциала. 19. y = x 7 , x = 2, 002
20.
y = 4 x − 3, x = 1, 78
21. y = x3 , x = 0,98
22.
y = x5 , x = 2,997
24.
y = x 4 , x = 3,998
26.
y=
28.
3 x2 + x + 1 y= x +1
30.
y=
3
23. y = x 2 , x = 1, 03
Найти производную. 25. y =
27. y =
(2 x + 1) x 2 − x x2
1− x 1+ x 3
1 2
( x + 2) x + 4 x + 5
29. y = 33 ( x + 1)( x − 1)2
x+7 6 x2 + 2 x + 7
Найти производную.
1 ) cos x
3 3 31. y = 3e x ( x 2 − 2 3 x + 2)
32.
y = esin x ( x −
33. y = arcsin e x − 1 − e2 x
34.
y = arctg(e x − e − x )
ex 2 35. y = ( x − 1) cos x + ( x − 1) 2 sin x 2
96
36.
y=−
e3 x 3sh 3 x
Найти производную. 37. y = ln arcsin 1 − e2 x 39. y = ln
x2 + 1 + x 2 x2 + 1 − x 2
1 41. y = ln ln sin(1 + ) x
38.
y = ln(bx + a 2 + b 2 x 2 )
40.
y = ln(e x + 1 + e2 x )
42.
y = ln ln 3 ln 2 x
Найти производную. 43.
5 x2 + 1 y = arctgx + ln 6 x2 + 4
44.
45.
x−2 y = arcsin ( x − 1) 2
ln(1 − 4 x 2 ) 46. y = arcsin 2 x + 2 8 2 1 − 4x
47.
y = ( x + 2 x + 2) ⋅ arctg
48.
y = 1 + 2 x − x 2 arcsin
x 1 8 y = x + arctg x − arctg 3 3 2 x
x − x x +2
x 2 − 2 ln(1 + x) 1+ x
Найти производную. 49. y = (sin x )e
50.
y = xe
ctgx
51. y = (tgx )ln tg( x / 4)
52.
y = xe
cos x
x 53. y = x 29 ⋅ 29 x
54.
y = (cos 2 x )ln cos( x / 4)
1/ x
Найти производную. 55. y = 56. y =
2 1 (4 x 2 − 4 x + 3) x 2 − x + (2 x − 1)4 arcsin 3 2x −1 2x −1 4 x2 − 4 x + 3
+
1 2x −1 arctg 2 2 97
57. y = arcsin e−4 x + ln(e4 x + e2 x − 1) 58. y = ln(5 x + 25 x 2 + 1) − 25 x 2 + 1 ⋅ arctg5 x
2 1 + −3 + 12 x − 9 x 2 2 −3 + 12 x − 9 x + ln 59. y = 3x − 2 3x − 2 60. y =
1 2x + 1 2x + 1 + arctg 2 2 4 x2 + 4 x + 3
Найти производную. 61. y =
4 x ((ln 4)sin 4 x − 4 cos 4 x) 16 + ln 2 4
(
63. y = x − ln 1 + e
65. y =
62.
x
) − 2⋅e
−x / 2
cos x 4 + arctg 2 + sin x 3
2tg
arctge
x/2
x +1 2 3
y=
64. y =
66.
cos x sin 2 x
− 2 cos x − 3ln tg
5 x ( sin 3 x ⋅ ln 5 − 3cos 3x )
y=2
9 + ln 2 5 cos x sin 4 x
+3
cos x sin 2 x
Найти производную функции y ( x ) , заданной параметрически.
x = ln tg t 67. 1 = y sin 2 t x = arctg t 69. 1 + t2 y = ln t +1 t +1 = x arctg t −1 71. y = arcsin 1 − t 2
98
x 2
68.
x = t t2 + 1 2 y = ln 1 + 1 + t t
70.
x = ln 1 − t 2 y = arcsin 1 − t 2
72.
1 − sin t = x ln 1 + sin t y = 1 tg 2t + ln cos t 2
(
)
Написать уравнение касательной к графику функции y ( x ) , заданной параметрически, в точке, соответствующей значению параметра t = t0. 1 + t3 x = 2 x = t (1 − sin t ) t −1 73. (t0 = 0) 74. (t0 = 2) y t t cos = t y = t2 − 1
x = 3cos t π ( t0 = ) 75. 4 y = 4sin t
x = 2tg t π = ( ) 77. t 0 2 4 = + y t t 2sin sin 2
76.
x = t − t 2 2 3 y = t − t
(t0 = 1)
78.
x = sin t t y = a
(t0 = 0)
В следующих задачах найти производную n-го порядка. 79. y = a 2 x +3
80.
y = sin ( 3 x + 1) + cos 5 x
81. y = e3 x +1
82.
y=
83. y = lg ( 2 x + 7 ) .
84.
y = log3 ( x + 5 )
11 + 12 x 6x + 5
В следующих задачах найти производную указанного порядка.
ln ( 2 x + 5 ) , y ′′′ = ? 2x + 5
86.
y = x ln (1 − 3 x ) , y ( IV ) = ?
(
88.
y = ( 5 x − 8 ) ⋅ 2− x , y ( IV ) = ?
85.
y=
87.
y = x 2 + 3x + 1 e3 x + 2 , y (V ) = ?
89.
y = e− x ( cos 2 x − 3sin 2 x ) , y ( IV ) = ?
)
90.
y=
ln ( x − 2 ) (V ) =? , y x−2
В следующих задачах найти производную второго порядка y ′′ функции, заданной параметрически. 91.
x = cos t y = ln sin t
92.
99
x = cos t + t sin t y = sin t − t cos t
x = et 93. y = arcsin t y = 3 sh 2t 95. x = 2 ( t − sin t )
94.
x = cos t 4 t y = sin 2
96.
x = arc tg t t2 = y 2
В следующих задачах показать, что функция y ( x ) удовлетворяет дифференциальному уравнению (∗). 97.
y = 4 x + x +1 ,
98.
2 y = x2 + 1 e x ,
99.
(
)
2x
1 + , y= x3 + 1 x
100.
y = e x + x + 2e x ,
101.
y=
2
1 , sin x + x
102. y = − x cos x + 3 x ,
8 xy ′ − y =
−1 y
3
(∗).
x +1
y ′ − 2 xy = 2 xe x
2
(∗).
x3 − 2 x x + 1 y′ + 2 x − 1 y = x
(
2
) (
y ′ − y = 2 xe x + x
3
2
)
(∗).
(∗).
2 ( sin x ) y ′ + y cos x = y 3 ( x cos x − sin x ) (∗).
xy ′ = y + x 2 sin x
100
(∗).
Глава 3. Исследование функций с помощью производных 3.1. Экстремумы и монотонность Рассмотрим функцию y = f (x), определённую на некотором интервале I ⊂ R . Говорят, что она имеет локальный максимум в точке x0 ∈ I , если найдётся такая δ – окрестность точки х0, что для всех точек х интервала I, попадающих в эту окрестность, f (х0) ≥ f (x). Если вместо последнего неравенства выполняется неравенство f (х0) ≤ f (x), то х0 есть точка локального минимума функции f (x). Локальный максимум и локальный минимум называются локальными экстремумами функции. Если в предыдущих неравенствах заменить знаки ≥ или ≤ строгими знаками > или < соответственно, то получатся определения строгого локального максимума и строгого локального минимума (строгих локальных экстремумов). Локальный экстремум называется глобальным экстремумом, если соответствующее неравенство ( f (х0) ≥ f (x), f (х0) ≤ f (x), f (х0) > f (x), f (х0) < < f (x)) выполняется при всех x ∈ I . Первым этапом отыскания экстремумов функции f (x): I → R является обычно выделение точек интервала I, “подозрительных на экстремум”, т.е. таких, что экстремум функции, если он вообще существует, может быть только в этих точках, а не в других. Этот этап основан на следующей теореме. Теорема 1 (необходимое условие наличия экстремума во внутренней точке интервала). Если внутренняя точка х0 интервала I есть точка экстремума функции f (x), то либо производная f ′ (х0) не существует, либо она равна нулю. На рис. 1. иллюстрируются оба эти случая. Доказательство. Пусть производная f ′ (х0) существует и не равна нулю. Тогда, для любого x ∈ I можно записать f ( x ) − f ( x0 ) = f ′ ( x0 )( x − x0 ) + o ( x − x0 ) 101
или f ( x ) − f ( x0 ) = f ′ ( x0 )( x − x0 ) 1 + o (1)
( x → x0 , x ≠ x0 ) .
При достаточно малых х – х0 величина о(1) делается меньше единицы по модулю, и квадратная скобка оказывается положительной. y
xo
xo
x
Рис. 1. К теореме 1. Поэтому разность f (x) – f (х0) имеет различные знаки при х < х0 и х > х0. Это противоречит факту наличия экстремума в точке х0. Теорема доказана. Каждая точка х0 , удовлетворяющая условию теоремы, называется критической точкой, или точкой, подозрительной на экстремум, функции f (x) на I. Итак, экстремумы функций могут находиться либо в критических точках, либо на границах интервала I, если эти границы входят в состав интервала. Возникает вопрос: как проверить, имеется ли действительно экстремум в подозрительной точке и какой именно (максимум или минимум)? Если речь идёт только о нахождении глобальных экстремумов, то этот вопрос решается просто: надо вычислить значения функции f (x) в подозрительных точках и выбрать те из этих точек, в которых f (x) принимает наибольшее и наименьшее значения. ПРИМЕР 1. Найти наибольшее и наименьшее значения функции 10 x + 10 y= x2 + 2 x + 2 на интервале [ −1, 2] . 102
Ясно, что данная функция определена на всей действительной оси, ибо квадратный трёхчлен в знаменателе в ноль не обращается (его дискриминант отрицателен, как легко проверить). Значит, функция везде имеет производную. Поэтому её глобальные экстремумы на интервале [ −1, 2] могут реализоваться либо в граничных точках интервала, либо в его внутренних точках с нулевой 10 x ( x + 2 ) производной. Вычисляя производную, получаем y ′ = − . Она об2 2 x + 2x + 2
(
)
ращается в ноль в одной внутренней точке нашего интервала х1=0. Ещё две подозрительные на экстремум точки – это границы интервала: х2 = –1 и х3 = 2. Как и положено при поиске глобальных экстремумов, находим значения функции во всех подозрительных точках: у(0) = 5, у(–1) = 0, у(2) = 3. Сравнивая эти числа, видим, что глобальный минимум 0 достигается в левом конце интервала, глобальный максимум 5 – во внутренней точке х = 0. Если же нужно найти локальные экстремумы, то описанный метод недостаточен. Как поступать в подобных случаях, выясним чуть позже. А пока рассмотрим способ определения монотонности функции f (x) на интервале в том случае, когда f (x) дифференцируема. Теорема 2 (достаточные условия монотонности функции). Пусть функция f (x): [ a , b] → R непрерывна на [a, b] и дифференцируема на [a, b]. Тогда а) если f ′ (x) = 0 на [a,b], то f (x) = const на [a, b]. б) если f ′ (x) ≥ 0 (f ′ (x) > 0) на [a, b], то f (x) не убывает (возрастает) на [a, b]. в) если f ′ (x) ≤ 0 (f ′ (x) < 0) на [a, b], то f (x) не возрастает (убывает) на [a, b]. Доказательство. Пусть x1, x2 ∈ [ a, b] , х1< х2. По формуле Лагранжа
f ( x2 ) − f ( x1 ) = f ′ ( c )( x2 − x1 ) + o ( x2 − x1 ) , где х1 < с < х2. Отсюда немедленно вытекают все утверждения теоремы. Теперь можно вернуться к вопросу о наличии и характере локального экстремума в подозрительных точках.
103
Пусть функция f ( x ) : I → R имеет критическую точку х0 внутри I и непрерывна в окрестности х0. Предположим, что некоторые интервалы вида [x0 – δ, x0], [x0, x0 + δ] являются интервалами монотонности функции f ( x ) . Тогда вопрос о наличии и характере экстремума решается сравнением поведения f ( x ) на этих интервалах. Если в интервалах [x0 – δ,x0],[x0, x0 + δ] функция f ( x ) дифференцируема, то вопрос сводится к тому, меняет ли f ′ (x) свой знак при переходе через точку x0. В случае, когда x0 – граничная точка интервала I, надо исследовать поведение f ( x ) (знак f ′ (x)) лишь с одной стороны от x0. Итак, решение задачи о локальном экстремуме дифференцируемой функции f (x) в точке x0 сводится к исследованию знака f ′(x) в окрестности x0. ПРИМЕР 2. Построить график функции y = 16 x3 + 12 x 2 − 5 с помощью производной первого порядка. Ясно, что эта функция и её производная y ′ = 48 x 2 + 24 x определены на всей числовой оси x. При приближении x к границам области определения, т.е. при x → ∞ , функция – бесконечно большая (отрицательная слева и положительная справа). Для определения её корней надо решать кубическое уравнение. После нескольких попыток перебора можно угадать корень x = 0,5 . Как легко проверить с помощью теоремы Безу и деления кубического многочлена на ( x − 0, 5 ), других корней наша функция не имеет. Записав производную в виде y ′ = 24 x ( 2 x + 1) , видим, что она обращается в ноль в точках x1 = 0, x2 = –0,5, положительна на интервалах x < –0,5 и x > 0, отрицательна при – 0,5 < x < 0. Следовательно, в силу изложенной выше теории, функция строго возрастает на первых двух интервалах и строго убывает на последнем. Она имеет локальный максимум y (–0,5) = – 4 и локальный минимум y (0) = –5. Глобальных экстремумов функция не имеет в силу неограниченности на бесконечности и сверху, и снизу. Полученные данные позволяют нарисовать качественный график (эскиз графика) функции, представленный на рис. 2. При желании его можно уточнить “по точкам”. 104
y
– 0,5
– 0,5 –4
Рис. 2.
x
График функции y = 16 x3 + 12 x 2 − 5 .
ПРИМЕР 3. Построить график функции 2
y = 33 ( x + 4 ) − 2 x − 8
(1)
с помощью производной первого порядка. Прежде, чем решать какую либо задачу стандартным методом, следует внимательно посмотреть, нельзя ли её упростить до применения этого метода. В нашем случае видно, что если ввести новую независимую переменную функ2
ция переписывается в виде y = 33 ( x + 4 ) − 2 ( x + 4 ) . Поэтому можно построить сначала график вспомогательной функции 3
(2) y = 3 x2 − 2 x , а затем сдвинуть его на 4 единицы в отрицательном направлении оси x. Функция (2) очевидным образом определена и непрерывна на всей числовой оси x. При x → ∞ , т.е. когда x стремится к границам области определения, она представляется в виде y = –2x(1+o(1)), следовательно является бесконечно большой (положительной при x → −∞ и отрицательной при x → +∞ ). Она обращается в ноль в точках, являющихся решениями уравнения 2 2 1 3x 3 − 2 x = x 3 3 − 2 x 3 = 0 , т.е. при x = 0 и x = 27/8 . Функция положительна при x < 27/8 и отрицательна при x > 27/8, что определяется путём решения соответствующих неравенств. Перейдём к исследованию монотонности и экстремумов функции (2). Для этого вычисляем её производную, которая, как легко проверить, имеет вид
105
(
)
1 y′ = 2 − 1 = 2 x −1 3 1 − x1 3 (3) 3x и существует при всех x, кроме нуля. Тем самым точка x = 0 уже является подозрительной на экстремум. Другие возможные подозрительные точки находим, приравнивая нулю производную, что даёт x = 1. Находя промежутки монотонности функции (2), т.е. промежутки знакопостоянства производной (3), видим, что (2) убывает при x < 0, возрастает при 0 < x < 1 и убывает при x >1.Следовательно, x = 0 есть точка строгого минимума, равного нулю, а x = 1 - точка строгого максимума, равного, как легко сосчитать, двум. Заметим ещё, что при x → −0 и x → +0 производная (3) стремится, соответственно, к −∞ и к +∞ . Это значит, что в начале координат график функции имеет направленное вниз “остриё”. Учитывая все полученные выше сведения, можно сказать, что график функции (2) имеет вид, имеет вид, изображённый на рис. 3. y
1
1
Рис. 3.
27/8
x
График функции (2).
Читатель без труда “сдвинет” этот график надлежащим образом, чтобы получить график функции (1). На этом мы закончим с примером и продолжим теоретические рассуждения. Если f (x) имеет в подозрительной на экстремум внутренней точке х0 интервала I производные порядка выше первого, то вопрос о наличии и характере экстремума в х0 можно решить иначе: исследуя знаки производных только в самой точке х0. А именно, имеет место 106
Теорема 3. Пусть все производные порядка ниже n функции f (x) во внутренn ней точке х0 интервала I равны нулю, а f ( ) ( x0 ) ≠ 0 . Тогда:
а) если n чётно, то х0 – точка строгого экстремума функции (минимума n n при f ( ) ( x0 ) > 0 , максимума при f ( ) ( x0 ) < 0 );
б) если n нечётно, то в х0 экстремума нет. Доказательство. По формуле Тейлора в окрестности точки х0 имеем 1 n n n f ( x ) = f ( x0 ) + f ( ) ( x0 )( x − x0 ) + o ( x − x0 ) при x → х0. n! 1 (n ) f Иначе: f ( x ) − f ( x0 ) = ( x0 )( x − x0 )n 1 + o (1) при x→ х0, x ≠ x0 . n! Из этой формулы вытекают утверждения теоремы. Действительно, при x,
(
)
достаточно близких к х0, величина o (1) в последнем равенстве будет по модулю меньше единицы, а значит выражение в квадратных скобках будет положительным. n
Далее, при чётном n величина ( x − x0 ) оказывается положительной, независимо от того, с какой стороны от х0 оказывается x. Поэтому знак приращения функции f ( x ) − f ( x0 ) оказывается одинаковым с обеих сторон от х0 и n совпадающим со знаком f ( ) ( x0 ) . Отсюда первое утверждение теоремы.
( x − x0 )n
При нечётном n знак величины
различен справа и слева от х0,
поэтому то же можно сказать и о знаке приращения f ( x ) − f ( x0 ) . Поэтому в точке х0 экстремума быть не может. ПРИМЕР 4. Исследовать поведение функции y = x 2 − 2e x −1 в окрестности точки х0 = 1 с помощью производных высших порядков. Для этого вычисляем последовательные производные данной функции в точке х0 = 1, пока не попадём на производную, отличную от нуля:
y ′ = 2 x − 2e x −1 , y ′′ = 2 − 2e x −1 , y ′′′ = −2e x −1 ,
y ′ (1) = 0, y ′′ (1) = 0,
y ′′′ (1) = −2 < 0. 107
Этого достаточно. В соответствии с теоремой 3, точка х0 = 1 не есть точка экстремума нашей функции, и её поведение в окрестности точки х0 = 1 характеризуется следующей асимптотической формулой: −2 1 3 3 3 3 x 2 − 2e x −1 = −1 + ( x − 1) + o ( x − 1) = −1 − ( x − 1) + o ( x − 1) . 3! 3
)
(
)
(
3.2. Выпуклость и точки перегиба Говорят, что функция f (x) вогнута (иначе, выпукла вниз) на интервале [a,b] (рис. 1), если для любых точек x1, x2 ∈ [a, b] таких, что х1 < x2, график f (x) на интервале (х1, x2) расположен не выше хорды, соединяющей его концы. Если вместо “не выше” говорить “ниже”, то получится определение сторогой вогнутости. Выпуклость функции f (x) (иначе, выпуклость вверх) на интервале [a,b] определяется аналогично.
x2 b
a x1
a x1
x2 b
x
Рис.1. Вогнутость. y
a x1
x2 b
a
x1
Рис.2. Выпуклость. 108
x2 b
x
Точка х0 называется точкой перегиба функции f (x), если она является общей границей интервала выпуклости и интервала вогнутости f (x), причем сама функция f (x) непрерывна в точке х0 (рис. 3). y
xo Рис. 3.
xo
x
Точки перегиба.
Ограничимся случаем, когда f (x) дифференцируема на интервале [a,b]. Тогда выпуклость на этом интервале можно определить иначе: по относительному положению графика функции и касательных к нему (а не хорд). Функция f (x) вогнута (строго вогнута) на [a,b], если касательная к графику f (x) в каждой точке из [a,b] лежит не выше (ниже) этого графика. Аналогично определяется выпуклость (строгая выпуклость). Мы не будем доказывать геометрически очевидную эквивалентность двух определений. Но если пользоваться определением с помощью касательных, становится ясно, что интервал выпуклости f (x) оказывается интервалом монотонности производной f ′ (x). В самом деле, достаточно нарисовать на рис. 1 и 2 касательные к графику в точках x1, x2. Выяснится, что для вогнутости (рис. 1) получится f ′ (x1) < f ′ (x2), а для выпуклости (рис. 2) будет f ′ (x1) > f ′ (x2). Что касается точек перегиба, то они оказываются точками, в которых меняется направление изменения f ′ (x), т.е. точки экстремумов функции f ′ (x). Отсюда важный вывод: исследовать f (x) на выпуклость и перегибы означает исследовать f ′ (x) на монотонность и экстремумы. Иначе говоря, для дифференцируемой на [a,b] функции f (x): а) Точками перегиба f (x) могут быть только точки, в которых f ′′ (x) не существует или равна нулю. 109
б) Интервалы выпуклости f (x) – это интервалы монотонности f ′ (x). При наличии f ′′ (x) – это интервалы постоянного знака f ′′ (x). в) Вопрос о наличии перегиба в подозрительной (см. пункт а) точке х0 можно решать, сравнивая характер монотонности f ′ (x) слева и справа от х0 (сравнивая знаки f ′′ (x)). г) Тот же вопрос можно решать, исследуя значения высших производных в самой точке х0 (см. последнюю теорему из разд. 3.1, заменив f (x) на f ′ (x)).
3.3. Наклонные асимптоты. Общая схема исследования функции Рассмотрим функцию y = f (x) (1) в область определения которой входят все достаточно большие по модулю значения x, так что можно обсуждать поведение функции при x → ∞ . Наклонной асимптотой функции (1) называется прямая y = kx + b такая, что
lim f ( x ) − ( kx + b ) = 0
(2) (3)
x →∞
Другими словами, расстояние между графиком функции (1) и прямой (2) должно стремиться к нулю при x → ∞ . Как выяснить по заданной функции (1), имеет ли она наклонную асимптоту, и, если да, как найти соответствующие числа k и b? ТЕОРЕМА. Для того, чтобы функция (1) имела наклонную асимптоту (2), необходимо и достаточно, чтобы существовали пределы f ( x) = k , lim f ( x ) − kx = b lim (4) x →∞ x →∞ x Доказательство. Предположим, что асимптота существует. Тогда верно равенство (3), которое мы перепишем в виде f ( x) b 1 − k − = o ( x → ∞) . x x x
110
f ( x) − k = o (1) ( x → ∞ ) . Но это означает, что сущестx вует первый из пределов (4). Теперь из (3) имеем: b = f (x) – k x + o(1). Это означает справедливость второго равенства (4). Обратно, пусть справедливы формулы (4). Тогда f (x) – (kx + b) = [ f(x) – kx]– b = [b + o(1)] – b = o(1), т.е. верно (3), и прямая (2) является асимптотой. Теорема доказана.
Из него следует, что
Все приведённые выше рассуждения по поводу асимптоты остаются в силе, если везде заменить x → ∞ на x → +∞ или на x → −∞ . Соответствующие асимптоты называются односторонними (правосторонней и левосторонней соответственно). В заключение настоящей главы отметим следующее обстоятельство. Каждую конкретную функцию мы изучаем с целью использования тех или иных её свойств для решения поставленных задач. Тем не менее, можно рекомендовать выработанную опытом примерную общую схему исследования функции, в которой каждый этап облегчает выполнение последующих.
Общая схема исследования функции: 1. Найти область определения функции и исследовать поведение функции в граничных точках этой области (при стремлении аргумента к границе области). Найти вертикальные асимптоты. 2. Выяснить симметрию графика (четность или нечетность функции) и вопрос о периодичности функции. 3. Найти точки разрыва и промежутки непрерывности. 4. Определить нули (корни) функции и промежутки знакопостоянства. 5. Найти точки и значения экстремумов и промежутки монотонности. 6. Найти точки перегиба и интервалы выпуклости. 7. Найти наклонные асимптоты графика функции. 8. Указать другие специфические особенности функции. 9. Построить график функции. ПРИМЕР. Построить график функции
y=
9 − 10 x 2
(5)
2
4x −1 111
2
1. Область определения функции определяется условием 4x –1 > 0, т.е. имеет вид
{x : x < −1/ 2
или x > 1/ 2}. При x → −1/ 2 − 0 и при
x → 1/ 2 + 0
функция (5) является положительной бесконечно большой. В самом деле, ее знаменатель стремится к нулю, оставаясь положительным, а числитель имеет предел 6,5. Таким образом, график имеет две вертикальные асимптоты: x = −1/2 и x =1/2. Если x → −∞ либо x → +∞, то y =
−10 x 2 1 + o (1) 2 x 1 + o (1)
= −5 x 1 + o (1) ,
Значит y → −∞, т.е. функция (5) является отрицательной бесконечно большой. 2. Также очевидно, что функция является чётной. Поэтому в дальнейшем исследовании ограничимся лишь правой половиной области определения. В конце исследования, получив соответствующий график, добавим к нему его отражение относительно оси y. 3. Функция (5) непрерывна во всех точках своей области определения. 4. Поскольку знаменатель выражения (5) положителен, вопрос о его корнях и промежутках знакопостоянства решается лишь с помощью числителя. 2
Рассматривая квадратичную функцию 9 – 10x , находим, что функция (5) по, равна нулю при x = 3 и отрицательна ложительна при 1 < x < 3 2 10 10 при x > 3/ 10 . 5. Для анализа функции (5) на монотонность и экстремумы вычисляем её производную, получая выражение
y′ = −
(
4 x 10 x 2 + 4
( 4 x2 − 1)
32
),
определённое для всех x из области определения функции (5). Легко заметить, что это выражение отрицательно при всех x > 1/ 2 . Значит, на этом интервале производная отрицательна, и функция (5) строго убывает. Никаких экстремумов нет. 6. Для исследования функции на выпуклость и точки перегиба вычисляем вторую производную функции (5):
y ′′ =
(
8 47 x 2 − 2 5
).
( 4 x − 1) 2 2
112
2 , т.е. и подавно при x > 1 . Сле2 47 довательно, на этом интервале нет точек перегиба, и функция (5) вогнута.
Эта производная положительна при x >
7. Наконец, обратимся к вопросу о наклонных асимптотах. При x → +∞ имеем:
−10 x 2 (1 + o (1) ) y ( x ) 9 − 10 x 2 = = → −5 . 2 x x ⋅ 2 x 1 + o (1) x 4x −1 Следовательно, k = –5. Затем: f ( x ) − kx =
9 − 10 x 2 2
4x −1
+ 5x =
−10 x 2 (1 + o (1) ) 2 x 1 + o (1)
+ 5x → 0 .
Поэтому b = 0. На основании полученных данных можно рисовать качественный график функции (5), уточняя его, при желании, “по точкам” (рис. 1). y
– 0,5
Рис. 1.
0,5
График функции y =
x
9 − 10 x 2 2
4x −1
.
Теоретические вопросы к главе 3. 1. Дать определение экстремумов функции, заданной на интервале (локальных и глобальных, строгих и нестрогих).
113
2. Что такое точки, подозрительные на экстремум? Сформулировать и доказать теорему о необходимом условии наличия экстремума во внутренней точке интервала. 3. Как найти глобальный экстремум функции, если известны все подозрительные на экстремум точки интервала? 4. Сформулировать и доказать теорему о достаточных условиях монотонности функции. 5. Как с помощью первой производной исследовать наличие и характер экстремума в точках интервала, подозрительных на экстремум? 6. Сформулировать и доказать теорему об исследовании подозрительных на экстремум точкек с помощью высших производных. 7. Дать определения выпуклости и вогнутости функции на интервале (строгой, нестрогой) с помощью хорд. Дать определение точки перегиба. 8. Дать определение выпуклости функции на интервале в случае её дифференцируемости – с помощью касательных. 9. Как исследовать дифференцируемую функцию на выпуклость и точки перегиба? 10. Дать определение наклонной асимптоты к графику функции и указать способ нахождения наклонных асимптот (с обоснованием). 11. Что понимается под общим исследованием функции?
114
Глава 4. Точки и векторы. Метод координат 4.1. Геометрические векторы В этом разделе мы обращаемся к знакомой по средней школе теме – евклидовой геометрии. Однако подход к ней будет новым для многих вчерашних школьников и заключается он в систематическом применении метода координат, который позволяет перевести геометрические факты на язык чисел, уравнений, неравенств, короче – на язык алгебры. Такой перевод позволяет применять алгебраические методы к решению геометрических проблем. Раздел математики, в котором развивается координатный метод в геометрии, называется аналитической геометрией. Одно из важных достоинств такого подхода к геометрическим вопросам состоит в том, что мы получаем возможность эффективно изучать не только простейшие геометрические объекты – точки, векторы, прямые, плоскости, многогранники, но и более или менее произвольные ″кривые″ линии, поверхности, тела. Правда, для этого иногда надо привлекать аппарат не только алгебры, но и дифференциального исчисления. В результате получается раздел математики, называемый дифференциальной геометрией. Соответствующие вопросы будут затрагиваться в нашем курсе несколько позже. Есть ещё один эффект от применения метода координат – ″обратный″ по отношению к предыдущим: возможность использовать геометрическую наглядность при исследовании чисто алгебраических объектов, скажем уравнений или систем уравнений. Например, задачу о решении системы линейных уравнений с двумя или тремя неизвестными можно интерпретировать, как задачу о нахождении общих точек некоторых прямых или плоскостей. Даже если неизвестных в системе больше, чем три, можно пытаться исследовать её по аналогии с геометрически прозрачным случаем трёх неизвестных. При этом геометрические понятия типа точки, вектора, прямой и плоскости естественным образом обобщаются на многомерное пространство. Раздел математики, вводящий и изучающий эти обобщения, и применяющий их к исследованию систем линейных уравнений, называется линейной алгеброй. Вот с таким кругом вопросов мы и начинаем знакомиться.
115
Модель реального обитаемого нами пространства, описываемая геометрией Евклида, исходит, прежде всего, из того, что это пространство есть множество точек. Обозначим это множество Е. Наряду с понятием точки, моделирующим идею наличия различных самых маленьких ″мест″ в пространстве, важнейшее значение в геометрии имеет понятие вектора. Оно моделирует идею возможности смещения в пространстве на определённое расстояние в определённом направлении. Направление смещения в пространстве однозначно определяется заданием прямой линии с указанием направления движения вдоль неё, а расстояние – фиксированием на такой прямой отрезка заданной длины. Поэтому вектор можно поначалу определить как направленный отрезок, или вектор-отрезок: отрезок прямой с заданным направлением движения вдоль него. Это направление обычно указывается стрелкой. Поскольку мы решили определить вектор как совокупность только направления и расстояния, следует считать равными, т.е. определяющими один и тот же вектор, все те направленные отрезки, которые: а) лежат на одной и той же прямой или на параллельных прямых; б) имеют одинаковые длины и имеют одинаковые направления (″смотрят″ в одну и ту же сторону от прямой, соединяющей их начала). Иначе говоря, два направленных отрезка представляют один и тот же вектор, если их можно совместить друг с другом параллельным смещением. Каждый вектор следует понимать как любой из его эквивалентных представителей – равных направленных отрезков (рис.1).
Рис. 1. Различные векторы-отрезки, представляющие один и тот же геометрический вектор. Эта ситуация похожа, например, на понятие рационального числа: одно и то же рациональное число представляется равными различными дробями: 1 2 −8 7 = = = = ... 3 6 −24 21 116
Таким образом, определяется совокупность всех векторов евклидовой геометрии, или геометрических векторов. Обозначается вектор чаще всего буквой со стрелкой сверху или жирной буквой. Мы изберём первый способ. Для изображения геометрического вектора в каждой конкретной ситуации мы будем выбирать удобный вектор из числа его представителей – векторов-отрезков (″откладывать″ геометрический вектор от какой-либо точки). Кроме перемещений в пространстве, векторы используются для моделирования многих физических величин, характеризуемых интенсивностью и направлением: скорость, ускорение, сила и т.д. На множестве всех геометрических векторов естественным образом определяются операции сложения векторов и умножения вектора на число. Пусть a , b – два вектора. Их суммой называется вектор, обозначаемый
a + b , который определяется так: надо отложить вектор b от конца вектора a , тогда a + b есть вектор с началом в начале a и концом в конце b . То же определение можно выразить с помощью известного правила параллелограмма (рис. 2).
a Рис. 2.
К определению суммы геометрических векторов.
Это определение возникло из опытного факта: результат двух последовательных смещений в пространстве, характеризуемых векторами a и b , можно представить, как результат одного смещения на вектор a + b . Произведением λ a действительного числа λ на вектор a называется вектор, длина которого получается умножением длины вектора a на λ , а
117
направление совпадает с направлением a , если λ > 0, и противоположно ему, если λ < 0 (рис. 3).
Рис.3.
К определению произведения геометрического вектора на число.
Нулевым вектором называется вектор нулевой длины. Нулевой вектор будем обозначать символом 0 . Операции сложения геометрических векторов и умножения вектора на число обладают рядом очевидных геометрических свойств, которые мы здесь отметим. а)
a +b =b +a.
Это свойство называется коммутативностью сложения векторов, и ясно из рис. 2. Оно аналогично соответствующему свойству чисел. б)
( a + b ) + c = a + (b + c ) .
Это – ассоциативность сложения векторов (рис. 4). Такое же свойство имеется у чисел. Благодаря ему можно говорить о сумме, не зависящей от порядка сложения, трёх и более векторов.
Рис. 4. Ассоциативность сложения геометрических векторов.
118
в) Существует единственный вектор, прибавление которого к любому вектору a не меняет последнего. Это нулевой вектор:
a+0=a. г) Для любого вектора a найдётся единственный противоположный ему вектор a ′ , т.е. такой, что a + a′ = 0 . Очевидно a′ = ( −1) a , что короче обозначается − a . Перечисленные свойства позволяют определить разность двух векторов
a и b , т.е. такой вектор c , что b + c = a . Действительно, можно выписать следующую цепочку эквивалентных друг другу равенств: b + c = a; b + c + b′ = a + b′;
( b + b′) + c = a + b′;
0 + c = a + b′; c = a + ( −1) b . Это и есть искомая разность, которую проще записывать в виде a − b . д) Если a и b - векторы, а α - число, то
(
)
α a + b = α a + αb . Это − дистрибутивность умножения числа на вектор относительно сложения векторов (рис. 5) .
Рис. 5. К свойству д). Проще говоря, при умножении числа на сумму векторов можно раскрывать скобки обычным образом. е) Если α , β − числа и a − вектор, то
(α + β ) a = α a + β a . 119
Это свойство дистрибутивности умножения числа на вектор относительно сложения чисел. Проще говоря, при умножении суммы чисел на вектор можно раскрывать скобки, как при умножении на число. ж) Если α , β - числа и a - вектор, то
α ( β a ) = (αβ ) a . з)
1⋅ a = a .
Из перечисленных свойств видно, что многие действия над векторами (вычитание, сложение нескольких векторов, группировка слагаемых, раскрытие скобок, вынесение общего множителя за скобки, перенос членов из одной части равенства в другую) проделываются по привычным из практики действий с числами правилам. Пусть теперь даны s векторов (1) a1, a2 , … , as . Применяя к ним конечное число раз операции сложения векторов и умножения их на числа, получим, после приведения подобных членов, вектор (2) a = α1a1 + α 2 a2 + … + α s as , где α1, α 2 , … , α s − числа. Вектор (2) называется линейной комбинацией векторов (1). Числа α1, α 2 , … , α s называются коэффициентами этой линейной комбинации. Говорят также, что вектор a линейно выражается через векторы (1). Снова рассмотрим произвольную систему векторов (1). Эта система называется линейно зависимой, если хотя бы один из её векторов линейно выражается через остальные, и линейно независимой − в противном случае. Сформулированное определение годится, если в системе (1) больше одного вектора. Система из одного вектора, по определению, считается линейно зависимой, если это нулевой вектор, и линейно независимой в противном случае. ПРИМЕР 1. Любая система векторов, среди которых есть нулевой вектор, линейно зависима. В самом деле, нулевой вектор можно представить как линейную комбинацию остальных векторов системы с нулевыми коэффициентами.
120
ПРИМЕР 2. Любые векторы, параллельные одной и той же прямой, линейно зависимы. Такие векторы называются коллинеарными. ПРИМЕР 3. Любые векторы, параллельные одной и той же плоскости, линейно зависимы. Их называют компланарными. Докажем наше утверждение. Если среди векторов системы есть нулевой или пара коллинеарных, оно очевидно. Если же это не так, то один из векторов можно “разложить по двум другим” (рис. 6).
Рис. 6.
К примеру 3.
ПРИМЕР 4. Любые четыре геометрические вектора линейно зависимы. Обоснование аналогично предыдущему примеру, с той разницей, что один из некомпланарных векторов разлагается по трём остальным. ПРИМЕР 5. Добавляя к системе линейно зависимых векторов ещё какие-нибудь векторы, снова получим линейно зависимую систему. Всякий упорядоченный набор e1, e2 , e3 трёх линейно независимых геометрических векторов называется базисом множества геометрических векторов. Имея базис, можно взаимно однозначно сопоставить каждому геометрическому вектору x упорядоченный набор трёх чисел динат в этом базисе (рис. 7), так что x = x1e1 + x2e2 + x3e3
{x1, x2 , x3} − его коор(3)
(Фигурные скобки для записи координат векторов используются, чтобы отличать их от координат точек). Таким образом, при наличии базиса, знать вектор – это знать тройку его координат.
121
Рис. 7.
Определение координат по базису.
(Геометрически очевидно, что все координаты нулевого вектора – нули). Вектору, равному сумме векторов, соответствует почленное сложение наборов координат: если наряду с вектором (3) имеется вектор (4) y = y1e1 + y2e2 + y3e3 , то
x + y = ( x1 + y1 )e1 + ( x2 + y2 )e2 + ( x3 + y3 )e3 .
(5)
Аналогично, умножению числа α на вектор соответствует почленное умножение этого числа на координаты вектора: α x = (α x1)e1 + (α x2 )e2 + (α x3 )e3 . (6) Формулы (5), (6) сводят операции над векторами (сложение и умножение на числа) к соответствующим операциям над числами – координатами векторов. При этом любое равенство x = y двух векторов оказывается эквивалентным системе трёх числовых равенств x1 = y1, x2 = y2 , x3 = y3 . →
→
→
ПРИМЕР 7. Задан тетраэдр OABC (рис. 8). В базисе из рёбер OA, OB, OC найти координаты: →
1) вектора DE , где D и E – середины рёбер OA и BC, 122
→
2) вектора OF , где F – точка пересечения медиан основания ABC. Для случая 1) имеем: → → → 1 → → 1 → 1→ 1→ 1 → DE = OE − OD = OC + OB − OA = − OA+ OB + OC . 2 2 2 2 2 Ответ: {−1/ 2, 1/ 2, 1/ 2} .
Рис. 8.
К примеру 7.
Случай 2):
→ → → → 1 → → 1 → → 1 → 2 → OF = OE + EF = OE + EA = OE + OA− OE = OA+ OE = 3 3 3 3 1 → 2 1 → → 1 → 1 → 1 → OA+ ⋅ OC + OB = OA+ OB + OC . 3 3 3 2 3 3 Ответ:
{1/ 3, 1/ 3, 1/ 3} .
ПРИМЕР 8. Векторы p {0,2,1}, q {0,1, −1}, r {5, −3,2} заданы своими координатами в некотором базисе. Составляют ли они сами базис? Другими словами, являются ли они линейно независимыми? Несколько позже мы получим стандартные способы ответа на подобный вопрос. А сейчас будем действовать, пользуясь только определением линейной зависимости и геометрическим смыслом. Прежде всего, очевидно, что все три вектора отличны от нулевого. Теперь выясним, коллинеарны ли, скажем, векторы p и q , т. е. верно ли равенство p = α q с некоторым числом α . В координатах это равенство имеет вид системы уравнений 123
0 =α ⋅0 2 = α ⋅1 . 1 = α ⋅ ( −1) Очевидно, эта система не удовлетворяется ни при каком α , т.е. векторы p и q не коллинеарны. Теперь осталось выяснить, компланарны ли три вектора p, q , r , т.е. лежит ли третий из них в плоскости первых двух, т.е. выполняется ли равенство r = α p + β q при некоторых числах α и β . Если да, то данная тройка векторов не составляет базиса, если нет – составляет. В координатах указанное равенство принимает вид системы уравнений 5 = α ⋅ 0 + β ⋅ 0 −3 = α ⋅ 2 + β . 2 =α − β Уже из первого уравнения видно, что система не удовлетворяется никакими числами α и β . Итак, векторы p, q , r образуют базис множества геометрических векторов. ПРИМЕР 9. Найти координаты вектора x {15, −20, −1} в базисе p, q , r предыдущего примера. Очевидно, следует найти коэффициенты x1, x2 , x3 в разложении
x = x p + x2 q + x3r . 1 В координатах это разложение имеет вид системы уравнений 0 ⋅ x1 + 0 ⋅ x2 + 5 x3 = 15 2 x1 + x2 − 3 x3 = −20 x − x + 2 x = −1 3 1 2 Решая эту систему, легко находим её единственное решение: x1 = −6, x2 = 1, x3 = 3 . Таким образом x = −6 p + q + 3r .
4.2. Векторные пространства Существуют совокупности объектов, совсем не похожих на геометрические векторы и даже имеющих совсем не геометрическую природу, но обладающих свойствами, аналогичными свойствам этих векторов. А именно, для 124
элементов этих совокупностей тоже можно определить операции сложения и умножения на числа так, чтобы выполнялись свойства а) – з) из 4.1 со всеми их следствиями. В частности, для таких совокупностей можно вводить понятия линейной зависимости, базиса и координат. Множество V называется векторным или линейным пространством, если определены операции сложения его элементов и умножения их на числа, так что: Для любой упорядоченной пары x, y ∈ V существует единственный элемент x + y ∈ V (сумма x и y); для любого x ∈ V и любого числа α ∈ существует единственный элемент α x ∈ V (произведение α на x), при этом выполняются следующие аксиомы: 1. ∀x, y ∈ V : x + y = y + x. 2. ∀x, y , z ∈ V :
( x + y ) + z = x + ( y + z ).
3. Существует единственный элемент из V, называемый нулевым и обозначаемый 0, такой что ∀x ∈ V : x + 0 = x. 4. Для каждого x ∈ V существует единственный элемент x′ ∈ V , такой что x + x′ = 0 . Этот элемент называется противоположным для x. 5. ∀x, y ∈ V , ∀α ∈ : α ( x + y ) = α x + α y. 6. ∀α , β ∈ , ∀x ∈ V : 7. ∀α , β ∈ , ∀x ∈ V :
(α + β ) x = α x + β x. α ( β x ) = (αβ ) x.
8. ∀x ∈ V : 1 ⋅ x = x. Элементы векторного пространства называются векторами. Свойства 1 − 8 называются аксиомами векторного пространства. Сделаем несколько замечаний к приведённому определению векторного пространства. - После этого определения термин “вектор” принимает более общий смысл, чем первоначально в теории геометрических векторов. - Новый смысл обретает и термин “пространство”. Это вовсе не обязательно реальное физическое пространство, а какое угодно множество, лишь бы для его элементов были определены операции сложения и умножения на числа, удовлетворяющие аксиомам 1 − 8. 125
- Векторы произвольного векторного пространства мы будем, как правило, обозначать латинскими буквами без стрелки, оставляя её для случая геометрических векторов. Для чисел же будем стараться, по возможности, использовать греческие буквы. Кстати, в теории векторных пространств числа часто называют скалярами. - Замечания после свойств а) − з) из пункта 4.1 о действиях над геометрическими векторами остаётся в силе и для векторов произвольной природы. Это понятно, поскольку аксиомы векторного пространства 1 − 8 фактически совпадают с указанными свойствами. - Определения линейной комбинации и линейной зависимости или независимости геометрических векторов сохраняется в силе и для произвольного векторного пространства.
4.3. Системы линейных алгебраических уравнений и их исследование методом Гаусса Рассмотрим часто возникающую в теории и практике действий с векторами задачу: является ли данный вектор y некоторого n-мерного векторного пространства V линейной комбинацией заданных векторов a1, a2, …, am того же пространства? Иначе говоря, существует ли набор чисел (x1, x2,…, xm) таких, что равенство x1a1 + x2 a2 +…+ xm am = y (1) имеет место? Например, так стоит задача при решении вопроса о линейной зависимости векторов a1, a2, …, am (тогда y = 0). Помимо проблемы существования решения (x1, x2,…, xm) уравнения (1), интерес обычно представляют и проблемы единственности этого решения, нахождения алгоритма вычисления составляющих его чисел. Анализ уравнения (1) существенно опирается на метод координат. А именно, выбрав в пространстве V какой-либо базис, разложим по нему данные векторы, заменив их соответствующими наборами координат: ai = (a1i , a2i ,…,ani),
i = 1, 2,…, m
(2)
y = (y1, y2 ,…,yn) после чего можно записать эквивалентную (1) систему числовых равенств
126
a11 x1 + a12 x2 + … + a1m xm = y1 a x + a x +…+ a x = y 21 1 22 1 2m m 2 … an1 x1 + an 2 x2 + … + anm xm = yn
(3)
Поскольку ставится вопрос о нахождении чисел (x1, x2,…, xm) при заданном y, это есть система n числовых уравнений с m числовыми неизвестными. Её называют системой линейных алгебраических уравнений (иногда используется аббревиатура СЛАУ). Подобные системы сплошь и рядом встречаются в линейной алгебре и её приложениях, в чём мы неоднократно убедимся. Обычно данные в системе величины сводят в (n,m) -матрицу системы a1m a11 a12 a a2m 21 a22 (4) A= ⋅ ⋅ ⋅ ⋅ a a a nm n1 n 2 и матрицу-столбец правых частей y1 y (5) Y = 2 yn Иногда эти два объекта объединяют в расширенную матрицу системы a11 a12 … a1m y1 a a a y m 21 22 2 2 . (6) AY = ⋅ ⋅ ⋅ ⋅ ⋅ anm yn an1 an 2 Широко используется индексная запись системы (3): m
∑ aij x j = yi ,
(i = 1,2,…,n)
(7)
j =1
Если правые части системы (3) − нули, т.е. вектор-столбец (5) равен нулю, система (3) называется однородной, или системой без правых частей. Приведя необходимые определения, обратимся к наиболее универсальному, практичному и, наверное, простому методу исследования системы (3). Он называется методом последовательного исключения неизвестных, или методом Гаусса. В дальнейшем мы познакомимся и с другими методами, 127
имеющими существенное значение для теоретических вопросов, в которых встречаются подобные системы, однако практическое решение конкретных систем, в том числе и с очень большим числом уравнений и неизвестных, как правило, осуществляется методом Гаусса или его модификациями. Этот метод позволяет ответить на следующие вопросы: - Имеет ли решения система (3), т.е. совместна ли она? - Единственно ли решение системы, т.е. определённая ли она? - Как описать структуру множества решений, если их много? - Как вычислять конкретные решения системы? Суть метода более или менее ясна из его названия “метод последовательного исключения неизвестных”. Однако, на пути реализации этих самых последовательных исключений возможны некоторые “подводные камни”. Поэтому мы изложим строгое формальное описание метода Гаусса, не оставляющее никаких неясностей и понятное даже компьютеру. Для этого перепишем систему (3) в несколько более громоздком, но удобном для нашего изложения виде 0 0 a11 x1 + a12 x2 + … + a10m xm = y10 0 0 a21 x1 + a22 x1 + … + a20m xm = y20 . … 0 0 0 0 an1 x1 + an 2 x2 + … + anm xm = yn
(8)
Рассмотрим вначале первое уравнение этой системы. Может случиться, 0 0 = a12 = … = a10m = y10 = 0 , т.е. уравнение удовлетворяется любым набочто a11
ром неизвестных (x1, x2,…, xm). Тогда первое уравнение можно отбросить, оставшиеся уравнения составят новую систему, эквивалентную исходной. 0 0 Другая возможность: a11 = a12 = … = a10m = 0 , но y10 ≠ 0 . Первое уравне-
ние, а следовательно и вся система (8) не удовлетворяется никаким набором (x1, x2,…, xm), т.е. она несовместна. Фиксированием этого факта исследование системы заканчивается. Наконец, остаётся последняя возможность: среди коэффициентов 0 0 a11 , a12 , …, a10m есть, по меньшей мере, один, отличный от нуля. Назовём его ведущим элементом матрицы системы. Не ограничивая общности анализа,
128
0 можно считать, что это a11 (в противном случае можно свести дело к этому случаю, временно изменив нумерацию неизвестных и запомнив это изменение). Решим первое уравнение системы (8) относительно неизвестного x1 , получая
выражение
x1 = −
0 a12
0 a11
x2 −
0 a13
0 a11
x3 − … −
a10m 0 a11
+
1
y0 0 1 a11
(9)
Подставим его правую часть вместо x1 в остальные уравнения системы (8), исключая из них x1. Получим систему уравнений вида 0 0 a11 x1 + a12 x2 + … + a10m xm = y10 a122 x1 + … + a12m xm = y12 , … a1n 2 x2 + … + a1nm xm = y1n
(10)
где 0 ai01 0 1 0 ai1 0 − y (i = 2,3,…, m; j = 2,3,…, n) a , yi = yi − 0 1j 0 1 a11 a11 Очевидно, что системы (8) и (10) эквивалентны.
a1ij
= aij0
(11)
Рассмотрим теперь систему, состоящую из всех уравнений (10), кроме первого. Это система с неизвестными (x2, x3 ,…, xm). Поступим с ней так же, как с системой (8). Опять имеются три возможности: либо её первое уравнение удовлетворяется тождественно, его можно отбросить и перейти к более “короткой” системе; либо это уравнение противоречиво, т.е. система (8) по этой причине несовместна, что завершает её анализ; либо a122 ≠ 0 . В последнем случае исключим неизвестное x2 из всех уравнений (10), начиная с третьего. Продолжим аналогичным образом последовательное исключение неизвестных. Может быть система (8) окажется несовместной из-за противоречивости одного из уравнений. Этот факт будет обнаружен. Что произойдёт в противном случае? Если по пути придётся отбросить k тождественно выполняющихся уравнений, т.е. неизвестные будут исключаться из n – k уравнений, то мы исключим n – k – 1 неизвестных и получим эквивалентную (8) систему
129
0 0 a11 x1 + a12 x2 + … + a1,0 n −k xn −k + a1,0 n −k +1xn −k +1 + … + a10m xm = y10 a122 x2 + … + a12,n −k xn −k + a12,n −k +1 xn −k +1 + … + a12m xm = y12 (12) ann−−kk,−n1−k xn −k + ann−−kk,−n1−k +1 xn − k +1 + + ann−−kk,−m1 xm = ynn−−kk −1
Переходом к системе (12) заканчивается первый этап применения метода Гаусса, называемый прямым ходом. Неизвестные xn-k+1,…, xm, не фигурирующие в “треугольной” части системы (12), называются свободными (независимыми). Рассмотрим сначала случай, когда их нет, т.е. когда m = n – k (общее число неизвестных m совпадает с числом всех уравнений, кроме лишних, тождественных). Перебирая последовательно все m уравнений (12), от последнего к первому, мы единственным образом найдём сначала xm, затем xm−1, и т.д. до x1 включительно. В этом состоит обратный ход метода Гаусса. Гарантией его однозначной реализуемости 0 служит то, что ведущие элементы a11 , a122 , …, ann−−kk,−n1− k отличны от нуля.
Таким образом, в случае m = n – k система (8), а значит и (1), − совместная и определённая. Её решение вычисляется по алгоритму метода Гаусса. Пусть теперь m > n – k , т.е. имеется m − n – k свободных неизвестных xn-k+1,…, xm. Задавая произвольно их числовые значения, мы сводим систему (12) к “треугольной” и, реализуя обратный ход метода Гаусса, однозначно находим соответствующие значения оставшихся (связанных) неизвестных x1,…, xn-k. Таким образом, всякий выбор значений свободных неизвестных однозначно определяет решение системы (1). Следовательно, в случае m > n – k система (1) совместна, но неопределённа, т.е. имеет не одно решение. Чтобы удобнее описать совокупность получающихся при этом решений, заметим, что выражения связанных неизвестных через свободные являются выражениями первой степени. Это видно из алгоритма обратного хода. Значит можно записать x1 = b11 xn-k +1+b12 xn-k +2+…+b1,m-n+k xm +c1 x2 = b21 xn-k +1+b22 xn-k +2+…+b2,m-n+k xm+c2 … xn-k = b n-k ,1 xn-k +1+b n-k ,2 xn-k +2+…+b n-k,m-n+ k xm +c n-k , 130
где буквы b с индексами – это заданные числа, определяемые матрицей исходной системы (1), а буквы с (с индексами) зависят ещё и от правых частей системы и обращаются в нули, если правые части – нули (см. (11)). Обозначим свободные неизвестные новыми буквами: xn-k+1 = t1, xn-k+2 = t2 ,…, xm = tm-n+k Тогда любое решение системы (1) запишется в виде x1 = b11 t1+b12 t2+…+b1,m-n+k tm-n+k+c1 x2 = b21 t1+b22 t2+…+b2,m-n+k tm-n+k+c2 … xn-k = b n-k,1 t1+b n-k,2 t2+…+b n-k,m-n+ k tm-n+k+c n-k xn-k +1 = t1 xn-k +2 = t2 … xm = tm-n+k Чтобы переписать эту громоздкую систему равенств в компактном виде, введём матрицы-столбцы высоты m: x1 c1 x c 2 2 X= , C = , … … xm cm b11 b12 b1,n −m + k b b b − + 21 22 2, n m k … … … bn −k ,1 bn −k ,2 bn −k ,n −m + k B1 = 1 , B2 = 0 , …, Bm −n + k = 0 0 0 1 0 0 0 … … … 0 0 1 Тогда любое решение системы (2) представляется так: X = t1 B1 + t2 B2 + …+ tm-n+k Bm-n+k + C
(13)
Отметим, что все столбцы B1, B2, …, Bm-n+k − линейно независимы как векторы m
из R (почему?) Подведём итоги, т.е. сформулируем, каким образом применение метода Гаусса позволяет ответить на вопросы, связанные с анализом системы (1). 131
1) Если при прямом ходе метода Гаусса обнаруживается противоречивое уравнение, то система несовместна. 2) В противном случае она совместна, и все её решения даются формулой (13), содержащей m – n + k параметров, которые могут принимать произвольные значения (это свободные неизвестные). 3) Если свободных неизвестных нет, то система определённая, т.е. имеет единственное решение (вектор-столбец С). В случае однородной системы (без правых частей) это единственное решение есть нулевой вектор-столбец. 4) Если свободные неизвестные есть, то система неопределённая, т.е. имеет много решений. В случае однородной системы (C = 0) эти решения составляют множество всех линейных комбинаций векторов-столбцов B1, B2, …, Bm-n+k , т.е. (m–n+k)-мерное подпространство векторного пространства m
R . В случае неоднородной системы, к каждому такому решению надо прибавлять один и тот же вектор-столбец C. ПРИМЕР 1. Исследуем методом Гаусса систему x1 + 2 x2 + 3x3 + 4 x4 = 0 7 x + 14 x + 20 x + 27 x = 0 1 2 3 4 5 x1 + 10 x2 + 16 x3 + 19 x4 = −2 3x1 + 5 x2 + 6 x3 + 13x4 = 5
(14)
Из первого уравнения выражаем x1 через остальные неизвестные и подставляем это выражение в три других уравнения. Получаем вместо (14) эквивалентную систему x1 = −2 x2 − 3x3 − 4 x4 − x3 − x4 = 0 x3 − x4 = −2 − x2 − 3x3 + x4 = 5 Из четвёртого уравнения этой системы выражаем x2 через x3 и x4 и подставляем это выражение во второе и третье уравнения, что фактически их не меняет. Это приводит к системе
x1 = −2 x2 − 3 x3 − 4 x4 x2 = −3x3 + x4 − 5 − x3 − x4 = 0 x3 − x4 = −2 132
Из третьего уравнения этой системы выражаем x3 через x4 и подставляем в последнее уравнение. Получаем систему, завершающую прямой ход метода Гаусса: x1 = −2 x2 − 3x3 − 4 x4 x2 = −3x3 + x4 − 5 x3 = − x4 x4 = 1 Обратным ходом находим последовательно x4 = 1, x3 = –1, x2 = –1, x1 = 1. Итак, система (14) имеет единственное решение (1, −1, −1, 1). ПРИМЕР 2. Примéним метод Гаусса к системе 1 x1 + x2 = x +x +x = 4 1 2 3 −3 x2 + x3 + x4 = x3 + x4 + x5 = 2 x4 + x5 = − 1 Исключая последовательно x1, затем x2 и x3, получаем, соответственно, системы x1 = − x2 + 1 x1 = − x2 + 1 x =3 x = −x − 6 3 4 2 ⇔ x2 + x4 = −6 x3 = 3 x + x = −1 x + x = −1 4 5 4 5 x4 + x5 = −1 x4 + x5 = −1 Исключение x4 приводит, после отбрасывания лишнего уравнения (тождества), к системе x1 = − x2 + 1 x = −x − 6 4 2 x3 = 3 x = −x −1 5 4 0 = 0 Отбрасывая лишнее уравнение и проводя обратный ход, получаем выражения всех неизвестных через единственную неизвестную x5:
133
x1 = − x5 + 6 −1 6 1 −5 x = x − 5 2 5 = + или, в форме матриц-столбцов, X x x = 3 0 3 5 3 . x = −x −1 −1 4 5 −1 1 0 x5 = x5 , ПРИМЕР 3. Рассмотрим систему
105 x1 − 175 x2 − 315 x3 + 245 x4 = 84 90 x1 − 150 x2 − 270 x3 + 210 x4 = 72 75 x − 125 x − 225 x + 175 x = 59 1 2 3 4 Выражая из первого уравнения x1 и подставляя его в остальные уравнения, убеждаемся, что второе уравнение обращается в тождество, а третье – противоречиво (проверьте!). Таким образом, заданная система несовместна.
4.4. Координаты точек От абстрактного векторного пространства вернёмся к обычной евклидовой геометрии – модели реального пространства. Мы представляем себе его как множество E точек. Зафиксируем в E произвольную точку O, которую назовём началом отсчёта. Затем каждой точке M из E сопоставим вектор OM , называемый радиус-вектором точки M. Таким образом, возникает взаимно однозначное соответствие между всеми точками пространства E и всеми геометрическими векторами, т.е. векторами из V3 (поскольку каждый вектор, если его отложить от начала отсчёта, оказывается радиус-вектором вполне определённой точки). После этого многие рассуждения о точках можно пересказать на языке векторов (их радиус-векторов). Зафиксируем теперь, кроме начала отсчёта O , ещё и некоторый базис
e1 , e2 , e3 в пространстве V3. Система (O, e1 , e2 , e3 ) называется аффинной системой координат пространства E. Она позволяет сопоставить каждой точке M ∈ E набор её аффинных координат (x1, x2, x3), которые определяются как координаты радиуса-вектора OM в базисе e1 , e2 , e3 (см. рис.7 из п. 4.1).
134
Рис. 1. Аффинная система координат в пространстве. Таким образом, с помощью аффинной системы координат устанавливается взаимно однозначное соответствие между точками пространства E и 3
числовыми наборами арифметического трёхмерного пространства R . Значит 3
R можно трактовать, по желанию, как арифметическую модель и векторного пространства V3 и пространства точек E. Вместо (O, e1 , e2 , e3 ) аффинную систему координат часто обозначают Ox1x2x3, вводя вместо базисных векторов координатные оси Ox1, Ox2, Ox3 (оси абсцисс, ординат и аппликат). Единица длины на каждой оси есть длина соответствующего базисного вектора. В том случае, когда базисные векторы e1, e2 , e3 попарно перпендикулярны и имеют одинаковую длину, аффинная система координат называется декартовой системой, а соответствующие координаты – декартовыми координатами. При этом базисные векторы часто обозначают символами i , j , k . Напомним, что координаты векторов в декартовом базисе обычно заключают в фигурные скобки: так, представление a = xi + y j + zk эквивалентно записи
a {x , y , z} . Рассуждения, аналогичные проведённым выше, можно провести не для всего пространства точек E, а для множества точек какой-либо плоскости. При этом векторное пространство V3 надо заменить на V2 . Аффинная система координат будет содержать два вектора, каждой точке плоскости будут соответствовать две координаты (см. рис. 2). 135
Наконец, аналогично можно рассматривать множество точек какой-либо прямой. Аффинная система координат будет иметь один базисный вектор, а каждая точка – одну координату (рис. 3). x2
M
e2 x1
e1 Рис. 2. Аффинная система координат на плоскости.
e
0
x
M
Рис.3. Аффинная система координат на прямой.
Имея аффинную систему координат, можно переводить на язык чисел многие геометрические задачи. Приведём два простых примера. ПРИМЕР 1. Даны две точки в пространстве своими аффинными коор→
динатами: A ( x A , y A , z A ) , B ( x B , y B , z B ) . Найти вектор AB . На языке аналитической геометрии найти вектор означает найти его координаты. Поскольку (рис. 4) →
→
→
AB = OB − OA , (1) а координаты радиус-векторов совпадают с координатами точек – их концов, имеем → AB {x B − x A , y B − y A , z B − z A} . B
α
A
С
β
B
A
O
O
Рис. 4. К примеру 1.
(
)
Рис. 5. К примеру 2. → и вектор AB {α , β , γ } , то с помощью
Если же даны точка A x A , y A , z A той же формулы (1) легко находится точка B: B ( x A + α , y A + β , z A + γ ) . 136
ПРИМЕР 2. Пусть, как и в предыдущем примере, заданы точки A ( x A , y A , z A ) , B ( x B , y B , z B ) . Найти точку C, которая делит отрезок AB в заданном отношении α β (рис. 5).
→ → α → Очевидно, OC = OA+ AB . α+β Поэтому точка C имеет координаты α xC = x A + ( xB − x A ) , α+β yC = y A +
α ( yB − y A ) , α+β
zC = z A +
α ( zB − z A ) α+β
ПРИМЕР 3. На плоскости с заданной аффинной системой координат рассмотрим параллелограмм. Зная его смежные вершины M ( −2, 6 ) и N ( 2,8 ) , а также точку пересечения диагоналей P ( 2, 2 ) , найти координаты двух других вершин. Имеем (рис. 6): → → → → → → → → OA = OM + 2 MP = OM + 2(OP − OM ) = 2 OP − OM
→ → → → → → → → OB = ON + 2 NP = ON + 2(OP − ON ) = 2 OP − ON Радиус-векторы искомых точек выражены через радиус-векторы заданных точек. Этого достаточно, чтобы легко вычислить нужные координаты. Ответ: A ( 6, 2 ) , B ( 2, −4 ) . B M
P A
N
Рис. 6.
O
К примеру 3. 137
4.5. Аналитическое представление прямой линии Рассмотрим какую-либо прямую линию ∆ в пространстве E (рис. 1). Чтобы зафиксировать её индивидуальность, достаточно задать некоторую её точку
M 0 и некоторый отличный от нуля вектор l , параллельный этой прямой. Предположим, что в пространстве выбрано начало отсчёта – точка O.
Mo
M
l
∆
r
ro
Рис. 1. Задание прямой линии. Пусть теперь M – произвольная точка прямой ∆ . Обозначим r0 и r радиусвекторы точек M 0 и M соответственно. Из рис. 1 очевидно, что для каждой точки M прямой ∆ , и только для таких точек, выполняется соотношение (1) r = r0 + l ⋅ t , где t – действительное число. Это соотношение называется параметрическим представлением прямой ∆ в векторной форме. Оно представляет собой функцию числа t, определённую на всей прямой , значениями этой функции являются радиус-векторы всех точек этой прямой. Эта функция осуществляет взаимно однозначное соответствие между множеством всех действительных чисел и множеством всех точек прямой. Для краткости вместо “параметрическое представление” используют термин “параметризация”. Число t в формуле (1) называют параметром прямой. Если, в дополнение к началу отсчёта О, в пространстве задан базис e1, e2 , e3 , т.е. имеется аффинная система координат Ox1x2 x3 , то, вводя координаты всех векторов, фигурирующих в (1), получаем вместо одного векторного равенства (1) три числовых: x1 = x01 + l1 ⋅ t (2) x2 = x02 + l2 ⋅ t . x = x + l ⋅t 3 03 3 138
Это – параметрическое представление прямой в координатной (или скалярной) форме. При желании, его можно рассматривать как систему трёх уравнений с четырьмя неизвестными x1, x2 , x3 , t , из которых одна свободна. Если выразить параметр t из каждого равенства системы (2) и приравнять результаты, то получим систему двух уравнений x1 − x01 x2 − x02 x3 − x03 = = (3) l1 l2 l3 с тремя неизвестными x1, x2 , x3 . Эта система эквивалентна системе (2). Действительно, если обозначить общее значение всех отношений (3) через t и выразить каждую координату x1, x2 , x3 через t, получим систему (2). Уравнения (3) называются каноническими уравнениями прямой. Сделаем одно замечание по поводу приведённого вывода уравнений (3) из уравнений (2). Он возможен только тогда, когда все знаменатели в (3) отличны от нуля. Однако, может случиться, что одна или даже две координаты направляющего вектора прямой окажутся нулями (лишь бы не все три, поскольку вектор не может быть нулевым – тогда прямая не определена). Пусть, например l1 = 0 . Тогда первый знаменатель в (3) есть ноль, что, вообще говоря, не имеет смысла. Но, как видно из (2) это значит лишь, что x1 − x01 = 0 . Понимая это, мы всё-таки применяем в этом случае запись вида (3), которая принимает вид
x1 − x01 x2 − x02 x3 − x03 = = l2 l3 0 и фактически эквивалентна системе равенств x −x x −x x1 − x01 = 0, 2 02 = 3 03 . l2 l3 Аналогично, если l1 = l2 = 0 , мы пишем x1 − x01 x2 − x02 x3 − x03 = = , l3 0 0 имея в виду систему равенств x −x x1 − x01 = 0, x2 − x02 = 0, 3 03 = t . l3 139
Перейдём к примерам, в которых для аффинных координат используем обозначения x, y , z . ПРИМЕР 1. Написать канонические уравнения прямой, проходящей через точку M 0 (2, 0, −3), параллельной (а) вектору l {2, −3,5} , (б) прямой
x −1 y + 2 z +1 = = , −1 5 2
(в) оси Оx, (г) оси Oy, (д) прямой x = −2 + t ,
1 y = 2t , z = 1 − t. 2
Решение. Изложенная выше теория говорит: знать прямую означает знать одну её точку и один вектор, коллинеарный прямой. Точка у нас есть. В задаче (а) вектор тоже есть. Поэтому по формулам (3) сразу пишем x−2 y z+3 ответ: = = . −3 2 5 В задаче (б) в качестве направляющего вектора искомой прямой можно взять направляющий вектор заданной прямой, координаты которого – это знаменатели в уравнениях (б), поскольку эти прямые параллельны. Таким образом, получаем x−2 y z+3 = = ответ: . −1 5 2 В задачах (в) и (г) достаточно сообразить, что направляющие векторы координатных осей x и y можно взять в виде {1, 0, 0} и {0, 1, 0} , соответственно. Отсюда получаем соответствующие прямые x−2 y z+3 x−2 y z+3 = = = = и . ответы: 1 0 0 0 1 0 Наконец, в задаче (д), как следует из (3), координаты направляющего вектора – это коэффициенты при t в равенствах (д). Отсюда x−2 y z+3 = = . ответ: 1 2 −1 2
140
ПРИМЕР 2. Написать параметрические представления и канонические
(
уравнения прямой, проходящей через две заданные точки M1 x1, y1, z1
)
и
M 2 ( x2 , y2 , z2 ) . Применить результат к следующим парам точек: (а) M1 (1, − 2, 1) , M 2 ( 3, 1, − 1) ; (б) M1 ( 3, − 1, 0 ) , M 2 (1, 0, − 3) .
Для решения поставленной задачи в общем виде заметим, что вектор
→ M1M 2 {x2 − x1, y2 − y1, z2 − z1} есть направляющий вектор искомой прямой. В качестве фиксированной точки прямой, которая необходима для написания
(
)
требуемых уравнений, возьмём, например, M1 x1, y1, z1 . Тогда можно сразу написать уравнения прямой в соответствии с (2) и (3): Параметрическое представление:
x = x1 + ( x2 − x1 ) t y = y1 + ( y2 − y1 ) t z = z1 + ( z2 − z1 ) t Канонические уравнения: y − y1 z − z1 x − x1 = = . x2 − x1 y2 − y1 z2 − z1 Подставляя теперь заданные числа, получаем результаты для конкретных случаев: x = 1 + 2t x −1 y + 2 z −1 = = (а) ; y = −2 + 3t , − 2 3 2 z = 1 − 2t (б)
x = 3 − 2t y = −1 + t , z = −3t
x − 3 y +1 z . = = −2 −3 1
Закончив с примерами, обсудим следующий вопрос: как можно судить о взаимном расположении двух прямых в пространстве, если они заданы своими параметрическими (или каноническими – это не принципиально) уравнениями. Пусть прямая ∆ задана представлением (1), а прямая ∆′ − представлением
r ′ = r0′ + l ′ ⋅ t ′ .
(1′)
Возможны следующие варианты взаимного расположения этих прямых: 141
(1). Прямые параллельны (рис. 2а). Очевидно, это равносильно тому, что векторы l и l ′ коллинеарны, но вектор r0′ − r0 им не коллинеарен. (2). Прямые совпадают (рис. 2б). В этом случае все три вектора l , l ′ и
r0′ − r0 коллинеарны. (3). Прямые пересекаются (рис. 2в). Это значит, что l и l ′ не коллинеарны, но все три вектора l , l ′ и r0′ − r0 компланарны. (4). Прямые скрещиваются (рис 2г). При этом все три вектора l , l ′ и
r0′ − r0 не компланарны
l′
Mo′
l
l Mo
Mo
∆′
∆
∆, ∆′
б)
а)
Mo
Mo′
l Mo′
l′
l′ Mo
в)
Рис.2.
l′
Mo′
l г)
Взаимное расположение двух прямых в пространстве.
Мы видим, что решение вопроса о взаимном расположении прямых, заданных параметрически, сводится к исследованию линейной зависимости некоторых систем векторов. Теперь рассмотрим ситуацию, когда прямая рассматривается не в трёхмерном пространстве, а на плоскости. Аффинная система координат имеет в этом случае базис из двух неколлинеарных векторов. Соответственно, имеются только две координаты, которые мы обозначим x, y. Параметрическое пред142
ставление прямой на плоскости в векторной форме имеет, естественно, прежний вид (1). Однако координатные соотношения (2), (3) упрощаются и принимают соответственно форму x − x0 y − y0 x = x0 + l1 ⋅ t = , . (4) y = y + l ⋅ t l l 0 2 1 2 Если в последнем равенстве (4) избавиться от знаменателей, то оно легко приводится к уравнению (5) Ax + By = C , в котором хотя бы один из коэффициентов A и B отличен от нуля (поскольку A = l2 , B = −l1, C = l2 x0 − l1 y0 ). Уравнение (5) получается и в случае, когда одна из координат направляющего вектора обращается в ноль, что легко проверить. Уравнение (5) называется общим уравнением прямой на плоскости. Отметим частные случаи уравнения (5) (неполные уравнения прямой на плоскости). Очевидно, что: C = 0 ⇔ прямая ∆ проходит через начало координат, A = 0 ⇔ прямая ∆ параллельна оси Ox или совпадает с ней, B = 0 ⇔ прямая ∆ параллельна оси Oy или совпадает с ней. Наконец, если прямая не параллельна оси Oy, т.е. B ≠ 0 , равенство (5) эквивалентно равенству (6) y = kx + b , где
k = − A B, b = C B .
Соотношение (6) называется уравнением прямой с угловым коэффициентом. Оно хорошо известно из средней школы для случая, когда базис системы координат Oxy состоит из двух взаимно перпендикулярных векторов единичной длины. При этом угловой коэффициент k действительно является тангенсом угла наклона прямой к оси Ox.
4.6. Аналитическое представление плоскости Рассмотрим какую-либо плоскость Π в пространстве Е (рис. 1). Чтобы зафиксировать её индивидуальность, достаточно зафиксировать некоторую её точку M 0 и два неколлинеарных вектора l1, l2 , параллельных этой плоскости 143
(отложим их от точки M 0 ). Предположим, что в пространстве выбрана точка O – начало отсчёта. Mo
l2 M
Π
l1 ro
r О
Рис. 1. Задание плоскости. Пусть точка M – произвольная точка плоскости Π . Обозначим r0 , r радиус-векторы точек M 0 и M соответственно. Из рис. 1 видно, что вектор →
M 0 M единственным образом разлагается по векторам l1, l2 , т.е. существует единственная упорядоченная пара чисел s, t такая, что выполняется соотношение (1) r = r0 + l1 ⋅ s + l2 ⋅ t . Это соотношение называется параметрическим представлением плоскости Π в векторной форме. Оно представляет собой функцию пары действительных параметров s и t, которая осуществляет взаимно однозначное отображение числовой плоскости 2 на множество точек плоскости Π . Если, в дополнение к началу отсчёта O, в пространстве имеется базис, а значит и аффинная система координат Oxyz , то, вводя координаты векторов, фигурирующих в (1), получаем вместо одного векторного равенства (1) три числовых: x = x0 + l11 ⋅ s + l21 ⋅ t (2) y = y0 + l12 ⋅ s + l22 ⋅ t , z = z + l ⋅s + l ⋅t 0 13 23 Это – параметрическое представление плоскости в координатной, или скалярной форме.
144
Можно проверить, что, исключив из системы трёх уравнений (2) переменные s и t, мы получим одно соотношение с тремя переменными x, y , z , имеющее вид Ax + By + Cz = D ,
(3)
где A, B, C , D − фиксированные числа, из которых первые три не обращаются в ноль одновременно. Соотношение (3) называется общим уравнением плоскости. ПРИМЕР 1. Плоскость задана параметрически x = −1 + s − 2t y = 1+ s + t . z = 2 − 3s + t Найти её общее уравнение. Решение. Выражаем s из первого уравнения системы: s = x + 2t + 1. Подставляя это выражение в два оставшихся равенства, получаем систему y = x + 3t + 2 . = − − + z 3 x 8 t 2 Исключая из этих уравнений t, находим ответ: x + 8 y + 3 z = 22. ПРИМЕР 2. Написать параметрическое представление плоскости, заданной общим уравнением −2 x + y − z = 0. Решение. Выразим из данного уравнения одну переменную, например z, через две другие. Результат запишем в виде x=x y=y z = 1 − 2x + y Это и есть ответ, ибо можно считать переменные x и y, принимающие любые значения, параметрами. В этом случае (см. рис. 1)
r0 {0, 0, 1}, l1 {1, 0, − 2}, l2 {0, 1, 1} . ПРИМЕР 3. Написать параметризацию и общее уравнение плоскости, проходящей через точку M ( 0,1, 2 ) параллельно векторам {2,0,1}, {1,1,0} . Решение. Параметризацию получаем непосредственно по формулам (2):
145
x = 2s + t y = 1+ t . z = 2+s Исключая, аналогично предыдущему примеру, параметры s и t, находим общее уравнение плоскости: x − y − 2 z = −5 . ПРИМЕР 4. Написать параметризацию и общее уравнение плоскости, проходящей через заданные точки
M1 ( x1, y1, z1 ) , M 2 ( x2 , y2 , z2 ) , M 3 ( x3 , y3 , z3 ) .
Решение. В качестве точки M 0 (рис. 1) возьмём точку M1 , а в качестве → направляющих векторов примем векторы M1M 2 {x2 − x1, y2 − y1 z2 − z1} и → M1M 3 x3 − x1, y3 − y1 z3 − z1 . Получим параметризацию:
{
} x = x + s(x − x ) + t(x − x ) 1 2 1 3 1 y = y1 + s ( y2 − y1 ) + t ( y3 − y1 ) . z = z1 + s ( z2 − z1 ) + t ( z3 − z1 )
(4)
Исключая из этих уравнений, как показано выше, параметры s и t, найдём общее уравнение плоскости. Однако можно поступить иначе. Сразу выпишем условия принадлежности точек M1, M 2 , M 3 плоскости в виде:
Ax1 + By1 + Cz1 = D Ax2 + By2 + Cz2 = D Ax + By + Cz = D 3 3 3
(5)
Решая затем эту систему относительно неизвестных A, B, C , D , получим коэффициенты искомого общего уравнения плоскости. Пусть, скажем, даны конкретные точки M1 (1, 2, 0 ) , M 2 ( 2,1,1) , M 3 ( 3, 0,1) . Тогда формулы (4) дают x = 1 + s + 2t y = 2 − s − 2t , z = s+t
146
откуда, исключая параметры s и t, имеем x + y = 3 . Тот же результат получим, если решать систему вида (5): A + 2B = D 2 A + B = D 3 A + C = D при дополнительном условии, что A, B, C не равны нулю одновременно. Аналогично случаю прямой, остановимся на неполных общих уравнениях плоскости: - отсутствие в уравнении (3) правой части (D = 0) эквивалентно тому, что плоскость проходит через начало координат. - обращение в ноль одного из коэффициентов A, B или C означает, что плоскость параллельна соответствующей оси координат. Например, плоскость вида By + Cz = D параллельна оси Ox. В самом деле, возьмём какую-либо точку
( x0 , y0 , z0 ) такой плоскости, т.е. точку, удовлетворяющую уравнению By0 + Cz0 = D .
Любая точка
(6)
( x, y0 , z0 ) , с произвольным x, также должна лежать в данной
плоскости, поскольку она удовлетворяет уравнению (6). Таким образом, вся прямая x = t , y = y0 , z = z0 лежит в этой плоскости. Но эта прямая параллельна оси Ox. Значит и вся плоскость обладает тем же свойством. - обращение в ноль двух из трёх коэффициентов A, B и C означает, что плоскость параллельна одновременно двум координатным осям, т.е. содержащей их координатной плоскости. Например, плоскость Cz = D параллельна координатной плоскости Oxy. Теперь обратимся к вопросу об определении взаимного расположении A1x + B1 y + C1z = D1 и двух плоскостей с общими уравнениями A2 x + B2 y + C2 z = D2 . Чтобы решить его, следует выяснить, есть ли у этих плоскостей общие точки и каково множество этих точек. Это значит, что надо решить систему уравнений с двумя неизвестными A1x + B1 y + C1z = D1 . (7) + + = y C z D A x B 2 2 2 2 Возможны следующие варианты: 147
(а). Система (7) не имеет решений. Другими словами, плоскости не имеют общих точек, т.е. являются параллельными. В противном случае система имеет решения. Решение этой системы не может быть единственным, ибо это означало бы существование единственной общей точки у двух плоскостей, что геометрически невозможно. Поэтому при решении системы должны появиться свободные неизвестные. (б). В системе (7) есть одна свободная неизвестная. Т.е. все три неизвестные линейно выражаются через один произвольный параметр. Иначе говоря, плоскости (7) пересекаются по прямой линии. (в). В системе (7) есть две свободные неизвестные, т.е. все три неизвестные линейно выражаются через два произвольных параметра. Иначе говоря, пересечением данных плоскостей является плоскость. Но это может означать только одно – данные плоскости совпадают. Обратим особое внимание на случай (б). Это ещё один метод аналитического задания прямой в пространстве – как линии пересечения двух плоскостей. В этом смысле система (7) с одной свободной неизвестной называется системой общих уравнений прямой в пространстве. ПРИМЕР 5. Написать параметрическое представление и канонические уравнения прямой в пространстве 2 x − y + 2 z = 3 x + 2y − z =1 Решаем эту систему, и обнаруживаем, что имеется одна свободная неизвестная, например x: 1 4 5 y = − x, z = − x . 3 3 3 В матричной форме это выглядит так: x 1 0 y = − 4 3 x + 1 3 . z − 5 3 Поэтому параметрическое представление прямой можно записать в виде
x = t,
y = 1 3 − 4t 3, z = − 5t 3 ,
148
x y −1 3 z = = . Т.к. направляющий век0 − 4 3 −5 3 тор прямой можно выбирать с точностью до числового множителя, окончаx y −1 3 z = = . тельно запишем канонические уравнения прямой: 0 4 5 а канонические уравнения − в виде
В заключение раздела – несколько слов о взаимном расположении прямой и плоскости. Пусть плоскость задана своим общим уравнением, а прямая – каноническими или параметрическими уравнениями. Следует объединить уравнения прямой и плоскости в одну систему уравнений с тремя неизвестными x, y, z и решить её. Если решений нет, то прямая, очевидно, параллельна плоскости. Если решение одно, прямая и плоскость пересекаются. Если же решений больше одного, то, конечно, прямая лежит на плоскости.
4.7. Полярные координаты В предыдущих разделах, говоря о координатах точек, мы имели в виду аффинные координаты. Однако, для перевода геометрических фактов на язык чисел применяют и другие системы координат, называемые криволинейными. Мы рассмотрим здесь наиболее употребительную криволинейную систему координат на плоскости, а именно полярные координаты. M
r
r ϕ О
M
y
ϕ
α
O x
Рис.1.Полярные координаты.
Рис.2.Связь декартовых и полярных координат.
Итак, выберем на плоскости точку O, и назовём её полюсом. Затем выберем луч α, исходящий из полюса, и назовём его полярным лучом (рис.1). Пусть теперь М – произвольная точка плоскости. Сопоставим ей два числа: полярный →
радиус r, который определяется как длина радиус-вектора OM , и полярный →
угол ϕ, определяемый как угол между полярным лучом и радиус-вектором OM 149
(отсчитываемый против часовой стрелки). Эти два числа r, ϕ называются полярными координатами точки М. В отличие от аффинных координат, соответствие M → ( r,ϕ ) не является взаимно однозначным соответствием между точками плоскости и всевозможными упорядоченными парами чисел. Во-первых, всегда r ≥ 0 , так что пара ( r,ϕ ) с r < 0 не может представлять полярные координаты какой-либо точки. Во-вторых, каждой точке M, отличной от полюса O, соответствует не одно, а множество значений полярного угла ϕ. Это множество можно записать в виде ϕ = ϕ 0 + 2π k ( k ∈ ) , где ϕ 0 - одно из значений полярного угла ϕ. Для самого же полюса О полярный угол вовсе не определён, или, выражаясь по другому, любое число можно считать его полярным углом. Часто употребляют систему полярных координат, связанную с декартовыми координатами x, y, как показано на рис. 2: положительный луч оси Ox берётся в качестве полярного луча. Тогда декартовы и полярные координаты одной и той же точки оказываются связанными соотношениями (1) x = r cos ϕ , y = r sin ϕ , позволяющими легко находить декартовы координаты по полярным. Если же надо найти r, ϕ по x, y, то следует поочередно воспользоваться очевидными формулами y x r = x 2 + y 2 , cos ϕ = , sin ϕ = . (2) r r ПРИМЕР 1. На плоскости с декартовыми координатами x, y написать в полярных координатах уравнение окружности радиуса a с центром в начале координат. Решение. Совершенно очевидно, что искомое уравнение имеет вид r = a . Это намного проще, чем уравнение той же окружности в декартовых координатах: x 2 + y 2 = a 2 . ПРИМЕР 2. Линия, имеющая в полярных координатах уравнение r = aϕ , называется спиралью Архимеда (рис. 3). С ростом ϕ она “разворачивается”, и r стремится к бесконечности.
150
ПРИМЕР 3. Линия с уравнением r = ae− kϕ − это логарифмическая спираль (рис. 4). С ростом ϕ она “сворачивается”, и r стремится к нулю. ПРИМЕР 4. Построить линию с уравнением r = 5cos 6ϕ . Решение. Поскольку r не может быть отрицательным, ϕ может принимать только такие значения, при которых cos 6ϕ ≥ 0 , а значит
π πk π πk + ≤ϕ ≤ + , k∈ . 12 3 12 3 В каждом k-ом из этих угловых интервалов r возрастает от нуля до максимального значения 5, затем убывает до нуля, так что образуется “лепесток”, симметπk . В результате получается шестилепестричный относительно луча ϕ = 3 ковая роза, изображённая на рис. 5. −
r
r
ϕ
ϕ
Рис.3.Спираль Архимеда
5
Рис.4.Логарифмическая спираль
Рис.5.Шестилепестковая роза.
Теоретические вопросы к главе 4. 1. Что такое вектор-отрезок и что такое геометрический вектор? 2. Дать определение сложения геометрических векторов и умножения геометрического вектора на число. Перечислить основные восемь свойств этих операций. 3. Что такое линейная комбинация геометрических векторов? Дать определение линейно зависимой и линейно независимой системы векторов. Привести примеры.
151
4. Дать определение базиса множества геометрических векторов и координат вектора в данном базисе. В чём смысл введения этих понятий? 5. Сформулировать аксиоматическое определение векторного пространства. 6. Сформулировать и доказать теорему о необходимом и достаточном условии линейной независимости системы векторов. 7. Что такое размерность векторного пространства? Что такое его базис? Сформулировать теорему о необходимом и достаточном условии того, что данная система векторов некоторого пространства составляет его базис. 8. Привести десять примеров векторных пространств (геометрические векторы, наборы чисел, матрицы, функции). 9. Что такое изоморфизм векторных пространств и в чём смысл этого понятия? 10. Что такое система линейных алгебраических уравнений? Дать определение матрицы системы, расширенной матрицы системы, однородной системы. Как выглядит индексная запись системы? В чём заключается задача исследования системы? 11. Описать алгоритм метода Гаусса исследования СЛАУ. Как отвечает этот метод на вопросы, составляющие исследования системы? 12. Что такое аффинная система координат в пространстве точек евклидовой геометрии? на плоскости? на прямой? Какова цель введения аффинных координат? 13. Как выглядит параметрическое представление прямой в пространстве в векторной и скалярной формах? 14. Что такое канонические уравнения прямой в пространстве? Как перейти от канонических уравнений к параметрическому представлению и наоборот? 15. Как судить о взаимном расположении двух прямых в пространстве по их параметрическим или каноническим уравнениям? 16. Что такое общее уравнение прямой на плоскости и уравнение прямой с угловым коэффициентом?
152
17. Написать параметрическое представление плоскости в пространстве в векторной и скалярной формах. Получить из параметрического представления общее уравнение плоскости. 18. Как исследовать взаимное расположение двух плоскостей по их общим уравнениям? Что представляет собой система общих уравнений прямой в пространстве? 19. Описать систему полярных координат на плоскости. Как вводятся полярные координаты, связанные с данной системой декартовых координат?
153
Глава 5. Измерения в векторном пространстве. Определители 5.1. Скалярное умножение геометрических векторов Как известно, длина отрезка прямой определяется в геометрии путём сравнения его с эталоном длины – единичным отрезком. Длиной геометрического вектора называют длину любого представляющего этот вектор вектора-отрезка. Длину вектора x будем обозначать символом x (и называть также модулем x ). Углом между отрезками AB и AC, исходящими из одной точки, называют поворот в плоскости ABC вокруг точки A, в результате которого луч AB переходит в луч AC. Ясно, что этот угол определён неоднозначно: можно поворачивать плоскость от первого отрезка до второго в двух противоположных направлениях (против и по часовой стрелке), да еще и добавлять произвольное число полных оборотов. Угол между двумя геометрическими векторами x и y определяется как угол между представляющими их векторами-отрезками, отложен-
( )
ными из одной точки. Этот угол мы будем обозначать символом x , y . Рассмотрим физическую задачу. Пусть материальная точка перемещается в пространстве прямолинейно на вектор l . Во время перемещения на точку действует постоянная сила, которую можно представить вектором f (направление этого вектора есть направление силы, а длина – количество единиц измерения силы). Как найти работу, совершаемую силой над движущейся точкой?
( )
Физика говорит, что эта работа выражается числом l ⋅ f ⋅ cos l , f . Видно, что работа зависит и от длин обоих векторов (чем больше сила и чем длиннее путь, тем больше работа), и от угла между этими векторами (сила может “помогать” перемещению или “мешать” ему). Такая мера “взаимодействия” двух векторов, объединяющая в одно число и длины векторов и угол между ними, оказывается очень удобной, как будет видно из дальнейшего, не только для вычисления работы, но и вообще в теории векторов. Поэтому вводится специальная операция над векторами – скалярное умножение. 154
Скалярным произведением геометрических векторов x и y называется число, обозначаемое ( x , y ) , или x ⋅ y , или x y и определяемое формулой
( x, y ) =
( )
x ⋅ y ⋅ cos x , y
(1)
Отметим сразу, что, умея вычислять скалярные произведения векторов, мы фактически умеем вычислять и длины векторов и углы между ними (последние – по абсолютной величине), ибо из (1) при y = x получается равенство
( x, x ) =
2
x , а затем и соотношения
x =
( x, x ),
( )
cos x , y =
( x, y ) . x x y y , , ⋅ ( ) ( )
(2)
Имеют место следующие основные свойства скалярного произведения: 1. Для любого вектора x :
( x , x ) ≥ 0 ; причём ( x , x ) = 0 только при
x=0
(положительная определённость скалярного произведения). 2. Для любой пары векторов x и y : ( x , y ) = ( y, x ) (коммутативность скалярного умножения). 3. Для любых трёх векторов x , y, z и любых двух чисел α , β :
(α x + β y, z ) = α ( x , z ) + β ( y, z ) ; ( x ,α y + β z ) = α ( x , y ) + β ( x , z ) (линейность скалярного умножения по первому и по второму множителю). Доказательство. Первые два свойства непосредственно очевидны из определения. Для обоснования третьего заметим сначала, что при z = 0 оно также очевидно. Если же z ≠ 0 , то введём в V3 декартов базис i , j , k так, чтобы единичный вектор k был направлен так же, как и вектор z (рис. 1). Разлагая любой вектор l ∈V3 по такому базису, получим l = l1i + l2 j + l3k . С другой стороны, по определению скалярного произведения,
(l , z ) = l
z cos α = z l3 .
Следовательно
(α x + β y, z ) = z (α x + β y )3 =
( )
z (α x3 + β y3 ) =
( )
= α ( z x3 ) + β ( z y3 ) = α l , x + β l , y . 155
z
l k
y
i
x Рис. 1.
j
К доказательству свойства 3.
Таким образом мы доказали первое равенство третьего свойства. Второе равенство получается из первого использованием коммутативности скалярного умножения. Свойства коммутативности и линейности позволяют обычным способом раскрывать скобки при скалярном умножении линейных комбинаций и приводить подобные члены. Отметим также, что для любой пары векторов x , y имеет место очевидное из (1) неравенство
( x, y ) ≤
x⋅y,
(3)
называемое неравенством Коши − Буняковского. Векторы x , y называются ортогональными, если их скалярное произведение равно нулю. Из определения (1) ясно, что ортогональность векторов означает следующее: либо хоть один из них нулевой, либо они перпендикулярны друг другу. Вектор x называется единичным, или нормированным, или ортом, если его длина равна единице. Другими словами, если x = 1 , или ( x , x ) = 1 . ПРИМЕР 1. Известно, что a = 3, (а) a 2 = a ⋅ a;
(
(б) 3a − 2b
)( a + 2b ) . 156
( )
b = 4, cos a , b =
2π . Вычислить 3
Решение. (а) a ⋅ a = a ⋅ a = a
(
(б) 3a − 2b
2 = 32 = 9 .
)( a + 2b ) = 3a ⋅ a − 2b ⋅ a + 3a ⋅ 2b − 2b ⋅ 2b =
= 3 a 2 − 2 a ⋅ b + 6a ⋅ b − 4 b
2
( )
= 6 ⋅ 32 + 4 a b cos a , b − 4 ⋅ 42 =
= −10 + 4 ⋅ 3 ⋅ 7 ⋅ ( −1/ 2 ) = −52. Поставим вопрос: как вычислить скалярное произведение векторов x и y , заданных своим координатами в некотором базисе e1, e2 , e3 ? С помощью основных свойств скалярного произведения этот вопрос решается следующим образом. Пусть y = y1e1 + y2e2 + y3e3 . x = x1e1 + x2e2 + x3e3 , Перемножим правые части этих равенств, раскрывая скобки с помощью свойства линейности, соберём подобные члены при каждом произведении базисных векторов, воспользовавшись в случае необходимости свойством коммутативности, и получим:
x ⋅ y = x1 y1e1 ⋅ e1 + ( x1 y2 + x2 y1 ) e1 ⋅ e2 + ( x1 y3 + x3 y1 ) e1 ⋅ e3 +
(4) + x2 y2e2 ⋅ e2 + ( x2 y3 + x3 y2 ) e2 ⋅ e3 + x3 y3e3 ⋅ e3. Становится ясно, что для вычисления требуемого скалярного произведения недостаточно одних координат перемножаемых векторов. Надо знать ещё и скалярные произведения всех пар базисных векторов. Однако в важном частном случае декартова базиса эта трудность исчезает. При этом произведение базисного вектора самого на себя равно единице, а произведения различных базисных векторов равны нулю. Формула (4) принимает весьма простой вид
x ⋅ y = x1 y1 + x2 y2 + x3 y3
(5)
Полагая в этой формуле y равным последовательно каждому из векторов декартова базиса, получим следующие выражения координат вектора как его скалярные произведения на базисные векторы: (6) x1 = x ⋅ e1, x2 = x ⋅ e2 , x3 = x ⋅ e3 . Из формулы (5) немедленно вытекает выражение длины вектора через его координаты в декартовом базисе:
x = x12 + x22 + x32 .
(7) 157
Отсюда, в свою очередь, следует удобная формула для вычисления расстояния между двумя точками пространства E. В самом деле, пусть в E введена декартова система координат Ox1x2 x3 , и пусть имеются две точки из E:
M ( x1, x2 , x3 ) и M ′ ( x1′ , x2′ , x3′ ) .
→
Поскольку расстоянием между этими точками является длина вектора MM ′ , это расстояние таково:
→ MM ′ =
(
x1′ − x1
) ( 2
+ x2′ − x2
) ( 2
+ x3′ − x3
)
2
.
(8)
Приведённые выше рассуждения можно проводить для векторов и точек не пространства, а плоскости. Просто координат будет на одну меньше. Вместо формул (5), (7), (8) будем иметь соответственно:
x ⋅ y = x1 y1 + x2 y2 ,
→
MM ′ =
x = x12 + x22 ,
(
x1′ − x1
) ( 2
+ x2′ − x2
)
2
(9)
Наконец, то же самое можно сделать и для векторов и точек прямой, имеющих всего одну координату (которой мы не будем присваивать подстрочного индекса). Вместо (9) получим:
x = x,
x ⋅ y = xy,
→
| MM ′ | =| x′ − x | .
(10)
Располагая понятием скалярного умножения, мы можем заметно продвинуться в аналитическом описании прямых и плоскостей. Выведем, например, общее уравнение плоскости, не пользуясь, как в разделе 4.6, параметрическим представлением этой плоскости. Имея плоскость Π , построим ортогональный ей вектор n ≠ 0 , исходящий из начала отсчёта (рис. 2) и направленный в сторону плоскости.
n Mo 90°
M
M1
Π
О
Π
r
Рис. 2.К выводу общего уравнения плоскости.
∆ Рис.3. К задаче о расстоянии от точки до плоскости. 158
Очевидно, что для всех точек M плоскости, и только для них, верно соотношение r ⋅n = D, (11) где
r = OM , D = const для данной плоскости.
Уравнение (11) и есть общее уравнение плоскости, записанное в векторной форме. Если теперь ввести декартовы координаты x, y, z точки M
и A, B, C −
вектора n , то можно переписать (11) в скалярной форме Ax + By + Cz = D . (12) Это хорошо знакомое нам общее уравнение плоскости в скалярной форме ((3) из 4.6), которое было получено в произвольной аффинной системе координат. Однако, теперь мы знаем, что, в случае декартовых координат, коэффициенты A, B, C этого уравнения являются координатами некоторого вектора, перпендикулярного плоскости Π и направленного от начала координат в сторону этой плоскости. Заметим, что если плоскость Π проходит через начало координат, направление “от начала координат к плоскости ” не определено. Поэтому вектор n может иметь любое из двух перпендикулярных плоскости направлений. Используем новую информацию для решения некоторых задач. ПРИМЕР 2. Написать в декартовых координатах общее уравнение плоскости, проходящей через точку М (1, 0, −2) и перпендикулярной вектору {−2, −2, −1}. Решение. Координаты данного вектора можно взять в качестве коэффициентов A, B, C искомого уравнения, которое, следовательно, имеет вид −2 x − 2 y − z = C . Константу С находим из условия принадлежности точки искомой плоскости, которое приводит к равенству −2 ⋅ 1 − 2 ⋅ 0 − 1 ⋅ ( −2 ) = C или C = 0 . Окончательно: плоскость имеет уравнение 2 x + 2 y + z = 0 . ПРИМЕР 3. Найти угол между плоскостями x + 2 y − 2 z = 7 и x + y = 35 . Решение. Ясно, что угол α между данными плоскостями равен углу между векторами {1, 2, −2} и {1,1,0}, которые, соответственно, перпендикулярны этим плоскостям. Поэтому
159
cos α =
1 ⋅ 1 + 2 ⋅ 1 + ( −2 ) ⋅ 0 1 + 2 + ( −2 ) ⋅ 1 + 1 + 0 2
2
2
2
2
2
=
2 , 2
а значит α = π 4 .
ПРИМЕР 4. Даны плоскость Π с уравнением (12) и точка M 0 ( x0 , y0 , z0 ) . Найти расстояние от точки до плоскости. Решение. Построим прямую ∆ , проходящую через точку M 0 и ортогональную плоскости (рис. 3). Очевидно, её параметрическое представление есть (13) r = r0 + t n , где r0 - радиус-вектор точки M 0 . Найдём точку пересечения M1 прямой ∆ и плоскости Π . Для этого надо подставить (13) в (11), что даёт последовательно: D − r0 ⋅ n r0 + nt ⋅ n = D, t = , а затем 2 n
(
)
r1 = r0 + n
D − r0 ⋅ n , 2 n
r1 − r0 = n
D − r0 ⋅ n . 2 n
(14)
Теперь искомое расстояние d выглядит так:
r ⋅n − D . d = r0 − r1 = 0 n
(15)
В декартовых координатах получаем:
d=
Ax0 + By0 + Cz0 − D . 2 2 2 A + B +C
(16)
Из формулы (14) следует, что, если число r0 ⋅ n − D = Ax0 + By0 + Cz0 − D положительно, то точка M 0 расположена с той же стороны от плоскости, в которую направлен вектор { A, B, C }, если оно отрицательно, то – с противоположной. Если это число равно нулю, то M 0 лежит на плоскости. ПРИМЕР 5. На плоскости даны прямая ∆ с уравнением Ax + By = C и точка M 0 ( x0 , y0 ) . Найти расстояние от точки до плоскости. В векторной форме эта задача решается точно так же, как предыдущая. Вся разница состоит в том, что в скалярных формулах присутствуют не три, а две координаты. Поэтому результаты выглядят так: 160
Искомое расстояние равно (по аналогии с (16)) Ax0 + By0 − C . (17) d= 2 2 A +B Если число r0 ⋅ n − D = Ax0 + By0 − C положительно, то точка M 0 расположена с той же стороны от прямой, в которую направлен вектор {А, В}; если оно отрицательно, то – с противоположной. Если это число равно нулю, то M 0 лежит на прямой. Картинки, аналогичные рис. 2,3 упрощаются и принимают, соответственно, вид (рис.4):
n 90°
M
Mo ∆ M1
r Рис. 4.
∆
К примеру 5.
5.2. Ориентация в пространстве. Векторное умножение геометрических векторов. Смешанное умножение Если вы можете передвигаться только по фиксированной прямой в пространстве, например по автодороге без ответвлений, то свобода вашего передвижения сводится только к выбору одного из двух противоположных направлений. Их надо различать, например назвав одно из направлений положительным, другое – отрицательным. Положительное направление можно зафиксировать, задав, например, какой-либо ненулевой вектор e прямой, имеющий именно это направление и известный в любой точке прямой. Тогда любого, кто хочет куда-то попасть, двигаясь по прямой, можно сориентировать – куда ему двигаться – по вектору или против. Отсюда определение: говорят, что всякий базис e одномерного пространства геометрических векторов V1 задаёт ориентацию в этом пространстве. Любой вектор x ≠ 0 из V1 называется при этом положительно ориентированным, если он направлен в ту же сторону, что и e , и отрицательно ориентированным в противоположном случае.
161
Если вы можете передвигаться только по фиксированной плоскости в пространстве, то выбор какого-либо направления движения из всех возможных в данной точке, т.е. какого либо ненулевого вектора e1 , лежащего в данной плоскости, недостаточен для реализации вашей свободы передвижения: ориентируясь только по нему, вы будете вынуждены двигаться только по прямой. Чтобы отклониться от неё, надо выбрать − в какую сторону от направления вектора e1 , т.е. выбрать положительную сторону отклонения. Для этого достаточно добавить к e1 какой-либо не коллинеарный ему вектор вашей плоскости e2 . Отсюда определение: говорят, что всякий базис e1, e2 двумерного пространства геометрических векторов задаёт ориентацию в этом пространстве. Любая упорядоченная пара ( x1, x2 ) неколлинеарных векторов из V2 называется при этом положительно ориентированной, если кратчайший поворот от x1 к x2 в плоскости происходит в том же направлении, что и кратчайший поворот от e1 к e2 , и отрицательно ориентированной − в противном случае. Иногда ориентацию на плоскости задают выбором положительного направления вращения плоскости в себе – с помощью терминов “против (или по) часовой стрелки”. Но с этим способом надо обращаться осторожно: в зависимости от того, с какой стороны мы смотрим на плоскость, один и тот же её поворот будет происходить как против часовой стрелки, так и по её движению. Поэтому указанный способ можно применять только в случае, когда известно, с какой стороны смотрят на плоскость. При этом базис e1, e2 обычно называют правым, если кратчайший поворот от e1 к e2 происходит против часовой стрелки, и левым – в противном случае. Если вы можете свободно перемещаться в пространстве, то двух векторов уже недостаточно, поскольку, корме понятий “вперёд-назад”, “направо-налево” появляются понятия “вверх-вниз”. Отсюда определение: говорят, что всякий базис e1, e2 , e3 трёхмерного пространства геометрических векторов V3 задаёт ориентацию в этом пространстве. Этот базис называют правым, если кратчайший поворот от e1 к e2 в плоскости этих двух векторов, рассматриваемый со стороны вектора 162
e3 , происходит против часовой стрелки (как на рис.1), и левым − в противном случае. Любая упорядоченная тройка x1, x2 , x3 некомпланарных векторов из V3 называется при этом положительно ориентированной, если она и базис e1, e2 , e3 одновременно правые или одновременно левые. В противном случае эта тройка отрицательно ориентирована. Мы можем сказать, что задание базиса в пространстве геометрических векторов не только позволяет переходить от векторов к их координатам, но и фиксирует ориентацию в пространстве. Ближайшее использование понятия ориентации в нашем курсе связано с операцией векторного умножения геометрических векторов. Важность этой операции, в частности, обуславливается её физическими применениями. Например: нахождение момента силы относительно точки; силы, действующей на заряд, движущийся в магнитном поле; скорости точки твёрдого тела с заданной угловой скоростью вращения – сводятся к вычислению векторных произведений. Итак, пусть в пространстве V3 геометрических векторов задан базис e1, e2 , e3 . Векторным произведением двух векторов x , y ∈ V3 называется вектор, обозначаемый x × y или ми:
[ x, y ]
и определяемый следующими условия-
( )
(а). x × y = x ⋅ y ⋅ sin x , y , т.е. длина вектора x × y определяется тем же числом, что и площадь параллелограмма, построенного на векторах x и y . (б). Вектор x × y ортогонален каждому из векторов x и y . (в). Тройка векторов x , y, x × y положительно ориентирована по отношению к базису e1, e2 , e3 (рис. 1).
x×y
e3
90°
e2
90°
x
e1 Рис. 1.
y y
x
К определению векторного произведения. 163
Обратим внимание на то, что векторное произведение можно определить только при задании ориентации в пространстве. При смене ориентации на противоположную, направление векторного произведения двух фиксированных векторов также меняется на противоположное. Отметим основные свойства векторного умножения. 1. x × x = 0 . 2. y × x = − x × y (антикоммутативность векторного умножения). 3. (α x + β y ) × z = α ( x × z ) + β ( y × z ) , где α и β − числа (линейность векторного умножения по первому множителю).
( )
Свойство 1 вытекает из того, что sin x , x = 0 . Свойство 2 – следствие пункта (б) определения векторного произведения. Свойство 3 примем без доказательства ввиду громоздкости последнего. Заметим сразу, что из 3 и 2 вытекает линейность векторного произведения и по второму множителю: z × (α x + β y ) = α ( z × x ) + β ( z × x ) . ПРИМЕР 1.
Вычислить площадь параллелограмма, построенного на
векторах a = 3 p + 2q , b = 2 p − q , если p = 4, q = 3,
( p, q ) = 3π / 4.
Решение. Из определения векторного произведения следует, что искомая площадь есть a × b . С помощью свойств 1−3 имеем:
a × b = ( 3 p + 2q ) × ( 2 p − q ) = 6 ( p × p ) + 2 ( q × p ) − 3( p × q ) − 2 ( q × q ) = = −5 ( p × q )
( )
Тогда a × b = 5 p × q = 5 p ⋅ q ⋅ sin p, q = 5 ⋅ 4 ⋅ 3sin
3π 2 = 60 = 30 2. 4 2
Значит искомая площадь равна 30 2 . Предположим теперь, что два вектора заданы своими координатами в базисе e1, e2 , e3 :
x = x1e1 + x2e2 + x3e3 ,
y = y1e1 + y2e2 + y3e3.
Как вычислить координаты вектора x × y ?
164
Ответ на этот вопрос получается с помощью определения и основных свойств 1−3 векторного произведения. А именно, раскрывая скобки, получаем:
x × y = ( x1e1 + x2e2 + x3e3 ) × ( y1e1 + y2e2 + y3e3 ) =
= x1 y1 ( e1 × e1 ) + x1 y2 ( e1 × e2 ) + x1 y3 ( e1 × e3 ) +
+ x2 y1 ( e2 × e1 ) + x2 y2 ( e2 × e2 ) + x2 y3 ( e2 × e3 ) + + x3 y1 ( e3 × e1 ) + x3 y2 ( e3 × e2 ) + x3 y3 ( e3 × e3 ) . Затем используем соотношения ei × ei = 0,
для любого i;
при i ≠ j , ei × e j = − e j × ei , и приведём подобные члены. Получим тогда
x × y = ( x1 y2 − x2 y1 )( e1 × e2 ) + ( x2 y3 − x3 y2 )( e2 × e3 ) + + ( x3 y1 − x1 y3 )( e3 × e1 ) .
(1)
Дальнейшее продвижение возможно только тогда, когда известны все парные векторные произведения базисных векторов друг на друга. Именно такая ситуация имеет место в важном частном случае, когда базис e1, e2 , e3 декартов и правый. При этом, как легко сообразить, справедливы равенства
e1 × e2 = e3 , e2 × e3 = e1, e3 × e1 = e2 . В результате формула (1) принимает значительно более простой вид: x × y = ( x2 y3 − x3 y2 ) e1 + ( x3 y1 − x1 y3 ) e2 + ( x1 y2 − x2 y1 ) e3
(2)
Эту формулу удобно переписать, используя понятие определителя:
e1 x × y = x1 y1
e2 x2 y2
e3 x3 y3
ПРИМЕР 2. Найти координаты вектора x в декартовом правом базисе, если он перпендикулярен векторам a {2, − 3, 1} и b {1, − 2, 3} , а также удовле-
(
)
творяет условию x ⋅ e1 + 2e2 − 7e3 = 10 .
165
Решение. Ясно, что искомый вектор коллинеарен векторному произведению a × b , которое имеет, в силу формулы (2), координаты {−7, −5, −1}. Следовательно, x {−7c, − 5c, − c} ,
где
с – число,
которое легко определить,
подставляя x в последнее условие задачи. Это даёт:
−c ( 7e1 + 5e2 + e3 )( e1 + 2e2 − 7e3 ) = 10 ,
−c 7 ⋅1 + 5 ⋅ 2 + 1 ⋅ ( −7 ) = 10 ,
или
откуда c = −1 и x {7, 5, 1} .
Введём ещё один вид умножения векторов. На этот раз пусть даны три вектора x , y , z ∈V3 . Число ( x × y ) ⋅ z называется смешанным произведением этих векторов и обозначается обычно символом
( x , y, z ) .
Приведём основные свойства смешанного умножения. 1. Модуль смешанного произведения ( x , y , z ) равен объёму параллелепипеда, построенного на векторах x , y, z , отложенных от общего начала. Число
( x , y, z )
положительно или отрицательно в зависимости от того, поло-
жительно или отрицательно ориентирована тройка векторов x , y, z . 2. Векторы x , y, z линейно зависимы (компланарны) тогда и только тогда, когда ( x , y, z ) = 0 . 3. В ортонормированном правом базисе смешанное произведение векто-
(
)
(
)
(
)
ров x = x1, x2 , x3 , y = y1, y2 , y3 , z = z1, z2 , z3 имеет вид: ( x , y, z ) = x1 y2 z3 + x2 y3 z1 + x3 y1z2 − x3 y2 z1 − x1 y3 z2 − x2 y1z3 . 4. Смешанное умножение линейно по каждому множителю. Например, (α x + β y, z , u ) = α ( x , z , u ) + β ( y, z , u ) . 5. При перестановке двух множителей смешанное произведение меняет знак на противоположный: ( x , y, z ) = − ( y, x , z ) = ( y, z , x ) = − ( x , z , y ) . Все перечисленные свойства легко выводятся из определения смешанного умножения. Мы оставляем их выводы читателю в качестве упражнений.
166
5.3. Определители Пусть в одномерном пространстве геометрических векторов V1 задана ориентация. Определителем, или ориентированной длиной вектора x ∈ V1 называется число, равное его длине или противоположное ей по знаку, соответственно тому, положительна или отрицательна ориентация x . Если ориентация задана базисом e таким, что e = 1, то x = xe , и определитель вектора x – это его координата x в базисе e . Пусть в двумерном пространстве V2 задана ориентация. Определителем, или ориентированной площадью системы двух векторов x , y из V2 называется площадь параллелограмма, построенного на векторах x , y или число, противоположное этой площади по знаку, соответственно тому, положительна или отрицательна ориентация пары векторов x , y . Предположим, что ориентация V2 задана ортонормированным базисом
e1, e2 . Разложим векторы x , y по этому базису: x = x1e1 + x2e2 , y = y1e1 + y2e2 . Введём вектор e3 единичной длины, ортогональный векторам e1, e2 и образующий вместе с ними правую тройку e1, e2 , e3 . Вычисляя векторное произведение x × y в базисе e1, e2 , e3 , видим, что определитель системы x , y – это число x1 y2 − x2 y1 . Пусть в трёхмерном пространстве V3 задана ориентация. Определителем, или ориентированным объёмом системы векторов x , y , z из V3 называется объём параллелепипеда, построенного на векторах x , y , z , или число, противоположное по знаку этому объёму, соответственно тому, положительна или отрицательна ориентация тройки векторов x , y , z . Пусть ориентация в V3 задана ортонормированным базисом e1, e2 , e3 . Разложим x , y, z по этому базису:
167
x = x1e1 + x2e2 + x3e3 , y = y1e1 + y2e2 + y3e3 , z = z1e1 + z2e2 + z3e3. Определитель системы x ,
y, z совпадает, очевидно, со смешанным произведением этих векторов, т.е. с числом x1 y2 z3 + x2 y3 z1 + x3 y1z2 − x3 y2 z1 − x1 y3 z2 − x2 y1z3 . При наличии базиса задание системы векторов означает задание координат этих векторов. В случае V1 вектор x задаётся своей единственной коорди-
натой х или квадратной матрицей (х) вида 1 × 1 . В случае V2 система векторов
x,
y задана наборами координат ( x1, x2 ) , ( y1, y2 ) или матрицей вида 2 × 2 : x1 x2 y y . 1 2 В случае V3 система векторов x , y , z задаётся наборами координат
( x1, x2 , x3 ) , ( y1, y2 , y3 ) , ( z1, z2 , z3 ) или квадратной матрицей вида 3 × 3 :
x1 x2 x3 y1 y2 y3 . z z 1 2 z3 Поэтому, если ортонормированный базис в V1 , или в V2 , или в V3 задан, то можно сказать, что определитель – это число, которое ставится в соответствие не системе векторов, а квадратной матрице. Если обозначить матрицу буквой А, то соответствующий ей определитель обозначается обычно det A , от слова determinant (лат.) – определитель, определяющий. Часто определитель обозначают по-другому: выписывают таблицу чисел, образующую матрицу А, обрамляя её прямыми линиями. Правда, в случае n =1 это обозначение не применяется, чтобы не спутать с обозначением модуля числа. Итак, (1) det ( a ) = a a a det 11 12 = a21 a22
a11 a12 = a11a22 − a12 a21 a21 a22
168
(2)
a11 a12 a13 a11 a12 a13 det a21 a22 a23 = a21 a22 a23 = a 31 a32 a33 a31 a32 a33 = a11a22 a33 + a12 a23a31 + a13a21a32 −
(3)
− a13a22 a31 − a12 a21a33 − a11a23a32 . Эти формулы служат определениями определителей матриц 1-го, 2-го и 3-го порядка соответственно. В них понятие вектора не фигурирует. Тем не менее, мы можем, при необходимости, трактовать строки матрицы, как координаты векторов в некотором ортонормированном базисе. Тогда определитель даёт ориентированный объём соответсвующей системы векторов. Чтобы запомнить формулы (2), (3) вычисления определителей, удобно пользоваться следующими мнемоническими правилами: надо брать произведения элементов матрицы, соединённых сплошными линиями на приводимых диаграммах, со знаком «+», а произведения элементов, соединённых пунктиром, со знаком «–». Сумма произведений и даст значение определителя:
a11
a12
a21 a22 (
,
= +,
a11 a12 a21 a22 a31 a32
a13 a23 , a33
a11 a12 a21 a22 a31 a32
a13 a23 a33
= −)
Последнее правило называется правилом Саррюса. Понятие определителя матрицы, как мы увидим далее, оказывается очень удобным для решения многих задач. Поэтому хотелось бы обобщить его для случая квадратной матрицы произвольного порядка n > 3. Но мы не располагаем понятием объёма в четырёхмерном, пятимерном и т.д. пространствах. Поэтому избираем иной путь. Заметим, что формулы (1) – (3) позволяют написать:
a11 a12 = a11 det ( a22 ) − a12 det ( a21 ) , a21 a22
169
(4)
a11 a12 a21 a22 a31 a32
a13 a23 = a33
a = a11 22 a32
(5)
a23 a a a a − a12 21 23 + a13 21 22 a33 a31 a33 a31 a32
Мы видим, что определитель порядка 2 или 3 выражается через элементы своей первой строки и через определители на порядок меньше. Эти выражения можно положить в основу рекуррентного определения определителя произвольного порядка n. Пусть дана квадратная n × n -матрица a11 a12 ... a1n a a ... a 21 22 2 n , (6) A= .. .. ... .. an1 an2 ... ann и пусть понятие определителя матрицы ( n − 1) × ( n − 1) известно. Определителем матрицы А называется число
a11 a12 a a det A = 21 22 ... ... an1 an 2 = a11
a22 a32 ... an 2
... a1n ... a2n = ... ... ... ann a23 ... a2n a33 ... a3n − a12 ... ... ... an 3 ... ann
a21 a23 ... a2n a31 a33 ... a3n + ... ... ... ... ... an1 an 3 ... ann a21 a22 a31 a32 n −1 ... + ( −1) a1n .. ..
(7)
... a2,n −1 ... a3,n −1 ... ..
an1 an 2 ... an ,n −1
Формула (7) даёт определение определителя любого порядка n с помощью разложения определителя по первой строке. Рассмотрим основные свойства определителей. 170
Теорема 1. Определитель единичной матрицы равен единице: 1 0 ... 0
0 1 ... 0 = 1. .. .. ... .. 0 0 ... 1
(8)
Доказательство основано на последовательном применении формулы (7). Теорема 2. Если поменять местами две строки определителя, он изменит знак на противоположный. Доказательство для n = 2 и n = 3 следует из формул (4), (5). Переход от n = 3 к n = 4 и так далее получается опять-таки с помощью (7). Следствие. Определитель, две строки которого совпадают, равен нулю. В самом деле, обозначив такой определитель через D, сравним его с определителем (– D), полученным перестановкой указанных в теореме строк. Это даст D = − D , откуда D = 0 . Теорема 3. Пусть некоторая i-ая строка определителя D порядка n имеет вид: α ai1 + β bi1, α ai 2 + β bi 2 , ..., α ain + β bin , где α , β – числа. Тогда определитель D имеет вид: D = α D1 + β D2 , где D1, D2 – определители, у которых
i-ые
строки
равны
соответственно
ai1, ai 2 , ..., ain
и
bi1, bi 2 , ..., bin . Любая другая строка у всех трёх определителей D, D1, D2 одинакова. Указанное свойство называется линейностью определителя по i-ой строке. Например, линейность по первой строке записывается так:
α a11 + β b11 α a12 + β b12 a21 a22 .. .. an1 an 2 a11 a = α 21 .. an1
... α a1n + β b1n ... a2n = ... .. ann ... a12 ... a1n b11 b12 a22 ... a2n a a + β 21 22 .. ... .. .. .. an 2 ... ann an1 an 2 171
(9)
... b1n ... a2n ... .. ... ann
Доказательство. Формула (9) для первой строки сразу получается, если воспользоваться определением (7). Линейность по любой другой строке получается из линейности по первой строке с помощью предыдущей теоремы. Теорема 4. Если строки определителя линейно зависимы как векторы из то определитель равен нулю.
n,
Доказательство. Пусть, например, первая строка определителя матрицы (6) есть линейная комбинация остальных строк: n a11 a12 a1n = ∑ αi ai1 ai 2 ain . i=2 Пользуясь свойством линейности по первой строке, представим наш определитель в виде ai1 ai 2 ain n a a a2n . det A = ∑ αi 21 22 i=2 an1 an2 ann Каждый определитель в правой части содержит, очевидно, две одинаковых строки, и, следовательно, равен нулю. Поэтому det A = 0 , что и требовалось доказать.
(
)
(
)
Следствие 1. Определитель матрицы, строка которой состоит из нулей, равен нулю. Следствие 2. При добавлении к некоторой строке матрицы линейной комбинации других её строк значение определителя не меняется. Обоснование следствий предоставляется читателю. Продолжим изучение свойств определителей. Пусть А – матрица размера m× n:
a11 a12 a a22 A = 21 .. .. am1 am 2
... a1n ... a2n . ... .. ... amn 172
(10)
Транспонировать матрицу А – значит перейти к матрице размера n × m :
a11 a T A = 12 .. a1n
a21 a22 .. a2n
... am1 ... am 2 , ... .. ... amn
(11)
строки которой являются столбцами матрицы А. Теорема 5. Определитель квадратной матрицы не меняется при её транспонировании, т.е. a11 a12 ... a1n a11 a21 ... an1 a a ... a2n a12 a22 ... an 2 (12) det A = 21 22 = = det AT .. .. ... .. .. .. ... ..
an1 an2 ... ann
a1n
a2n ... ann
Мы не будем приводить здесь доказательство этой теоремы ввиду его громоздкости. Однако, для случаев n = 1, 2, 3 формула легко проверяется с помощью (1) – (3). Следствие. Все свойства, сформулированные по поводу строк определителя, справедливы и для столбцов. Перечислим эти свойства: – Определитель матрицы А можно разложить по первому столбцу:
a11 a12 a21 a22 .. .. an1 an 2
... a1n ... a2 n = ... .. ... ann a22 a = a11 32 .. an 2
a23 a33 .. an3
... a2n a12 ... a3n a − a21 32 ... .. .. ... ann an 2
173
a13 a33 .. an3
... a1n ... a3n + ... .. ... ann
+ … + ( −1)n − 1 an1
a12 a22
a13 a23
..
..
an − 1, 2
... ...
a1, n a2, n
... .. an − 1,3 ... an − 1, n
(13)
– Если поменять местами два столбца матрицы, то её определитель изменит знак на противоположный. – Определитель матрицы с двумя одинаковыми столбцами равен нулю. – Определитель линеен по каждому своему столбцу. – Если столбцы матрицы линейно зависимы как векторы из литель равен нулю.
n
, то её опреде-
– Определитель матрицы, содержащей столбец нулей, равен нулю. – При добавлении к некоторому столбцу матрицы линейной комбинации других столбцов значение определителя не меняется. Рассмотрим произвольную матрицу А вида m × n . Выделим в ней k строк ( k ≤ m, k ≤ n ) и столько же столбцов. Элементы матрицы А, стоящие на пересечении этих строк и столбцов, образуют матрицу вида k × k . Её определитель называется минором k- го порядка матрицы А. В частности, каждый элемент aij матрицы – это один из её миноров первого порядка. Пусть А – квадратная матрица вида n × n . Зафиксируем один из её элементов aij. Минор Мij порядка n − 1 , соответствующий всем строкам матрицы, кроме i-ой и всем столбцам матрицы, кроме j-го, называется дополнительным по отношению к элементу aij. Число Aij = ( −1)i + j M ij
(14)
называется алгебраическим дополнением, или адъюнктом элемента aij матрицы А. Теорема 6. Рассмотрим матрицу А размера n × n с элементами aij, зафиксируем некоторую её i-ую строку. Определитель матрицы равен сумме произведений всех элементов этой строки на их алгебраические дополнения: 174
n det A = ∑ aij Aij , i = 1, 2,..., n j =1
(15)
Доказательство. Для i = 1 эта теорема уже известна (см. формулу (7)). Пусть теперь i >1. Поменяем местами i-ую строку с (i – 1)-ой, затем (i – 1)-ую с (i – 2)-ой и т.д., наконец вторую строку с первой. Вместо det A получим новый определитель, равный −1 i − 1 det A . Разложим его по формуле (7):
( )
ai1 a11
ai 2 a12
... ain a12 ... a1n ... ... ... ... ... a ( −1)i −1 det A = ai −1,1 ai −1,2 ... ai −1,n = ai1 i −1,2 ai +1,2 ai +1,1 ai +1,2 ... ai +1,n ... ... ... ... ... an 2 an1 an 2 ... ann
a13
... a1n ... ... ... ai −1,3 ... ai −1,n − ... ai +1,3 ... ai +1,n ... ... ... an 3 ... ann
a11 a12 ... ... ai −1,1 ai −1,2 n −1 ... + ( −1) ain ai +1,1 ai +1,2 ... ... an1 an 2
... a1,n −1 ... ... ... ai −1,n −1 = ... ai +1,n −1 ... ... ... an,n −1
= ai1M i1 − ai1M i 2 + ... + ( −1)n − 1 ain M in . Таким образом,
det A = ai1 ( −1)i + 1 M i1 + ai 2 ( −1)i + 2 M i 2 + ... + ain ( −1)i + n M in = n n = ∑ aij ( −1)i + j M ij = ∑ aij Aij j =1 j =1 Следствие. Аналогичная теорема имеет место и для столбцов: n (16) det A = ∑ aij Aij . i =1
175
Теорема 7. Сумма произведений элементов некоторой строки определителя на алгебраические дополнения соответствующих элементов другой строки равна нулю: n (17) ∑ aij Akj = 0, i ≠ k . j =1 (Доказать самостоятельно!) Обсудим теперь вопрос о практическом вычислении конкретных определителей. Если порядок определителя больше трёх, то у нас нет готовых формул типа (2) или (3). Естественная мысль – воспользоваться рекуррентным определением (7), последовательно понижая порядок подлежащих вычислению определителей. Однако использование только рекуррентного определения может привести к катастрофически сложным вычислительным трудностям, особенно для определителей высокого порядка. Действительно, пусть порядок определителя равен n. Выражая его по определению (7) через определители порядка n –1, получаем n слагаемых. Каждое из них содержит определитель порядка n –1, разложение которого даёт, в свою очередь, n –1 слагаемое. В результате выражение исходного определителя через определители порядка n –2 даёт n (n–1) слагаемых. Если продолжать подобную процедуру понижения порядка до определителей 1-го порядка, т.е. чисел, то получится сумма n! слагаемых. Каждое из них есть произведение n чисел. Итого, для вычисления исходного определителя потребуется порядка n!⋅n арифметических операций. Пусть, например, n = 20. Тогда компьютеру, выполняющему миллион операций в секунду, потребуется более полутора миллионов лет на вычисление определителя! С другой стороны, приложения теории определителей зачастую требуют вычисления определителей значительно большего порядка, чем 20. Поэтому, прежде, чем применять определение (7), или, что сводится к тому же, разлагать определитель по строке или столбцу, надо попытаться максимально упростить его. А именно, с помощью полученных выше свойств надо преобразовать определитель так, чтобы как можно большее число его элементов стали нулями. Тогда последующие разложения по строке или столбцу станут намного проще. Поясним сказанное примерами.
176
6 −5 8 4 9 7 5 2 . ПРИМЕР 1. Вычислить определитель ∆ = 7 5 3 7 −4 8 −8 −3 Вычтем из 1-го столбца 4-ый, затем в полученном определителе прибавим 4-ую строку к 1-ой: 2 −5 8 4 1 3 0 1
∆
1ый − 4ый
=
7 0 −1
ая ая 5 2 1 +4 7 7 5 2 = 0 5 3 7 . 3 7 −8 − 3 −1 8 −8 − 3
7 5 8
Теперь добавим к 4-ой строке 1-ую, затем из 1-ой строки вычтем семь 2-ых: 1 3 0 1 1 3 0 1
∆
4ая +1ая
=
ая ая 2 1 −7⋅ 2 0 −14 5 −5 = 0 5 3 7 . 0 5 3 7 0 11 −8 −2 0 11 −8 −2
7
7
5
Разложим полученный определитель по 1-му столбцу: −14 5 −5
∆ =1 ⋅ 5 11
3 7 −8 −2
Теперь уже можно вычислить определитель по правилу Саррюса. Но, пожалуй, проще добавить к 1-ой строке сумму 2-ой и 3-ей, а затем разложить полученный определитель по первой строке: 0 0 ая ая ая 2
∆
1 +2 +3
=
5 3 7 = 2 ( −6 + 56 ) = 100 . 11 −8 −2
1 2 3 ПРИМЕР 2. Вычислить определитель ∆ = 4 5 6
2 3 4 5 6 1
3 4 5 6 1 2
4 5 6 1 2 3
5 6 1 2 3 4
6 1 2 . 3 4 5
Вычтем из 6-ой строки 5-ую, из 5-ой строки – 4-ую и т.д., наконец из 2-ой 1-ую. Затем вычтем 6-ую строку из 1-ой, 2-ой,..., 5-ой: 177
∆
6ая − 5ая
=
1 1 1
2 1 1
3 1 1
4 1 1
1 1 1 −5 5 −4 ,… 1 1 −5 1 1 −5 1 1 ая
ая
5 6 1 −5 ая ая −5 1 1 − 6
0 0 0
1 1 1
0 6 0 −6 0 6 −6 0 1 −5 1 1
=
1 2ая − 6ая , … 1 1
7 6 6
2 0 0
3 0 0
5 6 0 −6 −6 0 0 0 1
0 0 1
Разложим теперь определитель ∆ по 1-му столбцу, затем вынесем общий множитель 6 из 2-ой, 3-ей, 4-ой и 5-ой строк, потом прибавим к 1-му столбцу остальные и, наконец, снова разложим ∆ по 1-му столбцу: 7 2 3 4 5 7 2 3 4 5
6 ∆ = ( −1) ⋅ 6 6
0 0 0
6 −6
0 0 −6 1 0 −6 0 = − 64 ⋅ 1 1 −6 0 0 0
0
0 0 0
1 −1
0
0 0 −1 0 −1 0 = −1 0 0 0
0
0
21 2 3 4 5 0 0 0 −1 0 0 0 0 −1 0 0 −1 0 . = − 64 ⋅ 0 0 0 −1 0 = − 64 ⋅ 21 ⋅ 0 −1 0 0 0 0 −1 0 0 −1 0 0 0 0 −1 0 0 0 Теперь всё просто. Последовательные разложения по 1-ой строке дают: 0 0 −1 0 −1 ∆ = −64 ⋅ 21 ⋅ 0 −1 0 = −64 ⋅ 21 ⋅ ( −1) ⋅ = 64 ⋅ 21 ⋅ ( −1) = −27216 . −1 0 −1 0 0
5.4. Приложения теории определителей к изучению матриц и систем линейных уравнений 5.4.1. Ранг матрицы Рассмотрим ( m, n ) -матрицу
a11 a12 a a22 A = 21 ... ... am1 am 2
... a1n ... a2n . ... ... ... amn 178
(1)
Если не все элементы этой матрицы равны нулю, то рангом этой матрицы называется максимальный порядок её отличных от нуля миноров. Например, если в матрице имеется минор 3-го порядка, отличный от нуля, а все миноры порядка 4 и выше равны нулю, то ранг матрицы равен 3. Если все элементы матрицы А – нули, то её ранг, по определению, равен нулю. Ранг матрицы А будем обозначать символом rang A. Любой, не равный нулю, минор порядка, совпадающего с рангом rang A матрицы А, называется базисным минором матрицы А. Строки (столбцы) матрицы А, в которых расположен базисный минор, называются базисными строками (столбцами) этой матрицы. Следующая теорема фактически даёт ещё одно, эквивалентное предыдущему, определение ранга матрицы. Теорема 1. Ранг ( m, n ) -матрицы (1) совпадает с максимальным числом её линейно независимых (как векторы из n ) строк. Аналогичное утверждение верно и для столбцов (как векторов из m ). Тем самым максимальное число линейно независимых строк и максимальное число линейно независимых столбцов матрицы совпадают. Мы примем эту теорему без доказательства. Как практически вычислить ранг конкретной матрицы? Рассмотрим, без доказательств, два наиболее употребительных метода. Метод окаймления. Пусть в матрице найден минор М порядка k, отличный от нуля. Рассмотрим лишь те миноры (k +1)-го порядка, которые содержат в себе (окаймляют) минор М. Если все они равны нулю, то ранг матрицы равен k. В противном случае среди окаймляющих миноров найдётся ненулевой минор (k +1)-го порядка, и вся процедура повторяется. ПРИМЕР 1. Методом окаймления найти ранг матрицы 2 −1 3 −2 4 A = 4 −2 5 1 7 . 2 −1 1 3 2 Первый же минор 1-го порядка этой матрицы, т.е. элемент а11= 2 не равен нулю. Значит, rang A ≥ 1 . Этот минор окаймляют следующие миноры 2-го порядка: 179
2 −1 4 −2
,
2 3 4 5
,
2 −2 4
1
,
2 4 4 7
2 −1
,
2 −1
,
2 3 2 1
,
2 −2 2
3
,
2 4 2 2
.
Первый из них равен нулю, второй – нет: 2 3 = 10 − 12 = −2 . 4 5 Значит, rang A ≥ 2 . Осталось рассмотреть миноры 3-го порядка, окаймляющие
2 −1 3 минор , т.е. миноры: 4 −2 5 , 4 5 2 −1 1 2 3
2 3 −2 4 5 1 , 2 1 3
2 3 4 4 5 7. 2 1 2
Читатель легко проверит, что первый из этих определителей равен нулю, а второй – нет. Теперь вычисления можно закончить, поскольку миноров четвертого порядка у матрицы не существует вовсе, и rang A = 3 .
4 8 ПРИМЕР 2. Найти ранг матрицы A = 4 4 8
3 6 3 3 6
−5 −7 −8 1 −1
2 3 4 2 2 7 . 2 −5 4 −6
Снова, как и выше, видим, что а11= 2 ≠ 0, и окаймляющий этот элемент минор 2-го порядка
4 −5 8 −7
= −28 + 40 = 12 отличен от нуля. Выпишем окаймляющие
его миноры 3-го порядка: 4 3 −5 4 −5 2
8 6 −7 , 4 3 −8
8 −7 4 , 4 −8 2
4 −5 3 8 −7 2 , 4 −8 7
4 −5 3 8 −7 2 , 4 1 −5
4 3 −5 8 6 −7 , 8 6 −1
4 −5 2 8 −7 4 , 8 −1 4
4 3 −5 8 6 −7 , 4 3 1 4 −5 3 8 −7 2 8 −1 −6
4 −5 2 8 −7 4 , 4 1 2
Можно заметить, что 1-ый, 2-ой, 4-ый, 5-ый, 7-ой и 8-ой определители равны нулю, т.к. содержат пропорциональные столбцы. Оставшиеся три минора также равны нулю, что проверяется непосредственным вычислением. Итак, все окаймляющие миноры третьего порядка равны нулю, и rang A = 2.
180
Переходим ко второму методу вычисления ранга матрицы − методу элементарных преобразований матрицы. Назовём элементарными преобразованиями матрицы следующие операции: а) перестановка двух строк (столбцов) матрицы; б) умножение строки (столбца) матрицы на число, отличное от нуля; в) прибавление к некоторой строке (столбцу) линейной комбинации других строк (столбцов) матрицы. Каждое из этих преобразований не меняет ранга матрицы. В самом деле, ясно, что при любом элементарном преобразовании всякий ненулевой минор матрицы остаётся ненулевым, а всякий нулевой – нулевым. Дадим ещё одно определение: матрица называется диагональной, если равны нулю все её элементы, кроме, быть может, диагональных элементов а11, а22 , а33 , ... . Так вот, элементарными преобразованиями можно привести всякую матрицу (1) к диагональному виду, причём такому, что ненулевые элементы главной диагонали будут единицами, расположенными в нескольких первых строках матрицы. Ясно, что у такой диагональной матрицы ранг равен числу упомянутых единиц. Поясним схему применения метода элементарных преобразований примерами. ПРИМЕР 3. Рассмотрим матрицу из примера 1 и вычислим её ранг методом элементарных преобразований. Поскольку каждое такое преобразование, не меняя ранга матрицы, меняет саму матрицу, мы будем использовать в наших выкладках вместо знака равенства между матрицами знак «~» (эквивалентность матриц в смысле равенства их рангов). Итак, вычтем из 1-ой строки данной матрицы 3-ю, после чего из 2-ой строки вычтем удвоенную 3-ю, что даёт: 2 −1 3 −2 4 1ая − 3ая , 2ая − 2⋅3ая 0 0 2 −5 2 0 0 3 −5 3 . A = 4 −2 5 1 7 ∼ 2 −1 1 3 2 2 −1 1 3 2 Теперь прибавим к 1-му, 3-му, 4-му и 5-му столбцам 2-ой, умноженный соответственно на 2, 1, 3, 2; получим: 181
0 0 2 −5 2 0 0 3 −5 3 . A ∼ 4ый +3 ⋅2ой ,5ый + 2 ⋅2ой 2 −1 1 3 2 Вычтем из 3-го столбца 5-ый, затем разделим 2-ой столбец на −1, а 4-ый столбец – на −5: 0 0 0 −5 2 0 0 0 1 2 A ∼ 0 0 0 −5 3 ∼ 0 0 0 1 3 . 0 −1 0 0 0 0 1 0 0 0 1ый + 2 ⋅2ой ,3ий + 2ой
Вычтем из 2-ой строки 1-ую, затем из 5-го столбца – удвоенный 4-ый: 0 0 0 1 2 0 0 0 1 0 A ∼ 0 0 0 0 1 ∼ 0 0 0 0 1 . 0 1 0 0 0 0 1 0 0 0 Наконец, поменяем местами 4-ый и 1-ый столбцы, 2-ой и 5-ый, затем 3-й и 5ый: 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 A ∼ 0 0 0 0 1 ∼ 0 1 0 0 0 ∼ 0 1 0 0 0 . 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 Матрица приведена к диагональному виду, её ранг равен 3 (как и в примере 1). ПРИМЕР 4. Вычислим методом элементарных преобразований ранг матрицы из примера 2. Для этого разделим её 1-ый столбец на 4, 2-ой на 3, 4-ый на 2. Затем вычтем 1-ый столбец из 2-го и 4-го. После этого вычтем 1-ую строку из 2-ой и 5-ой: 4 3 −5 2 3 1 1 − 5 1 3 8 6 −7 4 2 2 2 −7 2 2 A = 4 3 −8 2 7 ∼ 1 1 − 8 1 7 ∼ 4 3 1 2 5 1 1 1 1 5 − − 8 6 −1 4 −6 2 2 −1 2 −6 1 0 −5 0 3 1 0 − 5 0 3 2 0 −7 0 2 0 0 3 0 −4 ~ 1 0 −8 0 7 ∼ 0 0 −3 0 4 1 0 1 0 − 5 0 0 6 0 − 8 2 0 −1 0 −6 0 0 9 0 −12 182
Разделим 4-ю строку на 2, а 5-ю на 3. Далее, вычтем 2-ю строку из 4-ой и 5-ой и добавим её же к 3-ей: 1 0 −5 0 3 1 0 −5 0 3 0 0 3 0 −4 0 0 3 0 −4 A ∼ 0 0 −3 0 4 ∼ 0 0 0 0 0 . 0 0 3 0 −4 0 0 0 0 0 0 0 3 0 −4 0 0 0 0 0 Теперь прибавим 1-ый столбец, умноженный на 5, к 3-му, затем его же, умноженный на 3, вычтем из 5-го. Потом разделим 3-ый столбец на 3, а 5-ый – на (–4). После этого вычтем 3-ий столбец из 5-го: 1 0 0 0 0 1 0 0 0 0 0 0 3 0 −4 0 0 1 0 0 A ∼ 0 0 0 0 0 ∼ 0 0 0 0 0. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Наконец, поменяв местами 2-ой и 3-ий столбцы, приведём матрицу к диагональному виду: 1 0 0 0 0 0 1 0 0 0 A ∼ 0 0 0 0 0 . 0 0 0 0 0 0 0 0 0 0 Итак, ранг матрицы А равен 2, в полном соответствии с примером 2. 5.4.2. Критерий совместности системы линейных уравнений Мы уже знакомы с методом Гаусса исследования системы линейных алгебраических уравнений a11x1 + a12 x2 + ... + a1n xn = b1 a x + a x + ... + a x = b 21 1 22 2 2n n 2 , (2) ...... am1x1 + am 2 x2 + ... + amn xn = bm который, в частности, даёт ответ на вопрос о её совместности, т.е. о наличии у системы хотя бы одного решения. Однако, часто бывает удобнее решать этот 183
вопрос другим способом, сравнивая ранги матрицы А и расширенной матрицы А|Y системы (2). Напомним, что эти матрицы имеют вид (1) и y1 a11 a12 ... a1n a y a a ... 22 2n 2 А|Y = 21 (3) ... ... ... ... ... am1 am2 ... amn ym Теорема 2 (Кронекера – Капелли). Для совместности системы (2) необходимо и достаточно, чтобы ранги матриц А и А|Y совпадали, т.е. rang A = rang (А|Y). (4) Доказательство. Запишем систему (2) в виде x1 A1 + x2 A2 + ... + xn An = Y
(5)
где
a1i y1 a y i 2 (6) Ai = ; i = 1, 2,..., n; Y = 2 ... ... y a mi m Если система (2) совместна, то вектор Y есть линейная комбинация векторов A1 , A2 ,..., An . Тем самым, все столбцы матрицы А|Y линейно выражаются через базисные столбцы матрицы А, а значит эти последние являются базисными и для матрицы А|Y, т.е. имеет место равенство (4). Обратно, пусть верно равенство (4). Тогда базисные столбцы матрицы А являются базисными и для матрицы А|Y. Значит, столбец Y линейно выражается через эти столбцы и, тем самым, через все столбцы матрицы А. Другими слова-
(
)
ми, существует набор чисел x1, x2 ,..., xn такой, что верно равенство (5). Система (2) совместна. 5.4.3. Крамеровские системы уравнений Рассмотрим случай системы с квадратной матрицей a11x1 + a12 x2 + ... + a1n xn = y1 a x + a x + ... + a x = y 21 1 22 2 2n n 2 ...... an1x1 + an2 x2 + ... + ann xn = yn 184
(7)
и предположим, что матрица системы невырождена, т.е. что (8) ∆ = det A ≠ 0 Разумеется, такая система совместна, т.к. rang(А|Y) не может быть больше rang A = n. Изложим метод решения такой системы, принадлежащий Крамеру, из-за чего и системы вида (7), (8) часто называют крамеровскими. Запишем систему (7) в виде n (9) ∑ aij x j = yi , i = 1, 2,..., n , j =1
(
)
и пусть x1, x2 ,..., xn – некоторое её решение. Фиксируем произвольно индекс k, (k=1,2,…,n), и рассмотрим определитель ∆ k , получающийся из ∆ заменой его k-го столбца столбцом правых частей B. Заменив затем k-й столбец определителя ∆ k по формулам (9), придём к равенству
a11 ... ∆ k = ...
...
an1 ...
n ∑ a1 j x j j =1 ... n ∑ anj x j j =1
... a1n ...
... .
... ann
(k-й столбец) Если использовать линейность определителя ∆ k по k-му столбцу, то предыдущее равенство приведётся к виду a11 ... a1 j ... a1n n ∆ k = ∑ x j ... ... ... ... ... j =1 a n1 ... anj ... ann (k-й столбец) Слагаемые с индексами j ≠ k обратятся в ноль (почему?), а у слагаемого с j = k определитель равен ∆ . Таким образом, получаем ∆ k = xk ∆ . Поскольку наше рассуждение справедливо при k =1,2,…,n, приходим к формулам Крамера для вычисления единственного решения системы (7), (8): ∆ ∆ ∆ (10) x1 = 1 , x2 = 2 , ..., xn = n ∆ ∆ ∆ 185
5.4.4. Анализ линейной системы уравнений общего вида Вернёмся к системе (2) и опишем алгоритм её исследования и решения, используя понятия, введённые в этом разделе. При этом мы заново найдём и результаты, полученные ранее методом Гаусса. Однако появятся и новые или более удобные для приложений выводы. Итак, исследование системы (2) естественно начать с вычисления рангов матриц A и (А|Y). Если они различны, то система несовместна в силу теоремы Кронекера–Капелли. В случае выполнения условия (4) система совместна, и можно найти базисный минор М порядка r =rang A , общий для матриц A и (А|Y). Не ограничивая общности, можно считать, что он расположен в левом верхнем углу матрицы А. В противном случае можно свести дело к этому, меняя местами уравнения и меняя номера неизвестных. Таким образом, система (2) оказывается эквивалентной следующей системе: a11x1 + ... + a1r xr = − a1, r + 1xr + 1 − ... − a1n xn + y1 a21x1 + ... + a2r xr = − a2, r + 1xr + 1 − ... − a2n xn + y2 (11) ...... a x + ... + a x = − a rr r r , r + 1xr + 1 − ... − arn xn + yr r1 1
(
Неизвестные x1, x2 ,..., xr вестные
)
называются при этом связанными, а неиз-
( xr + 1,..., xn ) – свободными.
Для любого набора свободных неизвестных система (11) решается с помощью правила Крамера однозначно относительно связанных неизвестных: M M x1 = 1 , ..., xr = r , где M j ( j = 1,..., r ) – определитель, получаемый из M M М заменой j-го столбца столбцом − xr + 1 Ar + 1 − ... − xn An + Y , в котором a1, r + 1 a1n y1 Ar + 1 = ... , ..., Ar + 1 = ... , Y = ... . a y a r r r , 1 + rn Используя теперь линейность определителя M j по j – столбцу, приводим (так, как это сделано в методе Гаусса) решение системы (2), соответствующее заданному набору свободных неизвестных, к виду: (12) X = xr + 1B1 + xr + 2 B2 + ... + xn Bn − r + C , 186
где:
bn − r ,1 b11 ... ... x1 c1 b b x c 1r n − r, r 2 X= , B1 = 1 , ..., Bn − r = 0 , C = 2 , ... ... 0 ... x n cn ... 0 0 1
bkl, cl – некоторые числа. В качестве xr + 1 ,… , xn в (12) можно выбрать любой набор чисел. Таким образом, множество всех решений системы (2), называемое её общим решением, записывается в виде: X = t1B1 + t2 B2 + ... + tn − r Bn − r + C (13) причём B1, B2 ,..., Bn − r – линейно независимые векторы–столбцы высоты n. Система уравнений, получающаяся из (2) при y1 = y2 = … = ym= 0, т.е.
a11x1 + a12 x2 + ... + a1n xn = 0 a x + a x + ... + a x = 0 21 1 22 2 2n n (14) ...... am1x1 + am 2 x2 + ... + amn xn = 0 называется однородной системой, соответствующей системе (2). Очевидно, для общего решения однородной системы вместо (13) получается выражение (15) X = t1B1 + t2 B2 + ... + tn − r Bn − r с теми же B1, B2 ,..., Bn − r , что и в (13). Сформулируем следующие выводы: а) Общее решение (15) однородной системы (14) есть подпространство размерности (n – r) в n , где n – число неизвестных в системе, r – ранг её матрицы. б) Общее решение неоднородной системы есть сумма общего решения однородной системы и частного решения неоднородной системы. в) Разность двух частных решений неоднородной системы (2) есть некоторое решение соответствующей системы (14). г) Совместная система (2) имеет единственное решение в том и только в том случае, когда число неизвестных совпадает с рангом матрицы системы. 187
д) Однородная система всегда совместна, т.к. всегда имеет нулевое решение х1 = х2 = .. .= хn = 0. Она имеет ненулевые решения тогда и только тогда, когда число неизвестных больше ранга матрицы системы. е) Квадратная однородная система (m = n) имеет ненулевое решение тогда и только тогда, когда определитель её матрицы равен нулю.
Теоретические вопросы к главе 5. 1. Дать определение скалярного умножения двух векторов. Как найти длину вектора и угол между векторами с помощью скалярного произведения? 2. Сформулировать и обосновать основные свойства скалярного умножения. 3. Каково практическое применение свойств коммутативности и линейности скалярного умножения? 4. Что такое неравенство Коши − Буняковского? 5. Какие векторы называются ортогональными? Какой вектор называется нормированным? 6. Вывести формулу для вычисления скалярного произведения векторов, заданных своими декартовыми координатами. 7. Вывести выражение длины вектора через его декартовы координаты; формулу расстояния между двумя точками через их декартовы координаты (рассмотреть случаи на прямой, на плоскости, в трёхмерном пространстве). 8. Вывести общее уравнение плоскости в векторной и скалярной формах, не используя её параметрическое представление. Каков геометрический смысл коэффициентов при координатах в скалярной форме уравнения плоскости? 9. Дана плоскость Ax + By + Cz + D = 0 и точка M 0 ( x0 , y0 , z0 ) в пространстве (координаты декартовы). Вывести формулу расстояния от точки M 0 до плоскости. Как определить, с какой стороны от плоскости расположена точка M 0 ? 10. Аналогичный вопрос для прямой Ax + By + D = 0 и точки M 0 ( x0 , y0 ) на плоскости. 11. Что значит задать ориентацию на прямой, на плоскости, в трёхмерном пространстве? Для чего надо задавать ориентацию? 12. Дать определение векторного произведения геометрических векторов. 188
13. Сформулировать и обосновать основные свойства векторного произведения. 14. Вывести формулу для вычисления векторного произведения через координаты перемножаемых векторов в заданном произвольном базисе. Рассмотреть частный случай ортонормированного базиса. 15. Дать определение смешанного произведения трёх векторов. Сформулировать основные свойства смешанного произведения. 16. Дать определения определителей 1-го, 2-го и 3-го порядков. 17. Что такое определитель матрицы 1-го, 2-го или 3-го порядка? В чём состоит правило Саррюса? 18. Сформулировать рекуррентное определение определителя n -порядка. 19. Сформулировать и обосновать свойства определителей, касающиеся: - определителя единичной матрицы; - перемены мест двух строк определителя; - определителя с двумя одинаковыми строками; - линейности определителя по строке. 20. Что значит транспонировать матрицу? Как меняется определитель матрицы при её транспонировании? Что следует из ответа на этот вопрос по поводу столбцов определителя? 21. Дать определение минора матрицы и алгебраического дополнения элемента матрицы. 22. Сформулировать теорему о разложении определителя по строке и её следствия. 23. Дать определение ранга матрицы. Что такое базисный минор и базисные строки (столбцы) матрицы? 24. Сформулировать теорему о связи ранга матрицы с количеством её линейно независимых строк (столбцов). 25. Какие методы практического вычисления ранга матрицы вы знаете? В чём они состоят?
189
Глава 6. Линейные операторы 6.1. Определения. Действия над линейными операторами Пусть даны векторные пространства F и G. Функция А, сопоставляющая каждому вектору из F определённый вектор из G, называется линейным оператором, действующим из F в G, если для любых векторов х и x ′ из F и для любых чисел α и α ′ выполнено условие (1) A (α x + α ' x′ ) =α A ( x ) +α ′ A ( x′ ) Отметим сразу, что условие (1) эквивалентно совокупности двух условий: - для любых х, x′ из F (2) A ( x + x ′) =A ( x ) +A ( x ′) , - для любого х из F и любого числа α A(αx) = αA(x)
(3)
(Докажите эту эквивалентность!) Укажем также, что, наряду с обозначением А(х) для значения оператора А на векторе х употребляется обозначение без скобок: Ах. Естественно, пространство F назвается областью определения оператора А, а множество (4) A ( F ) = { y : y ∈ G , ∃x ∈ F : y = Ax}
− областью значений этого оператора. ПРИМЕР 1. Функция, сопоставляющая любому x ∈ F нулевой вектор из G, является линейным оператором, что очевидно из определения (1). Этот оператор называется нулевым оператором, или оператором аннулирования из F в G и обозначается символом О. Таким образом,
∀x ∈ F : O ( x ) = 0 ∈ G
(5)
ПРИМЕР 2. Пусть F – векторное пространство. Функция I: F→F такая, что (6) ∀x ∈ F : Ix = x является линейным оператором. Действительно, I(αx + α′x′) = αx + α′x′ = αIx + α′I x′, и (1) выполнено. 190
Оператор (6) называют тождественным, или единичным оператором. ПРИМЕР 3. Пусть F = G = R, где k – фиксированное число. Рассмотрим функцию y=kx:R→R (7) Это тоже линейный оператор, ибо k (αx + α′x′) = α (kx) + α′ (kx′) , и условие (1) выполнено. При k = 0 данный оператор является оператором аннулирования, при k = 1 это тождественный оператор. На привычном для нас языке: оператор (7) – это обычная прямая пропорциональность (рис. 1). y k>1 k=1 k=0 x k