Глава 1 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 1.1. Электромагнитное поле Принято считать, что в пространстве задано п...
32 downloads
245 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Глава 1 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 1.1. Электромагнитное поле Принято считать, что в пространстве задано поле некоторой величины, если в каждой точке пространства (или в некоторой его части) определено значение этой величины. Поле может быть скалярным или векторным в зависимости
от
характера
исследуемой
величины,
стационарным
(установившимся), если оно не меняется с течением времени в каждой точке пространства, или нестационарным (неустановившимся) в противном случае. Знаменитый английский учёный Джемс Клерк Максвелл (1831–1879), основатель
теоретической
электродинамики,
является
создателем
электромагнитной теории света. Развивая идею английского физика Майкла Фарадея о том, что взаимодействия между электрически заряженными телами осуществляются посредством электромагнитного поля, Д.К. Максвелл на основе обобщения эмпирических законов электрических и магнитных явлений в шестидесятых годах XIX века сформулировал фундаментальные уравнения классической
макроскопической
электродинамики,
описывающие
электромагнитные явления в произвольной среде. Французский физик Шарль Огюстен Кулон в 1785 году установил один из основных законов электростатики, определяющий силу взаимодействия между двумя "точечными" электрическими зарядами, в виде:
F =k
q1q2 , r2
(1.1)
где F – сила взаимодействия зарядов; q1 , q 2 – величины взаимодействующих зарядов;
r – расстояние
между
зарядами;
k – коэффициент
пропорциональности, величина которого определяется выбором системы единиц физических величин, входящих в это выражение; так, например, в системе единиц измерения физических величин СГС (сантиметр, грамм, секунда) коэффициент k полагается равным единице. Закон Кулона позволил 3
ввести понятие электрического поля. Силы электрического поля будут вполне определены, если в каждой точке этого поля определена сила, действующая на помещённый в ней единичный положительный заряд. Эта сила называется напряжённостью электрического поля и обычно обозначается буквой E . При q1 = q , а q 2 = 1 в соответствии с законом Кулона имеем
E =k
q r, r3
(1.2)
где r – радиус-вектор, проведённый из заряда q в рассматриваемую точку поля. Для описания электрических процессов в материальной среде вводится вектор электрической индукции D = D (E ) . Для большинства изотропных сред
D = εE ,
(1.3)
где ε = ε( x, y , z ) – диэлектрическая проницаемость (для вакуума в системе СГС
ε = 1 ). При этом поток вектора электрической индукции через произвольную замкнутую поверхность S определяется электрическим зарядом, находящимся в объёме V, ограниченном этой поверхностью, то есть:
∫ D dS = 4π∫ ρdV . S
(1.4)
V
Здесь dS = n dS , где n – единичный вектор внешней нормали к граничной поверхности, а ρ – плотность заряда в пространстве (заряд в единице объёма). Поднеся компас к проводнику с током, датский физик Ханс Кристиан Эрстед в 1820 году обнаружил, что магнитная стрелка устанавливается перпендикулярно проводнику. Из опыта Эрстеда следует, что магнитное поле имеет направленный характер и должно характеризоваться векторной величиной. Основную силовую характеристику магнитного поля назвали магнитной индукцией, которую принято обозначать буквой B . Для описания магнитных процессов в среде вводится вектор магнитной напряжённости H = H (B ) . Для большинства изотропных сред B = µH ,
(1.5) 4
где µ = µ( x, y , z ) – магнитная проницаемость среды (для вакуума в системе СГС
µ = 1 ). Вполне очевидно, что силовые линии магнитного поля замкнуты сами на себя. Поэтому для любого магнитного поля поток вектора магнитной индукции через любую замкнутую поверхность равен нулю, то есть
∫ B dS = 0 .
(1.6)
S
Из опыта известно, что для магнитного поля, как и для электрического, справедлив принцип суперпозиции: поле B , порождаемое несколькими токами, равно векторной сумме полей Bi , порождаемых каждым током в отдельности, т.е. B = ∑ Bi . Пусть замкнутый контур лежит в плоскости, перпендикулярной i
току. При этом циркуляция вектора B по контуру L равна
∫ B dl = L
4π I, c
где под I следует понимать ток, охватываемый контуром, при этом вектор dl совпадает с касательной в каждой точке контура в направлении обхода. Если некоторый контур охватывает несколько проводов с током, то в силу принципа суперпозиции имеем ⎛
⎞
BK ⎟⎟dl = ∑ ∫ BK dl = ∫ B dl = ∫ ⎜⎜⎝ ∑ ⎠ K K L
Здесь
L
L
I K – алгебраическая
пространстве, где
∑ I K = ∫ jn dS . K
4π ∑ IK . c K
величина.
Если
токи
текут
во
всём
Этот интеграл берётся по произвольной
S
поверхности S , натянутой на контур. Вектор j определяет плотность тока в той точке, где расположена площадка dS ; n – орт положительной нормали к этой площадке (т.е. нормали, образующей с направлением обхода контура при вычислении циркуляции правовинтовую систему). При этом
5
∫ B dl = L
4π j dS . c ∫S
Для большинства изотропных сред j = σE + jCTP ,
(1.7)
σ = σ( x, y , z ) – удельная
где
электропроводимость,
jCTP – плотность
так
называемых сторонних токов, т.е. токов, поддерживаемых любыми силами, кроме сил электрического поля. Согласно гипотезе Д.К. Максвелла магнитное поле порождается не только токами, текущими в проводнике, но и переменными электрическими полями в диэлектриках или в вакууме. Величина, пропорциональная скорости изменения электрического поля во времени, была названа Максвеллом током смещения. При этом циркуляция вектора магнитной напряжённости вдоль замкнутого контура L определяется полным током через произвольную поверхность S , ограниченную рассматриваемым контуром, в виде
∫ H dl = L
4π 1d j dS + D dS . ∫ c S c dt ∫S
(1.8)
В 1826 году немецкий физик Георг Симон Ом установил закон, согласно которому сопротивление R контура определяется выражением
R=
E , I
где E – электродвижущая сила (эдс), равная работе, совершаемой над единичным зарядом при обходе им замкнутого контура; I – сила тока:
I =−
dq . dt
В
1831
году
выдающийся
английский
физик
Майкл
Фарадей,
основоположник учения об электромагнитном поле, описал ставший теперь классическим эксперимент, открывший новую главу электродинамики. Много раз повторяя свои опыты в различных вариантах, М. Фарадей пришёл к выводу, что при всяком пересечении проводником линий магнитной индукции в последнем появляется ток, названный им индукционным, при этом протекший 6
заряд ∆q пропорционален числу пересечённых силовых линий ∆Φ и обратно пропорционален электрическому сопротивлению проводника R , то есть 1 R ⋅ ∆q = ∆Φ . c
Д.К. Максвелл ввёл связанный с контуром магнитный поток Φ = ∫ B n dS , S
где S – натянутая на контур поверхность. Отождествив величину ∆Φ с приращением потока Φ и учитывая закон Ома, Д.К. Максвелл придал закону электромагнитной индукции М. Фарадея следующий вид:
E = RI = − R
dq 1 dΦ =− dt c dt
или E =−
1 ∂B n dS . c ∫S ∂t
Вполне очевидно, что напряжённость электрического поля, определяющая индукционный ток в опыте М. Фарадея, неэлектростатического происхождения. Циркуляция этого поля по контуру даёт величину эдс, индуцируемой в контуре: E = ∫ E dl . L
При этом 1d
∫ E dl = − c dt ∫ B dS ,
(1.9)
L
т.е. циркуляция вектора напряжённости электрического поля вдоль замкнутого контура L (эдс индукции) определяется скоростью изменения потока вектора магнитной индукции через поверхность S , ограниченную рассматриваемым контуром. Знак "минус" соответствует правилу Ленца для направления индуцированного тока. Если считать, что вектора электромагнитного поля E , B , D и H являются непрерывными функциями координат, то, рассматривая потоки векторов B и D через поверхности, ограничивающие бесконечно малые 7
объёмы, и циркуляции векторов E и H по бесконечно малым контурам, можно от интегральных уравнений (1.4), (1.6), (1.8) и (1.9) перейти к системе дифференциальных уравнений Максвелла, характеризующих поле в каждой точке пространства. В соответствии с определением соответствующих функций имеем:
∫ D dS ∂Dx ∂D y ∂Dz d ; + D dS = lim S = divD = + ∫ ∆V → M ∆V ∂y ∂z dV S ∂x ∂Bx ∂B y ∂Bz d = = + + B d S div B ; ∂x ∂y dV ∫S ∂z
∫ H dl d Hdl = lim L 2 = n rotH = ∫ r → 0 πr dS L ∂H y ⎞ ⎛ ∂H x ∂H z ⎞ ⎛ ∂H y ∂H x ⎞ ⎤ ⎡⎛ ∂H ⎟⎟i + ⎜ ⎟⎟k ⎥ ; = n ⎢⎜⎜ z − − − ⎟ j + ⎜⎜ ∂ ∂ ∂ ∂ ∂ ∂ y z z x x y ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎦ ⎣ d E dl = n rotE = dS ∫ ∂E y ⎞ ⎛ ∂E x ∂E z ⎞ ⎛ ∂E y ∂E x ⎞ ⎤ ⎡⎛ ∂E ⎟⎟k ⎥ . ⎟⎟i + ⎜ − − = n ⎢⎜⎜ z − ⎟ j + ⎜⎜ ∂ x y ∂ ∂ z x ∂ ∂ y z ∂ ⎠ ⎝ ⎠ ⎦ ⎠ ⎝ ⎣⎝
В рассматриваемом случае дифференциальные уравнения Максвелла принимают вид: divD = 4πρ ,
(1.10)
divB = 0 ,
(1.11)
rotH =
4π 1 ∂D , j+ c c ∂t
rotE = −
(1.12)
1 ∂B . c ∂t
Уравнения позволяющей
Максвелла рассчитывать
(1.13) не
образуют
полной
электромагнитные
замкнутой
процессы
при
системы, наличии
материальной среды. Поэтому их необходимо дополнить соотношениями (1.3),
8
(1.5) и (1.7), которые называют уравнениями состояния или материальными уравнениями. 1.2. Волновое уравнение
Английский математик У. Гамильтон ввёл символ
∇=i
∂ ∂ ∂ +j +k , ∂x ∂y ∂z
называемый "набла". При своём применении он сохраняет черты как вектора, так и оператора дифференцирования. "Умножение" (т.е. действие) оператора Гамильтона на скаляр f и вектор A (точнее на скалярное и векторное поля соответственно) производится по следующим естественным правилам
⎛ ∂ ∂f ∂f ∂f ∂ ⎞ ∂ = gradf , +k +j + k ⎟⎟ f = i +j ∇f = ⎜⎜ i z y x x y z ∂ ∂ ∂ ∂ ∂ ∂ ⎠ ⎝
⎛ ∂ ∂A ∂Ay ∂Az ∂ ∂ ⎞ ⎟⎟(i Ax + jAy + k Az ) = x + + = div A , ∇ А = ⎜⎜ i + j +k ∂x ∂y ∂z ∂y ∂z ⎠ ⎝ ∂x ⎛ ∂ ∂ ∂ ⎞ ∇ × A = ⎜⎜ i + j + k ⎟⎟ × (i Ax + jAy + k Az ) = ∂y ∂z ⎠ ⎝ ∂x ⎛ ∂A ∂Ay ⎞ ⎟⎟ + = i ⎜⎜ z − y z ∂ ∂ ⎝ ⎠
i A ∂ ⎛ y ∂Ax ⎞ ∂ ⎛ ∂A ∂A ⎞ ⎟⎟ = j ⎜⎜ x − z ⎟⎟ + k ⎜⎜ − z x x y ∂ ∂ ∂ ∂ ⎠ ⎝ ⎝ ⎠ ∂x Ax
j ∂ ∂y Ay
k ∂ = rot A . ∂z Az
Рассмотрим электромагнитное поле в однородной непроводящей (σ = 0) среде в области поля, не содержащей ни зарядов (ρ = 0) , ни токов ( j = 0 ) . При этих условиях, используя оператор набла, уравнения (1.10)–(1.13) удобно представить в виде: 1 ∇ × H − D& = 0 c
(1.16)
1 ∇ × E + B& = 0 c
(1.17)
∇B = 0
(1.15) 9
∇D = 0 .
(1.14)
Точка над буквой означает дифференцирование по времени. Дифференциальное уравнение, которому должен удовлетворять каждый из векторов поля в отдельности, можно получить путём исключения другого. Подставив соотношение (1.5) в уравнение (1.17), разделив его на µ и векторно умножив на оператор набла, получаем: ⎛1 ⎞ 1 ∇ × ⎜ ∇ × E ⎟ + ∇ × H& = 0 . ⎝µ ⎠ c
(1.18)
Дифференцируя по времени уравнение (1.16), имеем 1 && ∇ × H& − D = 0. c
(1.19)
Выражение (1.19) с учётом материального уравнения (1.3) позволяет выражение (1.18) представить в виде ⎛1 ⎞ ε ∇ × ⎜ ∇ × E ⎟ + 2 E& = 0 . ⎝µ ⎠ c
(1.20)
В результате последующих преобразований выражение (1.20) можно привести к виду:
∇2 E −
εµ && E + ∇(ln µ ) × (∇ × E ) + ∇[E ∇(ln ε )] = 0 . c2
(1.21)
Аналогично находим
∇2H −
εµ && H + ∇(ln ε ) × (∇ × H ) + ∇[H∇(ln µ )] = 0 . c2
(1.22)
∂2 ∂2 ∂2 Здесь ∇ = 2 + 2 + 2 . ∂x ∂y ∂z 2
В рассматриваемой части пространства среду будем считать однородной. В этом случае ∇(ln ε ) = 0 и ∇(ln µ ) = 0 . При этом уравнения (1.21) и (1.22) принимают вид:
∇2 E −
εµ && E =0 c2
(1.23)
∇2H −
εµ && H = 0. c2
(1.24) 10
Уравнение вида (1.23) или (1.24) называется уравнением д’Аламбера или волновым уравнением.
1.3. Скалярные волны
В однородной среде в областях, где отсутствуют заряды и токи, любой из декартовых компонентов A(r , t ) векторов поля E или H в соответствии с уравнениями (1.23) и (1.24) удовлетворяет однородному волновому уравнению ∂2 A c2 2 − ∇ A = 0. ∂ t 2 εµ
Пусть
(1.25)
r ( x, y, z ) – радиус-вектор некоторой точки
P, а
s (s x , s y , s z ) –
единичный вектор с фиксированным направлением. При этом любое решение уравнения (1.25) в виде A = A(r s ,t ) определяет плоскую волну, так как в каждый момент времени величина A постоянна в плоскостях r s = const , которые перпендикулярны к единичному вектору s . Удобно выбрать такое положение осей декартовой системы координат
ξ, ζ, η , чтобы ось Oζ была бы направлена вдоль орта s . Тогда в соответствии с рис.1.1 имеем
r ⋅s =ζ или xs x + ys y + zs z = ζ . η
z
ζ
y P r
x
O ξ
Рис.1.1. Распространение плоской волны
11
В системе координат x, y, z имеем
∇2 A =
∂2 A ∂2 A ∂2 A + + . ∂x 2 ∂y 2 ∂z 2
Переходя к новой системе координат, получаем
∂ ∂ζ ∂ ∂ ∂ ∂ ∂ ∂ sx ; sy ; = sz . = = = ∂z ∂ζ ∂x ∂ζ ∂x ∂ζ ∂y ∂ζ При этом
∇2 A =
(
)
∂2 A 2 ∂2 A 2 2 s s s . + + = x y z ∂ζ 2 ∂ζ 2
Таким образом, в системе координат ξ, ζ, η уравнение (1.25) принимает вид: ∂2 A c2 ∂2 A − = 0. ∂t 2 εµ ∂ζ 2
(1.26)
Для решения этого уравнения перепишем его в виде
⎛∂ c ∂ ⎞⎛ ∂ c ∂ ⎞ ⎜ − ⎟⎜ + ⎟A = 0. ⎜ ∂t ⎟⎜ ∂t ⎟ ∂ ζ ∂ ζ εµ εµ ⎝ ⎠⎝ ⎠ Введём новые переменные
t−
εµ ζ = p; c
t+
εµ ζ = q. c
Отсюда находим
t=
1 (q + p ) , ζ = 1 c (q − p ) . 2 εµ 2
При этом ∂ ∂t ∂ ∂ζ 1 ⎛ ∂ ∂ c ∂ ⎞ ⎟, = ⎜⎜ − + = ∂p ∂t ∂p ∂ζ ∂p 2 ⎝ ∂t εµ ∂ζ ⎟⎠ ∂ ∂t ∂ ∂ζ 1 ⎛ ∂ ∂ c ∂ ⎞ ⎟. = ⎜⎜ + + = ∂q ∂t ∂q ∂ζ ∂q 2 ⎝ ∂t εµ ∂ζ ⎟⎠ Применив эти соотношения к функции A , получаем
12
∂2 A 1 ⎛ ∂2 A c2 ∂2 A ⎞ ⎟ = 0. = ⎜ − ∂p∂q 4 ⎜⎝ ∂t 2 εµ ∂ζ 2 ⎟⎠ Отсюда следует, что общее решение уравнения (1.26) имеет вид:
A = A1 ( p ) + A2 (q ) , где A1 и A2 – произвольные функции, т.е. любая функция от аргумента
t±
εµ ζ будет решением уравнения (1.26). c
⎛ εµ ⎞ Пусть, например, A2 = 0 . При этом A = A1 ⎜⎜ t − ζ ⎟⎟ . Легко видеть, что в c ⎝ ⎠ каждой плоскости ζ = const при изменении времени изменяется и поле. С другой стороны, в каждый момент времени поле различно для разных значений координат ζ . Вполне очевидно, что значение поля будет одним и тем же для сочетаний координаты ζ и момента времени t , удовлетворяющих условию: c t − ζ = const . εµ
(1.27)
Положив в этом условии t = 0 , получаем − ζ = const = −ζ 0 . Тогда условие (1.27) можно записать в виде: εµ t = ζ − ζ0 . c
Это значит, что если при t = 0 в некоторой точке ζ = ζ 0 пространства поле имело некоторое фиксированное значение, то через промежуток времени t то же самое значение поле будет иметь на расстоянии, равном
c t от начальной εµ
точки в направлении оси Oζ . Отсюда следует, что электромагнитное поле распространяется в пространстве, например, вдоль оси Oζ , со скоростью V=
c c = , где εµ n
εµ = n – показатель преломления среды. Таким образом,
⎛ 1 ⎞ функция A1⎜ t − ζ ⎟ определяет плоскую волну, бегущую в положительном ⎝ V ⎠ 13
1 ⎞ ⎛ направлении оси Oζ . Очевидно, что функция A2 ⎜ t + ζ ⎟ определяет плоскую ⎝ V ⎠ волну, бегущую в противоположном, отрицательном, направлении оси Oζ . В точке r = r0 пространства возмущение, вызванное волной, зависит только от времени: A(r0 , t ) = f (t ) . Важный частный случай электромагнитных волн представляют волны, в которых поле является простой периодической функцией времени. Такая волна называется монохроматической. Зависимость компонентов поля от времени в монохроматической волне определяется множителем вида: cos(ωt + δ ) , где ω – угловая частота волны. При этом функцию f (t ) можно представить в виде: f (t ) = a cos(ωt + δ ) .
(1.30)
Величина a (a > 0 ) называется амплитудой, а аргумент косинуса, т.е. ωt + δ называется фазой. Величина ν =
ω 1 = называется частотой колебаний. 2π T
При замене величины t на t + T значение функции f (t ) остаётся неизменным. Поэтому величина T является периодом колебаний. Волновые функции в форме (1.30) называют гармоническими функциями относительно времени. Заменив в выражении (1.30) величину t величиной t −
rs . При этом V
получаем ⎡ ⎛ rs⎞ ⎤ A(r , t ) = a cos ⎢ω⎜ t − ⎟+δ . V ⎠ ⎥⎦ ⎣ ⎝
(1.31)
Полученная волновая функция определяет гармоническую плоскую волну, распространяющуюся в направлении, заданном единичным вектором s . Расстояние, на которое перемещается поверхность волны за время T , равное периоду одного колебания, определяет период изменения напряжённости поля в пространстве, равный λ = VT = V
2π . Расстояние, равное λ , называется ω
длиной волны, при этом приведённая к вакууму длина волны λ 0 = cT = nλ . Эта длина
волны
соответствует
длине
14
распространяющейся
в
вакууме
гармонической волны той же частоты. Легко убедиться, что величина A(r , t ) , определяемая выражением (1.31), не изменится, если величину r s заменить величиной r s + λ . Выражение (1.31) можно представить в виде: A(r , t ) = a cos[ωt − k r + δ] ,
(1.32)
где k = ks называется волновым вектором или вектором распространения волны в среде, при этом волновое число k =
ω 2π 2π = =n = nk0 . λ λ0 V
Амплитуда a и начальная фаза δ плоской монохроматической волны не зависят от r и t, т.е. одинаковы во всём пространстве во все моменты времени, а, следовательно, выражение (1.32) определяет однородную волну. Никакие реальные волны этим свойством не обладают. Плоскую монохроматическую волну можно рассматривать как частный случай гармонических волн более сложной формы, в общем виде определяемых уравнением
A(r ,t ) = a(r )cos[ωt − g (r )] ,
(1.33)
где a > 0 и g – вещественные скалярные функции положения. Поверхности
g (r ) = const
называют поверхностями постоянной фазы или волновыми
поверхностями. Расчёты, связанные с гармоническими волнами, упрощаются, если использовать экспоненциальные функции вместо тригонометрических. При этом уравнение (1.33) можно записать в виде
A(r ,t ) = Re {U (r ) exp(− iωt )} =
[
]
1 U (r ) exp(− iωt ) + U ∗ (r ) exp(iωt ) , 2
(1.34)
где U (r ) – комплексная функция вида: U (r ) = a(r )exp[ig (r )] , а символ Re означает, что берётся вещественная часть. Если операции, производимые над функцией A , линейны, то в выражении (1.34) символ Re можно опустить и оперировать непосредственно в комплексной функцией вида:
A(r ,t ) = U (r )exp(− iωt ) .
(1.35) 15
∂2 A = −ω2U (r )exp(− iωt ) , а Используя выражение (1.35), находим, что 2 ∂t ∇ 2 A = exp(− iωt )∇ 2U (r ) . При этом уравнение (1.25) принимает вид: ∇ 2U + n 2 k 02U = 0 .
(1.36)
Полученное уравнение называют уравнением Гельмгольца. Величину U называют комплексной амплитудой волны. В частности, для плоской волны, имеем
g (r ) = ω
rs − δ = k r s − δ = k r − δ. V
При этом U (r ) = a(r ) exp(i k r ), где a(r ) = a0 (r ) exp (− iδ ) . 1.4. Векторные волны
Простейшим электромагнитным полем является поле плоской волны. Электромагнитную плоскую волну общего вида определим векторами
E = E (ψ ) , H = H (ψ ) , где ψ = t −
rs . V
При этом
∂ E ∂ E ∂ψ ∂ E , E& = = = ∂t ∂ψ ∂t ∂ψ
∇E = i
∂ E ∂ψ ∂ E ∂ψ ∂ E ∂ψ 1 ∂E 1 ∂E + j +k = − (i s x + js y + k s z ) =− s , ∂ψ ∂ x ∂ψ ∂ y ∂ψ ∂ z V ∂ψ V ∂ψ
(∇ × E )x = ∂ E z − ∂y
=−
∂ Ey ∂z
=
∂ Ez ∂ ψ ∂ E y ∂ ψ = − ∂ψ ∂ y ∂ψ ∂ z
⎞ 1 ∂ Ez 1 ∂ Ey 1 ⎛∂E s z = ⎜⎜ sy + × s ⎟⎟ ; V ⎝ ∂ψ V ∂ψ V ∂ψ ⎠x
вполне очевидно, что (∇ × E ) y = при этом ∇ × E =
⎞ ⎞ 1 ⎛∂E 1 ⎛∂E ⎜⎜ × s ⎟⎟ ; × s ⎟⎟ , (∇ × E )z = ⎜⎜ V ⎝ ∂ψ V ⎝ ∂ψ ⎠z ⎠y
1 ∂E ×s . V ∂ψ
Аналогично получаем 16
∂H 1 ∂H 1 ∂H H& = , ∇× H = , ∇H = − s ×s. ∂ψ V ∂ψ V ∂ψ Подставив полученные выражения в уравнения Максвелла (1.10)–(1.13), с учётом материальных уравнений (1.3) и (1.5), преобразуем их к виду: s
∂E = 0, ∂ψ
(1.37)
s
∂H = 0, ∂ψ
(1.38)
∂H V ∂E ×s −ε = 0, ∂ψ c ∂ψ
(1.39)
∂E V ∂H ×s +µ = 0. ∂ψ c ∂ψ
(1.40)
Полагая постоянную интегрирования равной нулю (т.е. пренебрегая постоянным полем во всём пространстве) и учитывая, что
c = εµ = n , в V
результате интегрирования выражений (1.37)–(1.40) получаем s E = 0,
(1.41)
s H = 0,
(1.42)
E= H =−
µ (H × s ) , ε
(1.43)
ε (E × s ). µ
(1.44)
Из вида равенств (1.41) и (1.42) следует "поперечность" электромагнитного поля, поскольку векторы электрической и магнитной напряжённости поля лежат в плоскости, перпендикулярной к направлению распространению поля. Как следует из выражений (1.43) и (1.44), векторы E и H ортогональны друг другу и образуют вместе с ортом s правую систему ортогональных векторов, как показано на рис.1.2. Кроме того, из выражений (1.43) и (1.44) следует, что
E=
µ ε H, H= E. ε µ
17
В результате получаем
εE= µH.
(1.45) H
O E
s Рис.1.2. Взаимное расположение векторов напряженности электрического E и магнитного H полей и вектора s направления распространения электромагнитной волны
1.4.1. Поляризация плоских монохроматических волн
Направим ось z системы координат x, y, z вдоль волнового вектора
k = ks . Тогда у векторов E и H могут быть отличны от нуля только проекции на оси x и y . Уравнения Максвелла допускают, в частности, такое решение, при котором у вектора E во всех точках в пространстве и во все моменты времени отлична от нуля только одна проекция, например, E x ( z , t ) . Вследствие свойства поперечности у вектора H при этом отлична от нуля только проекция на ось y , т.е. H y ( z , t ) . Эти проекции связаны между собой соотношением ε E x = µ H y . Мгновенный "снимок" такой волны, показывающий векторы E и H в разных точках оси z в один момент времени, показан на рис.1.3. В этом случае говорят, что волна имеет линейную (или плоскую) поляризацию. Плоскость, в которой лежит вектор напряжённости электрического поля волны
E и волновой вектор k , называют плоскостью поляризации или плоскостью колебаний. Чтобы представить себе изменение электрического и магнитного полей с течением времени, можно считать, что вся система векторов, показанная на рис.1.3, движется как целое вдоль оси z со скоростью V (в вакууме со скоростью c ). 18
E
z
H
Рис.1.3
Свет, в котором представлены все направления колебаний вектора E в плоскости, перпендикулярной к направлению распространения, называется естественным светом. Излучение обычных источников света не поляризовано. Линейно поляризованный свет получают, пропуская естественный через оптические
поляризаторы,
действие
которых
основано
на
различных
физических принципах. С их помощью можно не только получить линейно поляризованный свет, но и выяснить, имеет ли исследуемое излучение линейную
поляризацию.
Выполняющее
такую
роль
поляризационное
устройство называют анализатором. В отличие от обычных источников света излучение газового лазера, окна разрядной трубки которого наклонены на некоторый угол к её оптической оси (угол Брюстера), обладает линейной поляризацией. В общем случае вектор E может иметь любые направления в плоскости, перпендикулярной к направлению распространения волны. Пусть наряду с волной, поляризованной в плоскости
xOz , в том же направлении (в
направлении оси z ) распространяется другая волна той же частоты ω , но поляризованная в плоскости
yOz , как показано на рис.1.4. Вследствие
линейности уравнений Максвелла такое наложение (суперпозиция) волн также является решением уравнений. В зависимости от разности фаз складываемых линейно поляризованных волн результирующая волна моет иметь различную поляризацию. 19
z
y
ϕz
Ay
δ
ϕx
x
Ax Рис.1.4. Распространение электромагнитной волны
Рассмотрим электрическое поле E ( z , t ) волны, возникающей при сложении двух волн одинаковой частоты с ортогональными направлениями линейной поляризации:
Ex ( z , t ) = E0 x exp[i (kz − ωt )] = Ax exp(− iϕ x )exp[i (kz − ωt )]
(1.46)
E y ( z , t ) = E0 y exp[i (kz − ωt )] = Ay exp(− iϕ y )exp[i(kz − ωt )] .
(1.47)
При одинаковых (или отличающихся на nπ , где n – целое число) фазах ϕ x и ϕ y комплексных амплитуд E0 x и E0 y в каждой точке происходит сложение взаимно перпендикулярных колебаний в одной фазе, что даёт колебание в новом направлении. Результирующая волна будет линейно поляризованной. Направление её поляризации зависит от отношения амплитуд Ax и Ay , как показано на рис.1.5.
y
y
y
Ay 0 − Ay
Ay 0
Ay 0
Ax = 0
x
Ax x
Ay = 2 Ax , ϕx = ϕ y
y
Ax x
Ax = Ay , ϕx = ϕ y Рис.1.5
20
0
y
Ax
− Ax Ay = 0
Ay x
0
Ax x
Ay = 2 Ax , ϕ y = ϕx + π
Пусть волна, поляризованная в плоскости y 0 z , отстаёт по фазе на
1 π от 2
1 волны, поляризованной в плоскости x0 z , т.е. ϕ x − ϕ y = π . Если амплитуды 2 этих волн одинаковы
(Ax = Ay = A) ,
то вектор E в любой точке z будет
вращаться в плоскости x0 y против часовой стрелки, оставаясь неизменным по модулю. Например, в точке z = 0 имеем
E x (t ) = A cos(ωt + ϕ x )
(1.48)
1 ⎞ ⎛ E y (t ) = A cos⎜ ωt + ϕ x − π ⎟ = A sin (ωt + ϕ x ) . 2 ⎠ ⎝
(1.49)
Такую волну называют поляризованной по кругу или циркулярно поляризованной. Когда при наблюдении навстречу волне вращение вектора E в фиксированной плоскости происходит так, как в рассмотренном примере при
z = 0 , т.е. против часовой стрелки, то говорят о волне левой круговой поляризации. Правая круговая поляризация соответствует вращению вектора в фиксированной плоскости z = const в направлении часовой стрелки:
E x (t ) = A cos(ωt + ϕ x )
(1.50)
1 ⎞ ⎛ E y (t ) = A cos⎜ ωt + ϕ x + π ⎟ = − A sin (ωt + ϕ x ) , 2 ⎠ ⎝
(1.51)
т.е. волна E y (t ) опережает по фазе волну E x (t ) на
1 π. 2
На практике для превращения линейно поляризованного света в свет с круговой поляризацией используют анизотропные кристаллические пластинки, в которых две волны с ортогональными направлениями линейной поляризации имеют различные фазовые скорости. Подбором толщины пластинки можно получить на выходе заданную разность фаз этих волн и тем самым требуемое состояние поляризации. При использовании комплексной записи в виде (1.46) и (1.47) для складываемых волн с ортогональными направлениями линейной поляризации результирующая волна имеет линейную поляризацию, если отношение 21
комплексных амплитуд
E0 y
к
E0 x
выражается вещественным числом.
Результирующая волна имеет круговую поляризацию, если отношение комплексных амплитуд определяется мнимым числом, по модулю равным единице. При
E0 y E0 x
⎛ π⎞ = exp⎜ i ⎟ = i , волна будет иметь правую круговую ⎝ 2⎠
поляризацию, а при
E0 y E0 x
= −i – левую. В общем случае при наложении
световых колебаний во взаимно перпендикулярных плоскостях кривая, которую описывает конец вектора E в произвольной фиксированной плоскости
z = const , является геометрическим местом точек, координаты которых определяются уравнениями вида:
E x = Ax cos(τ + ϕ x )
(1.52)
E y = Ay cos(τ + ϕ y )
(1.53)
Ez = 0 .
(1.54)
Здесь τ = kz − ωt . Для того, чтобы исключить τ из уравнений (1.52) и (1.53), перепишем их в виде:
Ex = cos τ cos ϕ x − sin τ sin ϕ x Ax Ey Ay
(1.55)
= cos τ cos ϕ y − sin τ sin ϕ y .
(1.56)
При этом
Ey Ex sin ϕ y − sin ϕ x = cos τ sin (ϕ y − ϕ x ), Ax Ay Ey Ex cos ϕ y − cos ϕ x = sin τ sin (ϕ y − ϕ x ). Ax Ay Возведя в квадрат левую и правую части этих уравнений и сложив полученные выражения соответствующих частей, имеем
22
2
2
E ⎛ Ex ⎞ ⎛ E y ⎞ ⎟ − 2 E x y cos δ = sin 2 δ , ⎜⎜ ⎟⎟ + ⎜ ⎜ ⎟ Ax Ay ⎝ Ax ⎠ ⎝ Ay ⎠
(1.57)
где δ = ϕ y − ϕ x . Выражение (1.57) представляет собой уравнение конического
Ax 2 + 2 Bxy + Cy 2 = H
сечения. Известно, что квадратичная форма эллиптической,
если
дискриминант
будет
D = AC − B 2 > 0 .
формы
В
рассматриваемом случае соответствующий дискриминант равен 1 cos 2 δ sin 2 δ D = 2 2 − 2 2 = 2 2 > 0. Ax Ay Ax Ay Ax Ay
y
ν µ ψ
α
2 Ay
x
O
2 Ax Рис.1.6. Эллиптически поляризованная волна
Таким образом, уравнение (1.57) описывает эллипс, вписанный в прямоугольник, стороны которого параллельны осям координат Ox и Oy и имеют длины 2 Ax и 2 Ay , как показано на рис.1.6. Положив в уравнении (1.57) величину
E x = Ax ,
E x = Ax cos δ ,
т.е.
(± Ax , ± Ay cos δ)
и
получаем эллипс
E y = Ay cos δ ,
касается
(± Ax cos δ, ± Ay ).
а
сторон
при
E y = Ay
прямоугольника
получаем в
точках
В этом случае говорят, что волна,
описываемая уравнениями (1.52)–(1.54), эллиптически поляризована. В общем случае оси эллипса не параллельны осям Ox и Oy .
23
Пусть Oµ
и Oν – новые оси, совпадающие с осями эллипса, а
ψ (0 ≤ ψ < π) – угол между осью Ox и направлением главной оси Oµ , как показано на рисунке. При этом компоненты Eµ и Eν связаны с компонентами
E x и E y соотношениями Eµ = E x cos ψ + E y sin ψ
(1.58)
Eν = − E x sin ψ + E y cos ψ .
(1.59)
Если 2a и 2b
(a ≥ b ) – длины
осей эллипса, то уравнение эллипса
относительно осей Oµ и Oν можно записать в виде:
Eµ = a cos(τ + ϕ 0 )
(1.60)
Eν = b sin (τ + ϕ0 ) .
(1.61)
Чтобы определить амплитуды a и b , приравняем в развёрнутом виде правые части уравнений (1.58) и (1.60) и уравнений (1.59) и (1.61). При этом, учитывая выражения (1.52) и (1.53), получаем
a(cos τ cos ϕ0 − sin τ sin ϕ0 ) = cos τ(Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ ) −
− sin τ(Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ ),
b(sin τ cos ϕ0 + cos τ sin ϕ0 ) = cos τ(Ay cos ϕ y cos ψ − Ax cos ϕ x sin ψ ) +
+ sin τ(Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ ).
Приравнивая коэффициенты при cos τ и при sin τ , имеем
a cos ϕ 0 = Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ ,
(1.62)
a sin ϕ 0 = Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ ;
(1.63)
b cos ϕ0 = Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ ,
(1.64)
b sin ϕ0 = − Ax cos ϕ x sin ψ + Ay cos ϕ y cos ψ .
(1.65)
Возведя левые и правые части этих уравнений в квадрат и последовательно складывая полученные части уравнений (1.62) и (1.63) и уравнений (1.64) и (1.65), находим, что
a 2 = Ax2 cos 2 ψ + Ay2 sin 2 ψ + Ax Ay sin 2ψ cos δ , b 2 = Ax2 sin 2 ψ + Ay2 cos 2 ψ − Ax Ay sin 2ψ cos δ , 24
где δ = ϕ y − ϕ x . Отсюда следует, что
a 2 + b 2 = Ax2 + Ay2 .
(1.66)
Перемножив левые и правые части уравнений (1.62) и (1.64) и уравнений (1.63) и (1.65) и сложив соответствующие части полученных выражений, имеем
± ab = Ax Ay sin δ .
(1.67)
Наличие двух знаков в уравнении (1.67) определяет возможность двух направлений вращения вектора E , конец которого описывает эллипс. Поделив левые и правые части уравнений (1.64) и (1.65) соответственно на левые и правые части уравнений (1.62) и (1.63), получаем
±
b Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ − Ax cos ϕ x sin ψ + Ay cos ϕ y cos ψ . = = a Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ
Отсюда следует, что
Ax2 sin 2 ϕ x sin ψ cos ψ + Ax Ay sin ϕ x sin ϕ y sin 2 ψ −
− Ax Ay sin ϕ x sin ϕ y cos 2 ψ − Ay2 sin 2 ϕ y sin ψ cos ψ = = − Ax2 cos 2 ϕ x sin ψ cos ψ + Ax Ay cos ϕ x cos ϕ y cos 2 ψ − − Ax Ay cos ϕ x cos ϕ y sin 2 ψ + Ay2 cos 2 ϕ y sin ψ cos ψ. Преобразовав это выражение, получаем
(A
2 x
)
− Ay2 sin 2ψ = 2 Ax Ay cos δ cos 2ψ .
Отсюда следует, что
tg 2ψ =
2 Ax Ay
Ax2 − Ay2
Обозначим
Ay Ax
cos δ . = tgα , где 0 ≤ α ≤
(1.68) π . 2
При этом уравнение (1.68) можно представить в виде:
tg 2ψ =
2 sin α cos α 2tgα δ = cos δ cos cos 2 α − sin 2 α 1 − tg 2 α
или
tg 2ψ = tg 2α cos δ .
(1.69) 25
Из выражений (1.66) и (1.67) следует, что
±
2 Ax Ay 2ab 2tgα sin δ = = sin δ = 2 sin α cos α sin δ 2 2 2 2 a +b Ax + Ay 1 + tg 2 α
±
2ab = sin 2α sin δ . a + b2
или (1.70)
2
Обозначим ±
b π⎞ ⎛ π = tgχ , где χ ⎜ − ≤ χ ≤ ⎟ – вспомогательный угол, при 4⎠ a ⎝ 4
этом численное значение tgχ определяет величину отношения осей эллипса, а знак при χ характеризует два варианта, которые можно использовать при описании эллипса. При этом выражение (1.70) можно представить в виде: sin 2χ = sin 2α sin δ .
(1.71)
Итак, если заданы величины Ax и Ay , относящиеся к произвольному положению осей, разность фаз δ и если 0 ≤ α ≤
π , то главные полуоси эллипса 2
a и b и угол ψ (0 ≤ ψ < π) , который большая ось эллипса образует с осью Ox , определяются формулами:
a 2 + b 2 = Ax2 + Ay2
(1.72)
tg 2ψ = tg 2α cos δ
(1.73)
sin 2χ = sin 2α sin δ .
(1.74)
С другой стороны, если известны длины осей a и b и ориентация эллипса (т.е. заданы величины a , b и ψ ), то эти формулы позволяют найти амплитуды
Ax и Ay и разность фаз δ . Существуют оптические устройства, которые позволяют определять эти величины прямым способом. В предельных случаях эллипс поляризации вырождается либо в прямую, либо в окружность. Согласно выражению (1.57) эллипс вырождается в прямую при δ = ϕ y − ϕ x = mπ , где m = 0, ± 1, ± 2, K . При этом
26
Ey Ex
= (− 1)
m
Ay Ax
.
В этом случае имеем линейно поляризованную волну. В том случае, когда эллипс вырождается в окружность, имеем круговую поляризацию волны. Вполне очевидно, что условием этого является преобразование описанного прямоугольника в квадрат, что эквивалентно выравниванию амплитуд:
Ax = Ay = A . Кроме того, в этом случае один из компонентов вектора E должен равняться нулю, когда другой достигает максимального значения. Последнее π условие эквивалентно равенству: δ = ϕ y − ϕ x = ±(2m − 1) , где m = 1, 2, 3, K . 2
При соблюдении названных условий уравнение (1.57) принимает вид уравнения окружности:
E x2 + E y2 = A 2 . В случае правой поляризации sin δ > 0 . При этом
δ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; 2
E x = a cos(τ + ϕ x ) , π ⎞ ⎛ E y = a cos⎜ τ + ϕ x + + 2mπ ⎟ = −a sin (τ + ϕ x ) . 2 ⎠ ⎝ При левой поляризации sin δ < 0 . При этом π δ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2
E x = a cos(τ + ϕ x ) , π ⎞ ⎛ E y = a cos⎜ τ + ϕ x − + 2mπ ⎟ = a sin (τ + ϕ x ) . 2 ⎠ ⎝ Если вместо вещественного представления компонентов вектора E использовать комплексное:
E x = Ax exp[i(τ + ϕ x )],
[
]
E y = Ay exp i (τ + ϕ y ) ,
то 27
Ey Ex
=
Ay Ax
[
]
exp i (τ + ϕ y − τ − ϕ x ) =
Ay Ax
exp(iδ )
или
Ey Ex
=
Ay Ax
e iδ .
Значение этого отношения позволяет сразу же определить характер поляризации: – линейная поляризация электромагнитной волны, если δ = ± mπ , где
m = 0, 1, 2, K ; при этом Ey Ex
= (− 1)
m
Ay Ax
;
– правая круговая поляризация электромагнитной волны, если Ax = Ay ,
δ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2 Ex ⎡ ⎛π ⎛ π⎞ ⎞⎤ = exp ⎢i⎜ + 2mπ ⎟⎥ = exp⎜ i ⎟ = i ; Ey ⎝ 2⎠ ⎠⎦ ⎣ ⎝2 – левая круговая поляризация электромагнитной волны, если
π Ax = Ay , δ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2 при этом
Ex ⎡⎛ π ⎞⎤ ⎛ π⎞ = exp ⎢i⎜ − + 2mπ ⎟⎥ = exp⎜ − i ⎟ = −i . Ey ⎠⎦ ⎝ 2⎠ ⎣⎝ 2 Можно показать, что в общем случае для правой эллиптической поляризации мнимая часть отношения
Ey Ex
положительна, тогда как для левой
эллиптической поляризации она отрицательна. На рис.1.7 показаны эллипсы поляризации при разных значениях δ .
28
δ=0
0 1), то 2 2
tgα r ≥ tgα i ,
(1.158)
tgα t ≤ tgα i .
(1.159) 65
Знак равенства в соотношении (1.156) справедлив лишь при нормальном или скользящем падении света ( θi = θt = 0 или θi =
π ), а в соотношении 2
(1.157) – лишь при нормальном падении. Из неравенств (1.156) и (1.157) следует, что при отражении угол между плоскостью колебаний и плоскостью падения увеличивается, а при преломлении он уменьшается. В том случае, когда угол падения равен углу Брюстера, т.е. при θi + θt =
π , 2
в соответствии с формулой (1.156) tgα r = ∞ при любом значении угла α i . Из закона Брюстера следует, что свет поляризуется при падении его на границу раздела двух сред под углом Брюстера. Однако, доля отражённого при этом света сравнительно мала. Поляризовать падающий свет без изменения направления
его
распространения
можно
с
помощью
стопы
тонких
плоскопараллельных пластинок. Используя выражения (1.151), находим, что отношение интенсивности двух компонент волны после прохождения через обе поверхности пластинки определяется формулой вида: 2
⎛ τ⊥ ⎞ ⎜ ⎟ = cos 4 (θi − θt ) < 1 . ⎜τ ⎟ ⎝ || ⎠ Таким образом, при выходе из пластинки параллельный компонент преобладает над перпендикулярным, причём степень поляризации тем больше чем больше угол θi . Если угол θi равен углу Брюстера, то θt =
tgθi = n ; при этом получаем 2
4
⎛ τ⊥ ⎞ ⎛ 2tgθi ⎞ ⎛ 2n ⎞ 4 4 ⎜ ⎟ = sin 2θi = ⎜ ⎟ ⎜ 1 + tg 2 θ ⎟ = ⎜⎝ 1 + n 2 ⎟⎠ . ⎜τ ⎟ i ⎠ ⎝ ⎝ || ⎠
66
π − θi , а 2
2
При
nd = 1,56889
(стекло
марки
БК10)
получаем
⎛ τ⊥ ⎞ ⎜ ⎟ ~ = 0,675 . ⎜τ ⎟ ⎝ || ⎠
Следовательно, если свет проходит, например, через пять пластинок, то это отношение равно 0,657 5 ~ = 0,14 . История открытия поляризованного света весьма интересна. Двойное лучепреломление, которое возникает при прохождении света через кристалл исландского шпата, впервые наблюдал датчанин Эразм Бартолини в 1669 году. Х. Гюйгенс подробно исследовал это явление и описал его закономерности с помощью весьма остроумной, хотя и формальной, теории в 1690 году. Первое в истории науки феноменологическое определение поляризации света дал И. Ньютон. Он же ввёл понятие обыкновенного и необыкновенного лучей. Сам термин "поляризация света" был введён французским физиком Э. Малюсом, который более столетия спустя после работ Х. Гюйгенса открыл явление поляризации света при отражении от поверхности стекла и воды. Двойное преломление света в кристаллах можно использовать для превращения естественного света в поляризованный. Сами расщепившиеся в кристалле компонента линейно поляризованы. Для разделения образовавшихся пучков лучей В. Никель впервые предложил остроумное устройство, использующее различие показателей преломления для этих лучей. Оно получило название призмы Николя. Сегодня различных поляризационных призм существует довольно много. Однако, призма Николя сыграла в оптике большую роль и стала настолько популярной, что сегодня "Николь" и "поляризационная призма" – синонимы. В настоящее время наиболее удобный метод получения поляризованного света заключается в использовании так называемых поляроидных плёнок. Их действие
основано
на
свойстве,
известном
как
дихроизм.
Вещества,
обладающие этим свойством, имеют различные коэффициенты поглощения для света, поляризованного в различных
направлениях. Например, можно
изготовить плёнки из поливинилового спирта с внедрённым иодом, которые 67
пропускают почти 80% света, поляризованного в одной плоскости, и менее 1% света, поляризованного в перпендикулярном направлении. 1.6.5. Полное внутреннее отражение
При распространении света из оптически более плотной среды в среду с меньшей оптической плотностью, т.е. когда n = n12 =
ε µ n2 = 2 2 < 1, ε1µ1 n1
sin θt = 1 при sin θi = n12 , при этом θt = 90° , а направление распространения света совпадает с касательной к поверхности раздела. Если величина угла θi превышает предельное значение (sin θi > n12 ) , то свет не входит во вторую среду. Весь падающий свет отражается обратно в первую среду, т.е. в этом случае наблюдается полное внутреннее отражение. Таким образом, поток энергии через границу раздела двух сред отсутствует, однако, тем не менее, электромагнитное поле во второй среде не равно нулю. Действительно, если в фазовом множителе прошедшей волны, определяемом выражением (1.134), положить sin 2 θi 1 sin θt = sin θi , cos θt = ±i −1 , n n2
(1.160)
то получим
⎡
⎛
⎞⎤
⎣
⎝
nV2 ⎠⎦
⎡
x sin θi ωz ⎟⎟⎥ exp ⎢m exp(− iτt ) = exp ⎢− iω⎜⎜ t − где n = n12 =
⎢⎣ V2
⎤ sin 2 θi − 1⎥ , n2 ⎥⎦
n2 . n1
В результате имеем ⎡ ⎛ x sin θi ⎞⎤ ~ ⎟⎟⎥ , E (t ) = T exp(− iτt ) = T exp ⎢− iω⎜⎜ t − nV ⎝ 2 ⎠⎦ ⎣
⎡ ωz sin 2 θ ⎤ ~ i 1 − где T = T exp ⎢m ⎥ при n < 1 . n2 ⎢⎣ V2 ⎥⎦ 68
(1.161)
Выражение
(1.161)
описывает
неоднородную
волну,
которая
распространяется вдоль поверхности раздела сред в плоскости падения (т.е. в направлении оси x ) и меняется экспоненциально с изменением расстояния z от этой поверхности. Напомним, что волна называется неоднородной, если поверхности постоянной амплитуды не совпадают с поверхностями постоянной фазы. При положительном знаке перед корнем в выражении (1.161) при увеличении расстояния z от поверхности амплитуда росла бы неограниченно, что противоречит опыту. При отрицательном знаке амплитуда очень быстро уменьшается
с
глубиной
проникновения
z,
причём
ωz n n z = 2πν z = 2π z = 2π , т.е. эффективная глубина проникновения порядка V2 c λ0 λ длины волны. Экспериментальная проверка наличия возмущения во второй (менее плотной) среде представляет довольно трудную задачу, поскольку любое устройство, используемое для обнаружения возмущения, будет нарушать граничные условия. Грубое подтверждение можно получить, если поместить вторую преломляющую среду на расстоянии около четверти длины волны от поверхности раздела, на которой происходит полное внутреннее отражение, и наблюдать проникновение излучения во вторую среду. И, тем не менее, проникновение поля во вторую (менее плотную) среду наблюдалось в очень тонких опытах Л.И. Мандельштама ещё 1914 году. Чтобы применить формулы Френеля (1.142) к случаю полного внутреннего отражения, перепишем их в виде: R|| = −
sin θi cos θi − sin θt cos θt A|| , sin θi cos θi + sin θt cos θt
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
sin θi cos θt − sin θt cos θi R⊥ = − A⊥ . sin θi cos θt + sin θt cos θi
(1.162)
Подставив в эти выражения значения величин, определяемых формулами (1.160) (при положительном знаке перед квадратным корнем), получаем 69
R|| = −
n 2 cos θi − i sin 2 θi − n 2 n 2 cos θi + i sin 2 θi − n 2 2
R⊥ =
cos θi − i sin θi − n
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
A|| ,
2
cos θi + i sin 2 θi − n 2
A⊥ .
(1.163)
Следовательно, R|| = A|| , R⊥ = A⊥ ,
(1.164)
т.е. для каждого компонента интенсивность света, отражённого при полном внутреннем отражении, равна интенсивности падающего света. Таким образом, хотя во второй среде поле отлично от нуля, но поток энергии через поверхность отсутствует. Можно показать, что хотя в общем случае компонент вектора УмоваПойнтинга в направлении, нормальном к границе, конечен, его значение, усреднённое по времени, равно нулю. Это означает, что не существует постоянного потока во вторую среду, а энергия течёт туда и обратно. И, наконец, определим изменение фаз компонент отражённой и падающей волн. На основании соотношений (1.164) можно принять, что R|| A||
iδ
= e || ,
R⊥ = e iδ ⊥ . A⊥ R||
Согласно соотношениям (1.163) каждое из отношений
( )
определяется выражением, имеющим форму ψ ψ ∗
−1
A||
R⊥ A⊥
. Следовательно, если α –
( )
аргумент ψ (т.е. ψ = ae iα , где a и α вещественны), то e iδ = ψ ψ ∗ tg
и
−1
= e 2iα , т.е.
δ = tgα , а поэтому 2 sin 2 θi − n 2 1 tg δ|| = − , 2 n 2 cos θi 2
2
sin θi − n 1 tg δ ⊥ = − . 2 cos θi
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
(1.165)
70
Отсюда следует, что обе компоненты испытывают скачки фаз разной величины. Вследствие этого линейно поляризованный свет при полном внутреннем отражении оказывается поляризованным эллиптически. При этом для относительной разности фаз δ = δ ⊥ − δ|| имеем 1 1 tg δ ⊥ − tg δ|| 1 2 . tg δ = 2 1 1 2 1 + tg δ ⊥ tg δ|| 2 2
Подставив в это выражение соотношения (1.165) и преобразовав, получаем cos θi sin 2 θi − n 2 1 . tg δ = 2 sin 2 θi
(1.166)
π⎞ ⎛ Это выражение обращается в нуль при скользящем падении ⎜ θi = ⎟ и при 2⎠ ⎝ ~ ~ падении света под критическим углом θi sin θi = n . Между этими двумя
(
)
углами лежит угол, соответствующий максимуму относительной разности фаз. Он определяется уравнением: d d θi
(
)
2 2 2 ⎛ 1 ⎞ 2n − 1 + n sin θ i = 0. ⎜ tg δ ⎟ = ⎝ 2 ⎠ sin 3 θ i sin 2 θ i − n 2
Положив числитель дроби равным нулю, получаем sin 2 θ i =
2n 2 . 1+ n2
(1.167)
Подставив это соотношение в выражение (1.166), получаем формулу, определяющую максимальную величину δ m относительной разности фаз, в виде: 1 1 − n2 . tg δ m = 2 2n
(1.168)
Ещё Френелем было показано, что при полном внутреннем отражении можно из линейно поляризованного света получить свет, поляризованный по кругу. Выбирая направление поляризации падающей волны под углом 45° к плоскости падения (т.е. α i = 45° ), получаем равные амплитуды компонент: 71
A|| = A⊥ . Тогда в соответствии с равенствами (1.164) имеем: R|| = R⊥ . Затем
подбираем величины n и θi таким образом, чтобы относительная разность фаз δ была равна 90° . Для получения такого значения δ при одном отражении необходимо, чтобы в соответствии с соотношением (1.168) π 1− n2 . tg = 1 = 4 2n
При этом n = 2 − 1 = 0,414 . Отсюда следует, что показатель преломления n21 =
1 более плотной среды относительно менее плотной должен быть, по n
крайней мере, не менее 2,41. Это значение показателя преломления довольно велико, хотя непоглощающие вещества, показатель преломления которых приближается или даже превышает его, существуют. Френель использовал два полных внутренних отражения в стекле. Когда n21 = 1,51 , то, согласно соотношениям (1.167) и (1.168), максимальная относительная разность фаз δ m = 45°56′ получается при угле падения θi , равном 51°20′ . Поэтому в соответствии с уравнением (1.166) значение δ = 45° можно получить при одном из следующих углов падения: θi = 48°37′ , θi = 54°37′ . При
этом
разность
фаз
в
90°
возникает
в
результате
двух
последовательных полных внутренних отражений при любом их приведённых углов. Для получения такой разности фаз применяется стеклянный блок, известный как ромб Френеля, главное сечение которого показано на рис.1.15. Линейно поляризованный свет
Свет, поляризованный по краю
54°37′ Рис.1.15. Ромб Френеля
72
Вполне очевидно, что ромб Френеля можно использовать для получения эллиптически поляризованного света. В этом случае азимут падающего (линейно поляризованного) света должен отличаться от 45° . Можно также с помощью ромба Френеля получить линейно поляризованный свет из света, поляризованного эллиптически. Измерение предельного (критического) значения угла θi позволяет удобно и достаточно точно определять показатель преломления, используя равенство
n = sin θi .
Приборы,
используемые
рефрактометрами.
73
для
этой
цели,
называются
Глава 2 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ 2.1. Основное уравнение геометрической оптики Рассмотрим гармоническое электромагнитное поле общего вида
E (r ,t ) = E0 (r ) exp(− iωt ),
⎫ ⎬ ⎭
H (r ,t ) = H 0 (r ) exp(− iωt ), где вектора
E0 (r ) и
(2.1)
H 0 (r ) определяются комплексными векторными
функциями положения, при этом вещественные части стоящих справа выражений описывают физические поля. Подставив выражения (2.1) в уравнения Максвелла (1.14)–(1.17), в среде, свободной от зарядов и токов, получаем rot E0 − ik 0 µ H 0 = 0 ,
(2.2)
rot H 0 + ik 0 µ E0 = 0 ,
(2.3)
div ε E0 = 0
(2.4)
div µ H 0 = 0 .
(2.5)
При выводе этих уравнений были использованы материальные уравнения D = ε E , B = µ H и соотношения k 0 =
ω 2π = , где λ 0 – длина волны в вакууме. c λ0
Однородную плоскую волну, распространяющуюся в среде с показателем преломления n = εµ в направлении, определяемом единичным вектором s , можно представить следующими векторными функциями:
E0 (r ) = e exp(ik 0 ns ⋅ r ),
H 0 (r ) = h exp(ik 0 ns ⋅ r ),
⎫ ⎬ ⎭
(2.6)
где e и h – постоянные векторы, в общем случае комплексные. На достаточно больших расстояниях от малого источника поля s ⋅ r ≈ r . Поэтому разумно предположить, что в этих случаях поле общего типа можно представить в виде: E0 (r ) = e (r ) exp[ik 0 L(r )],
H 0 (r ) = h (r ) exp[ik 0 L(r )],
⎫ ⎬ ⎭
(2.7) 3
где L(r ) – "оптический путь" – вещественная скалярная функция положения; e (r ) и h (r ) – векторные функции положения, обязательно комплексные, если
необходимо учесть все возможные состояния поляризации излучения. Применив к выражениям (2.7) хорошо известные векторные тождества, получаем rot E0 = (rot e + ik 0 grad L × e ) exp (ik 0 L ) ,
(2.8)
div ε E0 = (ε div e + e ⋅ grad ε + ik 0 ε e ⋅ grad L ) exp (ik 0 L ) .
(2.9)
Аналогичные выражения получаем для rot H 0 и для div µ H 0 . Полученные выражения позволяют преобразовать уравнения (2.2)–(2.5) к виду:
grad L × e − µ h = −
1 rot e , i k0
(2.10)
grad L × h + ε e = −
1 rot h , i k0
(2.11)
e grad L = −
1 (e grad ln ε + div e ), i k0
(2.12)
h grad L = −
1 (h grad ln µ + div h ) . i k0
(2.13)
Пусть λ 0 → 0 . При этом k 0 → ∞ . Если в этом случае выражения, которые
умножаются на
1 , не будут чрезвычайно большими, то правыми частями i k0
уравнений (2.10)–(2.13) можно пренебречь и записать их в виде: grad L × e − µ h = 0 ,
(2.14)
grad L × h + ε e = 0 ,
(2.15)
e ⋅ grad L = 0 ,
(2.16)
h ⋅ grad L = 0 .
(2.17)
Легко видеть, что уравнения (2.16) и (2.17) получаются из уравнений (2.14) и (2.15), если умножить их скалярно на grad L.
4
Из уравнения (2.14) следует, что h =
1 grad L × e . При этом уравнение µ
(2.15) можно представить в виде:
[
]
1 (e ⋅ grad L ) ⋅ grad L − e (grad L )2 + ε e = 0 . µ
(2.18)
В соответствии с уравнением (2.16) первый член полученного уравнения обращается в нуль. При этом, поскольку вектор e не равен нулю во всём рассматриваемом пространстве, получаем:
( grad L )2 = n 2 ,
(2.19)
где n = εµ – показатель преломления среды. Функцию L(r ) называют эйконалом, а уравнение (2.19) – уравнением эйконала. Важно обратить внимание на то, что уравнение (2.19) получено в предположении, что
λ 0 → 0 . Раздел оптики, в котором пренебрегают
конечностью длин волн, что соответствует предельному переходу при λ 0 → 0 , называется
геометрической
оптикой,
поскольку
в
этом
приближении
оптические законы можно сформулировать на языке геометрии. Уравнение (2.19) называют основным уравнением геометрической оптики. Поверхности
L(r ) = const
называют
геометрическими
волновыми
поверхностями или геометрическими волновыми фронтами. Заметим, что в однородной среде в областях, свободных от зарядов и токов любая из декартовых компонентов A(r , t ) векторов поля E и H удовлетворяет однородному волновому уравнению (1.25), например, в форме
n 2 ∂ 2 A(r , t ) ∇ A(r , t ) = 2 , c ∂t2 2
решение которого можно записать в виде: A( x, y, z; t ) = A(r , t ) = A0 (r ) exp{ik 0 [L(r ) − ct ]}, где A0 (r ) и L(r ) – действительные величины. Величину A0 (r ) удобно заменить величиной exp a(r ) . При этом
5
∇ 2 A = div gradA = div[ Agrad (a + ik 0 L )] . Используя тождество ∇( fA ) = f∇A + A ∇f ′ , получаем ∇ 2 A = Adivgrad (a + ik 0 L ) + grad (a + ik 0 L )gradA = A∇ 2 (a + ik 0 L ) +
[
+ A grad (a + ik 0 L )
2
или
]
[
{
]}
∇ 2 A = A ∇ 2 (a + ik 0 L ) + grad (a + ik 0 L ) . 2
n2 ∂2 A Кроме того, 2 2 = − n 2 k 02 A . c ∂t
В результате имеем
[
]
A ∇ 2 a + ik 0∇ 2 L + ( grad a ) + 2ik 0 ( grad a )( grad L ) − k 02 ( grad L ) + n 2 k 02 = 0
или
2
{∇ a + (grad a )
2
2
[
2
]}
{
}
− k 02 ( grad L ) − n 2 + ik 0 2( grad a )( grad L ) + ∇ 2 L = 0 . 2
Разделив это уравнение на k 02 , получаем:
(grad L )
2
[
]
{
}
λ20 λ 2 − n − 2 ∇ 2 a + ( grad a ) − i 0 2( grad a )( grad L ) + ∇ 2 L = 0 . 2π 4π 2
В пределе при λ → 0 из равенства нулю действительной части получаем основное уравнение геометрической оптики в форме (2.19). Формулу (2.19) можно представить в виде: 2
2
2
⎛ ∂L ⎞ ⎛ ∂L ⎞ ⎛ ∂L ⎞ 2 ⎜ ⎟ + ⎜⎜ ⎟⎟ + ⎜ ⎟ = n . ⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂z ⎠
(2.20)
Формулы (2.19) и (2.20) справедливы лишь тогда, когда изменения a(r ) на расстояниях, сравнимых с длиной волны, малы по сравнению с самой величиной a(r ) . Поэтому нельзя ожидать, что геометрическая оптикадаст правильное описание поля, например, на границе тени, так как там интенсивность света резко меняется, или вблизи точек, где происходит резкая концентрация света (например, вблизи резкого изображения точки). Ответ на вопрос о распространении интенсивности поля в таких областях даёт теория дифракции. 6
2.2. Световые лучи
Энергия,
протекающая
через
основание
цилиндра,
ось
которого
параллельна орту s , а площадь поперечного сечения равна единице, за время t равна энергии, содержащейся в цилиндре длиной V ⋅ t , где V – скорость распространения электромагнитного поля в пространстве. Следовательно, поток энергии, равный энергии, протекающей через основание цилиндра в единицу времени, равен V ⋅ w , где w – плотность энергии электромагнитного поля. Плотности электрической и магнитной энергии соответственно равны we =
1 1 E D , wm = H B, 8π 8π
при этом плотность энергии электромагнитного поля равна w = we + wm . Учитывая соотношение (1.45), получаем w=
ε 2 µ 2 E = H . 4π 4π
(2.21)
С другой стороны, вектор Умова-Пойнтинга в соответствии с выражением (1.107) равен G=
c c c ε 2 c µ 2 E×H = EHs = E s= H s. 4π 4π 4π µ 4π ε
(2.22)
Сравнивая выражения (2.21) и (2.22), получаем
G=
c w⋅ s =V ⋅ w⋅ s . εµ
(2.23)
Отсюда следует, что вектор Умова-Пойнтинга определяет поток энергии и по величине, и по направлению распространения. Векторы электрической и магнитной напряжённости гармонического электромагнитного поля можно представить выражениями вида:
E (r , t ) = Re{E0 (r ) exp(− iωt )} =
[
]
1 E0 (r ) exp(− iωt ) + E0∗ (r ) exp(− iωt ) , 2
H (r , t ) = Re{H 0 (r ) exp(− iωt )} =
[
(2.24)
]
1 H 0 (r ) exp(− iωt ) + H 0∗ (r ) exp(− iωt ) , (2.25) 2
7
где E0 и H 0 – комплексные векторные функции координат. Так как частоты колебаний в оптическом диапазоне излучения очень велики ( ω достигает величины порядка 1015 c −1 ), непосредственно наблюдать мгновенные значения ни одной из таких быстро осциллирующих величин невозможно. Можно говорить лишь об их значениях, усреднённых за некоторый интервал времени − τ ≤ t ≤ τ , который велик по сравнению с периодом колебаний T =
2π . В частности, средняя по времени плотность ω
энергии электрического поля равна τ
τ
[
1 ε 2 ε 1 2 we = E dt = E exp(− 2iωt ) + 2 E0 E0∗ + ∫ ∫ 2τ − τ 8π 16πτ − τ 4
]
+ E0∗ exp(2iωt ) dt . 2
Здесь τ
τ
1 1 exp(− 2iωt )dt = − exp(− 2iωt ) = ∫ 2τ − τ 4iωτ −τ =−
1 [exp(− 2iωt ) − exp(2iωt )] = 1 T sin 2ωτ . 4iωτ 4π τ
Поскольку время τ велико по сравнению с периодом T , величина
T мала τ
по сравнению с единицей, а поэтому интегралом, содержащим exp(− 2iωt ) , можно
пренебречь.
Подобным
же
образом
можно
показать,
что
τ
1 T 1 sin 2ωτ , а следовательно, и интегралом, содержащим exp(2iωt )dt = ∫ 4π τ 2τ − τ exp(2iωt ) можно пренебречь. В результате окончательно получаем we ≈
ε E0 E0∗ . 16π
(2.26)
Аналогично находим, что средняя по времени плотность энергии магнитного поля равна wm ≈
h H 0 H 0∗ . 16π
(2.27) 8
Среднее по времени значение вектора Умова-Пойнтинга равно τ
τ
1 c (E × H )dt = c 1 ∫ 1 [E0 × H 0 exp(− 2iωt ) + G = ∫ 2τ − τ 4π 4π 2 τ − τ 4
+ E0 × H 0∗ + E0∗ × H 0 + E0∗ × H 0∗ exp(2iωt )]dt ≈ ≈
(
)
{
(2.28)
}
c c E0 × H 0∗ + E0∗ × H 0 = Re E0 × H 0∗ . 16π 8π
Подставив выражения (2.7) в выражения (2.26) и (2.27), получаем ε µ e ⋅ e ∗ , wm = h ⋅ h ∗. 16π 16π
we =
(2.29)
Из выражений (2.14) и (2.15) следует, что 1 gradL × e µ
(2.30)
1 e ∗ = − gradL × h ∗ . ε
(2.31)
h=
При этом выражения (2.29) принимают вид we = − wm =
(
)
(
)
1 1 e gradL × h ∗ = e × h ∗ gradL , 16π 16π
(
)
1 (gradL × e )h ∗ = 1 e × h ∗ gradL . 16π 16π
В результате имеем we = wm =
(
)
1 e × h ∗ gradL . 16π
Следовательно, в приближении геометрической оптики усреднённые по времени плотности электрического и магнитного полей равны друг другу. Подставив выражения (2.7) в выражение (2.28), получаем G =
{
}
c Re e × h ∗ . 8π
Используя соотношение (2.30), полученное выражение можно представить в виде: G =
{ (
)}
{(
)
}
c c Re e × gradL × e ∗ = Re e ⋅ e ∗ gradL − (e gradL )e ∗ . 8πµ 8πµ
В соответствии с уравнением (2.16): e gradL = 0 .
9
При этом G =
{(
)
}
(
)
c c Re e ⋅ e ∗ gradL = e ⋅ e ∗ gradL . 8πµ 8πµ
Первое из выражений (2.29) позволяет представить полученное выражение в виде G =2
c we gradL . εµ
(2.32)
Средняя по времени плотность полной энергии w = we + wm = 2 we . При εµ = n 2 отношение
grad L c в соответствии с = V , а отношение n εµ
уравнением (2.19) эйконала определяет некоторый единичный вектор s , равный
s=
gradL gradL = . n gradL
(2.33)
В результате получаем, что G =V w s .
(2.34)
Отсюда следует, что направление усреднённого по времени вектора Умова-Пойнтинга совпадает с нормалью к геометрическому волновому фронту, а абсолютная его величина равна произведению средней плотности энергии на скорость V =
c . Выражение (2.34) свидетельствует о том, что в приближении n
геометрической оптики средняя плотность полной энергии электромагнитного поля распространяется со скоростью V =
c . Полученные результаты позволяют n
ввести понятие геометрических световых лучей. Геометрические световые лучи можно определить как траектории перемещения плотности световой энергии, ортогональные геометрическим волновым фронтам L = const , при этом направление перемещения в каждой точке траектории совпадает с направлением усреднённого вектора УмоваПойнтинга.
10
Если радиус-вектор r (s ) точки P, расположенной на луче, рассматривать как функцию длины s дуги луча, то в соответствии с рис.2.1 отношение dr = s , при этом уравнении луча в соответствии с выражением (2.33) можно ds
представить в виде: n
dr = gradL(r ) ds
(2.35)
P
P2
dr
s
P1 r0
r
Рис.2.1
Умножив уравнение (2.35) скалярно на орт s , получаем
n=
dr gradL(r ) . ds
Но
dr gradL(r ) =
∂L( x, y, x ) ∂L( x, y, x ) ∂L( x, y, x ) dx + dy + dz = dL(r ) . ∂x ∂y dz
При этом
n=
dL(r ) . ds
(2.36)
Дифференцируя выражение (2.35) по s , получаем
d ⎛ dr ⎞ d d dr d dL dn dr = = gradL = gradn , ⎜ n ⎟ = gradL = ds ⎝ ds ⎠ ds dr ds dr ds dr dr то есть
d ⎛ dr ⎞ ⎜ n ⎟ = gradn . ds ⎝ ds ⎠
(2.37)
11
В однородной среде n = const , при этом уравнение (2.37) принимает вид:
d 2r = 0 . Очевидное решение этого уравнения можно представить в виде: ds 2 r = sa + b , где a и b – постоянные векторы. Это решение представляет собой уравнение прямой линии, направленной вдоль вектора a и проходящей через точку r = b . Следовательно, в однородной среде световые лучи есть прямые линии. Рассмотрим два волновых фронта: L1 = L = const и L2 = L + dL = const , как показано на рис.2.2. Из выражения (2.36) следует, что приращение эйконала
dL(r ) определяется произведением расстояния между волновыми фронтами на показатель преломления среды. Интеграл
∫ nds
вдоль кривой, определяющей
траекторию луча, называется оптической длиной этой кривой.
L = const
L + dL = const
ds
Рис.2.2. Смещение волнового фронта на расстояние ds
Представим себе, что два фиксированных положения волнового фронта связаны между собой множеством световых лучей, проходящих на своём пути оптические
среды,
разделяющие
рассматриваемые
волновые
фронты.
Обозначая квадратными скобками оптическую длину произвольного луча, проходящего через соответствующие точки P1 и P2 волнового фронта в первом и во втором положениях (смотри, например, рис.2.1), получаем: P2
[P1P2 ] = ∫ nds = L(P2 ) − L(P1 ) .
(2.38)
P1
12
Так как значение эйконала L при каждом положении волнового фронта постоянно, то постоянна и разность эйконалов при двух фиксированных положениях волнового фронта. При этом из выражения (2.38) следует, что P2
∫ nds =const .
(2.39)
P1
С другой стороны, nds =
c ds = cdt , где dt – время прохождения световой V
волной расстояния ds вдоль луча (время распространения поля или переноса световой энергии на расстояние ds вдоль луча). Следовательно, время распространения световой волны от точки P1 до точки P2 равно T2
P
1 2 T = ∫ dt = ∫ nds =const . c P1 T1 Основываясь на этой физической интерпретации выражения (2.39), его называют
законом
формулируют
так:
таутохронизма оптическая
(законом
длина
одновременности),
световых
лучей
однако,
между
двумя
фиксированными положениями волнового фронта постоянна.
2.3. Закон преломления
Учитывая тождество уравнением
(2.35)
вектор
rotgrad = 0 , находим, что в соответствии с ns = n
dr , ds
называемый
лучевым
вектором,
удовлетворяет соотношению: rotns = 0 .
(2.40)
Рассмотрим прохождение луча через поверхность раздела двух сред. Заменим поверхность раздела сред S тонким переходным слоем, внутри которого величины ε и µ быстро, но непрерывно меняются от значений, характеризующих среду с одной стороны поверхности, до значений – с другой её стороны. Построим элементарную прямоугольную площадку, стороны
13
которой P1Q1 и P2Q2 параллельны, а стороны P1 P2 и Q1Q2 перпендикулярны к поверхности S , как показано на рис.2.3. t2
Q2
P2
t
ε2 , µ2 ε1, µ1
S
N12
t1
τ
Q1
P1
Рис. 2.3. К выводу закона преломления
Пусть
t – единичный вектор касательной к поверхности, а
N12 –
единичный вектор нормали, направленный из первой среды во вторую. Если обозначить через τ единичный вектор нормали к элементарной площадке, то, интегрируя выражение (2.40) по площади элемента и используя теорему Стокса, получаем:
∫ (rotns )τd ∑ = ∫ ns dr ,
∑
(2.41)
С
где второй интеграл берётся по ограничивающему элементарную площадку d ∑ контуру
P1Q1Q2 P2 P1 . Если длина отрезков
P1Q1 = δl1 ,
P2Q2 = δl2
и
P1 P2 = Q1Q2 = δh мала, то на каждой из этих сторон вектор ns можно заменить постоянными векторами n1s1 и n2 s 2 . Тогда этот интеграл можно представить в виде суммы: n1s1 ⋅ t1 δl1 + n2 s2 ⋅ t 2 δl2 +
1 (n1s1 + n2 s2 ) (N12 + N 21 )δh = 0 . 2
(2.42)
При δh → 0 справедливо равенство δl1 = δl2 = δl . При этом выражение (2.42) принимает вид:
(n1s1t1 + n2 s2t 2 )δl = 0 .
(2.43)
В соответствии с принятым на рис.2.3 направлением векторов имеем: t1 = −t = − τ × N12 ; t 2 = t = τ × N12 .
14
Подставив эти соотношения в выражение (2.43), получаем:
(n2 s2 − n1s1 ) (τ × N12 ) = τ [N12 × (n2 s2 − n1s1 )] = 0 , или N12 × (n2 s2 − n1s1 ) = 0 .
(2.44)
Отсюда следует, что тангенциальная составляющая лучевого вектора ns непрерывна при переходе через поверхность раздела двух сред или, что то же ~ самое, вектор N12 = n2 s2 − n1s1 перпендикулярен к этой поверхности в точке ~ падения луча, при этом N12 = µN12 , где µ – скалярный множитель, называемый астигматической постоянной или постоянной отклонения. N12
n2
n2 s 2 i2
S
~ N12
n1s1
i1 n1
Рис. 2.4. К выводу закона преломления
Пусть i1 и i2 – углы, образованные падающим и преломлённым лучами с нормалью к поверхности раздела двух сред в точке падения, т.е. с нормалью
N12 , как показано на рис.2.4. Тогда в соответствии с выражением (2.44) имеем: n2 (N12 × s 2 ) = n1 (N12 × s1 ) ,
(2.45)
при этом:
n2 sin i2 = n1 sin i1 .
(2.46)
Итак, в соответствии с выражением (2.45) луч падающий, нормаль к поверхности раздела сред в точке падения луча и луч преломлённый лежат в одной плоскости. При этом в соответствии с выражением (2.46) отношение
15
синуса угла падения луча к синусу угла преломления равно отношению показателей преломления сред
n2 . Эти два положения, выражаемые n1
формулами (2.45) и (2.46), определяют закон преломления Снелиуса-Декарта. Обратимся вновь к выражению (2.44) и покажем применение его для построения хода преломлённого луча. Умножив это выражение на некоторый масштабный множитель M , получаем
(Mn′s ′ − Mns ) × N = 0 .
(2.47)
Пусть на преломляющую поверхность произвольной формы в точку Q падает луч, направление которого определяется ортом s , как показано на рис.2.5. Отложим от точки Q в направлении орта s отрезок QA1 , равный nM единиц линейной меры (например, 100n мм). Из точки A1 в направлении орта
N проведём линию. На этой линии определим положение точки A2 , удалённой от точки Q на расстояние QA2 = n′M тех же единиц линейной меры, например, с помощью циркуля. Через точки Q и A2 проведём линию, направление которой определим ортом s ′ . Поскольку построения на рис.2.5 выполнены в соответствии с формулой (2.47), орт s ′ определяет направление хода преломлённого луча.
n′ n
A1
N
nM n′M Q
A2
s′ N
s
Рис.2.5. Преломление луча на поверхности раздела двух сред
С другой стороны, из выражения (2.44) следует, что
n′s ′ = ns + µN .
(2.48) 16
Эта формула является основной в методе расчёта хода луча через систему сферических, а также несферических поверхностей, предложенном Иваном Васильевичем Лебедевым в 1938 году (журнал "Оптико-механическая промышленность", 1938, №7). Умножив скалярно обе части выражения (2.48) на вектор N , получаем
µ = n′ cos i ′ − n cos i .
(2.49)
Используя закон преломления в форме (2.49) легко преобразовать к виду:
µ = n′ 2 − n 2 + (nN s ) − nN s . 2
(2.50)
Для луча, отражённого поверхностью, имеем: n′ = n , а i ′ = π − i . При этом
µ = −2n cos i = −2nN s . Подставив это соотношение в выражение (2.48), при n′ = n получаем s ′ = s − 2 N (N s ) .
(2.51)
Формула (2.51) является одной из основных, применяемых при решении задач юстировки зеркальных и зеркально-призменных систем. Выразим орты s , N и s ′ через их проекции на оси декартовых координат:
s = sxi + s y j + sz k , N = N xi + N y j + N z k , s ′ = s ′x i + s ′y j + s ′z k . Подставив эти выражения в формулу (2.51), преобразуем её к виду:
⎛ s ′x ⎞ ⎛ sx ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ s ′y ⎟ = m′⎜ s y ⎟ , ⎜ s′ ⎟ ⎜s ⎟ ⎝ z⎠ ⎝ z⎠
(2.52)
где матрица m′ имеет вид:
⎛ 1 − 2 N x2 ⎜ m′ = ⎜ − 2 N x N y ⎜ ⎝ − 2N x N z
− 2N x N y 1 − 2 N y2
− 2N y N z
− 2N x N z ⎞ ⎟ − 2N y N z ⎟ . ⎟ 1 − 2 N z2 ⎠
17
(2.53)
2.4. Принцип Ферма
Принцип
Ферма,
известный
теперь
как
принцип
наикратчайшего
оптического пути, утверждает, что оптическая длина реального луча между P2
любыми двумя оптически несопряжёнными точками P1 и P2 , равная
∫ nds ,
P1
короче оптической длины любой другой кривой, соединяющей эти точки и лежащей в некоторой регулярной окрестности луча. Под регулярной окрестностью понимается область, которую можно заменить лучами таким образом, что через каждую её точку будет проходить один (и только один) луч. Покажем справедливость принципа Ферма в случае прохождения света через одну преломляющую поверхность произвольной формы, разделяющую две однородные среды с показателями преломления n и n′ .
n′
n N2 M
−i
N1 P1
− i′
P2
S Рис.2.6. Принцип Ферма и закон преломления
Обратимся к рис.2.6, на котором показан путь луча, проходящего через оптически несопряжённые точки
P1 и
P2
и падающего в точку
N1
преломляющей поверхности S , который образует с нормалью к поверхности в точке падения луча углы i и i ′ . Выберем на преломляющей поверхности точку
N 2 , бесконечно близкую к N1 . При этом отрезок кривой N1 N 2 будем считать величиной
первого
порядка
малости,
что
позволяет
заменить
его
дифференциалом: N1 N 2 = dS . Соединив точку N 2 с точками P1 и P2 , получим путь P1 N 2 P2 , соседний с путём P1 N1 P2 луча. Оптическая длина хода луча P1 N1 P2 18
может быть представлена в виде: [P1 P2 ] = ns + n′s ′ , где s = P1N1 , а s ′ = N1 P2 . При переходе от траектории луча P1 N1 P2 к соседней траектории P1 N 2 P2 оптическая длина хода луча получит приращение, равное:
d [P1P2 ] = nds + n′ds′ .
(2.54)
Чтобы определить величину этого приращения, восстановим в точке N1 перпендикуляр N1M к лучу P1 N 2 . Из-за малости угла N1 P1 N 2 можно принять
P1M ≈ P1 N1 . Поэтому отрезок MN 2 можно рассматривать как приращение ds отрезка P1 N1 = s при замене пути луча P1 N1 путём P1 N 2 . Пренебрегая величинами выше первого порядка малости, из треугольника MN1 N 2 находим, что ds = − dS sin i . При этом приращение отрезка N1P2 = s′ равно ds′ = dS sin i′ . Полученные выражения позволяют равенство (2.54) представить в виде:
d [P1 P2 ] = (n′ sin i ′ − n sin i )dS .
(2.55)
Отсюда получаем d [P1 P2 ] = n′ sin i ′ − n sin i . dS
При соблюдении закона преломления имеем: d [P1P2 ] = 0, dS
(2.56)
т.е. при соблюдении закона преломления длина оптического пути [P1P2 ] имеет экстремальное значение, что свидетельствует о справедливости принципа Ферма. С другой стороны, можно считать, что при соблюдении принципа Ферма равенство n′ sin i ′ = n sin i определяет закон преломления. Если каждому числу x из чисел некоторого класса сопоставлено другое число y , то, как известно, мы имеем дело с функцией y = y ( x ) . Если каждой
функции y ( x ) из некоторого класса функций сопоставлено некоторое число F , то говорят, что задан функционал F [ y ( x )] . Вариацию функционала обозначают символом δF [ y ( x )] . Вариация функционала является аналогом дифференциала функции. Для достижения функционалом F [ y ( x )] экстремального значения 19
необходимо, чтобы вариация (если она существует) при некоторой функции y=~ y ( x ) обращалась в ноль. Учитывая изложенное, принцип Ферма в обозначениях аппарата вариационного исчисления можно записать в виде: P2
δ ∫ nds = 0 .
(2.57)
P1
Поскольку n =
c , где c = const , выражение (2.57) можно представить V
эквивалентным выражениям вида: P2
ds = 0, V P1
δ∫
(2.58)
T2
т.е. δ ∫ dt = 0 . T1
С другой стороны, k = nk 0 , т.е. λ 0 = nλ , что позволяет выражение (2.57) представить в виде: P2
ds = 0. λ P
δ∫
(2.59)
1
Принцип Ферма содержит в себе и обобщает следующие положения лучевой оптики: 1. Закон преломления распространения света в однородной среде, т.е. в среде с постоянным показателем преломления. 2. Законы преломления и отражения лучей на поверхностях раздела сред, т.е. на тех поверхностях, где показатель преломления меняется скачком. 3. Позволяет рассчитать путь света в среде с показателем преломления, непрерывно изменяющимся вдоль пути, для которого справедливо уравнение (2.57). 4. Устанавливает закон обратимости светового пути, в соответствии с которым линия, представляющая собой возможный путь течения световой энергии, распространяющейся в одном направлении, есть также возможный путь её течения в обратном направлении.
20
Действительно, если вариация интеграла (2.57) равна нулю, когда он берётся в пределах от P1 до P2 , то она также равна нулю при перемене пределов интегрирования местами (т.е. в пределах от P2 до P1 ). Следует помнить, что все приведённые выше положения применимы только в пределах тех условий, в которых справедливы законы геометрической (лучевой) оптики.
2.6. Интегральный инвариант Лагранжа-Пуанкаре
Предположим, что показатель преломления n является непрерывной функцией координат. Тогда, применив теорему Стокса к интегралу от нормального компонента rot ns , взятому по любой открытой поверхности, получаем:
∫ n s ⋅ dr = 0 .
(2.60)
C
Интегрирование
выполняется
по
замкнутому
контуру
C,
ограничивающему указанную поверхность. Полученное выражение называется интегральным инвариантом Лагранжа-Пуанкаре и означает, что интеграл P2
∫ n s ⋅ dr , взятый между любыми двумя точками поля
P1 и P2 , не зависит от
P1
пути интегрирования. Можно показать, что формула (2.60) остаётся справедливой и в том случае, когда контур C пересекает поверхность, разделяющую две однородные среды с разными показателями преломления. Для доказательства этого будем считать, что контур C делится на части C1 и C2 , расположенными по разные стороны от преломляющей поверхности S , а точки пересечения контура C с поверхностью S соединены другой кривой K , лежащей на этой поверхности, как показано на рис.2.7.
21
C2 S K
C1
n2 n1
Рис.2.7. К выводу инварианта Лагранжа-Пуанкаре при наличии поверхности раздела двух однородных сред
Применяя формулу (2.60) к обоим контурам C1 K и C2 K и складывая полученные выражения, имеем:
∫ n1s1 ⋅ dr + ∫ n2 s2 ⋅ dr + ∫ (n2 s2 − n1s1 ) ⋅ dr = 0 .
C1
C2
(2.61)
K
Интеграл вдоль кривой K равен нулю, поскольку, как было показано при ~ выводе закона преломления, вектор N12 = n2 s2 − n1s1 , перпендикулярен к поверхности S в любой точке кривой K . При этом выражение (2.61) сводится к выражению (2.60), что и требовалось доказать.
2.5. Конгруэнции лучей
Уравнение произвольной прямой в пространстве можно определить уравнением вида: x = a11 + a12 z , y = a21 + a22 z .
(2.62)
Задавая независимым друг от друга величинам коэффициентов a11 , K, a22 всевозможные значения, получим уравнения всех прямых, заполняющих пространство.
Связывая
величины
коэффициентов
одной
зависимости
F1 (a11 , a12 , a21 , a22 ) = 0 , получаем комплекс прямых. Вполне очевидно, что в общем случае через каждую точку пространства проходит конус лучей с вершиной в этой точке. Добавляя ещё одну зависимость F2 (a11 , a12 , a21 , a22 ) = 0 , 22
мы выделяем из комплекса конгруэнцию [от лат.congruens (congruentis) – соразмерный, соответствующий, совпадающий] прямых. Пусть через каждую точку некоторой поверхности z = f ( x, y ) проходит прямая, определяемая коэффициентами a11 , a12 , a21 , a22 , которые являются функциями от x и y : a11 = a11 ( x, y ),
a12 = a12 ( x, y ),
a21 = a21 ( x, y ),
a22 = a22 ( x, y ). В результате получаем конгруэнцию прямых, так как из написанных четырёх равенств можно исключить x и y и получить два уравнения, связывающих величины a11 , K, a22 . Конгруэнцией прямых, например, является совокупность исходящих из светящейся точки лучей после выхода из оптической системы при условии, что последняя среда однородна. Соотношение (2.40), а, именно, rot ns = 0 , определяет все системы лучей, которые могут существовать в неоднородной среде, и выделяет их из более общих семейств кривых. В однородной среде, т.е. при n = const , это соотношение принимает вид: rot s = 0 .
(2.63)
Левую часть соотношения (2.40) можно заменить тождеством rot ns = n rots + ( grad n ) × s .
(2.64)
Умножив при этом соотношение (2.64) скалярно на вектор s , получаем, что система лучей в любой среде должна удовлетворять соотношению: s ⋅ rots = 0 .
(2.65)
Система кривых, заполняющих некоторую часть пространства так, что через каждую точку этой части пространства в общем случае проходит одна кривая, называется конгруэнцией. Если существует семейство поверхностей, пересекающих каждую кривую под прямым углом, то рассматриваемую систему кривых называют нормальной конгруэнцией. Если такого семейства
23
поверхностей нет, то говорят о косой конгруэнции. В обычной (световой) геометрической оптике рассматривают только нормальные конгруэнции лучей. Косые конгруэнции играют важную роль в электронной оптике. Если все лучи, составляющие конгруэнцию, имеют вид прямых, то такая конгруэнция называется прямолинейной конгруэнцией лучей. Формулы (2.63) и (2.65) определяют необходимые и достаточные условия, соблюдение которых свидетельствует о том, что конгруэнция лучей является соответственно нормальной и нормальной прямоугольной.
2.7. Теорема Малюса
Если все лучи в однородной среде имеют общую точку, например, исходят из точечного источника, то говорят, что лучи образуют гомоцентрический пучок. Такой пучок образует нормальную конгруэнцию, поскольку каждый луч пучка пересекает под прямым углом сферические поверхности (волновые фронты), центр которых расположен в точке пересечения лучей. В 1808 году французский физик Этьен Луи Малюс (1775–1812 гг.) показал, что если гомоцентрический пучок прямолинейных лучей преломляется или отражается какой-либо поверхностью, то получающийся после этого пучок лучей (в общем случае уже не гомоцентрический) тоже образует нормальную конгруэнцию. Позднее Дюпин (1816 г.), Кветеле (1825 г.) и Жергонн (1825 г.) обобщили результат Малюса. Работы этих учёных позволили сформулировать следующую
теорему,
называемую
теоремой
Малюса:
нормальная
прямолинейная конгруэнция остаётся нормальной после любого числа преломлений и отражений. Рассмотрим
нормальную
прямолинейную
конгруэнцию
лучей
в
однородной среде с показателем преломления n1 , которые преломляются на поверхность S , отделяющей эту среду от другой однородной среды с показателем преломления n2 , как показано на рис.2.8.
24
P
A2
A1 n2
n1
B1
B2 Q
L1
L2
S
Рис.2.8. К доказательству теоремы Малюса
Пусть L1 – один из волновых фронтов в первой среде, A1 и P – точки пересечения произвольного луча в первой среде с поверхностями L1 и S соответственно, а A2 – точка на преломлённом луче. Если точку A1 сместить в другую точку B1 на том же волновом фронте, то точка P на поверхности преломления сместится в точку Q . Теперь на преломлённом в точке Q луче выберем такую точку B2 , чтобы оптический путь от B1 до B2 равнялся оптическому пути от A1 до A2 ,т.е. чтобы соблюдалось равенство:
[ A1 PA2 ] = [B1QB2 ] .
(2.66)
Если перемещать точку B1 по всей поверхности L1 , то точка B2 при своём перемещении заполнит поверхность L2 . Покажем, что преломлённый луч QB2 перпендикулярен к этой поверхности. Вычисляя интегральный инвариант Лагранжа-Пуанкаре по замкнутому пути A1 PA2 B2QB1 A1 , получаем:
∫
n ds +
A1PA2
∫
ns dr +
A2 B2
∫
B2QB1
n ds +
∫ ns dr = 0
B1 A1
на основании равенства (2.66) имеем
∫
A1PA2
nds +
∫ nds = 0 .
B2QB1
25
(2.67)
Кроме того, поскольку на волновом фронте L1 единичный вектор s в каждой точке перпендикулярен к нему, интеграл
∫ ns ⋅ dr = 0 .
В результате
B1 A1
выражение (2.67) принимает вид:
∫ n s ⋅ dr = 0 .
(2.68)
A2 B2
Полученное соотношение должно выполняться на поверхности L2 для любого отрезка кривой. Это возможно только в том случае, если s ⋅ dr = 0 для каждого линейного элемента dr поверхности L2 , т.е. если преломлённые лучи перпендикулярны к ней или, другими словами, если преломлённые лучи образуют нормальную конгруэнцию, что и требовалось доказать. Поскольку точка B1 на волновом фронте L1 выбрана произвольно, то равенство [ A1 PA2 ] = [B1QB2 ] позволяет утверждать, что оптическая длина пути между любыми двумя волновыми фронтами одинакова для всех лучей. Вполне очевидно,
что
этот
результат
остаётся
справедливым
для
случая
последовательных преломлений (и отражений) на нескольких поверхностях, а так же, как это непосредственно следует из выражения (2.38), в случае распространения лучей в среде с непрерывно изменяющимся показателем преломления. Эта теорема, доказанная с помощью интегрального инварианта Лагранжа-Пуанкаре, называется принципом равного оптического пути. Из этой теоремы
следует,
что
геометрические
волновые
фронты
нормальной
конгруэнции лучей или совокупности нормальных конгруэнций, образованных в результате последовательных преломлений (и отражений), "оптически параллельны" друг другу. С последней теоремой невольно ассоциируется гипотетическая теорема, впервые выдвинутая в 1690 году Х.Гюйгенсом, согласно которой каждую точку волнового фронта можно считать центром вторичного светового возмущения, порождающего элементарные сферические волны, при этом волновым фронтом в любой последующий момент времени служит огибающая этих вторичных
26
сферических волн. Принцип Гюйгенса может служить правилом для построения поверхностей, "оптически параллельных" друг другу. Дополнив построение Гюйгенса утверждением, что вторичные волны интерферируют между собой, О.Френель в 1818 году впервые смог объяснить явление дифракции. Это сочетание построения Гюйгенса с принципом интерференции называется принципом Гюйгенса-Френеля. Позднее (в 1882 г.) Г.Кирхгоф
придал
исследованиям
Френеля
строго
математическое
обоснование, и с этого времени началось широкое изучение дифракции. Тем не менее, в большинстве практически важных случаев из-за математических трудностей приходится прибегать к приближённым методам и тут принцип Гюйгенса-Френеля служит мощным инструментом, позволяющим решать большинство вопросов, встречающихся в прикладной оптике.
27
Глава 3 ОСНОВЫ ТЕОРИИ ГЕОМЕТРИЧЕСКОГО ПОСТРОЕНИЯ ИЗОБРАЖЕНИЯ ПРЕДМЕТА СИСТЕМОЙ ОПТИЧЕСКИХ ПОВЕРХНОСТЕЙ 3.1. Параксиальная оптика Теоретические соотношения, полученные в предположении, что лучи, проходящие через оптически сопряжённые точки в пространстве предметов и изображений, расположены в непосредственной близости от оптической оси, принято называть параксиальной оптикой (от греч. para – возле, мимо, вне и лат. axis – ось) или оптикой Гаусса. Рассмотрим ход луча через одну преломляющую поверхность сферической формы, центр кривизны которой расположен в точке C , разделяющую однородные среды с показателями преломления n и n′ , как показано на рис.3.1. Следует заметить, что в случае одной преломляющей поверхности сферической формы любая прямая, проведённая через центр её кривизны, может быть принята за оптическую ось. Однако, будем считать, что рассматриваемая преломляющая поверхность входит в состав некоторой центрированной системы
оптических
поверхностей,
обладающей
вполне
определённым
положением оптической оси, под которой понимаем линию, проходящую через центры кривизны всех поверхностей. Точку пересечения преломляющей поверхности с оптической осью (точку O ) называют вершиной этой поверхности. Расстояние от вершины O поверхности до центра C её кривизны равно радиусу r кривизны поверхности. Если центр кривизны поверхности расположен
справа
от
её
вершины,
то
величина
положительной, в противном случае – отрицательной.
3
радиуса
считается
n −i
A
n′
N − i′
A′ N
A −σ
K
O
C
σ′
A′
∆ −s
r
s′
Рис.3.1. Преломление луча осевого пучка на сферической поверхности раздела двух однородных сред
Пусть в среде с показателем преломления n
на оптической оси
расположена некоторая светящаяся точка A . Рассмотрим ход луча, исходящего из точки A под углом − σ к оптической оси и падающего на преломляющую поверхность в точке N . Нормалью к преломляющей поверхности в точке падения луча служит прямая NC , а её направление от точки падения определяется ортом N . Орт нормали N направлен из среды с показателем преломления n в среду с показателем преломления n′ . Направление луча AN определяется ортом A . Этот луч с нормалью к поверхности в точке падения образует угол падения − i . Преломлённый в точке N поверхности луч проходит в среде с показателем преломления n′ и пересекает оптическую ось в точке A′ под углом σ′ к ней. Направление луча NA′ определяется ортом A ′ . Этот луч с нормалью к поверхности в точке падения образует угол преломления − i ′ . Угол падения i будем считать положительным, если для совмещения орта
A падающего луча с ортом нормали N орт A следует повернуть вокруг точки падения луча (вокруг точки N ) против часовой стрелки; в противном случае угол будем считать отрицательным. Аналогично угол преломления луча i′ будем считать положительным, если для совмещения орта A ′ преломлённого луча с ортом нормали N орт A ′ необходимо повернуть вокруг точки N против часовой стрелки; в противном случае – отрицательным. 4
Положительным направлением оптической оси системы поверхностей принято считать направление слева направо. При этом угол σ будем считать положительным, если для совмещения орта A с оптической осью его следует повернуть вокруг точки A против часовой стрелки; в противном случае – отрицательным. Аналогично угол σ′ будем считать положительным, если для совмещения орта A ′ с оптической осью его следует повернуть вокруг точки A′ против часовой стрелки, в если по часовой стрелке, то отрицательным. Обозначим отрезки OA = − s и OA′ = s′ , при этом начало отрезков s и s′ будем считать расположенным в вершине O преломляющей поверхности. В соответствии с рис.3.1 имеем
r r−s r r − s′ = . = , sin σ sin i sin σ′ sin i ′ Учитывая закон преломления в форме (2.46), из этих соотношений получаем n sin σ r − s ′ sin i ′ sin σ . = = r − s sin i sin σ′ n′ sin σ′
(3.1)
Из точки N на оптическую ось опустим перпендикуляр NK = m . Тогда в соответствии с рисунком имеем sin σ = − sin σ′ =
m m =− , 2 NA m 2 + (∆ − s )
m m = . 2 2 NA′ m + (s ′ − ∆ )
При этом 2 m 2 + ( s′ − ∆ ) sin σ =− . 2 sin σ′ m 2 + (∆ − s )
(3.2)
Из рисунка следует, что ∆ = r − r 2 − m 2 . Вполне очевидно, что lim ∆ = 0 . m→0
Будем считать, что в общем случае отрезки s ≠ 0 и s′ ≠ 0 . Тогда lim sin σ = lim σ = 0 , lim sin σ′ = lim σ′ = 0 .
m→0
m →0
m→0
m →0
При этом из соотношения (3.2) следует, что 5
m 2 + (s ′ − ∆ ) s′ sin σ = − lim = 0. lim 2 m →0 sin σ′ m→0 s0 m 2 + (∆ − s ) 2
Полученный результат позволяет соотношение (3.2) представить в виде: r − s0′ ns0′ = . r − s0 n′s0
(3.3)
Это соотношение легко преобразовать к виду: ⎛ 1 1⎞ ⎛ 1 1⎞ n′⎜⎜ − ⎟⎟ = n⎜⎜ − ⎟⎟ . ⎝ s0′ r ⎠ ⎝ s0 r ⎠
(3.4)
В результате получили формулу, известную под названием формулы Аббе, хотя она была выведена ещё Ньютоном. Формула (3.4) получена в предположении, что луч, выходящий из осевой точки A , пересекает преломляющую поверхность на высоте m → 0 . Такой луч принято называть параксиальным лучом. Вполне очевидно, что при этом формула (3.4) справедлива для любой преломляющей поверхности вращения несферической поверхности, если радиус кривизны в вершине поверхности
r0 ≠ 0 . Если осевая точка предмета расположена на бесконечно большом расстоянии от вершины O преломляющей поверхности, т.е. если s0 = ∞ , то осевая точка изображения A0′ займёт положение, называемое задним фокусом поверхности и обозначаемое через F0′ , а отрезок s0′ , называемый задним фокусным расстоянием f 0′ , в соответствии с формулой (3.4) определится соотношением
f 0′ =
n′r . n′ − n
(3.5)
Вполне очевидно, что при s0′ = ∞ точка A0 займёт положение переднего фокуса
F0 , при этом переднее фокусное расстояние
f0
определится
соотношением
f0 = −
nr . n′ − n
(3.6) 6
Из выражений (3.5) и (3.6) следует, что
f 0′ n′ =− . f0 n
(3.7)
3.2. Оптика виртуальных лучей
Восстановим в вершине O преломляющей поверхности перпендикуляр к оптической оси. На этом перпендикуляре, на произвольном расстоянии от оптической оси, равном h , обозначим точку P . Проведём из точки P в точки
A0 и A0′ линии, которые с оптической осью образуют углы − α и α′ , как показано на рис.3.2, при этом отрезки OA0 и OA0′ соответственно равны − s0 и
s0′ . Перепишем формулу (3.4) в виде:
n ′ n n′ − n . − = s0′ s0 r P
A′ A0
h
−α
α′
C
O
−l
l′
A0′
s0′
− s0 A
Рис.3.2. Построение хода нулевого луча
Умножим левую и правую части этой формулы на h . Тогда в соответствии с рис.3.2 получаем n′tgα′ − ntgα = h
где tgα =
n′ − n , r
(3.8)
h h , tgα′ = . s0 s0′
7
В вычислительной практике тангенсы углов обозначают просто углами. При этом полученное выражение можно представить в виде рекуррентной формулы для i -ой преломляющей поверхности:
ni +1α i +1 − ni α i = hi
ni +1 − ni . ri
(3.9)
Эта формула справедлива для любой преломляющей поверхности, при этом для i + 1 поверхности имеем
hi +1 = hi − αi +1di ,
(3.10)
где d i – расстояние между вершинами i -ой и i + 1 -ой поверхностей. Плоскость, перпендикулярную оптической оси и проходящую через вершину поверхности будем называть главной плоскостью преломляющей поверхности. Линию A0 HA0′ называют первым нулевым лучом. По сути дела правильнее было бы называть этот луч осевым фиктивным [фр. fictive < лат. fictio – вымысел] лучом. В плоскости, перпендикулярной оптической оси и проходящей через точку
A0 , т.е. в плоскости предмета, отложим отрезок A0 A = −l , как показано на рис.3.2. Луч, выходящий из точки A предмета, проходит через центр кривизны преломляющей
поверхности
без
изменения
направления
и
пересекает
плоскость изображения в точке A′ на расстоянии A0′ A′ = l ′ от оптической оси. При этом поперечное увеличение изображения, образованного преломляющей поверхностью, определяется отношением
V0 =
l ′ s0′ − r . = l s0 − r
(3.11)
Сопоставив левую и правую части соответственно выражений (3.3) и (3.11), получаем
V0 = Но
ns0′ . n′s0
(3.12)
s0′ hs0′ α = = . Тогда из выражений (3.11) и (3.12) следует, что s0 hs0 α′
nlα = n′l ′α′ . 8
Вполне
очевидно,
что
это
выражение
справедливо
для
любой
произвольной последовательности преломляющих поверхностей вращения. Записанное в виде:
ni li α i = ni +1li +1α i +1 ,
(3.13)
это выражение называется инвариантом Лагранжа-Гельмгольца. Рассмотрим применение полученных соотношений для решения частных задач. 3.3. Кардинальные точки оптической системы
Оптическую систему из k сферических преломляющих поверхностей принято записывать в виде:
r1 = d1 = r2 = rk −1 = rk =
n1 = n2 = .
d k −1 = nk = nk +1 =
Из формулы (3.9) следует, что
α i +1 =
ni n − ni α i + hi i +1 . ni +1 ni +1ri
(3.14)
Пусть расстояние от вершины первой поверхности до осевой точки предмета равно s1 . Тогда высота h1 = s1α1 . Выбрав произвольно значение угла
α1 (или высоты h1 ) и подставив в формулу (3.14), находим значение угла α 2 : α2 =
n1 n −n α1 + 2 1 s1α1 . n2 n2 r1
Затем находим высоту нулевого луча на главной плоскости второй поверхности:
h2 = h1 − α 2 d1 . Полученные значения угла α 2 и высоты h2 позволяют вычислить значения угла α 3 и высоты h3 . Продолжая подобные вычисления, находим высоту hk на 9
главной плоскости последней в системе поверхности и угол α k +1 . Положение изображения,
образованного
определится расстоянием
рассматриваемой
оптической
системой,
s′ от вершины k -ой поверхности до точки
пересечения нулевого луча с оптической осью, равным
s′ =
hk . α k +1
Из инварианта (3.13) следует, что поперечное увеличение изображения, образованного системой оптических поверхностей, равно
V0 =
lk +1 n1α1 = . l1 nk +1α k +1
Таким образом, при известных значениях радиусов кривизны оптической системы,
расстояний
между
вершинами
поверхностей
и
показателей
преломления разделяемых поверхностями сред расчёт первого нулевого (осевого фиктивного) луча позволяет определить положение изображения и его поперечное увеличение.
H′
1-я поверхность
k-я поверхность
h1 B′
hk
Ok f′
α k +1
F′
s ′F ′
Рис.3.3. Кардинальные точки оптической системы
Если предмет расположен на бесконечно большом расстоянии от оптической системы, то в этом случае угол α1 = 0 . Выбрав при этом любое
значение высоты h1 , в результате расчёта хода нулевого луча находим высоту hk на главной плоскости последней поверхности и последний угол α k +1 , 10
образованный нулевым лучом с осью, как показано на рис.3.3. Точка пересечения луча с осью определяет положение изображения бесконечно удалённой осевой точки и называется задним фокусом F ′ оптической системы. Плоскость, перпендикулярная к оптической оси и проведённая через точку F ′ , называется задней фокальной плоскостью. Положение фокуса F ′ относительно последней поверхности системы определяется задним фокальным отрезком s′F ′ , в соответствии с рис.3.3 равным: s ′F ′ =
hk . α k +1
(3.15)
Плоскость H ′ , нормальная к оптической оси и содержащая точку пересечения падающего луча с продолжением выходящего, называется задней главной плоскостью; точка пересечения главной плоскости с оптической осью (точка B ′ ) называется задней главной точкой. При этом заднее фокусное расстояние, равное расстоянию от задней главной точки до заднего фокуса определяется соотношением: f′=
h1 . α k +1
(3.16)
При некотором положении осевой точки предмета её изображение, образованное оптической системой, расположено на бесконечно большом расстоянии. Эта точка F называется передним фокусом оптической системы, а плоскость, нормальная к оптической оси и проходящая через передний фокус, называется передней фокальной плоскостью. Положение переднего фокуса относительно вершины первой поверхности определяется передним фокальным отрезком s F . Плоскость H , нормальная к оптической оси и содержащая точку пересечения продолжения луча, проходящего через передний фокус F оптической системы, с продолжением выходящего из оптической системы луча при α k +1 = 0 , называется передней главной плоскостью, а точка пересечения передней главной плоскости с оптической осью (точка B ) называется передней главной точкой. Расстояние от передней главной точки до переднего фокуса 11
называется передним фокусным расстоянием. Переднее фокусное расстояние и передний фокальный отрезок можно вычислить в результате расчёта обратного хода нулевого луча. Главные точки B и B ′ и фокусы F и F ′ называются кардинальными точками оптической системы. 3.4. Геометрическое построение изображения и основные оптические формулы H A
P1
l
F
B
H′ P1′ B′
A0′
F′
A0
− l′ −z
−f
P2
P2′
f′
−s
z′
A′
s′
Рис.3.4. Геометрическое построение изображения
Обратимся к рис.3.4, на котором оптическая система представлена главными плоскостями H и H ′ и, соответственно, главными точками B и B ′ , и определено положение фокусов F и F ′ . Кроме того, на рисунке показано некоторое положение предмета l = A0 A . Требуется построить изображение этого предмета. Для этого достаточно построить изображение A′ одной лишь точки A . Опустив из точки A′ перпендикуляр на оптическую ось, получим изображение A0′ A′ всего отрезка A0 A . Чтобы найти изображение точки A , достаточно определить ход двух лучей, исходящих из точки A , и найти точку их пересечения в пространстве изображений. Один луч, исходящий из точки A , направим параллельно оптической оси. При этом выходящий из оптической системы луч должен 12
пройти через задний фокус F ′ и пересечься с лучом падающим в точке P1′ на задней главной плоскости на расстоянии B′P1′ = l от оптической оси. Таким образом, положение луча P1′F ′ определено. Второй луч, исходящий из точки A , направим в передний фокус F оптической системы. Этот луч должен пересечься с выходящим из оптической системы параллельно её оптической оси лучом в точке P2 на передней главной плоскости на расстоянии BP2 = −l ′ от неё. Построенные в пространстве изображений лучи P1′F ′ и P2 A′ пересекаются в точке A′ , которая оптически сопряжена, следовательно, с точкой A . Перпендикуляр A′A0′ , опущенный на оптическую ось из точки A′ , определяет изображение отрезка A0 A . Для получения основных аналитических соотношений, необходимых в практике расчёта оптических систем, обратимся вновь к рис.3.3. На рисунке введены обозначения: l = A0 A , l ′ = A0′ A′ , f = − BF , f ′ = B′F ′ . В оптике принято считать, что свет распространяется слева направо. Для отрезков, лежащих на оптической оси, принято следующее правило знаков: если направление отсчёта отрезка совпадает с направлением движения света (слева направо), отрезок считается положительным, в противном случае – отрицательным. Для отрезков, перпендикулярных к оптической оси, один конец которых лежит на оси, действует следующее правило знаков: если отрезок лежит выше оси, он положителен (например, отрезок A0 A ), в противном случае он считается отрицательным (например, отрезок A0′ A′ ). Для последующего вывода необходимых соотношений введём отрезки на оптической оси, начала которых лежат в точках F и F ′ , а концы – в оптически сопряжённых точках A0 и A0′ соответственно: − z = FA0 и z ′ = F ′A0′ . Из подобия треугольников FA0 A и FBP2 получаем: −
l′ − f . = l −z
(3.17)
Отсюда следует, что поперечное увеличение изображения, образованного оптической системой, равно 13
V0 =
l′ f =− . l z
(3.18)
Из подобия треугольников F ′A0′ A′ и F ′B′P1′ получаем − l ′ z′ = . l f′
(3.19)
В этом случае поперечное увеличение изображения равно V0 =
l′ z′ =− . l f′
(3.20)
Приравнивая правые части соотношений (3.18) и (3.20), получаем формулу Ньютона в виде:
zz ′ = ff ′ .
(3.21)
Заметим, что положение главной точки
B
в оптической системе
определяется отрезком z = − f . При этом в соответствии с формулой Ньютона отрезок z ′ = − f ′ , что соответствует положению главной точки B′ , т.е. задняя главная плоскость является изображением передней главной плоскости и, следовательно, точки P1 и P1′ и P2 и P2′ являются оптически сопряжёнными. Кроме того, как следует из выражений (3.18) и (3.20), при z = − f и z ′ = − f ′ поперечное увеличение в изображении главных плоскостей V0 = 1X . Таким образом, произведение отрезков x и z ′ для оптической системы постоянно и равно произведению её фокусных расстояний. Введём отрезки − s = BA0 и s ′ = B′A0′ . Начало этих отрезков считаем лежащими в точках B и B′ . В соответствии с рисунком имеем z=s− f, z ′ = s ′ − f ′.
⎫ ⎬ ⎭
(3.22)
Подставив эти значения величин z и z ′ в формулу Ньютона, получаем
f ′s + fs′ = ss′ . Поделив это выражение почленно на ss′ , приводим его к виду: f′ f + = 1. s′ s
(3.23)
14
Эту формулу называют формулой отрезков или оптической формулой. Используя равенства (3.22), находим: s′ f ′ + z ′ . = s f +z
(3.24)
Из формулы (3.21) следует, что z′ =
ff ′ . z
Подставив это значение z ′ в выражение (3.24), получаем s′ f ′ z + f f′ = . = s z f +z z
(3.25)
В соответствии с формулой Ньютона имеем: f ′ z′ = . z f
(3.26)
При этом s′ f ′ z ′ = = . s z f′
(3.27)
Умножив эти соотношения на −
f и учитывая соотношения (3.18) и f′
(3.20), получаем V0 = −
f s′ . f′ s
Заметим, что V0 =
(3.28) s ′ hs ′ α = = . При этом s hs α′
l′ f α . =− l f ′ α′
(3.29)
Отсюда следует, что
fαl = − f ′α′l ′ . Применив
(3.30) инвариант
Лагранжа-Гельмгольца
последовательно ко всем поверхностям системы, получаем n1α1l1 = nk +1α k +1lk +1
или 15
в
форме
(3.13)
nαl = n′α′l ′ .
(3.31)
Сопоставив соотношения (3.29) и (3.30), имеем f′ n′ =− . f n
(3.32)
Таким образом, для оптической системы в воздухе, т.е. при n = n′ = 1 , формулы (3.21), (3.23) и (3.29) принимают вид:
zz ′ = − f ′ 2
(3.33)
1 1 1 − = s′ s f ′
(3.34)
nα . n′α′
(3.35)
V0 =
Умножив формулу отрезков (3.34) на h и учитывая, что
h h′ = α, а = α′ , s s′
получаем α ′ − α = hϕ ,
(3.36)
где ϕ – оптическая сила системы поверхностей, при этом ϕ =
16
1 . f′
Глава 4 ОСНОВНЫЕ ПОНЯТИЯ И СООТНОШЕНИЯ ФОТОМЕТРИИ Слово "фотометрия" составлено из двух греческих слов: "фос" (ϕϖζ ) – свет и "метрео" (µετρεω) – измеряю, т.е. в переводе на русский язык, его следует понимать как "световые измерения". В бытовом понимании "свет" – это ощущение, которое возникает у человека под влиянием падающего в его глаз электромагнитного излучения с длинами волн, лежащими в пределах от 380нм до 780нм. В технике под словом "свет" понимают то излучение, которое вызывает зрительное ощущение. Измерение этого излучения и составляет задачу фотометрии. Первой фотометрической работой в истории науки было разделение звёзд по их блеску (по освещённости от этих звёзд) на шесть классов – звёздных величин, выполненное Гиппархом во II веке до Р.Х. В звёздном каталоге Птоломея, приложенном к его "Альмагесту", содержатся оценки звёздных величин свыше 1000 звёзд. Сопоставляя их с современными объективными измерениями освещённости от этих же звёзд, установили, что когда одна звезда имеет звёздную величину на единицу больше, чем другая, то освещённость от первой в 2,5 раза меньше, чем от второй. Постепенное расширение общего интереса к измерениям света можно проследить по литературным памятникам и отметить его у Данте (XIII в.), у Леонардо да Винчи (XV в.) и у Галилея (XVII в.). Начало практического применения некоторых видов световых измерений можно, по-видимому, отнести к концу XVI и началу XVII веков и особенно к XVIII веку, когда были опубликованы книги основоположников фотометрии французского учёного Пьера Бугера (1698–1758) (Bouguer P.Essai d’optique sur la gradation de la lumiere. – Paris, 1729) и немецкого учёного Иоганна Генриха Ламберта (1728–1777) (Lambert J.H. Photometria, sive de mensura et gradibus luminis, colarum et umbrae – Augsburg, 1760). С тех пор методы световых 1
измерений непрерывно совершенствуются, следуя за ускоряющимся темпом технического прогресса, предъявляющего всё более высокие требования к различным видам измерений лучистой энергии. С древнейших времён и до XIX века единственная возможность замечать и оценивать излучение была связана со зрением человека. Естественно поэтому, что все фотометрические законы и соотношения развивались только в связи с воздействием излучения на глаз наблюдателя и что световые измерения могли осуществляться
только
в
пределах
видимого
спектра.
С
появлением
приёмников, чувствительных к ультрафиолетовым и инфракрасным лучам, содержание фотометрии стало расширяться и в настоящее время её можно определить как совокупность методов и теории, охватывающих энергетику процессов
излучения,
распространения
и
превращения
(в
частности,
поглощения) лучистой энергии в любой части электромагнитного спектра. Однако,
чаще
всего
фотометрические
соотношения
применяются
к
ультрафиолетовому, видимому и инфракрасному излучениям, объединяемым в общем понятии оптического излучения. 4.1. Интенсивность
излучения
некогерентного
источника
конечных
размеров в геометрическом приближении Плотность потока энергии электромагнитного поля определяется вектором Умова-Пойнтинга.
G=
c c E×H = EHs , 4π 4π
где E и H – векторы напряжённости электрического и магнитного полей соответственно. Направление вектора Умова-Пойнтинга перпендикулярно векторам E и H и совпадает с направлением распространения электромагнитной волны, а его величина равна энергии, переносимой в единицу времени через единичную площадку, перпендикулярную вектору G . Таким образом, вектор G = vws , где 2
w – плотность энергии, а v – скорость распространения электромагнитных волн. Строго монохроматическое поле, которое можно рассматривать как фурьекомпоненту произвольного поля, создаёт гармонический осциллятор или набор подобных осцилляторов с одинаковой частотой излучения. В оптике обычно имеют дело с источниками, излучающими свет в узком, но конечном диапазоне частот. Такой источник можно рассматривать как набор большого числа гармонических осцилляторов, частоты которых попадают в указанный диапазон. Для вычисления интенсивности света в какой-либо точке P пространства необходимо просуммировать все поля, созданные каждым осциллятором (элементом источника), т.е. E = ∑ En ; n
H = ∑ Hn . n
Так как частоты колебаний в оптическом диапазоне излучения очень велики, непосредственно наблюдать мгновенные значения ни одной из таких быстро осциллирующих величин невозможно. Можно говорить лишь об их значениях, усреднённых за некоторый интервал времени, который велик по сравнению с периодом колебаний. Величина среднего по времени вектора Умова-Пойнтинга служит мерой интенсивности света в некоторой точке P , т.е. I (P ) = G = =
c 4π
∑ n
c c E ×H = 4π 4π
∑
En × H n =
n, m
(4.1)
En × H n + ∑ En × H m . n≠m
Световые колебания, создаваемые различными элементами источника, можно считать независимыми (взаимно некогерентными), причём среднее значение поля равно нулю. Тогда
∑
n ≠m
En × H m = 0 .
3
Поэтому при решении многих оптических задач можно принять, что вторая сумма в выражении (4.1) равна нулю (в этих случаях говорят, что поля некогерентны). Тогда I (P ) = где
c ∑ En × H n = 4π n
Gn – вектор
∑ Gn
,
(4.2)
n
Умова-Пойнтинга,
соответствующий
n -му
элементу
источника. Направление
усреднённого
по
времени
вектора
Умова-Пойнтинга
совпадает с нормалью к геометрическому волновому фронту, а абсолютная его величина равна произведению средней плотности энергии
w на скорость
распространения электромагнитных волн V . Волновой фронт излучения точечного источника в однородной среде имеет сферическую форму. Источники излучения конечного размера принято считать точечными, если их угловые размеры малы, при этом в геометрической оптике источник излучения считается точечным, если его угловой размер стремится к нулю. Свет от источника распространяется, как правило, во все стороны, заполняя всё окружающее пространство. Для анализа пространственного распределения излучаемой источником энергии используют представление о телесном угле.
r
O
Рис.4.1. Телесный угол
4
Телесным углом называется часть пространства, заключённая внутри одной
полости
некоторой
конической
поверхности
(с
замкнутой
направляющей), порождаемой движением прямой линии (образующей), проходящей через неподвижную точку (вершину конической поверхности), как показано на рис.4.1 при этом всякая (не проходящая через вершину) линия, которую
образующая
пересекает
при
своём
движении,
называется
направляющей. Если вершина телесного угла расположена в центре сферы произвольного радиуса r , то коническая поверхность, ограничивающая телесный угол, выражает на сфере часть её поверхности, площадь S которой пропорциональна квадрату радиуса r , т.е. S = ωr 2 . Коэффициент ω является мерой телесного угла. Единицей телесного угла является стерадиан (ср). Телесный угол, равный одному стерадиану, соответствует части поверхности сферы, площадь которой равна площади квадрата со стороной, равной радиусу сферы. Коническая поверхность телесного угла может принимать различные формы. Если это поверхность прямого кругового конуса с плоским углом 2α при вершине, то телесный угол (в стерадианах) ω = 2π(1 − cos α ) = 4π sin 2
α . 2
Если конус телесного угла разворачивается в плоскость, то телесный угол, соответствующий полупространству, оказывается равным 2π ср и, наконец, если площадь S охватывает всю поверхность сферы, то полный телесный угол в каждой точке пространства равен 4π ср. Когда коническая поверхность сжимается около какого-то направления и площадь вырезаемой конусом поверхности сферы становится бесконечно малой, телесный угол также становится бесконечно малым и равным dω =
dS . r2
Пусть δS – элемент поверхности волнового фронта, соответствующего определённой точке поверхности источника излучения. Через поверхность δS проходят конические пучки лучей, исходящих из каждой точки источника. Осевые лучи этих пучков заполняют конус с телесным углом dω , как показано 5
на рис.4.2. Если угол раствора конуса достаточно мал, то можно пренебречь зависимостью проекции вектора Gn от направления и записать выражение (4.2) в виде: I (P ) = ∑ Gn = ∑ I n . n
(4.3)
n
δS
Источник излучения
Конус с телесным углом δω , образованный центральными лучами
Рис.4.2. К выводу закона интенсивности в геометрической оптике для некогерентного источника излучения конечных размеров
Предположим, что число точечных источников (осцилляторов) настолько велико, что их распределение без существенной ошибки можно считать непрерывным. Вклад от каждого точечного источника бесконечно мал, однако, суммарный эффект конечен. В этом случае сумма (интеграл) пропорциональна телесному углу δω , т.е. I (P ) = Lδω ,
а полный (усреднённый по времени) поток энергии δΦ e , проходящий через элемент δS в единицу времени, равен
δΦ e = LδωδS .
(4.4)
Формула (4.4) играет важную роль в фотометрии. 4.2. Оптическое
излучение.
Световой
поток.
эффективные характеристики оптического излучения
6
Энергетические
и
Одним из видов энергии (греч. energeia – действие) является излучение, испускаемое телами естественного и искусственного происхождения. Такие тела называют источниками излучения. Известными каждому естественными источниками излучения являются Солнце, Луна, Земля, планеты и созвездия, небо, облака, полярные сияния. Искусственные источники оптического излучения могут быть тепловыми, люминесцентными и газоразрядными. Сюда же относятся светодиоды и лазеры. Приёмниками излучения можно считать все тела живой и неживой природы, поглощающие излучение. По типу действия излучения различают приёмники тепловые (болометры, термоэлементы, терморезисторы и др.), фотоэлектрические (фотоэлементы, фотоумножители, фотосопротивления), фотографические (фотографические слои). Среди приёмников живой природы, прежде всего, можно назвать глаза (сетчатку глаз) и кожу человека и листья растений.
Приёмники
излучения
обладают
различным
механизмом
преобразования энергии излучения. Исследование этого механизма помогает наиболее эффективно использовать энергию излучения. Как известно, любое материальное тело, имеющее температуру выше нуля абсолютной
шкалы,
излучает
энергию
в
окружающее
пространство.
Следовательно, все тела, с которыми нам приходится иметь дело в жизни, непрерывно обмениваются энергией, так как любой поток излучения переносит энергию от излучающего тела к поглощающему. При тепловом излучении световое излучение обусловлено спонтанными переходами электронов с высоких уровней энергии на более низкие; инфракрасное излучение происходит за счёт изменения колебательного и вращательного движений атомов; при люминесцентном излучении атомы и электроны спонтанно переходят с высоких уровней энергии на более низкие, а возбуждаются электромагнитным полем. В газоразрядном источнике излучение возникает в результате электрического разряда в атмосфере инертных газов, паров металла или их смесей. Принцип действия излучающих полупроводниковых диодов (светодиодов) основан на явлении электролюминесценции при протекании тока 7
в структурах с p − n -переходом. Устройство, генерирующее когерентные электромагнитные волны за счёт вынужденного испускания или вынужденного рассеяния света активной средой, находящейся в оптическом резонаторе, называется лазером. Слово "лазер" представляет собой аббревиатуру слов английского выражения: "Light Amplification by
Stimulated Emission of
Radiation" – усиление света вынужденным излучением. Непрерывный спектр электромагнитного излучения распространяется от γ -лучей с минимальной длиной волны 10−7 мкм, возникающих при распаде
радиоактивных элементов, до длинноволновых радиоизлучений и излучений генераторов переменного тока промышленной частоты с длиной волны 6000км. Средняя
область
спектра
электромагнитного
излучения,
охватывающая
инфракрасное излучение с длиной волн от 1мм до 0,78мкм, видимое излучение – от 0,78мкм до 0,38мкм и ультрафиолетовое излучение с длинами волн от 0,38мкм до 0,01мкм, носит название оптической области спектра. Излучение
этой
Объединение
области
излучений
спектра этих
называется
спектральных
оптическим областей
в
излучением. одну
группу
объясняется как единством принципов возбуждения оптического излучения, так и общностью методов их преобразования и использования. Полная энергия излучения любого спектрального состава, переносимая электромагнитными волнами за единицу времени, значительно превышающую периоды световых колебаний, через какую-либо поверхность, определяет мощность излучения, которую в оптике принято называть потоком излучения или лучистым потоком. Количественной характеристикой излучения является его мощность (поток излучения) Φ e , а качественной характеристикой – его спектральный
состав,
при
Φ e = Φ e (λ ) ,
этом
где
λ – длина
волны
монохроматического излучения. Спектральный состав излучения определяется спектральной плотностью потока излучения, равной ϕeλ =
dΦ eλ . dλ
8
Спектральная
плотность
потока
излучения
ϕeλ
характеризует
распределение энергии в спектре. При заданной (или известной) зависимости ϕeλ от λ полный поток излучения в области спектра от λ1 до λ 2 определяется
очевидным выражением вида: λ2
Φ e = ∫ ϕeλ dλ .
(4.5)
λ1
Спектр излучения называют сплошным, если спектральная плотность потока излучения ϕeλ – непрерывная функция λ , отличная от нуля в широком интервале длин волн. Сплошной спектр имеет, например, свет, излучаемый раскалёнными твёрдыми телами и жидкостями. Спектр излучения называют линейчатым, если ϕeλ практически отлична от 1 нуля лишь в узких дискретных интервалах длин волн λ i ± ∆λ i 2
(∆λ i 0 ) называется амплитудой, а аргумент косинуса (ωt + δ ) – фазой. Величина ν =
ω 1 = называется частотой колебаний и представляет 2π T
собой число колебаний в секунду. При замене величины t на t + T значение функции f (t ) остаётся неизменным. Поэтому величина T называется периодом колебаний. Волновые функции в форме (4.44) называют гармоническими функциями относительно времени. Рассмотрим волновую функцию, которая определяет гармоническую плоскую волну, распространяющуюся в направлении, заданном единичным вектором s . Для этого в выражении (4.44) заменим величину t величиной t−
r ⋅s . При этом получаем V ⎡ ⎛ r ⋅s ⎞ ⎤ A(r , t ) = a cos ⎢ω⎜ t − ⎟+δ . V ⎠ ⎥⎦ ⎣ ⎝
(4.45)
Расстояние, на которое перемещается поверхность волны за время T , равное
одному
периоду
колебаний,
определяет
напряжённости поля в пространстве, равный λ = VT = V
период
изменения
2π . Длина волны λ ω
называется длиной волны, при этом приведённая длина волны λ 0 = cT = nλ . Эта длина волны соответствует распространяющейся в вакууме гармонической волне той же частоты. Легко убедиться, что величина A(r , t ) , определяемая выражением (4.45), не изменится, если величину r ⋅ s заменить на r ⋅ s + λ . Выражение (4.45) можно представить в виде: A(r , t ) = a cos(ωt − k ⋅ r + δ ) ,
(4.46)
где k = ks называется волновым вектором или вектором распространения волны в среде, при этом волновое число k =
ω 2π 2π = =n = nk0 . Под A(r , t ) можно V λ λ0
35
понимать любую из проекций векторов E и H на оси декартовой системы координат. Амплитуда a и начальная фаза δ плоской монохроматической волны не зависят от r и t , т.е. одинаковы во всём пространстве во все моменты времени, а, следовательно, выражение (4.46) определяет однородную волну. Никакие
реальные
монохроматическую
волны
этим
волну
можно
свойством
не
рассматривать
обладают. как
Плоскую
частный
случай
гармонических волн общего вида, определяемых уравнением
A(r , t ) = a(r ) cos[ωt − g (r )] ,
(4.47)
где a > 0 и g – вещественные скалярные функции положения. Поверхности
g (r ) = const
называют поверхностями постоянной фазы или волновыми
поверхностями. В отличие от предыдущего случая поверхности постоянной амплитуды волны, определяемой уравнением (4.47), вообще говоря, не совпадают с поверхностями постоянной фазы. Говорят, что такое уравнение определяет неоднородную волну. Расчёты, связанные с гармоническими волнами, упрощаются, если использовать экспоненциальные функции вместо тригонометрических. При этом уравнение (4.47) можно записать в виде
A(r , t ) = Re {U (r ) exp(− iωt )},
(4.48)
где U (r ) = a(r ) exp[ig (r )], а символ Re означает, что берётся вещественная часть. Заметим, что изучение свойств плоской монохроматической волны важно потому, что любая электромагнитная волна может быть представлена в виде суперпозиции таких простых волн, поскольку сумма любых решений уравнений Максвелла является их решением. Кстати сказать, последнее утверждение в этом замечании позволяет от уравнения (4.48) перейти к уравнению вида:
A(r , t ) = U (r ) exp(− iωt ) .
(4.49)
Отсюда следует, что A(r , t ) = U (r ) exp(− iωt ) , а ∇ 2 A = exp(− iωt )∇ 2U (r ) . При этом уравнение (4.43) принимает вид: ∇ 2U + n 2 k02U = 0 .
(4.50) 36
Полученное уравнение называют уравнением Гельмгольца. Величину U называют комплексной амплитудой волн. В частности, для плоской волны имеем ⎛ r ⋅s ⎞ g (r ) = ω⎜ ⎟ − δ = k (r ⋅ s ) − δ = k ⋅ r − δ ⎝ V ⎠
при этом U (r ) = a exp(ik ⋅ r ) , где a = a0 exp(− iδ ). 4.5.3. Поляризация плоских монохроматических волн
Итак, решение уравнений Максвелла в форме (4.45) даёт бегущую плоскую монохроматическую волну. В бегущей плоской электромагнитной волне вектора E и H в каждой точке пространства и в каждый момент времени образуют с волновым вектором k правую тройку векторов. В этом заключается свойство поперечности электромагнитных волн. Направим ось z системы координат вдоль волнового вектора k . Тогда у векторов E и H могут быть отличны от нуля только проекции на оси x и y . Уравнения Максвелла допускают, в частности, такое решение, при котором у вектора E во всех точках в пространстве и во все моменты времени отлична от нуля только одна проекция, например,
Ex ( z , t ) . Вследствие свойства
поперечности у вектора H отлична от нуля только проекция на ось y , т.е.
H y ( z , t ) . Эти проекции связаны между собой соотношением
ε Ex = µ H y .
Мгновенный "снимок" такой волны, показывающий векторы E и H в разных точках оси z в один момент времени, показан на рис.4.7. В этом случае говорят, что волна имеет линейную, или плоскую, поляризацию. Плоскость, в которой лежит вектор напряжённости электрического поля волны E и волновой вектор k , называют плоскостью поляризации или плоскостью колебаний. Чтобы представить себе изменение электрического и магнитного полей с течением времени, можно считать, что вся система векторов, показанная на рис.4.7, движется как целое вдоль оси z со скоростью c (в вакууме). 37
Излучение обычных источников света не поляризовано. Свет, в котором представлены
все
направления
колебаний
вектора
E
в
плоскости,
перпендикулярной направлению распространения, называется естественным светом. Линейно поляризованный свет получают, пропуская естественный через оптические поляризаторы. Действие этих устройств основано на различных физических принципах. С их помощью можно не только получить линейно поляризованный свет, но и выяснить, имеет ли исследуемое излучение линейную
поляризацию.
Выполняющее
такую
роль
поляризационное
устройство называют анализатором. Интенсивность пропускаемого через анализатор линейно поляризованного света при повороте анализатора изменяется от максимального значения, когда направление поляризации совпадает с направлением пропускания анализатора, и до нуля, когда эти направления перпендикулярны друг другу. В отличие от обычных источников света излучение газового лазера, окна разрядной трубки которого наклонены на некоторый угол к её оптической оси (угол Брюстера), обладает линейной поляризацией. В общем случае вектор E может иметь любые направления в плоскости, перпендикулярной направлению распространения волны. Пусть наряду с волной, поляризованной в плоскости
x0 z , в том же направлении (в
направлении z ) распространяется другая волна той же частоты ω , но поляризованная
в
y0 z .
плоскости
Вследствие
линейности
уравнений
Максвелла такое наложение (или суперпозиция) волн также является решением уравнений.
В
зависимости
от
разности
фаз
складываемых
линейно
поляризованных волн результирующая волна может иметь различную поляризацию. Рассмотрим электрическое поле E ( z , t ) волны, возникающей при сложении двух волн одинаковой частоты с ортогональными направлениями линейной поляризации:
Ex ( z , t ) = E0 x exp[i(kz − ωt )] = a exp(− iϕ1 )exp[i(kz − ωt )], 38
(4.51)
E y ( z , t ) = E0 y exp[i (kz − ωt )] = b exp(− iϕ2 )exp[i (kz − ωt )] .
(4.52)
При одинаковых (или отличающихся на nπ , где n – целое число) фазах ϕ1 и ϕ2 комплексных амплитуд E0 x и E0 y в каждой точке происходит сложение взаимно перпендикулярных колебаний в одной фазе, что даёт колебание в новом направлении. Результирующая волна будет линейно поляризованной. Направление её поляризации зависит от отношения амплитуд a и b , как показано на рис.4.8. Пусть волна, поляризованная в плоскости y 0 z , отстаёт по фазе на волны, поляризованной в плоскости x0 z , т.е. ϕ1 − ϕ2 =
1 от 2π
1 . Если амплитуда 2π
этих волн одинаковы (a = b ) , то вектор E в любой точке z будет вращаться в плоскости x0 y против часовой стрелки, оставаясь неизменным по модулю. Например, в точке z = 0 имеем
Ex (t ) = a cos(ωt + ϕ1 )
(4.53)
1 ⎞ ⎛ E y (t ) = a cos⎜ ωt + ϕ1 − π ⎟ = a sin (ωt + ϕ1 ) . 2 ⎠ ⎝
(4.54)
Такую волну называют поляризованной по кругу или циркулярно поляризованной. Когда при наблюдении навстречу волне вращение вектора E в фиксированной плоскости происходит как в рассмотренном примере при
z = 0 , т.е. против часовой стрелки, то говорят о волне левой круговой поляризации. Правая круговая поляризация соответствует вращению вектора в фиксированной плоскости z = const в направлении по часовой стрелке:
Ex (t ) = a cos(ωt + ϕ1 )
(4.55)
1 ⎞ ⎛ E y (t ) = a cos⎜ ωt + ϕ1 + π ⎟ = −a sin (ωt + ϕ1 ) , 2 ⎠ ⎝
(4.56)
т.е. E y (t ) опережает по фазе волну Ex (t ) на
1 π. 2
На практике для превращения линейно поляризованного света в свет с круговой поляризацией используют анизотропные кристаллические пластинки, 39
в которых две волны с ортогональными направлениями линейной поляризации имеют различные фазовые скорости. Подбором толщины пластинки можно получить на выходе заданную разность фаз этих волн и тем самым требуемое состояние поляризации. При использовании комплексной записи (4.51) и (4.52) для складываемых волн
с
ортогональными
направлениями
линейной
поляризации
результирующая волна имеет линейную поляризацию, если отношение комплексных амплитуд
E0 y
к
E0 x
выражается вещественным числом.
Результирующая волна имеет круговую поляризацию, если отношение комплексных амплитуд определяется мнимым числом, по модулю равным единице. При при
E0 y E0 x
E0 y E0 x
⎛ π⎞ = exp⎜ i ⎟ = i волна будет с правой круговой поляризацией, а ⎝ 2⎠
= −i – с левой. В общем случае при наложении световых колебаний во
взаимно перпендикулярных плоскостях кривая, которую описывает конец вектора E в произвольной точке пространства, является геометрическим местом точек, координаты которых
Ex = a1 cos(τ + ϕ1 )
(4.57)
E y = a 2 cos(τ + ϕ 2 )
(4.58)
Ez = 0 .
(4.59)
Здесь τ = kz − ωt . Для того, чтобы исключить τ из первых двух уравнений (4.57) и (4.58), перепишем их в виде
Ex = cos τ cos ϕ1 − sin τ sin ϕ1 a1 Ey a2
(4.60)
= cos τ cos ϕ2 − sin τ sin ϕ2 .
(4.61)
При этом
40
E Ex sin ϕ2 − y sin ϕ1 = cos τ sin (ϕ2 − ϕ1 ) a1 a2
(4.62)
E Ex cos ϕ2 − y cos ϕ1 = sin τ sin (ϕ2 − ϕ1 ) . a1 a2
(4.63)
Возведя в квадрат левую и правую части этих уравнений и сложив полученные выражения соответствующих частей, имеем 2
2
⎛ Ex ⎞ ⎛ Ex ⎞ E E ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ − 2 x y cos ϕ = sin 2 ϕ , a1 a2 ⎝ a1 ⎠ ⎝ a2 ⎠
(4.64)
где ϕ = ϕ2 − ϕ1 . Выражение (4.64) представляет собой уравнение конического сечения. Известно, что квадратичная форма
Ax 2 + 2 Bxy + Cy 2 = H
будет
эллиптической, если дискриминант формы δ = AC − B 2 > 0 . В рассматриваемом случае соответствующий детерминант равен 1 a12 δ=
−
cos ϕ − a1a2
cos ϕ a1a2 1 a12
(
)
1 sin 2 ϕ 2 = 2 2 1 − cos ϕ = 2 2 ≥ 0 . a1 a2 a1 a2
Таким образом, уравнение (4.64) описывает эллипс, вписываемый в прямоугольник, стороны которого параллельны осям координат x, y и имеют длины 2a1 и 2a2 , как показано на рис.4.9. Положив в уравнении (4.64) величину Ex = a1 , получаем E y = a2 cos ϕ , а при E y = a2 , получаем Ex = a1 cos ϕ , т.е. эллипс касается сторон прямоугольника в точках
(± a1 cos ϕ; ± a2 ) .
(± a1; ± a2 cos ϕ)
и
В этом случае говорят, что волна, описываемая уравнениями
(4.57), (4.58) и (4.59), эллиптически поляризована. В общем случае оси эллипса непараллельны осям 0 x и 0 y . Пусть
0µ
и
0ν – новые оси, направленные по осям эллипса, а
ψ (0 ≤ ψ < π ) – угол между 0 x и направлением главной оси 0µ , как показано на рис.4.10. При этом компоненты Eµ и Eν связаны с Ex и E y соотношениями 41
Eµ = Ex cos ψ + E y sin ψ
⎫⎪ ⎬. ⎪⎭
Eν = − Ex sin ψ + E y cos ψ Если 2a и 2b
(4.65)
(a ≥ b ) – длины
осей эллипса, то уравнение эллипса
относительно осей 0µ и 0ν можно записать в виде: Eµ = a cos(τ + ϕ0 )
⎫ ⎬. ⎭
Eν = mb sin (τ + ϕ0 )
(4.66)
Наличие двух знаков определяет возможность двух направлений вращения электрического (магнитного) вектора, конец которого описывает эллипс. Чтобы определить амплитуды a и b , приравняем в развёрнутом виде правые части уравнений (4.65) и (4.66). При этом, учитывая выражения (4.60) и (4.61), получаем a cos ϕ0 cos τ − a sin ϕ0 sin τ = cos τ(a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ ) −
− sin τ(a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ );
m b cos ϕ0 sin τ m b sin ϕ0 cos τ = cos τ(a2 cos ϕ2 cos ψ − a1 cos ϕ1 sin ψ ) +
+ sin τ(a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ ).
Приравнивая коэффициенты при cos τ и sin τ , получаем
a cos ϕ0 = a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ;
⎫ ⎪ ⎪ ⎬ ⎪ .⎪⎭
a sin ϕ0 = a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ; m b cos ϕ0 = a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ; m b sin ϕ0 = −a1 cos ϕ1 sin ψ + a2 cos ϕ2 cos ψ Возведя,
левые
и
правые
части
этих
(4.67)
уравнений
в
квадрат
и
последовательно складывая полученные части первых и последующих двух уравнений, находим, что a 2 = a12 cos 2 ψ + a22 sin 2 ψ + a1a2 sin 2ψ cos ϕ ; b 2 = a12 sin 2 ψ + a22 cos 2 ψ − a1a2 sin 2ψ cos ϕ , где ϕ = ϕ1 − ϕ2 . Отсюда следует, что a 2 + b 2 = a12 + a22 .
(4.68)
Используя выражения (4.67), легко показать, что 42
(
)
± ab cos 2 ϕ0 + ab sin 2 ϕ0 = ± ab = a1a2 sin ϕ .
(4.69)
Кроме того, b a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ − a1 cos ϕ1 sin ψ + a2 cos ϕ2 cos ψ . = = a a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ
m
Отсюда находим a12 sin 2 ϕ1 sin ψ cos ψ − a1a2 sin ϕ1 sin ϕ2 cos2 ψ + a1a2 sin ϕ1 sin ϕ2 sin 2 ψ − − a22 sin 2 ϕ2 sin ψ cos ψ = = −a12 cos 2 ϕ1 sin ψ cos ψ + a1a2 cos ϕ1 cos ϕ2 cos 2 ψ − a1a2 cos ϕ1 cos ϕ2 sin 2 ψ + + a22 cos 2 ϕ2 sin ψ cos ψ. Преобразовав это выражение, получаем
(a
2 1
)
− a22 sin 2ψ = 2a1a2 cos ϕ cos 2ψ .
Отсюда следует, что tg 2ψ =
2a1a2 cos ϕ . a12 − a22
Обозначим
(4.70)
a2 π = tgα , где 0 ≤ α ≤ . a1 2
При этом уравнение (4.70) можно представить в виде: tg 2ψ =
2tgα 2 sin α cos α cos ϕ = cos ϕ 2 1 − tg α cos 2 α − sin 2 α
или tg 2ψ = tg 2α cos ϕ .
(4.71)
Из выражений (4.68) (4.69) следует, что ±
2ab 2a1a2 2tgα sin = ϕ = sin ϕ = 2 sin α cos α sin ϕ 1 + tg 2α a 2 + b 2 a12 + a22
±
2ab = sin 2α sin ϕ . a 2 + b2
или
Обозначим ±
(4.72)
b = tgχ , a
43
где
π⎞ ⎛ π χ ⎜ − ≤ χ ≤ ⎟ – вспомогательный 4⎠ ⎝ 4
угол,
определяющий
форму
и
ориентацию эллипса колебаний. При этом выражение (4.62) можно переписать в виде: sin 2χ = sin 2α sin ϕ .
(4.73)
Итак, если заданы величины a1 и a2 и разность фаз ϕ , относящиеся к произвольному положению осей, и если 0 ≤ α ≤ a и b и угол ψ
(0 ≤ ψ < π) ,
π , то главные полуоси эллипса 2
который большая ось образует с осью 0 x ,
определяются формулами
a 2 + b 2 = a12 + a22 ;
(4.74а)
tg 2ψ = tg 2α cos ϕ ;
(4.74б)
sin 2χ = sin 2α sin ϕ .
(4.74в)
С другой стороны, если известны длины осей a и b и ориентация эллипса (т.е. заданы a , b и ψ ), то эти формулы позволяют найти амплитуды a1 и a2 и разность фаз ϕ . Существуют оптические устройства, которые позволяют определять эти величины прямым способом. В предельных случаях эллипс поляризации вырождается либо в прямую, либо в окружность. Согласно (4.64) эллипс вырождается в прямую при ϕ = ϕ2 − ϕ1 = mπ , где m = 0, ± 1, ± 2, K . При этом
Ey Ex
= (− 1)
m
a2 . В этом случае a1
имеем линейно поляризованную волну. В том случае, когда эллипс вырождается в окружность, имеем круговую поляризацию волны. Вполне очевидно,
что
условием
этого
является
преобразование
описанного
прямоугольника в квадрат, что эквивалентно выравниванию амплитуд: a1 = a2 = a . Кроме того, при этом один из компонентов вектора E должен равняться нулю, когда другой достигает максимального значения. Последнее условие эквивалентно равенству:
44
π ϕ = ϕ2 − ϕ1 = ±(2m − 1) , где m = 1, 2, 3, K . 2 При соблюдении названных условий уравнение (4.64) принимает вид уравнения окружности: Ex2 + E y2 = a 2 . В случае правой поляризации sin ϕ > 0 . При этом ϕ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; 2
Ex = a cos(τ + ϕ1 ) , π ⎛ ⎞ E y = a cos⎜ τ + ϕ1 + + 2mπ ⎟ = −a sin (τ + a1 ) . 2 ⎝ ⎠ Для левой поляризации sin ϕ < 0 . При этом π ϕ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2 Ex = a cos(τ + ϕ1 ) , π ⎛ ⎞ E y = a cos⎜ τ + ϕ1 + + 2mπ ⎟ = a sin (τ + a1 ) . 2 ⎝ ⎠ Если вместо вещественного представления компонентов вектора E использовать комплексное: Ex = a1 exp[i (τ + ϕ1 )], E y = a2 exp[i (τ + ϕ2 )], то Ey Ex
=
a2 a exp[i (τ + ϕ2 − τ − ϕ1 )] = 2 exp(iϕ) a1 a1
=
a2 i ϕ e . a1
или Ey Ex
Значение этого отношения позволяет сразу же определить характер поляризации: 45
– линейная поляризация электрической волны, если
ϕ = ± mπ , где
m = 1, 2, 3, K ; при этом Ey Ex
= (− 1)
m
a2 ; a1
– правая круговая поляризация электрической волны, если a1 = a2 ,
ϕ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2 Ey
⎡ ⎛π ⎞⎤ ⎛ π⎞ = exp ⎢i⎜ + 2mπ ⎟⎥ = exp⎜ i ⎟ = i ; Ex ⎠⎦ ⎝ 2⎠ ⎣ ⎝2
– левая круговая поляризация электрической волны, если
a1 = a2 ,
π ϕ = − + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2
Ey
⎡⎛ π ⎛ π⎞ ⎞⎤ = exp ⎢i⎜ − + 2mπ ⎟⎥ = exp⎜ − i ⎟ = −i . Ex ⎝ 2⎠ ⎠⎦ ⎣⎝ 2
Можно показать, что в общем случае для правой эллиптической поляризации мнимая часть отношения
Ey Ex
положительна, тогда как для левой
эллиптической поляризации она отрицательна. На рис.4.10 показаны эллипсы поляризации при разных значениях ϕ . Характеристика состояния поляризации с помощью параметров Стокса.
Для характеристики эллипса поляризации необходимы три независимые величины, к которым из уже рассмотренных можно отнести амплитуды a1 и a2 и разность фаз ϕ или малую и большую полуоси эллипса a и b и угол ψ , характеризующий ориентацию эллипса. Для практических целей состояние поляризации удобно характеризовать параметрами, обладающими одинаковой физической размерностью. Такие параметры были введены Стоксом в 1852 году при его исследованиях частично поляризованного света. Параметрами 46
Стокса для плоской монохроматической волны служат следующие четыре величины: s0 = a12 + a22 ,
(4.75а)
s1 = a12 − a22 ,
(4.75б)
s2 = 2a1a2 cos ϕ ,
(4.75в)
s3 = 2a1a2 sin ϕ .
(4.75г)
Лишь три из них независимы, так как справедливо тождество
s02 = s12 + s22 + s32 .
(4.76)
Из выражения (4.75а) следует, что параметр
s0
пропорционален
интенсивности волны. Напомним, что s0 =
⎛ a12 ⎜⎜1 + ⎝
a2 = tgα . Из соотношения (4.75а) имеем a1
a22 ⎞ a12 2 2 ⎟ = a1 1 + tg α = . a12 ⎟⎠ cos2 α
(
)
Полученное соотношение позволяет выражение (4.74в) преобразовать к виду: sin 2χ = 2 cos 2 αtgα sin ϕ = 2 cos 2 α
a1a2 2a a sin ϕ sin ϕ = 1 2 . 2 s0 a1
Учитывая при этом выражение (4.75г), получаем s3 = s0 sin 2χ .
(4.77)
В результате подстановки соотношений (4.75б) и (4.75в) в выражение (4.70) имеем
s2 = s1tg 2ψ .
(4.78)
Подставим соотношения (4.77) и (4.78) в выражение (4.76): s02 = s12 + s12tg 2 2ψ + s02 sin 2 2χ . Отсюда следует, что s1 = s0 cos 2χ cos 2ψ .
(4.79)
При этом выражение (4.78) принимает вид: 47
s2 = s0 cos 2χ sin 2ψ . Таким
образом,
соотношениями эллиптичность
связаны и
характеризующим
s1, s2
параметры с
углом
направление ориентацию
s3
и
достаточно
π⎞ ⎛ π χ ⎜− ≤ χ ≤ ⎟, 4⎠ ⎝ 4
вращения, эллипса.
и
с
простыми
характеризующим
(0 ≤ ψ < π) ,
ψ
углом
Полученные
соотношения,
определяющие параметры s1, s2 и s3 , удобно свести всех вместе: s1 = s0 cos 2χ cos 2ψ ,
(4.80а)
s2 = s0 cos 2χ sin 2ψ ,
(4.80б)
s3 = s0 sin 2χ .
(4.80в)
Полученные
выражения
(4.80)
определяют
возможность
простого
геометрического представления различных состояний поляризации: параметры Стокса s1, s2 и s3 можно рассматривать как декартовы координаты точки P на сфере ∑ радиуса s0 , причём 2χ и 2ψ являются сферическими угловыми координатами этой точки, как показано на рис.4.11. Таким образом, каждому возможному состоянию поляризации плоской монохроматической волны заданной интенсивности (s0 = const ) соответствует одна точка на сфере ∑ и наоборот. Так как знак угла χ определяет направление вращения, то, как следует из выражения (4.80в), правая поляризация представляется точками на поверхности ∑ , лежащими выше экваториальной плоскости (плоскости xy ), а левая поляризация – точками на ∑ , лежащими ниже этой плоскости. Для линейно поляризованного света разность фаз ϕ равна нулю или числу, кратному π . В соответствии с выражением (4.80в) параметр Стокса s3 равен нулю, если χ = mπ , где m = 0, ± 1, ± 2, K . Таким образом, линейная поляризация представляется точками окружности в экваториальной плоскости. Для круговой поляризации a1 = a2 и при правой поляризации угол ϕ =
π , а при левой 2
π поляризации угол ϕ = − . При этом в соответствии с соотношением (4.74в) 2 48
sin 2χ = ±1 . Следовательно, правая круговая поляризация представляется
северным полюсом (s1 = s2 = 0, s3 = s0 ) , а левая круговая поляризация – южным полюсом (s1 = s2 = 0, s3 = − s0 ) . Такое геометрическое представление различных состояний поляризации точками на сфере было предложено Пуанкаре. Оно чрезвычайно полезно в кристаллооптике для определения влияния кристаллических сред на состояние поляризации проходящего через них света. Сфера ∑ называется сферой Пуанкаре. Итак, строго монохроматический свет всегда поляризован, т.е. конец электрического (или магнитного) вектора в каждой точке пространства движется периодически, описывая эллипс, который в особых случаях переходит в круг или прямую линию. В том случае, когда конец вектора движется совершенно нерегулярно и такие световые колебания не имеют никаких преимущественных направлений в плоскости, перпендикулярной к направлению распространения, свет называется неполяризованным. Эти два случая относятся к экстремальным. В общем случае изменение векторов поля не является ни вполне регулярным, ни вполне нерегулярным, при этом можно сказать, что свет частично поляризован. Обычно такой свет получается из неполяризованного при отражении или рассеянии. Рассмотрим квазимонохроматическую световую волну со средней частотой
ν , распространяющуюся в положительном направлении от z . Пусть Ex (t ) и E y (t ) – два взаимно ортогональных компонента электрического вектора в некоторой точке O , перпендикулярные к направлению распространения, при этом Ex (t ) = a1 (t )exp{i[ϕ1 (t ) − 2πν t ]},
E y (t ) = a2 (t )exp{i[ϕ2 (t ) − 2πν t ]}.
⎫ ⎬ ⎭
(4.81)
Если бы свет был монохроматическим, то амплитуды a1 и a2 и начальные фазы ϕ1 и ϕ2 были бы постоянными. Для квазимонохроматической волны эти величины зависят также от времени. Однако, за любой интервал времени, 49
малый по сравнению с временем когерентности, т.е. малый по сравнению с величиной, обратной эффективной спектральной ширине света ∆ν , их изменение относительно невелико. Предположим, что запаздывание компонента E y относительно компонента E x равно ε , что можно осуществить, например, с помощью одного из оптических компонентов, и рассмотрим интенсивность
I (θ, ε ) световых
колебаний в направлении, которое образует угол θ с положительным направлением оси x . Такие колебания можно выделить, пропуская свет через соответствующим образом ориентированный поляризатор. Компонент электрического вектора в рассматриваемом направлении после введения запаздывания ε можно определить выражением вида: E (t ; θ, ε ) = Ex cos θ + E y exp(iε )sin θ .
(4.82)
При этом I (θ, ε ) = E (t ; θ, ε )E * (t ; θ, ε ) =
= J xx cos θ + J yy sin θ + J xy exp(− iε )cos θ sin θ + J yx exp(iε )sin θ cos θ , 2
2
(4.83)
где J xx , J xy , K – элементы матрицы
⎛ Ex Ex* ⎜ J =⎜ * ⎜ E y Ex ⎝
Ex E *y ⎞⎟ ⎛⎜ a12 ⎟=⎜ E y E *y ⎟ ⎜ a1a2 exp(iϕ) ⎠ ⎝
Здесь ϕ = ϕ2 (t ) − ϕ1 (t ) , а скобки
a1a2 exp(− iϕ) ⎞⎟ ⎟. a22 ⎟ ⎠
(4.84)
означают, усреднение по времени.
Матрица когерентности квазимонохроматической волны J представляет собой эрмитову матрицу, диагональные элементы которой вещественны и представляют собой интенсивности E x и E y компонентов электрического вектора, а недиагональные элементы – в общем случае комплексны. Напомним, что матрица называется эрмитовой, если J ij = J *ji
при всех i и j . Элементы
матрицы когерентности заданной волны можно определить с помощью относительно простых экспериментов, суть которых состоит в измерении интенсивности для ряда значений
θ 50
(ориентации поляризатора) и
ε
(запаздывания, обусловленного применяемым компенсатором) и последующем решении соответствующих уравнений, полученных из выражения (4.83). Пусть
{θ, ε}
обозначает результаты измерений, соответствующие определённой паре
значений θ, ε . Удобно использовать следующие их значения:
{0 , 0}, {45 , 0}, {90 , 0}, {135 , 0}, ⎧⎨45 , π2 ⎫⎬, ⎧⎨135 , π2 ⎫⎬ . o
o
o
o
⎩
o
⎭ ⎩
o
⎭
Из выражения (4.83) следует, что элементы матрицы когерентности выражаются через интенсивности, полученные в результате измерений при шести приведённых значения пар θ, ε в виде:
( ) = I ( 90 , 0 ), 1 1 ⎡ ⎛ π ⎞⎤ π⎞ ⎛ = [I ( 45 , 0 ) − I (135 , 0 )] + i ⎢ I ⎜ 45 , ⎟ − I ⎜135 , ⎟⎥ , 2 2 2 2
J xx = I 0o , 0 , J yy J xy J yx
o
o
o
o
o
⎠⎦ ⎠ ⎝ ⎣ ⎝ 1 1 ⎡ ⎛ π ⎞⎤ π⎞ ⎛ = I 45o , 0 − I 135o , 0 − i ⎢ I ⎜ 45o , ⎟ − I ⎜135o , ⎟⎥ . 2 2 ⎣ ⎝ 2⎠ ⎝ 2 ⎠⎦
[(
)]
) (
⎫ ⎪ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪ ⎪⎭
(4.85)
Из равенств (4.85) видим, что для определения J xx , J xy и вещественной части J xy (или J yx ) необходим лишь поляризатор. Для определения мнимой части J xy (или J yx ) требуется также согласно двум последним соотношениям (4.85) компенсатор, который вносил бы разность фаз в четверть периода между компонентами
Ex
и
Ey
электрического вектора. В качестве такого
компенсатора можно применить, например, четвертьволновую пластинку. Итак, для характеристики квазимонохроматической плоской волны, вообще говоря, необходимы четыре вещественные величины, например,
J xx , J xy , вещественная и мнимая части J xy (или J yx ). В своих исследованиях частично поляризованного света Стокс ввёл несколько отличное представление с четырьмя параметрами, тесно связанными с рассмотренными. Параметрами Стокса общего вида являются следующие четыре величины:
51
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
s0 = a12 + a22 , s1 = a12 − a22 , s2 = 2 a1a2 cos ϕ , s3 = 2 a1a2 sin ϕ ,
(4.86)
где, как и прежде, a1 и a2 – мгновенные значения амплитуд двух взаимно перпендикулярных
компонентов
Ex
и
Ey
электрического
вектора, а
ϕ = ϕ2 − ϕ1 – разность их фаз. Для монохроматического света амплитуды a1 и a2 и разность фаз ϕ не зависят от времени и выражения (4.86) становятся выражениями (4.85). Из выражений (4.86) и (4.84) следует, что параметры Стокса и элементы матрицы когерентности связаны соотношениями: s0 = J xx + J yy ,
(4.87а)
s3 = i (J xy − J yx ) ;
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
1 (s0 + s1 ), 2 1 = (s0 − s1 ), 2 1 = (s2 − is3 ), 2 1 = (s2 + is3 ). 2
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
(4.87б)
s1 = J xx − J yy , s2 = J xy + J yx ,
J xx = J yy J xy J yx
Применив соотношения (4.85) и (4.87а), получаем
( ) ( ) = I (0 , 0 ) − I (90 , 0 ), = I (45 , 0 ) − I (135 , 0 ),
s0 = I 0o , 0 + I 90o , 0 , s1 s2
o
o
o
o
π⎞ π⎞ ⎛ ⎛ s3 = I ⎜135o , ⎟ − I ⎜ 45o , ⎟ . 2⎠ ⎝ 2⎠ ⎝
⎫ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪⎭
52
(4.88)
Из этих соотношений видно, что параметр s0 представляет собой полную интенсивность.
Параметр
s1
равен
разности
интенсивностей
линейно
поляризованного света, прошедшего через поляризаторы, с азимутами θ = 0o и θ = 90o . Так же интерпретируется и параметр s2 , но для азимутов θ = 45o и θ = 135o . И, наконец, параметр s3 равен разности интенсивностей света, прошедшего через прибор, пропускающий колебания с правой круговой поляризацией, и света, прошедшего через прибор, пропускающий колебания с левой круговой поляризацией. Используя соотношения (4.87а), легко убедиться, что при соблюдении условия
s02 = s12 + s22 + s32
справедливо равенство
J xx J yy = J xy J yx , т.е. для
монохроматической плоской волны J xx J yy − J xy J yx = 0 . Для неполяризованной волны (естественный свет) справедливо соотношение s1 = s2 = s3 = 0 . Однако, при этом s0 > 0 . Таким образом, в общем случае имеем s02 ≥ s12 + s22 + s32 . Можно показать, что любую квазимонохроматическую световую волну можно рассматривать как сумму полностью неполяризованной м полностью поляризованной волн, не зависящих друг от друга, и что такое представление единственно. Обозначим четыре параметра Стокса s0 , s1 , s 2 , s3 одним символом s . Тогда, очевидно, для волны, характеризующейся параметром s , требуемое представление запишется в виде
s = s (1) + s (2 ) ,
(4.89)
где s (1) = s12 + s22 + s32 , s1 , s2 , s3 ,
(4.89а)
а s (2 ) = s0 − s12 + s22 + s32 , 0, 0, 0 .
(4.89б)
Параметр s (1) соответствует поляризованной, а s (2 ) – неполяризованной части волны. Следовательно, с помощью параметров Стокса степень поляризации исследуемой волны можно определить отношением
53
P=
I поляр I полн
=
s12 + s22 + s32 . s0
(4.90)
При этом форма и ориентация эллипса поляризации, связанного с поляризованной частью волны, в соответствии с соотношениями (4.77) и (4.89а), определяется выражением s3
sin 2χ =
s12 + s22 + s32
,
(4.91)
1 π где − π < χ ≤ . Угол ψ (0 ≤ ψ < π) между большой осью эллипса и осью 0 x 4 4 определяется в соответствии с выражениями (4.78) и (4.89а) соотношением tg 2ψ =
s2 . s1
Итак, параметры Стокса, как и матрица когерентности, служат полезным инструментом
для
систематического
анализа
состояния
поляризации
квазимонохроматической волны. 4.5.4. Отражение и преломление плоской волны на границе раздела двух однородных изотропных сред
Полное электромагнитное поле, включающее падающую, отражённую и преломлённую волны, должно удовлетворять определённым граничным условиям, которые могут быть получены предельным переходом из уравнений Максвелла. Уравнения электромагнитного поля можно применить к каждой среде
с
учётом
значений
электрических
и
магнитных
параметров,
характеризующих эту среду. Любая оптическая система представляет собой систему поверхностей раздела двух сред с различными свойствами, характеризуемыми величинами ε и
µ . Полная теория должна быть в состоянии описывать явления,
происходящие на границе раздела двух сред. Математически это означает, что необходимо иметь систему, граничных условий, которые связывали бы на границе раздела двух сред два решения уравнений электромагнитного поля, 54
каждое из которых справедливо в отдельности по одну сторону от границы раздела. Выведем соотношения, описывающие переход электромагнитного поля через такую поверхность раздела. Граничные условия на поверхностях раздела
Заменим поверхность раздела сред T тонким переходным слоем, внутри которого
ε
и
µ
быстро,
но
непрерывно
меняются
от
значений,
характеризующих среду стороны поверхности, до их значений с другой её стороны. Внутри этого слоя построим цилиндр, ограниченный с боков частоколом нормалей к поверхности T в пределах малых площадок δS1 и δS2 , параллельных поверхности T и служащих основаниями цилиндра с каждой её стороны, как показано на рис.4.12. Поскольку во всём цилиндре вектор B и его производные непрерывны, мы можем применить теорему ОстроградскогоГаусса к интервалу от divB , взятому по объёму цилиндра. Тогда согласно уравнению (4.4) получим
∫ divB dV = ∫ B ⋅ n dS = 0 .
V
(4.92)
S
Здесь n – единичный вектор внешней нормали. Заметим, что второй интеграл берётся по всей поверхности цилиндра. Так как площадки dS1 и dS2 предполагаются малыми, можно считать, что на них вектор B принимает постоянные значения B1 и B2 . Тогда выражение (4.92) можно заменить следующим: B1 ⋅ n1δS1 + B2 ⋅ n2 δS 2 + вклад от стенок = 0 .
(4.93)
Если высота цилиндра dh стремится к нулю, то необходимый слой переходит в поверхность, в вклад от стенок цилиндра исчезает при условии, что отсутствует поверхностный поток магнитной индукции. Такой поток никогда не наблюдается и, следовательно, в пределе
(B1 ⋅ n1 + B2 ⋅ n2 )δS = 0 ,
(4.94)
где δS – площадь пересечения рассматриваемого цилиндра с поверхностью T . 55
Если n12 – единичный вектор нормали, направленный из первой среды во вторую, то n12 = −n1 = n2 . При этом из соотношения (4.94) следует, что n12 (B2 − B1 ) = 0 ,
(4.95)
т.е. нормальная составляющая вектора магнитной индукции непрерывна на поверхности раздела. Подобным образом можно рассмотреть электрическое смещение D , но в этом случае при наличии зарядов появится дополнительный член. Аналогично выражению (4.92) из соотношения (4.3) следует
∫ divD dV = ∫ D ⋅ n dS = 4π∫ ρdV .
V
S
(4.96)
V
При слиянии площадок δS1 и δS2 объёмная плотность зарядов ρ ρ , определяемую соотношением переходит в поверхностную плотность заряда ~ ρdS . lim ∫ ρdV = ∫ ~
δh → 0
V
S
Аналогично объёмная плотность тока j переходит в поверхностную ~ плотность тока j : ~
jdV = ∫ j dS . δh → 0 ∫ lim
V
S
Если площадку δS и высоту δh выбрать достаточно малыми, то из выражения (4.96) получаем D1 ⋅ n1δS1 + D2 ⋅ n2 δS 2 + вклад от стенок = 4π~ ρ δS . Вклад от стенок стремится к нулю с уменьшением δh и поэтому в пределе при δh → 0 получаем n (D − D ) = 4π~ ρ, 12
2
(4.97)
1
т.е. при наличии на поверхности раздела слоя с поверхностной плотностью заряда ~ ρ нормальная составляющая вектора электрического смещения при переходе через эту поверхность испытывает скачок, равный 4π~ ρ. Исследуем теперь поведение тангенциальных составляющих векторов E и
H . Заменим поверхность резкого раздела сред переходным слоем, а цилиндр, 56
показанный
на рис.4.12, прямоугольной
площадкой, стороны
которой
параллельны и перпендикулярны поверхности T , как показано на рис.4.13. Пусть τ – единичный вектор, перпендикулярный плоскости рассматриваемого прямоугольника. Используя теорему Стокса, из уравнения (4.2) получаем
∫ rotE ⋅ τdS = ∫ E ⋅ dr = − S
L
1 ∂B τdS . c ∫S ∂t
(4.98)
Здесь первый и третий интегралы берутся по площади прямоугольника, а второй – вдоль его границ. Если длины P1Q1 = δl1 и P2 Q2 = δl 2 малы, то на каждой из этих сторон вектор E можно заменить постоянными векторами E1 и E2 . Подобным же образом постоянным значением можно заменить и вектор
∂B . При этом из уравнения (4.108) в соответствии с рис.4.13 находим ∂t E1 ⋅ t1δl1 + E 2 ⋅ t 2 δl 2 + вклад от концов = −
1 ∂B τδlδh , с ∂t
(4.99)
где δl – линейный элемент, по которому прямоугольник пересекается с поверхностью
раздела.
Если
теперь
постепенно
уменьшать
высоту
прямоугольника, то вклад от концов P1P2 и Q1Q2 будет стремиться к нулю. Полагая, что вектор
∂B остаётся конечным, в пределе при δh → 0 получим ∂t
(E1t1 + E2t2 )δl = 0 .
(4.100)
Если t – единичный вектор касательной к поверхности раздела в плоскости прямоугольника, то t1 = −t = − τ × n12 , t2 = t = τ × n12 . При этом из выражения (4.100) следует τ[n12 × (E2 − E1 )] = 0 .
Так как ориентации прямоугольника, а, следовательно, и единичного вектора τ , произвольна, то n12 × (E2 − E1 ) = 0 ,
(4.101)
57
т.е. тангенциальная составляющая электрического вектора непрерывна на поверхности раздела сред. И,
наконец,
рассмотрим
поведение
тангенциальной
составляющей
магнитного вектора. Анализ выполним аналогичным образом. При этом вместо выражения (4.99) получаем H 1 ⋅ t1δl1 + H 2 ⋅ t 2 δl 2 + вклад от концов =
1 ∂D 4π ~ τδlδh + j τδl . с ∂t c
(4.102)
В результате предельного перехода при δh → 0 находим n12 × (H 2 − H1 ) =
4π ~ j. c
(4.103)
Итак, из полученных соотношений следует, что векторы напряжённости электрического и магнитного полей E и H и векторы электрической и магнитной индукции D и B удовлетворяют следующим граничным условиям: 1. Тангенциальные компоненты напряжённости электрического поля
(
)
непрерывны Et1 = Et 2 на границе раздела двух сред, где физические свойства среды, характеризуемые значениями ε и µ , изменяются скачками.
(D
n1
2. Нормальные компоненты вектора электрической индукции непрерывны
)
= Dn2 в отсутствие поверхностных зарядов на границе раздела сред. 3. Тангенциальные компоненты вектора напряжённости магнитного поля
(
)
непрерывны H t1 = H t 2 в отсутствие поверхностных токов на границе раздела.
(B
n1
4. Нормальные компоненты вектора магнитной индукции непрерывны
)
= Bn2 . Для оптических частот большинство сред практически немагнитно и
поэтому B равно H . Применим соотношения, которым удовлетворяют векторы поля на поверхностях, где физические свойства среды претерпевают разрыв, к исследованию распространения плоской волны, падающей на плоскую границу, разделяющую две однородные изотропные среды. Законы отражения и преломления
58
Уравнение, определяющее напряжённость электрического поля E (r , t ) или индукцию магнитного поля B (r , t ) , удобно представить в виде: F (r , t ) = F0 exp(iϕ)exp[− i (ωt − k r )], т.е. переменная часть фазового множителя в выражении, определяющем гармоническую электромагнитную плоскую волны, равна
⎛ r ⋅s ⎞ τ = ωt − k r = ω⎜ t − ⎟, V ⎠ ⎝ где s – единичный вектор направления распространения волны; V – скорость (фазовая) распространения волны. Если на границу раздела двух однородных сред с разными оптическими свойствами падает плоская волна, то естественно предположить, что она разделится на две волны: проходящую во вторую среду и отражённую.
59
Глава 5 СВЕТОТЕХНИКА ОПТИЧЕСКИХ СИСТЕМ 5.1 . Световая трубка Пусть P (ξ, η) – произвольная точка на некоторой изучающей поверхности
S , отнесённая к какой-либо криволинейной системе координат на этой поверхности. При этом световой поток (усреднённый по времени), изучаемый площадкой
dS
S
поверхности
в телесный угол
dω в направлении,
определяемом полярными углами (α, β ) , равен d 2Φ = LdωdS cos ε ,
(5.1)
где L – фотометрическая яркость излучения площадки dS в точке (ξ, η) в направлении
(α, β ) ,
т.е. в общем случае L = L(ξ, η; α, β ) ; фотометрическая
яркость излучения, определяемая по физическому воздействию, может отличаться от субъективного ощущения яркости, поскольку глаз человека обладает разной чувствительностью к излучению различных длин волн; ε – угол между направлением (α, β ) и нормалью к элементу поверхности, как показано на рис.5.1. Множитель cos ε в выражении (5.1) определяет тот факт, что физический смысл имеет не сам элемент поверхности dS , а его проекция на плоскость, перпендикулярную к направлению (α, β ) .
(α, β) Нормаль к dS
ε
P(ξ, η) dS Рис.5.1. Угол между направлением (α, β ) и нормалью к элементу поверхности
3
Пусть сечение телесного угла dω наклонной плоскостью образует площадку dSν на некотором расстоянии R от площадки dS вдоль оси телесного угла dω под углом εν к ней, как показано на рис.5.2. При этом d 2Φ = L
dSν cos εν dS cos ε = Ldων dSν cos εν . R2 N
O
dων
ε
(5.2) Nν
εν
dS
Oν dS ν
dω R
Рис.5.2. Сечение телесного угла dω наклонной плоскостью
С другой стороны, световой поток, проходящий через площадку dSν , равен
d 2Φ ν = Lν dων dSν cos εν .
(5.3)
В общем случае d 2Φ ν = τd 2Φ , где τ – коэффициент пропускания среды, разделяющей площадки dS и dSν . Поскольку в рассматриваемом случае нас интересует лишь соотношения геометрических величин, среду будем считать абсолютно прозрачной, что эквивалентно равенству τ = 1. При этом из сопоставления выражений (5.2) и (5.3) следует, что L = Lν . Полученное равенство позволяет интерпретировать величину L не только как яркость излучающей поверхности, но и как яркость излучения в плоском сечении светового пучка. Совокупность геометрических лучей, заполняющих телесный угол dω , образует гомоцентрический пучок лучей, исходящих из точки излучающего элемента,
опирающийся
на
освещаемый
элемент.
Совокупность
геометрических лучей, проходящих через две произвольно расположенные площадки (диафрагмы), размеры которых значительно меньше расстояния 4
между ними, образует совокупность геометрических пучков лучей, называемую физическим пучком, при этом поверхность, ограничивающую поперечные размеры физического пучка, принято называть световой трубкой. Из сопоставления выражений (5.1) и (5.2) следует, что dωdS cos ε = dων dSν cos εν .
(5.4)
Величину d 2G = dωdS cos ε называют геометрическим фактором пучка световых лучей. Инвариантность геометрического фактора d 2G относительно площадок dS и dSν физического пучка, определяемая выражением (5.4), означает,
что
он
является
мерой
множества
геометрических
лучей,
составляющих физический пучок, не зависящей от того, какая из площадок является
излучающей.
Вполне
очевидно,
что
геометрический
фактор
элементарного физического пучка, ограниченного площадками dS и dSν , не зависит от выбора расстояния R между ними, а, следовательно, не зависит от выбора расстояния R (при τ = 1) и величина светового потока, проходящего через площадки dS и dSν , контуры которых образуют контуры световой трубки. При этом яркость излучения в каждом сечении плоскостью телесного угла остаётся неизменной. Поэтому яркость Lν = L можно считать яркостью элементарного физического пучка. Понятие яркости пучка лучей, введённое в трудах академика Владимира Александровича Фока, Андрея Александровича Гершуна, Сергея Осиповича Майзеля и других, оказалось весьма удобным при исследовании объёмных источников излучения или рассеивающих излучение сред, например, неба, где исходное, и вполне естественное, определение яркости, строго говоря, вообще теряет смысл. 5.2. Инвариант Штраубеля
Пусть через некоторую элементарную площадку dSν1 в пределах телесного угла dων1 под углом εν1 к нормали к площадке dSν1 проходит некоторый поток излучения. Будем считать, что площадка dSν , образованная сечением телесного угла dων1 плоскостью, расположена на поверхности dSν , разделяющей среды, 5
показатели преломления которых равны nν = nν1 и nν′ = nν 2 . Ось телесного угла
dων , вершина которого расположена в точке в пределах площадки dSν , образует с нормалью к последней угол εν , а после преломления на границе раздела двух сред – угол ε′ν , как показано на рис.5.3. В соответствии с законом преломления nν sin εν = nν′ sin ε′ν .
Возведя в квадрат обе части этого равенства и дифференцируя, получаем nν2 sin εν cos εν dεν = nν′2 sin ε′ν cos ε′ν dε′ν .
− ε ν1
(5.5)
Oν1 dων1
dS ν1
nν = nν1
− εν
dων
dSν Sν Oν nν′ = nν 2
dω′ν − ε′ν
dSν 2
dων 2 Oν 2
− εν2
Рис.5.3. Элементарная площадка dSν через, которую проходит поток излучения
Построим элементарный телесный угол dων , ограничив его четырьмя гранями пирамиды (частный случай конической поверхности), а именно: двумя меридиональными плоскостями XOM и XON , образующими элементарный двугранный угол dϕ , и двумя плоскостями, проходящими через центр O сферы радиуса R и через элементы дуг малых кругов на поверхности сферы, как 6
показано на рис.5.4. Если элементарную площадку, вырезанную на поверхности сферы, принять в виду малости длин элементарных дуг меридиональных сечений, равных Rdεν , за прямоугольник, то площадь этого элемента поверхности определяется произведением основания прямоугольника, длина которого равна R sin εν dϕ , на его высоту, равную Rdεν . При этом элементарный телесный угол dων , равный отношению dων =
dS , определится выражением R2
dS R sin εν dϕRdεν = = sin εν dεν dϕ . R2 R2
(5.6)
После преломления пучка лучей на границе раздела двух сред телесный угол dω′ν определится аналогичным выражением вида: dω′ν = sin ε′ν dε′ν dϕ ,
(5.7)
где dϕ′ равен углу dϕ , так как согласно первой части формулировки закона преломления луч падающий, луч преломлённый и нормаль к поверхности раздела двух сред в точке падения луча лежат в одной плоскости. x dϕ
X
Rdεν dS
R sin εν
εν O Y
dων
Z
z
ϕ
dϕ
N M
y
Рис.5.4. Элементарный телесный угол dων , ограниченный четырьмя гранями пирамиды (частный случай конической поверхности)
Сопоставив выражения (5.6) и (5.7) с выражением (5.5), получаем 7
nν2 cos εν dων = nν′2 cos ε′ν dω′ν .
(5.8)
Полученная формула определяет взаимосвязь телесных углов до, и после преломления световой трубки на поверхности раздела двух сред. Умножив обе части выражения (5.8) на величину dSν , получаем
nν2 dων dSν cos εν = nν′2 dω′ν dSν cos ε′ν .
(5.9)
Учитывая свойство световой трубки, определяемое выражением (5.4), при
nν = nν1 и nν′ = nν 2 имеем nν2 dων dSν cos εν = nν21dων1dSν1 cos εν1 ; nν′2dω′ν dSν′ cos ε′ν = nν22 dων 2 dSν 2 cos εν 2 ,
где, по сути дела, dSν′ = dSν . Учитывая выражение (5.9), получаем nν21dων1dSν1 cos εν1 = nν2 dων dSν cos εν =
(5.10)
= nν′2 dω′ν dSν′ cos ε′ν = nν22 dων 2 dSν 2 cos εν 2 .
Величину n 2 d 2G = n 2 dωdS cos ε называют оптическим фактором. Можно предположить, что площадка dSν1 расположена на преломляющей поверхности
Sν −1 , а
площадка
dSν 2 – на
поверхности
Sν +1 .
Обобщая
соотношение (5.10) на произвольное число преломляющих поверхностей, получаем
n 2 d 2G = const .
(5.11)
Это соотношение определяет основной инвариант для световой трубки: произведение квадрата показателя преломления, проекции элементарной площадки, контур которой определяет контур световой трубки, на плоскость, перпендикулярную оси трубки, и элементарного телесного угла с вершиной в точке этой площадки остаётся инвариантным для элементарной световой трубки, претерпевающей преломления на каком угодно числе преломляющих поверхностей: n12 dω1dS1 cos ε1 = K = nν2 dων dSν cos εν = K = n 2p dω p dS p cos ε p = d 2 J . (5.12)
8
Эта формула была строго доказана в 1902 году Штраубелем и называется теоремой, или инвариантом, Штраубеля. При абсолютной прозрачности сред, разделяемых преломляющими поверхностями, в соответствии с законом сохранения энергии световой поток, проходящий через световую трубку, претерпевающую какое угодно число преломлений, в соответствии с выражением (5.3) равен d 2Φ = L1dω1dS1 cos ε1 = K = Lν dων dSν cos εν = K = L p dω p dS p cos ε p .
Разделив эти равенства почленно на инвариант Штраубеля, получаем Lp L1 Lν = K = = K = = L0 , n12 nν2 n 2p
где L0 – так называемая редуцированная (или приведённая к вакууму) яркость. В соответствии с рис.5.3 имеем dων =
dSν1 cos εν1 dS cos ε ; dω′ν = ν 2 2 ν 2 , 2 Rν1 Rν 2
где Rν1 и Rν 2 – расстояния от осевой точки Oν площадки dSν до осевых точек
Oν1 и Oν 2 площадок dSν1 и dSν 2 соответственно. Эти соотношения позволяют выражение (5.9) представить в виде: nν2 dSν dSν1 cos εν cos εν1 nν′2 dSν dSν 2 cos ε′ν cos εν 2 = . Rν21 Rν22
(5.13)
Пусть в выражении (5.13) углы εν = εν1 = ε′ν = εν 2 = 0 , а площадки dSν , dSν1 и dSν 2 световых трубок имеют круглую форму. При этом площадь этих элементарных площадок равна dSν1 = π(dlν1 ) ; dSν 2 = π(dlν 2 ) ; dSν = π(dmν ) , 2
2
2
где dlν1 , dlν 2 , dmν – радиусы соответствующих площадок. Обозначим dmν dmν = dσν1 ; = dσ ν 2 . Rν1 Rν 2 Эти соотношения и принятые обозначения позволяют выражение (5.13) представить в виде:
9
2 2 2 2 nν2 (dlν1 ) (dσν1 ) = nν′2 (dlν 2 ) (dσν 2 ) .
Применив
полученное
выражение
к
последовательности
из
p
преломляющих поверхностей, в соответствии с инвариантом Штраубеля получаем n1dσ1dl1 = n2 dσ 2 dl2 = K = nν dσν dlν = K = n p dσ p dl p .
(5.14)
Для оптически сопряжённых отрезков, т.е. в том случае, когда отрезок
dlν +1
является изображением отрезка
dlν , это выражение называется
инвариантом Лагранжа-Гельмгольца и записывается в виде
nαl = n′α′l ′ , где
l,
(5.15)
l ′ – оптически
сопряжённые
малые
отрезки,
расположенные
перпендикулярно оптической оси; α , α′ – малые углы, образованные лучами светового пучка с оптической осью в пространстве предметов и изображений соответственно. Отношение малых отрезков определяет величину поперечного увеличения: V=
l ′ nα . = l n′α′
(5.16)
Из малой величины поперечных размеров световой трубки следует, что инвариант Лагранжа-Гельмгольца справедлив для малых отрезов l и l ′ и для лучей, образующих малые углы α и α′ с осью световой трубки, т.е. в параксиальной (от греч. para′ – возле, мимо, вне и лат. axis – ось) области. Инвариант Лагранжа-Гельмгольца является одним из основных соотношений параксиальной оптики. 5.3. Ограничение световых пучков лучей в оптической системе
Любая оптическая система состоит из элементов, имеющих ограниченные размеры, вследствие чего из всего светового потока, излучаемого каждой изображаемой
точкой
(точнее,
малым
элементом
поверхности),
через
оптическую систему проходит только часть его. Вместе с тем ограничена и величина предмета (угловая или линейная), из каждой точки которого световой 10
поток попадает в оптическую систему. Первое ограничение определяет освещённость изображения, а второе – угловую или линейную величину изображаемого предмета, называемую угловым или линейным полем системы. Входной зрачок
C
Выходной зрачок
B A
− σA
ω
P′
P
Входной люк
− ω′
σ′A′
A′
Выходной люк
Рис.5.5. Ограничение световых пучков лучей в оптической системе.
Оптическая система, как правило, содержит последовательность диафрагм, ограничивающих световые пучки лучей, формирующих изображение. Под диафрагмой будем понимать не только отверстие в непрозрачном экране, но и края линз и зеркал или края их оправ. Будем считать, что диафрагмы имеют круглую форму с центром на оптической оси системы. Найдём параксиальное изображение каждой диафрагмы в пространстве предметов, образованное предшествующей ей оптической системой. Изображение диафрагмы (в частном случае непосредственно диафрагма), которое видно из осевой точки предмета A под наименьшим углом 2σ A , как показано на рис.5.5, определяет
максимальную угловую величину светового пучка лучей, проходящих через оптическую систему, и называется входным зрачком оптической системы. Реальная диафрагма, изображение которой (или сама диафрагма) является входным зрачком, называется апертурной диафрагмой. Изображение входного зрачка, образованное всей системой поверхностей в пространстве изображений, называется выходным зрачком оптической системы. Угол σ A , образованный с оптической осью лучом, выходящим из осевой точки A предмета в край 11
входного зрачка, называется апертурным углом в пространстве предметов или передней
угловой
апертурой.
Соответствующий
угол
σ′A′
называется
апертурным углом в пространстве изображений или задней угловой апертурой. Произведение синуса апертурного угла на показатель преломления среды соответствующего
пространства
(соответственно передней
называется
или задней). Числовая
числовой
апертурой
апертура определяет
предельное разрешение в дифракционной картине изображения двух точек, образованного идеальной оптической системой. Изображение диафрагмы (в частном случае сама диафрагма), которое из центра входного зрачка P видно под наименьшим углом 2ω как показано на рис.5.5, ограничивает величину изображаемого предмета и называется входным люком, при этом угол 2ω называется угловым полем оптической системы в пространстве предметов, а угол ω – углом поля. Реальная диафрагма, изображение которой является входным люком, называется полевой диафрагмой. Изображение входного люка, образованное оптической системой в целом в пространстве изображений, называется выходным люком. Как следует из рисунка, верхний крайний луч наклонного светового пучка, выходящего из точки B в плоскости предмета, проходит через верхние крайние точки входного люка и входного зрачка. Нижний крайний луч наклонного светового пучка, выходящего из точки C в плоскости предмета, проходит через верхнюю крайнюю точку входного люка и нижнюю крайнюю точку входного зрачка, то есть световой пучок полностью перекрывается экраном входного люка. Таким образом, для точек в плоскости предмета в промежутке между точками B и C происходит нарастающее срезание световых пучков от нулевого в точке B до полного в точке C . Такое срезание световых пучков называется виньетированием. Вполне очевидно, что если входной люк расположен в плоскости предмета (полевая диафрагма при этом может быть расположена в плоскости промежуточного или конечного изображения), то виньетирование
световых
пучков
лучей
отсутствует.
Иногда
при
конструировании оптических устройств (при разработке оптических систем) 12
эффект виньетирования применяют для устранения части пучка лучей, недопустимо нарушающих его гомоцентричность. Кроме того, с помощью дополнительных диафрагм можно существенно уменьшить влияние на качество изображения света, рассеянного на торцах линз и поверхностях оправ линз, на стенках корпусов оптических устройств и т.п. Пусть
2 y A – линейное
поле
оптической
системы
в
пространстве
предметов, а 2 y ′A′ – в пространстве изображений. При этом луч, выходящий из внеосевой точки предмета в направлении центра P входного зрачка, образует полевой угол ω , тангенс которого равен tg ω =
где
y , ap − a
a – расстояние от передней главной точки H оптической системы до
осевой точки A предмета ; a P – расстояние от передней главной точки до осевой точки P (центра) входного зрачка. В пространстве изображений имеем аналогичное соотношение вида: tg ω′ =
y′ . a′p′ − a′
Угловое увеличение W изображения, образованного оптической системой, определяется отношением W=
tg ω′ . tg ω
Луч, выходящий из внеосевой точки предмета и проходящий через центр входного зрачка, называется главным лучом. Если апертурная диафрагма расположена в задней фокальной плоскости той части оптической системы, которая предшествует этой диафрагме, то входной зрачок будет находиться в бесконечности и все главные лучи в пространстве предметов будут параллельны оптической оси. Такая оптическая система называется системой с телецентрическим ходом главных лучей в пространстве предметов или телецентрической
со
стороны
предмета.
Если
апертурная
диафрагма
расположена в передней фокальной плоскости той части системы, которая 13
следует за этой диафрагмой, то выходной зрачок будет находиться в бесконечности и все главные лучи в пространстве изображений будут параллельны оптической оси. В этом случае оптическая система называется телецентрической со стороны изображения. Плоскость, в которой расположены оптическая ось и главный луч, называется меридиональной плоскостью. Плоскость, перпендикулярная к меридиональной плоскости по главному лучу (в которой расположен главный луч), называется сагиттальной плоскостью. 5.4. Световой
поток,
проходящий
через
оптическую
систему
от
излучающего элемента поверхности, расположенного на оптической оси перпендикулярно к ней
Элементарный
световой
d 2Φ ,
поток
излучаемый
элементом
dS ,
расположенным на оптической оси перпендикулярно к ней, и проходящий через элементарную площадку dΣ входного зрачка оптической системы в пределах телесного угла
dω , как показано на рис.5.6, определяется
выражением (5.1) в виде:
d 2Φ = Lσ dωdS cos σ ,
(5.17)
где Lσ – яркость излучающего элемента в направлении, образующем угол σ с оптической осью; dω – элементарный телесный угол с вершиной в осевой точке площадки dS ; σ – угол между осью телесного угла dω и оптической осью. dΣ dω − dσ
dS A
−σ
dS ′
dϕ
P K
14
P′
σ′ A′
2
Рис.5.6. Элементарный световой поток d Φ , излучаемый элементом dS
Обозначив отрезок AP = − R , в соответствии с рисунком получаем dω =
dΣ R sin σdϕRdσ = = sin σdσdϕ . R2 R2
(5.18)
При этом d 2Φ = Lσ dS sin σ cos σdσdϕ ,
(5.19)
где dϕ – элементарный двугранный угол между двумя меридиональными (проходящими через оптическую ось) плоскостями, как показано на рис.5.6, и составляющими боковые стенки телесного угла dω . Для определения светового потока
dΦ , излучаемого элементарной
площадкой dS и заполняющего весь входной зрачок оптической системы, проинтегрируем выражение (5.19) по всей площади входного зрачка, т.е. в пределах изменения переменных 0 ≤ ϕ ≤ 2π и при круглой форме зрачка 0 ≤ σ ≤ σ КР где σ К – значение угла σ , соответствующее краю входного зрачка, т.е. апертурный угол осевого пучка лучей в пространстве предметов. Таким образом,
dΦ =
σ К 2π
∫ ∫ LσdS sin σ cos σdσdϕ .
(5.20)
0 0
Задача
определения
потока
dΦ
существенно
упрощается,
если
предположить, что яркость Lσ = L = const , т.е. является величиной постоянной во всех точках излучающего элемента dS и не зависит от угла излучения σ (при этом говорят, что элемент dS излучает по закону Ламберта). При этом условии выражение (5.20) можно переписать в виде: dΦ = LdS
σ К 2π
∫ ∫ sin σ cos σdσdϕ .
(5.21)
0 0
В результате интегрирования выражение (5.21) принимает вид: dΦ = πLdS sin 2 σ .
(5.22)
Этот световой поток проходит сквозь оптическую систему и падает на элементарную площадку dS ′ , которая становится изображением площадки dS , 15
как показано на рис.5.6. Вполне очевидно, что световой поток dΦ′ , падающий на площадку dS ′ , определится аналогичным выражением вида:
dΦ′ = πL′dS ′ sin 2 σ′ ,
(5.23)
где σ′ – апертурный угол осевого пучка лучей в пространстве изображений (или задний апертурный угол оптической системы). Как было показано, L = n 2 L0 ; L′ = n′ 2 L0 , где L0 – редуцированная яркость; n
и
n′ – показатели преломления сред в пространстве предметов и
изображений соответственно. Если принять во внимание тот факт, что в реальной оптической системе неизбежны потери светового потока (поглощение, френелево отражение на поверхностях), учитываемые коэффициентом пропускания τ(τ < 1) , то вместо светового потока dΦ из системы выходит поток dΦ′ = τdΦ , а, следовательно, меньший потока dΦ . При этом dΦ′ = τπL′dS ′ sin 2 σ′ ,
(5.24)
2
⎛ n′ ⎞ где L′ = ⎜ ⎟ L . При n′ = n : L′ = L . ⎝n⎠ Условие синусов Аббе
Учитывая выражение (5.22), получаем dΦ ′ = τπLdS sin 2 σ .
(5.25)
Приравняв правые части выражений (5.24) и (5.25), находим, что n 2 dS sin 2 σ = n′2dS ′ sin 2 σ′ .
(5.26)
Учитывая геометрическое подобие оптически сопряжённых плоскостей фигур, одна из которых является предметом, а другая – его изображением, можно написать 2
dS ′ ⎛ dy ′ ⎞ =⎜ ⎟ , dS ⎜⎝ dy ⎟⎠ где dy и dy′ – линейные отрезки оптически сопряжённых элементов площадок dS и dS ′ . При этом выражение (5.26) можно переписать в виде: 16
n 2 dy 2 sin 2 σ = n′2 dy′2 sin 2 σ′ . Извлекая, квадратный корень из обеих частей этого равенства, получаем инвариант вида:
ndy sin σ = n′dy′ sin σ′ .
(5.27)
Отсюда находим, что n sin σ dy ′ . =V = n′ sin σ′ dy
(5.28)
Из условия V = V0 = const следует так называемое условие синусов Аббе: n sin σ = const . n′ sin σ′
(5.29)
Если в изображении A′ осевой точки предмета A полностью устранена сферическая аберрация, то соблюдение условия (5.29) является необходимым и достаточным условием совершенного изображения элементарного отрезка dy , перпендикулярного оптической оси, а, следовательно, и всей элементарной площадки dS , проходящей через точку A и содержащей отрезок dy . При этом изображение образует сколь угодно широкие пучки лучей, образующих любые углы σ с оптической осью. Пусть расстояние от передней главной плоскости оптической системы до осевой точки предмета равно − a , а от задней главной плоскости до параксиального изображения этой точки равно a′ . При этом линейное увеличение системы равно V0 =
na ′ . При соблюдении условия синусов n′a
справедливо равенство
na′ n sin σ . = n′a n′ sin σ′ Отсюда следует, что
a sin σ = a ′ sin σ′ .
(5.30)
Но a sin σ = m , а a′ sin σ′ = m′ , где m и m′ – расстояния от оптической оси до точек пересечения крайних лучей, образующих углы σ и σ′ с оптической осью, со сферами радиусов
a
и
a′ соответственно. Таким образом, 17
применительно к реальным оптических системам представления о главных плоскостях, справедливые в параксиальной области, для конечного осевого пучка лучей должны быть заменены представлениями о главных сферах, понимая под последними сферы, которые проходят через главные точки оптической системы, а радиусы сфер равны a (передняя главная сфера) и a′ (задняя главная сфера). Заметим, что при a → ∞ при m = a sin σ ≠ 0 угол σ → 0 . При этом расстояние a′ стремится к величине
f ′ , называемой задним фокусным
расстоянием. Как следует из (5.30), при a → ∞ имеем f′=
m . sin σ′
Условие
(5.31) синусов
Аббе
в
этом
случае
определяется
равенством
m = const . sin σ′
Следуя Аббе, назовём пару оптически сопряжённых точек A и A′ на оси оптической системы, для которых отсутствует сферическая аберрация лучей широкого пучка
и, кроме
того,
выполнено
условие
синусов, парой
апланатических точек. 5.5. Освещённость в осевой точке изображения
При анализе свойств световых трубок по умолчанию предполагалось стигматичное отображение каждой точки элементарных площадок, при этом явления дифракции не учитывались. Результаты такого анализа дают практически важное представление об идеальном распределении светового потока в плоскости изображения. При этом освещённость в каждой точке изображения естественным образом определяется отношением элементарного светового потока к элементарной площадке, на которую он падает, т.е. E0′ =
dΦ′ . dS ′
18
Используя формулу (5.24), находим, что освещённость E0′ в осевой точке изображения определяется выражением E0′ = τπL sin 2 σ′ .
(5.32)
2
⎛ n′ ⎞ Но L′ = ⎜ ⎟ L . При этом ⎝n⎠ E0′ = τπL0 A′2 .
(5.33)
Величину A′ = n′ sin σ′ в оптике называют числовой апертурой со стороны изображения или задней числовой апертурой; величину L0 =
1 L называют n2
редуцированной яркостью излучения (пучка лучей). Пусть числовая апертура светового пучка лучей в пространстве предметов (передняя числовая апертура) A = n sin σ . Тогда, учитывая формулу (5.28) при соблюдении условия (5.29)
получаем E0′ =
τπ L A2 , 2 0 V0
(5.34)
где V0 – поперечное увеличение изображения образованного оптической системой.
a′
P′
F ′ σ′ − z′p′
A′ z′
p′ Рис.5.7. Выходной зрачок оптической системы
Пусть радиус выходного зрачка оптической системы равен a′ , а расстояние от центра выходного зрачка до осевой точки изображения PA′ = p′ , как показано на рис.5.7. При этом в соответствии с рисунком имеем
19
sin σ′ = 2
a′ 2 a′ 2 = a′ 2 + p′ 2 p′ 2
1 . a′ 2 1+ 2 p′
Подставив это соотношение в выражение (5.32), получаем πa′2 E0′ = τL 2 p′
1 . a′ 2 1+ 2 p′
(5.35)
У большинства светосильных зеркальных и зеркально-линзовых систем выходной зрачок имеет форму кольца. Пусть R′ – радиус выходного зрачка, а r ′ – радиус экранируемой части зрачка. При этом освещённость в осевой точке
изображения определится очевидным выражением вида:
(
)
E0′ = τπL sin 2 σ′H − sin 2 σ′BH ,
где sin 2 σ′H =
(5.36)
R′2 r ′2 2 ′ σ = ; sin . BH R′2 + p′2 r ′ 2 + p′ 2
Это выражение можно записать в виде
(
)
E0′ ≈ τπL 1 − η2 sin 2 σ′ ,
где σ′ = σ′H ; η =
(5.37)
r′ – коэффициент линейного экранирования зрачка по R′
диаметру. Синус апертурного угла эквивалентной оптической системы, имеющей сплошной выходной зрачок круглой формы и создающей такую же освещённость в осевой точке изображения, равен sin σ′ЭКВ = sin 2 σ′Н − sin 2 σ′ВН .
В соответствии с рис.5.7 имеем ⎛ z′ z′ ′ ⎞ p′ = z′ − z′p′ = f ′⎜⎜ − p ⎟⎟ , ⎝ f′ f′⎠
где f ′ – фокусное расстояние системы. При этом
p′ = f ′(− V0 + V0 ЗР ) ,
(5.38) 20
где V0 = −
z′ – поперечное увеличение изображения предмета, образованного f′
оптической системой, а V0 ЗР = −
z′p′ – поперечное увеличение изображения f′
входного зрачка, образованного оптической системой.
DЗР = 2a – диаметр
Пусть
входного
зрачка,
а
′ = 2a′ – диаметр DЗР
выходного зрачка. При этом
V0 ЗР =
a′ . a
(5.39)
Заметим, что при
p′ ≥ 10a′ с погрешностью, не превышающей 1%,
освещённость в изображении осевой точки определяется выражением
E0′ = τL′
πa ′ 2 . p′2
(5.40)
Подставив в это выражение соотношения (5.38) и (5.39), получаем 2
⎛ 2a ⎞ 1 V02ЗР , E0′ = τπL⎜⎜ ⎟⎟ 2 4 ⎝ f ′ ⎠ (V0 ЗР − V0 ) где
(5.41)
2a DЗР = = 2 A – относительное отверстие оптической системы. f′ f′
Величину
(2A)2
– называют
геометрической
светосилой
оптической
системы, а величину τ(2A) называют физической светосилой системы. 2
Если предмет расположен на весьма большом расстоянии от оптической системы, то величину V0 = −
z′
можно считать достаточно малой, полагая
z′ ≈ 0 . При этом формула (5.41) принимает вид: f′ 2
⎛ 2a ⎞ 1 E0′ = τπL′⎜⎜ ⎟⎟ . 4 ⎝ f′⎠
(5.42)
При однократном увеличении изображения, т.е. при V0 = −1X , формула (5.41) принимает вид:
21
2
V02ЗР ⎛ 2a ⎞ 1 ′ E0 = τπL ⎜⎜ ⎟⎟ . 2 4 ⎝ f ′ ⎠ (1 + V0 ЗР ) Формула Манжена-Чиколева
Рассмотрим важный в технике дальнего освещения (случай освещения прожектором) вопрос об освещённости бесконечно удалённого изображения. Пусть источник света (предмет) расположен вблизи переднего фокуса F оптической системы. В этом случае его изображение окажется расположенным на весьма большом расстоянии p′ от выходного зрачка оптической системы, как показано на рис.5.8, где оптическая система представлена бесконечно тонким компонентом ϕ , а источник света представлен элементом dS = πy 2 , все точки которого обладают одинаковой яркостью и излучают равноярко во всех направлениях. ϕ
Вых.зр.
A
B′
2y
A′ 2 y′
F
p′B′
p′
Рис.5.8. Оптическая система, как бесконечно тонкий компонент ϕ
Освещённость E0′ в точке A′ , расположенной на оптической оси системы, определится формулой (5.32):
E0′ = τπL′ sin 2 σ′ . В рассматриваемом случае с достаточной степенью приближения можно считать, что sin σ′ =
a′ 1 ′ . , где радиус выходного зрачка системы a′ = DЗР p′ 2
22
′ – площадь выходного зрачка оптической системы. При этом Пусть S ЗР имеем E0′ =
′ τπL′S ЗР , 2 p′
(5.43)
′ = πa′2 . где S ЗР Сопоставив полученное соотношение с формулой (4.17): dEn =
dI , можно r2
сделать вывод о том, что рассматриваемая оптическая система с источником излучения dS в отношении светового действия эквивалентна излучателю с осевой силой света ~ ′ , I 0 = L ′S ЗР 2
где яркость
~ ⎛ n′ ⎞ L ′ = τL′ = τ⎜ ⎟ L ; ⎝n⎠
L – яркость источника света. При этом
выражение (5.43) можно представить в виде: E0′ =
I0 . p′ 2
(5.44)
При n′ = n = 1 : ′ . I 0 = τLS ЗР
(5.45)
Полученную формулу, т.е. выражение (5.54), называют формулой Манжена-Чиколева. Как следует из рис.5.8, эта формула справедлива для всех точек на оптической оси в пространстве изображений, расположенных не ближе точки B′ , так как для более близких точек действующей будет не вся световая поверхность выходного зрачка, а только часть её. В соответствии с рис.5.8 имеем D′ 2 y′ = ЗР , p ′ − p ′B′ p ′B′
′ – диаметр выходного зрачка. где DЗР При этом 23
p′B ′ ≥ p′
′ DЗР . ′ + 2 y′ DЗР
Обозначим 2 y = d . При этом 2 y′ =
z′ d. f′
При z′ ≈ p′ − f ′ получаем p′B′ ≥ p′
′ f ′ DЗР . ′ + ( p′ − f ′)d f ′ DЗР
(5.46)
При p′ = ∞ : p′B′(∞ ) ≥ f ′
′ DЗР . d
Формула Манжена-Чиколева может быть применена и в тех случаях, когда выходной зрачок имеет не только форму круга, но и более сложную форму, например, в проекционных системах, когда источник света в виде нитей или спирали лампы накаливания изображается конденсором в плоскость входного зрачка проекционного объектива. Полученные
соотношения
позволяют
весьма
просто
оценить
эффективность применения оптической системы в составе осветительного устройства. Пусть источник излучения имеет площадь dS ИСТ и яркость L . Его сила света I ИСТ в направлении нормали к поверхности будет равна I ИСТ = LdS ИСТ . В соответствии с формулой (5.45) осевая сила света источника в сочетании с оптической системой равна ′ . I 0 = τLS ЗР Отношение
рассматриваемых
величин
силы
света
называется
коэффициентом усиления оптической системы: m=
I0 I ИСТ
=τ
′ S ЗР . dS ИСТ
(5.47)
Коэффициент m определяет "выигрыш в силе света", обеспечиваемый применением оптической системы.
24
′ , а Пусть диаметр выходного зрачка оптической системы равен DЗР 1 1 ′ = πDЗР ′2 , а dSИСТ = πd 2 , диаметр источника излучения равен d . Так как S ЗР 4 4 имеем 2
⎛ D′ ⎞ m = τ⎜ ЗР ⎟ . ⎝ d ⎠
(5.48)
В некоторых системах (например, в прожекторах) коэффициент усиления m может достигать величины 10 000 и даже более. 5.6. Световой
поток,
проходящий
через
оптическую
систему
от
излучающего элемента поверхности, расположенного вне оптической оси
Y B1 ϕ
dS ′
A′
α′0
β1
α′ y′
q′ p′
dΣ′ dr ′ dϕ
A0′
r ′ p′ B2
p′ r ′ cos ϕ
−ω
r ′ sin ϕ
β2
Z
X
Рис.5.9. Определение светового потока, падающего на элементарную площадку dS ′ в плоскости изображения оптической системы
Определим световой поток, падающий на элементарную площадку dS ′ в плоскости
изображения
оптической
системы,
содержащую
точку
A′ ,
расположенную вне оптической оси, как показано на рис.5.9. Предположим при этом, что световой поток, выходящий из системы, заполняет её выходной зрачок, имеющий форму круга, и что яркость излучения в пределах всего пучка лучей остаётся постоянной и равной L′ . 25
Разобьём выходной зрачок системы на элементарные кольца бесконечно близкими концентрическими окружностями. Выделим элемент площади dΣ′ одного из колец, ограниченный окружностями, радиусы которых равны r ′ и r ′ + dr ′ , и углом dϕ между двумя меридиональными плоскостями, одна из которых образует некоторый угол ϕ с осью Z . Площадь этого элемента зрачка равна r ′dr ′dϕ . При этом световой поток, проходящий через элементарную световую трубку, образованную двумя площадками (сечениями) dΣ′ = r ′dr ′dϕ и
dS ′ , равен L′dS ′r ′dr ′dϕ cos 2 (q′, X ) d Φ′ = , q′ 2 2
(5.49)
где q′ – расстояние от элемента dΣ′ кольца с координатами (r ′ sin ϕ; 0; r ′ cos ϕ) до элемента dS ′ с координатами (0; p′; y′) . В соответствии с рис.5.9 имеем cos(q′, X ) =
p′ ; q′2 = p′2 + y′2 + r ′2 − 2r′y′ cos ϕ . q′
(5.50)
Поток dΦ′ , проходящий через элемент изображения dS ′ , находим, выполняя интегрирование по всей площади кругового зрачка радиуса a′ : a′
2π
0
0
dΦ′ = L′p′2dS ′ ∫ r ′dr ′ ∫
( p′
dϕ 2
+ y′2 + r ′2 − 2r ′y′ cos ϕ
)
2
.
Представим это выражение в виде: a′
2π
dϕ . 2 ( a + b cos ϕ ) 0
dΦ′ = L′p′ dS ′ ∫ r ′dr ′ ∫ 2
0
Первое интегрирование выполняем по формулам
dϕ
A sin ϕ
dϕ
∫ (a + b cos ϕ)2 = a + b cos ϕ + B ∫ a + b cos ϕ , где A =
b a и B= 2 ; 2 b −a a − b2 2
⎛ a −b 1 ⎞ dϕ 2 ⎜⎜ = arctg tg ϕ ⎟⎟ ∫ a + b cos ϕ a 2 − b2 + 2 ⎠ a b ⎝ при условии, что a > b . 26
(5.51)
Заметим, что 2π
2π
π
dϕ dϕ dϕ ∫ a + b cos ϕ = ∫ a + b cos ϕ + ∫ a + b cos ϕ = 0 0 π
2π π ⎡ ⎛ a−b 1 ⎞ ⎤ ⎛ a−b 1 ⎞ ⎢arctg ⎜ ⎥ = ⎜ a + b tg 2 ϕ ⎟⎟ + arctg ⎜⎜ a + b tg 2 ϕ ⎟⎟ ⎥ = 2 2 ⎢ a −b ⎣ ⎠π ⎦ ⎠0 ⎝ ⎝ 2 [arctg∞ − arctg 0 + arctg 0 − arctg (− ∞ )] = = 2 2 a −b 2 2π ⎡ π ⎛ π ⎞⎤ = . − − = ⎜ ⎟ ⎥ 2 2 ⎢2 2 2 2 ⎝ ⎠ ⎦ a −b ⎣ a −b
2
2π
sin ϕ = 0 . Тогда Кроме того, A a + b cos ϕ 0
dϕ
2π
a
∫ (a + b cos ϕ)2 = a 2 − b 2
2
a −b
2
=
(a
2πa 2
−b
2
)
3
. 2
При этом выражение (5.51) принимает вид
( p′
a′
dΦ = 2πL′p′ dS ′ ∫ 2
0
2
)
+ r ′2 + y′2 r ′dr ′
[(p′ + r′ + y′ ) − 4 y′ r′ ] 2
2
2 2
2
2
3
.
(5.52)
2
Для выполнения интегрирования в выражении (5.52) введём новую переменную α′ – угол между лучами B1 A′ и B2 A′ , проведёнными из точки A′ к концам диаметра B1B2 элементарного кольца в меридиональной плоскости. Как следует из рис.5.9,
α′ = β1 − β2 , где β1 и β2 – углы с осью Z лучей B1 A′ и B2 A′ . Так как tgβ1 =
p′ p′ , а tgβ2 = , то y′ − r ′ y′ + r ′ −1
2 p′r ′ tgβ1 − tgβ2 y′ + r ′ − y ′ + r ′ ⎛ p′ 2 ⎞ ⎜ ⎟ ; 1 = p′ + tgα′ = = 2 2 2 2 2 2 2 ⎜ ⎟ ′ ′ ′ ′ ′ 1 + tgβ1tgβ2 − + − y′ − r ′ y r p y r ⎝ ⎠
27
(
cos α′ = 1 + tg α′ = = =
( p′ ( p′ ( p′
2
2
2
+ y′ + r ′ 2
+ y′ + r ′ 2
)
−1
2
=
( p′
p′ 2 + y ′ 2 − r ′ 2 + y′ − r ′
2
2
p′ 2 + y ′ 2 − r ′ 2
)
2 2
(
+ y′ + r ′ 2
2
2
2
)
)
2 2
(
)
(
2
2
)
=
− 4 r ′ r ′ + p′ + 4 r ′ r ′ + p′ − 4 y ′ r ′ 2
2
− 4 y′ r ′ 2
2
2
2
2
2
2
=
;
2
2r ′dr ′
− sin αdα = −
=
2
4
p′ 2 + y ′ 2 − r ′ 2
2 2
)
+ 4 p′ r ′ 2
− 4 r ′ p′ + y ′ + r ′ + 4 r ′ + 4 p′ r ′ 2
p′ 2 + y ′ 2 − r ′ 2 2
)
2 2
−
( p′ + y′ + r ′ ) − 4 y′ r ′ 2( p ′ + y ′ + r ′ )2r ′ − 8 y ′ r ′ dr ′ = − ( p′ + y ′ + r ′ ) 2[( p ′ + y ′ + r ′ ) − 4 y ′ r ′ ] ( p′ + y′ + r ′ ) − 4 y′ r ′ + ( p′ + y′ − r ′ )( p′ − y′ + r ′ ) = = −2r ′dr ′ [ ( p′ + y ′ + r ′ ) − 4 y ′ r ′ ] ( p′ + y′ + r ′ )( p′ + y′ + r ′ + p′ + y′ − r ′ )− 4 y′ r ′ − K = −2r ′dr ′ [ ( p′ + y′ + r ′ ) − 4 y′ r ′ ] 2 y ′ ( p′ + y ′ − r ′ ) K− = [(p′ + y′′ + r ′′ ) − 4′ y′ r′′ ] ′ ′ ′ ′ ′ 2( p + y + r )( p + y ) − 2 y ( p + y + r ) = −2r ′dr ′ = [(p′ + y′ + r′ ) − 4 y′ r ′ ] 2
2
2
2 2
2
2
2
2
2
2
2
2
2
2
2
2
2 2
2
2
2
2
2
2 2
2
2
2
2
2
2
3
2
2
2
2
2
2
3
2
2
2
3
2
2
2
2
2
2
2
2
2
2
2
2 2
2
[(p′ + y′ + r ′ ) − 4 y′ r ′ ] 2 2
2
2
2
2 2
2
p′2 + y′2 + r ′2
2
3
2
2
2
= −4 p ′ 2
2
2
2
2
2
2 2
2
2
2
2
2
2 2
2
2
2
2
3
2
2
3
2
2
2
r ′dr ′ . 2
Итак, sin α′dα′ = 4 p′
2
p′ 2 + y ′ 2 + r ′ 2
[(p′ + y′ + r′ ) − 4 y′ r′ ] 2
2
2 2
2
2
3
r ′dr ′ .
(5.53)
2
Сопоставив выражения (5.52) и (5.53), получаем α′
0 1 dΦ′ = πL′dS ′ ∫ sin α′dα′ , 2 0
(5.54)
28
где
α 0 – угол между лучами, проведёнными из точки
A′
плоскости
изображений к концам диаметра в меридиональной плоскости кругового сечения пучка лучей, выходящих из оптической системы и собирающихся в точке A′ . В результате интегрирования в выражении (5.54) получаем 1 1 dΦ′ = πL′dS ′(1 − cos α′0 ) = πL′dS ′ sin 2 α 0 , 2 2
где cos α′0 =
( p′
p ′ 2 + y ′ 2 − a′ 2 2
+ y ′ + a′ 2
) − 4 y ′ a′
2 2
2
2
(5.55)
.
Заметим, что для точки A′ , расположенной на оптической оси системы,
y′ = 0 , а, следовательно, p′ 2 − a′ 2 cos α 0 = 2 . При этом p′ + a ′ 2
1 p ′ 2 + a′ 2 − p′ 2 + a′ 2 a′ 2 dΦ′ = πL′dS ′ = πL′dS ′ 2 = πL′dS ′ sin 2 σ′ , 2 2 2 2 p′ + a′ p′ + a ′ где σ′ – апертурный угол оптической системы в пространстве изображений. В этом случае формула (5.55) естественным образом переходит в формулу (5.23). В реальной оптической системе выходящий световой поток dΦ′ меньше входящего потока dΦ и равен dΦ′ = τdΦ , где τ – коэффициент пропускания оптической системы. 5.7. Освещённость элемента изображения, расположенного вне оптической оси системы
Освещённость в некоторой точке, расположенной вне оптической оси в плоскости изображения, определяется отношением потока dΦ′ к площади элемента изображения dS ′ , содержащего эту точку. В соответствии с формулой (5.55) это отношение равно: 1 E′ = πτL′ sin 2 α′0 . 2
(5.56)
Полагая заднюю апертуру наклонного пучка лучей сравнительно малой, что справедливо для подавляющего большинства применяемых систем, 29
формулу (5.56) можно преобразовать в более удобному виду. Действительно, 1 если величина sin α 0 сравнительно невелика, то можно принять, что 2 1 a′ cos ω′ , sin α′0 ≈ 2 p′A′ где в соответствии с рис.5.9: p′A′ – отрезок, соединяющий центр выходного зрачка p′ с рассматриваемой точкой A′ ; a′ – радиус кругового сечения наклонного пучка лучей, сходящихся в точке A′ , плоскостью выходного зрачка. В соответствии с рисунком p′A′ =
1 a′ p′ . При этом sin α′0 ≈ cos 2 ω′ . 2 p′ cos ω′
Последнее соотношение позволяет выражение (5.56) представить в виде: a′2 E ′ = πτL′ 2 cos 4 ω′ . p′
Положив в формуле (5.32) sin σ′ =
(5.57) a′ , получаем p′
a′ 2 E0′ = πτL′ 2 . p′
(5.58)
Из сопоставления соотношений (5.57) и (5.58) следует, что E ′ = E0′ cos 4 ω′ .
(5.59)
При выводе формулы (5.59) предполагалось, что оптическая система образует безаберрационное изображение предмета и апертурной диафрагмы. В случае реальной оптической системы формулу (5.58) удобно переписать в виде: dΦ ′ a0′2 E0′ = = τπL′ 2 , dS0′ p′
(5.60)
а формулу (5.57) удобно представить в таком виде: E′ =
a′2 dΦ ′ dS 0′ dS 0′ τπL′ 0 2 cos 4 ω′ . = dS 0′ dS ′ dS ′ p′
(5.61)
Из сопоставления формул (5.60) и (5.61) следует, что E′ =
a′ 2 dS 0′ E0′ cos 4 ω′ . 2 a0′ dS ′
(5.62) 30
Вполне очевидно, что аберрации в изображении апертурной диафрагмы, образованном следующей за ней частью оптической системы, определяют неравенство
a′ 2 ≠ 1 , а неравенство a0′2
dS0′ ≠ 1 определяется дисторсией в dS ′
изображении предмета. Назовём произведение рассматриваемых отношений аберрационным коэффициентом Русинова (коэффициентом аберрационного виньетирования) и обозначим его через PУС (ω′) : a′ 2 dS 0′ PУС (ω′) = 2 . a0′ dS ′
(5.63)
При этом формулу (5.62) можно представить в виде:
E ′ = PУС (ω′)E0′ cos 4 ω′ .
(5.64)
31
Глава 6 СТРУКТУРА ИЗОБРАЖЕНИЯ, ОБРАЗОВАННОГО ОПТИЧЕСКОЙ СИСТЕМОЙ, И ОЦЕНКА ЕГО КАЧЕСТВА Распределение освещённости в плоскости изображения определяется выражением
E0 ( x′, y′) = τπL′( x′, y′)sin 2 σ′ cos4 w′ ,
(6.1)
где L′( x′, y′) – распределение яркости излучения в направлении главных лучей, осреднённой в пределах светового пучка лучей; τ – коэффициент пропускания света оптической системой и средами, разделяющими предмет, оптическую систему и плоскость изображений; σ′ – угол, образованный крайним лучом осевого пучка с оптической осью в пространстве изображений; w′ – угол (полевой угол) между главным лучом и оптической осью в пространстве изображений.
n′2 Распределение яркости L′( x′, y′) = 2 L( x, y ) , где L( x, y ) – распределение n яркости излучения поверхностью предмета; n и n′ – показатели преломления сред в пространстве предметов и изображений соответственно. Следовательно,
n′2 2 E0 ( x′, y′) = τπL( x, y ) 2 sin σ′ cos 4 w′ . n
(6.2)
Поперечное увеличение изображения, образованного оптической системой, определяется соотношением вида:
V=
n sin σ , n′ sin σ′
где σ – угол, образованный крайним лучом, исходящим из осевой точки предмета, с оптической осью. При этом выражение (6.2) можно представить в виде:
sin 2 σ E0 ( x′, y′) = τπL( x, y ) 2 cos 4 w′ . V
Пусть, например, sin w′ = 0,1, что соответствует углу w′ ≈ 6° . Тогда
(
)
2
cos4 w′ = 1 − sin 4 w′ = 1 − 2 sin 2 w′ + sin 4 w′ = 0,9801 . Таким образом, при достаточно большом, например, для объективов зрительных труб, угловом поле изображения приближённо можно считать, что
sin 2 σ E0 ( x′, y′) = τπ 2 L( x, y ) V
(6.3)
E0 ( x′, y′) = KL( x, y ) ,
(6.4)
или
sin 2 σ = const . где K = τπ V2 Итак, при сравнительно малом, но достаточно большом, например, для объективов зрительной трубы, угловом поле распределение освещённости на плоскости изображения идеально отображает распределение яркости излучения поверхностью предмета. Важно отметить, что формула (6.1) получена для идеальной оптической системы на основе представлений геометрической оптики. Оптическую систему будем считать геометрически идеальной, если она удовлетворяет следующим условиям, сформулированным Д.К. Максвеллом в 1858 году: – все лучи, вышедшие из точки предмета A( x, y ) и прошедшие через оптическую систему, должны сойтись (пересечься) в точке изображения
A′( x′, y′) ; – каждый элемент плоскости предмета, нормальной к оптической оси и содержащей точку A( x, y ) , должен быть изображён элементом плоскости, нормальной к оптической оси и содержащей точку A′( x′, y′) ; – высота изображения y′ должна быть пропорциональна высоте предмета
y , причём коэффициент пропорциональности должен быть постоянным независимо от местоположения точки A( x, y ) в плоскости предмета.
Отклонения от первого условия определяют поперечные аберрации широких и узких пучков лучей, образующих изображение; отклонения от второго условия определяют кривизну поверхности изображения, а отклонения от третьего условия нарушают подобие изображения предмету и называются дисторсией. Однако, в изображении, образованном геометрически идеальной оптической системой, распределение освещённости не является идеальным отображением яркости излучения поверхностью предмета, поскольку в этом случае каждая точка предмета изображается в виде дифракционного пятна, радиус первого тёмного кольца в котором (радиус кружка или пятна Эри) при круглой форме зрачков определяется формулой
rg′ =
1,22λ . 2n′ sin σ′
Вполне
(6.5)
очевидно,
что
при
прочих
равных
условиях
размер
дифракционного пятна в изображении точки тем меньше, чем меньше длина волны излучения λ . Этим, например, объясняется тот факт, что для повышения эффективности применения планарной технологии производства современной полупроводниковой
электроники
наблюдается
постоянное
стремление
использовать излучение более коротких длин волн. Из соотношения (6.5) следует, что только при λ = 0 безаберрационная оптическая система формирует геометрически идеальное изображение. Если предположить, что величина светового потока, излучаемого точечным источником (точечным предметом), мала, но конечна, то вполне очевидно, что яркость излучения такого источника должна быть бесконечно большой, при этом бесконечно велика, должна быть и освещённость геометрически идеального изображения точки. Освещённость идеализированного изображения точки можно описать с помощью так называемой δ -функции Дирака:
[
(
)]
δ( x′, y′) = lim N 2 exp − N 2 π x′2 + y′2 . N →∞
Представим это выражение в виде:
(6.6)
N2 δ( x′, y′) = lim = N →∞ exp N 2 π x′2 + y′ 2
[ (
= lim
N →∞
)]
1 . 1 1 2 2 2 2 2 2 2 + π x′ + y′ + N π x′ + y′ + K 2 N2
(
)
(
)
Отсюда следует, что при x′ = 0 и y′ = 0 функция δ(0, 0 ) = ∞ . Если x′ ≠ 0 и (или) y′ ≠ 0 , то δ( x′, y′) = 0 . Кроме того,
N ∫ ∫ exp[− N ∫ ∫ δ(x′, y′) dx′dy′ = Nlim →∞
∞
2
−∞
∞
2
)]
(
π x′2 + y′2 dx′dy′ =
−∞
= lim N
∞
2
N →∞
∫ exp(− N
−∞
2
)
(
)
−∞
N 2 πx′2 = u .
Обозначим
∞
πx′ dx′ ∫ exp − N 2 πy′2 dy′. 2
Тогда
2 N 2 πx′dx′ = du
(
2
и,
соответственно,
1
− 1 dx′ = u 2 du . 2N π
При этом получаем ∞
∫ exp(− N
−∞
2
∞
)
)
πx′ dx′ = 2 ∫ exp − N πx′ dx′ = 2
2
0
1 N π
∞
∫ exp(− u )u
−
1 2 du .
0
Известно, что гамма-функция определяется интегралом Эйлера в виде: ∞
Γ(t ) = ∫ exp(− u )u t −1du . 0
Из сопоставления интегралов следует, что t = ∞
∫ exp(− N 0
2
)
∞
(
)
πx′ dx′ = ∫ exp − N 2 πy′2 dy′ = 2
0
1 . Но 2
⎛1⎞ Γ⎜ ⎟ = π . При этом ⎝2⎠
1 . В результате получаем, что N
∞
∫ ∫ δ(x′, y′) dx′dy′ = 1.
−∞
Итак, δ -функция обладает следующими свойствами:
⎧∞, при x′ = x0′ ; y′ = y0′ ; ′ ′ ′ ′ δ( x − x0 , y − y0 ) = ⎨ 0, при x′ ≠ x0′ и (или ) y′ ≠ y0′ ; ⎩ ∞
∫ ∫ δ(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1 .
−∞
Отсюда
следует,
что
если
δ -функция
описывает
распределение
освещённости в идеализированном изображении точки, то световой поток, формирующий это изображение, равен единице. С другой стороны, если яркость излучения точечного источника света равна нулю, то освещённость в изображении точки, а, следовательно, и поток, его формирующий, тоже будут равны нулю. Поэтому освещённость в идеализированном изображении точки определим произведением вида:
E0 ( x′, y′) δ( x′ − x0′ , y′ − y0′ ) . Пусть f ( x′, y′) – любая функция переменных x′ и y′ . Если f ( x′, y′) непрерывна при
x′ = x0′ и y′ = y0′ , то справедливо следующее важное
соотношение ∞
∫ ∫ f (x′, y′)δ(x′ − x0′ , y′ − y0′ ) dx′dy′ = f (x0′ , y0′ ),
−∞
т.е. справедливо соотношение
f ( x′, y′)δ( x′ − x0′ , y′ − y0′ ) = f ( x0′ , y0′ )δ( x′ − x0′ , y′ − y0′ ) .
(6.7)
Свойство δ -функции, определяемое соотношением (6.7), называется фильтрующим свойством δ -функции. Таким образом, выражение
E0 ( x′, y′)δ( x′ − x0′ , y′ − y0′ ) = E0 ( x0′ , y0′ )δ( x′ − x0′ , y′ − y0′ ) . Вполне очевидно, что световой поток, формирующий как реальное изображение точки (с учётом дифракции и аберраций), так и идеализированное, должен быть одним и тем же, равным входящему в оптическую систему с учётом коэффициента пропускания сред оптической системы. Следовательно
∞
∫ ∫ E (x′ − x0′ , y′ − y0′ ) dx′dy′ =
−∞
(6.8)
∞
=
∫ ∫ E0 (x′, y′)δ(x′ − x0′ , y′ − y0′ )dx′dy′ = E0 (x0′ , y0′ ),
−∞
где E0 ( x0′ , y0′ ) – величина освещённости в изображении точки, определяемая формулой (6.1) или формулой (6.3). Функцию D( x′ − x0′ , y′ − y0′ ) , определяемую отношением
D( x′ − x0′ , y′ − y0′ ) =
E ( x′ − x0′ , y′ − y0′ ) , E0 ( x0′ , y0′ )
называют функцией рассеяния точки (ФРТ). При этом из выражения (6.8) находим, что ∞
∫ ∫ D(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1.
(6.9)
−∞
Таким образом, ФРТ можно интерпретировать как изображение точечного источника излучения, в котором распределён поток излучения, равный единице. Заметим, что
E ( x′ − x0′ , y′ − y0′ ) = D( x′ − x0′ , y′ − y0′ )E0 ( x0′ , y0′ ) ,
(6.10)
где E ( x′ − x0′ , y ′ − y0′ ) – распределение освещённости в реальном изображении точки, образованном оптической системой. Если ФРТ постоянна для всех точек плоскости изображения (аберрации практически не изменяются в пределе всей плоскости изображения), то освещённость в рассматриваемой точке с координатами x′, y ′ зависит только от расстояния,
на
котором
она
находится
от
точки
идеализированного
изображения с координатами x0′ , y0′ . Это означает, что оптическая система удовлетворяет условию пространственной инвариантности, т.е. в соответствии с терминологией, принятой в оптике, она обладает изопланатической коррекцией аберрацией или, просто, она изопланатична. В общем случае оптические системы этому условию не удовлетворяют. Однако, плоскость
изображения всегда можно разделить на кольцевые зоны, концентричные осевой точке изображения, в пределах которых условие изопланатичности практически соблюдается, т.е. в пределах которых ФРТ изменяется в допустимых пределах. Поскольку в изображении точки освещённость распределена на малой, но конечной площади, то вполне очевидно, что распределение освещённости в изображении других точек будет влиять на общее распределение освещённости в изображении этих точек. Будем считать излучаемый каждой точкой предмета свет некогерентным, при этом освещённость в каждой точке плоскости изображения равна сумме освещённостей от каждой изображаемой точки. В общем случае изображающая система линейна, если E ( x′, y′) = ∑ ai Ei ( x′, y′) . i
6.1. Оптическая система как фильтр пространственных частот В общем случае влияние оптической системы на структуру образованного ею изображения можно определить с помощью математического оператора, который
показывает,
как
нужно
преобразовать
функцию
E0 ( x0′ , y0′ )
идеализированного изображения, чтобы получить функцию распределения освещённости E ( x′, y ′) в действительном изображении. Такое воздействие оптической
системы,
удовлетворяющей
требованиям
линейности
и
изопланатичности, можно описать с помощью передаточной функции. Передаточная функция должна быть достаточно универсальна, чтобы её можно было применить к системам различного назначения. Другое важное требование, предъявляемое к передаточной функции, состоит в том, чтобы её можно было измерить. Рассмотрим распределение освещённости на плоскости изображения вдоль линии, параллельной, например, оси
x′ . В этом случае
E0 ( x0′ , y0′ ) =
= E0 ( x0′ , y0′ = const ) . Если эту линию совместить с осью x′ , то y0′ = 0 . При этом E0 ( x0′ , y0′ ) = E0 ( x0′ ) и, соответственно,
E ( x′ − x0′ ) = E ( x0′ )Dл ( x′ − x0′ ) ,
(6.11)
где Dл ( x′ − x0′ ) – функция рассеяния линии (ФРЛ), причём
Dл ( x′ − x0′ ) =
∞
∫ D( x′ − x0′ , y′ − y0′ )dy′ .
−∞
Условие нормировки ФРЛ таково, что ∞
∞
−∞
−∞
∫ Dл (x′ − x0′ ) dx′ = ∫ ∫ D(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1.
В случае изопланатической системы
Dл ( x′ − x0′ i ) = Dл (x′ − x0′ j ).
Удобно обозначить x0′ = x′ − ξ′ . При этом ФРЛ можно представить в виде, показанном на рис.6.1.
Dл (ξ′)
ξ′
0 Рис.6.1. Функция рассеяния линии
Обратимся к рис.6.2, на котором распределение освещённости в идеализированном изображении в направлении оси x′ представлено кривой
E0 = E0 ( x0′ ) . Определим освещённость изображения E ( x′) в произвольной точке с координатой x′ . Для этого надо найти сумму ординат, равных
Dл (ξ′)E0 ( x′ − ξ′) при изменении координаты ξ′ (отсчитываемой от точки с координатой x′ ) теоретически от − ∞ до ∞ . При каждом значении координаты
ξ′ соответствующую ординату можно считать принадлежащей ФРЛ в изображении предмета с абсциссой x0′ = x′ − ξ′ и отстоящей от центра этой функции (т.е. от абсциссы x0′ ) на расстоянии, равном ξ′ , как показано на рис.6.2. Таким образом, распределение освещённости в изображении предмета определяется выражением
E ( x′ ) =
∞
∫ Dл (ξ′)E0 (x′ − ξ′)dξ′ .
(6.12)
−∞
E0
E0 ( x0′ )
Dл (ξ′)E0 ( x′ − ξ′) Dл (ξ′)E0 ( x′ = x0′ )
x′ − ξ′
O
ξ′
x′
x′ Рис.6.2. К выводу свёртки функций
Dл (ξ′) и E0 ( x′ − ξ′)
Этот интеграл представляет собой так называемую свёртку функции
E0 ( x0′ ) распределения освещённости вдоль оси x′ в идеализированном изображении предмета, образованного оптической системой, с функцией рассеяния линии Dл (ξ′) . Свёртку функций часто обозначают значком ⊗ . При этом E = Dл ⊗ E0 . В
общем
случае
распределения
освещённости
E0 ( x0′ , y0′ )
в
идеализированном изображении предмета формула (6.12) принимает вид:
E ( x′, y′) =
∞
∫ ∫ D(ξ′, η′)E0 (x′ − ξ′, y′ − η′) dξ′dη′ ,
(6.13)
−∞
где ξ′, η′ – координаты ФРТ. Можно показать, что линейный процесс, определяемый интегралом (6.13), на языке преобразования Фурье записывается в чрезвычайно простой форме, что приводит к интересным и полезным соображениям о действии оптической системы как фильтра пространственных частот.
Уместно напомнить, что формула (6.12), а, соответственно, и формула (6.13), получены в предположении, что вид функции D(ξ′, η′) в пределах рассматриваемых участков изображения не изменяется, т.е. в переделах рассматриваемых
участков
изображения
оптическая
система
обладает
изопланатической коррекций аберраций, при этом каждая точка предмета излучает некогерентный свет. При решении многих задач физики и математики необходимо осуществить разложение периодической функции f ( x ) с периодом, равным p , в ряд по тригонометрическим функциям:
f ( x ) = a0 + a1 sin
2π 2π 2π x + b1 cos x + K + an sin n x+ p p p
n =∞⎛ nx nx ⎞ 2π x + K = a0 + ∑ ⎜⎜ an sin 2π + bn cos 2π ⎟⎟ . + bn cos n p p p⎠ n =1 ⎝
(6.14)
Ряд вида (6.14) называется рядом Фурье, а разложение функции f ( x ) в ряд Фурье составляет задачу гармонического анализа. В приложениях зачастую ограничиваются конечным числом членов и получают при этом приближение функции тригонометрическим многочленом. Легко убедиться, что коэффициенты такого ряда Фурье определяются формулами:
a0 =
an =
bn =
1 p
2 p
2 p
1 p 2
∫ f (x ) dx ,
1 − p 2 1 p 2
∫
1 − p 2 1 p 2
f ( x )sin 2π
nx dx , p
nx ∫ f (x )cos 2π p dx, (n = 1, 2, K).
1 − p 2
Во многих случаях, представляет интерес, когда ряд Фурье сходится в обычном смысле, т.е. поточечно, и каким образом он описывает функцию f ( x ) . На такую постановку вопроса в значительной степени даёт ответ следующая
⎛ 1 1 ⎞ p, p ⎟ так ⎝ 2 2 ⎠
теорема Дирихле. Пусть f ( x ) удовлетворяет в интервале ⎜ − называемым условиям Дирихле:
⎛ 1 1 ⎞ p, p ⎟ можно разбить на конечное число интервалов, в ⎝ 2 2 ⎠
− интервал ⎜ −
которых f ( x ) непрерывна и монотонна; − если x0 является точкой разрыва функции
f ( x ) , то существуют
f ( x0 + 0 ) и f ( x0 − 0 ) . Тогда ряд Фурье функции f ( x ) сходится и имеет место n ⎛ ⎡ nx nx ⎞⎤ lim ⎢a0 + ∑ ⎜⎜ an sin 2π + bn cos 2π ⎟⎟⎥ = n →∞ p p ⎠⎦ n =1 ⎝ ⎣ ⎧ f ( x ), если f ( x ) непрерывна в x; ⎪ = ⎨ f ( x + 0 ) + f ( x − 0 ) в противном случае. ⎪ 2 ⎩
Запишем ряд Фурье в виде:
f ( x ) = a0 + где ω =
n =∞
n =∞
n =1
n =1
∑ an sin nωx + ∑ bn cos nωx ,
2π . p
Представим функцию exp(ix ) в виде степенного ряда
1 2 2 1 3 3 1 4 4 1 i x + i x + i x + K + in xn + K = n! 2! 3! 4! 1 1 1 ⎛ 1 ⎞ ⎛ ⎞ = ⎜1 − x 2 + x 4 − K⎟ + i⎜ x − x 3 + x 5 − K⎟ = cos x + i sin x. 4! 3! 5! ⎝ 2! ⎠ ⎝ ⎠
exp(ix ) = 1 + ix +
Таким образом, exp(ix ) = cos x + i sin x , т.е. получаем известную формулу Эйлера. При этом
f ( x ) = a0 + +
n =∞
n =∞
a
∑ 2ni [exp(inωx ) − exp(− inωx )] +
n =1
b
∑ 2n [exp(inωx ) + exp(− inωx )] =
n =1
= a0 +
где
n =∞
∑
n =1
bn + ian ⎤ ⎡ bn − ian ( ) ( ) exp in x exp in x ω + − ω ⎥⎦, ⎢⎣ 2 2
bn − ian 1 = p 2 =
1 p
1 p 2
1 p 2
∫ f (x )(cos nωx − i sin nωx )dx =
1 − p 2
∫ f (x )exp(− inωx )dx;
1 − p 2
bn + ian 1 = 2 p
При n = 0 :
1 p 2
∫
f ( x )(cos nωx + i sin nωx )dx =
1 − p 2
1 p
1 p
1 p 2
∫ f (x )exp(inωx )dx .
1 − p 2
1 p 2
∫ f (x )dx = a0 .
1 − p 2
Изменив знак величины n , т.е. заменив n на − n , из формулы для получаем формулу для
f (x ) =
bn + ian 2
bn − ian . А тогда 2
n=∞
∑ Cn exp(inωx ),
(6.15)
n = −∞
где Cn =
1 p
1 p 2
∫ f (x )exp(− inωx )dx .
1 − p 2
(6.16)
Пусть N – пространственная частота функций (гармоник), составляющих ряд Фурье, при этом N =
n . Единичное изменение частоты N определим p
разностью
∆N =
ni +1 ni 1 − = . p p p
Тогда
f (x ) =
1 p 2
n =∞
∑ g (N ) exp(i 2πNx )∆N , где g (N ) = ∫ f (x )exp(− i 2πNx )dx .
n = −∞
1 − p 2
Пусть некоторая функция
f ( x ) задана на всей вещественной оси.
Предположим, что нас интересуют её значения в интервале [x0 , x0 + p ]. При этом
функцию
f (x )
на
всей
вещественной
оси
можно
заменить
последовательностью её значений в интервале [x0 , x0 + p ] с периодом, равным
p , т.е. можно заменить функцию f ( x ) соответствующей периодической функцией. Тогда функцию f ( x ) в интервале [x0 , x0 + p ] можно представить рядом Фурье. Вполне очевидно, что в этом случае функция, представленная рядом Фурье, вне интервала [x0 , x0 + p ] не будет совпадать с функцией f ( x ) . Для целого ряда задач было бы полезно иметь выражение, подобное ряду Фурье, представляющее функцию f ( x ) , заданную в промежутке от − ∞ до ∞ . При этом будем считать, что f ( x ) в любом конечном интервале подчиняется ∞
условиям Дирихле и является абсолютно интегрируемой, т.е.
∫ f (x ) dx < ∞ .
−∞
Чтобы распространить полученное выражение на случай непериодических функций, можно устремить период p к бесконечности. Основной интервал тогда становится бесконечно большим, при этом величину
1 можно считать p
бесконечно малым изменением пространственной частоты N , т.е.
1 = dN . p
Тогда суммирование бесконечно большого числа колебаний всех частот от − ∞ до ∞ , определяемое полученным бесконечным рядом, можно представить интегралом ∞
f (x ) =
∫ g (N ) exp(i 2πNx )dN ,
(6.17)
−∞
при этом функция g ( N ) определяется через f ( x ) формулой
g (N ) =
∞
∫ f (x ) exp(− i 2πNx )dx .
(6.18)
−∞
Эти соотношения можно представить в виде:
1 ∞ f (x ) = g (ω) exp(iωx )dω 2π −∫∞
(6.19)
и, соответственно,
g (ω) =
∞
∫ f (x ) exp(− iωx )dx ,
(6.20)
−∞
где ω = 2π
n 1 , dω = 2π при p → ∞ . p p
Выражение (6.19) можно представить в виде:
⎤ 1 ∞⎡ 1 ∞ ( ) ( ) exp f (x ) = f x i x d − ω ω ⎥ exp(iωx )dω = ∫⎢ ∫ 2π −∞ ⎣ 2π −∞ ⎦ 1 ∞~ = ∫ g (ω) exp(iωx ) dω. 2π −∞ При этом
1 ∞ ~ g (ω) = ∫ f (x ) exp(− iωx ) dx . 2π − ∞ Выражение (6.18) определяет прямое преобразование Фурье функции f ( x ) и записывается в виде:
F [ f ( x )] = g ( N ) =
∞
∫ f (x )exp(− i 2πNx )dx ,
(6.21)
−∞
а обратное преобразование Фурье записывается в таком виде:
F
−1
∞
[g (N )] = f (x ) = ∫ g (N ) exp(i 2πNx )dN .
(6.22)
−∞
Это выражение можно рассматривать как представление функции f ( x ) в виде
линейной
комбинации
(т.е.
интеграла)
элементарных
функций
характерного вида exp(i 2πNx ) . Вполне очевидно, что комплексное число g ( N ) представляет собой просто весовой коэффициент, на который следует умножить элементарную функцию частоты N при синтезе искомой функции
f (x ) . Преобразование Фурье функции двух переменных f ( x, y ) определяется формулой вида:
F [ f ( x, y )] = g (N x , N y ) =
=
∞
∫∫
[
(6.23)
]
f ( x, y )exp − i 2π(N x x + N y y ) dxdy,
−∞
при этом обратное преобразование Фурье записывается в виде:
[
]
F −1 g (N x , N y ) = f ( x, y ) = =
∞
[
(6.24)
]
∫ ∫ g (N x , N y )exp i 2π(N x x + N y y ) dN x dN y .
−∞
Заметим,
[
что
]
для
любой
пары
частот
(N x , N y )
функция
exp i 2π(N x x + N y y ) = 1 при i 2π(N x x + N y y ) = i 2πn , где n – целое число. При этом y = −
N Nx n n = xtgα + y0 , где tgα = − x , y0 = . Направление, x+ Ny Ny Ny Ny
перпендикулярное к этой линии, определится очевидным уравнением вида:
Ny π⎞ 1 ⎛ y = xtg ⎜ α + ⎟ + y0 = xtgθ + y0 , где tgθ = − . Отсюда следует, что = 2⎠ tgα N x ⎝
N y = N x tgθ . При этом N x x + N y y = N x x + N x ytgθ =
Nx (x cos θ + y sin θ) . cos θ
Повернём систему координат xoy вокруг начала координат в положение x′oy′ в соответствии с уравнением
⎛ x ⎞ ⎛ cos θ − sin θ ⎞⎛ x′ ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ . y sin θ cos θ ⎝ ⎠ ⎝ ⎠⎝ y ′ ⎠ При этом
[
]
N ⎡ ⎤ exp i 2π(N x x + N y y ) = exp ⎢i 2π x ( x cos θ + y sin θ)⎥ = cos θ ⎣ ⎦ N ⎡ ⎤ = exp ⎢i 2π x x′ cos 2 θ − y ′ sin θ cos θ + x′ sin 2 θ + y ′ sin θ cos θ ⎥ = cos θ ⎣ ⎦ = exp(i 2πNx′),
(
где N =
)
Nx , т.е. N x = N cos θ , а N y = N x tgθ = N sin θ . cos θ
y
x′
1 Ny
θ x
0 1 Nx
~ p
Рис.6.3. Линии равной фазы
Таким образом, точно так же, как одномерное, двумерное преобразование Фурье можно рассматривать как представление функции
[ (
f ( x, y ) в виде
)]
линейной комбинации элементарных функций вида exp i 2π N x x + N y y , при этом каждая элементарная функция в плоскости xoy
"направлена" по
отношению к оси x под углом θ , как показано на рис.6.3. Здесь N x =
Ny =
n , при этом py
N = N x2 + N y2 ; величина угла
соотношением: θ = arctg
Ny
θ
n ; px
определяется
. Пространственный период (т.е. расстояние
Nx
между линиями равной фазы) можно определить очевидным выражением вида:
p 1 ~ p= = = n N
1 N x2
+
N y2
.
Для функции, обладающей осевой симметрией, удобно перейти к полярной системе координат:
x′ = r ′ cos ϕ , y′ = r ′ sin ϕ , при этом r ′ = x′2 + y′2 , tgϕ =
y′ ; x′
N x = ρ cos γ , N y = ρ sin γ , при этом ρ = N x2 + N y2 , tgγ =
Ny Nx
.
Тогда F [ f (r ′, ϕ)] = g (ρ, γ ) , где g (ρ, γ ) =
∞ 2π
∫ ∫ f (r ′, ϕ)exp[− i 2πr ′ρ(cos γ cos ϕ + sin γ sin ϕ)]r ′dr ′dϕ . 0 0
Из
свойства
осевой
симметрии
функции
f (r ′, ϕ)
следует,
f (r ′, ϕ) = f (r ′) . При этом
g (ρ, γ ) =
∞
2π
−∞
0
∫ f (r ′)r ′dr′ ∫ exp[− i 2πr ′ρ cos(ϕ − γ )]dϕ .
Используя тождество
1 2π J 0 (a ) = exp[− ia cos(ϕ − γ )]dϕ , 2π ∫0 где J 0 (a ) – функция Бесселя первого рода нулевого порядка, получаем ∞
g (ρ, γ ) = g (ρ ) = 2π ∫ f (r ′)J 0 (2πr ′ρ)r ′dr ′ . 0
(6.25)
что
Полученное выражение преобразования Фурье, играющее важную роль в решении оптических задач, называется преобразованием Фурье-Бесселя или, иначе, преобразованием Ганкеля. Путём аналогичных рассуждений можно показать, что обратное преобразование Фурье функции g (ρ ) , обладающей осевой симметрией, определяется выражением вида: ∞
f (r ′) = 2π ∫ g (ρ )J 0 (2πr ′ρ )ρdρ .
(6.26)
0
Следовательно, для функций, обладающих осевой симметрией, различие между действиями прямого и обратного преобразования Фурье отсутствует, т.е. преобразование Ганкеля обладает свойством симметрии. Из определения преобразования Фурье вытекает ряд математических следствий, облегчающих нахождение фурье-образа (иначе спектра Фурье или частотного
спектра).
Эти
следствия
принято
формулировать
в
виде
математических теорем. 1. Теорема линейности
F [αf ( x, y ) + β F ( x, y )] = αF [ f ( x, y )] + βF [F ( x, y )]. 2. Теорема подобия
(
)
Если F [ f ( x, y )] = g N x , N y , то F [ f (ax, by )] =
1 ab
⎛ N Ny ⎞ ⎟⎟ . g ⎜⎜ x , a b ⎠ ⎝
Отсюда следует, что "растяжение" координат в пространственной области
( x, y )
приводит к "сжатию" координат в области частот
(N x , N y )
и к
изменению общей амплитуды спектра. 3. Теорема смещения
(
)
Если F [ f ( x, y )] = g N x , N y , то
[
]
F [ f ( x − a, y − b )] = g (N x , N y )exp − i 2π(N x a + N y b ) . т.е. смещение функции в пространственной области вызывает линейный фазовый сдвиг в области частот. 4. Теорема Парсеваля
(
)
Если F [ f ( x, y )] = g N x , N y , то ∞
f ( x, y ) dxdy = 2
∫∫
−∞
∞
∫∫
g (N x , N y ) dN x dN y . 2
−∞
Теорему Парсеваля обычно интерпретируют как закон сохранения. 5. Теорема свёртки
(
)
(
)
Если F [ f ( x, y )] = g N x , N y , а F [F ( x, y )] = G N x , N y , то
⎤ ⎡∞ F ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ = g (N x , N y )G (N x , N y ). ⎦ ⎣−∞ Доказательство
⎡∞ ⎤ F ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ = ⎣−∞ ⎦ ∞
⎡∞ ⎤ = ∫ ∫ ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ exp − i 2π(N x x + N y y ) dxdy = ⎦ −∞ ⎣−∞ =
∞
∫∫
−∞
[
]
⎧∞ ⎫ f (ξ, η)⎨ ∫ ∫ F ( x − ξ, y − η) exp − i 2π(N x x + N y y ) dxdy ⎬dξdη . ⎩−∞ ⎭
[
]
Введём новые переменные q = x − ξ и p = y − η . При этом
[
]
[
] [
]
exp − i 2π(N x x + N y y ) = exp − i 2π(N x ξ + N y η) exp − i 2π(N x q + N y p ) .
Тогда
F [ f ( x, y ) ⊗ F ( x, y )] = =
∞
∫ ∫ f (ξ, η)exp [− i 2π(N x ξ + N y η)]dξdη ×
−∞
×
∞
∫ ∫ F (q, p ) exp [− i 2π(N x q + N y p )]dqdp = g (N x , N y )G (N x , N y ),
−∞
т.е. преобразование Фурье свёртки двух функций полностью эквивалентно более простой операции умножения их образов. Теорема свёртки известна как теорема Бореля. 6. Теорема автокорреляции
(
)
Если F [ f ( x, y )] = g N x , N y , то
⎡∞ ⎤ 2 F ⎢ ∫ ∫ f (ξ, η) f * ( x − ξ, y − η)dξdη⎥ = g (N x , N y ) . ⎣−∞ ⎦ Эту теорему можно рассматривать как частный случай теоремы свёртки. 7. Интегральная теорема Фурье Во всех точках, где функция f ( x, y ) непрерывна,
FF -1 [ f ( x, y )] = F -1F [ f ( x, y )] = f ( x, y ) , т.е. в результате последовательного выполнения прямого и обратного преобразования Фурье некоторой функции f ( x, y ) получается преобразуемая функция за исключением точек разрыва. В каждой точке разрыва функции два последовательных преобразования её дают среднее значение величины f ( x, y ) в окрестности этой точки. Теоремы
преобразования
Фурье
определяют
основные
правила
выполнения преобразований и могут существенно упростить решение задач, связанных с использованием анализа Фурье. В соответствии с теоремой свёртки преобразование Фурье распределения освещённости E ( x′, y′) , определяемого формулой (6.13), равно произведению преобразований
Фурье
ФРТ
D(ξ′, η′) и распределения освещённости
E0 ( x0′ , y0′ ) в идеализированном изображении предмета: e(N x , N y ) = d (N x , N y )e0 (N x , N y ).
(6.27)
Формула (6.27) определяет механизм образования изображения: каждой составляющей
пространственного
спектра
e0 (N x , N y )
распределения
освещённости при идеализированном изображении предмета соответствует
коэффициент d (N x , N y ) , который можно назвать "множителем передачи" или "множителем контраста" оптической системы. Таким образом, функция
d (N x , N y ) , характеризующая состояние коррекции аберраций в изображении,
образованном оптической системой, по сути дела выполняет роль фильтра пространственных частот.
Функция d (N x , N y ) , определяющая то, каким образом каждая частотная
составляющая
передаётся
оптической
системой
с
учётом
дифракции,
остаточных аберраций и ошибок изготовления оптической системы, называется оптической передаточной функцией (ОПФ) системы. ОПФ, являющаяся преобразованием Фурье ФРТ, представляет собой в общем
случае
комплексную
функцию,
которую
можно
записать
в
показательной форме через модуль комплексной функции T ( N ) и аргумент ϕ( N ) :
d (N x , N y ) =
∞
∫ ∫ D(x′, y′)exp[− i 2π(N x x′ + N y y′)]dx′dy′ =
−∞
[
]
= T (N x , N y )exp − iϕ(N x , N y ) .
(6.28)
В случае одномерного распределения освещённости в идеализированном изображении предмета (этот случай чаще всего встречается при измерении ОПФ, когда предмет представляет собой решётку из параллельных штрихов, узкую
щель
и
т.п.)
ОПФ
становится
функцией
одного
аргумента –
пространственной частоты N , например, вдоль оси x′
d (N ) =
∞
∫ Dл ( x′)exp[− i 2πNx′]dx′ .
−∞
Используя формулу Эйлера, получаем
d (N ) =
∞
∞
−∞
−∞
∫ Dл (x′)cos 2πNx′dx′ − i ∫ Dл (x′)sin 2πNx′dx′ =
= C ( N ) − iS ( N ), где
интегралы,
обозначенные
через
C
и
(6.29)
S , называются косинус-
преобразованием и синус-преобразованием функции рассеяния линии. Модуль комплексной функции по определению равен
T (N ) =
[C (N )] 2 + [S (N )] 2 = 2
2
(6.30)
⎤ ⎡∞ ⎤ ⎡∞ = ⎢ ∫ Dл ( x′) cos 2πNx′dx′⎥ + ⎢ ∫ Dл ( x′)sin 2πNx′dx′⎥ , ⎦ ⎣ −∞ ⎦ ⎣ −∞ а аргумент ϕ( N ) может быть определён из соотношений:
sin ϕ( N ) =
S (N ) , T (N )
(6.31)
cos ϕ( N ) =
C (N ) . T (N )
(6.32)
Для лучшего понимания смысла модуля T ( N ) и аргумента ϕ( N ) комплексной ОПФ рассмотрим более подробно, как изображается отдельная частотная составляющая спектра идеализированного изображения предмета оптической системой, имеющей известную функцию рассеяния. Пусть распределение освещённости в идеализированном изображении предмета (или в его частотной составляющей) определяется косинусоидой с постоянной составляющей E0 , как показано на рис.6.4а, при этом
E0 ( x′) = E0 + E1 cos 2πNx′ ,
(6.33)
1 где N – пространственная частота, заметим, что период ~ p= .
N
Пусть Dл (ξ′) – функция рассеяния линии. Тогда ∞
∞ ⎡ E ( x′) = ∫ Dл (ξ′) E0 ( x′ − ξ′)dξ′ = E0 + E1 ⎢cos 2πNx′ ∫ Dл (ξ′) cos 2πNξ′dξ′ + ⎣ −∞ −∞ ∞ ⎤ + sin 2πNx′ ∫ Dл (ξ′)sin 2πNξ′dξ′⎥ = E0 + E1[C ( N ) cos 2πNx′ + ⎦ −∞ + S ( N )sin 2πNx′] = E0 + E1T ( N )[cos ϕ( N ) cos 2πNx′ + sin ϕ( N )sin 2πNx′].
В результате получаем, что
E ( x′) = E0 + E1T ( N ) cos[2πNx′ − ϕ( N )] .
(6.34)
E0 ( x ′ )
a) E1
E0
0 1 ~ p= N
E ( x′)
E1T ( N )
б)
E0
0
∆x′
Рис.6.4. Распределение освещённости в идеализированном
б ) изображениях
Отсюда
следует,
что
полученное
a ) и действительном
распределение
освещённости
в
изображении предмета при косинусоидальном распределении освещённости в его идеализированном изображении остаётся косинусоидальным и той же пространственной частоты. Однако, модуляция, равная отношению амплитуды переменной составляющей распределения освещённости к среднему её значению (т.е. к постоянной составляющей) для полученного распределения освещённости сказывается меньше, чем для исходного, как показано на рис.6.4б. Действительно, для идеализированного изображения имеем
E1 , E0
m=
(6.35)
а при действительном распределении освещённости величина
m′ =
E1 T (N ) , E0
т.е. T ( N ) =
(6.36)
m′ . m
(6.37)
Таким образом, значение модуля ОПФ, т.е. значение T ( N ) , для каждой пространственной частоты равно отношению модуляции распределения освещённости в действительном изображении к модуляции распределения освещённости в идеализированном изображении гармонической составляющей соответствующей частоты и называется коэффициентом передачи модуляции (КПМ)
системы.
Совокупность
значений
КПМ
для
различных
пространственных частот составляет функцию передачи модуляции (ФПМ) или частотно-контрастную характеристику оптической системы. Распределение освещённости в действительном изображении отличается от распределения освещённости в идеализированном изображении ещё и сдвигом косинусоиды на угол ϕ( N ) , определяющим линейное смещение косинусоиды на расстояние ∆x′ =
ϕ( N ) . Совокупность значений сдвига 2πN
(смещения) фазы ϕ( N ) для различных пространственных частот составляет функцию передачи фазы (ФПФ) системы. Как следует из выражений (6.29)– (6.32), если N = 0 , то T (0 ) = 1, а ϕ(0 ) = 0 . Определим контраст идеализированного изображения выражением
k=
E0 ( x′)max − E0 ( x′)min . E0 ( x′)max + E0 ( x′)min
Но E0 ( x′)max = E0 + E1 , а E0 ( x′)min = E0 − E1 . Тогда
k=
E0 + E1 − E0 + E1 E1 = = m. E0 + E1 + E0 − E1 E0
(6.38)
При этом контраст действительного изображения равен
k′ = =
E ( x′)max − E ( x′)min = E ( x′)max + E ( x′)min
E0 + E1T ( N ) − E0 + E1T ( N ) E1 = T ( N ) = mT ( N ) = m′. E0 + E1T ( N ) + E0 − E1T ( N ) E0
Отсюда следует, что
T (N ) =
k ′ m′ = . k m
При k = 1 , т.е. при E1 = E0 , T ( N ) = k ′ = m′ . Итак,
нормированное
распределение
освещённости
в
изображении
точечного предмета, образованном оптической системой, называется функцией рассеяния точки (ФРТ). Другими названиями этой же характеристики являются следующие:
выходной
сигнал
импульсного
типа,
функция
Грина,
дифракционная картина Фраунгофера. ФРТ является одной из двух наиболее полных характеристик, описывающих качество изображения, образованного оптической системой. Распределение освещённости E ( x′, y′) в изображении любого предмета в принципе можно рассчитать как свёрстку распределения освещённости в идеализированном изображении предмета, т.е. E0 ( x′, y′) , и ФРТ. Практически же для любого реального предмета, распределение освещенности, в идеализированном изображении которого непрерывно, подобный расчёт является довольно сложной процедурой. В то же время одиночные светящиеся точки или совокупность таких дискретных точек часто являются предметами для оптических систем, применяемых в астрономии, что придаёт ФРТ не только теоретическое значение, но и определённый практический смысл. Второй из двух наиболее полных характеристик качества изображения является комплексная оптическая передаточная функция (ОПФ), удобная для характеристики качества изображения при непрерывном распределении освещённости в нём. Математически ФРТ и ОПФ взаимозаменяемы, так как каждая из них может быть получены путём Фурье-преобразования другой.
Применение ОПФ удобно потому, что, во-первых, процессы Фурьепреобразования функции E0 ( x′, y′) , умножения её на ОПФ и обратного Фурьепреобразования результата для получения функции E ( x′, y′) выполнить проще, чем эквивалентную математическую процедуру свёртки; во-вторых, ОПФ для ряда независимых факторов, ухудшающих качество изображения, могут быть объединены простым их перемножением, в результате чего получается полная ОПФ изображающей системы. 6.2.
Структура
изображения
оптической системой
точечного
предмета,
образованного