Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Ю.Д. Корнюшкин
ОСНОВЫ СОВ...
37 downloads
280 Views
6MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Ю.Д. Корнюшкин
ОСНОВЫ СОВРЕМЕННОЙ ФИЗИКИ (Квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика) Учебное пособие
Санкт-Петербург 2005
Корнюшкин Ю.Д. Основы современной физики (квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика) / Учебное пособие. СПб: СПбГУ ИТМО, 2005. 326 с. Пособие составлено в соответствии с программой по физике для технических вузов. В нем в доступной форме изложены основы квантовой механики, атомной физики, физики твердого тела, физики атомного ядра. Автор, по возможности, стремился изложить основные достижения физики двадцатого века. В основе пособия лежат лекции, прочитанные автором в течение ряда лет для студентов СПбГУ ИТМО. Главное внимание в пособии уделено обсуждению физического смысла и содержания основных законов природы в области микромира, а также физике твердотельного состояния. Учебное пособие предназначено, в первую очередь, для студентов младших курсов. Однако оно может быть полезным и студентам старших курсов, а также аспирантам и преподавателям различных специальностей. Рецензент – Е.П. Григорьев, профессор Санкт-Петербургского государственного университета © Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 2005 © Корнюшкин Ю.Д., 2005
Юрий Дмитриевич Корнюшкин ОСНОВЫ СОВРЕМЕННОЙ ФИЗИКИ (квантовая механика, физика атомов и молекул, физика твердого тела, ядерная физика)
Учебное пособие Редакторы К.К. Боярский, А.В. Сечкарев, С.К. Стафеев, Н.А. Ярышев Редакционно-издательский отдел Санкт-Петербургского университета информационных технологий, механики и оптики Лицензия № 00408 от 05.11.99. Зав. РИО Н.Ф. Гусарова Подписано к печати 05.02.2005. Заказ № 806. Тираж 100 экз.
3
Содержание ПРЕДИСЛОВИЕ .............................................................................................6 ПРЕДИСЛОВИЕ АВТОРА ................................................................................7 ГЛАВА 1. ЗАКОНЫ КВАНТОВОЙ МЕХАНИКИ...............................9 1.1. ВОЛНА ДЕ БРОЙЛЯ ................................................................................9 1.2. ОПЫТ ДЭВИССОНА - ДЖЕРМЕРА ........................................................13 1.3. ВОЛНОВАЯ ФУНКЦИЯ .........................................................................19 1.4. ФИЗИЧЕСКИЙ СМЫСЛ ВОЛНОВОЙ ФУНКЦИИ ......................................21 1.5. СООТНОШЕНИЯ НЕОПРЕДЕЛЕННОСТЕЙ ..............................................26 1.6. УРАВНЕНИЕ ШРЕДИНГЕРА .................................................................34 1.7. ЭЛЕКТРОН В ПОТЕНЦИАЛЬНОЙ ЯМЕ ...................................................40 1.7.1. Линейный гармонический осциллятор.....................................41 а) Классический осциллятор.......................................................................41 б). Квантовый осциллятор ..........................................................................44
1.7.2. Движение электрона в потенциальной яме с плоским дном .....47 1.7.3. Движение электрона над потенциальной ямой..........................54 1.7.4. Движение электрона над потенциальным барьером.................57 1.7.5 Движение электрона в направлении потенциального барьера конечной толщины ....................................................................60 1.7.6. Автоэлектронная эмиссия............................................................64 ГЛАВА 2. ФИЗИКА АТОМОВ И МОЛЕКУЛ .....................................66 2.1. ОСНОВНЫЕ ПОНЯТИЯ .........................................................................66 2.2. ОПЕРАТОР МОМЕНТА ИМПУЛЬСА .......................................................67 2.3. АТОМ ВОДОРОДА ................................................................................71 2.4. СНЯТИЕ ВЫРОЖДЕНИЙ СОСТОЯНИЙ В АТОМЕ ВОДОРОДА ..................75 4.1. Снятие вырождения состояний по магнитному квантовому числу. ...............................................................................75 4.2 Снятие вырождений по орбитальному квантовому числу.......78 2.5. СПЕКТРАЛЬНЫЕ СЕРИИ АТОМА ВОДОРОДА.........................................81 2.6. СПЕКТРАЛЬНЫЕ СЕРИИ АТОМОВ ЩЕЛОЧНЫХ МЕТАЛЛОВ ..................83 2.7. ФИЗИЧЕСКАЯ ПРИЧИНА ВОЗНИКНОВЕНИЯ ТОНКОЙ СТРУКТУРЫ В СПЕКТРЕ АТОМОВ ЩЕЛОЧНЫХ И ЩЕЛОЧНОЗЕМЕЛЬНЫХ ЭЛЕМЕНТОВ ........................................................................................89 2.8. ЭНЕРГИЯ СПИН-ОРБИТАЛЬНОГО ВЗАИМОДЕЙСТВИЯ ..........................96 2.9. РАСПРЕДЕЛЕНИЕ ЭЛЕКТРОНОВ В АТОМЕ ПО СЛОЯМ И СОСТОЯНИЯМ ................................................................................100 2.10. ДВУХАТОМНАЯ МОЛЕКУЛА ............................................................102
ГЛАВА 3. ОСНОВЫ ФИЗИКИ ТВЕРДОГО ТЕЛА..........................114 3.1. КЛАССИФИКАЦИЯ ТВЕРДЫХ КРИСТАЛЛИЧЕСКИХ ТЕЛ .....................114 3.1.1. Ионные кристаллы. .................................................................117
4 3.1.2. Ковалентные кристаллы ........................................................118 3.1.3. Металлические кристаллы.....................................................119 3.1.4. Молекулярные кристаллы.......................................................120 3.2. ОСНОВНЫЕ ОСОБЕННОСТИ КЛАССИЧЕСКОЙ И КВАНТОВОЙ СТАТИСТИКИ .....................................................................................120 3.3. ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ ФЕРМИ-ДИРАКА ..................................125 3.4. КВАЗИЧАСТИЦЫ В КРИСТАЛЛИЧЕСКОМ ТВЕРДОМ ТЕЛЕ ...................131 3.4.1 Фононы кристаллической решетки........................................131 3.4.2 Квазиэлектроны кристаллической решетки. ........................137 3.5. РАСПРЕДЕЛЕНИЕ СВОБОДНЫХ ЭЛЕКТРОНОВ ПО ЭНЕРГИЯМ .............139 3.6. ЯВЛЕНИЕ СВЕРХПРОВОДИМОСТИ .....................................................145 3.7. СВОБОДНЫЕ ЭЛЕКТРОНЫ В КРИСТАЛЛИЧЕСКОЙ РЕШЕТКЕ ТВЕРДОГО ТЕЛА ................................................................................152 3.7.1 Адиабатическое приближение................................................152 3.7.2 Приближение самосогласованного поля. ...............................153 3.7.3 Приближение почти свободных электронов.........................154 3.7.4 Приближение сильной связи ....................................................155 3.8. ЗОННАЯ ТЕОРИЯ ТВЕРДЫХ ТЕЛ .........................................................156 3.9. ЭФФЕКТИВНАЯ МАССА КВАЗИЭЛЕКТРОНА В ТВЕРДОМ ТЕЛЕ............161 3.10. ДЫРОЧНАЯ ПРОВОДИМОСТЬ ...........................................................164 3.11. ЭЛЕКТРОХИМИЧЕСКИЙ ПОТЕНЦИАЛ В СОБСТВЕННЫХ ПОЛУПРОВОДНИКАХ ........................................................................167 3.12. ПРИМЕСНЫЕ ПОЛУПРОВОДНИКИ ....................................................171 3.13. ЭЛЕКТРОПРОВОДНОСТЬ ПОЛУПРОВОДНИКОВ ................................175 3.13.1 Собственный полупроводник.................................................176 3.13.2 Примесные полупроводники...................................................178 3.14. КОНТАКТ ДВУХ ПОЛУПРОВОДНИКОВ .............................................179 3.15. ФИЗИЧЕСКИЕ ОСОБЕННОСТИ КОНТАКНОГО СЛОЯ В p-n ПОЛУПРОВОДНИКЕ ..................................................................182 3.16. КОНТАКТ МЕТАЛЛ - ПОЛУПРОВОДНИК ...........................................187 3.17. СООТНОШЕНИЕ ЭЙНШТЕЙНА .........................................................191 3.18. ВЫПРЯМЛЯЮЩЕЕ ДЕЙСТВИЕ p-n ПЕРЕХОДА ..................................193 3.19. ТРАНЗИСТОРЫ .................................................................................199 3.20. ВНУТРЕННИЙ ФОТОЭФФЕКТ В ПОЛУПРОВОДНИКАХ ......................203 3.20.1 Фоторезисторы (фотосопротивления) ..............................204 3.20.2 Фотодиоды, фотоэлементы ................................................206 3.21. ФИЗИЧЕСКИЕ ОСНОВЫ РАБОТЫ ЛАЗЕРОВ .......................................211 3.21.1 Время жизни атома в возбужденном состоянии ...............211 3.21.2 Принцип детального равновесия...........................................214 3.21.3 Основные принципы работы лазеров ...................................217 3.21.4 Гелий -неоновый лазер............................................................218 3.21.5 Полупроводниковые лазеры ...................................................221 3.22. ЭМИССИОННЫЕ ЯВЛЕНИЯ ...............................................................229 3.22.1 Термоэлектронная эмиссия из металлов .............................230
5 3.22.2 Полевая электронная эмиссия...............................................236 3.22.3 Фотоэлектронная эмиссия ...................................................237 3.22.3.1 Фотоэлектронная эмиссия из металлов. ....................................239 3.22.3.2 Фотоэлектронная эмиссия из полупроводников .......................241
ГЛАВА 4. ОСНОВЫ ФИЗИКИ АТОМНОГО ЯДРА.......................242 4.1. ЭЛЕМЕНТАРНЫЕ ЧАСТИЦЫ ..............................................................242 4.1.1Основные свойства элементарных частиц ............................244 4.1.2 Кварковая структура адронов................................................247 4.2. СТРОЕНИЕ АТОМНОГО ЯДРА .............................................................250 4.3. ЭНЕРГИЯ СВЯЗИ ЯДРА .......................................................................251 4.4. ЯДЕРНЫЕ СИЛЫ .................................................................................255 4.5. СТРОЕНИЕ АТОМНЫХ ЯДЕР ...............................................................261 4.5.1 Модель жидкой капли ..............................................................265 4.6. ФОРМУЛА ВЕЙЦЗЕККЕРА ..................................................................265 4.7. МЕЗОННАЯ ТЕОРИЯ ЯДЕРНЫХ СИЛ ...................................................268 4.8. МОДЕЛЬ ЯДЕРНЫХ ОБОЛОЧЕК...........................................................272 4.9. НАПРАВЛЕННОСТЬ РАДИОАКТИВНЫХ ПРЕВРАЩЕНИЙ .....................278 4.10. РАДИОАКТИВНОСТЬ ........................................................................283 4.10.1 Закон радиоактивного распада.............................................284 4.10.2 α- распад .................................................................................288 4.10.3 β- распад..................................................................................296 4.11. ЯДЕРНЫЕ РЕАКЦИИ .........................................................................299 4.12. ЭФФЕКТИВНОЕ СЕЧЕНИЕ ЯДЕРНОЙ РЕАКЦИИ. ................................303 4.13. ДЕЛЕНИЕ ТЯЖЕЛЫХ ЯДЕР ПРИ ЗАХВАТЕ НЕЙТРОНА. ......................304 4.14. ПРОДУКТЫ ДЕЛЕНИЯ УРАНА ПОД ДЕЙСТВИЕМ ТЕПЛОВЫХ НЕЙТРОНОВ .......................................................................................311 4.15. ЦЕПНАЯ ЯДЕРНАЯ РЕАКЦИЯ ...........................................................314 4.16. РЕАКЦИИ СИНТЕЗА ЛЕГКИХ ЯДЕР ...................................................319 4.16.1 Термоядерные реакции...........................................................319 4.16.2 Термоядерные источники энергии Солнца...........................324
6
Предисловие Автор предлагаемого учебного пособия, кандидат технических наук, доцент Юрий Дмитриевич Корнюшкин более полувека проработал на кафедре физики СПБГУ ИТМО. Все годы Великой Отечественной войны вплоть до Победы он провел на фронте, выполнял тяжелые военные обязанности рядового, автоматчика, артиллериста, а после войны закончил инженерно-физический факультет и аспирантуру. В течение многих лет он проводил все виды занятий, включая полный лекционный цикл по курсу общей физики, участвовал в составлении ряда учебно-методических пособий. Ю.Д. Корнюшкиным написан и опубликован обширный цикл работ по физической электронике. До последнего времени он проявлял неизменный интерес к совершенствованию учебно-лабораторного практикума, постановке новых современных лабораторных работ. Предлагаемая читателю книга – последний труд Ю.Д. Корнюшкина, закончить который помешала его внезапная кончина в канун 80летнего юбилея. Сотрудники кафедры, ознакомившись с содержанием рукописи (проф. А.В. Сечкарев – гл. 1, 2; проф. С.К. Стафеев и доц. К.К. Боярский – гл. 3; проф. Н.А Ярышев – гл. 4), считают, что данное учебное пособие по своему содержанию значительно превышает тот объем заключительной части лекционного курса физики, который читается в последние годы на инженерных факультетах нашего университета. Рецензенты кафедры не пытались вносить в содержание и структуру пособия существенные дополнения, о которых сказано в авторском предисловии, а ограничились лишь исправлением замеченных неточностей, сохраняя авторский стиль изложения. Учтено также большинство замечаний, сделанных рецензентом рукописи д.ф.-м.н., профессором Е.Г. Григорьевым. Считаем, что данное пособие будет полезным дополнением к имеющимся учебникам и позволит студентам младших и старших курсов расширить кругозор в области современной физики. Зав. кафедрой физики, д.т.н., профессор
С.К. Стафеев
7
Предисловие автора Одна из главных задач преподавания физики в вузе состоит в том, чтобы объяснить студенту основные законы природы, развить у него навыки использования полученных знаний, а также выработать основы логики физического мышления, особенностью которого является умение не только оперировать идеальными моделями изучаемого явления, но и соотносить эти модели с реальной действительностью. Физика - быстро развивающаяся наука. И то, что ранее казалось ее новыми достижениями, через некоторое время на поверку оказывается либо устаревшими, либо общепринятыми представлениями. При этом, однако, старые достижения не становятся неверными: развитие физики лишь определяет границы их применимости. Настоящее учебное пособие предназначено для студентов, обучающихся по программе 2-го курса технического университета, но, тем не менее, некоторые его разделы могут быть полезными студентам старших курсов, аспирантам и преподавателям. В главе 1 формулируются основные законы квантовой механики в наиболее доступной для понимания студентами 2-го курса форме. В ней рассмотрено движение электрона в потенциальной яме конечной глубины. В результате полная энергия электрона оказывается зависящей от ширины и глубины потенциальной ямы, плотность уровней полных энергий в пределах потенциальной ямы распределена неравномерно. Глава 2 посвящена физике атомов и молекул. В ней, в частности, объясняется физическая причина вырождения состояний в атоме водорода по орбитальному и магнитному квантовым числам. При анализе двухатомной молекулы вводится понятие обменного взаимодействия. Обсуждается физическая природа спин-орбитального взаимодействия и влияния его на особенности спектров атомов щелочных металлов. В главе 3 излагаются основы физики твердого тела. Значительный акцент сделан на физике сверхпроводников 2-го рода как наиболее перспективных в настоящее время сверхпроводников. Подробно обсуждается внутренний фотоэффект в полупроводниках. Объясняются физические принципы работы фотосопротивлений, фотодиодов, фотоэлементов, оптронной пары. Сформулированы физические принципы создания гетеропереходов. Объяснена физика лазерного излучения.
8
В главе 4 обсуждаются основы физики атомного ядра. В отличие от общепринятого подхода, изложение основ физики атомного ядра начинается с обзора физических свойств элементарных частиц. Теория α-распада доводится до количественного расчета энергии вылетевших из ядра α-частиц. Следует заметить, что распределение изложения по отдельным главам довольно неравномерно. Наибольший объем приходится на 3-ю главу, и это не случайно: именно этот раздел физики во второй половине 20 века получил наибольшее развитие, именно в этой области были сделаны наиболее выдающие достижения и открытия. Основой учебного пособия являлись лекции, прочитанные автором в течение многих лет в Ленинградском институте точной механики и оптики на дневном отделении. Пособие охватывает все основные разделы современной физики, а именно, элементы квантовой механики, физики атомов и молекул, физики твердого тела, физики атомного ядра и элементарных частиц. Автор по возможности пытался на доступном для студентов уровне изложить основные идеи современной физики, объяснить явления и законы в области микромира. Как правило, изложение ведется с использованием математического аппарата, известного студентам 2-го и старших курсов. Автор в пособии сознательно широко использовал математику, считая, что только на ее основе можно строго объяснить основные законы природы. Это, в первую очередь, относится к применению теории дифференциальных уравнений, используемых при анализе некоторых конкретных задач с целью выявления количественных физических закономерностей в изучаемых явлениях природы. Применение доступного для студентов математического аппарата имеет несомненное достоинство, так как позволяет описать законы природы не только качественно, но и количественно. В тех же случаях, когда для описания физического процесса необходимо применять специальный математический аппарат, выходящий за пределы студенческой программы, используется лишь качественный подход с указанием основных идей в проводимых физических рассуждениях. Такой подход, в частности, осуществлен при описании явления сверхпроводимости. Пособие называется "Основы современной физики". Оправданием такому названию является то, что в нем фактически охвачены важнейшие открытия в физике, начиная с 1923 года по 2000 год. Не все разделы физики в пособии в равной степени отражены достаточно подробно, некоторые из них вообще опущены. Это связано с тем, что
9
одни находятся в стадии интенсивного формирования, другие – из-за того, что их содержание выходит за пределы программы 2-го курса, по которой автор составлял настоящее пособие. Автор при отборе материала был ограничен объемом учебного пособия, и поэтому некоторые важные разделы физики, такие, как явление сверхтекучести, эффекты Мессбауэра, Джозефсона и некоторые другие, не нашли своего отражения. Автор надеется, что учащийся, изучивший настоящее пособие, будет хорошо ознакомлен с основами современной физики, с ее достижениями и проблемами. Автор уверен, что знание основ современной физики в дальнейшем позволит студенту, уже находясь на старших курсах, более успешно овладевать многими специальными техническими дисциплинами.
10
Глава 1. ЗАКОНЫ КВАНТОВОЙ МЕХАНИКИ 1.1. Волна де Бройля Из предыдущих разделов физики нам известно, что такие процессы природы, как тепловое и рентгеновское излучения, фотоэффект и др., хорошо объясняются на основе использования корпускулярных представлений. С другой стороны, интерференция, дифракция, поляризация света объясняются на основе волновых представлений, согласно которым свет есть электромагнитные волны. Таким образом, свет, в широком понимании этого слова, представляет своеобразное сочетание волновых и корпускулярных свойств материи. В одних условиях эта материя наиболее четко проявляет волновые свойства, в других – корпускулярные. Одним из критериев применимости того или иного подхода является величина поперечного сечения цуга волн: если поперечное сечение цуга волны сравнимо с размерами частиц вещества, то свет, электромагнитная волна проявляют корпускулярные свойства и электромагнитное излучение можно рассматривать как поток световых частиц, если же поперечное сечение цуга волн значительно больше размера частиц, то свет следует рассматривать как поток электромагнитной волны. Таким образом, свет как материя обладает двойственной природой. Пусть на границу раздела двух сред падает плоская электромагнитная волна. y
v1x v1y
v1
i1
v2y
v2x v2
x
i2
Рис. 1.1.1. Изменение скорости частицы у поверхности раздела сред без учета преобразования полей Из рис. 1.1.1 следует, что v1x = v2x или
11
sin i 1 v1 n 1 1 c c , n 2= ; .= , = = v2 n sin i 2 v 2 n 2 v1 n2 где v – фазовая скорость, c – скорость света в вакууме, n = – абсоn1 лютный показатель преломления, i1, i2 – углы падения и преломления. Применив корпускулярный подход, мы получили закон, обратный закону преломления. Таким образом, хотя для оптических явлений корпускулярный подход применим, но он дает неверный результат. Причина несоответствия корпускулярной теории опыту состоит в том, что для описания этого процесса необходим иной подход, при котором учитываются взаимодействия множества световых частиц с атомами вещества. Математической основой описания такого процесса является кинетическое уравнение переноса. В 1923 г. французский ученый де Бройль высказал предположение, что двойственная природа материи должна проявляться не только у электромагнитного излучения. Он предположил, что электроны при определенных условиях должны проявлять волновые свойства. Он писал: "В оптике в течение столетия слишком пренебрегали корпускулярным способом рассмотрения явлений по сравнению с волновым. Не делалось ли в теории материи обратной ошибки? Не думали ли мы слишком много о картине частиц и не пренебрегали ли чрезмерно картиной волн?" В 1929 г за эту работу ему была присуждена Нобелевская премия. Де Бройлю было 30 лет, когда он высказал свою гипотезу о волновых свойствах материи и вывел формулу, с помощью которой можно вычислить длину волны, связанную с движущимся электроном. К мысли о том, что электрон должен обладать волновыми свойствами, де Бройля привели следующие факты и соображения. В природе существует аналогия между геометрической оптикой и механикой. Основные законы этих двух разделов физики можно сформулировать в тождественно математической форме. Это значит, что вместо того чтобы рассматривать движение заряженной частицы в электрическом ρ поле с потенциалом ϕ(r ) , можно рассматривать распространение поρ тока частиц в пространстве с абсолютным показателем n(r ) . Заметим, что рассматриваемая аналогия в настоящее время охватывает все разделы физики и в ряде случаев бывает очень полезной. Покажем это на конкретном примере. Допустим, имеется две контактирующие между собой среды. Потенциал электрического поля в верхней среде φ1, а потенциал в нижv1 sin i 1 = v 2 sin i 2 ; n 1 =
12
ней среде φ2. На границе раздела происходит постепенное изменение потенциала. Тогда напряженность электрического поля в пограничном слое можно представить в виде (см. рис. 1.1.2): ρ ρ dϕ ρ E=− j = Ey j. dy Если φ1> φ2 , ρ ρ dϕ < 0, E ↑↑ j , dy и в пределах пограничного слоя наρэлектрон будет действовать сила ρ Fy = eE , e < 0,
направленная вниз, а в направлении координатной оси 0Х сила действовать не будет, так как Ex=0. Следовательно, ρ ρ (1.1.1.) F1x = F2 x = 0, v1x = v 2 x ; F y ↑↓ j .
sin i1 v 2 = . sin i 2 v1 y me v1y
v1x v1 x me v2y
v2x v2
Рис. 1.1.2. Изменение скорости частицы у поверхности раздела сред с учетом преобразования полей Электрон, проникая в пространство с потенциалом φ1, приобретает кинетическую энергию k1 =
me v12 = e∆ϕ1 2
Тогда в пространстве с потенциалом φ2 его кинетическая энергия будет m v2 k2 = e 2 = e∆ϕ 2. 2 Значит,
13 1 ⎞2
v 2 ⎛ ∆ϕ 2 (1.1.2) ⎟ =⎜ v1 ⎜⎝ ∆ϕ 1 ⎟⎠ Подставляя полученное выражение (1.1.2) в (11.1.), имеем: 1
⎛ ∆ϕ 2 ⎞ 2 ⎟ (1.1.3) =⎜ sin i 2 ⎜⎝ ∆ϕ 1 ⎟⎠ Формула (1.1.3) является математической записью закона преломления в электронной оптике. Закон преломления в геометрической оптике формулируется в виде sin i 1 n (1.1.4) . n21 = 2 = n 1 sin i 2 Из сравнения выражений (1.1.3) и (1.1.4) можно получить относительный показатель преломления в электронной оптике: sin i 1
1
⎛ ∆ϕ ⎞ 2 n21 = ⎜⎜ 2 ⎟⎟ ⎝ ∆ϕ1 ⎠
(1.1.5)
В случае электромагнитных волн плоская электромагнитная волна представляет собой пучок параллельных лучей, для которых волновой фронт – плоскость, перпендикулярная направлению распространения лучей, а волновая поверхность – система параллельных поверхностей ρ ρ с колебаниями векторов E и H в одной и той же фазе ρ ρ ρ ρ ρ 2π ρ r E = E0 cos(ωt − k x) ⋅ j , H = H 0 cos(ωt − k x) ⋅ k , k = ,k = . r λ Однако, если принять корпускулярную точку зрения, то плоскую электромагнитную волну можно рассматривать как поток световых частиц, перемещающихся в пространстве параллельно (рис. 1.1.3) или даже связать ее с отдельно движущимся фотоном. Если в пространстве существует поток свободных, не взаимодействующих между собой электронов (на эти электроны не действуют внешние силы), то в таком потоке электроны должны перемещаться параллельно. Эта картина верна, если пользоваться корпускулярными представлениями. Но если воспользоваться волновыми представлениями, т.е. применить понятие волны материи, то с таким потоком частиц можно связать некий волновой процесс, и описание движения электронов с волновой точки зрения должно быть аналогично описанию плоской электромагнитной волны. Следовательно, такой волновой процесс также можно изобразить в виде плоской волны. Поэтому де Бройль предположил, что между волновыми и корпускулярными
14
характеристиками электрона должна существовать точно такая же взаимосвязь, как и между соответствующими характеристиками фотона. И, кроме того, де Бройль предположил, что корпускулярное описание движения свободного электрона должно быть подобно корпускулярному описанию фотона, волновое описание свободного электрона должно быть подобно волновому описанию потока фотонов в электромагнитной волне (рис. 1.1.3). y
y
ρ E ρ E ρ E
ρ
mф c
ρ
mф c mф
ρ c
фотоны
фронт волны
ρ ρ E = E0 cos(ω t − k x) ⋅ j
ρ c ρ c ρ c x
me me me
ρ v ρ v ρ v
ρ v ρ v ρ v
свободные электроны
фронт волны
x
ρ
ϕ = ϕ 0 cos(ω t − k x)
а б Рис. 1.1.3. Модель плоской волны для фотонов (а) и для электронов (б) По определению импульс фотона и энергия фотона соответственно равны c pф = mф c, ε = mф c 2 = pф с, ε = hν, ν = . λ Значит, ε hν h h (1.1.6) = ; pф = , pф = = λ c c λ где λ – длина электромагнитной волны, h – постоянная Планка, pф – импульс фотона. Таким образом, уравнение (1.1.6) связывает между собой как корпускулярные, так и волновые характеристики света воедино, а коэффициентом связи является постоянная Планка. Де Бройль предположил, что уравнение (1.1.6) можно применять не только для фотонов, но и для электронов. А так как импульс электрона pe=p=mev, то длина волны некоторого волнового процесса, связанного с движущимся электроном, будет определяться из уравнения h p = = me v. λ Отсюда
15
λ=
h . me v
И если me v 2 = eU ≤ 10 кэВ, 2 то масса электрона me = m0, т.е. практически не отличается от массы покоя. Тогда в соответствии с законом сохранения энергии можем записать: K=
1
⎛ 2eU ⎞ 2 m v2 (1.1.7) ⎟⎟ . eU = e ; v = ⎜⎜ 2 m ⎝ e ⎠ После подстановки найденного выражения для скорости имеем h λ= 1 ⎛ 2eU ⎞ 2 ⎟⎟ m⎜⎜ ⎝ me ⎠ или 12,3 ⋅ 10 −10 12,3 λ= м = 1 Å, [U]=В. 1 U2 U2 Пусть U = 100 B. Тогда λ = 0,12 нм. Если же U = 10000 B, то λ= 0,012 нм. Таким образом, длина волны свободного электрона, двигающегося со скоростью v, соответствует длине волны рентгеновского излучения. На это обстоятельство мы обратим внимание в дальнейшем. Такое совпадение, разумеется, носит случайный характер.
1.2. Опыт Дэвиссона - Джермера
Любая гипотеза, как бы она ни была привлекательна и правдоподобна, остается гипотезой до тех пор, пока она не подтвердится опытом. Только прямые опыты, в которых отчетливо проявлялись бы волновые свойства частиц, могли бы подтвердить правильность идеи де Бройля. В 1922 г. по заказу американской фирмы "Белл-телефон" Клинтон Джозеф Дэвиссон (1881–1958) и его сотрудник Кансмен изучали отражение электронов от поверхности металла и при этом обнаружили какие-то аномалии. В 1925 г. Дэвиссон, находясь в Европе, показал
16
свои графики Максу Борну, Джеймсу Франку (аспиранту Борна) в Геттингене и Дугласу Хартри в Оксфорде. Все они признали, что аномалии на графиках свидетельствуют о проявлении волновых свойств электронов, т.е. волн де Бройля, хотя и не убедили в этом Дэвиссона. Вскоре после возвращения в Америку в экспериментальной установке Дэвиссона во время работы случилась авария: треснула вакуумная трубка, и нагретый в это время поликристаллический Ni под действием кислорода воздуха окислился. После восстановления установки и прокаливания образца в вакууме исследования совместно с Лестером Альбертом Джермером (1896–1971) были продолжены. Вскоре выяснилось, что спектр отраженных электронов имеет отчетливо выраженные интерференционные максимумы. В результате к концу 1927 г. они убедились в реальности существования волн материи. Но еще в 1925 г. студент М. Борна Вальтер Эльзассер, получив задание разобраться с этим явлением, предположил, что аномалии на графиках Дэвиссона объясняются электронными волнами де Бройля. Он послал в журнал краткую заметку, в которой объяснил результаты опытов Дэвиссона и Кансмана дифракцией волн материи. Однако на эту заметку тогда никто не обратил внимание. Схема экспериментальной установки Дэвиссона представлена на рис. 1.2.1. Что же произошло в установке Дэвиссона после прокаливания? В результате прокаливания и дальнейшего остывания на поверхности поликристаллического Ni возникли отдельные монокристаллы. При попадании электронов на монокристалл Ni число электронов в направлении угла скольжения меняется в зависимости от энергии электронов. Оказалось, что существуют такие значения энергии, при которых отражение электронов максимально, и существуют такие значения энергии, при которых число отраженных электронов минимально. В результате на экспериментальном графике наблюдаются чередующиеся максимумы и минимумы интерференции электронных волн.
θ
θ
Ni
Рис. 1.2.1. Схема установки Девиссона
J
17
Если теперь при заданном значении угла скольжения θ и полярного угла менять энергию первичных электронов, то график должен иметь вид, изображенный на рис.2.2.2. I
1
xi = U i2 , i = 1, 2, 3, 4
x1
x2
x3
x4
1
U2
Рис. 1.2.2. Интерференция картины электронов
1
θ
2
θ
θ θ
d
Рис. 1.2.3. Модель интерференции волн в кристалле Известно, что монокристалл Ni можно представить в виде системы кристаллографических плоскостей. Если принять, что отражение волн материи происходит от кристаллографических плоскостей, то в результате интерференции волн максимум отраженной волны будет возникать в случае разности хода лучей, кратной длине волны (рис. 1.2.3). Из рис. 1.2.3 следует, что разность хода у интерферирующих лучей 1 и 2 ∆ = 2d sin θ .
Отсюда (1.2.1) 2d sin θ = mλ, m = 1, 2, 3, ... , где d – межплоскостное расстояние, θ – угол скольжения. Если считать, что гипотеза де Бройля правильна, то длина волны
18
12,3 ⋅ 10 −10 , м U и после подстановки в (1.2.1) получаем: 12,3 ⋅ 10 −10 12,3 ⋅ 10 −10 2d sin θ = m ; ; U = m c1 , c1 = 2d sin θ U λ=
1
1
1
⎛U ⎞2 ⎛U ⎞2 ⎛U2 ⎞2 ⎟⎟ = 2 ; ⎜⎜ 3 ⎟⎟ = 3 ; ⎜⎜ 4 ⎟⎟ = 4 . ⎜⎜ ⎝ U1 ⎠ ⎝ U1 ⎠ ⎝ U1 ⎠ Таким образом, возникновение максимумов на экспериментальных графиках следует рассматривать как результат интерференции волн неизвестной пока природы, которые связаны с движущимся электроном в пространстве. Значит, движение электронов в пределах кристаллической решетки можно рассматривать как волновой процесс. Наличие экспериментально наблюдаемых максимумов и минимумов и их правдоподобное объяснение является доказательством правильности гипотезы де Бройля о наличии в природе волн материи. Как оказалось впоследствии, волновыми свойствами обладают не только электроны, но и любые микрочастицы.
1.3. Волновая функция
Итак, несомненно, поток электронов обладает и волновыми, и корпускулярными свойствами. Это значит, что двигающемуся электрону соответствует какой-то волновой процесс неизвестной пока природы. Де Бройль также не понимал физическую природу этого волнового процесса и поэтому предложил описать его с помощью функции, которую он назвал волновой функцией, т.е. функцией, которая описывает движение частиц с волновой точки зрения. Но при этом он считал, что при таком описании должна сохраниться аналогия с описанием волнового процесса в оптике. Мы знаем, что движение фотонов в виде пучка параллельных лучей описывается плоской электромагнитной волной. Следовательно, и движение свободных электронов, перемещающихся в пространстве параллельно и прямолинейно, также должно описываться в виде плоской волны, образованной волновой функцией. Введение волновой функции, ее конкретный вид проще всего выяснить на примере использования знакомых нам явлений. Уравнение плоской электромагнитной волны имеет вид E = E0 cos( ω t − k x), H = H 0 cos( ω t − k x).
19
Запишем теперь это же уравнение так, чтобы в него вошли как корпускулярные, так и волновые характеристики материи. Для этого перейдем от ω и k, характеризующих процесс с волновой точки зрения, к энергии кванта ε и импульсу кванта p, характеризующим тот же процесс с корпускулярной точки зрения: 2π 2π h ε hν = ; ω = 2πν = ε = ; η= h h η 2π 2 π 2 π h 2π p = k= = p= ; η λ h λ h здесь p – импульс фотона. Тогда, заменив ω и k в уравнении плоской электромагнитной на ε и p, получим: ⎛1 ⎞ ⎛1 ⎞ E = E0 cos⎜ (ε t − px )⎟, H = H 0 cos⎜ (ε t − px )⎟. ⎝η ⎠ ⎝η ⎠ Аналогичное выражение получается, если плоскую волну выразить не через косинус, а через синус. Поэтому в общем случае эти две тригонометрические функции можно объединить и записать уравнение плоской электромагнитной волны в более общем виде: i i − (ε t − p x ) − (ε t − p x )
E = E0 e
η
, H = H0 e
η
.
При такой форме записи мы видим, что в уравнении плоской электромагнитной волны отображаются и волновые, и корпускулярные свойства материи. Волновые свойства здесь проявляются в том, что эти уравнения записаны в виде волны, а корпускулярные свойства проявляются в том, что параметрами электромагнитной волны являются энергия фотона ε и импульс p фотона, причем под ε здесь понимается полная энергия фотона или других микрочастиц, если подобные рассуждения проводить для них. Если же движение фотона происходит в произвольном направлении, то в общем случае уравнение плоской электромагнитной волны с учетом корпускулярных свойств материи будет E = E0 e
−
i (ε t − pρ rρ) η
−
i (ε t − pρ rρ) η ,
H = H 0e ρ ρ ρ ρ E0 = const , H 0 = const , r = x i + y j + z k . Де Бройль в своих физических рассуждениях исходил из предвзятой, но очень плодотворной идеи. Он считал, что законы природы и уравнения, при помощи которых описываются эти законы как с волновой, так и с корпускулярной точек зрения, во всех физических явлениях должны быть едины и поэтому должны иметь тождественный ,
20
вид. Поэтому де Бройль предложил воспользоваться аналогичным выражением ρдля описания волновых свойств электрона, только вместо ρ векторов E и H , имеющих ясный физический смысл в случае светового потока, ввести некоторую волновую функции ψ, записав с помощью этой функции уравнение плоской волны: −
i
(ε t − px )
(1.3.1) ψ = ψ 0e η , где в случае плоской волны ψ0 = const. Не надо думать, что волновая функция, которая здесь была введена по аналогии, является характеристикой только электрона. Нет! При помощи этой функции можно также описать распространение света в пространстве как с волновой, так и с корпускулярной точек зрения. Но только физический смысл волны де Бройля будет отличаться от физического смысла электромагнитной волны. Введение волновой функции ψ есть новая математическая формулировка одного из законов природы, который проявляет свое действие в микромире. На приведенном примере мы вновь убеждаемся в том, что математическая формулировка основных законов природы не выводится, а постулируется, о них догадываются. Поскольку введенная волновая функция есть закон природы, отображающий объективную реальность, и поскольку ее аналитическое выражение получено путем использования аналогии, т.е. по существу по догадке, то все рассуждения, связанные с постулированием вида волновой функции, являются яркой иллюстрацией того, что, как правило, фундаментальные законы природы являются обобщением результатов эксперимента в виде конкретных аналитических формул. Итак, на примере волновой функции ψ мы проследили все этапы открытия волновой функции для свободного электрона, мы как бы проанатомировали само открытие волновой функции, при помощи которой можно описать движение электрона с волновой точки зрения. Де Бройль считал, что уравнение (1.3.1) описывает движение свободного электрона с полной энергией ε = mec2 и импульсом p = mev. Предположим, что в пространстве существуют такие точки и такие моменты времени, для которых фаза колебаний всегда постоянная. Тогда для свободного электрона, у которого ε = const, p = const, dx dx ε c 2 ε t − px = const , ε − p = 0 ; vфаз = = = > c. dt dt p v Следовательно, фазовая скорость волны де Бройля не совпадает со скоростью движения частицы, поскольку она больше скорости света в вакууме. Поэтому фазовая скорость определяет всего лишь скорость
21
перемещения фазы в пространстве некоторого колебательного процесса, описывающего движение электрона с волновой точки зрения и не больше. Это указывает на то, что волновая функция не может непосредственно описать движение электронов в пространстве, она имеет иной более сложный физический смысл. Итак, оказывается, что фазовая скорость свободного электрона больше скорости света в вакууме. С этой скоростью частицы в пространстве перемещаться не могут. Если же ввести в рассмотрение такие гипотетические частицы, как тахионы, то окажется, что они в пространстве могут перемещаться со скоростью больше скорости света в вакууме, но это уже будут не реально существующие в природе частицы. Нечто подобное имеет место в оптике, когда при рассмотрении распространения света в анизотропных средах мы вынуждены применять такие понятия, как фазовая и лучевая скорости, имеющих разный физический смысл. Иначе обстоит дело с групповой скоростью волн де Бройля. Известно, что для любого волнового процесса
vгруп = Подставляя сюда ε
= ε0 + mv 2
dω dε = . dk dp
2
и p = mv, где ε0 – энергия покоя, m
– масса, v – скорость частицы (полагаем v a, Поэтому
31
∆p y ∆y > h .
Итак, в общем случае с учетом (1.5.3) и (1.5.4) имеем: ∆px ∆x > h , ∆p y ∆y > h ,
(1.5.4)
(1.5.5)
∆pz ∆z > h . Система неравенств (1.5.5) и представляет собой соотношения неопределенностей Гейзенберга. Мы получили их на примере дифракции света, однако они выполняются для любых микрочастиц. Соотношения неопределенностей, записанные в виде системы неравенств (1.5.5), выполняются только для проекций импульсов и координат на одноименные координатные оси. Поэтому для проекций на разноименные координатные оси правая часть неравенств (1.5.5), в частности, может быть равна нулю, например, ∆p x ∆y ≥ 0, ∆p z ∆x ≥ 0. В этом случае проекцию импульса и координату вдоль разноименных направлений в мысленном опыте можно определить одновременно с любой точностью. Так, можно совершенно точно определить и проекцию импульса на ось Оx и координату y. В этом случае ∆px = 0 ,
∆y = 0 . Из системы неравенств (1.5.5) для проекций импульса и радиуса вектора на соответствующие координатные оси можно получить еще одно неравенство, связывающее между собой неопределенность величины полной энергии микрочастицы с неопределенностью момента времени, когда частица имеет указанную полную энергию. Покажем это на примере фотона. ρ Пусть r есть направление, вдоль которого фотон движется со скороρ ρ стью c . Для направления r запишем соотношение неопределенности: ρ ρ (1.5.6) ∆p∆r > h, ∆p∆r > h. Энергия фотона ε ф = mф c 2 = pc.
Импульс и координата фотона в момент времени t : ε p = , r = ct. c Тогда неопределенность значения импульса и неопределенность значения координаты фотона соответственно равны ∆ε ∆p = , ∆r = c∆t. c
32
и после подстановки найденных значений в (1.5.6) получаем (1.5.7) ∆ε∆t > h . Установленное неравенство (1.5.7) справедливо не только для фотонов, но и для иных микрочастиц. Физический смысл неравенства (1.5.7) следующий: чем точнее известен момент времени, когда была определена энергия микрочастицы, тем менее точно может быть определена ее полная энергия, и наоборот. А применительно к свойствам самой системы его можно сформулировать так: чем меньше длительность некоторого энергетического состояния системы, тем больше неопределенность в знании ее полной энергии. Так как p x = mvx , то h (1.5.8) ∆υ x ∆x > . m Неравенство (1.5.8) позволяет установить границу применения классической и квантовой механик. Так, если координата микрочастицы определяется настолько точно, что неопределенность ∆x ее положения в пространстве меньше характерного линейного размера частицы, то при анализе ее движения можно применять корпускулярный подход, если же эта неопределенность больше ее характерного размера, то для описания движения необходимо использовать волновую функцию. (Характерным размером может быть, например, размер атома или молекулы). Допустим, нам известен способ, с помощью которого можно определить скорость электрона в атоме с точностью ∆vx = 1мм/с. Тогда из (1.5.8) следует, что ∆x ≈ 0,7м. В этом случае ∆x >> R, где R – радиус ядра атома. Такой электрон в процессе движения проявляет только волновые свойства. Если же эта скорость определена, допустим, в кинескопе телевизора, то электрон следует рассматривать как частицу. Таким образом, движение электрона в атоме, в кристаллической решетке твердого тела может быть описано с помощью волновой функции, его положение в пространстве определяется величиной плотности вероятности. Соотношение неопределенностей не отрицает возможность одновременного определения координаты и импульса микрочастицы, их одновременное измерение возможно лишь с определенной точностью. В этом утверждении заключается отказ от некоторых представлений, укоренившихся в физике того времени. Так, в классической физике
33
широко пользуются понятием траектории движения материальной точки, траектории движения частицы, причем под траекторией понимается зависимость координаты, определяющей положение материальной точки в пространстве, от времени. Знание траектории предполагает знание с любой точностью и координаты, и скорости (координаты и импульса). В классической механике координата и скорость материальной точки в любой момент времени в принципе могут быть определены одновременно с любой точностью, это значит, что движение материальной точки, движение центра масс в пространстве происходит по определенной траектории. В квантовой механике одновременное абсолютно точное определение координаты и импульса микрочастицы в принципе невозможно. Поэтому понятие траектории движения отсутствует, оно не имеет физического смысла. Мы, конечно, можем указать путь, пройденный электроном, но тогда ничего не можем сказать о том, в какой момент времени электрон будет занимать то или иное положение в пространстве. В классической механике всегда имеется возможность однозначно предсказать будущее по прошедшему. В квантовой механике однозначность предсказания заменяется вероятностью предсказания. Из соотношений неопределенности вытекает принцип дополнительности. Он был сформулирован Н. Бором в виде следующего утверждения: координату и импульс микрочастицы нельзя абсолютно точно измерить не только одновременно, но и с помощью одного и того же прибора. В самом деле, чтобы измерить импульс атома и при этом не очень сильно его изменить в результате воздействия на атом самого прибора, необходим очень легкий подвижный датчик, способный перемещаться вместе с атомом в процессе измерения. Но такая подвижность приведет к тому, что его положение в пространстве окажется весьма неопределенным. Для измерения координаты необходим прибор с очень большой массой датчика. Поэтому при попадании частицы в такой датчик положение датчика в пространстве меняться не будет. Таким образом, в природе всегда существуют две сопряженные физические величины, одновременное измерение которых в принципе невозможно. Такими сопряженными величинами, в частности, являются координата и импульс частицы, потенциальная и кинетическая энергии и т.д. Гносеологическая причина несовместимости дополнительных понятий заключается в двойственной природе материи. Этот закон является универсальным и охватывает все без исключения явления природы.
34
1.6. Уравнение Шредингера
Уравнение Шредингера является основным законом квантовой механики, его роль является такой же, какую второй закон Ньютона играет в классической механике. Эрвин Шредингер (1887–1961) в 1911 г. окончил Венский университет. В 1925 г. он стал профессором Цюрихского университета. Шредингер знал, что в природе существует оптико-механическая аналогия, которую впервые установил Гельмгольц. Но Гельмгольц доказал ее лишь для геометрической оптики, в которой не учитываются волновые свойства света. Шредингер же предположил, что оптикомеханическая аналогия сохраняется и в волновой оптике. Это значит, что любое движение частиц можно рассматривать как распространение некоторой волны. Квантовая механика – это раздел физики, описывающий движение микрочастиц в пространстве с учетом волновых и корпускулярных свойств материи. Квантовая механика рассматривает движение только тех объектов, которые в процессе движения проявляют волновые свойства. Поэтому квантовая механика движение макротел вообще не описывает. Критерий, с помощью которого можно указать границу применимости квантовой механики, определяют соотношения неопределенностей. Если ∆x ≥ z или ∆v x ≥ v x , где z – характерный размер частицы, то для решения задачи следует применять квантовую механику. Если же ∆x 0, a22 = 2e (ε − U ). η η Тогда в новых обозначениях дифференциальное уравнение (1.7.2.7) в различных областях пространства будет иметь разный вид. В области 1 ψ1′′( x) − a12ψ1 ( x) = 0. Его решение l ψ1 ( x ) = ψ 01e a x + ψ 02 e − a x , x ≤ − . 2 Так как электрон в область 1 глубоко проникнуть не может, то ψ1 ( x) x = −∞ = 0, ψ 02 = 0; 1
1
ψ1 ( x) = ψ01eia1x .
(1.7.2.9)
В области 2 ψ′2′ ( x) + a22ψ 2 ( x) = 0.
Его решение ψ 2 ( x) = ψ 03e ia 2 x + ψ 04 e − ia 2 x .
В области 3 ψ′3′ ( x ) − a12 ψ 3 ( x) = 0.
Его решение
(1.7.2.10)
50
l x≥ . 2
ψ 3 ( x) = ψ 05e a1 x + ψ 06 e − a1 x ,
Так как электрон и в область 3 глубоко проникнуть не может, то ψ3 ( x) x = ∞ = 0, ψ 05 = 0; или (1.7.2.11) ψ 3 ( x ) = ψ 06 e − a1x . После подстановки в (1.7.2.6) найденных решений (1.7.2.9)– (1.7.2.11) получим волновые функции для различных областей пространства: ψ1 ( x, t ) = ψ 01e ψ 2 ( x, t ) = ψ 03e
−
−
i (εt + iηa1 x ) η ,
i (εt − ηa 2 x ) η −
+ ψ 04 e i
−
i (εt + ηa 2 x ) η ,
(εt − iηa1 x )
ψ 3 ( x, t ) = ψ 06 e η , Из анализа вида волновых функций следует, что в 1-й и 3-й областях фазовые скорости имеют мнимую величину, хотя сами волновые функции отличны от нуля. Это означает, что квантовая механика предсказывает возможность прохождения через потенциальный барьер, но не объясняет физическую природу возможности прохождения. Парадоксальность ситуации состоит в том, что в этом случае нарушается закон сохранения энергии. В области 2 фазовая скорость – вещественная величина, волновая функция состоит из двух плоских волн, распространяющихся в противоположных направлениях. Для определения постоянных интегрирования ψ01, ψ03, ψ04, ψ06 воспользуемся граничными условиями для волновых функций и их производных: ⎛ ψ 2 ( x ) = ψ3 ( x ) ⎞ ⎛ ψ1 ( x) = ψ 2 ( x) ⎞ . (1.7.2.12) ⎟⎟ ⎜⎜ ⎟⎟ ; ⎜⎜ x x ψ ' ( x ) ψ ' ( x ) = = ψ ' ( ) ψ ' ( ) 2 3 ⎝ 1 ⎠ x =l / 2 ⎝ 2 ⎠ x =l / 2
После подстановки значений в граничные условия решений соответствующих дифференциальных уравнений находим постоянные интегрирования, при этом в зависимости от четности волновой функции в области 2 получаем различные постоянные интегрирования. Кроме того, в зависимости от четности волновой функции получаем различные уравнения, определяющие условия квантования полной энергии электрона: для четной волновой функции в области 2 al a1 = a2 tg 2 , 2
51
для нечетной волновой функции в области 2 al a2 = − a2 ctg 2 . 2 В дальнейшем для анализа будем использовать только четную волновую функцию. В результате проведенных преобразований получаем следующие выражения для волновых функций в областях 1, 2, 3: ψ1 ( x) = ψ 0 e ψ 2 ( x) =
l a1 ( x + ) 2
,
ψ0 ⋅ cos a2 x , al cos 2 2 l − a1 ( x − ) 2
l −∞ ≤ x ≤ − ; 2 l l − ≤x≤ ; 2 2
(1.7.2.13)
l ≤ x ≤ ∞. 2 Для определения постоянной ψ0 воспользуемся условием нормировки волновой функции: ψ 3 ( x) = ψ 0 e
−
l 2
∫e
l 2 a1 ( x + ) 2
−∞
dx +
l 2
∫ −
Отсюда имеем:
l 2
,
∞
l − 2 a1 ( x − ) cos 2 (a2 x) 2 dx + ∫ e dx = ψ 0− 2 a l l cos 2 ( 2 ) 2 2 −1
2 ⎛a ⎞ 2⎛ 2 2a ⎞ (1.7.2.14) ψ = ⎜ + 1 + ⎜⎜ 1 ⎟⎟ + 2 1 ⎟ . l ⎜ a1l a2 ⎠ a2 l ⎟ ⎝ ⎝ ⎠ Из решений (1.7.2.13) видно: если электрон находится в области 2, то всегда существует некоторая вероятность проникновения вглубь стенки потенциальной ямы, хотя по законам классической физики это невозможно. Рассмотрим более подробно причину квантования полной энергии электрона, находящегося в потенциальной яме конечной глубины. Из (1.7.2.8) следует, что величина полной энергии ε электрона в области 2 η2 2 (1.7.2.15) ε =U + a2 . 2me Следовательно, возможные значения полной энергии определяются возможными значениями параметра a2 и величиной потенциальной энергии U, причем 2m (1.7.2.16) a22 + a12 = − 2 e U . η 2 0
52
После подстановки в (1.7.2.16) значений a1 и a2 из (1.7.2.8) и последующих преобразований получаем трансцендентное уравнение 2m ⎛a l⎞ (1.7.2.17) a22 = − 2 e U cos 2 ⎜ 2 ⎟. η ⎝ 2 ⎠ В табл. 2 приведены значения a2 для различных значений n. Знание корней a2 позволяет по формуле (1.7.2.15) вычислить полную энергию электрона в потенциальной яме. С целью определения возможных значений полной энергии электрона в качестве примера, используя (1.7.2.16) и (1.7.2.17), выполним конкретный расчет при следующих исходных условиях: l = 2 нм, U = -10 эВ. Результаты вычислений представлены в табл. 1.7.2, в которой n – квантовое число. n
a2·10
9
- ε , эВ
1 1,48
2 3 1,67 4,44
4 5,03
5 7,38
9,92
9,89 9,25
9,04
7,92
6 7 8,40 10,3 5,9 7,33 5
8 13,2
9 15,9
3,37
0,35
Таблица 1.7.2. Результаты вычислений по (1.7.2.16) и (1.7.2.17) На рис. 1.7.2.3 изображена потенциальная яма и расположение уровней полной энергии при заданных параметрах a2 и U. Разумеется, при иных параметрах потенциальной ямы число и расположение уровней полных энергий в ней будет иным. Если глубина потенциальной ямы при заданной ее ширине l невелика, то число уровней в ней ограничено, и электрон в потенциальной яме по-прежнему обладает дискретными значениями полной энергии. Но чем больше ширина потенциальной ямы, тем большее число уровней будет находиться в ней, что непосредственно следует из решений уравнений. Если же провести подобный расчет для макроскопического тела (металла), то окажется, что число уровней в нем станет настолько большим, а энергетический интервал между соседними уровнями будет настолько мал, что отдельные уровни окажутся физически неразличимыми. Таким образом, в металле возникнет зона разрешенных значений энергии. И если она, допустим, частично заполнена, то такая зона разрешенных значений энергии называется зоной проводимости.
53 ε ,u
n
-10
0
10
ο
x,
A
9
8
ε 7 6 5 4 3
Рис. 1.7.2.3. Потенциальная функция и уровни энергии частицы в потенциальной яме с плоским дном Итак, чем больше l, тем больше будет квантовых чисел n, тем большее число волновых функций будут описывать движение электронов в потенциальной яме, поскольку каждой волновой функции должно соответствовать собственное значение полной энергии. В нашем примере число волновых функций 9. Ψ 2 (x) n=1 n=2 n=3 x, A -1.0
1.0
Рис. 1.7.2.4. Графики плотности вероятности для частицы в потенциальной яме
54
На рис. 1.7.2.4 изображены графики плотности вероятностей для первых трех квантовых чисел. Из рис. 1.7.2.4 видно, что с ростом n понижается высота максимума плотности вероятности, кроме того, число максимумов для заданного n равно числу n. Если ширина потенциальной ямы достаточно велика, то n будет велико, и для электрона, обладающего достаточно большой энергией, число максимумов будет столь велико, что они окажутся физически неразличимыми. Таким образом, в этом случае положение электрона можно определить лишь с точностью до ширины потенциальной ямы. Электрон теперь как бы "размазан" по всей ширине потенциальной ямы. 1.7.3. Движение электрона над потенциальной ямой Пусть энергия электрона ε > 0. Тогда при движении на его пути не встречается потенциальный барьер (рис. 1.7.3.1). Классическая механика показывает, что никаких препятствий для движения частицы в прямом направлении не возникает, отражение от потенциального барьера не происходит. Рассмотрим ту же задачу, применив для ее решения уравнение Шредингера ∂ψ (1.7.3.1) Hˆ ψ = i η . ∂t ε U ρ v
ε
m e
l
x
0
I
II
III
Рис. 1.7.2.5. Схема движения электрона над потенциальной ямой
55
Его решение представим в виде произведения двух волновых функций: (1.7.3.2) ψ( x, t ) = ψ(x ) ψ(t ), где i − εt
ψ (t ) = ψ 0 e η . Запишем стационарное уравнение Шредингера 2m (1.7.3.3) ψ ′′( x ) + 2e (ε − U ) ψ ( x ) = 0 . η Так как всюду полная энергия ε > 0, то решения уравнения (3) будут отличаться от полученных в п. 1.7.2. Как и раньше, все геометрическое пространство разделим на три области. В областях 1 и 3 2m U = 0, a12 = 2e ε > 0 . η В области 2 2m U < 0, a22 = 2e (ε − U ) > 0 . η Решениями уравнения (3) будут: в области 1 ψ1(x) = ψ01eia1x + ψ02e−ia1x , i − (ε t−ηa1x) η ψ1(x,t) = ψ01e +
i − (ε t+ηa1x) η ψ02e ;
в области 2 ψ 2 ( x) = ψ 03e ia 2 x + ψ 04 e −ia 2 x , ψ 2 ( x, t ) = ψ 03
i − ( ε t − ηa 2 x ) η e
+
ψ 04
i − ( ε t + ηa 2 x ) η e ;
в области 3 ψ 3 ( x) = ψ 05eia1 x + ψ 06 e −ia1 x , i − ( ε t − ηa1 x ) η e
i − ( ε t + ηa1 x ) η e ;
ψ 3 ( x, t ) = ψ 05 + ψ 06 Из полученных решений видно, что каждое из них содержит прямую и отраженную волну. Но так как в области 3 нет физических условий для возникновения отраженной волны при движении электрона в прямом направлении, то естественно положить ψ06 = 0. Коэффициенты отражения и прохождения можно выразить через отношения соответствующих значений плотности вероятности:
56 2
2
⎛ψ ⎞ ⎛ψ ⎞ (1.7.3.4) R = ⎜⎜ 02 ⎟⎟ , D = ⎜⎜ 05 ⎟⎟ . ψ ⎝ 01 ⎠ ⎝ ψ 01 ⎠ Для определения постоянных интегрирования ψ01 ,ψ02 ,ψ05 используем граничные условия, согласно которым на границе раздела соседних областей пространства должны быть равны не только волновые функции, но и их первые производные: ψ 01 + ψ 02 = ψ 03 + ψ 04 ⎛ ψ1 ( x) = ψ 2 ( x) ⎞ ⎟⎟ ; ⎜⎜ ⎝ ψ1 ' ( x) = ψ 2 ' ( x) ⎠ x = 0 ia1 (ψ 01 − ψ 02 ) = ia2 (ψ 03 − ψ 04 ) (1.7.3.6) ⎛ ψ 2 ( x ) = ψ 3 ( x) ⎞ ψ 03eia 2 l + ψ 02e − ia 2 l = ψ 05eia 2 l ⎜⎜ ⎟⎟ ; ia l − ia l ia l ⎝ ψ 2 ' ( x) = ψ 3 ' ( x) ⎠ x = l ia2 ψ 03e 2 − ψ 04e 2 = ia1ψ 05e 2
(
)
Для вычисления R и D необходимо знать Ψ01 ,Ψ02 ,Ψ05. Их значения можно найти из совместного решения системы уравнений (1.7.3.5): ⎛ i (a 2 + a22 ) sin a2l ⎞ ⎟⎟ ψ 01 , ∆ = 4e ia1l ⎜⎜ cos a2l − 1 2a1a2 ⎝ ⎠ ∆ψ 02 = ψ 01
(
)
,
ψ 05 =
2eia1l i a22 − a12 sin a2l , a1a2
∆ψ 05 = ψ 01 ⋅ 4 .
Тогда ψ 02 =
∆ψ 02 ∆
∆ψ 05 ∆
(1.7.3.6)
где ∆, ∆ψ02 , ∆ψ05 – значения соответствующих определителей системы уравнений. Значения из (1.7.3.6) подставляем в (1.7.3.4). В результате получаем: 2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 2 ⎟ − 1⎟ sin 2 a l 2 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠
D=
2
2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠ 2
(1.7.3.7)
.
(1.7.3.8)
2
2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
,
57
Из (1.7.3.7) следует, что существует определенная вероятность отражения электрона от правой границы потенциальной ямы, что не имеет места в классической физике. Электрон, пролетая над потенциальной ямой, как бы "чувствует" ее влияние, что и приводит к возникновению некоторой вероятности отражения от нее. Рассмотрим конкретный пример. Пусть U= -10 эВ, ε = 5 эВ, l=2нм. Расчет, выполненный по формулам (1.7.3.7) и (1.7.3.8), дает следующие результаты: R = 0,22, D = 0,78. Из формулы (1.7.3.7) следует, что при sin a2l = 0 коэффициент отражения R = 0. Следовательно, условие a2l = κπ соответствует условию квантования полной энергии электрона: h2 ε = U + κ2 , (1.7.3.9) 8mel 2 κ = 1, 2, 3, ... Условие (1.7.3.9) накладывает определенные ограничения на величину полной энергии. Если электрон, пролетая над потенциальной ямой, не чувствует ее влияния, sin a2l = 0, R = 0, то его полная энергия должна быть дискретна, т.е. квантована. 1.7.4. Движение электрона над потенциальным барьером Пусть на пути движения электрона расположен потенциальный барьер бесконечно большой толщины. Полная энергия электрона всюду больше потенциальной, ε > U0 > 0 (рис. 1). Рассмотрим влияние такого потенциального барьера на движений электрона. Для этого все пространство разобьем на две области. В области 1 U = 0, в области 2 U=const. ε U ρ v
ε
m e II
I
0
x
Рис. 1.7.4.1. Схема движения электрона над потенциальным барьером
58
Для каждой из областей пространства запишем стационарное уравнение Шредингера. Область 1 (1.7.4.1) ψ1′′( x) + a12ψ1 ( x) = 0 . Область 2 (1.7.4.2) ψ ′2′ ( x) + a22 ψ 2 ( x ) = 0 , где 2m 2m a12 = 2e ε, a22 = 2e (ε − U ) . η η Решениями дифференциальных уравнений (1.7.4.1) и (1.7.4.2) являются (1.7.4.3) ψ1 ( x) = ψ 01eia1 x + ψ 02e −ia1 x , (1.7.4.4) ψ 2 ( x) = ψ 03eia1 x + ψ 04e −ia1 x . Тогда с учетом временной составляющей волновой функции получаем: для области 1 ψ1 ( x, t ) =
i − ( ε t − ηa1 x ) η ψ 01e
+ ψ 02
i − ( ε t + ηa1 x ) η e ,
(1.7.4.5)
ψ1 ( x, t ) = ψ1пад ( x, t ) + ψ1отр ( x, t ) .
для области 2 ψ 2 ( x, t ) = ψ 03
i − ( ε t − ηa 2 x ) η e
+ ψ 04
i − ( ε t + ηa 2 x ) η e ,
(1.7.4.6)
ψ 2 ( x, t ) = ψ 2 пад ( x, t ) + ψ 2отр ( x, t ) . где ψ1пад( x ,t), ψ2пад( x ,t), ψ1отр( x ,t), ψ2отр( x ,t) – соответственно падающая и отраженная волны де Бройля. Из постановки задачи следует, что в области 2 отраженная волна возникать не может, поэтому ψ 2отр ( x, t ) = 0 , ψ 04 = 0 . Тогда волновая функция в области 2 будет иметь вид: i − ( ε t − ηa 2 x )
(1.7.4.7) ψ 2 ( x, t ) = ψ 03e η . Для определения постоянных интегрирования ψ01, ψ02, ψ03 запишем граничные условия для уравнений (1.7.4.5) и (1.7.4.7)? ⎛ ψ1 ( x ) = ψ 2 ( x ) ⎞ ⎜⎜ ⎟⎟ . ⎝ ψ1′ ( x) = ψ′2 ( x) ⎠ x =0 Тогда после подстановки соответствующих значений в граничные условия имеем:
59
ψ 01 + ψ 02 = ψ 03
⎫ (1.7.4.8) ⎬. a1ψ 01 − a1ψ 02 = a2 ψ 03 ⎭ Решив систему уравнений (1.7.4.8) совместно, получим a −a 2a1 (1.7.4.9) ψ 02 = 1 2 ψ 01 , ψ 03 = ψ 01. a1 + a2 a1 + a2 При движении в пространстве электрон обладает импульсом p=ħa1,2 . Поэтому p1 = ηa1 , p2 = ηa2 . Так как при движении электрона в пространстве вместе с ним переносится импульс, то плотность вероятности переноса импульса в области 1: в прямом направлении 2 2 , ω2 пад = p1ψ 01 = ηa1ψ 01 в обратном направлении 2 2 ω2обр = p1ψ 02 = ηa1ψ 02 Плотность вероятности переноса импульса в области 2 2 2 . ω2пад = p1ψ 03 = ηa1ψ 03 По определению, коэффициент отражения электрона от потенциального барьера ω1отр
⎛ψ ⎞ = ⎜⎜ 02 ⎟⎟ ω2пад ⎝ ψ 02 ⎠ коэффициент прохождения в область 2 R=
2
,
(1.7.5.10)
2
ω2 пад a2 ⎛ ψ 03 ⎞ . (1.7.5.11) ⎟ = ⎜ ω1пад a1 ⎜⎝ ψ 01 ⎟⎠ Подставив в (1.7.5.10) и (1.7.5.11) найденные в (1.7.5.9) значения, получим D=
2
⎛a −a ⎞ 4a1a2 , (1.7.5.12) R = ⎜⎜ 2 1 ⎟⎟ , D = 2 + a a ( ) a + a ⎝ 2 1⎠ 2 1 причем, как видно из (11) и (12), R + D = 1. Рассмотрим конкретный пример. Пусть ε = 10 эВ, U = 5эВ. После вычислений по (1.7.5.12) имеем: R = 0, 0294, D = 0, 9706. Если же ε = 10 эВ, U = 9 эВ, то R = 0,270, D = 0,730, т.е. с увеличением высоты потенциального барьера коэффициент отражения возрастает, и при условии U0≥ε электрон потенциальный барьер преодолеть не может.
60
В заключение сделаем следующее замечание. В настоящем параграфе рассматривалось движение электрона с использованием плотности вероятности переноса импульса. Этот подход к решению задачи является более общим по сравнению с решениями в разделах 1.7.2 и 1.7.3. Может возникнуть вопрос: "Почему же в тех разделах был получен физически правильный результат?" Причина заключается в том, что потенциальная энергия электрона в 1-ой и 3-ей областях пространства там была одинаковой, поэтому импульсы электрона в областях 1 и 3 также одинаковы: p1 = ηa1 , p2 = ηa2 . В результате при вычислении коэффициентов отражения и прохождения импульсы электрона сокращаются. Но если потенциальные энергии в областях 1 и 3 разные, то следует вычислять плотности вероятности переноса импульсов как в прямом, так и в обратном направлениях. 1.7.5. Движение электрона в направлении потенциального барьера конечной толщины Пусть на пути движения свободного электрона находится потенциальный барьер высотой U конечной толщины l. Полная энергия электрона ε < U (рис. 1.7.5.1) Как и ранее, все координатное пространство разделим на три области. В областях 1 и 3 потенциальная энергия электрона U = 0, в области 2 U > ε > 0. Вычислим коэффициент отражения электрона R от потенциального барьера и коэффициент прохождения электрона D сквозь потенциальный барьер. Запишем уравнение Шредингера и их решения для каждой из областей в отдельности. Область 1: (1.7.5.1) ψ1'' + a12 ψ1 ( x) = 0 . Решение дифференциального уравнения ψ1 ( x) = ψ 01e ia1 x + ψ 02 e −ia1 x , ψ1 ( x, t ) = ψ 01e
i − ( ε t − ηa1 x ) η
где a12 =
2me ε > 0. η2
+ ψ 02 e
i − ( ε t + ηa1 x ) η
,
61
ε U
vρ m
0
vρ
ε m
e I
II
e
III
0
λ
Рис. 1.7.5.1. Схема движения электрона к барьеру конечной ширины Область 2: (1.7.5.2) ψ '2' + a22ψ 2 ( x) = 0 . Решение дифференциального уравнения ψ 2 ( x) = ψ 03eia2 x + ψ 04e −ia2 x = ψ 03e a3x + ψ 04 e − a3x , где 2m 2m a22 = 2e (ε − U 0 ) < 0, a2 = ia3 , a32 = 2e (U − ε) > 0. η η Так как ширина потенциального барьера может быть достаточно большой, то при ψ03 ≠ 0 первое слагаемое с ростом может неограниченно возрастать, что не имеет физического смысла. Для исключения этого противоречия необходимо положить ψ03 = 0. Тогда решением дифференциального уравнения (1.7.5.2) является ψ 2 ( x ) = ψ 04 e − a3 x , (1.7.5.3) i i ψ 2 ( x, t ) = ψ 04 e
− ( ε t − iηa 3 x ) η
= ψ 04 e
− ( ε t − iηa 2 x ) η .
Область 3: ψ′3′ ( x) + a12 ψ 3 ( x ) = 0. Решение дифференциального уравнения ψ 3 ( x) = ψ 05eia1 x + ψ 06 e −ia1 x , i − ( ε t − iηa1 x ) η e
i − ( ε t + iηa1 x ) η e .
ψ 3 ( x, t ) = ψ 05 + ψ 06 Поскольку физических условий для отражения электрона в области 3 не существует, то ψ06 = 0 . Тогда
62
(1.7.5.4) ψ 3 ( x ) = ψ 05 e ia1x . Для определения амплитуд волновых функций ψ01, ψ02, ψ05 используем граничные условия: ⎛ ψ 2 ( x) = ψ 3 ( x) ⎞ ⎛ ψ1 ( x ) = ψ 2 ( x ) ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ; ′ ′ ⎝ ψ1 ( x ) = ψ 2 ( x ) ⎠ x = 0 ⎝ ψ′2 ( x) = ψ′3 ( x) ⎠ x = λ Таким образом, формально результаты вычислений в настоящем параграфе полностью совпадают с результатами вычислений в разделе 1.7.3, в котором рассматривалось движение электрона над потенциальной ямой. Различие состоит в том, что в разделе 1.7.3 a2 – действительная величина, здесь же a2 – мнимая величина. На основании этого все промежуточные вычисления можно опустить, записав сразу выражения для R и D, полученные в разделе 1.7.3: 2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 2 ⎟ − 1⎟ sin 2 a l 2 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ ⎝ a1 ⎠
D=
,
(1.7.5.5)
.
(1.7.5.6)
2
2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sin 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ Так как a2 = ia3 – мнимая величина, то e a 3l − e − a3l sin( a2l ) = sin(ia3l ) = sh ( a3l ) = . 2 Найденное выражение для подставим в (1.7.5.5) и (1.7.5.6): 2
2
2
R=
⎛ ⎛ a ⎞2 ⎞ ⎜ ⎜ 3 ⎟ − 1⎟ sh 2 (a l ) 3 ⎜ ⎜⎝ a1 ⎟⎠ ⎟ ⎝ ⎠ 2
⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 3 ⎟⎟ + ⎜ ⎜⎜ 3 ⎟⎟ − 1⎟ sh 2 (a3l ) ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ 2
2
,
(1.7.5.7)
63 2
⎛a ⎞ 4 ⎜⎜ 2 ⎟⎟ . (1.7.5.8) ⎝ a1 ⎠ D= 2 2 2 ⎞ ⎛ a ⎞ ⎛⎛ a ⎞ 4⎜⎜ 2 ⎟⎟ + ⎜ ⎜⎜ 2 ⎟⎟ − 1⎟ sh 2 a2l ⎟ ⎝ a1 ⎠ ⎜⎝ ⎝ a1 ⎠ ⎠ Выражение для коэффициента прохождения электрона через барьер может быть представлено в виде ⎛ 2 ⎞ D = D0 exp⎜ − 2me (U 0 − ε) ⋅ l ⎟ ⎝ η ⎠ где величина D0 близка к единице. При этом R=1-D. Из физического смысла формул (1.7.5.7) и (1.7.5.8) следует, что здесь отсутствуют условия квантования, причина состоит в том, что sh(a3l) не является периодической функцией. Следовательно, при любых значениях ε, U, l имеется определенная вероятность для электрона преодолеть потенциальный барьер без изменения полной энергии; электрон, сталкиваясь с потенциальным барьером, с определенной вероятностью может пройти через него как через туннель. Поэтому это явление, этот эффект еще называется туннельным эффектом. Опыт подтверждает предсказание теории. Оценим теперь вероятность туннельного эффекта для слоев различной толщины. Расчет выполним для U = 5 эВ и двух значений полной энергии: 3 эВ и 4, 8 эВ. Результаты вычислений по формулам (1.7.5.7) и (1.7.5.8) сведены в табл. 1.7.3.
ε, эВ
R
D
l, A
l, A
0,1
0,2
0,3
0,4
0,1
0,2
0,3
0,4
3
0,395
0,810
0,952
0,989
0,605
0,190
0,048
0,011
4,8
0,259
0,596
0,783
0,879
0,741
0,404
0,217
0,121
Таблица 1.7.3. Вероятность туннельного эффекта для слоев различной толщины Как следует из табл. 1.7.3, туннельный эффект может проявляться лишь на расстояниях, сравнимых с размерами атомов. В последние годы туннельный эффект неожиданно нашел практическое применение: на основе использования этого эффекта были разработаны и успешно применяются туннельные микроскопы, с помощью которых
64
можно исследовать и визуализировать изучаемую поверхность на атомно-молекулярном уровне. Для этого используется микроскопический зонд, который перемещается вдоль поверхности в непосредственной близости от нее. Регистрируемый сигнал усиливается, и на экране осциллографа или телевизора наблюдается профиль изучаемой поверхности, что, в свою очередь, является экспериментальным доказательством существования этого эффекта. На основе использования представлений о туннельном эффекте объясняются некоторые физические явления, такие как автоэлектронная эмиссия или α-распад. При помощи туннельного эффекта можно объяснить принцип работы туннельных диодов и других тонкопленочных элементов, разработанных в начале 60-х годов. Эти элементы в настоящее время промышленностью выпускаются серийно. Наконец, с помощью туннельного эффекта можно объяснить механизм проводимости тонких диспергированных пленок, ибо в очень тонких пленках толщиной в моноатомный слой механизм проводимости иной, нежели в массивном образце: там не выполняется закон Ома и наблюдается ряд особенностей, вызванных тем, что средняя длина свободного пробега электрона сравнима с расстоянием между отдельными атомными образованиями (кластерами), существующими на поверхности твердого тела. 1.7.6. Автоэлектронная эмиссия Возможность прохождения электрона или другой микрочастицы (нуклон в ядре атома, α-частица) через потенциальный барьер конечной толщины впервые получила экспериментальное подтверждение в явлении эмиссии электронов из металлов, возникающей под действием внешнего электрического поля. Это явление называется автоэлектронной эмиссией. Сущность явления следующая. Действие внешнего электрического поля напряженностью Е приводит к тому, что на границе металл– вакуум возникает потенциальный барьер конечной толщины вместо существовавшего ранее потенциального барьера бесконечно большой толщины. Этот барьер в сильных полях оказывается достаточно тонким, и электрон за счет туннельного эффекта может вылететь за пределы металла. В результате эмиссия электронов начинается при значительно меньших значениях напряженности электрического поля Е по сравнению с классической оценкой явления. Так как эта эмиссия электронов возникает при любой температуре, в том числе и комнатной, то явление называется холодной эмиссией электронов.
65
Внешнее электрическое поле в металл практически не проникает, оно лишь действует на электроны поверхностного слоя, на пути движения которых теперь расположен достаточно узкий потенциальный барьер. Поэтому имеется определенная вероятность преодолеть такой потенциальный барьер туннельным эффектом. В настоящее время явление автоэлектронной эмиссии нашло практическое применение. В частности, оно используется в электронных проекторах, у которых увеличение изображения объекта достигает величины 2·106. При таком увеличении изображения отдельных участков поверхности острия вольфрамового катода получаются такой величины, что можно отчетливо наблюдать на экране проектора поверхность кристаллической решетки, а также отдельные поверхностные атомные скопления – кластеры. Для получения большой величины напряженности электрического поля вблизи поверхности катода он должен быть очень тонким, радиус кривизны поверхности катода должен быть порядка 1 мкм. Только в этом случае можно получить сильное электрическое поле вблизи поверхности катода (рис. 1.7.6.1).
-
+
Рис. 1.7.6.1. Схема применения игольчатого катода Явление автоэлектронной эмиссии нашло широкое применение в промышленности. Речь идет о следующем. В 70-х–90-х гг. ХХ века на основе использования явления автоэлектронной эмиссии были разработаны катоды для целого ряда электронно-лучевых приборов. Использование таких катодов позволило резко увеличить ток эмиссии электронов, сделать сильноточные установки более надежными и компактными. Сильное электрическое поле позволяет туннельным эффектом вырывать электроны не только с поверхности металла и жидкости, но и из отдельных атомов и молекул. Это явление называется автоионизацией. В настоящее время явление автоионизации используется в ионных источниках масс-спектрометров. Достоинством таких источников является отсутствие у них накаленных электродов, а также отсутствие диссоциации анализируемых молекул.
66
Глава 2. ФИЗИКА АТОМОВ И МОЛЕКУЛ 2.1. Основные понятия Как известно, атом – наименьшая составная часть вещества, в которой сохраняется индивидуальность химического элемента. Сам химический элемент – это совокупность атомов одного сорта. Взаимодействие между атомами при наличии достаточно сильной связи может приводить к образованию молекул. Каждый атом состоит из положительно заряженного ядра и вращающихся вокруг него электронов. Таким образом, ядро атома окружено облаком электронов, образующих электронные оболочки. Размеры атома определяются размерами его электронной оболочки, строго говоря, не имеющей определенной границы. В нормальном состоянии атомы электрически нейтральны. Но существуют условия, при которых атом может потерять или присоединить дополнительные электроны, превращаясь соответственно в положительный или отрицательный ион. Строение электронных оболочек атома определяется электромагнитными взаимодействиями электронов оболочки с ядром и между собой. Электромагнитное взаимодействие в веществе на порядки превышает гравитационное взаимодействие, поэтому все силы, действующие между частицами и приводящие к образованию атомов, молекул, жидкого и твердого состояния вещества, имеют только электромагнитное происхождение. Попытки перенести в атомную физику понятия и законы физики макроскопических тел показали неприменимость многих понятий классической физики в физике микромира. Это можно проиллюстрировать на примере системы, состоящей из двух частиц – протона и электрона (атом водорода). В процессе движения между электроном и протоном существует электромагнитное взаимодействие. Классическое решение задачи приводит к планетарной модели атома, согласно которой электрон вокруг ядра движется по круговой или эллиптической орбите. Но согласно классической электродинамике вращающийся вокруг ядра электрон должен непрерывно излучать электромагнитные волны и при этом непрерывно терять энергию. В результате через некоторое время электрон должен упасть на ядро. Опыт не подтверждает этот теоретический результат. Решение той же задачи с использованием уравнения Шредингера приводит к результату, полностью соответствующему опыту.
67
Так как процесс решения реальных задач с использованием уравнения Шредингера – очень непростая с математической точки зрения процедура, то в квантовой механике определенные математические действия символически отображаются в виде операторов. С некоторыми из них мы познакомились ранее. Тогда на языке операторов любую сложную математическую задачу можно достаточно просто формализовать, проще проследить за отдельными этапами ее решения, легче сделать определенные физические выводы. 2.2. Оператор момента импульса Физические особенности атомов, молекул, твердых тел хорошо объясняются особенностями строения электронной оболочки отдельных атомов. Атомные электроны, образующие электронную оболочку, непрерывно находятся в движении вокруг ядра. Движение это криволинейное, и его важнейшей динамической характеристикой является ρ момент импульса L . Момент импульса в квантовой теории играет значительно более важную роль, чем в классической физике, поскольку в микромире существует деление частиц на фермионы и бозоны, коллективное поведение которых существенно различается между собой. Кроме того, с формальной точки зрения поля с различными спиновыми квантовыми числами s представляются различными математическими объектами: так, частицам, у которых s = 0, соответствует скалярная волновая функция, частицам, у которых s = 1/2, соответствует спинорная волновая функция, а частицам, у которых s = 1, соответствует векторная волновая функция. В классической механике момент импульса электрона в принципе может быть определен совершенно точно, так как никаких ограничений на точность определения координаты и импульса там не накладывается: ρ ρ ρ (2.2.1) L =r × p. В квантовой механике на одновременное определение r и p соотношениями неопределенностей накладывается определенное ограничение, а именно (2.2.2) ∆r ∆ p > h . Поэтому точное определение момента импульса, например, путем задания трех его проекций, в квантовой механике не имеет физического смысла. Тем не менее, исходя из определения момента импульса, выражение для оператора момента импульса составить можно:
68
где
ρ ρ ρ ρ ρ ρ L = r × p = ( y pz − z p y ) i + ( z px − x pz ) j + ( z p y − y pz ) k , (2.2.3) ρ ρ ρ ρ ρ ∂ ∂ ∂ rˆ = r = x i + y j + z k ; pˆ x = −i η , pˆ y = −i η , pˆ z = −i η ; ∂x ∂y ∂z ˆ ˆ ˆ (2.2.4) ypˆ z − zpˆ y = Lx , zpˆ x − xpˆ z = Ly , zpˆ y − ypˆ z = Lz .
Используя результаты (2.2.3) и (2.2.4), составим разность произведений разноименных проекций моментов импульса на координатные оси. После некоторых математических преобразований получаем следующий результат: Lˆ x Lˆ y − Lˆ y Lˆ x = i η Lˆ z ⎫ ⎪⎪ (2.2.5) Lˆ x Lˆ z − Lˆ z Lˆ x = − i η Lˆ y ⎬ . ⎪ Lˆ y Lˆ z − Lˆ z Lˆ y = − i η Lˆ x ⎪⎭
ρ ˆ
Предположим, что оператор момента импульса L имеет собственное значение. Тогда ρ ρ ρ ρ ˆ L = Lˆ x i + Lˆ y j + Lˆ z k , Lˆ x ψ = Lx ψ, Lˆ y ψ = L y ψ, Lˆ z ψ = Lz ψ . Операторы (5) умножим справа на волновые функции: (2.2.6) Lˆ x ( Lˆ y ψ ) − Lˆ y ( Lˆ x ψ ) = i η Lˆ z ψ =. Но Lˆ x ( Lˆ y ψ ) = Lˆ x ( L y ψ ) = Lˆ y ( Lˆ x ψ ) = L y Lx ψ . Аналогично имеем: Lˆ y ( Lˆ x ψ ) = Lˆ y ( Lx ψ ) = Lx ( Lˆ y ψ ) = Lx L y ψ . Найденные значения подставим в (2.2.6): i η Lz ψ = ( L y Lx − Lx L y ) ψ = 0, Lz = 0. Аналогично доказывается, что Lx = Ly = 0. Таким образом, собственные значения проекций оператора момента импульса равны нулю, значит, и собственное значение оператора момента импульса также равно нулю. Физически это означает, что в ρ отсутствие действия внешнего поля оператор Lˆ в пространстве не опρ ределен, вектор L в пространстве в процессе движения может иметь любое, произвольное направление. Это эквивалентно тому, что у него нет собственного значения. Однако в определенные моменты времени его проекции на координатные оси все-таки существуют.
69
Движение электрона в атоме вокруг ядра происходит по криволинейной траектории. Поэтому для описания движения электрона в пространстве, естественно, следует использовать сферическую систему координат (рис. 2.2.1).
z ρ Lz
θ ρ Lx
ϕ
ρ L
ρ Ly
y
x Рис. 2.2.1. Сферическая система координат Запишем операторы проекций импульсов в сферической системе координат: ∂ ∂ Lˆ x = i η (sin ϕ + ctg θ cos ϕ ), ∂ϕ ∂θ ∂ ∂ Lˆ y = i η(− cos ϕ + ctg θ sin ϕ ), ∂θ ∂ϕ ∂ Lˆ z = − i η . ∂ϕ Из уравнения (2.2.1) следует, что величина вектора момента имρ ρ пульса L зависит от выбора начала отсчета r . В то же время проекции операторов моментов импульса Lˆ x , Lˆ y , Lˆ z на соответствующие координатные оси не зависят от выбора начала отсчета и поэтому направления координатных осей для них может быть выбрано произвольно. ρ Так как собственное значение оператора момента импульса Lˆ в принципе определить невозможно, это означает, что одновременное определение трех и даже двух значений проекций моментов импульса невозможно. Однако любое собственное значение хотя бы одной проекции оператора все-таки определить возможно. Расчет показывает, что оператор квадрата момента импульса
70
ρ ⎛ 1 ∂ ⎛ ∂ 1 ∂ 2 ⎞ ⎞⎟ ˆ ⎜⎜ sin θ + ⎟ . L 2 = − η2 ⎜⎜ ∂θ sin 2 θ ∂ϕ 2 ⎟⎠ ⎟⎠ ⎝ sin θ ∂θ ⎝
Тогда
ρ ˆ (2.2.7) L2 ψ = L2 ψ , L2 = η2 λ(λ + 1), где ℓ – так называемое орбитальное квантовое число, ℓ = 0, 1, 2, … . ρ Иными словами, несмотря на то, что направление вектора L в пространстве не определено, а потому ρ ˆ L ψ ≠ Lψ ,
ρ ˆ
собственное значение оператора L2 все-таки определить можно. Из всех операторов проекций момента импульса на координатные оси X, Y, Z наиболее простое выражение имеет оператор проекции на ρ ось 0Z. Определим собственное значение проекции Lz : ∂ψ (2.2.8) Lˆ z ψ = Lz ψ, − i η = Lz ψ. ∂ϕ Отсюда после разделения переменных и последующего интегрирования получаем: ψ = ψ0
i Lz ϕ eη
= ψ0 e
⎛L ⎞ i ⎜ z (ϕ − 2 π ) + 2 π m ⎟ ⎝ η ⎠
или Lz (ϕ − 2 π) + 2 π m = Lz ϕ . η η Тогда после сокращения на величину (Lzφ)/ћ получаем Lz (2.2.9) (ϕ − 2 π) + 2 π m = Lz ϕ. η η Отсюда Lz = ηm , где m – магнитное квантовое число, m = 0,±1,±2, …,±ℓ, ℓ – орбитальное квантовое число. Итак, в отсутствие внешних полей направление оси 0Z в пространстве никак не определено. Наличие внешнего магнитного поля позволяет однозначно определить направление оси 0Z в пространстве. В этом случае принято, что координатная ось 0Z направлена вдоль вектора внешнего магнитного поля. В качестве примера вычислим кинетическую энергию электрона, вращающегося вокруг ядра атома
71 2
Iω (2.2.10) , 2 где I – момент инерции электрона, ω – угловая скорость вращения. Угловую скорость выразим через момент импульса L (2.2.11) ω= . I Тогда после подстановки в (2.2.11) и (2.2.10) значения L из (2.2.7) получаем η2 (2.2.12) ε к вр = λ(λ + 1). 2I Из (2.2.12) следует, что кинетическая энергия вращательного движения электрона вокруг ядра атома – всегда дискретная величина, она не может принимать любые непрерывные значения. Опыт подтверждает этот результат. ε к вр =
2.3. Атом водорода
Точное аналитическое решение допускают лишь немногие задачи квантовой механики. К ним относится задача об атоме водорода. На примере атома водорода можно в общих чертах понять методы решения подобных задач для многоэлектронных атомов. В этом состоит большая познавательная ценность такого анализа. Атом водорода – простейший из атомов вещества, он состоит из ядра (протон) и вращающегося вокруг него электрона. Считаем, что центр инерции атома совпадает с центром инерции ядра. Это допущение достаточно обосновано, так как масса ядра значительно больше массы электрона. Движение электрона происходит вокруг силового центра в поле кулоновских сил. Поле таких сил обладает сферической симметрией. В квантовой механике понятие траектории отсутствует. С помощью волновой функции можно определить лишь вероятность положения электрона в атоме и тем самым составить представление о характере его движения. Электрическое поле протона, в котором находится электрон, определяет потенциальную энергию электрона e2 (2.3.1) U =− < 0. 4 π ε0 r
72
Запишем стационарное уравнение Шредингера в сферической системе координат: 2m (2.3.2) ∆ψ(r , θ, ϕ) + 2 e (ε − U ) ψ(r , θ, ϕ) = 0, η где ∆ – оператор Лапласа; ε – собственная энергия оператора Гамильтона (полная энергия электрона в атоме). Оператор Лапласа в сферической системе координат имеет вид: ∂ ∂ 1 ⎛∂ 1 ⎛ ∂ 1 ∂ 2 ⎞ ⎞⎟ ⎜⎜ sin θ + ⎟ . ∆ = 2 ⎜⎜ r 2 + ∂θ sin θ ∂ϕ 2 ⎟⎠ ⎟⎠ r ⎝ ∂r ∂r sin θ ⎝ ∂θ Отсюда следует, что его можно представить в виде двух слагаемых, одно из которых зависит только от координаты r, а другое – от углов θ и φ: 1 (2.3.3) ∆ = 2 (∆ r + ∆ θ,ϕ ), r где ∂ 1 ∂2 ⎞ ∂ ∂ 1 ⎛ ∂ ⎜⎜ sin θ + ⎟. ∆ r = r 2 , ∆ θ ,ϕ = ∂θ sin θ ∂ϕ2 ⎟⎠ ∂r ∂r sin θ ⎝ ∂θ Тогда уравнение (2.3.2) можно записать по-иному: 1 (2.3.4) (∆ r + ∆ θ,ϕ ) ψ(r, θ, ϕ) + 2m2 e (ε − U ) ψ(r, θ, ϕ) = 0. 2 r η Для решения уравнения (2.3.4) применим метод разделения переменных Фурье, согласно которому волновую функцию ψ(r,θ,φ) можно представить в виде произведения двух волновых функций, причем каждая из них зависит либо от координаты r, либо от углов θ и φ: (2.3.5) ψ ( r , θ, ϕ) = ψ ( r )ψ (θ, ϕ) . Заметим, что применение метода Фурье в нашем случае возможно потому, что потенциальная энергия электрона не зависит от времени. Подставим значение ψ(r,θ,φ) из (2.3.5) в уравнение (2.3.4): 2me ψ (θ, ϕ) ∆ r ψ (r ) + ψ (r )∆ θ, ϕ ψ (θ, ϕ) + 2 r 2 (ε − U )ψ (r )ψ (θ, ϕ) = 0 . η Каждое из слагаемых полученного уравнения разделим на волновую функцию (2.3.5): ∆ θ, ϕψ(θ, ϕ) ∆ r ψ ( r ) 2m e 2 + 2 r (ε − U ) + = 0. ψ(r ) ψ(θ, ϕ) η В полученном уравнении два первых слагаемых зависят только от координаты r, а одно слагаемое – только от углов θ и φ, следовательно, их можно разъединить, записав
73
∆ θ, ϕψ(θ, ϕ) ∆ r ψ ( r ) 2m e 2 (2.3.6) + 2 r (ε − U ) = − = λ. ψ (r ) ψ (θ, ϕ) η Уравнения (2.3.6) корректно, если каждое из них равно одной и той же постоянной величине λ, эта величина будет определена в дальнейшем. Таким образом, уравнение (2.3.6) представляет собой два взаимосвязанных дифференциальных уравнения с коэффициентом связи λ. Рассмотрим первоначально угловую часть уравнения Шредингера (2.3.7) ∆ θ ,ϕ ψ (θ, ϕ) + λψ (θ, ϕ) = 0 .
Как следует из (2.3.3), sin 2 θ ⋅ ∆ θ,ϕ = ∆ θ + ∆ ϕ .
Уравнение (2.3.7) умножим на sin2θ : sin 2 θ ∆ θ,ϕ ψ (θ, ϕ) + λ sin 2 θ ψ (θ, ϕ) = 0 . Но так как ψ (θ, ϕ) = ψ (θ) ψ (ϕ), то (∆ θ + ∆ ϕ ) ψ(θ) ψ (ϕ) + λ sin 2 θ ψ (θ) ψ (ϕ) = 0. Из полученного уравнения видно, что и в этом случае переменные разделяются: ∆ ψ (ϕ) ∆ θ ψ (θ) = m2 , + λ sin 2 θ = − ϕ ψ (ϕ) ψ (θ)
где m = const. В результате имеем ∆ θψ (θ) + λ sin 2 θ ψ (θ) = m 2 , ∆ ϕψ(ϕ) + m ψ(ϕ) = 0. 2
(2.3.8) (2.3.9)
Решением уравнения (2.3.9) является волновая функция ψ(φ)=ψ0eimφ, оно совпадает с решением дифференциального уравнения (2.2.8) в разделе 2.2. Поэтому постоянная m имеет ясный физический смысл – это магнитное квантовое число, следовательно, m = 0, ±1, ±2, ±3, …. Анализ показывает, что решение уравнения (2.3.8) возможно, если λ = λ(λ + 1), λ = 0,1, 2, 3, Κ . ℓ – орбитальное квантовое число. Теперь вернемся к координатной части уравнения Шредингера. Из (2.3.6) следует, что ⎞ ⎛ 2m ∆ r ψ ( r ) + ⎜ 2 e r 2 (ε − U ) − λ ⎟ ψ ( r ) = 0 ⎝ η ⎠ или в развернутом виде d 2 ψ (r ) 2 dψ (r ) λ(λ + 1) ⎞ ⎛ 2m + + r 2 ⎜ 2 e (ε − U ) − ⎟ ψ(r ) = 0 . (2.3.10) r dr dr 2 r2 ⎠ η ⎝
74
Решение уравнения (2.3.10) возможно, если полная энергия электрона квантована: me e 4 (2.3.11) ε=− 2 , ν = 0, 1, 2, 3, ... . 2 8 h ε 0 (ν + λ + 1) Обозначим n=ν+ℓ+1, n – главное квантовое число, n = 1,2,3,…,∞. Отсюда следует, что ℓ = 0, 1, 2, 3, … , n - 1; m = 0, ±1, ±2, ±3, … , ±ℓ . Тогда полная энергия электрона в атоме водорода m e4 1 (2.3.12) ε = − e2 ⋅ 2 , 8 h ε0 n Это энергия стационарного состояния, она всегда квантована. Теперь определим волновые функции ψ(r) и ψ(θ). Волновая функция ψ(φ) была ранее определена в (2.3.10). Как показывает анализ, при заданном магнитном квантовом числе m регулярное решение ψ(θ) имеет следующий вид: 1
⎛ ( 2 λ + 1)(λ − m )! ⎞ 2 m ⎟ sin θ Pλ m ( cos θ ), ψ (θ) = ⎜⎜ ⎟ ⎝ 2 (λ + m )! ⎠
(2.3.13)
где Pλ m ( cos θ ) – присоединенный полином Лежандра. Решение для радиальной части уравнения ψ(r) имеет вид: 1
λ
3 − − ⎛ 2ρ ⎞ ⎛ 4(n − λ − 1)! ⎞ 2 n ⎛ 2ρ ⎞ ⎟ ( a0 ) 2 ⎜ ⎟ e L2nλ++λ1 ⎜ ⎟ , ψ ( r ) = ⎜⎜ 4 3 ⎟ ⎝ n ⎠ ⎝ n ⎠ ⎝ n ((n + λ)!) ⎠ 2 где a 0 = η , ρ = r , L2nλ++11 ⎛⎜ 2ρ ⎞⎟ – полином Лагерра. a0 me e 2 ⎝ n ⎠ Общее число возможных решений при n = const равно n −1
∑ (2 λ + 1) = n λ= 0
2
.
ρ
(2.3.14)
(2.3.15)
Итак, получается, что заданному значению n соответствует n2 различных волновых функций. Другими словами говоря, полной энергии ε соответствует n2 различных волновых функций. В подобных случаях говорят, что данное состояние вырождено с кратностью вырождения n2. Вырождение снимается внешним возмущением со стороны электрического или магнитного поля.
75
2.4. Снятие вырождения состояний в атоме водорода
Ранее в разделе 2.3 было показано, что одному и тому же главному квантовому числу n соответствуют n2 различных состояний. Физически это означает, что в отсутствие действия внешних электрических и магнитных полей эти состояния оказываются совпадающими по энергиям, т.е. вырожденными и потому физически неразличимыми. Если же атом находится во внешнем электрическом или магнитном поле, то вырождение состояний у него снимается. Электрическое поле снимает вырождение состояний по орбитальному квантовому числу ℓ, магнитное поле – по магнитному квантовому числу m. Если же в объеме, где находится атом, одновременно существуют электрические и магнитные поля, то вырождение снимается как по орбитальным, так и по магнитным квантовым числам. Тогда каждой паре значений квантовых чисел ℓ и m будет соответствовать свое значение полной энергии, свой уровень полной энергии: уровень полной энергии расщепляется на столько уровней, сколько существует их возможных значений, т.е. на n2 уровней. Рассмотрим более детально физическую причину снятия вырождений состояний в атоме водорода. 2.4.1. Снятие вырождения состояний по магнитному квантовому числу Пусть атом водорода находится в магнитном поле, в частности, это поле может быть либо внешним, либо оно создается другими движущимися электронами, его величина должна быть достаточно большой, порядка 1 Тл, в противном случае эффект расщепления уровней полной энергии будет незаметен. Введем систему координат, у которой координатная ось 0Z в пространстве совпадает с направлением вектора индукции магнитного поля B (рис.2.4.1.1). Воспользуемся полуклассическим приближением о движении электрона. В данном случае оно приводит к правильному результату. На рис. 2.4.1.1 положение электрона q2 определяется радиусомρ ρ вектором r , v – мгновенная скорость электрона. Мысленно будем считать, что каждому мгновенному положению электрона соответствует своя траектория, вдоль которой электрон движется по круговой орбите. Мгновенное положение оси вращения такой круговой орбиты образует с осью 0Z угол α. Вращающийся вокруг ядра электрон облаρ ρ дает моментом импульса L и магнитным моментом pm . Движущийся
76
по воображаемой орбите электрон создает ток J, а вращающийся вокруг ядра (протона) электрон обладает моментом инерции I. ρ pm
z
ρ B
α
I q2 = e < 0
ρ r
ρ v
q1
ρ
ω
ρ L
Рис. 2.4.1.1. Движение электрона по орбите в магнитном поле По определению, магнитный момент кругового тока q (2.4.1.1) pm = J ⋅ S = 2 π r 2 . T Момент импульса вращающегося вокруг ядра электрона 2π (2.4.1.2) L = I ω = me r 2 , T где T – период обращения электрона вокруг ядра. Запишем отношение pm q (2.4.1.3) = 2 = g, L 2me g – гиромагнитное отношение. Из рис. 2.4.1.1 следует, что орбитальные магнитный момент и момент импульса направлены в противоположные стороны, поэтому ρ ρ (2.4.1.4) p m = − g L. Находясь во внешнем магнитном поле, круговой ток приобретает дополнительную энергию ρ ρ (2.4.1.5) ∆ε = − pm B = g B L cos α, причем L cos α = Lz = m η, m – магнитное квантовое число. Поэтому ∆ε = g B η m , (2.4.1.7) m = 0, ± 1, ± 2, ± 3, ... , ± λ.
77
Таким образом, каждый уровень полной энергии расщепляется на 2l+1 уровней (рис. 2.4.1.2).
n
ε
∞
0
3
2
} }
4∆ε
2∆ε
Рис. 2.4.1.2. Расщепление энергетических уровней электрона в магнитном поле Заметим, что при такой постановке задачи на воображаемый круговой ток действует момент силы, под влиянием которого плоскость орρ биты вращается с угловой скоростью прецессии Ω . Причина вращения воображаемого кругового тока в следующем. По определению, момент силы, действующий на круговой ток, ρ ρ ρ M = pm × B , под действием этого момента силы мгновенная плоскость воображаемой орбиты вращается вокруг оси 0Z с угловой скоростью прецессии ρ ρ Ω = g B. Такой способ описания движения электрона по сложной незамкнутой криволинейной траектории позволяет значительно упростить анализ движения: реальное движение можно разложить на два простых движения, которые легко подаются анализу и расчету. В основном состоянии радиус первой орбиты электрона r = 0,53·10-10 м, период обращения по орбите Т = 1,52·10-16 с. Кроме того, q2 = 1,6·10-19 Кл, me = 9,1·10-31 кг, g = 1,76·1011 Кл/кг. Тогда при индукции внешнего магнитного поля В = 10 Тл имеем pm = 1,75·10-13 А·м; М = 1,75·10-12 Н·м; Ω = 1,76·1012 с-1 ; ∆ε=0,004 эВ.
78
Из рассмотренного примера следует, что вырождение состояний по магнитному квантовому числу снимается только в сильных магнитных полях. Внешними макроскопическими источниками такие поля создавать достаточно сложно. Другое дело – поле в многоэлектронных атомах. В них в центральной части атома магнитное поле создается всеми электронами электронной оболочки атома. Эти поля достаточно велики. Так, если воспользоваться результатами рассмотренного выше примера, то окажется, что индукция магнитного поля, созданного электроном атома водорода в состоянии с главным квантовым числом n = 2 в центре атома, В = 3,67·109 Тл . Сравним теперь угловую скорость орбитального движения электрона с угловой скоростью прецессии. Вычисление отношения этих угловых скоростей дает величину 23000, т.е. мгновенная угловая скорость вращения электрона на воображаемой круговой орбите будет в десятки тысяч раз больше величины угловой скорости прецессии орбиты. Поэтому при проведении расчетов плоскость орбиты электрона можно считать практически неподвижной. 2.4.2. Снятие вырождений по орбитальному квантовому числу Рассмотрим теперь, как снимается вырождение состояний по орбитальному квантовому числу. Пусть атом находится во внешнем электрическом поле. Под действием этого поля электронная оболочка атома смещается, происходит поляризация атома: в пространстве вместо нейтрального атома возникает эффективный диполь, образованный смещенным эффективным отрицательным зарядом электронной оболочки атома q2* и положительно заряженным ядром (протоном) q1 (рис. 2.4.2.1). Конечно, эта наглядная модель является приближенной, но она весьма удобна для дальнейших вычислений. Строго говоря, подобная задача может быть решена только методами квантовой механики, и то лишь для водородоподобных атомов. Для более сложных атомов решение возможно приближенными методами. Качественный подход дает следующий результат. Пусть атом водорода находится во внешнем электрическом поле, тогда под действием сил электрического поля в пространстве произойдет смещение более легкого электрического заряда q2 = e относительно тяжелого заряда протона на величину эффективного плеча ди-
ρ
поля λ . В результате в объеме возникает эффективный диполь, электрический момент которого ρ ρ pe = q *2 λ.
79
ρ F1
q1 q*2
ρ E
ρ λ
ρ r
q2
ρ* F2
Рис. 2.4.2.1. Смещение орбиты электрона в электрическом поле Для состояний с главными квантовыми числами n > 1 pe=const>0. Возникновение эффективного диполя приводит к тому, что атом в электрическом поле приобретает дополнительную энергию ρ ρ ∆ε = − pe E . С точки зрения квантовой механики причина здесь следующая. В отсутствие внешнего электрического поля полная энергия атома зависит только от величины момента импульса L и не зависит от его ориентации в пространстве. Во внешнем электрическом поле ориентации моментов импульса на ось 0Z квантованы: Lz = m η . Атом приобретает дополнительную энергию, которая при этом может принимать только дискретные значения. Анализ показывает, что каждый уровень полной энергии расщепляется на несколько уровней, энергетический интервал между которыми (2.4.2.1) ∆ε = A ⋅ ( 2 λ − ( n − 1) + m ) n E , -9 Здесь A – нормирующий множитель, A = 1, 6·10 эВ·м/В; n, ℓ, m – главное, орбитальное, магнитное квантовые числа. Расщепление уровней энергии под действием электрического поля называется эффектом Штарка. В табл. 2.1 приводятся значения интервалов ∆ε между соседними уровнями полной энергии, вычисленные по формуле (2.4.2.1) при различных значениях квантовых чисел n, ℓ, m в электрическом поле Е = 107 В/м.
80
n 1
m
ℓ 0 0 1 1
2
0 0 0 1
∆ε 0 -2A·E 2A·E 4A·E
∆ε, эВ 0 -0,016 0,016 0,032
Таблица 2.1. Значения интервалов между соседними уровнями полной энергии n
∞
ε
E1
E2
1
m
1 1
1 0
0
0
0
0
0
∆ε 2
λ
2∆ε
Рис. 2.4.2.2. Расщепление энергетических уровней электрона в электрическом поле Как следует из табл. 2.1, заметное расщепление уровней полных энергий можно наблюдать лишь в сильных электрических полях. Опыт подтверждает установленный теоретически результат. Линейный эффект Штарка характерен для атомов водорода в не слишком сильных полях и составляет тысячные доли эВ при напряженности электрического поля Е = 106 В/м. На рис. 2.4.2.2 изображены уровни полных энергий электрона в атоме водорода как в отсутствие внешнего электрического поля Е1, так в электрическом поле напряженностью Е2 для различных квантовых чисел. Уровень полной энергии, соответствующий невозбужденному состоянию атома, в электрическом поле пропадает, а вновь возникшие уровни полной энергии теперь расположены несимметрично. Штарк-эффект наблюдается не только у атомов водорода, но и у многоэлектронных атомов, например, у атомов щелочных металлов.
81
2.5. Спектральные серии атома водорода
Мы теперь знаем выражение для полной энергии электрона в атоме водорода: m e4 1 (2.5.1) ε = − e2 2 ⋅ 2 . 8h ε 0 n Из уравнения (2.5.1) следует, что полная энергия электрона в атоме всегда отрицательная. Наименьшее значение полной энергии соответствует главному квантовому числу n = 1. Этому квантовому числу соответствует основное, невозбужденное состояние. Все состояния с иными значениями квантовых чисел n > 1 являются возбужденными. В отсутствие внешних электрических и магнитных полей эти состояния являются вырожденными, поэтому различным значениям квантовых чисел ℓ и m при фиксированном значении n = const соответствуют одни и те же значения полной энергии ε. Для атома водорода не существует запрещенных переходов электрона с одного уровня полной энергии на другой, поскольку каждому значению n соответствуют n2 различных состояний с одинаковым значением полной энергии. Заметим, что представление о вырождении уровней энергии атомов водорода, строго говоря, является лишь приближенным. На самом деле уровни энергии с одним n и различными ℓ за счет релятивистских эффектов и эффектов квантового поля слегка отличаются друг от друга. Но эти тонкие эффекты настолько малы, что ими в большинстве случаев можно пренебречь. Отдельные состояния электрона в атоме изображают графически с помощью системы уровней полной энергии. Переход с верхнего уровня полной энергии на нижний сопровождается "высвечиванием", выделением избыточной порции энергии. А так как процесс "высвечивания" сопровождается непрерывным движением вокруг ядра электрического заряда, генерирующего электромагнитные волны, то высвобождающаяся энергия есть электромагнитная энергия, величина которой (2.5.2) ∆ε = h ν . где h – постоянная Планка, ν – частота колебаний напряженности электрического поля в электромагнитной волне. Величина избыточной "высвечивающейся" энергии называется квантом электромагнитного излучения. Переход электрона с нижнего уровня полной энергии на верхний возможен только в результате поглощения электроном кванта элек-
82
тромагнитной энергии, соответствующего разности энергии у этих двух состояний. Таким образом, излучение и поглощение – это взаимно обратные процессы. На рис. 2.5.1 изображены уровни полной энергии при различных значениях квантовых чисел. n
ε
∞
0
6 5 4 3 2 1
Рис. 2.5.1. Уровни энергии атома водорода Найдем разность энергии при переходе электрона с более высокого на более низкий уровень полной энергии электрона: (2.5.3) ∆ε = ε 2 − ε1 ; после подстановки в (2.5.3) значений из (2.5.1) и (2.5.2) получаем m e4 ⎛ 1 1 ⎞ hc (2.5.4) ∆ε = e2 2 ⎜⎜ 2 − 2 ⎟⎟ = . 8 h ε 0 ⎝ n1 n2 ⎠ λ 1 Обозначим ~ ν = – спектроскопическое волновое число, тогда из λ (2.5.4) имеем: m e4 ⎛ 1 1 ⎞ ~ (2.5.5) ν = 3e 2 ⎜⎜ 2 − 2 ⎟⎟ . 8 h c ε0 ⎝ n 1 n 2 ⎠ Обозначим
83 4
me e . (2.5.6) 8h 3cε 02 Величина R называется постоянной Ридберга. После этого уравнение (2.5.4) принимает достаточно простой вид: ⎛ 1 1 ⎞ ~ (2.5.7) ν = R ⎜ 2 − 2 ⎟. ⎜ n1 n 2 ⎟ ⎝ ⎠ Формула (2.5.7) называется сериальной формулой атома водорода, так как каждому значению n1 = const и различным значениям n2≥n1+1 соответствует своя спектральная серия. Перечислим возможные спектральные серии атома водорода: серия Лаймана – n1 = 1, n2 ≥ 2 – ультрафиолетовая область, серия Бальмера – n1 = 2, n2 ≥ 3 – видимая область, серия Пашена – n1 = 3, n2 ≥ 4 – инфракрасная область, серия Брэккета – n1 = 4, n2 ≥ 5 – инфракрасная область, серия Пфунда – n1 = 5, n2 ≥ 6 – инфракрасная область. Первая спектральная серия в спектре атома водорода была обнаружена в 1885 г. швейцарским физиком Бальмером задолго до создания квантовой механики. С этого началось систематическое исследование спектральных серий. Минимальная длина волны для серии Лаймана получается при n2 = 2. Она равна 4/3 R и называется резонансной линией атома водорода. При приближении к границе серии спектральные линии сгущаются. За границей серии спектр не обрывается, а становится сплошным. Это связано с тем, что электрон отрывается от атома, он становится свободным, поэтому его энергия не квантуется. Атом превращается в ион. R=
2.6. Спектральные серии атомов щелочных металлов
В атомах щелочных металлов внешняя электронная оболочка содержит один валентный электрон, слабо связанный с ядром атома. Остальные Z-1 электронов вместе с ядром образуют остов атома, в электрическом поле которого движется валентный электрон. Заряд ядра Ze > 0 и заряд (Z-1)e < 0 электронной оболочки мысленно можно заменить одним эффективным зарядом q*=e>0. А так как распределение электронов в остове атома не обладает сферической симметрией, то положение эффективного заряда q* в пространстве не совпадает с положением ядра. Поэтому валентный электрон будет двигаться в результирующем электрическом поле, не обладающем сферической
84
симметрией. Следовательно, силу, действующую на валентный электрон, нельзя определить из закона Кулона: закон Кулона выполняется только в случае сферически симметричных полей. Таким образом, в пространстве возникает эффективный электрический диполь, образованный эффективным зарядом остова атома и валентным электроном (рис.2.6.1).
ρ v
Ze> 0
e 0, U01 , U02 – коэффициенты разложения потенциальной энергии в степенной ряд. Стационарное состояние валентного электрона в электрическом поле остова атома по-прежнему характеризуется квантовыми числами n, ℓ, m, причем вырождение по квантовому числу ℓ теперь снимается. Это происходит потому, что потенциальная энергия валентного электрона отличается от кулоновской. Что же касается магнитного квантового числа m, то в отсутствие внешнего магнитного поля различные состояния по квантовому числу m являются вырожденными, т.е. различным значениям m и при одних и тех же значениях квантовых чисел n и ℓ соответствует одна и та же полная энергия.
85
Различные состояния электрона в атоме принято обозначать маленькими буквами латинского алфавита, причем каждой букве соответствует состояние с определенным значением орбитального квантового числа ℓ. Эти состояния приведены в табл. 2.2. ℓ Обозначение состояния
0
1
2
3
4
5
s
p
d
f
g
h
Таблица 2.2. Состояния электрона в атоме Так как при таком подходе в строении атомов щелочных металлов и атома водорода много общего, то и формула полной энергии валентного электрон должна быть подобна формуле полной энергии электрона в атоме водорода. Разница должна состоять в наличии поправки у главного квантового числа: m e4 1 (2.6.1) ε = − e2 2 ⋅ , 8 h ε 0 ( n − ∆n ) 2 где ∆n – квантовый дефект, 2 2 me e 2 ⎞⎟ 1 ⎛⎜ ⎛ 1 ⎞ (2.6.2) ∆n = − ± ⎜ l + ⎟ − c1 −l , η2 ⎟⎠ 2 ⎜⎝ ⎝ 2 ⎠ c1 –- постоянный множитель; n > ∆n > 0. Из (2) следует, что ∆n = ∆n(ℓ), поэтому теперь полная энергия валентного электрона зависит от квантовых чисел n и ℓ. Иными словами, в электрическом поле остова атома вырождение по квантовому числу ℓ снимается, а по m по-прежнему сохраняется. Объясняется это тем, что в изотропном пространстве полная энергия не зависит от m. Теперь введем понятие спектрального терма Т, определив его как ε T =− . hc Тогда с учетом (1) получим 1 m e4 R (2.6.3) T = 3e 2 ⋅ , = 2 8 h ε 0 c ( n − ∆n ) ( n − ∆n ) 2 где R – постоянная Ридберга. Спектральный терм Т – это краткая запись полной энергии валентного электрона в атоме. Так как квантовый дефект ∆n зависит от орбитального квантового числа ℓ, то для краткости записи вводится следующее условное обозначение терма: T = n ℓ . Так, например, терму 3s соответствуют квантовые числа n=3, ℓ=0 .
86
R R R , , . np = nd = 2 2 (n − ∆n( s) ) (n − ∆n( p) ) (n − ∆n(d ) )2 Физический смысл принятых обозначений будет ясен из следующих примеров. Если использовать понятие терма, то переходы валентного электрона из одного квантового состояния в другое, сопровождающиеся излучением кванта энергии электромагнитных волн, можно весьма просто выразить через разность термов: hc (2.6.4) ∆ε = = h c (T1 − T2 ) , λ 1 где ~ ν = – спектроскопическое волновое число. λ Тогда ~ (2.6.5) ν = n1l1 − n2l2 , R (2.6.6) . T= (n − ∆n(l )) 2 Из курса "Электричество и магнетизм" следует, что мгновенный диполь, у которого заряды все время перемещаются в пространстве с ускорением, излучает электромагнитные волны. Если положение движущегося отрицательного заряда диполя отсчитывать от центра инерции эффективного заряда остова атома, то эффективный электрический момент диполя ρ ρ (2.6.7) p = q ⋅ r (t ) , где q – заряд валентного электрона, находящегося за пределами остова ρ атома, r (t ) – мгновенный радиус-вектор валентного электрона относительно центра инерции эффективного заряда остова атома (рис. ns =
ρ ρ
ρ
2.6.2). На рис. 2.6.2 r (t ) = - λ , λ – плечо диполя, q* – эффективный заряд остова атома, q* = e > 0. ρ λ q 0
Рис. 2.6.2. Общая схема возникновения эффективного диполя в атоме Итак, валентный электрон вращается вокруг остова атома. Значит, в пространстве всегда существует эффективный электрический диρ ρ поль pe = q λ .
87
Первоначально предположим, что, в полуклассическом приближении, эффективные заряды валентного электрона и остова атома совпадают. Тогда атом будет электрически нейтрален. Электрический момент диполя отсутствует. В действительности валентный электрон движется по сложной криволинейной траектории. В результате положение электрического заряда валентного электрона не совпадает с положением эффективного заряда остова атома, возникает мгновенный электрический диполь. Так как валентный электрон все время находится в движении, его положение в пространстве непрерывно меняется, то вектор электрического момента диполя относительно центра инерции остова атома также непрерывно меняет не только направление в пространстве, но и величину электрического момента. Это эквивалентно переходу электрона из одного состояния, например, состояния i, в другое, например, состояние k. Но можно сказать и обратное: переход валентного электрона из состояния i в состояние k приводит к изменению электрического момента диполя. В общем случае изменение состояния валентного электрона сопровождается излучением. Среднее значение электрического момента диполя, по определению, будет ρ ρ (2.6.8) pe i k = ∫ ψ *k pe ψ i dv , где ψi , ψk* – волновые функции валентного электрона в начальном ψi и конечном ψk состояниях. ρ Если среднее значение peik ≠ 0 , то в результате такого перехода
ρ
возникает дипольное излучение атома, если же peik ≠ 0 , то дипольное излучение отсутствует. Переходы называются разрешенными, есρ ли peik ≠ 0 , а те ограничения, которые накладываются при этом на величину изменения квантовых чисел, называются правилами отбора. В случае дипольного излучения существуют следующие правила отбора: ∆ℓ= ±1, ∆m= 0,±1. Что же касается возможных значений главных квантовых чисел n, то на их изменения никаких ограничений не накладывается. Однако с увеличением разности n2 - n1 вероятность перехода валентного электрона из одного состояния в другое постепенно уменьшается. В результате у атомов щелочных металлов с учетом правил отбора могут возникать следующие спектральные серии: главная серия диффузнная серия резкая серия фундамента льная серия
ν~гл = ns − n1 p , ν~д = np − n2 d , ν~р = np − n2 s , ν~ф = nd − n2 f ,
88
причем n1 = n, n + 1, n + 2, . . . ; n2 = n1 + 1. Слева приведены исторически возникшие названия серий. n ε
нм
4d
78 ,2
4p
5f 12
нм
м 2,
7
,7 69 18
3d нм
3p нм
2p 0 67
н ,8
61 0,4
81
413 ,
2н 253 ,
6н
м
3s
4f
м
,3 н
4s
2s
5d
427
5s
5p
м
Рис. 2.6.4. Возникновение спектральных серий в излучении атома лития На рис. 2.6.3 изображена схема уровней полных энергий атома Li и возможные переходы валентного электрона, сопровождающиеся излучением электромагнитных волн. На этой схеме легко выделить все указанные выше спектральные серии. В заключение хочется еще раз подчеркнуть, что сформулированные выше правила отбора относятся только к дипольному излучению. Однако в природе могут возникать и другие виды излучений, например, квадрупольное. Они менее вероятны, и мы их здесь не рассматриваем. Для них существуют иные правила отбора. Изучение спектров излучения атомов щелочных металлов показало, что линии основных серий этих атомов являются двойными, дублетными. Например, желтая линия Na, обусловленная переходом 3p– 3s, состоит из двух линий: λ1 = 589,0 нм и λ2 = 589,6 нм. Структуру спектра, в которой происходит расщепление спектральных линий, называют тонкой структурой. Спектральную линию, состоящую из несколько близко расположенных компонент, называют мультиплетом. Одиночные линии называют синглетами, двойные –
89
дублетами и т.д. Аналогичная терминология используется и для характеристики самих уровней энергии (термов). Расщепление спектральных линий в атомах щелочных металлов означает, что расщепляются уровни полной энергии валентного электрона, между которыми происходят радиационные переходы. Анализ их спектров указал на то, что у них s-состояния (ℓ=0) синглетны, а p-, d-, f- состояния (ℓ = 1, 2, 3) дублетны. С помощью квантовых чисел n, ℓ , m причину расщепления уровней объяснить не удается. Это можно объяснить, если ввести новое квантовое число. Но об этом – в следующем параграфе. 2.7. Физическая причина возникновения тонкой структуры в спектре атомов щелочных и щелочноземельных элементов
Для анализа спектров излучения и поглощения многоэлектронных атомов обычно используется векторная модель атома. Но на ее основе можно получить только качественные или полуколичественные результаты. В связи с этим объяснение наблюдаемых явлений носит специфический характер. Частично оно состоит из перечисления правил, которые не поддаются наглядной интерпретации, хотя некоторые из этих правил можно пояснить с помощью наглядной модели. А вообще-то лишь очень немногие из утверждений доказываются достаточно строго. Теперь мы знаем, что даже решение задачи об атоме водорода требует знания специальных функций, большой математической эрудиции и достаточно трудоемко. А ведь атом водорода – это простейший из возможных атомов. Нетрудно представить, какой математический аппарат необходим, чтобы решить задачу для реальных случаев, при условии, что точное решение задачи вообще возможно. Из многоэлектронных атомов здесь мы рассмотрим атомы щелочных и щелочноземельных элементов. Опыт показывает, что каждый уровень полной энергии валентного электрона у этих атомов состоит из двух или трех близко расположенных уровней. Следовательно, существует какая-то причина, вызывающая такое расщепление уровней. Известно, что электрический заряд электронной оболочки атомов щелочных и щелочноземельных элементов практически полностью компенсируется положительным зарядом ядра. Поэтому остов атома обладает эффективным положительным зарядом, заряд у атомов щелочных элементов равен (Z - 1)e, у атомов щелочноземельных элементов равен (Z - 2)e. Остальные один или два валентных электрона, сравнительно слабо связанные с остовом, вращаются вокруг остова,
90
находясь при этом в эффективном электрическом поле остова атома. Состояние электрона в атоме определяется квантовыми числами n, ℓ, m. Однако при фиксированном значении главного квантового числа n состояние атома будет определяться значением орбитального квантового числа ℓ. Но поскольку теперь это состояние характеризует состояние всего атома, то для определения состояния атома вводят большие латинские буквы: L = S, P, D, F, G, H. Эти буквы имеют тот же смысл, что и буквы ℓ = s, p, d, f, h. Тогда при фиксированном значении главного квантового числа n каждым значениям ℓ , m будет соответствовать определенная энергия. Следовательно, каждый атом будет иметь различный дискретный набор полных энергий, как это изображено на рис. 2.7.1, где ∆Nℓ – кратность вырождения, или число уровней полной энергии, соответствующих состоянию атома с заданным значением квантового числа L . l = 0 , m = 0 ; ∆Nl = 1
S
l = 1, m = 0, ±1; ∆N l = 3 = 2l +1
P
l = 2 , m = 0, ±1, ± 2 ; ∆Nl = 5 = 2l +1
D
Рис. 2.7.1. Дискретный набор уровней энергии для разных L Более тщательные спектроскопические измерения показали, что уровни полной энергии состоят из двух или трех близко расположенных уровней. Это указывает на то, что использованный набор квантовых чисел является недостаточным для понимания физической причины расщепления. Для объяснения расщепления уровней полных энергий в 1925 году голландские ученые Уленбек и Гаудсмит высказали гипотезу, что это вызвано наличием у электрона собственного ρ момента импульса Ls . В то время по аналогии с ядром атома электрон представлялся в виде жесткого заряженного шарика, вращающегося вокруг оси симρ метрии с угловой скоростью ω (рис. 2.7.2). Поэтому собственный момент импульса электрона ρ ρ (2.7.1) Ls = Iω . На основе этой гипотезы им удалось объяснить физическую причину наблюдаемого на опыте расщепления уровней полной энергии электрона в атомах щелочных металлов. Свои расчеты, с использованием представлений о собственном моменте импульса электрона, они
91
решили опубликовать. Подготовили научную статью и направили ее в журнал "Nature" ("Природа"), редактором которого был выдающийся физик того времени Зоммерфельд. Однако авторов статьи все время терзали сомнения в правильности исходных предположений. Дело в том, что представление об электроне как о заряженном шарике вызывает серьезное возражение.
ρ
ω
ρ L s
Рис. 2.7.2. Модель возникновения собственного момента импульса электрона по Уленбеку и Гаудсмиту Используя вычисленное значение момента импульса электрона, они пришли к выводу, что материя на поверхности такого шарика должна перемещаться вокруг центра шарика со скоростью больше скорости света в вакууме, что в принципе невозможно. Несколько поразмыслив, они решили обратиться к редактору журнала с просьбой вернуть статью обратно. Зоммерфельд принял авторов статьи и сказал им примерно следующее. – Журнал уже отдан в типографский набор и практически набран. Разбивать набор – это большая работа и приведет к задержке издания номера журнала. А, кроме того, Вы еще молоды, у Вас пока нет никакого научного авторитета, так что в случае опубликования статьи Вы ничем не рискуете, ничего не теряете. Гаудсмит и Уленбек согласились с доводами редактора. Статья была опубликована и стала достоянием научной общественности. В переводе на русский язык слово spin означает вращение. Этим словом они обозначили как процесс вращения электрона, так и собственный момент импульса, с ним связанный. Выше была указана причина, по которой модель электрона в виде шарика не вполне соответствует современным представлениям. В рамках классических представлений можно попытаться так отварьировать форму электрона, чтобы результат был менее противоречив, придав, например, электрону форму диска толщиной значительно меньше его радиуса (рис. 2.7.3).
92
ρ
R
ω
ρ
ω
Рис. 2.7.3. Дисковая модель возникновения собственного момента импульса электрона Тогда по аналогии с орбитальным движением электрона можем записать ρ ˆ (2.7.2) L2s ψ s = L2s ψ s , где L2s – собственное значение квадрата оператора момента импульρ са, ψs – собственная волновая функция оператора Lˆ2 : (2.7.3) L2s = η2 s (s + 1) . Каждый уровень полной энергии у атомов щелочных металлов является двойным. Это можно объяснить тем, что у атомов щелочных металлов вырождение состояний по спиновому квантовому числу снимается. Причина снятия вырождения вызвана тем, что валентный электрон теперь находится в электрическом поле остова, строго говоря, не обладающем сферической симметрией, а следовательно, не являющемся кулоновским. Поэтому (2.7.4) ∆N s = 2 = 2 s + 1 . Из (2.7.4) находим s = 1/2. Спиновое магнитное квантовое число ms=±s = ±1/2, оно определяет величину собственного магнитного момента электрона. Из опыта известно, что спиновое гиромагнитное отношение gs=2gℓ. Эту величину легко получить, пользуясь моделью электрона в виде диска*). Собственный магнитный момент электрона *)
Получившееся согласие с опытом ничего не говорит о реальной форме электрона. Классические представления здесь неприменимы. В настоящий момент нет ясности не только в форме, но и в размерах электрона. Бесспорно только одно: электрон обладает собственным моментом импульса – спином, величина которого хорошо известна.
93
e (2.7.5) π R2 , Ts где Ts – период вращения электрона вокруг оси симметрии, R – радиус электрона. Собственный момент импульса электрона m R2 2 π (2.7.6) Ls = e ⋅ . Ts 2 По определению, гиромагнитное отношение электрона при вращении его вокруг оси симметрии pm s . gs = Ls После подстановки значений pms и Ls из (2.7.5) и (2.7.6) имеем e (2.7.7) gs = = 2ge , me что совпадает с результатами опыта. Из опыта следует, что суммарный вектор собственных моментов импульса всех электронов остова атома полностью заполненной электронной оболочки всегда равен нулю. Так как электронная оболочка остова является замкнутой, то состояние атома определяется состоянием валентных электронов. Полный момент импульса атома можно получить двумя способами: ρ ρ ρ ρ ρ (2.7.8) L j = ∑ Ll i + ∑ Ls i = Ll + Ls , pm s =
i
i
ρ ρ ρ L j = ∑ Ll i + Ls i ,
(
)
(2.7.9)
i
причем (2.7.8) соответствует нормальной связи, а (2.7.9) – сильной связи между частицами. Состояние атома условно обозначают 2s+1TJ , Т – условное обозначение терма атома, S = s , S – полное спиновое квантовое число
∑ i
валентных электронов в атоме. Известно, что квадрат векторов проекций соответствующих моментов импульсов на ось 0Z ρ Ll2z = (ml η) 2 , ml = 0 , ± 1, ± 2 , ± 3 , ... , ± l ;⎫ ⎪ ρ 1 ⎪ (2.7.10) L2s z = (ms η) 2 , ms = ± s = ± ; ⎬ 2 ⎪ ρ2 L j z = (m j η) 2 , m j = ml + ms ; j = l ± s ⎪ ⎭ где
94
m j = − j , − ( j − 1), ... , ( j − l ), ... , j.
Полные орбитальные и спиновые момента импульса атома будут ρ ρ ρ ρ L = ∑ Ll i , S = ∑ Ls i . i
i
Тогда полный момент импульса всех электронов электронной оболочки атома ρ ρ ρ J = L+S , причем ρ ρ ρ J 2 = η2 J ( J + 1) , L2 = η2 L ( L + 1) , S 2 = η2 S ( S + 1) , J – внутреннее квантовое число. Квантовые числа J, L, S имеют смысл наибольших значений, которые могут принимать проекции ρ ρ ρ векторов J z , Lz , S z на направление OZ (см. (2.7.10)). Тогда (2.7.11) J = L + S , L + S − 1 , ..... | L − S | . Моменты импульсов электронной оболочки остова полностью ρ ρ ρ скомпенсированы, поэтому J z , Lz , S z соответственно равны векторам проекций валентных электронов на ось OZ: ρ ρ ρ ρ ρ ρ Lz = Ll z , S z = Ls z , J z = L j z . Итак, для определения состояния атома необходимо вычислить J, ρ ρ L, S. По физическому смыслу вектора Lz , S z расположены параллельно, поэтому их следует складывать алгебраически с учетом направлеρ ρ ρ ний отдельных векторов моментов импульсов: J z = Lz + S z . Так как теперь L = ℓ, S = s, J = j, то J=L±S. Если L = const, то, как следует из (2.7.11), число возможных состояний (2.7.12) ∆N j = 2 S + 1 . Рассмотрим более подробно физическую причину возникновения тонкой структуры спектральных линий сначала у атомов щелочных элементов, а затем у атомов щелочноземельных элементов. У атома щелочного металла имеется всего один валентный электрон, поэтому S = s = 1/2. Пусть первоначально L = 0, это означает, что среднее значение орбитального момента импульса равно нулю, а собственный момент импульса валентного электрона атома направлен либо в прямом, либо в обратном направлениях. С энергетической точки зрения
95
эти направления совершенно равнозначны, значит, им должна соотρ ρ ветствовать одна и та же полная энергия атома, Lsz ↑ или ↓ Lsz . Полное внутреннее квантовое число J = L + S = 1/2. Терм такого состояния будет 2S+1 TJ = 2S1/2. Пусть L = 1, S = 1/2. Здесь возможны два физически различных направления проекций на ось OZ орбитального и собственного моменρ ρ тов импульсов Lz и S z , что соответствует двум значениям внутренних квантовых чисел J: ρ ρ ρ S z2 = (η S ) 2 , L2z = (η L) 2 , J z2 = (η J ) 2 , J = L ± S .
ρ J z
ρ Sz ρ Lz
1 3 = 2 2
J =1+
Терм атома
ρ Sz ρ Lz
ρ J =1− 1 = 1 Jz 2 2
ТJ = 2P1/2 , 2P3/2 а кратность вырождения ∆NJ = 2 · 1/2 + 1 = 2. Пусть теперь L = 2, S = 1/2, L = 4·S. Изобразим направления проекρ ρ ций векторов Lz и S z : ρ Sz ρ Lz
2S+1
ρ J z J = 2 +
1 5 = 2 2
ρ Sz ρ Lz
ρ J z
J = 2 −
1 3 = 2 2
Термы атома этих состояния будет 2S+1 TJ = 2D3/2 , 2D5/2. Число возможных состояний и их обозначения приведены в следующей таблице. L J Уровень
0 ½ 2 S1/2
1 1/2, 3/2 2 P1/2, 2P3/2
2 3/2, 5/2 2 D3/2, 2D5/2
Если атом имеет два валентных электрона, то здесь могут встретиться два случая.
96
1. Проекции собственных моментов импульсов электронов антипараллельны, S=0. Число возможных состояний при любом L, согласно (2.7.11), равно 1. 2. Проекции собственных моментов импульсов электронов параллельны, S=1. ρ ρ ρ В случае нормальной связи J z = Lz + S z . Значит, при заданном наρ правлении вектора Lz в пространстве могут возникать три возможных значений полных квантовых чисел S, L, J,ρпричем S = 0,1 : ρ J Z = 0 , J = 0;
L=0
Sz ρ Sz
ρ JZ
ρ JZ ;
J = 1 + 1 = 2;
J =1
2S +1 T = 3S , 3 S 0 1 J L=1
ρ Sz ρ Lz
ρ Sz ρ Lz
ρ J Z = 0; S = 1, L = 1; J = 0;
2S +1 T = 3P , 3 P , 3P 0 1 2 J L=2 ρ Sz
ρ Lz
ρ ρ J Z = LZ J = 0 + 2 = 2;
ρ Sz ρ Lz
SZ = 0
ρ ρ LZ = J Z J = 1 + 0 = 1;
ρ Sz
ρ JZ ;
ρ Lz
ρ JZ;
J = 2 +1 = 3
J = 2 − 1 = 1;
2S +1 T = 3D , 3 D , 3D J 1 2 3
Возможные состояния атома приводятся в следующей таблице. L J Уровни
0 0, 1 3 S0, 3S1
1 0, 1, 2 3 P0, 3P1, 3P2
2 1, 2, 3 3 D1, 3D2, 3D3
2.8. Энергия спин-орбитального взаимодействия
Собственный магнитный момент валентного электрона в процессе движения все время находится в магнитном поле, созданном им же самим в результате орбитального движения. Поэтому электрон, а стало быть, и атом должны обладать дополнительной энергией, она называется энергией спин-орбитального взаимодействия: ρ ρ (2.8.1) ∆ε = − pm s Bl ,
97
ρ ρ где pms – вектор собственного магнитного момента электрона, Bλ – вектор индукции магнитного поля в месте локализации электрона, т.е. магнитного поля, возникающего в результате орбитального движения валентного электрона вокруг остова: ρ ρ ρ µ 0 pm l ρ µ0 ρ ⋅ 3 = − gl Ll . pm s = − g s Ls Bl = 2π r 2 π r3 Тогда величину энергии спин-орбитального взаимодействия можно оценить по формуле (1): µ0 ρ ρ (2.8.2) ∆ε = − g s g l Ls Ll . 2 π r3 Квадрат суммарного момента импульсов ρ ρ ρ ρ ρ L2j = L j L j = L2j = L2l + 2 Ll Ls + L2s .
Следовательно, скалярное произведение двух моментов импульса L2j = η2 j ( j + 1) , L2l = η2l (l + 1) , L2s = η2 s ( s + 1) . где ρ ρ 1 Ls Ll = − (L2j − L2l − L2s ) , 2 или ρ ρ η2 Ls Ll = − ( j ( j + 1) − l (l + 1) − s( s + 1) ) . 2 ρρ Подставим произведение Ls Lλ в (2.8.22) с учетом того, что g s = 2gℓ: µ 0 η2 (2.8.3) ( j ( j + 1) − l (l + 1) − s( s + 1) ) 2 π r3 Применим полученный результат для анализа тонкой структуры в спектре излучения атома Na. Электронная оболочка атома Na содержит электроны, распределенные по состояниям 1s2 2s2 2p6 3s1 (здесь верхние цифры выражают число электронов в названном состоянии). Валентный электрон 3s движется в поле остова атома, волновая функция состояния 3s сферически симметрична, поэтому распределение плотности вероятности состояния 3s также с высокой степенью приближения обладает сферической симметрией. Возбуждение электрона 3s происходит в процессе газового разряда, в результате которого валентный электрон 3s переходит в возбужденное состояние 3p. В состоянии 3p волновая функция, а также ее плотность вероятности сферической симметрией не обладают. Для учета влияния такой несфе∆ε = g l2
98
ричности необходимо в уравнение (2.8.3) вместо величины радиусвектора r ввести эффективный радиус-вектор rэф. Расчет показывает, что электронные слои атома 1s, 2s, 2p вращаются вокруг центра инерции с угловыми скоростями ω(1s, 2s) = 1,99·1017 рад/с, ω(2p) = 1,52·1017 рад/с, ω(2p) = 0,82·1017 рад/с, ω(3s) = 7,23·1015 рад/с или в относительных единицах ω(1s, 2s)/ω(3s) = 27,5, ω(2p)/ω(3s) = 21,0, ω(2p)/ω(3s) = 11,3. Таким образом, получается, что вся электронная оболочка атома вращается вокруг центра инерции, но при этом различные слои электронной оболочки вращаются с различными угловыми скоростями. А так как различие в угловых скоростях сравнительно невелико, то на движении валентного электрона сильнее всего влияет несимметричное распределение в пространстве распределение плотности вероятности электронов 2p-слоя. Распределение плотности вероятности 2p-электронов приближенно можно оценить при помощи угловых составляющих волновой функции ψ(θ, φ). Так как нас будут интересовать только состояния, не обладающие сферической симметрией, то состояниям 2p будут соответствовать квантовые числа ℓ = 1, m = 0, ±1, а сами волновые функции ψℓ,m(θ, φ) с учетом нормировки имеют следующий вид: ψ12,1 =
3 3 3 sin 2 θ, ψ12, 0 = cos 2 θ, ψ12, −1 = sin 2 θ. (8π) 2 ( 4 π) 2 (8π) 2
Тогда соответствующие плотности вероятности 3 3 3 sin θ ei ϕ , ψ1,0 = cos θ, ψ1, −1 = ψ1,1 = sin θ e − i ϕ , 8π 4π 8π их графики изображены на рис. 2.8.1. Вычислим общую площадь, ограниченную графиками плотности вероятности. Учитывая особенности расположения в пространстве pорбиталей, полная площадь сечения каждой орбитали будет складываться из 4-х площадей для ψ21,1 и 2-х площадей для ψ21,0.
ψ 12,1
ψ 12, 0
ψ 12, − 1
Рис. 2.8.1. Распределение плотности вероятности при ℓ = 1 для разных m
99
Площадь сечения π
π
4⋅3 2 2 3 ⎛ 1 1 ⎞2 3 − sin 2θ + θ ⎟ = S (ψ ) = sin θ dθ = , 2 ∫ 2⎜ (8 π) 0 16 π ⎝ 4 2 ⎠ 0 64 π 2 1,1
площадь сечения π
S (ψ12,0 )
π
4⋅3 2 3 ⎛1 1 ⎞2 3 2 cos d sin 2 . = θ θ = θ + θ⎟ = ⎜ 2 ∫ 2 2 ⎠ 0 16 π (4 π) 0 4π ⎝ 4
Полная площадь сечения всех 6-ти орбиталей 2p 9 S эф = 4 S (ψ12,1 ) + 2 S (ψ12, 0 ) = ; S 0 = π ⋅12 = π. 16 π Тогда величина эффективного радиуса остова атома Na rэф = (Sэф/ S0)1/2 = 0,239 r. Из опыта следует, что r = 0,1537 нм. Поэтому rэф = 0,239⋅ 0,1537=0,0367 нм. Подставим найденное значение эффективного радиуса в (2.8.3). После вычислений получаем ∆ε = 1,084·10-21 Дж = 6,78·10-3 эВ, что соответствует величине тонкого расщепления спектральной линии с длиной волны 589,0 нм ∆λ = 0,53 нм. Полученный результат сравним с опытом. Наиболее интенсивной у Na является желтая линия, возникающая при переходах 32P1/2 -32S1/2 и 32P3/2 -32S1/2. Этим переходам соответствуют длины волн 589,59 нм и 589,0 нм. Таким образом, опыт дает величину 0,59 нм, т.е. расхождение составляет 10%, что является хорошим результатом. Что же касается влияния релятивистского эффекта (в зависимости от скорости движения массы электрона) на величину тонкой структуры спектральной линии, то его роль настолько мала, что им можно пренебречь. Как следует из приведённого выше анализа, величина тонкого расщепления уровней полной энергии валентных электронов атомов порядка 10-3 эВ. На её величину может влиять увеличение радиусавектора r с ростом Z. Но это влияние столь мало, что оно существенно не сказывается на изменении величины ∆ε. Поэтому можно считать, что величина ∆ε, возникающая вследствие спин-орбитального взаимодействия, должна быть примерно постоянной. Формула (2.8.3) может иметь важное прикладное значение, так как по известной из опыта величине тонкой структуры она позволяет оценить геометрические размеры некоторых из атомов. Как показывает анализ, переход электрона из одного состояния в другое с учётом спин-орбитального взаимодействия активен в спектре
100
только в том случае, если при этом выполняются следующие правила отбора для квантовых чисел: ∆j = 0, ±1; ∆m = 0, ±1 . (2.8.4) На рис. 2.8.2, а показана схема разрешенных переходов для желтой линии Nа, а на рис. 2.8.2, б показаны разрешенные переходы в диффузной серии, на рис. 2.8.2, б спектральные линии выглядят более сложно, они состоят из трех близко расположенных компонент и называются сложным дублетом. Такая структура линии объясняет размытость линий диффузной серии.
3
2P
4 2D 5
2
3 2
4 2D 3
2
3 2P 3
3 2P 1
3 2S 3 2
2
2
3 2P 1
2
Рис. 2.8.2. Примеры разрешенных переходов в излучении натрия для главной (а) и диффузной (б) спектральных линий 2.9. Распределение электронов в атоме по слоям и состояниям
Закономерности распределения электронов в атомах по слоям и состояниям вытекают из принципа Паули. Этот принцип утверждает, что две тождественные частицы с одинаковым полуцелым спиновым квантовым числом (s=1/2, 3/2, 5/2 и т. д.) не могут одновременно находиться в одном и том же состоянии. Принцип Паули тесно связан с принципом тождественности, т.е. с принципом неразличимости одинаковых частиц. Электроны – тождественные частицы, у каждого из них нет индивидуальных признаков, индивидуальных особенностей, с помощью которых их можно различать между собой. Принцип Паули отображается при помощи антисимметричной волновой функции: при перестановке состояний двух электронов волновая функция должна изменить только знак. Таким образом, если два электрона находятся в одинаковых состояниях, то при антисимметричной волновой функции вероятность таких состояний равна нулю.
101
Как теоретически доказал Паули, любые частицы с полуцелым спиновым квантовым числом должны иметь антисимметричные волновые функции. Частицы с иным значением спинового квантового числа имеют симметричные волновые функции, и в одинаковых состояниях может находиться любое их число. С помощью принципа Паули можно объяснить строение электронных оболочек в атомах, ядерные оболочки и их структуру у атомных ядер, химическую связь молекул. В классической физике аналог принципа Паули отсутствует. Для определения в атоме состояния электрона необходимо задание 4х квантовых чисел. При этом каждое состояние определяется своим набором квантовых чисел. В соответствии с принципом Паули, в различных состояниях из 4-х квантовых чисел, хотя бы одно из них должно быть иным. Только в этом случае состояния электронов будут разными. Ранее было установлены возможные значения квантовых чисел и связь между ними: n = 1, 2, 3, ... , ∞; ℓ = 0, 1, 2, ... , n-1; m = mℓ = 0, ±1, ±2, ... , ± ℓ ; ms = ±1/2. Тогда в соответствии с принятой схемой получим следующий набор состояний и соответствующих квантовых чисел для каждого состояния: n = 1; ℓ = 0 ; mℓ = 0; ms = 1/2. Это состояние обозначается 1s, в нем может находиться не более 2-х электронов. В этом состоянии электрон обладает наименьшей энергией, электронное облако (плотность вероятности) обладает сферической симметрией. Электроны, заполняющие в атоме все s-состояния, образуют К-слой. Условная запись состояний заполненного К-слоя 1s2: 2s2; n = 2 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 2p6 . Электроны 2s2 2p6 образуют L-слой, в нем содержится 8 электронов. n = 3 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; 3s2 ; 3p6 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 3d10; ℓ = 2 ; mℓ = 0, ±1 ; ±2 ; ms = ±1/2; 2 6 10 Электроны 3s 3p 3d образуют М-слой, в нем содержится 18 электронов. 4s2 ; n = 4 ; ℓ = 0 ; mℓ = 0 ; ms = ±1/2 ; ℓ = 1 ; mℓ = 0, ±1 ; ms = ±1/2 ; 4p6 ; 4d10; ℓ = 2 ; mℓ = 0, ±1 ; ±2 ; ms = ±1/2; ℓ = 3 ; mℓ = 0, ±1, ±2, ±3 ; ms = ±1/2 4f14 .
102
Электроны 4s2 4p6 4d10 4f14 образуют N-слой, в нем содержится 32 электрона. Казалось бы, что все последующие слои должны заполняться в такой же последовательности. Но в действительности такой идеальный порядок заполнения слоев нарушается, хотя по-прежнему полностью заполненным слоем называется слой с ненарушенным порядком заполнения. Ниже приводится последовательность заполнения состояний при n ≥ 4: n = 4; 4s2 3d10 4p6 – всего 18 электронов; n = 5; 5s2 4d10 5p6 – всего 18 электронов; n = 6; 6s2 4f14 5d10 6p6 – всего 32 электрона; n = 7; 7s2 5f14 6d10 7p6 – всего 32 электрона. Такое отклонение в заполнении электронных оболочек от идеального при n≥ 4 вызвано особенностями в изменении энергии связи, которая, в свою очередь, определяет конфигурацию электронных оболочек атомов с большими Z. 2.10. Двухатомная молекула
Молекула, наименьшая часть данного вещества, является носителем его основных химических и физических свойств. Молекула может состоять из различных или одинаковых атомов, соединенных в единое целое химическими связями. Число атомов в молекуле может меняться от двух до сотен тысяч. Размеры молекул возрастают с увеличением числа входящих в них атомов от 0,1 нм до 100 нм и более. Молекулы представляют собой электрически нейтральные системы частиц. Химические и физические свойств молекулы определяется ее относительно слабо связанными внешними электронами. Вследствие того, что внутренние движения частиц в молекуле сложнее, чем в атоме, схема уровней энергий имеет более сложный вид: наряду с движением электронов относительно ядер могут происходить колебательное и вращательное движения с участием ядер. Поэтому полная энергия молекул с точностью до аддитивной постоянной, не меняющейся при химических превращениях, равна ε = ε эл + ε кол + ε вр , (2.10.1) где εэл – полная энергия электрона, εкол – энергия колебательного движения молекулы, εвр – энергия вращательного движения молекулы. Указанные энергии имеют следующие порядки величин: εэл ~ 1 эВ, εкол ~ (0,01 - 0,10) эВ, εвр ~ (0,01 - 0,10) эВ.
103
Между атомами молекулы существуют два основных вида связей (взаимодействий): ионная и ковалентная. Ионная связь возникает, когда молекулу можно представить состоящей из двух разноименно заряженных ионов. Например, молекула NaCl состоит из ионов Na+ и Cl-. Сила притяжения между такими ионами возникает как сила взаимодействия между разноименными зарядами и качественно достаточно просто может быть объяснена на основе классических представлений. На рис. 2.10.1 схематически изображена молекула NaCl. Известно, что радиусы нейтральных атомов Na и Cl соответственно равны 0,186 нм и 0,064 нм. Но после образования молекулы размеры ионов Na и Cl меняются и оказываются соответственно равными 0,098 нм и 0,133 нм. Na +
ρ F
ρ F
Cl −
Рис. 2.10.1. Возникновение сил притяжения между атомами в молекуле NaCl Физическая причина возникновения ионов Na+ и Cl- достаточно проста. Запишем распределение электронов у нейтральных атомов Na и Cl по состояниям: Na – 1s2 2s2 2p6 3s1; Cl – 1s2 2s2 2p6 3s2 3p5. Электроны 1s2 2s2 2p6 у атома Na образуют электронную оболочку атома инертного газа Ne. Эта оболочка полностью заполнена электронами, в результате связь электронов с ядром очень прочная. Такая оболочка сильно (на 10/11) экранирует электрическое поле ядра. Поэтому валентный электрон 3s слабо связан с ядром. Атому Cl для образования устойчивой оболочки инертного газа Ar недостает одного электрона. При образовании молекулы NaCl атом Cl присоединяет электрон, недостающий для полной застройки оболочки 3р. Эта связь также оказывается достаточно прочной. Между ионами молекулы возникает сила электрического притяжения, сближающая ионы до определенного расстояния, после чего между ними вследствие деформации электронных оболочек начинает действовать сила отталкивания между остовами атомов. Этот процесс динамический, он сопровождается периодической сменой сил притяжения силами отталкивания. В
104
результате атомы молекулы NaCl совершают непрерывные колебания. Колебания атомов в молекуле NaCl аналогичны колебаниям линейного гармонического осциллятора, рассмотренного нами ранее. Ковалентная связь возникает между нейтральными или одноименно заряженными атомами молекулы. С помощью законов классической физики ее возникновение объяснить нельзя, хотя качественное (наглядное) объяснение вполне возможно. Квантовая механика хорошо объясняет физическую причину ее возникновения на основе использования процесса обменного взаимодействия. В качестве примера рассмотрим роль ковалентной связи в процессе образования молекулы водорода. Молекула водорода – простейшая из возможных молекул. Ее простота позволяет достаточно наглядно проследить за отдельными этапами решения уравнения Шредингера, а также физическими выводами, вытекающими из него. Заметим, что примерно такими же методами решаются задачи и с многоэлектронными атомами, поэтому этот подход с чисто познавательной точки зрения для нас является очень важным и в дальнейшем будет использован неоднократно. ρ r1 A A
r12
1 ρ r2 A
2 ρ r1B
ρ r2 B B
R
Рис. 2.10.2. Обозначения межчастичных расстояний в молекуле Н2 Молекула водорода Н2 состоит из двух атомов, пусть это будут атомы А и В (рис.2.10.2). Составим уравнение Шредингера для системы частиц, входящих в состав молекулы водорода. (2.10.2) Hˆ ψ = εψ , ε – полная энергия молекулы, Ĥ – оператор Гамильтона молекулы.
105
Hˆ = Hˆ 1 + Hˆ 2 + U η2 e2 η2 e2 Hˆ 1 = − ∆1 − ∆2 − ; Hˆ 2 = − ; 2me 4 π ε 0 r1 A 2me 4 π ε 0 r2 B e2 e2 e2 e2 − + + ; 4 π ε 0 r1B 4 π ε 0 r2 A 4 π ε 0 r12 4 π ε 0 R Ĥ1, Ĥ2 – операторы Гамильтона атомов А и В ; r1, r2 – координаты первого и второго электрона; U – полная потенциальная энергия первого электрона при движении его вокруг ядра В, второго электрона при движении его вокруг ядра А, взаимодействия между электронами 1 и 2, взаимодействия между ядрами А и В. Волновая функция системы частиц ψ зависит не только от координат, но и от направлений собственных моментов импульса электронов. Для молекулы водорода могут реализоваться лишь два случая: а) собственные моменты импульсов параллельны, ρ ρ ρ ρ ρ Ls = Ls1 + Ls 2 = 2 Ls1 = 2 Ls 2 ; б) собственные моменты импульсов антипараллельны, ρ ρ ρ Ls = Ls1 + Ls 2 = 0. Для наглядности определения различных состояний атомов А и В присвоим каждому электрону свой номер. Тогда различным состояниям будет соответствовать различное расположение электронов. Здесь возможны два варианта, изображенные на рис. 2.10.3. Uˆ = U = −
1 2 A
2 1 B
A
B
Рис. 2.10. Два варианта расположения электронов в молекуле Н2 Задача решается методом последовательных приближений. Нулевое приближение. В этом приближении взаимодействия между частицами молекулы не учитываются, потенциальная энергия взаимодействия U= 0. Так как движение электронов в пространстве в указанном приближении происходит независимым образом, то вероятность такого сложного события будет равна произведению вероятностей каждого из них. Тогда в соответствии с рис. 2.10.3 можем записать
106
ψ12 = ψ 2A (1) ψ 2B (2) ;
ψ 22 = ψ 2A (2) ψ 2B (1)
или (2.10.3) Однако электроны представляют собой тождественные частицы, они физически неразличимы независимо от направлений собственных ρ ρ моментов импульсов Ls1 и Ls 2 , хотя различным направлениям собственных моментов импульса соответствуют различные состояния. Поэтому описание состояний только при помощи волновых функций (2.10.3) является недостаточным, поскольку они не учитывают наρ ρ правления в пространстве собственных моментов импульса Ls1 и Ls 2 . Для исключения неоднозначности обычно конструируют волновую функцию так, чтобы для одного случая она была бы четной, а для другого случая была бы нечетной. Тогда с учетом (2.10.3) можем записать: ψ s = c s (ψ1 + ψ 2 ) , ψ a = c a ( ψ1 − ψ 2 ) , (2.10.4) где ψs, ψa –- симметричная и антисимметричная волновые функции, причем симметричной функции соответствуют антипараллельные наρ ρ правления собственных моментов импульсов электронов LS 1 ↑↓ LS 2 , а антисимметричной функции – параллельные направления собственψ1 = ψ A (1) ψ B (2) ;
ψ 2 = ψ A (2) ψ B (1).
(
(
ρ
ρ
)
)
ных моментов импульсов электронов LS 1 ↑↑ LS 2 . По определению, полная энергия молекулы водорода для симметричных и антисимметричных волновых функций соответственно равна ε s = ∫ ψ*s Hˆ ψ s dV = ∫ ψ*s Hˆ 1ψ s dV + ∫ ψ*s Hˆ 2ψ s dV , ⎫⎪ (2.10.5) ⎬ ε a = ∫ ψ*a Hˆ ψ a dV = ∫ ψ*a Hˆ 1ψ a dV + ∫ ψ*a Hˆ 2ψ a dV ,⎪ ⎭ Для определения коэффициентов Cs и Ca в (4) используем условие нормировки: * * (2.10.6) ∫ ψ s ψ s dV = 1, ∫ ψ a ψ a dV = 1, После подстановки значений ψ s и ψ a из (2.10.4) в (2.10.6) получаем:
∫( ∫ (ψ
)( )(ψ
) )dV = 1.
C s2 ψ1* + ψ*2 ψ1 + ψ 2 dV = 1 Ca2
* 1
− ψ*2
1
− ψ2
(2.10.7)
Можно показать, что после интегрирования в (2.10.7) получим:
107
C = (2(1 + J s )) , C = (2(1 − J s )) ,
(2.10.8)
J s = ∫ ψ*A (2)ψ A (1)ψ*B (1)ψ B (2)dV ≠ 0 ,
(2.10.9)
2 s
−1
−1
2 a
где
J s – некоторое число. Первое приближение. В первом приближений учитывается взаимодействие между всеми частицами молекулы, поэтому полная потенциальная энергия молекулы U ≠ 0 . Теперь оператор Гамильтона Hˆ = Hˆ + Hˆ + U 1
2
Запишем уравнение Шредингера для каждого из электронов молекулы: Hˆ 1ψ s = ε1ψ s , Hˆ 2ψ s = ε 2ψ s , Обозначим ε1 = ε 2 = ε 0 – полная энергия электрона в каждом из изолированных атомов, т.е. в отсутствие взаимодействия между атомами. Тогда полная энергия молекулы, у которой собственные моменты импульсов электронов антипараллельны, равна (2.10.10) ε s = ∫ ψ*s Hˆ ψ s dV = 2ε 0 + ∫ ψ*sUψ s dV , причем здесь учтено, что * * * ∫ ψs Hˆ 1 + Hˆ 2 ψs dV = ∫ ψs (ε1 + ε2 )ψs dV = (ε1 + ε2 )∫ ψsψs dV = 2ε0 .
(
)
Аналогично получается выражение для полной энергии молекулы, у которой собственные моменты импульсов электронов параллельны: (2.10.11) ε a = 2ε 0 + ∫ ψ*aUψ a dV , Введем обозначения: ∆ε s = ∫ ψ*sUψ s dV , ∆ε a = ∫ ψ*aUψ a dV ,
(2.10.12)
где ∆ε s , ∆ε a – средние значения изменения полной энергии, возникающие в результате взаимодействия между атомами в молекуле. Отсюда (2.10.13) ε s = 2ε 0 + ∆ε s , ε a = 2ε 0 + ∆ε a После подстановки значений в (2.10.12) и выполнения промежуточных вычислений получаем: K + UJ s K − UJ s (2.10.14) ∆ε s = , ∆ε a = , 1+ Js 1 − Js где (2.10.15) K = ∫ ψ*A (1)ψ*B ( 2)Uψ A (1)ψ B ( 2) dV .
108
Интеграл K описывает так называемое обменное взаимодействие, его структура отображает физическую причину возникновения силы притяжения между атомами. Интеграл (2.10.15) относится к той области пространства, в которой электроны 1 и 2 одновременно принадлежат атомам А и В, т.е. находятся между ядрами. А так как электрические заряды электронов и ядер разноименны, то, находясь в пространстве между ядрами, они как бы притягивают ядра друг к другу (рис. 2.10.4).
1 A
B 2
Рис. 2.10.4. Модель возникновения сил притяжения между ядрами в молекуле Н2 Однако в пространстве между ядрами электроны могут находиться ρ ρ ρ ρ только в том случае, если LS 1 ↑↓ LS 2 . Если же LS 1 ↑↑ LS 2 , то электроны 1 и 2 в этом пространстве находиться не могут, так как в этом случае они находятся в одном и том же состоянии, что согласно принципу Паули запрещено. На рис. 2.10.5 изображены графики, поясняющие причину возникновения устойчивого состояния у молекулы водорода: состояния будут устойчивыми, если ε эл < 0 и имеется минимум энергии, отвечающий равновесному расстоянию между ядрами. Здесь R – расстояние между атомами. Электроны 1 и 2 в процессе движения вокруг ядер могут находиться не только между ядрами, но и за их пределами. В этом случае между ядрами возникает сила отталкивания. Значит, на ядра действуют знакопеременные силы, под влиянием которых ядра то сближаются, то удаляются друг от друга. В результате относительно центра инерции молекулы происходят колебания ядер, колебания атомов. Таким колебаниям должна соответствовать энергия колебательного движения ε кол . Анализ показывает, что, кроме этого, свободная молекула должна еще непрерывно вращаться вокруг своего центра инерции.
(
)
(
)
109
ε эп
∆εa 0
R0
R ∆ εs
D
Рис. 2.10.5. Энергия связи ядер в молекуле Н2 для устойчивой и неустойчивой конфигурации электронных спинов Полный момент импульса молекулы ρ ρ ρ L j = Lэл + Lя , L2j = η2 j ( j + 1) ,
(2.10.16)
где j – вращательное квантовое число, j = 1,2,3,... Зависимость эффективной потенциальной энергии взаимодействия между атомами от расстояния для устойчивых состояний всегда имеет минимум (рис. 2.10.6). Прочность связей атомов в молекуле определяется с помощью понятия энергии диссоциации D . Энергией диссоциации называется минимальная работа, которую необходимо совершить для разложения молекулы на атомы. Потенциальную энергию U(R) можно разложить в степенной ряд по r = R − R0 вблизи точки R = R0 , ограничиваясь только начальными членами разложения: dU 1 d 2U 2 1 d 3U 3 (2.10.17) U ( R) = U ( R0 ) + r+ r + r + ... dr 2 dR 2 6 dR 3 Здесь и в дальнейшем значения производных берутся в точке r = 0. В точке R = R0 функция U ( R) имеет минимум, ⎛⎜ dU ⎞⎟ = 0. ⎝ dr ⎠ R=R0 Если в (2.10.17) пренебречь четвертым слагаемым, то 1 d 2U 2 (2.10.18) U ( R) = U ( R0 ) + r . 2 dR 2 Так как энергия колебания относительно центра инерции молекулы
110
µω2 2 M ⋅ M2 M , r , µ= 1 M1 = M 2 = M = 2 2 M1 + M 2 M – масса ядра, то в (2.10.18) 1 d 2U µω2 = , 2 dR 2 2 где µ – приведенная масса молекулы, ω – собственная круговая частота колебаний ядер. Из (18) следует, что изменение потенциальной энергии молекулы µω2 2 ∆U ( R) = r = ε кол . 2 Таким образом, задача сведена к задаче о гармоническом осцилляторе с энергией 1⎞ ⎛ (2.10.19) ε кол = hν⎜ ν + ⎟, 2⎠ ⎝ где ν – колебательное квантовое число, ν = 0, 1, 2, 3,... . ε кол =
Заметим, что учет в (2.10.17) слагаемого
1 d 3U 3 r будет соответст6 dR 3
вовать ангармоническим колебаниям ядер. Атомы молекулы водорода все время вращаются вокруг центра инерции с кинетической энергии вращения η2 (2.10.20) ε вр = j ( j + 1), 2I I – момент инерции молекулы, j = 1, 2, 3,... . Медленное движение ядер приводит к расщеплению каждого электронного уровня на несколько дополнительных уровней, характеризующихся значениями квантовых чисел υ и j. Так как ε кол + ε вр ≤ D , то число таких уровней должно быть ограничено. Сравним теперь порядок величин всех трех слагаемых энергии молекулы. Полная энергия молекулы (2.10.21) ε = ε эл + ε кол + ε вр . Допустим, электроны, входящие в состав электронной оболочки молекулы, в какой-то промежуток времени локализованы вблизи R0 . Тогда неопределенность импульса в этой области пространства (∆r ≈ R0 )
111
η . R0 Для основного состояния электронной подсистемы молекулы можно принять неопределенность энергии примерно равной самой энергии: ∆ε эл ≈ ε эл Поэтому ∆p ≈
∆ε эл ≈
(∆p )2 2me
=
η . 2me R02
Приняв для оценки R0 = 1,06 ⋅ 10 −10 м , получим ∆ε ' эл = 3,4 эВ . Для оценки величины изменения энергии колебательного движения атомов положим в (2.10.19) u = 0 : ηω . (2.10.22) ∆ε кол ≈ ε кол = 2 Вблизи точки R = R0 между атомами, входящими в состав молекулы, действует квазиупругая сила, поэтому kr 2 µω2 r 2 (2.10.23) ε кол = = . 2 2 Следовательно, k ω= . µ Подставим найденное значение ω в (22): η2 k (2.10.24) . ε кол = 2 µ Так как 1 ⎛ d 2U ⎞ ∆U ( R) = ε кол = ⎜⎜ 2 ⎟⎟ r2, 2 ⎝ dR ⎠ R = R 0
то, как следует из (23), ⎛ d 2U ⎞ d2 K = ⎜⎜ 2 ⎟⎟ = dR 2 ⎝ dR ⎠ R= R 0
⎛ η2 ⎞ η2 ⎟ ⎜ 3 . = ⎜ 2m R 2 ⎟ me R04 ⎝ e ⎠ R = R0
Подставим значение K в (2.10.24): 3η2 1 me ε кол = = 3ε эл 2 µ 2 R0 meµ и после вычислений получаем ∆ε кол = ε кол = 0,2 эВ .
112
Вращательная энергия у слабовозбужденных атомов ( J = 1) η2 m (2.10.25) j ( j + 1) = 2ε эл e , 2 µ 2µR0 вычисления дают следующий результат: ∆ε вр = ε вр = 0,002 эВ ε вр =
Приведенные выше оценки хорошо соответствуют опытным данным. По физическому смыслу ε0 в (10) есть полная энергия электрона в атоме водорода, находящегося в основном состоянии. В нашем случае это ε эл . Тогда R 1 (2.10.26) ε 0 = ε эл = − , hc n 2 R – постоянная Ридберга, n = 1, 2, 3,..., n – главное квантовое число. С учетом (2.10.21), (2.10.22), (2.10.25) полная энергия молекулы водорода ⎛ ⎛ m ⎞ 1⎞ m (2.10.27) ε = ⎜⎜1 − ⎜ ν + ⎟ 3 e − 2 j ( j + 1) e ⎟⎟ε эл . 2⎠ µ µ ⎠ ⎝ ⎝ На рис. 2.10.6 приводится схема уровней энергии молекулы водорода. Из рис. 2.10.6 следует, что интервалы между соседними уровнями энергии колебательного и вращательного движений постепенно сближаются. А так как ε кол + ε вр ≤ D , то всегда существует определенная граница как для колебательных, так и для вращательных уровней. Из приведенных оценок видно, что интервал энергий между соседними уровнями очень мал. Поэтому отдельные спектральные линии оказываются физически неразличимыми и образуют полосы в спектре излучения. Возможность тех или иных переходов между отдельными уровнями молекулы водорода определяются правилами отбора для квантовых чисел: n – любое; ∆ν = ±1; ∆j = ±1 . (2.10.28) Из правил отбора (2.10.28) следует, что при переходе возбужденной молекулы в основное состояние на электронный спектр в (27), имеющий дискретный характер (см. (26)), накладываются спектры колебательных и вращательных переходов. В результате весь спектр представляет систему из нескольких групп полос, расположенных в различных участках спектра. Установленные выше результаты справедливы лишь при гармонических колебаниях ядер атомов, входящих в состав молекулы, т.е. при действии между ними квазиупругой силы. Но это будет справедливо
113
лишь при наличии малых отклонений ядер от положения равновесия. Если же отклонение от положения равновесия настолько велики, что сила взаимодействия будет отличаться от квазиупругой, то ε кол перестает выражаться формулой (2.10.19). В этом случае приближенно ее можно выразить формулой вида: 1 ⎞ 1 ⎞⎛ ⎛ (2.10.29) ε кол = hν⎜ υ + ⎟⎜1 − C1 (υ + ) ⎟ , C1 > d , d – размер молекулы. Этим объясняется чрезвычайно малая величина взаимодействия между молекулами. Впервые такая связь была введена в физику Ван-дер-Ваальсом в 1873 году. Различают три вида этих сил: ориентационные, индукционные, дисперсионные. Как показывает анализ, потенциальная энергия взаимодействия у них зависит от расстояния по одному и тому же закону: A (3.1.1) U= 6 . r Ориентационные силы возникают между молекулами полярных диэлектриков как результат взаимодействия между молекулами, имеющими постоянные электрические моменты диполей. Индукционные силы возникают из-за того, что одна из молекул, обладающая электрическим моментом диполя, поляризует другую и индуцирует в ней электрический момент диполя. Дисперсионные силы возникают потому, что дипольный момент молекулы быстро и случайным образом меняется во времени, одновременно с ним меняются дипольные моменты соседних молекул. Поскольку каждая молекула такого кристалла электронейтральна, то молекулярные кристаллы являются диэлектриками, не обнаруживая ни электронной, ни ионной проводимости. Наиболее сильные взаимодействия из перечисленных – ориентационные и дисперсионные. 3.2. Основные особенности классической и квантовой статистики Любое твердое тело состоит из огромного числа микрочастиц, находящихся в непрерывном движении. Наиболее простой подход к выявлению физических закономерностей заключается в описании их
121
коллективных свойств. Этим, наряду с термодинамикой, занимается статистическая физика. Статистическая физика – это раздел физики, в котором изучаются физические свойства макроскопических тел, т.е. систем, состоящих из очень большого числа частиц (электронов, атомов, молекул) с учетом индивидуальных особенностей этих частиц и взаимодействий между ними. Так как твердое тело состоит из огромного числа взаимодействующих частиц, то для выявления особенностей его состояния применяют методы статистической физики, законы которой справедливы для большого массива движущихся частиц. Одним из важнейших свойств твердого тела является его электропроводность. Наибольшей электропроводностью обладают металлические и ковалентные кристаллы. Поэтому в дальнейшем будем рассматривать в основном два типа кристаллических твердых тел – ковалентные кристаллы и металлы. У них: 1) ионы в пространстве располагаются периодически; 2) в процессе кристаллизации вещества от каждого из атомов отрываются валентные электроны, в результате в объеме твердого тела возникают либо электронный Ферми-газ (ЭФГ), либо электронная Ферми-жидкость (ЭФЖ). Понятия ЭФГ, ЭФЖ тесно связаны с понятием свободных электронов, которое было введено в разделе 3.1. В отсутствие электрического поля свободные электроны движутся хаотически между ионами кристаллической решетки. Электрическое поле положительного заряда ионов в какой-то мере экранирует действие ближайшего свободного электрона на рассматриваемый свободный электрон. Следовательно, в первом приближении можно принять, что свободные электроны не взаимодействуют между собой. Такая система невзаимодействующих между собой электронов называется ЭФГ. По своим физическим свойствам ЭФГ во многом похож на идеальный газ. Основной отличительной особенностью его является наличие у свободного электрона электрического заряда и собственного момента импульса. ЭФЖ – это тот же ЭФГ, но в этой модели свободные электроны взаимодействуют между собой. В настоящее время теория ЭФГ достаточно хорошо разработана количественно, теория ЭФЖ разработана на уровне операторов, пользуясь этой теорией, количественные расчеты выполнить не удается. Главные особенности твердого тела определяются степенью различия концентраций свободных электронов и особенностями связи между атомами кристаллической решетки. На величину электропроводности решающим образом влияет концентрация свободных электронов,
122
которая очень сильно меняется у различных твердых тел. Так, у металлов концентрация свободных электронов порядка 1028–1029 м-3, у полупроводников – 1020–1022 м-3, а у диэлектриков – 1012–1014 м-3.. А так как удельная электропроводность твердого тела (3.2.1) σ = е⋅n⋅b , где e – заряд электрона, n – концентрация свободных электронов, b – подвижность электронов, то удельные электропроводности металла, полупроводника, диэлектрика отличаются между собой на порядки величин: σ м >> σ п п >> σ диэл . Напомним, что σ = ρ −1 , b =
v E
,
(3.2.2)
где ρ – удельное электрическое сопротивление, v – дрейфовая скорость, E – напряженность электрического поля в веществе. Свободные электроны твердого тела образуют систему частиц, обладающую целым рядом специфических свойств. Рассмотрим, в чем же состоит своеобразие свойств такой системы частиц по сравнению со свойствами частиц идеального газа. Указанную задачу, в принципе, можно рассмотреть совершенно строго, пользуясь при этом либо методами квантовой статистики, либо методами квантовой механики. При этом как в том, так и в другом случаях придется использовать теорию вероятности. Так для решения задачи методом квантовой механики необходимо описать движение каждого электрона, для чего необходимо составить столько уравнений Шредингера сколько электронов в системе. Кроме того, необходимо знать реальный потенциал взаимодействия между частицами твердого тела. Такая задача необычайно сложна, с ней может справиться только ЭВМ, да и то в отдаленном будущем. Поэтому в настоящее время для объяснения физических особенностей твердых тел в основном применяют методы физической статистики с использованием законов теории вероятностей. С помощью статистики многих частиц удается в среднем описать особенности движения всех свободных электронов ЭФГ в твердом теле. С энергетической точки зрения твердое тело будем рассматривать как потенциальную яму, в которой находятся свободные электроны ЭФГ. Каждый из них не связан ни с одним из атомов твердого тела, а принадлежит всей кристаллической решетке в целом. Свободные электроны в твердом теле по своим свойствам отличны от молекул идеального газа, отличны от свободных электронов в вакууме. Формально это проявляется прежде всего в том, что молекулы идеального
123
газа подчиняются классической статистике Максвелла-Больцмана, а свободные электроны твердого тела подчиняются квантовой статистике Ферми-Дирака. Сравним теперь основные особенности классической и квантовой статистик. 1. Статистика Максвелла-Больцмана имеет дело с частицами, движение которых в пространстве описывается законами классической физики, состояние частицы однозначно определяется заданием ее координат x, y, z и проекций импульса на координатные оси px, py, pz. Как координаты, так и одноименные проекции импульсов, в принципе, можно определить одновременно и совершенно точно. Поэтому в природе возможны состояния, бесконечно мало отличающиеся одно от другого координатами, импульсами, энергией. Эти состояния классическая физика считает не совпадающими между собой. Следовательно, любые два физически близкие состояния являются различными, и никаких ограничений на них при этом не накладывается, в том числе и на точность их определения. Больше того, возможно, что ∆px ∆x → 0 , поэтому в пределе может быть так, что ∆px = 0 и ∆x = 0 , т.е. в одном и том же состоянии могут находиться две и большее число частиц, и эти частицы будут физически различными. Если каждой из таких частиц присвоить свой номер, например, 1, 2, 3, . . . , то теоретически можно проследить за движениями этих частиц в пространстве. По-иному дело обстоит с электронами твердого тела. В общем случае свободные электроны твердого тела обладают и волновыми, и корпускулярными свойствами. Поэтому для них выполняется соотношение неопределенностей, и классический способ описания состояний здесь неприемлем. 2. Введем в рассмотрение понятие фазового пространства координат и импульсов. Фазовым пространством называется пространство, вдоль координатных осей которого откладываются не только геометрические величины, координаты частиц, но и физические величины, например, проекции импульсов на соответствующие координатные оси. Рассмотрим первоначально фазовую плоскость p x − x . Разделим все фазовое пространство на равные по величине площади и назовем их ячейками фазовой плоскости (рис. 3.2.1). При этом размер ячейки выберем равной постоянной Планка: ∆px ∆x = h . Пусть в двух соседних ячейках имеется по одному электрону. Тогда, по определению, эти свободные электроны будут находиться в
124
различных физических состояниях, если ∆px ∆x > h . Если же ∆px ∆x < h , то указанные два состояния будут восприниматься как одно и две частицы будут физически неразличимы. Итак, чтобы частицы были физически различимы, необходимо выполнение неравенства (3.2.3) ∆px ∆x ≥ h .
px
e1
∆p x
e2
∆p x
∆x
∆x
x
Рис. 3.2.1. Фазовые ячейки Следовательно, минимальный размер площади ячейки двумерного фазового пространства, соответствующий физически различным состояниям, равен h . Теперь рассмотрим остальные две плоскости фазового пространства, а именно, p y − y , p z − z . Для каждой из этих плоскостей минимальная площадь равна h . Поэтому минимальный объем ячейки шестимерного фазового пространства координат и импульсов, которому соответствуют еще физически различимые соседние состояния, будет равен h3 : dτmin = ∆p x ∆x∆p y ∆y∆p z ∆z min = ∆p x ∆p y ∆p z dV min . (3.2.4)
(
)
(
)
3. Предположим, что все фазовое пространство разбито на ячейки с минимальным объемом фазового пространства dτ min = h3 . В каждой ячейке может находиться большое число квантовых состояний, заполненных электронами. Такие состояния будут физически неразличимыми и будут восприниматься как одно состояние. Эти состояния являются вырожденными. Условие снятия вырождения – в каждой ячей-
125
ке должно быть одно состояние с определенными значениями квантовых чисел n, l, m, ms, и это состояние должно быть заполнено свободным электроном. Если же не все ячейки заполнены электронами, то, тем более, такие состояния будут невырожденными. 4. Число частиц в фазовом пространстве можно получить умножением коэффициента заполнения каждой ячейки на полное число ячеек, причем коэффициент заполнения ячейки определяется из дополнительных условий. Итак, если объем ячейки фазового пространства dτ ≥ h3 , то каждой ячейке будет соответствовать свое квантовое состояние, только в этом случае состояния свободных электронов будут физически различными. Поэтому в квантовой статистике фазовое пространство, в том числе и координатное, дискретно. В классической статистике фазовое пространство непрерывно, классическая статистика никаких ограничений на величину ячейки фазового пространства не накладывает, полагая, что они могут быть сколь угодно малыми. Заполнение состояний свободными электронами в твердом теле происходит в соответствии с принципом Паули, согласно которому в состоянии с полной энергией ε может находиться не более двух электронов с противоположно направленными собственными моментами импульсов. Поэтому в каждой ячейке фазового пространства может находиться не более двух электронов с противоположно направленными спинами. 5. В статистике Максвелла-Больцмана предполагается, что молекулы идеального газа можно, по крайней мере в принципе, различать между собой, перестановка местами двух молекул, находящихся в разных состояниях, приводит к возникновению нового микросостояния. В квантовой статистике Ферми-Дирака предполагается, что все свободные электроны тождественны. Поэтому перестановка электронов, находящихся в разных состояниях, не приводит к появлению нового микросостояния, эти состояния оказываются совпадающими. 3.3. Функция распределения Ферми-Дирака Функция Ферми-Дирака – это такая функция, с помощью которой вычисляется вероятность осуществления состояния частиц с полуцелым спиновым квантовым числом. Так, если параметром состояния является полная энергия, то функция распределения позволяет вычислить вероятность осуществления состояния с полной энергией ε.
126
Функция распределения Ферми-Дирака может быть использована для любой системы частиц, у которых спин s = (2k + 1)/2, k = 0, 1, 2, 3, . . . Такими частицами, например, являются электроны, нуклоны в ядрах атомов и другие. Если же s = k , то вероятность возможных состояний такой системы частиц вычисляется с помощью функции распределения Бозе-Эйнштейна. Примером таких частиц, в частности, являются фотоны. Пусть в объеме находятся частицы с полуцелым спином, например, свободные электроны. Движение хаотическое. Поэтому концентрация электронов в интервале энергий от ε до ε + dε будет dn = f n dε , а число возможных состояний в этом интервале энергий dz = f z dε . Обозначим концентрацию, приходящуюся на единичный интервал энергий, dn fn = , dε а концентрацию состояний в единичном интервале энергий dz . fz = dε По определению, функция распределения Ферми-Дирака равна числу электронов, приходящихся на одно квантовое состояние: dn fф−д = . (3.3.1) dz В объеме твердого тела V = const все фазовое пространство разделим на отдельные ячейки (рис. 3.3.1). py 1
2
3
4
•
•
i
•
•
•
λ−1
λ px
Рис. 3.3.1. Заполнение фазовых ячеек Так как полное число частиц и полное число состояний соответственно равны N = nV , Z = zV , то после подстановки n и z в (3.3.1) получаем:
127
dN . (3.3.2) dZ В формуле (3.3.2) N – большая, но ограниченная величина, Z – большая и неограниченная величина. Поэтому всегда N < Z . Минимальный объем ячейки фазового пространства, соответствующий физически различимым состояниям fф−д =
dτmin = h3 = dpdV , где
dp = dp x dp y dp z , dV = dxdydz . Выберем одну ячейку фазового пространства из общего числа ячеp x p y p zV ек λ = . В каждой ячейке пространства импульсов, согласно dpdV принципу Паули, может находиться не более двух электронов с противоположно направленными собственными моментов импульса, только в этом случае состояния электронов будут физически различными. Поэтому максимально возможное значение fp-d=2. Если учесть спиновое к4ватновое число как еще одну координату фазового пространства, то функция Ферми-Дирака ограничена сверху значением 1. Это ограничение математически выражает "индивидуализм" квантовых частиц с полуцелым спином, заключенный в принципе Паули. Отметим, что функция распределения бозонов (Бозе-распределение) не ограничена сверху: в одной фазовой ячейке может находиться множество бозонов. Каждой ячейке фазового пространства соответствует Z i состояние с энергией εi ; таким образом каждому номеру ячейки присваивается определенный номер состояния, например, i -ой ячейке соответствует Z i - состояние. Выделим в объеме V два вспомогательных объема V1 и V2 , мысленно разделив эти объемы вспомогательной перегородкой (рис. 3.3.2). Состояние макроскопического тела, состоящего из N частиц, можно определить с помощью термодинамических потенциалов, их изменение определяет направленность протекающего в системе частиц процесса. Если температура и объем все время сохраняются неизменными, то такое состояние характеризуется изохорно-изотермным потенциалом, он еще называется свободной энергией. Для незаряженных частиц свободная энергия
128
F =U −T ⋅S . (3.3.3) Здесь U – внутренняя энергия системы частиц, T – температура, S – энтропия системы частиц, S = k ln W + S0 , (3.3.4) W – термодинамическая вероятность осуществления данного макроскопического состояния системы частиц, k – постоянная Больцмана, S0 – значение энтропии системы частиц при T = 0 K. V = V1 + V2 , T = const •
•
•
•
•
•
•
•
•
•
•
• V1 • q1 • • • • • •
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
V2
q2
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Рис. 3.3.2. Термодинамическое равновесие Если теперь в объем ввести dN заряженных частиц с потенциальной энергией ε n , то в системе таких частиц произойдет изменение свободной энергии ⎞ ⎛ ∂U ⎞ ⎛ ∂U dFq = ⎜ + ε n ⎟dN − T ⋅ dS , (3.3.5) ⎟dN + ε n ⋅ dN − T ⋅ dS = ⎜ ⎠ ⎝ ∂N ⎝ ∂N ⎠ ∂U где + ε n = ε , ε – энергия частицы в определенном квантовом со∂N стоянии, ε n = q ⋅ ϕ , ϕ – потенциал электростатического поля. Применим эти понятия к системе свободных электронов твердого тела. Пусть в объеме V находятся свободные электроны, двигающиеся в пределах твердого тела хаотически. В процессе движения некоторое их число переходит границу раздела вспомогательных объемов V1 и V2 и попадает в соседний объем. Процесс обмена частицами контактирующих между собой объемов можно характеризовать электрохимическим потенциалом ⎛ ∂Fq ⎞ ⎟⎟ . (3.3.6) µ э = ⎜⎜ ⎝ ∂N ⎠V ,T При термодинамическом равновесии ( V = const ) электрохимические потенциалы в каждом из вспомогательном объеме равны между собой:
129
µ э1 = µ э 2 . Физический смысл этого равенства следующий: работа по переносу одной заряженной частицы из объема V1 в объем V2 равна работе по переносу другой заряженной частицы из объема V2 в объем V1 . Таким образом, получается, что при термодинамическом равновесии электрохимические потенциалы у системы заряженных частиц в пределах объема всюду одинаковы. ⎛ ∂Fq1 ⎞ ⎛ ∂Fq 2 ⎞ ⎟⎟ ⎟⎟ µ э = ⎜⎜ = ⎜⎜ . (3.3.7) ⎝ ∂N1 ⎠V ,T ⎝ ∂N 2 ⎠V ,T 1
2
После подстановки значения Fq из (5) в (6), получаем выражение для электрохимического потенциала в наиболее общем виде: ∂S , (3.3.8) µ = ε −T ∂N где ε – полная энергия частицы в i -м состоянии, S – энтропия системы частиц, вид ее определен в (3.3.4). Покажем, как электрохимический потенциал зависит от функции Ферми-Дирака. Для этого, прежде всего, найдем закон изменения термодинамической вероятности с изменением числа частиц N в системе. По определению, термодинамическая вероятность Z! W= . (3.3.9) (Z − N )! N ! Прологарифмируем W : ln W = ln(Z !) − ln((Z − N )!) − ln( N !) . Так как согласно постановке задачи Z !>> 1 , ( Z − N )!>> 1 , N !>> 1 , то для упрощения дальнейших вычислений применим формулу Стирлинга: ln(Z!) = Z ln Z ; ln((Z − N )!) = (Z − N ) ln(Z − N ) ; ln(N!) = N ln N , после чего получаем (3.3.10) ln W = Z ln Z − ( Z − N ) ln(Z − N ) − N ln N . Продифференцируем полученное выражение (3.3.10): Z Z−N ∂(Z − N ) − ∂ ln W = (ln Z )∂Z + ∂Z − Z Z−N N − (ln(Z − N ))∂(Z − N ) − ∂N − (ln N )∂N . N
130
Так как общее число состояний при заданной температуре не меняется, ∂z = 0 , то после несложных преобразований имеем: ∂ ln W ⎛Z ⎞ (3.3.11) = ln⎜ − 1⎟ . N ∂N ⎝ ⎠ Как следует из (3.3.3), S − S0 ln W = . k Отсюда ∂S ∂ ln W =k . ∂N ∂N ∂S Найденное значение с учетом (3.3.11) и (3.3.2) подставим в ∂N (3.3.8): ⎛Z ⎞ 1 µ э = ε − kT ln⎜ − 1⎟ = ε − kT ln f ф−−д − 1 . (3.3.12) ⎝N ⎠ Из (3.3.12) находим выражение для функции Ферми-Дирака:
(
)
−1
⎞ ⎛ ε −µ э f ф − д = ⎜ e kT + 1⎟ . (3.3.13) ⎟ ⎜ ⎠ ⎝ Напомним, что в (3.3.13) ε – энергия частицы в i -м состоянии, µ э – электрохимический потенциал заряженной частицы. Из (3.3.13) следует, что при T = 0 K функция Ферми-Дирака имеет вид ступеньки (рис. 3.3.3): ⎧1 ε ≤ µ э , fф−д T =0K = ⎨ ⎩0 ε ≥ µ э . f ф −д 1
0,5
ε 0
µэ
µ µ0
Рис. 3.3.3. Функция Ферми-Дирака
0
µ э0
131
Для конечной температуры распределение "расплывается", появляются свободные состояния при ε < µ э и занятые при ε > µ э . Область этого "расплывания" имеет пределы тепловой энергии kT. Поскольку интегрирование функции распределения по энергии дает полное число частиц, то площадь под кривой Ферми всегда постоянна и не зависит от температуры. Если ε − µ э >> kT , то f ф − д = e
−
ε −µ э kT
= f 0e
−
ε kT
.
Таким образом, при ε − µ э >> kT , т.е. при достаточно большой энергии, "хвост" функции распределения соответствует функции распределения Максвелла-Больцмана. Значит, в указанном интервале энергий частицы ведут себя как частицы идеального газа. Такой энергией, в частности, обладают термоэлектроны, свободные электроны, вылетевшие за пределы твердого тела. Поэтому для термоэлектронов можно использовать классическую статистику. Но для свободных электронов твердого тела, строго говоря, классическую статистику применять нельзя. 3.4. Квазичастицы в кристаллическом твердом теле
Квазичастицами называются наделенные свойствами частиц элементарные возбуждения, возникшие в твердом теле в результате внешних воздействий. В зависимости от особенностей внешних воздействий существуют различные виды квазичастиц: фононы, квазиэлектроны, плазмоны, поляроны, экситоны и другие. В настоящем параграфе будут рассмотрены физические причины возникновения и физические особенности только двух видов квазичастиц, наиболее важных для понимания дальнейшего изложения физики твердого тела. Остальные виды квазичастиц рассматриваются только в специальных разделах курса физики. 3.4.1. Фононы кристаллической решетки Атомы, находящиеся в узлах кристаллической решетки, при Т>0 К участвуют в тепловом движении, совершая непрерывные колебания около положения равновесия. Амплитуда колебаний ионов у большинства кристаллов не превышает 0,01 нм, что составляет (5–7)% от величины среднего расстояния между ионами кристаллической решетки. Но движение ионов при этом оказывается весьма сложным. Дело в том, что колеблющиеся частицы связаны между собой силами взаимодействия. У металлов это проявляется в виде металлической
132
связи, у молекулярных кристаллов – в виде молекулярной связи, у полупроводников – в виде ковалентной. Между ионами кристаллической решетки одновременно действуют силы притяжения и отталкивания. Если ионы изобразить в виде шариков, а силы взаимодействия заменить силой сжатой или растянутой пружины, то имеется определенное расстояние между ионами, на котором ионы будут находиться в положении равновесия. Грубая модель расположения таких ионов с указанием связей в кристаллической решетке изображена на рис. 3.4.1. ρ F
ρ F
Рис. 3.4.1. Квазиупругая модель кристалла: О – ионы кристаллической решетки; – сила взаимодействия между ионами кристаллической решетки (условным образом изображена пружина) Если один из ионов вывести из положения равновесия, например, ρ силой F , то его перемещение вызовет соответствующее перемещение ρ соседних ионов. Если теперь действие силы F прекратится, то левый ион (рис. 3.4.1) будет совершать колебания, которые вследствие существующих между ионами связями будут передаваться соседним ионам. В результате в кристалле возникает процесс распространения колебаний, т.е. возникает волна. В общем случае в кристалле могут возникать как продольные, так и поперечные колебания ионов. Возникшие волны, достигнув поверхности кристалла, отражаются от нее, в кристалле возникает сложная система стоячих волн. Это явление аналогично тому, какое происходит в закрепленной с двух сторон струне (рис. 3.4.2). В ней, как известно, могут возникать стоячие волны определенной длины, поскольку для возникновения стоячей волны необходимо, чтобы на длине струны укладывалось целое число длин полуволн. Собственная частота колебаний, с которой происходят колебания струны, зависит от силы натяжения, упругих свойств струны и ее линейных размеров. В кристалле также устанавливается набор стоячих волн, причем величина каждой длины волны зависит от размеров кристалла и его упругих свойств. Таким образом, природа тепловых упругих волн в
133
кристалле аналогична природе звуковых волн, поэтому их еще называют акустическими. Интервал частот тепловых волн очень широк – от 100 Гц до 1013 Гц.
Рис. 3.4.2. Стоячие волны Предельное значение длин тепловых волн в кристалле можно определить из следующих соображений. Изобразим плоскую модель кристалла, линейный размер которого ℓ. Из рис. 3.4.3а видно, что максимальная длина стоячей волны λmax= 2ℓ. Действительно, для того, чтобы на поверхностях кристалла при наибольшей длине волны λmax=2ℓ возникли узлы, необходимо, чтобы линейный размер кристалла был бы равен половине наибольшей длины волны.
λ
4d
а б Рис. 3.4.3. Определение максимальной (а) и минимальной (б) длин волн Минимальная длина волны λmin может быть определена из рис. 3.4.3б. На нем изображена стоячая волна, которая охватывает 4 межатомных расстояния. Поэтому λmin = 4d, где d – постоянная кристаллической решетки. Скорость распространения тепловых волн совпадает со скоростью звука в кристалле, а энергия колебаний распределяется между всеми видами волн. Но, так как короткой длине волны соответ-
134
ствует наибольшая частота колебаний, то наибольшая энергия приходится на короткие волны. Как следует из квантовой механики, энергия колебаний ионов должна быть дискретной, т.е. квантована. Квант энергии тепловых колебаний ионов кристаллической решетки называется фононом и равен εФ = h ν , (3.4.4.1) где ν – частота колебаний ионов. Фононы, т.е. распространяющиеся в кристалле элементарные возбуждения, наделяются свойством частиц и называются квазичастицами. Они являются элементарными носителями движения в системе реальных частиц, входящих в состав кристаллической решетки, и связаны между собой взаимодействием. В газах частицы одновременно выполняют две функции: они являются элементарными кирпичиками вещества, тем самым выполняя функцию структурной единицы материи, и одновременно являются элементарными носителями движения в этой системе частиц. Таким образом, в газах элементарный носитель движения и структурная единица материи совпадают между собой, образуют единое целое. В твердом теле эти две функции разделены: ионы являются структурными единицами материи, а фононы являются структурными единицами движения, с их помощью переносится колебательная энергия. В процессе движения в кристалле фононы сталкиваются между собой и при этом рассеиваются. Рассеяние также происходит при столкновении фонона с дефектом кристаллической решетки. Система не взаимодействующих между собой фононов образует фононный газ, свойства его соответствуют статистике БозеЭйнштейна, функция распределения которой −1
⎞ ⎛ ε ⎟ ⎜ kT f Б − Э = ⎜ e − 1⎟ . ⎟ ⎜ ⎠ ⎝ Если рассматривать распространение волны в кристалле, то процесс распространения колебаний можно представить в виде цепочки ионов, в которой некоторое число ионов отклонилось от положения равновесия (рис. 3.4.4). Если в направлении между наибольшим сближением ионов движется электрон, то он столкнется с таким сближением и при этом либо отдаст часть своей энергии, либо получит от решетки некоторую ее величину.
135
На рис. 3.4.4 представлен наглядный образ фонона – кванта энергии теплового колебания ионов кристаллической решетки.
e
ρ v
me
Рис. 3.4.4. Взаимодействие электрона с фононами Приравняем среднюю энергию колебательного движения, приходящуюся на одну степень свободы, энергии одного фотона: kT = hν. (3.4.1.2) В уравнении (3.4.1.2) частота колебаний иона кристаллической решетки зависит от температуры. Тогда максимальной температуре будет соответствовать максимальная частота колебаний: (3.4.1.3) ν max = ν (Tmax ) . Частота колебаний ионов кристаллической решетки охватывает большой интервал частот, но среди возможных частот всегда имеется минимальная частота ν min и максимальная частота ν max . А так как для фононов, обладающих наибольшей энергией, справедлива зависимость (3.4.1.2), то можно записать: ⎛ kT ⎞ kθ ⎜⎜ ⎟⎟ (3.4.1.4) = 1, = h ν h ν ⎝ ⎠ν max max где θ – температура Дебая.
θ=
hνmax . k
(3.4.1.5)
Для одномерного кристалла температура Дебая легко вычисляется. Действительно, колебания в кристаллической решетке распространяются со скоростью звука: vзв = λ min ⋅ νmax = λ min / Tmin , Tmin – период колебаний. Отсюда v v ν max = зв = зв . (4.3.1.6) λ min 4d После подстановки νmax из (3.4.1.6) в (3.4.1.5) получаем:
136
h v зв . (3.4.1.7) 4k d Для трехмерных кристаллов следует учесть, что колебания ионов можно разложить на 3 составляющие. Тогда θ в (3.4.1.7) есть температура Дебая для одной составляющей колебаний, а максимальная энергия фонона с учетом 3-х составляющих колебаний будет равна (3.4.1.8) 3 hν max = θ x, y , z . θ=
Отсюда в общем случае температура Дебая равна 3 h v зв θ x, y , z = . (3.4.1.9) 4k d В качестве примера вычислим температуру Дебая для кристаллов Cu и NaCl, у которых скорости звука соответственно равны 3550 м/с и 4400 м/с, а постоянные кристаллической решетки 3,60Å и 5,63Å. В результате вычислений по формуле (3.4.1.9) получаем значения температур Дебая для Cu θ=354 K, для NaCl θ=281 К. Ниже в таблице приведены экспериментальные значения для некоторых веществ. Вещество
Au
Cu
Ge
NaCl
θэкс , K
170
315
290
280
Анализ таблицы показывает, что в кристаллах имеют место как продольные, так поперечные колебания, причем у Au преобладающими являются продольные, а у Cu – поперечные колебания. При температуре Т = θ в твердом теле возбуждается весь спектр колебаний с максимальной частотой νmax. Поэтому дальнейшее повышение температуры Т > θ не вызовет появление колебаний с новыми частотами, дальнейшее нагревание приводит лишь к увеличению амплитуды колебаний и соответствующему увеличению колебательной энергии. При Т < θ с ростом температуры увеличивается νmax, увеличивается спектр возможных частот колебаний. При Т > θ кристалл называется горячим, при Т < θ – холодным. Тогда температура Дебая есть граница раздела между горячим и холодным состояниями, но и в том, и в другом случаях амплитуда колебаний увеличивается с ростом температуры. Рассмотренные колебания ионов называются акустическими. Однако, когда элементарная ячейка кристалла содержит несколько атомов, то наряду с акустическими возникают оптические колебания.
137
3.4.2. Квазиэлектроны кристаллической решетки Ранее было показано, что движение электрона в вакууме можно представить в виде двух волновых функций, одна из которых отображает волновые свойства материи, другая – корпускулярные: ρρ − i (ω t − k r )
ρρ i − (ε t − p r ) η . = ψ0 e
(3.4.2.1) Таким образом, каждой движущейся частице с энергией ε и имρ пульсом p можно сопоставить некоторый волновой процесс. Из (1) ρ ρ следует, что ε = η ω и p = η k , ω – круговая частота колебаний волноρ вой функции, k – волновой вектор, ω = 2πν, k = 2π/ λ. Эти же представления можно распространить и на свободные электроны в кристаллическом твердом теле. Пусть первоначально свободные электроны не взаимодействуют между собой, т.е. в твердом теле существует ЭФГ. Возможные состояния электронов ЭФГ определяются набором уровней полной энергии. Эти состояния, в принципе, могут быть получены в результате решения уравнения Шредингера. Однако при наличии внешнего воздействия, в частности, при нагревании твердого тела, происходит возбуждение свободных электронов твердого тела, а, следовательно, и изменение у каждого из них полной энергии. Если такие возбуждения достаточно малы, то полная энергия системы свободных электронов будет складываться из энергии их основных состояний и энергии отдельных элементарных возбуждений: ψ = ψ0 e
N
N
i =1
i =1
ε = ∑ ε i + ∑ ∆ε i .
(3.4.2.2)
В результате элементарного возбуждения у каждого электрона увеличивается импульс, а стало быть и скорость движения в кристаллической решетке, т.е. элементарное возбуждение каким-то образом связано с изменением динамической характеристики движения частицы – импульса. Возбужденное состояние, возникающее в твердом теле, не остается локализованным, а в результате взаимодействия между частицами распространяется в виде волны. Возбуждения каждого из свободных электронов незначительны по величине. Они называются элементарными и наделяются свойствами частиц. Но так как возбуждения – это не реальные, а воображаемые частицы, то такие элементарные возбуждения называются квазичастицами. Они обладают квазиρ импульсом η k , энергией ε = ηω и спиновым квантовым числом s=1/2. Квазичастицы во многом подобны элементарным частицам, но они
138
никогда не могут возникать в вакууме. Дело в том, что для их возникновения обязательно требуется наличие вещества, состоящего из способных возбуждаться структурных элементов материи. В этом случае квазиэлектроны являются элементарными носителями движения. Квазичастицы (квазиэлектроны) также имеют массу, но для них понятие массы является условным: масса квазичастицы не обладает ни гравитационными, ни инерционными свойствами. Система невзаимодействующих между собой квазиэлектронов образует ЭФГ, для которого справедлива функция распределения Ферми-Дирака: −1
⎛ ε −µ 0 ⎞ ⎜ ⎟ fФ − Д = ⎜ e k T + 1⎟ , (3.4.2.3) ⎜ ⎟ ⎝ ⎠ где ε – энергия квазиэлектрона, µэ – их электрохимический потенциал. Для дальнейшего объяснения физических свойств кристаллического твердого тела необходимо ввести в рассмотрение поверхность Ферми. Поверхностью Ферми называется поверхность с постоянной полной энергией, равной энергии Ферми, построенная в пространстве квазиимпульсов, отделяющая область занятых электронных состояний от области состояний, в которой при Т = 0 К электронов нет. Большинство свойств кристаллического твердого тела определяют электроны, расположенные на поверхности Ферми и в узкой области пространства квазиимпульсов вблизи нее. Каждый металл характеризуется своей поверхностью Ферми, причем форма поверхности весьма разнообразная и, как правило, очень сложная. Но для ЭФГ поверхность Ферми сферическая, что сильно облегчает проведение конкретных расчетов. Электроны проводимости твердого тела являются квазичастицами. Приставку "квази-" электроны проводимости получили потому, что законы их движения в твердом теле сильно отличаются от законов движения в вакууме. Движение электрона проводимости можно представить себе как движение в сопровождении облака других частиц, поскольку в процессе движения за электроном возникает область эффективного положительного заряда, также перемещающегося вместе с ним. Это приводит к изменению зависимости между энергией и импульсом электрона. У электрона проводимости структурная единица материи, электрон, совпадает со структурной единицей движения, ρ квазиэлектроном. Ввиду сложного вида закона дисперсии ε = ε( p) для
139
наглядности квазиэлектроны удобно располагать над поверхностью Ферми в непосредственной близости от нее, тогда свободные уровни полной энергии будут располагаться в объеме, ограниченном поверхностью Ферми. К возбужденным состояниям свободных электронов металла понятие квазиэлектрона имеет двойное применение. Иногда под словом "свободные электроны" подразумевают квазиэлектроны, тем самым подчеркивая, что электроны в процессе движения возбуждаются. При такой трактовке число квазиэлектронов всегда равно числу свободных электронов и не меняется с изменением температуры. Однако чаще квазиэлектронами называют элементарные возбуждения, которые характеризуются появлением электрона за пределами поверхности Ферми, а освободившееся от электронов уровни полной энергии наделяются свойствами частиц и называются дырками. В этом случае квазичастицы рождаются парами и в пространстве не совпадают между собой. Заметим, что под дырками понимают незаполненное электроном состояние с энергией ε < εФ , εФ – энергия Ферми. 3.5. Распределение свободных электронов по энергиям
Свободный электрон в твердом теле представляет своеобразное сочетание двух понятий – структурной единицы материи и структурной единицы движения, причем структурная единица движения – элементарное возбуждение электрона, квазиэлектрон. Структурные единицы материи и движения у свободных электронов совпадают, образуя единое целое. Из этого, в частности, следует, что свободный электрон имеет заряд, энергию, квазиимпульс и массу. Но масса эта необычная, она не является носителем инерционных и гравитационных свойств, т.е. она не является ни динамической характеристикой движущейся частицы, ни материальной. Поэтому масса свободного электрона в твердом теле называется эффективной массой, ее физическое содержание мы раскроем в дальнейшем. Для изучения электрических, магнитных, тепловых и других свойств твердого тела необходимо знать распределение электронов по энергиям. Установим вид распределения при постоянной эффективной массе свободного электрона (m* = const). Предположим, что свободные электроны не взаимодействуют между собой. Значит, в твердом теле существует ЭФГ. Подсчитаем число возможных состояний свободных электронов в пространстве импульсов.
140
Число ячеек в объеме 6-мерного фазового пространства координат и импульсов может быть найдено как частное от деления всего объема фазового пространства на минимальный объем ячейки фазового пространства. Среда изотропная, поэтому поверхность Ферми сферическая. Следовательно, любое направление движения свободного электрона является равновероятным. Кроме того, распределение свободных электронов в геометрическом пространстве равномерное. Тогда при выборе фазового пространства можно рассматривать весь объем. ρ Пусть свободный электрон имеет импульс в интервале от p до ρ ρ p + dp (рис. 3.5.1). Распределение электронов по геометрическому объему V равномерно. Py
ρ dPy
ρ P
0
ρ dP
ρ dPx
Px
Рис. 3.5.1. Импульсное пространство Тогда число ячеек в объеме фазового пространства координатимпульсов будет dpx dp y dpz V dp3 ⋅V = . dN я = h3 h3 Число ячеек в единице объема геометрического пространства в выделенном объеме пространства импульсов dp3 = dpx·dpy·dpz (рис. 3.5.2) d N я dp = 3. V h Тогда число свободных электронов в единице объема геометричеρ ского пространства, импульсы которых находятся в интервале от p ρ ρ до p + dp , с учетом принципа Паули будет
141
dp 2 dГ я fф − д = 2 fф − д 3 , V h где fф-д – вероятность заполнения ячейки свободным электроном, функция Ферми-Дирака. dn =
pz ρ dp z
ρ dp ρ dpx
ρ dp y
py
px Рис. 3.5.2. Объем в импульсном пространстве
Полученное выражение для концентрации свободных электронов справедливо лишь для заданного направления импульсов. Однако в отсутствие внешних электрических и магнитных полей движение свободных электронов в кристаллической решетки твердого тела хаотично и в любом направлении равновероятно. Таких элементарных объемов в разных направлениях пространства импульсов можно построить бесчисленное множество. Совокупность таких элементарных объемов на одном и том же расстоянии пространства импульсов образует шаровой слой толщиной dp (рис. 3.5.3). py
ρ ρ dp p 0
Рис. 3.5.3. Шаровой слой
px
142
Объем такого шарового слоя dV p = 4π p 2 dp , а концентрация ячеек
в пределах выделенного шарового слоя пространства импульсов 4π p 2 dp dN я = . h3 Тогда концентрация свободных электронов в шаровом слое пространства импульсов 8 π p 2 dp (3.5.1) fФ − Д . dn = 2 fФ − Д dN я = h3 Перейдем теперь от пространства импульсов к пространству энергий и найдем концентрацию свободных электронов в интервале энергий от ε до ε + dε. Свободные электроны находятся в электрическом поле кристаллической решетки и потому обладают потенциальной энергией. Кинетическая энергия свободного электрона p2 K = ε −U = 2m * или p 2 = 2m * (ε − U ) , (3.5.2) где U – потенциальная энергия свободного электрона в твердом теле, m* – эффективная масса электрона. Перенесем начало отсчета энергии на дно потенциальной ямы, положив K = ε > 0. Тогда, как следует из (3.5.2),
p 2 = 2m * ε , 2
1 22
3 ( m*) 2
1 ε2
3
1
p dp = dε . (3.5.3) Отсюда после подстановки найденных значений в (3.5.1) имеем: 4 π (2m*) 2 ε 2 dε dn = . (3.5.4) ⎛ ε − µ ⎞⎞ 3⎛ h ⎜⎜1 + exp⎜ ⎟ ⎟⎟ ⎝ kT ⎠ ⎠ ⎝ Следует обратить внимание, что в показатель степени уравнения (3.5.4) входит не µэ , а µ. Это связано с тем, что теперь начало отсчета энергии находится на дне потенциальной ямы. Тогда концентрация
143
свободных электронов в интервале энергий от 0 до ∞ может быть определена после вычисления интеграла 3 1 ∞ 4 π (2m*) 2 ε 2 dε . n= 3 (3.5.5) ⎛ε−µ⎞ h 1 + exp⎜ ⎟ 0 ⎝ kT ⎠ Верхний предел ε = ∞ выбран из тех соображений, что при ⎛ε−µ⎞ ε−µ ⎟⎟ >> 1 , и поэтому без заметной ошибки >> 1 величина exp⎜⎜ kT ⎝ kT ⎠
∫
можно положить εmax = ∞. Если принять, что m* = const, то интеграл (3.5.5) является табличным, и тогда концентрация свободных электронов зависит от температуры, эффективной массы и химического потенциала: 3
2 3 8 π(2m*) 2 2 ⎛⎜ π 2 ⎛ k T ⎞ ⎞⎟ ⎟ . ⎜ n= µ 1+ ⎜ 8 ⎜⎝ µ ⎟⎠ ⎟ 3 h3 ⎝ ⎠
(3.5.6)
Пусть kT 0K
x
εФ
µ µ0
ε
dn dε
µ
0
а
б
Рис. 3.5.4. Распределение электронов по энергиям 3.6. Явление сверхпроводимости
Явление сверхпроводимости впервые было обнаружено в 1911 г. голландским физиком Каммерлинг-Оннесом при исследовании зависимости электрического сопротивления ртути от температуры. В результате проведенных опытов им было установлено, что при температуре Т = 4,2 К электрическое сопротивление ртути уменьшается практически до нуля. В 1913 г. за исследования физических свойств веществ при низких температурах, а также за разработку способа получения жидкого гелия ему была присуждена Нобелевская премия по физике. Однако разумного физического объяснения этому явлению ни ему, ни другим ученым того времени получить не удавалось. Причина возникших трудностей состояла в том, что сверхпроводимость – сугубо квантовое явление, возникающее в результате Бозе-конденсации пар электронов проводимости. Лишь после того, когда это установили, удалось объяснить это явление. В 1957 г. Бардиным, Купером и Шриффером (БКШ) был разработан первоначальный вариант микроскопической теории сверхпроводимости. Сверхпроводимость довольно распространенное в природе явление: оно наблюдается у чистых металлов, металлических сплавов и соединений, у некоторых полупроводников. Перечислим важнейшие свойства сверхпроводников.
146
1. Отсутствие электрического сопротивления протекающему постоянному току при температуре ниже критической Тк. 2. Выталкивание внешнего магнитного поля из объема сверхпроводника (эффект Мейснера). На рис. 3.6.1а изображено сечение проρ водника, помещенного во внешнее магнитное поле B при температуρ ре Т>Тк. Видно, что векторные линии индукции магнитного поля B пронизывают сечение проводника. Однако, если температура вещества будет ниже Тк, то вещество переходит в сверхпроводящее состояние, при этом внешнее магнитное поле уже не проникает в сверхпроводник, происходит выталкивание магнитного поля из сверхпроводника (рис. 3.6.1.б). Значит, при Т < Тк в объеме сверхпроводника магнитное поле отρ ρ сутствует, а так как B = µ 0 (1 + χ m ) H , χ m – магнитная восприимчивость вещества, то χ m = −1, µ = µ 0 (1 + χ m ) = 0 . Следовательно, при таких условиях сверхпроводник ведет себя как идеальный диамагнетик.
Tк ≤ T
ρ B T > Tк
а Рис. 3.6.1. Эффект Мессбауэра
ρ B
χ m = −1
χ m>1
б
3. Существование предельного значения индукции внешнего магнитного поля ВK и предельного значения плотности тока сверхпроводимости jк, при превышении которых сверхпроводимость в веществе исчезает. Согласно теории БКШ, между электронами проводимости действуют не только кулоновские силы отталкивания; при определенных условиях между некоторыми из них возникает сила притяжения. Физическая причина возникновения силы притяжения следующая. Свободный электрон, двигающийся в кристаллической решетке, притягивает к себе положительно заряженные ионы, тем самым несколько сближая их между собой. В результате такого уплотнения в расположе-
147
нии ионов в пространстве возникает избыточный положительный заряд, коррелированный с движущимся электроном. К такому положительному заряду притягивается другой электрон проводимости. Так, благодаря поляризации положительных зарядов, между электронами возникает сила притяжения. Этот процесс в какой-то мере подобен процессу обменного взаимодействия, благодаря которому возникает ковалентная связь между атомами. Оценки показывают, что сила притяжения между электронами превышает силу отталкивания между ними. В результате в объеме ЭФГ возникает множество связанных в отдельные пары электронов, эти пары называются куперовскими парами (к. п.). У электронов к. п. векторы собственных моментов импульсов антипараллельны, поэтому полный момент импульса к. п. всегда равен нулю, спиновое квантовое число одной к. п. s = 0. Итак, каждая к. п. является бозоном, для них запрет Паули не выполняется, в частности, в одном и том же состоянии может находиться множество к. п. Оценим расстояние между соседними к. п. Пусть первоначально температура металла Т = 0 К. В металле электрическое поле отсутствует, и электрический ток не протекает. В этом случае все состояния ниже уровня Ферми оказываются заполненными электронами (см. раздел 3.5), а все состояния с энергией выше уровня Ферми будут полностью свободными. Если вещество изотропное, то поверхность Ферми (см. раздел 3.5) в пространстве импульсов будет иметь сферическую форму с радиусом сферы рФ. Пусть теперь температура металла выше 0 К, но меньше Тк. Тогда некоторые электроны, первоначально находившиеся вблизи поверхности Ферми, перейдут на более высокие свободные уровни энергии, расположенные в непосредственной близости к поверхности Ферми. В результате вблизи поверхности Ферми возникает тонкий слой энергетических состояний, частично заполненный электронами. Толщина этого слоя находится в интервале импульсов от р01 = рФ - ∆p/2 до р02 = рФ + ∆p/2, а интервал энергий электронов в пределах этого слоя при температуре, близкой к Тк, будет ∆ε ≈ k Tк 1эВ, то энергии фононов теперь уже будет недостаточно, чтобы при столкновении с ними свободные электроны получили энергию достаточную для перехода из валентной зоны в зону проводимости. В результате свободные электроны в зоне проводимости практически отсутствуют, свободных носителей заряда в ней нет. Такие вещества электрический ток не проводят. Это диэлектрики. Наконец, может быть предельный случай, когда ∆ε ≈ 0 эВ. Это означает, что валентная зона и зона проводимости соприкасаются между собой, причем зона проводимости даже при Т = 0 К должна быть частично заполнена электронами (рис. 3.8.4).
ε
∆x =d
y
0
-
Рис. 3.8.4. Энергетические зоны висмута
}
6p
}
5d
} 6s
161
Примером может служить Bi, у которого внешние электроны находятся в состояниях: 5d10 6s2 6p3. При Т = 0 К зона 6s заполнена полностью, зона 6p заполнена частично. При Т > 0 К вследствие переходов электронов из зоны 6s зона 6p заполняется дополнительно. Так как зоны 6p и 6s соприкасаются (∆ε = 0 эВ ), то подобные переходы имеют место при любой температуре. Такое вещество обладает высокой электропроводностью, но его электрическое сопротивление с ростом температуры уменьшается в области высоких температур и увеличивается в области низких. Это связано с тем, что при высоких температурах в зону проводимости в значительном количестве поступают электроны из валентной зоны. Но так как при высокой температуре энергия фононов достаточно велика, следовательно, и возбуждения электронов валентной зоны при столкновении с фононами оказываются значительными, что позволяет электронам переходить в зоны проводимости с более глубоких слоев валентной зону. Такое вещество при высоких температурах ведет себя как полупроводник. Наоборот, при низких температурах поступление электронов из валентной зоны в зону проводимости невелико, влияние их на изменение концентрации свободных электронов зоны проводимости незначительно. Поэтому при низких температурах такое вещество ведет себя как металл. Твердые тела, обладающие металлическими и полупроводниковыми свойствами, называются полуметаллами. 3.9. Эффективная масса квазиэлектрона в твердом теле
Под действием приложенной разности потенциалов в проводнике возникает электрический ток, т.е. направленный поток электронов. С микроскопической точки зрения это означает, что под действием электрического поля в проводнике возникает направленное ускоренное движение электронов, в результате на расстоянии, равном средней длине свободного пробега, электрон приобретает добавочную энергию – энергию возбуждения. Наличие энергии возбуждения наглядно проявляется на примере автоэлектронной эмиссии, когда вблизи поверхности металла под действием внешнего поля возникает потенциальный барьер конечной толщины. Электроны проводимости с определенной, хотя и весьма малой, вероятностью могут преодолеть его туннельным эффектом и вылететь в вакуум. Но вылететь может не любой электрон, а только тот, который получил элементарное возбуждение ∆ε.
162
У полупроводников элементарные возбуждения электронов называются квазиэлектронами. Они наделяются скоростью, квазиимпульсом, энергией и эффективной массой. По определению, квазиимпульс равен ρ ρ p = ηk . (3.9.1) Тогда сила, действующая на квазиэлектрон, ρ ρ dpρ dk F= =η . (3.9.2) dt dt Энергия квазиэлектрона p2 η 2 (3.9.3) k , ε= = * 2 me 2 me* где m*e – эффективная масса квазиэлектрона. Скорость квазиэлектрона ρ η ρ v = * k. (3.9.4) me Тогда производная от полной энергии по волновому числу с учетом неравенства k dme* 2 >> * , me dk (3.9.5) dε η2 = k. dk me* Если квазиэлектрон находится в электрическом поле напряженноρ стью E , то на квазиэлектрон действует сила dv (3.9.6) F = e E = me* . dt Из совместного решения уравнений (3.8.4) и (3.8.5) получаем: 1 dε v= , (3.9.7) η dk 1 1 dv = (3.9.8) . * me η dk
На рис. 3.9.1 слева изображены графики полной энергии ε, скорости v, эффективной массы m*e квазиэлектрона, а справа изображена зона разрешенных значений энергии для первой зоны Бриллюэна. Из рис. 3.9.1 следует, что вблизи дна зоны эффективная масса m*e положительна, вблизи верхней части зоны эффективная масса отрицатель-
163
на, и где-то в средней части зоны эффективная масса испытывает разрыв непрерывности.
ε
ε
me* < 0 me* > 0
−
2π d
0 v
2π d
kx
0
y
kx
m e*
kx
Рис. 3.9.1. К определению эффективной массы электрона Подставив в (3.9.2) значение k из (3.9.4), получим dv , (3.9.9) F = me* dt где 1 1 d 2ε . = me* η2 dk 2 Следовательно, квазиэлектрон можно рассматривать как свободную частицу, движение которой в кристаллической решетке подчиняется 2-му закону Ньютона. Появление у квазиэлектрона эффективной массы вызвано влиянием периодического поля кристаллической решетки на движущийся в зоне проводимости валентный электрон.
164
Эффективная масса квазиэлектрона – это не обычная масса электрона, а всего лишь коэффициент пропорциональности между внешdv , определяющий составляющую направней силой F и ускорением dt ленного движения электрона на фоне его хаотического движения. Эффективная масса квазиэлектрона не определяет ни запаса энергии, ни гравитационные, ни инерционные свойства электрона. Больше того, в общем случае направление действия силы и ускорения в пространстве могут и не совпадать. Единственным оправданием введения такого понятия является привычность и простота законов классической механики, которые с введением указанного коэффициента можно достаточно просто использовать для анализа особенностей движения свободного электрона в периодическом поле кристаллической решетки при наличии в ней внешнего электрического поля, а также возможность ее экспериментального измерения. Кроме того, в целом ряде случаев величина измеряемой эффективной массы квазиэлектрона имеет тот же порядок величины, что и масса свободного электрона. Это показывает, что эффективная масса квазиэлектрона в какой-то мере отображает реальные инерционные свойства электрона. Проведенное рассмотрение справедливо лишь в приближении сильной свяρ зи. Опыт показывает, что в ряде случаев графики дисперсии ε(k ) для полупроводников действительно имеют вид параболических зависимостей. 3.10. Дырочная проводимость
Для простоты рассуждений предположим, что в твердом теле имеется всего две зоны разрешенных значений энергии. Одна полностью заполнена электронами, другая полностью свободна, их разделяет зона запрещенных энергий. Теперь удалим электрон с одного из верхних уровней нижней зоны, для этого сообщим ему энергию, достаточную для перехода в верхнюю зону. Тогда в верхней зоне будет находиться электрон, а в нижней зоне освободится уровень полной энергии. Возникший свободный уровень, возникшее вакантное место в пределах заполненной зоны называется дыркой. Электрон, попавший в верхнюю зону из нижней, под действием электрического поля будет перемещаться, при этом на расстоянии, равном средней длине свободного пробега, он будет постепенно накапливать дополнительную энергию, будет постепенно переходить на более высо-
165
кие уровни. В заполненной зоне существует свободный уровень полной энергии, там также возникает направленное движение электронов. Происходит процесс, аналогичный процессу перемещения электрона в верхней зоне, когда под действием поля электрон переходит с нижнего уровня на верхний свободный. В результате такого перехода в заполненной зоне освобождается нижележащий уровень полной энергии. Возникший вакантный уровень полной энергии наделяется свойством частицы – это квазичастица и называется дыркой. −
2π d
0
2π d
y
kx
mд* > 0 mд* < 0
εд
εд
v
kx mд*
kx
Рис. 3.10.1. К определению эффективной массы дырок По мере возбуждения электронов, сопровождающегося переходами на выше расположенные соседние уровни, дырка постепенно будет опускаться в нижнюю часть заполненной зоны. Минимальным значением энергии дырка будет обладать на верхней границе заполненной зоны. В геометрическом пространстве дырка перемещается в направлении, обратном направлению движения электрона. Следовательно, под действием внешнего электрического поля дырка будет перемещаться точно так же,
166
как перемещалась бы положительно заряженная частица под действием того же поля. Стало быть, дырка как бы обладает положительным зарядом, равным заряду электрона, и, так как она – квазичастица, то также обладает эффективной массой m*д. Минимальным значением полной энергии дырка обладает на верхней границе заполненной зоны, поэтому отсчет энергии для дырок идет сверху вниз от верхней границы заполненной зоны. На рис. 3.10.1 по аналогии с квазиэлектронами приведены графики полной энергии ε, скорости v и эффективной массы m*g дырок в первой зоне Бриллюэна, а также соответствующая заполненная зона разрешенных энергий. Из приведенных графиков видно, что в верхней части заполненной зоны эффективная масса дырки mд* положительна, в нижней части зоны она отрицательна. Если эти понятия применить к собственному полупроводнику, то окажется, что в зоне проводимости электрон обладает некоторой энергией возбуждения, т. е. там возникает квазиэлектрон, у которого минимум энергии находится на дне зоны проводимости и отсчет энергии ведется снизу вверх, а в валентной зоне – дырка, для нее энергия растет сверху вниз (рис. 3.10.2). Под действием электрического поля они перемещаются в противоположных направлениях: дырка в валентной зоне, электрон - в зоне проводимости.
ε
εe
ρ E 0= 0
0
ρ ρ E 0= − E 0 j
y
Зона проводимости
Зона проводимости ρ
-
∆ε +
Валентная зона
y
ve
∆ε
ρ vg
+
Валентная зона
Рис. 3.10.2. Электронно-дырочная пара Итак, в собственном полупроводнике сразу возникают две квазичастицы – квзиэлектрон и дырка. В нем по-прежнему структурной еди-
167
ницей материи является электрон, а структурными единицами движения являются квазиэлектроны и дырки, причем в геометрическом пространстве квазиэлектрон совпадает с электроном, что же касается дырок, то они с электроном пространственно разделены. Дырки прямого физического смысла не имеют. Тем не менее, на основе использования понятия дырок можно достаточно просто объяснить некоторые физические особенности полупроводников.Можно предложить такой наглядный образ дырки. При тепловом возбуждении одна из связей между соседними атомами разрывается, участвовавший в образовании связи электрон становится электроном проводимости. Затем в результате флуктуации тепловых колебаний ионов решетки связь разрывается в другой части кристалла, а освободившийся валентный электрон занимает место в предыдущей разорванной связи, и т.д. Каждая разорванная связь обладает положительным зарядом, энергией, эффективной массой. Если теперь в кристалле существует электрическое поле ρ E0 , то под действием поля электроны и дырки будут двигаться в противоположные стороны, возникает ток проводимости. 3.11. Электрохимический потенциал в собственных полупроводниках
Пусть система, состоящая из N частиц, характеризуется постоянной температурой и объемом (T, V) = const. Такую систему можно описать, используя различные макроскопические параметры, в данном случае используя изохорно-изотермный потенциал, или, что тоже самое, свободную энергию: F = U – T·S , (3.11.1) U – внутренняя энергия, S – энтропия системы частиц, Т – температура. По физическому смыслу свободная энергия является мерой той работы, которую может совершить система, находясь в изохорноизотермном состоянии при переходе системы из одного фазового состояния в другое. Тогда химическим потенциалом называется величина, равная изменению свободной энергии при изменении числа незаряженных частиц в системе на единицу в изохорно-изотермном процессе: ⎛ ∂F ⎞ (3.11.2) µ=⎜ ⎟ . ⎝ ∂N ⎠T ,V Если же в объеме находится система заряженных частиц, то свободная энергия системы заряженных частиц
168
Fq = F + N εn, (3.11.3) εn = qφ, εn – потенциальная энергия частицы с зарядом q, φ – потенциал электростатического поля, N – полное число частиц в системе. По определению электрохимический потенциал заряженной частицы ⎛ ∂Fq ⎞ ⎟⎟ , µ э = ⎜⎜ (3.11.4) ⎝ ∂N ⎠V ,T µ э = µ + qϕ . Разделим полный объем V на два вспомогательных объема V1 и V2. Тогда в объеме V1 будет находиться N1 частиц, а в объеме V2 будет находиться N2 частиц. Частицы движутся хаотически, поэтому между объемами V1 и V2 происходит обмен частицами, т.е. имеет место диффузионный контакт (рис. 3.11.1). Полное число частиц в объеме N = N1 + N2 = const. Следовательно, увеличение числа частиц в объеме V1 означает убыль их числа в объеме V2: dN1 = - dN2. В общем случае изменение свободной энергии dF = µ 1 dN1 + µ 2 dN 2 . Но в состоянии термодинамического равновесия dF = 0, поэтому µ1 dN1 = −µ 2 dN 2 . (3.11.5) После подстановки в (3.11.5) dN1 = - dN2 получаем (3.11.6) µ1 = µ 2 = µ . Итак, при термодинамическом равновесии химические потенциалы в различных частях системы частиц равны между собой.
V1
V2
N1
N2
µ э1
µэ2
Рис. 3.11.1. Термодинамическое равновесие Пусть теперь в объеме находятся N заряженных частиц. Тогда в общем случае dFq = µ dN + ε n dN .
169
Но при наличии термодинамического dFq= 0, dN1 = - dN2 , имеем µ э1 = µ э2 = µ э .
равновесия,
когда
(3.11.7)
Таким образом, при термодинамическом равновесии в различных частях пространства электрохимические потенциалы равны между собой. Эта особенность электрохимического потенциала позволяет использовать его для определения условия, при котором в системе имеет место термодинамическое равновесие. Неравенство между собой электрохимических потенциалов в различных микрообъемах указывает на протекание различных процессов переноса в пространстве. Определим теперь положение уровня электрохимического потенциала в собственном полупроводнике, в котором существует система квазиэлектронов и дырок. Направления отсчета энергии у них противоположные: у квазиэлектронов начало отсчета энергии – на дне зоны проводимости, у дырок – на верхней границе валентной зоны. Электрохимический потенциал – это энергетическая величина, определяющая состояние термодинамического равновесия в системе частиц или квазичестиц. Так как в собственном полупроводнике одновременно существуют квазиэлектроны и дырки, то электрохимический потенциал такой системы квазичастиц будет равен среднему значению его составляющих: µ эe + µ эд µэ = . (3.11.8) 2
εe
Зона проводимости
fe 0e 0д
fд
µ эe
µ э ∆ε
0
µ эд Валентная зона
εд Рис. 3.11.2. Зоны собственного полупроводника
170
На рис. 3.11.2 изображены расположение зон в собственном полупроводнике, где fe, fд – функции Ферми-Дирака для квазиэлектронов и дырок: −1
−1
⎛ ⎛ ε e − µ эe ⎞ ⎞ ⎛ ⎛ ε − µ эд ⎞ ⎞ ⎟ + 1⎟ , f д = ⎜ exp⎜ д ⎟ + 1⎟ . (3.11.9) f e = ⎜ exp⎜⎜ ⎟ ⎜ ⎟ ⎜ ⎜ kT ⎟ ⎟ kT ⎠ ⎠ ⎠ ⎠ ⎝ ⎝ ⎝ ⎝ Для вычислений функций распределения fe и fд необходимо знать электрохимический потенциал квазичастиц. Ранее в разделе 3.5 было получено выражение для химического потенциала свободного электрона: 2⎞ ⎛ ⎜ π 2 ⎛⎜ kT ⎞⎟ ⎟ µ = µ 0 ⎜1 − (3.11.10) ⎟, ⎜ 12 ⎜⎝ µ 0 ⎟⎠ ⎟ ⎝ ⎠ 2
h 2 ⎛ 3n ⎞3 µ0 = (3.11.11) ⎜ ⎟ . 8 m* ⎝ π ⎠ Формулы (3.11.10) и (3.11.11) полностью применимы для квазиэлектронов и дырок. Из опыта известно, что концентрация квазиэлектронов в металле примерно в 106 раз больше концентрации квазичастиц в собственных полупроводниках. Как видно из формулы (3.11.10), для вычисления химического потенциала необходимо знать эффективную массу квазичастиц. В табл. 3.11.1 приводятся относительные значения эффективных масс квазиэлектронов и дырок в Si и Ge, а также ширина запрещенной зоны ∆ε0 у каждого из этих полупроводников.
me* me
mд* me
∆ε 0 , ЭВ
Si
1,08
0,37
1,12
Ge
0,56
0,59
0,66
Табл. 3.11.1. Относительные значения эффективных масс квазиэлектронов, m*e, и дырок, m*д, и ширина запрещенной зоны, ∆ε0 в Si и Ge Подставив найденные значения в (3.11.10), (3.11.11), получим: µ эe ≈ 0 , µ эд ≈ 0 .
171
Это означает, что функции Ферми-Дирака fe и fg для квазичастиц соответственно локализованы вблизи границ зоны проводимости и валентной зоны. Из рис. 3.11.2 видно, что µ эд = µ эe − ∆ε 0 . (3.11.12) Подставим µ эд из (3.11.12) в (3.11.8): ∆ε 0 µэ =− . (3.11.13) 2 Итак, уровень электрохимического потенциала в собственном полупроводнике для системы, состоящей из квазиэлектронов и дырок, проходит через середину запрещенной зоны (рис. 3.11.2). Более строгий анализ показывает, что положение уровня электрохимического потенциала незначительно меняется с изменением температуры. Это связано с тем, что зависимость для квазиэлектронов более сильная, чем аналогичная зависимость для дырок. 3.12. Примесные полупроводники
Электропроводность собственных полупроводников очень сильно зависит от концентрации примесей, введенных в кристаллическую решетку. Так, введение в Si всего лишь 0,001% бора увеличивает электропроводность в 1000 раз. Повышенная электропроводность, обусловленная примесями, называется примесной проводимостью, а сами полупроводники – примесными полупроводниками. Для выяснения механизма действия примесей на проводимость полупроводников рассмотрим влияние фосфора P и бора В на свойства Si. Чистый Si является собственным полупроводником. Атом Si имеет порядковый номер в периодической системе элементов Z = 14, поэтому в состав его электронной оболочки должно входить 14 электронов, распределенные по состояниям следующим образом: 1s2 2s2 2p6 3s2 3p2 . Такая система электронов позволяет Si иметь кристаллическую решетку, в которой каждый атом окружен четырьмя ближайшими соседями. Связь между ними ковалентная и создается электронами 3s3p. На рис. 3.12.1 изображена плоская модель кристаллической решетки. Предположим, что некоторое число атомов Si заменена атомами фосфора Р, у которого Z=15, а электроны распределены по состояниям 1s2 2s2 2p6 3s2 3p3. Значит, атом Р имеет валентность, равную 5, она определяется электронами 3s2 3p3. Внедренный атом Р для образова-
172
ния связи с четырьмя ближайшими атомами использует 4 валентных электрона, пятый валентный электрон в образовании связи не участвует, он первоначально движется вокруг атома P (рис. 3.12.1), постепенно удаляясь от него. Тепловые столкновения с электронами и фононами кристаллической решетки приводят к тому, что электрон переходит в возбужденное состояние, а расстояние между электроном и остовом атома P увеличивается настолько, что между ними находится один или несколько атомов Si. Эти атомы экранируют электрическое поле остова атома P, в результате связь между электроном и остовом ослабляется настолько, что достаточно тепловых столкновений ионов Si с электроном, чтобы он оторвался от своего атома и превратился в электрон проводимости.
p+
Рис. 3.12.1. Кристаллическая решетка кремния с примесью Указанный наглядный процесс означает, что внедренный атом примеси создает в запрещенной зоне уровень полной энергии, на котором первоначально находится валентный электрон атома Р. Этот уровень располагается вблизи дна зоны проводимости на расстоянии ∆ε дон = 0, 044 эВ и называется донорным уровнем, так как он является основным поставщиком электронов в зону проводимости (заполненный электроном уровень-донор). Действительно, в результате возбуждения атома Р тепловыми колебаниями решетки валентный электрон 3р отрывается от атома и переходит с донорного уровня в зону проводимости (рис. 3.12.2), при этом атом Р превращается в положительно заряженный ион, прочно связанный с ближайшими ионами кристаллической решетки. Положительный заряд иона под действием электрического поля в
173
образовании тока проводимости участвовать не может, в образовании тока проводимости будут участвовать электроны, перешедшие в зону проводимости как с примесных уровней, так и из валентной зоны. Ширина запрещенной зоны у Si ∆ε0 =1,12эВ.
ε
Зона проводимости
∆ ε дон
-
{
-
∆ε +
+
0
µ эn
Валентная зона
Рис. 3.12.2. Примесная электронная проводимость Итак, концентрация электронов в зоне проводимости в основном определяется концентрацией атомов примеси. Возникшие же в результате переходов в валентной зоне дырки имеют концентрацию на много порядков меньше, чем концентрация электронов в зоне проводимости, и практически не влияют на величину электропроводности при комнатной температуры. Такой полупроводник обладает электронной проводимостью и называется полупроводником n-типа, в нем основными носителями заряда являются электроны, а неосновными носителями заряда являются дырки. Предположим теперь, что в кристаллической решетке Si некоторое число атомов замещено атомами бора В, у которого электроны по состояниям распределены следующим образом: 1s2 2s2 2p1. Валентным электроном является электрон в состоянии 2p. Для образования связей с четырьмя ближайшими соседними атомами Si атому В не хватает одного электрона. Его можно заимствовать у атома Si. Опыт показывает, что для отрыва валентного электрона 2р от атома Si требуется энергия активации ∆ε акц = 0,046эВ, которая может быть получена от фононов кристаллической решетки. Разорванная в кристаллической решетке связь обладает свойством положительного заряда, равного заряду электрона, она не локализована возле какого-либо конкретного атома Si, а вследствие флук-
174
туаций колебаний ионов кристаллической решетки случайным образом перемещается от одного атома к другому (рис. 3.12.3).
B
Рис. 3.12.3. Дырочная примесь
ε Зона проводимости -
∆ε
0
µ эp
-
∆ ε акц { +
+
Валентная зона
Рис. 3.12.4. Примесная дырочная проводимость Внедрение в кристаллическую решетку атомов В означает, что в непосредственной близости к верхней границе валентной зоны возник примесный свободный уровень (рис. 3.12.4). Близость этого уровня к заполненной валентной зоне приводит к тому, что уже при сравнительно низких температурах электроны из валентной зоны переходят на примесный уровень. Кроме того, наряду с переходами на примесные уровни, в результате возбуждений некоторое число электронов переходит из валентной зоны в зону проводимости, но их концентра-
175
ция там чрезвычайно мала. Возникшая в валентной зоне разорванная между соседними атомами Si связь обладает свойством квазичастицы и называется дыркой. Дырка имеет положительный заряд, эффективную массу, энергию. Но так как концентрация дырок в валентной зоне во много раз больше концентрации квазиэлектронов в зоне проводимости, то основными носителями заряда в таких полупроводниках являются дырки, не основными – квазиэлектроны. Такие полупроводники называются полупроводниками р-типа. Таким образом, в кристаллическом Si все трехвалентные атомы примеси создают дырочный, а все пятивалентные атомы примеси – электронный тип проводимости. В отличие от собственной проводимости, которая имеет место в собственном полупроводнике и осуществляется одновременно квазиэлектронами и дырками, примесная проводимость полупроводника обусловлена в основном носителями заряда одного знака: квазиэлектронами в случае донорной примеси, дырками – в случае акцепторной примеси; эти носители заряда называются основными. Кроме них, примесный полупроводник содержит и неосновные носители заряда: полупроводник n-типа – дырки, полупроводник р-типа – квазиэлектроны. Концентрация их, как правило, значительно меньше концентрации основных носителей заряда. Поэтому доля, вносимая ими в электропроводность, во много раз меньше доли, вносимой основными носителями заряда. 3.13. Электропроводность полупроводников
Электропроводность вещества – это одна из тех немногих характеристик твердого тела, которую сравнительно легко можно определить из опыта, например, непосредственным измерением электрического сопротивления. Для оценки величины электропроводности любого тела используются такие физические величины, как электрическое сопротивление, удельное электрическое сопротивление, удельная электропроводность. Если полупроводник однородный и имеет по длине постоянное поперечное сечение, то электрическое сопротивление образца вычисляется по формуле: λ R=ρ , (3.13.1) S где ρ = σ-1 – удельное сопротивление, σ – удельная электропроводность.
176
3.13.1. Собственный полупроводник Пусть в собственном полупроводнике существует электрическое поле напряженностью Е0, под действием которого в нем возникает направленное движение свободных зарядов – электрический ток. Опыт показывает, что при малых напряженностях электрического поля средняя скорость направленного движения носителей заряда пропорциональна напряженности электрического поля: v = b E0 , (3.13.2) где b – подвижность, – средняя скорость носителя заряда. Уравнение (3.13.2) позволяет сформулировать следующее определение подвижности носителей заряда: подвижностью носителей заряда называется величина, численно равная средней скорости направленного движения, которую носители заряда того или иного знака приобретают в электрическом поле напряженностью 1В/м. Из раздела "Электричество" известно, что плотность электрического тока j = en v , (3.13.3) где n – концентрация носителей заряда, e – заряд электрона, e> ∆εдон , ∆ε0 >> ∆εакц , то при достаточно низкой температуре электропроводность примесных полупроводников в основном определяется величиной концентрации примесей. Однако с ростом температуры примесные уровни будут постепенно истощаться,
179
и при высоких температурах электропроводность будет определяться концентрацией носителей заряда в собственном полупроводнике. Формулы (3.13.19), (3.13.20) позволяют по результатам опыта вычислить энергию активации в полупроводниках n- и р-типа при комнатной температуре или близкой к ней. В этом случае ∆ε0>>∆εдон, ∆ε0 >> ∆εакц. Тогда в уравнениях (3.13.19), (3.13.20) первыми слагаемыми можно пренебречь, записав σn = σn0 e
−
∆ ε дон 2 kT
, σ p = σ p0 e
−
∆ ε акц 2 kT
.
(3.13.21)
3.14. Контакт двух полупроводников
Рассмотрим контакт n- и р-полупроводников, причем для простоты дальнейших рассуждений предположим, что у этих полупроводников собственный полупроводник один и тот же. Опыт показывает, что при введении в контакт таких полупроводников в области контакта возникает особый слой, получивший название p-n перехода. p-n переход можно получить химическим, электролитическим способом, либо путем внедрения атомов примеси методом диффузии или ионной бомбардировкой. Механическим способом p-n переход получить не удается из-за малости толщины контактного слоя по сравнению с неровностями поверхности образцов. Обычно толщина контактного слоя менее 10 мкм. Поскольку собственный полупроводник один и тот же, то ∆ε0 и размеры зон у них одинаковы, хотя электрохимические потенциалы разные, в нашем случае µэp < µэn (рис. 3.14.1). В процессе введения в контакт происходит выравнивание уровней электрохимических потенциалов и постепенное установление термодинамичекого равновесия между носителями заряда в исходных полупроводниках. Этот процесс идет в результате диффузии квазиэлектронов из n- в р-полупроводник и дырок из р- в n-полупроводник. Наглядно все это можно представить следующим образом (рис. 3.14.1). При соприкосновении полупроводников электроны с донорных уровней преимущественно переходят не в зону проводимости, а на расположенные вблизи валентной зоны акцепторные уровни. На этих уровнях они локализуются вблизи атомов примеси и в образовании тока проводимости участвовать не могут. Такие переходы эквивалентны обратному переходу дырок с примесного акцепторного уровня на примесный донорный уровень. Возникшие на примесном уровне
180
дырки также перемещаться не могут, они локализованы вблизи атомов примеси. Z
Z
сближение n
n
p
-
ε 0
L1 L 2 + + -
p
yε
µэn
µ эp
+
y
0
ε2
-
ε1 а
y y
eUк
Фne
-
-
Фpe Фnд +
Фpд +
µ эn = µ эp
eUк
б
Рис. 3.14.1. Контактный слой: а – диффузия частиц в контактном слое, б – энергии носителей в контактном слое Итак, после контакта происходит процесс диффузии носителей заряда, причем в процессе диффузии уровень электрохимического потенциала µ эn постепенно опускается вниз и после выравнивания электрохимических потенциалов µ эn и µ эp дальнейшего переноса избыточного количества зарядов через контактный слой происходить не будет. Однако в результате такого процесса нарушается электрическая нейтральность исходных полупроводников. С одной стороны, электроны и дырки, переходя через границу раздела, оставляют после себя неподвижные ионы донорных и акцепторных атомов (рис. 3.14.1, а), а, с другой стороны, увеличивается концентрация электронов вблизи контакта в области р-полупроводника и дырок – в области n-полупровод-ника, контактная область р-полупроводника оказывается заряженной отрицательно, а контактная область n-полупроводника оказывается заряженной положительно. На участке L = L1 + L2 возникает электрическое поле, созданное двумя слоями объемных зарядов. Таким образом, вблизи границы раздела электронного и дырочного полупроводников возникают области положительных и отрица-
181
тельных объемных зарядов. За пределами контактного слоя в каждом из полупроводников объемных зарядов не существует. Но в результате таких переходов в пределах контактного слоя искривляются зона проводимости и валентная зона. Как следствие этого, возникает контактная разность потенциалов, которая одновременно является и внутренней и внешней. Внутренней она является потому, что в области контакта энергия зон изменяется на величину eUк , а внешней – потому, что между точками, расположенными над поверхностями контактирующих полупроводников, возникает разность потенциалов. Эта контактная разность потенциалов не имеет специального названия. Почему же возникает, на первый взгляд, такое странное обстоятельство, когда внешняя и внутренняя контактные разности потенциалов равны между собой? Внешняя и внутренняя контактные разности потенциалов имеют разное физическое происхождение: внешняя определяется разностью работ выхода электронов, внутренняя – взаимным расположением уровней электрохимических потенциалов. А так как в данном случае предполагается, что примесные полупроводники созданы на основе одного и того же собственного полупроводника, то внешняя и внутренняя контактные разности потенциалов равны между собой. Если бы это было не так, то внешняя контактная разность потенциалов отличалась бы от внутренней. С учетом вышеизложенного, внешняя контактная разность потенциалов 1 1 (3.14.1) U к = (Ap − An ) = (µ эp − µ эn ), e e Аp, Аn – работа выхода электрона из р- и n-полупроводников, е>0. После установления термодинамического равновесия в области контакта имеют место следующие потоки квазичастиц (рис. 3.14.1, б). Пусть квазиэлектрон с энергией ε < ε2 движется из n- в рполупроводник. В области контакта он попадает в тормозящее для него электрическое поле, постепенно теряет энергию и возвращается обратно в n-полупроводник. С другой стороны, любая дырка с энергией ε < ε1 при движении в сторону n-полупроводника также попадает в тормозящее электрическое поле и возвращается обратно. Но если энергия квазиэлектронов в n-полупроводнике ε > ε2 , а энергия дырок в р-полупроводнике ε > ε1, то квазиэлектроны и дырки преодолеют контактный слой и соответственно попадут в р- и n-полупроводники. У примесных полупроводников всегда имеется некоторое число таких квазиэлектронов и дырок. Поэтому там возникают различные диффузионные потоки квазичастиц.
182
Из постановки задачи следует, что через контактный слой должны протекать четыре потока квазичастиц (рис. 3.14.1, б). Рассмотрим их отдельно. 1. Диффузионные потоки Фne и Фpд возникают из-за изменения концентраций в пределах образца как у квазиэлектронов, так и у дырок. Их направления указаны на рис. 3.14.1, б. 2. В р-полупроводнике в зоне проводимости неосновными носителями заряда являются квазиэлектроны, в n-полупроводнике в валентной зоне – дырки. Благодаря хаотическому движению некоторое число квазичастиц попадают в контактный слой, ускоряются электрическим полем контактного слоя и переносятся, соответственно: квазиэлектроны – в nполупроводник, дырки – в р-полупроводник. Возникают потоки Фne и Фpд. Уравнение баланса потоков этих квазичастиц: Фne + Фpд = Фpe + Фnд . А так как поток квазичастиц Ф = I / q*, q* – эффективный заряд квазичастицы, I – электрический ток квазичастиц, то Inд + Ipe = Ine + Ipд .
(3.14.2)
В отсутствие действия внешнего источника тока напряженность электрического поля Е = 0, ток проводимости в образце отсутствует, диффузионный ток равен току проводимости: (3.14.3) Iдиф = Iпров , где Iдиф = Ine + Ipд , Iпров = Inд + Ipe . 3.15. Физические особенности контактного слоя в p-n полупроводнике
Как было установлено в разделе 3.12, в процессе контакта n- и pполупроводников в пространстве между ними возникает слой конечной толщины, обедненный носителями заряда. В этом контактном слое возникают объемные заряды, локализованные вблизи атомов примесей, поэтому эти заряды под действием поля в пространстве перемещаться не могут, следовательно, не могут участвовать в образовании тока проводимости. Оценим теперь толщину контактного слоя и выясним, от каких параметров вещества зависит его толщина. Для дальнейшего анализа
183
первоначально предположим, что к полупроводнику внешний источник тока не подключен (рис. 3.15.1). Ln
Lp
++ -++ --
n 0
p
Ln L = Ln + Lp
x
Рис. 3.15.1. Объемный заряд в области p-n перехода Температура полупроводника такова, что в результате перехода электронов с примесных уровней в зону проводимости все примесные уровни n-полупроводника свободны, а в результате перехода электронов из валентной зоны р-полупроводника на примесные уровни все примесные уровни оказываются занятыми электронами. Это условие будет выполняться либо при достаточно высокой температуре образца, либо когда донорный уровень расположен в непосредственной близости к зоне проводимости n-полупроводника, а акцепторный уровень расположен в непосредственной близости к валентной зоне. Все дальнейшие рассуждения проведем только для области контактного слоя L = Ln + Lp (рис. 3.15.1). В общем случае объемная плотность зарядов в области контактного слоя имеет разный знак и разную пространственную протяженность. Выберем начало координат на левой границе положительного заряда n-полупроводника (рис. 3.15.1). Введем следующие обозначения для объемных плотностей зарядов в n- и p-полупроводниках: 0 < x < Ln , ρn = - en дон , Ln < x < L , ρp = en а , e < 0. Здесь nдон – концентрация атомов примеси в n-полупроводнике (концентрация донорных уровней), nа – концентрация атомов примеси в рполупроводнике (концентрация акцепторных уровней). Предполагаем, что в области контактных слоев Ln и Lp концентрация объемных зарядов при различных значениях x сохраняется неизменной. Так как р-полупроводник заземлен, то n-полупроводник оказывается положительно заряженным относительно р-полупровод-ника. Следовательно, в области контакта происходит постепенное изменение потенциала. Для определения изменения потенциала в области контактного слоя L воспользуемся уравнением Пуассона. Тогда в контактном слое толщиной Ln уравнение Пуассона
184
d 2ϕn e nдон (3.15.1) =− 2 ε0 ε dx при следующих граничных условиях: dϕ n ϕn | x= Ln = U к > 0 , | x=0 = 0 , eU к < 0 . dx Решением уравнения (1) является e (3.15.2) ϕ0 − U к = nдон L2n , 2ε 0 ε φ0 – потенциал на границе раздела n- и р-полупроводников. В контактном слое толщиной Lp уравнение Пуассона d 2ϕ p e (3.15.3) = nа 2 ε0 ε dx при граничных условиях dϕ p ϕ p | x= L = 0 , | x= L = 0 . dx Решением уравнения (3.15.3) является e ϕ0 = nа L2p . (3.15.4) 2ε 0 ε Подставим найденное из (3.15.4) значение φ0 в уравнение (3.15.2): e e na L p2 − U к = − nдон Ln2 . 2ε 0 ε 2ε 0 ε Отсюда внутренняя контактная разность потенциалов e Uк = nдон Ln2 + nа L p2 . (3.15.5) ε0 ε Как следует из (3.15.1) и (3.15.3) с учетом граничных условий, dϕ n e ⎫ nдон ⋅ x , =− ⎪ dx ε0 ε ⎪ (3.15.6) ⎬. dϕ p e nа x − Ln − L p .⎪ = ⎪⎭ ε0 ε dx Так как на границе раздела градиент потенциала должен быть непрерывным, то ⎛ dϕ n dϕ p ⎞ ⎜⎜ ⎟ . = (3.15.7) dx ⎟⎠ x= L ⎝ dx
(
)
(
)
n
185
После подстановки значений (3.15.6) в (3.15.7) получаем nдон Ln = nа Lp или 2 ⎛ nдон ⎞ 2 2 (3.15.8) ⎟⎟ Ln . L p = ⎜⎜ n ⎝ а ⎠ Найденное значение Lp2 подставляем в (3.15.5): Uк =
e nдон (nдон + na ) Ln2 . 2ε 0 ε n a
Отсюда 1
⎛ 2ε ε na ⎞2 Uк ⎟⎟ . Ln = ⎜⎜ 0 ⎝ e nдон nдон + na ⎠ Значение Ln из (3.15.9) подставим в (3.15.8): 1/ 2
⎛ 2ε ε n ⎞ Uк ⎟⎟ L p = ⎜⎜ 0 дон ⎝ e na nдон + na ⎠
.
(3.15.9)
(3.15.10)
Толщина контактного слоя L = Ln + L p , тогда, как следует из (3.15.9) и (3.15.10), 1/ 2
⎛ 2ε ε n + na ⎞ L = ⎜⎜ 0 дон U к ⎟⎟ . (3.15.11) ⎝ e nдон + na ⎠ Если к концам полупроводника приложена внешняя разность потенциалов U, то в полупроводнике будет протекать электрический ток. Но контактный слой обеднен свободными носителями заряда, значит, он обладает электрическим сопротивлением, значительно превышающим электрическое сопротивление остального полупроводника, при этом основное падение напряжения будет происходить в контактном слое, а внешнее напряжение U будет суммироваться с внутренней контактной разностью потенциалов Uк. Тогда формулы (3.15.9)–(3.15.11) можно видоизменить: ⎫ ⎪ ⎪ ⎪ 1/ 2 ⎛ 2ε 0 ε nдон U к + U ⎞ ⎪⎪ ⎟⎟ , ⎬ Ln = ⎜⎜ ⎝ e na nдон + na ⎠ ⎪ 1/ 2 ⎪ ⎛ 2ε ε n + na ⎞ (U к + U )⎟⎟ .⎪⎪ L = ⎜⎜ 0 дон e n n ⋅ дон a ⎝ ⎠ ⎪⎭ 1/ 2
⎛ 2ε ε na U к + U ⎞ ⎟⎟ Ln = ⎜⎜ 0 ⎝ e nдон nдон + na ⎠
,
(3.15.12)
186
причем внешняя разность потенциалов U может быть как положительной, так и отрицательной. Из (3.15.12) следует, что ширина контактного слоя L будет меняться в зависимости от величины и знака разности потенциалов U и, в общем случае, L n ≠ L p. Если же Uк + U = 0, то в области контактного слоя возникает пробой. В табл. 3.15.1 приводятся результаты вычислений по формулам (3.15.9)– (3.15.11) толщины контактных слоев Ln, Lp, L = Ln+Lp для Si. Вычисления выполнены для ε = 11,7 эВ, Uк = 1 В. Из табл. 3.15.1 видно, что толщина контактного слоя сильно зависит от концентрации примесей, наибольшей величины она достигает у полупроводников с малой концентрацией. При высокой концентрации толщина контактного слоя очень мала и с увеличением концентрации стремится к нулю. Так как электрическое сопротивление контактного слоя велико, то любое его изменение должно сильно влиять на электропроводность полупроводников. Согласно (3.15.12), толщина контактного слоя L зависит от величины и знака приложенной внешней разности потенциалов U, она определенным образом влияет на величину протекающего через контакт тока. В результате электрическое сопротивление контактного слоя для +U и -U оказывается различным по величине, и это различие может быть весьма значительным. На этом основано выпрямляющее действие p-n перехода, поскольку с изменением знака разности потенциалов U будет меняться как толщина контактного слоя L, так и его электрическое сопротивление. n дон, м -3 21
1⋅10 1⋅1021 1⋅1022 1⋅1022 1⋅1022 1⋅1023
n а, м -3 1⋅1022 1⋅1021 1⋅1021 1⋅1023 1⋅1022 1⋅1022
Ln, мкм
Lp, мкм
Ln / Lp
L, мкм
1,08 0,80 11 0,34 0,25 0,034
0,11 0,80 1,08 0,034 0,25 0,34
10 1 0,1 10 1 0,1
1,19 1,60 1,19 0,37 0,50 0,37
Таблица 3.15.1. Толщины контактных слоев Ln, Lp, L=L +Lp для Si
187
3.16. Контакт металл - полупроводник Рассмотрим первоначально контакт металла с n-полупроводником, у которых уровни электрохимических потенциалов не совпадают, µэм < µэп (рис. 3.16.1).
y металл
п/п
ε
x
0 З.п.
З.п
З.п
x µ эп
В.з
dn dε
Рис. 3.16.1. Контакт металл-полупроводник (з. п. – зона проводимоdn сти; в. з. - валентная зона; – распределение по энергиdε ям концентрации электронов в з. п. металла) Так как уровень электрохимического потенциала металла расположен ниже уровня электрохимического n-полупроводника, то в процессе их сближения возникает направленный перенос электронов из nполупроводника в металл. Избыточный перенос продолжается до полного выравнивания уровней электрохимических потенциалов, после чего в области контакта у n-полупроводника возникает слой, обедненный свободными носителями заряда. Возникшие там положительные заряды локализованы вблизи атомов примеси и перемещаться не могут (рис. 3.16.2). Из-за незначительной концентрации квазиэлектронов в контактном слое этот слой обладает большим электрическим сопротивлением и называется запорным слоем. В области контактного слоя должны существовать два потока квазичастиц: Ф ме – поток квазиэлектронов из металла в полупроводник и
188
Ф пе – поток квазиэлектронов из полупроводника в металл. Они равны между собой. Дырки в валентной зоне n-полупроводника – неосновные носители заряда, их концентрация значительно меньше концентрации квазиэлектронов в зоне проводимости. Поэтому потоком дырок через контактный слой можно пренебречь. y + металл + п/п
ε 0
x Фме З.п.
x З.п
Фпе
-
µ эп З.п
dn dε
В.з
Рис. 3.16.2. Возникновение барьера Шоттки (з. п. – зона проводимости; в. з – валентная зона; dn – распределение по энергиям конdε центрации электронов в з. п. металла) Возникший в области контакта положительный заряд проводит к искривлению всех уровней полной энергии n-полупроводника, приводит к возникновению потенциального барьера, который называется барьером Шоттки (рис. 3.16.2). Теперь приложим к образцам внешнюю разность потенциалов (рис. 3.16.3). Так как εп = eφ , φ > 0, е < 0, то все уровни полной энергии n-полупроводника смещаются вниз, электрохимический потенциал n-полупроводника µэп = µ + eφ (3.16.1) также понижается. В такой замкнутой цепи возникает электрический ток. Наибольшее электрическое сопротивление приходится на запорный слой, поэтому основное падение напряжения происходит в запорном слое, падение напряжения на остальных участках цепи незначительно.
189 Iобр
ϕ
y
-
металл
+ +
+
п/п x
ε
x eϕ
0 Фме -
Фпе -
µ эп
Рис. 3.16.3. Контактный слой во внешнем поле (запорное направление) Квазиэлектроны металла, попадая в электрическое поле контактного слоя, переносятся в n-полупроводник. В то же время на пути движения квазиэлектронов из n-полупроводника находится потенциальный барьер, высота которого возросла по сравнению с первоначальной. Поэтому поток квазиэлектронов в сторону металла уменьшается. В результате приложенной разности потенциалов с указанной на рис. 3.16.3 полярностью один поток остается неизменным, а второй уменьшается, возникает разностный поток квазичастиц ∆Фe = Фме - Фпе. (3.16.2) Значит, в замкнутой цепи будет протекать электрический ток ⎛ ⎛ eϕ ⎞ ⎞ I обр = I 0 ⎜⎜ exp⎜ − (3.16.3) ⎟ − 1⎟⎟ , e > 0 . ⎝ kT ⎠ ⎠ ⎝ Его физическое происхождение вызвано преобладающим влиянием тока проводимости из металла над диффузионным током из полупроводника. Приложим теперь внешнюю разность потенциалов обратного знака. Тогда уровень электрохимического потенциала n-полупроводника по сравнению с исходным поднимется вверх, все уровни полной энергии n-полупроводника также поднимутся вверх. В результате высота потенциального барьера понизится (рис. 3.16.4). Но положение уров-
190
ней полной энергии в металле при этом не изменится, не изменится и величина потока квазиэлектронов из металла в сторону полупроводника. Значит, поток проводимости квазиэлектронов из металла сохраняется прежним. Что же касается диффузионного потока квазиэлектронов из полупроводника в сторону металла, то в результате уменьшения высоты потенциального барьера он возрастет, через контактный слой пройдет результирующий поток квазичастиц ∆Ф = Фпе - Фме , (3.16.4) будет протекать электрический ток (прямой ток) ⎛ ⎛ eϕ ⎞ ⎞ I пр = I 0 ⎜⎜ exp ⎜ ⎟ −1⎟⎟ , e < 0 . (3.16.5) ⎝ kT ⎠ ⎠ ⎝ Этот ток имеет в основном диффузионное происхождение. Iпр
ϕ
y
+
металл
+ +
-
п/п x
ε 0 Фме -
eϕ x - Ф пе
µэ
Рис. 3.16.4. Контактный слой во внешнем поле (прямое направление) Таким образом, омический контакт, запорный слой должен обладать выпрямляющим для переменного тока действием. На основе этого явления созданы и широко используются диоды Шоттки. Их замечательной особенностью является необычно малое время релаксации – порядка 10-11 с, что позволяет с успехом их применять в импульсных радиотехнических схемах, вычислительной технике, автоматике, т.е. там, где требуется высокое быстродействие, способность обрабатывать возможно более короткие и часто следующие друг за другом электрические импульсы.
191
y
y металл
п/п
ε
металл x
0 З.п.
З.п
µэм
x µ эп
-
п/п
ε
x
0 З.п
x
З.п.
µэ З.п
З.п
В.з
В.з
а
б
Рис. 3.16.5. Возникновение антизапорного слоя Рассмотрим теперь контакт металла с n-полупроводником, у которого уровень электрохимического потенциала больше уровня электрохимического потенциала полупроводника (рис. 3.16.5). В результате после контакта в полупроводник переходит некоторое число электронов, в контактном слое полупроводника возникает отрицательно заряженный слой, который называется антиза-запорным слоем (рис. 3.16.5, б). Электрическое сопротивление антизапорного слоя очень мало, поэтому такой контакт не обладает выпрямляющим свойством. Тем не менее, он широко применяется для создания омических контактов, с помощью которых полупроводник, полупроводниковые устройства подключаются к электрическим схемам. 3.17. Соотношение Эйнштейна
Предположим, что в объеме образца в направлении координатной оси 0Х происходит изменение концентрации заряженных частиц идеального газа n(x). Электрический заряд частицы q. Кроме того, в объеме существует электрическое поле Е, направление которого противоположно градиенту концентрации ∇n(x ) . В результате наличия градиента концентрации в объеме возникает диффузия заряженных частиц, направленная в одну сторону, и поток проводимости (дрейфовый поток), направленный в противоположную сторону.
192
Тогда полный ток будет складываться из дрейфового тока (тока проводимости) и диффузионного тока, направления которых противоположны. Следовательно, в любой точке полупроводника для произвольного момента времени плотность тока равна сумме диффузионного и дрейфового токов (тока проводимости): j = je + jд . В отсутствие внешнего источника тока (3.17.1) je = - jд . Из первого закона Фика следует: плотность тока диффундирующих заряженных частиц dn (3.17.2) jд = −qD , dx q – заряд частицы, D – коэффициент диффузии. Плотность дрейфового тока (тока проводимости) je = q v n , (3.17.3) где n – концентрация, – дрейфовая скорость носителей заряда: v = bE, b – подвижность носителей заряда, Е – напряженность электрического поля. После подстановки значения в (3.17.3) получаем je = qbnE . (3.17.4) Найденные в (3.17.2), (3.17.4) значения jд , je подставляем в (3.17.1): dn (3.17.5) qbn E = q D . dx Для заряженных частиц идеального газа, находящихся в электрическом поле консервативных сил, справедливо распределение Больцмана, согласно которому концентрация зависит от величины потенциальной энергии частицы в данной точке пространства и температуры. Если принять q = e > 0, то eϕ kT
dn e dϕ =− , n (3.17.6) dx kT dx φ – потенциал электростатического поля. Напряженность электрического поля в полупроводнике dϕ E=− . (3.17.7) dx Поэтому после подстановки dn и E из (3.17.6) и (3.17.7) в (3.17.5) и dx сокращения на постоянные множители получаем: n = n0 e
−
,
193
D kT (3.17.8) = . b e Уравнение (3.17.8) называется соотношением Эйнштейна. Оно справедливо для системы частиц с малой концентрацией, когда взаимодействиями между частицами можно пренебречь. К таким частицам, в частности, относятся квазиэлектроны и дырки в собственных и примесных полупроводниках.
3.18. Выпрямляющее действие p-n перехода
В любом полупроводнике одновременно происходят два противоположно направленных процесса: а) генерация квазиэлектронов и дырок; б) рекомбинация квазиэлектронов и дырок. В результате в объеме между этими процессами устанавливается динамическое равновесие. Основными механизмами рекомбинации являются излучательный механизм, когда энергия рекомбинирующей пары квазиэлектрон–дырка излучается в виде фотона; фононный механизм, когда энергия рекомбинирующей пары передается ионам кристаллической решетки; ударный механизм, когда энергия рекомбинирующей пары передается третьей частице. Возникающий на границе раздела n- и p-образцов контактный слой обладает рядом физических особенностей. Если, например, к концам p-n образца приложить переменную разность потенциалов, то оказывается, что p-n переход будет обладать преимущественно односторонней проводимостью, а, следовательно, и выпрямляющим действием. На рис. 3.18.1 изображен контакт n- и p-полупроводников, цифрами 1 и 2 обозначены границы контактного слоя, Фne, Фpд – потоки основных носителей заряда, Фpe, Фnд – потоки неосновных носителей заряда. Как следует из физического смысла рис. 3.18.1, концентрация квазиэлектронов в p-образце в результате рекомбинаций квазиэлектронов и дырок с увеличением расстояния от границы контактного слоя уменьшается. Найдем закон изменения концентрации. Пусть τe – среднее время жизни квазиэлектронов в p-полупроводнике, в котором они являются неосновными носителями заряда. Тогда в отсутствии диффузии из р- в n-образец изменение концентрации по глубине будет происходить только в результате рекомбинации квазиэлектронов зоны проводимости с дырками валентной зоны. Следовательно, изменение концентрации во времени ∂n n0 − n , = ∂t τe
194
n0 – равновесное значение концентрации квазиэлектронов. 1
y n x1
ε
2 + + -
p x2
x
0
Фne
x
Фne
µэ Фpд +
Фpд +
eUк
Рис. 3.18.1. Потоки носителей зарядов через p-n переход С другой стороны, в отсутствие рекомбинаций изменение концентрации во времени определяется 2-м законом Фика: ∂n ∂ 2n = De 2 , ∂t ∂x где De – коэффициент диффузии квазиэлектронов в р-образце (коэффициент диффузии неосновных носителей заряда). Так как оба процесса в образце существуют одновременно, то ∂n n0 − n ∂ 2n = + De 2 . ∂t τe ∂x При наличии динамического равновесия ∂n = 0 , поэтому ∂t ∂2n n0 − n . = ∂x2 Deτ e Обозначим λe = De τ e , (3.18.1) ℓe – диффузионная длина квазиэлектронов (неосновных носителей заряда) в р-образце. Тогда d 2 (n − n0 ) n − n0 (3.18.2) . = dx 2 λ2e
195
Непосредственной подстановкой можно показать, что решением дифференциального уравнения (3.18.2) является n ( x) = n0 + c1 e
−
x + x2 λe
(3.18.3)
,
где λe + x2
c1 = −n0 e λe , n (λe ) = 0 . Тогда после подстановки найденного значения c1 в уравнение (3.18.3) получаем: ⎛ ⎛ x − λe ⎞ ⎞ ⎟⎟ ⎟ , n ( x) = n0 ⎜1 − exp⎜⎜ ⎜ ⎟ (3.18.4) ⎝ λe ⎠ ⎠ ⎝ x ≤ λe Уравнение (3.18.4) позволяет дать физически обоснованное определение диффузионной длины квазиэлектронов в р-образце: диффузионная длина ℓe –это то расстояние, на котором в результате рекомбинаций квазиэлектронов и дырок неосновные носители заряда полностью исчезают: квазиэлектроны – в зоне проводимости рполупроводника, дырки – в валентной зоне n-полупроводника. Оценим теперь величину диффузионной длины квазиэлектронов ℓe и дырок ℓд в примесных полупроводниках n- и р-типа на основе Si и сравним ее с толщиной контактного слоя L. Для уменьшения объема вычислений предположим, что nдон = nакц, а температура образца Т = 300К. Из опыта известны подвижности квазиэлектронов be и дырок bд в этих полупроводниках и времена жизни. Необходимые для вычисления диффузионной длины по формуле (3.18.1) значения коэффициента диффузии вычислим по формуле соотношения Эйнштейна. В табл. 3.18.1 представлены результаты таких вычислений для двух концентраций неосновных носителей заряда.
nдон = nакц м-3 1⋅1022 1⋅1021
bд be м2/(В·с) 0,074 0,140
0,038 0,046
τe
τд с
0,72 50
10,5 167
De
м2/с
1,9·10-3 3,6·10-3
Dд
9,9·10-4 1,2·10-4
ℓe
ℓд см
3,7 42,4
10,2 44,7
Таблица 3.18.1. Динамические характеристики неосновных носителей заряда в Si Из таблицы 3.18.1 следует, что диффузионная длина ℓe неосновных носителей заряда в десятки тысяч раз превышает толщину контактно-
196
го слоя. Поэтому при движении в сторону контактного слоя последний не может оказать на них заметного влияния. Квазиэлектроны в р-образце появляются из n-образца в результате прохождения через контактный слой L = Le + Lд. Как следует из табл. 3.18.1, в полупроводниках ℓe >> L, а так как концентрация квазиэлектронов в р-образце всегда мала, то квазиэлектроны в полупроводнике образуют ЭФГ, обладающий, как известно, свойствами идеального газа. В результате контакта n- и р-полупроводников в области контактного слоя толщиной L возникает электрическое поле, замедляющее движение квазиэлектронов из n- в р-образец. Поэтому в пределах контактного слоя происходит постепенное изменение потенциальной энергии квазиэлектронов, что в соответствии с распределением Больцмана приводит к изменению их концентрации. В отсутствии приложенной внешней разности потенциалов концентрация квазиэлектронов на правой границе контактного слоя в точке x2 −
− eU к
n ( x2 ) 0 = n ( x1 ) e kT , (3.18.5) где n(x1) – концентрация квазиэлектронов на левой границе x1 контактного слоя. Так как контактный слой обеднен основными носителями заряда, то он обладает электрическим сопротивлением, во много раз превышающим электрическое сопротивление остального р-n полупроводника. Поэтому, если к p-n-полупроводнику приложена внешняя разность потенциалов, то практически все падение напряжения U будет в области контактного слоя L. Тогда концентрация квазиэлектронов на правой границе изменится и окажется равной −
eU kT .
n ( x2 ) = n ( x 2 ) 0 e (3.18.6) Возникшее изменение концентрации квазиэлектнов в точке x2 ⎛ − eu ⎞ ne = n ( x2 ) 0 ⎜ e kT − 1⎟ . (3.18.7) ⎜ ⎟ ⎝ ⎠ После подстановки в (3.18.7) значение (3.18.3) получаем x + x2 ⎞ ⎛ ⎞ ⎛ − eU − ⎜ λe ⎟ ⎜ kT − 1⎟ . ne = ⎜ n ( x2 ) 0 + c1e e (3.18.8) ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ Так как плотность тока квазиэлектронов в р-образце
197
je = eDe
dne , dx
(3.18.9)
то с учетом (3.18.3) и (3.18.8) получаем: ⎛ − eU ⎞ De je = e ne ( x2 ) ⎜ e kT − 1⎟ . (3.18.10) ⎜ ⎟ λe ⎝ ⎠ Проведя аналогичные преобразования для дырок, получаем ⎞ ⎛ − eU Dд jд = e nд ( x2 ) ⎜ e kT − 1⎟ . (3.18.11) ⎟ ⎜ λд ⎠ ⎝ Тогда результирующая плотность тока квазиэлектронов и дырок равна ⎛ − eU ⎞ j = jS ⎜ e kT − 1⎟ , (3.18.12) ⎜ ⎟ ⎝ ⎠ где ⎛D ⎞ D (3.18.13) j S = e⎜⎜ e ne + д nд ⎟⎟ , λд ⎠ ⎝ λe jS – плотность тока насыщения. Найденное из (3.18.1) выражение для коэффициента диффузии подставим в (3.18.13): ⎞ ⎛λ λ (3.18.14) jS = e⎜⎜ e ne + д nд ⎟⎟ . τд ⎠ ⎝ τe Так как рекомбинация квазиэлектронов и дырок или их генерация вызваны переходами из зоны проводимости в случае рекомбинации и, наоборот, из валентной зоны в зону проводимости – в случае генерации, то времена жизни квазиэлектронов τe и дырок τд обычно достаточно велики. Что же касается обычных столкновений, при которых число неосновных носителей заряда сохраняется неизменным, то они происходят соответственно в пределах одной и той же зоны, такие столкновения приводят лишь к внутризонным переходам неосновных носителей заряда. Экспериментальные оценки показывают, что время жизни носителей заряда в результате межзонных переходов находится в интервале 10-8 с ≤ τд ≤ 10-3 с, а время жизни неосновных носителей заряда в результате внутризонных столкновений составляет 10-13 с ≤ τe ≤ 10-12 с. Подставим в (3.18.13) значение коэффициента диффузии, найденного из соотношения Эйнштейна. После сокращения на постоянные множители имеем:
198
⎛b b ⎞ (3.18.15) jS = kT ⎜⎜ e + д ⎟⎟ . ⎝ λe λд ⎠ Пусть в уравнении (3.18.12) U > 0. Тогда добавочная потенциальная энергия квазиэлектрона eU < 0. Это приводит к тому, что все зоны n-полупроводника будут смещаться вниз (рис. 3.18.1). И теперь на пути движения квазиэлектронов встретится потенциальный барьер, величина которого возросла на |eU|. Поэтому теперь не все квазиэлектроны из диффузионного потока n-образца смогут преодолеть потенциальный барьер. Что же касается тока проводимости, по-прежнему существующего в р-полупроводнике, то его величина практически не изменится, так как квазиэлектроны р-полупроводника, достигнув границы контактного слоя, попадают в ускоряющее электрическое поле и перебрасываются в n-полупроводник. В результате через контактный слой L будет протекать разностный ток, состоящий из дрейфового и диффузионного токов, направление тока будет определяться током проводимости (дрейфовым током), а сам ток имеет малую величину. Указанный разностный ток называется обратным током: ⎛ − |e U | ⎞ ⎜ ⎟ jобр = js ⎜ e k T − 1⎟ . (3.18.16) ⎜ ⎟ ⎝ ⎠ Если же U < 0, то eU > 0. Поэтому зона проводимости смещается вверх, высота потенциального барьера на пути движения квазиэлектронов в р-образец уменьшается, через контактный слой будет протекать ток большей величины по сравнению с первоначальной. Теперь диффузионный поток больше потока проводимости, а направление разностного тока будет совпадать с направлением диффузионного тока. Этот ток называется прямым током: ⎛ eU ⎞ ⎜ ⎟ jпрям = js ⎜ e k T − 1⎟. (3.18.17) ⎜ ⎟ ⎝ ⎠ Как видно из уравнений (3.18.16), (3.18.17), прямой и обратный токи сильно зависят от температуры, с ростом температуры выпрямляющее действие p-n перехода резко убывает. Для количественной характеристики выпрямляющего действия pn перехода вводится коэффициент выпрямления
K=
jпрям jобр
.
(3.18.18)
199
T, K U, B
300
0,1 0,2 0,3 0,4
47,7 2274 1,1·105 5,1·106
350
400
450
K = jпрям / jобр 27,5 754 2,1·104 5,7·105
18,1 329 5,8·103 1,1·105
13,2 113 2,3·103 3,0·104
Таблица 3.18.2. Значения коэффициентов выпрямления при различных значениях разности потенциалов U в интервале температур 300–450 К В табл. 3.18.2 приведены значения коэффициентов выпрямления при различных значениях разности потенциалов U в интервале температур 300–450 К. Из табл. 3.18.2 видно, что коэффициент выпрямления К p-n перехода сильно зависит от величины внешней разности потенциалов U и температуры. Так как полупроводник с p-n переходом по отношению к переменному электрическому току обладает односторонней проводимостью, т.е. выпрямляющим действием, то он называется полупроводниковым диодом. Если сравнивать выпрямляющее действие полупроводникового диода с выпрямляющим действием двухэлектродной лампы, состоящей только из катода и анода, то у вакуумного диода коэффициент выпрямления не зависит ни от температуры катода, ни от разности потенциалов между анодом и катодом, что является несомненным их преимуществом перед полупроводниковым диодом. Однако большим достоинством полупроводниковых диодов являются их малые габариты и отсутствие дополнительного источника тока для питания катода, что всегда имеет место в вакуумном диоде. 3.19. Транзисторы
Транзистор – это устройство, состоящее из трех полупроводников и двух p-n переходов, используемое для управления электрическим током, протекающим через него. Транзисторы применяются для усиления, генерации или переключения токов. Когда к полупроводниковому диоду добавляется третий слой полупроводника, то получается устройство, которое может усиливать мощность или напряжение. Это устройство и называется транзистором. Транзистор состоит из трех областей с чередующимся типом проводимости: n-p-n или p-n-p.
200 y
p
n
n x
ε
x
0
− −
−
−
µэ + +
+ +
Рис. 3.19.1.Энергетические зоны в n-p-n транзисторе На рис. 3.19.1 изображена принципиальная схема транзистора n-pn, а также расположение валентной зоны и зоны проводимости. Так как к транзистору внешняя разность потенциалов не приложена, то уровень электрохимического потенциала µэ всюду один и тот же. Из условия динамического равновесия вытекает равенство потоков, протекающих через контактные слои в прямом и обратном направлениях: Φn e − Φ p e = Φ p д − Φn д. (3.19.1) Отсюда следует, что в областях n-p, p-n переходов должно иметь место равенство токов: диффузионный ток Iдиф равен дрейфовому току (току проводимости) Iпров: I pe + In g = I p g + I ne. (3.19.2) Однако если к транзистору подключить внешние источники тока, как это показано на рис. 3.19.2, то расположение уровней электрохимического потенциала в n-полупроводниках изменится. А так как в данном случае p-полупроводник заземлен, то в нем уровень электрохимического потенциала останется прежним. Тогда в соответствии с изменением положения уровня электрохимического потенциала изменятся и положения зон проводимости и валентных зон в полупроводниках. На рис. 3.19.2 левый n-полупроводник называется эмиттером, правый n-полупроводник – коллектором, а средний р-полупроводник – базой. Если сравнивать транзистор с аналогичной по своему действию электронной лампой-триодом, то происхождение названий эмит-
201
тер, база, коллектор можно объяснить следующим образом. В транзисторе эмиттер является источником носителей заряда, его роль эквивалентна катоду триода, коллектор является приемником носителей заряда, его роль эквивалентна аноду триода, что же касается p-n перехода, то он выполняет роль управляющей сетки электронной лампы. На рис. 3.19.2 приведена схема включения с общей базой. Рассмотрим принцип действия транзистора как усилителя электрических сигналов в схеме с общей базой. Как видно из рис. 3.19.2, на эмиттер подается потенциал Uэ, понижающий потенциальный барьер на границе n- и p-полупроводников. В результате концентрация квазиэлектронов в р- области и дырок в n-области резко возрастает по сравнению с равновесной. Происходит инжекция носителей зарядов. Квазиэлектроны, инжектируемые из эмиттера э в базу б, затем диффундируют к коллектору к. Если база достаточно тонкая, то практически все квазиэлектроны достигают коллектора. Действительно, попадая в электрическое поле контактного слоя, существующего между базой и коллектором, квазиэлектроны ускоряются электрическим полем p-n перехода и перебрасываются в коллекторную цепь транзистора. Геометрия транзистора выбирается такой, чтобы через базовый вывод протекал незначительный по сравнению с коллекторным ток. Uэ − + ∆ U вх ~
Rэ
Uк − +
n −−
p
э
n
ε −
Φ ne
∆U к
к
б
0
Rк
−
−
x э
к
э
Φ pe
µэ Φ pg
+
Φng +
б
Рис. 3.19.2. Включение транзистора с общей базой Предположим, что на входное сопротивление Rэ подается напряжение ∆Uвх. Это приводит к изменению тока эмиттера на величину ∆U вх ∆I э = . (3.19.3) Rэ
202
А так как Iэ ≈ Iк, то практически на ту же величину изменится и ток в цепи коллектора: ∆Iк ≈ ∆Iэ. Значит, в результате этого на сопротивлении нагрузки Rк произойдет изменение падения напряжения на величину ∆U вх = ∆I к Rк . (3.19.4) Тогда коэффициент усиления по напряжению в цепи транзистора с общей базой будет ∆U вых Rк KU = = (3.19.5) . ∆U вх Rэ Из рис. 3.19.2 следует, что эмиттерный переход включен в прямом направлении, следовательно, он обладает малым электрическим сопротивлением, в то же время коллекторный переход включен в запорном направлении, следовательно, он обладает большим электрическим сопротивлением, и к нему можно подключить сопротивление нагрузки Rк большой величины. Из опыта следует, что коэффициент усиления по напряжению находится в интервале 10 ≤ KU ≤ 50. Итак, используя транзистор с общей базой, можно получить даже в одном каскаде значительное усиление как по напряжению, так и по мощности. В настоящее время существует несколько типов транзисторов. Одним из них, кроме рассмотренного выше, является полевой транзистор, в котором рабочий ток протекает по узкому участку полупроводника. Параллельно ему расположен другой электрод (затвор), напряжение на котором определяет ширину участка с протекающим током. Например, если на затвор подается отрицательное напряжение, то оно отталкивает основные носители заряда в n-полупроводнике и, наоборот, притягивает их в р-полупроводнике. В результате участок полупроводника, в котором протекает рабочий ток, в первом случае сужается, его электрическое сопротивление возрастает, электрический ток уменьшается, а во втором случае электрический ток соответственно возрастает. Таким образом, в полевом транзисторе управление током осуществляется напряжением U, приложенным перпендикулярно направлению тока. Любой транзистор представляет собой твердотельный цилиндрик. Его изготовляют с помощью специальных технологических операций, создающих чередование p-n переходов, а также металлические контакты на полупроводниках. Такие транзисторы обладают большой механической прочностью, поэтому их можно применять в условиях боль-
203
ших вибраций и ускорений (автомобиль, ракета и т.д.). Для работы транзистора используют низковольтные источники питания (2–3 В). В 60-е годы 20-го века были разработаны интегральные микросхемы. Они изготовляются следующим образом. На диэлектрической пластине размещаются транзисторы, конденсаторы, резисторы, а также проводники, соединяющие их в определенной последовательности. В результате получаются очень компактные и взаимозаменяемые микросхемы. Уже существуют микросхемы с плотностью упаковки элементов порядка 106 мм2. Они заменили электронные блоки из отдельных транзисторов, что привело к появлению ЭВМ третьего поколения. Микросхемы применяют на заводах в станках с числовым программным управлением, в вычислительных комплексах, устройствах автоматики, связи, электронной разведки и др. 3.20. Внутренний фотоэффект в полупроводниках
Внутренним эффектом называется перераспределение электронов по энергетическим состояниям, происходящее в результате поглощения электромагнитного излучения. В полупроводниках внутренний фотоэффект проявляется в изменении величины электропроводности и называется фотопроводимостью, в изменении под действием падающего излучения относительной диэлектрической проницаемости и называется фотодиэлектрическим эффектом, в возникновении под действием излучения ЭДС и называется фотоЭДС. Физическая причина перечисленных выше эффектов заключается в особенностях расположения зон у полупроводников. Самым характерным для полупроводников процессом поглощения света является собственное поглощение, при котором электрон валентной зоны, поглотив фотон, переходит либо на примесный уровень в nполупроводнике, либо в зону проводимости. При этом энергия фотона hν = ε K − ε H , где εK, εH – энергии электрона в конечном и начальном состояниях. Собственное поглощение света возможно при hν ≥ ε, где ε=∆ε0, ∆εa, ∆εg, ∆ε0 – ширина запрещенной зоны, ∆εa – интервал энергии между верхней границей валентной зоны и акцепторным уровнем в pполупроводнике, ∆εg – интервал энергии между донорным уровнем и нижней границей зоны проводимости. При таких переходах наряду с законом сохранения энергии должен выполняться закон сохранения квазиимпульса:
204
ρ ρ ρ p = p0 + η q , ρ ρ где p0 – начальный квазиимпульс электрона, p – конечный квазиимρ пульс электрона, η q – изменение квазиимпульса электрона, возникающее в результате таких переходов. Для видимого и длинноволнового излучения η q νpv (νpv – частота объемного плазмона) соответствует области ультрафиолетовой прозрачности металлов. Крас-
240
ная граница однофотонной фотоэлектронной эмиссии обычно находится в области, которая охватывает оптический интервал частот. 3. ν ≥ νps (νps – частота поверхностного плазмона) соответствует резкому росту фототока. Величина ν = νps соответствует второй красной границе фотоэлектронной эмиссии. Первая теория фотоэлектронной эмиссии была разработана Р. Фаулером в 1931 г. В основу теории были положены следующие допущения. 1. Электроны в металле являются свободными, т.е. находятся в потенциальной яме с плоским дном. 2. В фотоэлектронной эмиссии принимают участие электроны с энергией близкой к энергии Ферми. 3. Коэффициент отражения на границе раздела для электронов с полной энергией больше потенциальной равен нулю и равен единице для всех электронов, находящихся в потенциальной яме. 4. Неупругие столкновения электронов проводимости приводят к такой потере энергии, при которой электрон не в состоянии вылететь за пределы металла и остается в пределах потенциальной ямы. При использовании таких предположений ЭФГ в металле можно рассматривать как смесь двух газов – "холодного" (невозбужденного) и "горячего" (возбужденного). Энергетический спектр у "горячих" электронов предполагается таким же, как и у "холодных", со смещением вверх по шкале энергий на величину энергии фотона hν, что эквивалентно снижению на ту же величину высоты потенциального барьера. Выполненный расчет показал, что при Т = 0 К фототок фотоэлектронной эмиссии 2 π e me α s (ν − ν 0 )2 , Iф = (3.22.17) h ν > ν0 ; α – относительное число горячих электронов по отношению к холодным (постоянная определяется из опыта); S – площадь освещаемой поверхности металла. При Т > 0 К и ν < ν0 фототок ассимптотически стремится к нулю, и, следовательно, красная граница должна отсутствовать. Однако в случае ν0 ≤ ν ≤ 1,5 ν0 уравнение (3.22.17) все-таки выполняется. Из сравнения формул (3.22.16) и (3.22.15) следует, что теория Фаулера хорошо соответствует опыту лишь вблизи "красной" границы спектра. Следовательно, теория Фаулера имеет ограниченную применимость и недостаточное познавательное значение.
241
В 1964 г. В. Спайсером была предложена теория, согласно которой процесс выхода фотоэлектронов из металлов следует разделить на три последовательных процесса: 1. поглощение фотона и появление в твердом (или жидком) теле фотоэлектрона с энергией более высокой по сравнению со средней энергией электронов проводимости; 2. движения фотоэлектрона к поверхности, сопровождающегося рассеянием энергии; 3. выход фотоэлектрона в другую среду через поверхность раздела. Полученное в этой теории выражение для фототока имеет весьма сложный вид и содержит несколько подгоночных параметров, значения которых можно определить только из эксперимента. Наличие определяемых из опыта параметров делают теорию неудобной как для практического использования, так и для анализа физических процессов в фотоэлектронной эмиссии. Таким образом, строгая теория фотоэлектронной эмиссии до сих пор еще не создана. Но очевидно, что эта теория должна основываться на квантовомеханическом рассмотрении возбуждения фотонами электронов металла с последующим использованием уравнения кинетической теории переноса, в которое следует ввести микроскопические параметры взаимодействия как фотонов с электронами проводимости, так и фотоэлектронов с электронами проводимости металла. Фотоэлектронная эмиссия из полупроводников. В полупроводниках фотоэлектронная эмиссия может быть вызвана возбуждением электронов из валентной зоны, с уровней примесей, из зоны проводимости и др. Для каждого из этих случаев пороговая частота ν имеет свое значение. Если полупроводник собственный, то минимальная энергия квантов, достаточная для перехода электронов из валентной в зону проводимости, равна ширине запрещенной зоны. Отсюда следует, что эффективность фотоэлектронной эмиссии при заданной ширине запрещенной зоны ∆ε0 определяется электронным сродством χ . Тогда красная граница фотоэлектронной эмиссии будет определяться из уравнения h ν 0 = ∆ε 0 + x. (3.22.18) Следовательно, в вакуум могут перейти лишь те электроны, которые достигают поверхности эмиттера с энергией, достаточной для преодоления потенциального барьера высотой χ . Создание на поверхности отрицательного электронного сродства позволяет существенно повысить квантовый выход фотоэлектронной эмиссии. Для соз-
242
дания отрицательного электронного сродства используются полупроводники р-типа, у которых при сильном легировании уровень Ферми почти совпадает с верхней границей валентной зоны.
242
Глава 4. ОСНОВЫ ФИЗИКИ АТОМНОГО ЯДРА 4.1. Элементарные частицы Ядра атомов любого вещества состоят из протонов и нейтронов, имеющих единое название – нуклоны. Других частиц в составе атомного ядра нет. Существующие в природе мельчайшие стабильные и метастабильные частицы называются элементарными частицами. Многие из них возникают в результате взаимодействий, т.е. столкновений с другими элементарными частицами вещества. Время взаимодействия между элементарными частицами настолько мало, что не поддается точному измерению. Неточность измерения времени взаимодействия ∆t сравнима с временем жизни многих элементарных частиц. Поэтому для оценки энергии взаимодействия частиц можно воспользоваться соотношением неопределенности ∆ε∆t > h. Неопределенность энергии взаимодействия ∆ε должна быть всегда меньше энергии взаимодействия ε, в противном случае частица не может быть обнаружена, т.е. ε ≥ ∆ε . С учетом соотношения неопределенности получаем h ε≥ . ∆t Уточним физический смысл понятия элементарная частица. Прежде всего, в понятии "элементарная частица" в современной физике находит отражение идея о наличии в природе первичных сущностей материи, которые определяют все известные свойства материи. До начала двадцатого века считалось, что вся материя состоит из атомов. Заметим, что атом в переводе на русский язык означает неделимый. Атомы в то время считались элементарными частицами материи. Но с развитием экспериментальной техники было установлено, что атом состоит из ядра и электронной оболочки. В дальнейшем открывались все новые и новые микрочастицы (мюоны, пионы и др.), которые также можно было принять за элементарные частицы. Термин элементарная частица несколько "размыт", т.е. нельзя с полной достоверностью утверждать, существуют ли в природе действительно элементарные частицы. Сведения о внутренней структуре элементарных частиц могут быть получены только на основе анализа результата столкновений между ними, причем полная энергия столкновений должна быть та-
243
кой, при которой у сталкивающихся частиц начинает проявляться внутренняя структура. Исторически первой открытой элементарной частицей был электрон, обнаруженный Дж. Томсоном в катодных лучах (1897 г.). В 1919 г. Э. Резерфорд среди частиц, выбитых из атомных ядер, обнаружил протоны. Другая частица, входящая в состав ядра, нейтрон, была открыта в 1932 г. Дж. Чедвиком. Представление о возможности существования частицы электромагнитного поля, фотона, берет свое начало с работы М. Планка (1900 г.). Развивая идею М. Планка, А. Эйнштейн (1905 г.) постулировал, что электромагнитное излучение является потоком отдельных квантов энергии, фотонов, и на основе этого объяснил некоторые особенности внешнего фотоэффекта. Прямые экспериментальные доказательства существования фотона были даны Р. Милликеном (1912–1915 гг.) и А. Комптоном (1922 г.). Открытие нейтрино связано с теоретической догадкой В. Паули (1930 г.). Но экспериментальное подтверждение было дано лишь в 1953 г. работами Ф. Райнеса и К. Коуэна. Затем в космических лучах экспериментально были обнаружены: в 1932 г. К. Андерсоном – позитрон, в 1936 г. К. Андерсоном и С. Неддермейером – мюон, в 1947 г. С. Пауэллом с сотрудниками – π мезоны. В 1940–1950 гг. была обнаружена большая группа частиц с необычными свойствами, получивших название странных (К-мезоны, Λ-гипероны и др.). В 1955–1956 гг. открыты анитипротон, антинейтрон. За время с 1960 г. по 1970 г. на ускорителях было открыто большое число крайне неустойчивых частиц, получившие название резонансов. В 1962 г. было установлено, что существуют два различных типа нейтрино: электронное и мюонное. В 1975 г. были получены первые сведения о существовании тяжелого лептона – аналога электрона и мюона, τ - мезона. Соответственно принято, что существует третий тип нейтрино – τ - мезонное. Неожиданными оказались и свойства у большинства элементарных частиц. Для их описания, помимо характеристик, заимствованных из классической физики, таких как электрический заряд, масса, момент импульса, потребовалось введение многих новых специальных характеристик. Ввиду неоднозначности понятия, в настоящее время термин элементарная частица обычно употребляется не в точном смысле этого слова, а менее строго – для наименования большой группы мельчайших частиц, подчиненных условию, что они не являются атомами или атомными ядрами. Эта группа частиц необычайно обширна, в нее, в
244
частности, входят протон, нейтрон, лептоны, т.е. электрон, мюон и тау-мезон со своими античастицами и нейтрино, фотон, π-мезон, странные частицы, резонансы – несколько сотен частиц, в основном нестабильных. Имеются серьезные основания считать, что большинство элементарных частиц обладает внутренней структурой, но в то же время у таких частиц, как, например, электрон, нейтрино, внутренней структуры не обнаружено. 4.1.1. Основные свойства элементарных частиц Микроскопические массы и микроскопические размеры элементарных частиц определяют их квантовые и волновые свойства. Характерную длину волны де Бройля элементарной частицы массы m можно вычислить по формуле: h λ= , mc где h – постоянная Планка, с – скорость света в вакууме. Вычисленная длина волны по порядку величины близка к типичным расстояниям, на которых осуществляется взаимодействие между этими частицами. Так, у π-мезона λ ≈ 1,4 10-15 м, т.е. по порядку величины примерно равна эффективному радиусу взаимодействия πмезона. Из этого следует, что квантовые закономерности здесь являются решающими. Наиболее важным свойством всех элементарных частиц является способность рождаться и уничтожаться, что соответствует их испусканию и поглощению. Опыт показывает, что все процессы с элементарными частицами протекают через последовательность актов их поглощения и испускания, при этом в зависимости от особенностей взаимодействия они отличаются длительностью и интенсивностью взаимодействия. Все взаимодействия между элементарными частицами можно разделить на четыре вида: сильное, электромагнитное, слабое, гравитационное. Сильное взаимодействие соответствует самой сильной связи между элементарными частицами. При сильном взаимодействии процессы протекают наиболее интенсивно по сравнению с другими видами взаимодействий между элементарными частицами. Частицы, участвующие в сильных взаимодействиях, называются адронами. В настоящее время известно несколько сот их разновидностей. Существуют стабильные и нестабильные адроны. Стабильные адроны подраз-
245
деляются на мезоны (спин 1) и барионы (спин 1/2). К нестабильным адронам, в частности, относятся резонансы, нестабильные относительно сильного взаимодействия элементарные частицы. Величина сильного взаимодействия не зависит от величины и знака электрического заряда адрона. Сила взаимодействия между адронами короткодействующая, время взаимодействия между ними порядка 10-23 с. Электромагнитное взаимодействие – это взаимодействие между элементарными частицами, осуществляемое посредством электромагнитного поля. Время взаимодействия порядка 10-20 с, т.е. во много раз превышает время сильного взаимодействия и, следовательно, простирается на большие расстояния. Электромагнитное взаимодействие значительно слабее сильного, оно определяет величину связи атомных электронов с ядром, величину связи между атомами в молекулах, а также твердых и жидких веществах. Слабое взаимодействие – это взаимодействие между элементарными частицами, которое соответствует самой слабой связи между ними по сравнению с сильным и электромагнитным. Оно вызывает медленно протекающие процессы с участием элементарных частиц. Время взаимодействия 10-19 с. Эффективный радиус взаимодействия не превышает 10-18 м, поэтому оно всегда слабее электромагнитного, которое, в свою очередь, до расстояний 10 −15 м всегда слабее сильного. На расстояниях меньших 10-18 м слабое и электромагнитное образуют единое электрослабое взаимодействие. Частицы, обладающие только слабым взаимодействием, в среднем практически не взаимодействуют с веществом. В гравитационном взаимодействии участвуют все без исключения элементарные частицы. Но так как массы частиц малы, то гравитационные силы по сравнению с остальными на много порядков слабее, поэтому в физике элементарных частиц их обычно не учитывают. Гравитационное взаимодействие между элементарными частицами может быть существенным только на расстояниях порядка 10-35 м. В зависимости от участия в тех или иных видах взаимодействий все изученные элементарные частицы делятся на четыре основные группы: адроны, лептоны, фотоны, бозоны*). Современная классификация взаимодействий и элементарных частиц приведена в учебных пособиях по физике последних лет издания, например: Детлаф А.А., Яворский Б.М. Курс физики. 4-е изд. М.: Издательский центр «Академия», 2003. 720 с. *)
246
Адроны обладают сильным, электромагнитным и слабым взаимодействиями. Лептоны обладают только электромагнитным и слабым взаимодействием и образуют два семейства: 1. электрон, мюон, τ-мезон; 2. нейтрино (электронное, мюонное, τ-нейтрино). Фотоны – это группа элементарных частиц, являющихся переносчиками электромагнитного взаимодействия большой энергии. У фотонов спиновое квантовое число равно 1. Бозоны являются переносчиками слабого взаимодействия, они были обнаружены лишь в 1983 году. Бозоны – частицы с целыми спиновыми квантовыми числами 0, 1, 2, они подчиняются статистике БозеЭйнштейна. Бозоны могут быть двух видов: W-бозон и Z-бозон, у них спиновое квантовое число равно 1 . Большинство адронов и все лептоны имеют свои античастицы, отличающиеся от исходных частиц лишь противоположными знаками соответствующих зарядов, нейтрино не имеют электрического заряда, но в природе существуют нейтрино и антинейтрино. Во всех взаимодействиях элементарных частиц выполняются законы сохранения энергии, импульса, момента импульса, электрического и барионного зарядов, а также зарядов, имеющих иное физическое происхождение, которые здесь мы не обсуждаем из-за специфики вопроса. Барионам приписывается барионный заряд В = +1, антибарионам В = -1. Барионный заряд остальных частиц В = 0. Кроме того, существуют следующие лептонные заряды: электронный ℓe, электронного нейтрино ℓve, мюонный ℓµ, мюонного нейтрино ℓvµ, τ-мезонный ℓτ, τмезонного нейтрино ℓvτ. Электрону и электронному нейтрино приписывают заряд ℓe=ℓve=1; мюону и мюонному нейтрино приписывают заряд ℓµ=ℓvµ=1; τ-мезону и τ-мезонному нейтрино приписывают заряд ℓτ=ℓvτ=1. Остальные элементарные частицы лептонным зарядом не обладают. Следует заметить, что понятия "барионный, лептонный" заряды надо понимать не в прямом смысле слова как электрический заряд, а в смысле некоторого квантового числа, с помощью которого отображаются определенные физические свойства элементарных частиц. Для всех перечисленных зарядов в процессах взаимодействия выполняются законы сохранения для каждого из видов заряда, это значит, что суммарный одноименный заряд до взаимодействия равен суммарному одноименному заряду после взаимодействия.
247
4.1.2. Кварковая структура адронов В 1964 г. М. Гелл-Манном (США) и независимо от него Г. Цвейгом (Швейцария) была выдвинута гипотеза, что все адроны состоят из каких-то фундаментальных структурных элементов материи, кварков. В дальнейшем оказалось, что модели элементарных частиц, построенные из кварков и антикварков, находятся в хорошем согласии с экспериментальными результатами. Например, рассеяние быстрых электронов на нуклонах показало, что протон содержит три точечных рассеивающих центра: два из них с зарядами 2/3e и один с зарядом (-1/3е). Для согласования кварковой структуры некоторых элементарных частиц с принципом Паули понадобилось приписать кваркам дополнительные квантовые числа, получившие название "цвет", "очарование" и др. Кроме того, пришлось ввести еще один структурный элемент материи, с помощью которого осуществляется взаимодействие между кварками, этот структурный элемент был назван глюоном. Таким образом, глюоны – это посредники, переносящие взаимодействие между кварками. В зависимости от комбинаций цветов кварков вводятся 8 различных глюонов. Масса покоя глюона mг = 0, спин Sг= 1. Глюоны не только осуществляют взаимодействие между кварками, но могут взаимодействовать между собой. Свойства глюонов таковы, что на больших расстояниях силы взаимодействия становятся настолько значительными, что появление кварков в свободном состоянии оказывается невозможным. И наоборот, на малых расстояниях силы взаимодействия оказываются настолько незначительными, что на таких расстояниях кварки можно считать свободными частицами. Эта особенность сильного взаимодействия получила название асимптотической свободы. Кварковая модель не только правильно описывает свойства известных элементарных частиц, но и предсказывает существование новых, которые действительно обнаруживаются в экспериментах. Итак, все виды адронов состоят из кварков. Минимальное число сортов кварков 6. Кварки имеют спин 1/2, барионный заряд 1/3, дробный электрический заряд, а также еще 4 квантовых числа, но для их обоснования необходимы знания, выходящие за пределы курса общей физики, поэтому их здесь мы не обсуждаем. Барионы состоят из 3-х кварков, мезоны – из 2-х кварков. В табл. 4.1.1 приводятся условные обозначения кварков, их электрический заряд и их относительные массы.
248
Обозначение кварка u d s c b t
Электрический заряд 2/3 e -1/3 e -1/3 e 2/3 e -1/3 e 2/3 e
m/me 9,79 13,7 293,5 2642 9198
Таблица 4.1.1. Некоторые свойства кварков (e – заряд электрона; m – масса кварка, me – масса покоя электрона) В табл. 4.1.2 в качестве примера приводится кварковый состав нуклонов (протонов, нейтронов) и π-мезонов, а также относительные их массы и время жизни в свободном состоянии.
p n π+ π0 π-
S 1/2 1/2 0
m/me 1836,2 1838,7 273,1
Среднее время жизни стабилен 918с=15,3мин 2,6·10-8 с
2(uu − dd )
B 1 1 0 0
0
264,1
8,3·10-17 с
du
0
0
273,1
2,6·10-8 с
uud ddu
ud
Таблица 4.1.2. Кварковый состав нуклонов и π-мезонов ( u , d – антикварки; В – барионный заряд; S – спиновое квантовое число; m – масса элементарной частицы, me – масса покоя электрона) Из анализа состава элементарных частиц видно разнообразие их свойств и характеристик Резко различаются между собой их массы, времена жизни. Почти у каждой частицы имеется ее двойникантичастица, в связи с чем их число сразу же должно быть увеличено почти вдвое. Большие группы частиц объединены под названием резонансы. Характерным для этих частиц является малое время жизни (~10-23с), все они рассматриваются как различные возбужденные состояния одной частицы, например нуклона. В табл. 4.1.3 приведены основные характеристики некоторых элементарных частиц.
249
Условные обозначения
Масса покоя Спиновое кван- Среднее время МэВ товое число жизни Фотон 0 1 стабильны ν Лептоны (ℓ = 1) e0,511 1/2 стабильны -5 νe< 0,3·10 1/2 стабильны µ105,7 1/2 2,2·10-6 с νµ< 0,51 1/2 стабильны τ1782 1/2 3,4·10-12 c < 250 1/2 ? ν τПринятые обозначения: e- – электрон, µ- , τ- – мюоны и τмезоны, ν e-, ν µ- – нейтрино Мезоны (В = 0) π+, π139,6 0 2,6·10-8 c 0 π 135,0 1 8,31·10-17 c 493,7 0 1,24·10-3 c K Принятые обозначения: π – π-мезоны, K – K-мезон. Барионы (B = 1) 938,280 1/2 стабильны p 939,573 1/2 918 с n Λ 1115,6 1/2 2,63·10-10 с Принятые обозначения: p – протон, n – нейтрон, Λ – гиперон.
Таблица 4.1.3. Основные характеристики элементарных частиц Говоря о том, что почти каждой частице соответствует своя античастица, необходимо остановиться на одном поразительном факте. Астрономические исследования показывают, что видимая нами Вселенная состоит только из образующих атомы протонов, нейтронов и электронов, а не из их античастиц. Если бы во Вселенной вещество соседствовало с антивеществом, то на границе их соприкосновения происходили бы процессы аннигиляции. Однако излучений с характерными для этих процессов энергиями не наблюдается. Можно, конечно, предположить, что скопления галактик, отделенных друг от друга громадными расстояниями, могут состоять как из вещества, так и из антивещества. Однако ни одна из космологических моделей не предложила еще такой модели развития Вселенной. Античастицы очень редко наблюдаются в приходящих из космоса лучах. Наблю-
250
даемое в настоящее время во Вселенной отношение числа антинуклонов к числу нуклонов оказывается примерно равным 10-9. Указанное свойство получило название барионной асимметрии Вселенной. Эта же величина характеризует отношение среднего числа фотонов к среднему числу нуклонов во Вселенной. 4.2. Строение атомного ядра Ядро любого атома, кроме атома легкого водорода, состоит из двух типов частиц: Z – протонов и N – нейтронов, причем протоны имеют электрический заряд q = e > 0, а нейтроны электрическим зарядом не обладают. Обобщено эти частицы называются нуклонами. Кроме того, в ядерной физике часто используется слово нуклид. Под словом нуклид понимается ядро атома любого химического элемента с указанными значениями Z и N. В физике атомного ядра, наряду с другими единицами, за единицу массы принята атомная единица массы, сокращенно а.е.м. 1 а.е.м. =1,66 10-27 кг. Тогда масса протона mp = 1,67265 10-27 кг, а масса нейтрона mn=1,67495 10-27 кг, т.е. mn > mp. Общее число протонов и нейтронов в ядре A = Z + N, A – массовое число. Массовое число A в основном определяет массу ядра, а также массу атома в целом. Однако химические свойства атомов все-таки определяются не числом нуклонов в ядре, а числом валентных электронов в электронной оболочке атома. Полное число электронов в нейтральном атоме всегда равно порядковому номеру в периодической таблице элементов, т. е. Z – зарядовому числу. Значит, число электронов в нейтральном атоме равно числу протонов в ядре. Других частиц в ядре, кроме нуклонов, нет. Условное обозначение нуклида в основном состоянии ZA X , где X – символ химического элемента. Например, нуклиды углерода и кислорода имеют следующие обозначения: 126C , 168O . Атомы, ядра которых имеют одинаковые зарядовые числа Z и различные массовые числа A, имеют одни и те же химические свойства и называются изотопами. Изотопы одного и того же химического элемента различаются друг от друга лишь по числу нейтронов в ядре. Большинство веществ с атомами одного и того же Z представляют смесь различных изотопов. Так, углерод имеет 3 изотопа: 126C , 136C , 146C ;
кислород также имеет 3 изотопа:
15 16 17 8 O, 8 O, 8 O
. Разумеется, процент-
251
ное содержание каждого из изотопов в природе неодинаково. Так, процентное содержание в природе изотопов 126С , 168O наибольшее по сравнению с другими одноименными изотопами этих элементов.
H
% 99,985
T -
H =D
0,015
-
H =T
-
12,26 года
He
0,00013
-
He
100
-
Z 1
2
3
4
X 1 1 2 1 3 1
3 2 4 2 6 2 6 3
He
-
0,81 c
Li
7,4
-
7 3
Li
92,6
-
8 3
Li
-
0,84 c
9 3
Li
-
0,17 c
7 4 8 4 9 4 10 4
Be
-
53 дня
Be
-
1·10-16 с
Be
100
-
Be
-
3·106 лет
Таблица 4.2.1. Изотопы и изобары некоторых легких ядер Атомы, ядра которых имеют одни и те же массовые числа, называются изобарами. Одни и те же изобары, т.е. ядра с различными Z, соответствуют ядрам атомов различных химических элементов. В табл. 4.2.1 в качестве примера приводятся изотопы и изобары некоторых легких ядер, их процентное содержание в природе, а также период полураспада нестабильных ядер. 4.3. Энергия связи ядра
Атомное ядро представляет собой систему, состоящую из A нуклонов, удерживаемых в ядре силами связи. Если бы мы пожелали разделить эту систему на составляющие ее нуклоны, то пришлось бы
252
совершить работу против действия сил связи, существующих между нуклонами ядра. Величина этой работы и является мерой энергии связи, мерой прочности ядра. Поэтому энергия связи является одной из важнейших характеристик атомного ядра. Итак, между нуклонами ядра всегда действуют особые силы взаимодействия – ядерные силы. Положительно заряженные протоны и электрически нейтральные нейтроны благодаря действию этих сил образуют чрезвычайно устойчивое образование – ядро. Устойчивость ядра означает, что между нуклонами такого ядра существует сильная связь, действуют большие силы притяжения. Изучение этой связи в известных пределах может быть проведено без привлечения сведений об особенностях и свойствах ядерных сил. Такой подход основан на использовании закона сохранения энергии, он носит общий характер и позволяет сделать ряд важных выводов о специфике тех связей, которые удерживают нуклоны в ядре. На основании сказанного можно дать такое определение энергии связи: энергией связи называется та энергия, которую необходимо сообщить ядру, чтобы разделить его на составляющие его нуклоны без сообщения им за пределами ядра дополнительной энергии. Эту энергию в дальнейшем будем обозначать εсв. Так как на расщепление ядра необходима затрата энергии, то обратный процесс – процесс образования ядра (синтеза ядра) из нуклонов – всегда должен сопровождаться выделением энергии, равной той, которую необходимо затратить на расщепление ядра на составные его части. Итак, если ядро устойчиво, то полная энергия частиц в ядре должна быть меньше полной энергии, которой бы обладали нуклоны до образования ядра. Поэтому синтез ядер из протонов и нейтронов всегда сопровождается высвобождением энергии, равной энергии связи εсв, и соответствующим изменением эквивалентной этой энергии массы: ε ∆M = св2 , (4.3.1) c где εсв – полная энергия связи в расчете на все нуклоны ядра; ∆M – дефект массы: ∆M = Z m p + ( A − Z ) mn − M я . (4.3.2) где m p – масса протона, mn – масса нейтрона, m я – масса ядра.
253
Заметим, что в периодической таблице элементов всегда приводится масса атома, а не масса ядра, поэтому с целью удобства в практическом ее применении формулу (4.3.2) можно переписать по-иному: ∆M = Z mн + ( A − Z ) mn − M а , (4.3.3) где mH – масса атома водорода, т.е. масса протона вместе с электроном, Ma – масса атома. Так как всегда ∆M > 0, то при синтезе ядра из протонов и нейтронов выделяется энергия, пропорциональная ∆M. Разумеется, это будет верно, если данное ядро в дальнейшем находится в устойчивом (невозбужденном) состоянии. Сравним теперь энергию, которая высвобождается при синтезе ядер из нуклонов, с энергией, которая высвобождается при образовании молекул и атомов: при синтезе ядер ∆ε/ε ≤ 10-4, где ε – полная энергия ядра, при синтезе молекул ∆ε/ε < 10-10, где ε – полная энергия молекулы. Используя эти данные, можно показать, что силы взаимодействия между атомами в молекуле примерно в 106 раз меньше сил взаимодействия между нуклонами ядра. Найдем энергию, соответствующую 1 а.е.м. =1u, где u – углеродная единица массы:
1u = M (126C ) / 12, εu = 1uc 2 = 931 ⋅106 эВ = 931 МэВ Поэтому, если дефект массы измерять в единицах а.е.м. , то εсв=931 ∆М, МэВ. (4.3.4) Средняя энергия связи, приходящаяся на один нуклон ядра, является важнейшей характеристикой ядра. Опыт показывает, что средняя энергия связи в расчете на один нуклон сложным образом зависит от массового числа A. Эту зависимость приближенно проще всего изобразить графически (рис. 4.3.1), Из графика на рис. 4.3.1 видно, что средняя энергия связи, приходящаяся на один нуклон, сначала возрастает, достигая максимального значения 8,7 МэВ, когда A ≈ 60. Последующее увеличение числа нуклонов в ядре приводит к постепенному ослаблению связи между нуклонами. Для тяжелых ядер (A > 200) величина /A уменьшается до 7,5 МэВ. Заметим, что указанный график относится только к средним значениям /A. Однако в природе имеют место отклонения от приведенных средних значений. Так, если в ядре содержатся 2, 8, 20, 28, 50, 82 протонов или 2, 8, 20, 28, 50, 82, 126 нейтронов, то для таких чисел нуклонов энергия связи несколько возрастает по
254
сравнению с соответствующей средней энергией связи. Эти числа называются магическими. ε св
10
A
, МэВ
8 6
4 2 0
50
100
150
200
250
A
Рис. 4.3.1. Средняя энергия связи Значит, ядра, в которых одновременно содержатся магическое число протонов и магическое число нейтронов, обладают повышенной стабильностью. К ним, в частности, относятся ядра 4 16 40 208 2 He, 8 O, 20 Ca, 82 Pb, а также некоторые другие ядра атомов. Протоны и нейтроны в дважды магических ядрах наиболее плотно упакованы, поэтому значения /A у дважды магических ядер больше, чем у рядом расположенных на рис. 4.3.1 ядер. Энергии отрыва отдельных протонов и отдельных нейтронов не совпадают как между собой, так и с величиной /A . Из графика на рис. 4.3.1 также следует, если тяжелое ядро неустойчиво, то оно может распадаться на два ядра, например, 250 150 100 Z X → Z1 X + Z 2 X + Q1 , при этом выделяется избыточная энергия Q1 . Если же синтезировать ядро из более легких ядер, например, 2 2 4 1 H + 1H → 2 He + Q2 , то будет выделяться энергия Q2 = (6,0 - 0,2) МэВ = 5,8 МэВ, где (εсв / A) 2 H = 0,1 МэВ, (εсв / A) 4 He = 6,0 МэВ, причем Q1 < Q2. Поэтому 1
2
реакция синтеза ядер энергетически более выгодна по сравнению с реакцией распада ядра. Однако в настоящее время в промышленных
255
целях освоена лишь реакция деления тяжелых ядер, которая используется в частности, на атомных электростанциях. Установки, основанные на синтезе ядер, продолжают разрабатываться – это термоядерные реакторы, их промышленное использование – дело будущего. 4.4. Ядерные силы
Ядра большинства природных изотопов представляют собой очень устойчивые образования. Нейтроны и протоны в них удерживаются мощными ядерными силами притяжения. Поэтому в ядре ядерные силы притяжения, наряду с кулоновскими силами отталкивания между протонами, образуют устойчивую систему частиц. Интересно отметить, что ядерные силы между двумя протонами, между двумя нейтронами, между протоном и нейтроном всегда одинаковы. Поэтому как протоны, так и нейтроны рассматриваются как разные состояния одной частицы – нуклона. Величина ядерных сил не зависит от наличия или отсутствия электрического заряда нуклона. Следовательно, ядерные силы имеют совершенно иную природу, отличающуюся от природы электромагнитных, гравитационных и других сил. Если внимательно проанализировать различные типы ядерных реакций, то оказывается, что в природе не наблюдается процессов исчезновения нуклонов. Это эквивалентно тому, что у нуклонов существует какое-то свойство, какое-то качество, какая-то характеристика, которая в любой ядерной реакции сохраняется неизменной. Эта характеристика условно названа барионным зарядом. Стало быть, в природе должен выполняться закон сохранения барионного заряда. Сущность закона сохранения барионного заряда состоит в том, что сумма барионных чисел до и после ядерной реакции должна оставаться неизменной. Протоны и нейтроны обладают барионным зарядом В = +1. Но в природе, наряду с ними, существуют нуклоны, у которых барионный заряд В = -1. К ним, в частности, относятся антипротоны, антинейтроны. Эти, а также другие барионы различаются между собой лишь знаками барионного и электрического зарядов, разумеется, если у такого бариона электрический заряд вообще существует. Поэтому в общем случае В = +1, -1, а q = 0,+e,-, где e=1,6 10-19 Кл. Каковы же особенности ядерных сил? 1. Прежде всего, ядерные силы – короткодействующие. К такому заключению можно прийти на основании анализа графика /A на рис. 4.3.1.
256
Пусть в системе находятся A взаимодействующих между собой нуклонов. Каждому взаимодействию соответствует своя энергия взаимодействия, а полная энергия взаимодействия есть энергии связи. Следовательно, для оценки величины энергии связи необходимо подсчитать полное число взаимодействий. Найдем полное число взаимодействий на примере ядра, состоящего из 4-х нуклонов. В этом случае на каждый из нуклонов со стороны соседних будут действовать 3 силы. На рис. 4.4.1 изображены рассматриваемые 4 нуклона и указаны силы, действующие на нуклон 1 со стороны остальных трех нуклонов. 1
2
4
3
Рис. 4.4.1. Схема взаимодействия в ядре из 4-х нуклонов Составляя равнодействующие всех сил для каждого из изображенных нуклонов, можно получить систему уравнений. В общем случае число таких уравнений равно массовому числу A, а число сил, входящих в равнодействующую всех сил для каждого нуклона, равно A - 1: A −1 ρ 6ρ 4 4 7ρ 4 48ρ ⎫ F1 = F12 + F13 + F14 ⎪ ρ ρ ρ ρ ⎪ F2 = F21 + F23 + F24 ⎪⎬ A ρ ρ ρ ρ F3 = F31 + F32 + F34 ⎪ ρ ρ ρ ρ ⎪ F4 = F41 + F42 + F43 ⎪⎭ В полученной системе уравнений всегда имеются повторяющиеся силы: F12 = F21, F13 = F31, F14 = F41 и т.д. Полное число взаимодействий будет 1 ( A − 1) A. 2 А так как каждой силе соответствует своя энергия взаимодействия, то полная энергия взаимодействий, т.е. энергия связи
257
ε св =
k ( A − 1) A, 2
где k – нормирующий множитель. Энергия связи, приходящаяся на один нуклон ядра, ε св k = ( A − 1). A 2 Теперь обратимся к графику /A. Из графика на рис. 4.3.1 следует, что в области малых значений A наблюдается практически линейная зависимость от A. Но это как раз и свидетельствует о том, что в легких ядрах каждый нуклон взаимодействует с каждым нуклоном. Однако в области больших A пропорциональность между /A и A не имеет места. Это означает, что теперь взаимодействие нуклона с другими нуклонами охватывает лишь его ближайших соседей, взаимодействие с удаленными нуклонами отсутствует. Следовательно, ядерные силы являются короткодействующими. Радиус действия ядерных сил весьма мал и не превышает 1,4 Ф. Для справки укажем: 1 Ф = 1 Ферми = 1⋅10-15 м. Кроме того, из графика на рис. 4.3.1 следует < εсв > k lim =− , A→ 0 2 A что также соответствует опыту. 2. Ядерные силы способны к насыщению, т.е. каждый нуклон может взаимодействовать только с ограниченным числом соседних нуклонов, находящихся на расстоянии не далее, чем на 1,4 Ф. Свойство насыщения ядерных сил аналогично свойству насыщения валентных связей в химических соединениях или, допустим, в полупроводниках n-типа. Действительно, в каждой устойчивой молекуле один атом может быть связан лишь с ограниченным числом других атомов. Так, например, два атома водорода образуют устойчивую химическую связь только с одним атомом кислорода, и при этом возникает молекула воды H2O. Известно, что в природе существует молекула H2, но нет молекул H3. Если же к двум атомам водорода присоединить два атома кислорода, то получится неустойчивое химическое соединение H2O2. Что же касается химического соединения H2O3, то оно в природе вообще не встречается. Из этого следует, что валентные связи обладают свойством насыщения. Примерно то же самое имеет место и для нуклонов. Каждый нуклон наиболее прочно связан лишь с ограниченным числом нуклонов, расположенных на расстояниях меньше 1,4 Ф. В легких ядрах наиболее сильно связаны нуклоны в ядрах атомов
258 4 2 He
. И вообще, наиболее сильная связь возникает в ядрах с дважды магическими числами нуклонов – магическими числами протонов и магическими числами нейтронов. В таких ядрах между нуклонами образуются насыщенные связи, поэтому такие ядра являются наиболее стабильными. Отсюда легко понять, почему ядро 48 Be является неустойчивым. Связано это с тем, что ядро
8 4
Be как бы состоит из
4 2
He с насыщенными связями). Это приводит к тому, что время жизни ядер 48 Be мало (см. таблицу изотопов), у них период подвух ядер
лураспада порядка 10-16 с. Так как в ядре 24 He все связи насыщены, то, если к ядру 24 He добавить еще один нуклон – протон или нейтрон, возникает нестабильное ядро либо 35 Li , либо 25 He . Но эти ядра, первоначально возникнув, мгновенно распадаются, они в природе и в лабораторных условиях не существуют. У ядер с насыщенными связями энергия связи на один нуклон наибольшая. Вот почему после ядер 24 He возникает стабильное ядро 7 3
Li , а не ядро 35 Li . Все это приводит нас к мысли о том, что в ядре,
как и в атоме, существуют нуклонные оболочки. Тогда у ядра атома 4 2 He нуклонная оболочка оказывается полностью заполненной и дальнейшее увеличение числа нуклонов в ядре приводит к постепенному заполнению новой нуклонной оболочки. Здесь застройка новой нуклонной оболочки начинается с ядра атома 37 Li . Нечто подобное имеет место и в атомах. Атом, у которого электронная оболочка 1s2 полностью заполнена, обладает большой инертностью к химическим реакциям. У таких атомов К-слой полностью заполнен. Таким атомом является атом He. По мере возрастания порядкового номера элемента происходит заполнение следующей электронной оболочки, и, наконец, когда полностью заполняются состояния 2s22p6 , то заполненным оказывается второй слой, L-слой. Это имеет место у атома Ne, он также инертен к химическим реакциям. Таким образом, существование в природе ядер с повышенной энергией связи на один нуклон приводит к тому, что на экспериментальном графике рис. 4.3.1 точки для ядер с заполненными нуклонными оболочками будут расположены выше соответствующих средних
259
значений. Магические числа как раз и свидетельствуют о насыщении связей между нуклонами ядра. 3. Знак ядерных сил зависит от расстояния между нуклонами. Что можно сказать об особенностях сил взаимодействия? Нуклоны наиболее сильно связаны между собой, когда они находятся на расстоянии ≈ 0,5 Ф. При дальнейшем сближении до расстояния 0,2 Ф силы притяжения постепенно сменяются силами отталкивания (рис. 4.4.2). Поэтому нуклоны в ядре находятся на некотором расстоянии друг от друга. В этом состоит одно из характерных отличий ядерных сил от электромагнитных. FЯ
0,2
0,5
1,4 r, Ф
Рис. 4.4.2. Силы взаимодействия между нуклонами 4. Обменный характер сил притяжения Взаимодействие между нуклонами в ядре осуществляется при помощи обмена особыми частицами, которые называются π-мезонами. Поэтому такое взаимодействие носит обменный характер. Здесь наглядную картину можно представить следующим образом: если имеет место взаимодействие между двумя нуклонами, то на языке ядерной физики это означает, что эти два нуклона непрерывно обмениваются между собой другими частицами, которые без нарушения целостности ядра зарегистрировать невозможно. Все π-мезоны, находящиеся в свободном состоянии, подразделяются на три группы, которые отличаются между собой электрическим зарядом, массой и временем жизни, у них барионный заряд отсутствует (В=0): π0, π+, π-. Находясь в свободном состоянии, они имеют следующие свойства: mπ± = 273,2·mе, q = ± e, τ = 2,6·10-8 c, mπ0 = 264,2 me, q = 0 , τ = 1,9·10-16 c.
260
Обменное взаимодействие между двумя нуклонами ядра происходит непрерывно в интервале времени ∆t = 4·10-24 с. Максимальное расстояние, которое за это время пролетает виртуальный π-мезон со скоростью, близкой к скорости света, равно ℓ = 3·108·4·10-24·1015 = 1,2 Ф. Это расстояние сравнимо с радиусом действия ядерных сил. Если два протона, два нейтрона, протон и нейтрон обмениваются 0 π -мезонами, то в этом случае взаимного превращения нуклонов из одного в другой не происходит. Пусть взаимодействие осуществляется при помощи π–-мезонов, тогда нейтрон, испустив π–-мезон, одновременно с этим превращается в протон, а исходный протон, поглотив отрицательный π–-мезон, превратится в нейтрон. Теперь допустим, взаимодействие между протоном и нейтроном осуществляется при помощи π+-мезона. Протон, испустив π+-мезон, превратится в нейтрон, при этом исходный протон, потеряв положительный заряд, также превратится в нейтрон. Итак, процесс взаимодействия между протоном и нейтроном можно наглядно представить таким образом: первоначально протон испускает π+-мезон, π+-мезон за время 4·10-24 с поглощается нейтроном, в результате нейтрон переходит в протонное состояние. Возникший в результате поглощения нейтроном π+-мезона протон вновь испускает π+-мезон и т.д. Значит, в процессе обменного взаимодействия между разноименными нуклонами протоны испускают только π+-мезоны, нейтроны испускают только π–-мезоны, а взаимодействие между одноименными нуклонами осуществляется в результате обмена нейтральными π0-мезонами. Наглядная схема этих процессов приведена на рис. 4.4.3. Здесь π0, π±-мезоны являются квантами ядерного взаимодействия, но способ обмена мезонами – виртуальный.
π+
π0
π−
+
+
+
+
π+
+
π−
+
π0 π0 π0
Рис. 4.4.3. Схема обмена виртуальными мезонами Последовательной теорией электромагнитного взаимодействия является квантовая электродинамика, окончательно сформировавшаяся к началу 50-х гг. ХХ века.
261
Согласно квантовой электродинамике, электрон непрерывно излучает и вновь поглощает виртуальные фотоны; электрон как бы окружен облаком виртуальных фотонов. Электромагнитные взаимодействия электронов и других электрически заряженных частиц рассматриваются как результат обмена виртуальными фотонами. Виртуальные фотоны здесь являются квантами электромагнитного взаимодействия, когда при испускании фотона заряд на некоторое время занимает энергию у себя при условии ее быстрой передачи за счет поглощения этого фотона другим зарядом. Виртуальный процесс обмена фотонами с заимствованием и возвращением энергии происходит за очень короткое время и не поддается измерению. 4.5. Строение атомных ядер
Для построения теории атомного ядра необходимы детальные знания особенностей ядерных сил. Однако в настоящее время у физиков нет еще достаточно точного представления об их природе и свойствах. И то, что о природе ядерных сил до сих пор было рассказано, носит скорее предварительный характер, нежели окончательный. Определенный вклад в понимание структуры и свойств атомных ядер внесло использование различных физических моделей ядер. Как поступают в таком случае? Обычно конструируется такая модель, такие представления, которые в совокупности описывают какието свойства реальных атомных ядер с наибольшей точностью и в то же время вносят физические и математические упрощения в решение поставленной задачи. Любая совокупность таких упрощающих физических предположений, приводящих к физической и математической трактовке задачи о свойствах ядер, и называется моделью ядра. Модель ядра является обобщением тех сведений, которыми располагает физика о свойствах атомного ядра. С этой точки зрения должно быть ясно, что никакая модель ядра не может передать всех свойств атомных ядер. Поэтому всякая модель имеет ограниченную применимость, в природе нет универсальных моделей. Каждую модель с успехом применяют при рассмотрении ограниченного круга ядерных процессов. Достоинство той или иной модели состоит в том, что она дает направляющие идеи для дальнейших исследований, а также возможность объяснить в ядерной физике многие явления, рассматривая их при этом с единой точки зрения.
262
4.5.1. Модель жидкой капли Модель жидкой капли – одна из простейших моделей атомного ядра, которая применима для тяжелых невозбужденных ядер. Модель была разработана в 1936 г. М. Борном. В основе модели лежит представление о том, что благодаря большой плотности упаковки нуклонов в ядре и наличию сильного взаимодействия между ними столкновения между нуклонами происходят настолько часто, что движение отдельных нуклонов оказывается взаимосвязанным, взаимозависимым. Согласно этой модели, ядро представляет собой каплю заряженной жидкости, поверхность которой испытывает волнообразное колебательной движение. Модель жидкой капли имела успех в объяснении многих характерных особенностей ядерных реакций. В 1939 г. на основе этой модели Н. Бору, Д. Уилеру и независимо от них Я.И. Френкелю (г. Ленинград) удалось объяснить деление тяжелых ядер. Успех модели был настолько значительным, что он даже несколько повлиял на дальнейшее развитие теории ядра, задержал появление других теорий и моделей. В чем же состоят основные положения капельной модели ядра? Модель жидкой капли применима для ядер с большим числом нуклонов, A >> 1. Предполагается, что между ядром и каплей жидкости имеется глубокая аналогия. Основанием для такого заключения являются следующие факты. 1. Плотность ядерного вещества постоянна у всех ядер и практически не зависит от размера ядра. Плотность капли жидкости также не зависит от ее размеров. Для доказательства этого утверждения проведем следующие наглядные рассуждения. Если принять, что невозбужденное ядро имеет сферическую форму, то объем ядра должен быть пропорционален общему числу нуклонов А: 4 V = π R 3 = DA, D = const. 3 Плотность ядерного вещества ρ = M Я / V , а его масса M Я ≈ m A ; здесь М – масса ядра, m – средняя масса нуклона. Конечно, плотность ядра несколько зависит от его размеров, от числа нуклонов в ядре, но эта зависимость слабая. С учетом этого mA m ρ= = = const. DA D Таким образом, плотность ядерного вещества практически не зависит от размера ядра, она одинакова у всех ядер. То же самое имеет
263
место и в жидкой капле, где плотность жидкости практически не зависит от размеров капли. Для примера вычислим плотность ядерного -15 вещества у изотопа ядра 238 м. 92 U , радиус ядра которого R = 8·10
ρ=
3m A 4πR
, 3
ρ=
3 ⋅ 1,66 ⋅ 10 −27 ⋅ 238
(
)
−15 3
= 1,84 ⋅ 1017 кг/м 3
4 π 8 ⋅ 10 Мы видим, что плотность ядерного вещества столь велика, что ее даже не с чем сравнивать. Поэтому свойства ядерной материи необычны по сравнению со свойствами вещества макроскопических тел. Физическая причина такого различия в плотности материи макроскопических тел и плотности ядерного вещества достаточно понятна. Она состоит в том, что ядерное вещество сосредоточено в очень малом объеме ядра, за пределами этого объема плотность материи по сравнению с ядерной пренебрежимо мала. В макроскопических телах при определении плотности вещества мы учитываем не только полный объем всех ядер вещества, но и объем, в котором нет ядер, а присутствуют лишь поля различного физического происхождения; но плотность материи в этих полях на много порядков величины меньше ядерной. Так как объем ядер по сравнению с объемом пространства между ядрами очень мал, то и средняя плотность макроскопического вещества всегда оказывается величиной высшего порядка малости относительно плотности ядерной материи. 2. Силы ядерного взаимодействия в какой-то степени напоминают силы межмолекулярного взаимодействия в капле жидкости. Известно, что силы межмолекулярного взаимодействия, приводящие к образованию капли жидкости, обладают малым радиусом действия, они являются короткодействующими. Это означает, что каждая молекула взаимодействует не со всеми молекулами капли жидкости, а лишь с близлежащими. У молекул существует сфера молекулярного действия. Нечто подобное имеет место и в атомных ядрах: силы ядерного взаимодействия являются короткодействующими, способными к насыщению; поэтому каждый нуклон может взаимодействовать с ограниченным числом ближайших к нему нуклонов, устойчивому состоянию должно соответствовать определенное расстояние между нуклонами. В результате, как и в жидкой капле, в ядре возникает поверхностный слой, нуклоны которого находятся в особом состоянии. Невозбужденное ядро в целом ряде случаев должно иметь сферическую форму, а нуклоны поверхностного слоя обладать дополнительной поверхностной энергией, см. рис. 4.5.1.
264
Рис. 4.5.1. Схема капельной модели ядра 3. В капле жидкости силы взаимодействия между молекулами очень велики по сравнению с силами взаимодействия между атомами газа. Поэтому расстояние между молекулами в капле достаточно мало, плотность упаковки очень велика, а средняя длина свободного пробега мала по сравнению с линейными размерами капли. В капельной модели атомное ядро рассматривается как система сильно связанных частиц, поэтому вследствие плотной упаковки нуклонов в ядре средняя длина свободного пробега нуклонов также мала по сравнению с диаметром ядра. В результате, находясь в ядре, нуклоны испытывают непрерывные столкновения друг с другом, а их движение, в общем случае, уже не является независимым. Итак, λ 0 , (сила отталкивания), 3. r > R , Fя < 0 , (сила притяжения). Если в (4.7.9) положить R = 1,4 Ф , то масса виртуального π -мезона m0 = 275,6 ⋅ me . Эксперимент дает следующий результат: mπ ± = 273,2 m , τ = 2,6 ⋅ 10 −8 c , q = ± e ;
mπ 0 = 264,2 me , τ = 1,6 ⋅ 10 −16 c , q = 0 , где me – масса покоя электрона. Следовательно, на расстоянии r < R между нуклонами ядра происходит обмен π± - мезонами, ибо, согласно (4.7.9), чем больше mπ ± , тем меньше радиус ядерного взаимодействия R . На расстояниях r > R обмен между нуклонами происходит преимущественно π0 - мезонами, у которых mπ 0 < mπ ± . Как следствие этого, радиус действия ядерных сил увеличивается.
272
В заключение отметим основные особенности мезонной теории ядерного взаимодействия. Достоинства теории: 1. объясняет физическую причину наличия короткодействия ядерных сил, а также знакопеременность действия ядерных сил; 2. объясняет причину независимости действия ядерных сил от величины и знака электрического заряда; 3. достаточно проста и наглядна. Недостатки теории: 1. не объясняет физическую причину возникновения сил отталкивания между нуклонами на расстояниях, меньших 0,2Ф; 2. не объясняет физическую причину насыщения ядерных сил; 3. не учитывает влияние спина нуклона на особенности взаимодействия между ними. За создание теории ядерного взаимодействия Юкава в 1949 г. получил Нобелевскую премию. 4.8. Модель ядерных оболочек
Модель ядерных оболочек применима для неколлективных невозбужденных ядер с любым числом нуклонов в ядре. Она хорошо объясняет: 1. физический смысл магических чисел нуклонов в ядре, 2. эффект насыщения ядерных сил, 3. особенности заполнения нуклонных оболочек в ядре, 4. физическую причину стабильности ядер. В этой модели используются следующие предположения. 1. Каждый нуклон находится в самосогласованном поле ближайших нуклонов ядра. 2. Нуклоны ядра участвуют в орбитальном движении вокруг центра ядра, несмотря на отсутствие в нем силового центра. Действие не существующего в ядре силового центра заменяют силы поверхностного натяжения. 3. Энергия нуклонов в ядре дискретна, т.е. она квантуется. 4. Каждый нуклон имеет орбитальный и собственный моменты импульсов, а также собственный магнитный момент. Заметим, наличие собственного магнитного момента у нейтрона можно объяснить неравномерным по объему распределением электрического заряда. Это связано с тем, что нейтрон состоит из трех кварков, пространственно по-разному расположенных в нем.
273
5. Между соседними нуклонами существует спин-орбитальное взаимодействие. 6. Нуклон представляем в виде тороида, вращающегося вокруг оси симметрии с большой угловой скоростью. Из мезонной теории ядерных сил следует, что ядерные силы являются короткодействующими, они обладают свойством насыщения. Поэтому каждый нуклон может взаимодействовать лишь с ограниченным числом нуклонов ядра, с несколькими соседними нуклонами. Так как все нуклоны находятся в непрерывном движении, то каждый нуклон относительно соседнего нуклона будет перемещаться с мгновенρ ной скоростью υ , поэтому относительно мгновенного центра ядра он ρ будет обладать мгновенным орбитальным моментом импульса Ll и ρ собственным моментом импульса Ls . Кроме того, нуклон как система ρ кварков должен обладать собственным магнитным моментом pms и при орбитальном движении будет создавать соответствующее магнитρ ное поле Bl . В результате каждый из нуклонов ядра будет обладать энергией спин-орбитального взаимодействие, физическая причина возникновения которого была разъяснена ранее на примере объяснения происхождения энергии спин-орбитального взаимодействия валентного электрона атома. Сказанное в равной степени относится как к протону, так и к нейтрону. Как было показано ранее, энергия спин-орбитального взаимодействия у каждого нуклона ядра определяется выражением ρ ρ ∆W = − pms ⋅ Bl . (4.8.1) Собственный магнитный момент нуклона ρ ρ pms = −2 gLs . Магнитное поле, созданное нуклоном в результате орбитального движения всех нуклонов ядра, ρ ρ µ ρ Be ≈ 0 3 pml = γ pml 2π r Орбитальный магнитный момент нуклона ρ ρ pml = − gLl , ρ e ρ где g = , Ls – собственный момент импульса, Ll – орбитальный моm мент импульса, g – гиромагнитное отношение нуклона. После подстановки найденных значений в (4.8.1) получаем:
274
ρρ ∆W = −2 g 2 γ Ls Ll .
(4.8.2) ρ ρ Теперь найдем скалярное произведение векторов Ll ⋅ Ls . Так как полный момент импульса нуклона ρ ρ ρ L j = Ll + Ls , то
ρ ρ ρ ρρ L2j = L j ⋅ L j = L2j = L2l + 2 Ll Ls + L2s
или
ρρ 1 Ll Ls = ( L2j − L2l − L2s ), (4.8.3) 2 где j – внутреннее квантовое число. Полный, орбитальный и собственный моменты импульсов по одному и тому же закону зависят от соответствующих квантовых чисел: ρ ρ ρ (4.8.4) L2j = η2 j ( j + 1) , Ll2 = η2l (l + 1) , L2s = η2 s ( s + 1) .
После подстановки значений (4.8.4) в (4.8.3) получаем: ρ ρ η Le ⋅ Ls = ( j ( j + 1) − l (l + 1) − s ( s + 1) ) . (4.8.5) 2 В общем случае внутреннее квантовое число 1 j=l±s=l± . 2 Подставим в формулу (4.8.2) следующие значения внутренних квантовых чисел:
j1 = l +
1 . 2
Тогда
1 3⎞ 3 1 ⎛ ∆W1 = g 2η2 γ ⎜ (l + )(l + ) − l (l + 1) − ⋅ ⎟ = g 2η2 γ l . 2 2⎠ 2 2 ⎝ 2 Обозначим ⎧∆W0 = g 2η2 γ ⎪ (4.8.6) ⎨∆W1 = l ⋅ ∆ W0 . ⎪⎩ 2 Далее при 1 j2 = l − 2
275
∆W
1 − 2
1 1 ⎞ 1 1 ⎛ = g 2η2 γ ⎜ (l − )(l + ) − l (l + 1) + ⋅ ( ) ⎟ = −l∆W0 2 2 ⎠ 2 2 ⎝ ∆W
−
1 2
= −l∆W0 . ∆W
±
(4.8.7)
1 2
λ
j
0
±1 2
0
s1
1
±1 2 , 32
1, − 1
p1 , p3
T
∆W0
2
2
2
2
3 2, 52
2, − 2
d3 ,d5
3
5 2, 7 2
3, − 3
f5 , f7
2
2
2
2
Таблица 4.8.1. Энергии спин-орбитального взаимодействия для различных значений орбитальных квантовых чисел В табл. 4.8.1 приведены относительные значения энергии спинорбитального взаимодействия ∆W 1 для различных значений орби±
2
тальных квантовых чисел и соответствующие обозначения термов нуклонов в ядре. Из табл. 4.8.1 видно, что каждый терм расщепляется на два, причем величина относительного расщепления
∆W
±
1 2
∆W0
равна квантовому числу
λ ; чем больше λ , тем больше будет величина расщепления. В модели ядерных оболочек последовательное заполнение состояний нуклонами происходит по воображаемым нуклонным оболочкам. В заполненной оболочке нуклоны наиболее прочно связаны между собой. Всего в ядре может быть не более 7 нуклонных оболочек, каждая из них характеризуется определенным набором термов. В табл. 4.8.2 приводятся первые пять ядерных оболочек, а также число нукло-
276
нов, заполняющих каждую из них, и магические числа нуклонов для каждой из оболочек. Цифры 1 и 2 перед термами обозначают номера уровней. При наличии в ядре полностью заполненных одной или нескольких нуклонных оболочек ядро оказывается особенно устойчивым, а следовательно более стабильным относительно радиоактивного распада, у таких ядер энергия связи является наибольшей по сравнению с энергией связи у ядер с незаполненными нуклонными оболочками. № оболочки
T
I
1s 1
II
1 p 3 ,1 p 1
III
1d 5 ,1d 3 , 2s 1
IV
1 f7
V
2
2
2
2
2
1 f 5 , 2 p 3 , 2 p 1 , 1g 9 2
2
N
2
2
4+2=6
2+6=8
6 + 4 + 2 = 12
2
2 2
Nj
2
2 + 6 + 12 = 20
8
20 + 8 = 28
6 + 4 + 2 + 10 = 22
28 + 22 = 50
Таблица 4.8.2. Конфигурация первых пяти ядерных оболочек ( T – условное обозначение терма с указанием внутреннего квантового числа; N j – число нуклонов в заполненной нуклонной оболочке; N – магическое число нуклонов в ядре) Модель ядерных оболочек позволяет выявить существующие в природе стабильные ядра. Если за наиболее вероятное значение магического числа в VII протонной оболочке принять Z = 126 , а в VIII нейтронной оболочке N = 240 , то, по-видимому, ядра с указанными чис366 лами нуклонов 126 X должны обладать повышенной стабильностью и необычными физическими свойствами. Опыт показывает, что после изотопа 208 82 Pb все более тяжелые изотопы, полученные искусственным путем, являются нестабильными, у них с увеличением массового
277
числа A период полураспада постепенно уменьшается. Тогда по мере приближения к изотопам с массовыми числами A = 366 должен увеличиваться период полураспада. Однако изотопы с указанными массовыми числами в настоящее время получить весьма проблематично. Один из таких "островков" стабильности в слабом его проявлении на260 Lr , что видно из табл. 4.8.3. блюдается у трансуранового элемента 103 A Z
X
T1 2
254 99
Es
1,3 года
257 100
Fm
100 дней
258 101
Md
56 дней
259 102
No
58 мин
260 103
Lr
90 дней
261 104
Ku
65 с
262 105
Ns
34 с
Таблица 4.8.3. Стабильность некоторых изотопов Остановимся вкратце на предсказаниях модели ядерных оболочек относительно возможных спинов четно-четных ядер в основном состоянии. При застройке оболочек нуклоны объединяются в пары с противоположной ориентацией их собственных моментов импульса ρ Ls . Поэтому основное состояние всех ядер с четным числом протонов и четным числом нейтронов не должно иметь результирующего собственного момента импульса, отличного от нуля. Это полностью соответствует опыту. Отсюда получается, что собственный момент импульса, собственный магнитный момент у таких ядер отсутствует. Как следует из опыта, ядра, состоящие из четно-нечетных или нечетночетных протонов и нейтронов, имеют суммарное спиновое квантовое число 1 j = N + , N ≤ 6. 2 Таким образом, спиновое квантовое число ядра j в основном со1 стоянии либо кратно , либо равно 0 . 2 Область применения модели ядерных оболочек ограничена описанием ядер, находящихся в основном или слабо возбужденном состояниях. Нами довольно подробно рассмотрены две модели ядра. Но существуют и другие модели ядра, например, обобщенная модель ядра, которая дает правильное описание свойств некоторых ядер. В этой модели предполагается, что нечетный нуклон движется в поле аксиальной симметрии, образованной всеми нуклонами остова. В какой-то
278
степени эта модель напоминает атом щелочноземельного элемента. Более подробное изложение этой и других моделей ядра (модель парных корреляций, статистическая модель и др.) выходит за пределы курса общей физики высшей школы. 4.9. Направленность радиоактивных превращений
Из опыта известно, что в природе совершенно не встречаются ядра атомов, состоящие только из протонов, кроме ядра H , или только из нейтронов, хотя неоднократно подчеркивалось, что ядерные силы притяжения между p-p, n-n, p-n совершенно одинаковы. Так в чем же здесь дело? Опыт показывает, что свободных нейтронов в природе не существует: раз возникнув, они через некоторое время распадаются. Таким образом, свободный нейтрон является радиоактивной частицей и, следовательно, имеет ограниченное время жизни. Иными словами, энергетический уровень свободного нейтрона всегда располагается выше энергетического уровня свободного протона, поэтому реакция распада свободного нейтрона всегда идет с выделением энергии Q : n = p + 0e+ 0v~ + Q , −1
0 e
Q = 0,79 МэВ , Tn = 11,7 мин , Tp = ∞ , Tn и Tp – соответственно время
жизни нейтрона и протона в свободном состоянии. Переход нейтрона в протон сопровождается испусканием электрона и электронного антинейтрино, их появление вызвано тем, что при переходе нуклона из нейтронного в протонное состояние должны выполняться законы сохранения электрического, барионного и лептонного зарядов, а также закон сохранения энергии. В самом деле, если нуклон перешел из нейтронного состояния в протонное, то у нуклона в протонном состоянии возникает положительный заряд, и для его компенсации необходимо, чтобы в процессе распада появилась частица, компенсирующая этот заряд. Такой частицей является электрон. Но электрон принадлежит к классу лептонов, он, кроме электрического заряда, имеет еще лептонный заряд. Для компенсации положительного лептонного заряда электрона должна возникнуть частица с отрицательным лептонным зарядом. Такой частицей является электронное антинейтрино 00 v~e . На рис. 4.9.1 представлена схема радиоактивного распада свободного нейтрона.
279
ε
n
−1
e + v~e
p
Рис. 4.9.1. Схема радиоактивного распада свободного нейтрона Рассмотрим особенности заполнения уровней полных энергий протонами и нейтронами в ядре, используя модель ядерных оболочек. В этой модели предполагается независимое друг от друга движение нуклонов в потенциальной яме самосогласованного поля ядра, потенциал поля не вычисляется, а подбирается и зависит от расстояния до центра ядра. Потенциал подбирается таким, чтобы имело место наилучшее согласие с опытом. В соответствии с моделью ядерных оболочек на рис. 4.9.2 приведена эмпирическая последовательность расположения нуклонных уровней в ядре без учета электромагнитного взаимодействия между протонами. Изображенные на рис. 4.9.2 уровни полной энергии нуклонов являются вырожденными. Кратность вырождения N определяется значениями квантового числа j =l+s, где l , s – орбитальное и спиновое квантовые числа, и вычисляется по формуле N = 2 j +1 . Так как при построении уровней электромагнитное взаимодействие между протонами не учитывалось, то протонные и нейтронные уровни изображены совпадающими. В табл. 4.9.1 приводится распределение нуклонов в стабильных ядрах по состояниям, в том числе и в ядрах с магическими числами 2, 8, 20, 28, 50, в модели ядерных оболочек с учетом изменения энергии протонов из-за их электромагнитных взаимодействий. В результате при большом числе протонов протонные уровни должны располагаться выше соответствующих нейтронных. При малом числе протонов кулоновские силы отталкивания незначительно увеличивают полную энергию взаимодействия. Однако при возрастании числа протонов с
280
Z > 20 кулоновские силы начинают играть все более заметную роль, и компенсация расталкивающего действия кулоновских сил теперь происходит за счет увеличения дополнительного числа нейтронов и, следовательно, увеличения сил ядерного притяжения. Стало быть, в стабильных ядрах, Z > 20 , как правило, число нейтронов всегда должно быть больше числа протонов. Содержание табл. 4.9.1 подтверждает указанный вывод. ε
Nm
11 2
126
1i 12
3p
32
2f
13 2 52
72 92
1h
82 3s
12
2d
1g
28
2p 1f
32
11 2
52
72
12 32
9 2
52 7 2
20
32
1d
2s 8 1p 2
1s
12
52
12 32 12
Рис. 4.9.2. Расположение нуклоных уровней в ядре ( ε – полная энергия ядерного взаимодействия между нуклонами, N m – магические числа нуклонов в ядре)
281 Nm
2
X
Np
Nn
1 1
H
1s 1
-
2 1
H
1s 1
3 2
He
2 × (1s 1 )
1s 1
4 2
He
2 × (1s 1 )
2 × (1s 1 )
6 3
Li
2 × (1s 1 ) ,1 p 3
7 3
Li
2 × (1s 1 ) ,1 p 3
9 4
Be
2 × (1s 1 ) , 2 × (1 p 3 )
2 × (1s 1 ) , 3 × (1 p 3 )
B
2 × (1s 1 ) , 3 × (1 p 3 )
2 × (1s 1 ) , 3 × (1 p 3 )
B
2 × (1s 1 ) , 3 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 )
12 6
C
2 × (1s 1 ) , 4 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 )
13 6
C
2 × (1s 1 ) , 4 × (1 p 3 )
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
A Z
10 5 11 5
8
2
1s 1
2 2
2
2
2
2
2
2
2 × (1s 1 ) ,1 p 3 2
2
2
2 × (1s 1 ) , 2 × (1 p 3 ) 2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
14 7
N
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
15 7
N
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
16 8
O
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 )
17 8
O
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) 2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) ,1d 5
2
2
2
2
2
2
2
2 2
2
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 ) 2
2
2
2
2 × (1s 1 ) , 4 × (1 p 3 ) , 2 × (1 p 1 )
2 2
2
2
2 × (1s 1 ) , 4 × (1 p 3 ) ,1 p 1
2
2
2
2
2
2
2
20
40 20
... , 6 × (1d 5 ) , 2 × (2 s 1 ) , 4 × (1d 3 ) ... , 6 × (1d 5 ) , 2 × (2 s 1 ) , 4 × (1d 3 )
28
58 28
... , 8 × (1 f 7 )
... , 8 × (1 f 7 )
50
120 50
... , 4 × (2 p 3 ) , 6 × (1 f 5 ) ,
..., 4 × (2 p3 ) , 6 × (1 f 5 ) ,10× (1g 9 ) ,
10 × (1g 9 ) , 2 × (2 p 1 )
2 × (2 p 1 ) , 8 × (1g7 ) , 6 × (2d 5 ) ,12× (1h11 ) ,
Ca Ni Sn
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
4 × (2d 3 ) , 2 × (3s 1 ) ,10× (1h9 ) ,8 × (2 f 7 ) , 2
2
2
2
6 × (2 f 5 ) , 4 × (3 p9 ) ,10× (1i13 ) 2
2
2
Таблица 4.9.1. Распределение нуклонов в ядрах по состояниям
282
В табл. 4.9.1 обозначено: N m – магические числа протонов; N p , N n – соответственно, числа протонов и нейтронов в ядрах; × – знак
умножения,
2 × (1s 1 ) = 1s 1 ,1s 1
например,
2
2
2
или
4 × (1 p 3 ) = 1 p 3 , 1 p 3 , 1 p 3 , 1 p 3 . ) 2
2
2
2
2
Пусть по какой-то причине число нейтронов N в ядре оказалось больше числа протонов Z , соответствующих стабильному состоянию ядра. Это означает, что отношение N Z возросло по сравнению с N Z , характерным для стабильных изотопов. Уменьшить эту величину до значения N/Z у стабильных изотопов можно путем уменьшения числа нейтронов в ядре. Значит, в ядре должен произойти переход одного нуклона из нейтронного в протонной состояние (см. рис. 4.9.3, а). При этом будут испускаться кванты энергии −10 e+ 00v~e . Если же ядро пересыщено протонами, то будет иметь место переход одного из протонов ядра в нейтрон с испусканием кванта энергии 0 0~ − +1 e + 0 ve (см. рис. 4.9.3, б). В первом случае возникает −1 e = β распад, во втором случае возникает ε
p
−1
e + v~e
n
+1
e = β + распад. ε
n
p +1
e + ve
Рис. 4.9.3. Схемы переходов: а – из нейтронного в протонное состояние, б – из протонного в нейтронное состояние Таким образом, опыт показывает, у самых легких стабильных ядер, у которых Z ≤ 20 , отношение N Z ≈ 1 , т.е. число протонов примерно
283
равно числу нейтронов. Но с возрастанием Z отношение N Z постепенно увеличивается, и у тяжелых стабильных ядер, например, у таких, как 208 82 Pb , оно достигает величины, примерно равной 1, 537. Из анализа экспериментальных данных также следует, что для стабильных или долго живущих ядер справедлива следующая эмпирическая формула: N Z = a0 + a1Z + a2 Z 2 + a3 Z 3 , (4.9.1) где a0 = 0,8178, a1 = 0,0166, a2 = −1,552⋅10−4 , a3 = 7,279 ⋅ 10−7 , причем 10 < Z < 126 . Формула (4.9.1) позволяет вычислить число нейтронов в ядре при Z = 126 и тем самым предсказать "островок" стабильности, который, несомненно, должен существовать у некоторых трансурановых элементов. Ядра таких элементов должны иметь повышенную стабильность относительно спонтанного деления и -распада. 4.10. Радиоактивность
В природе существуют стабильные и радиоактивные ядра атомов. Особенностью радиоактивных ядер является самопроизвольный их распад с испусканием одной или нескольких частиц. В процессе распада у ядра могут измениться как зарядовое Z , так и массовое A числа. Радиоактивность ядер, существующих в природных условиях, называют естественной. Радиоактивность ядер, синтезированных с помощью ядерных реакций в лабораториях, называют искусственной. Различия в естественной и искусственной радиоактивности не существует, законы радиоактивности у них одинаковы. Основными характеристиками радиоактивного распада являются: время протекания (период полураспада), тип испускаемых частиц, энергия частиц – продуктов распада, направления вылета частиц – продуктов распада. К числу радиоактивных процессов относятся: 1) α - распад; 2) β − - распад; 3) β + - распад; 4) e -захват; 5) γ - излучение ядер; 6) спонтанное деление тяжелых ядер.
284
4.10.1 Закон радиоактивного распада Радиоактивный распад ядер протекает самопроизвольно без всякого внешнего воздействия. Это процесс статистический, и для отдельно взятого ядра можно лишь указать вероятность его распада в данный момент времени. Однако закономерность в распаде большего числа ядер вскрывается лишь через случайность каждого из них. Основной характеристикой радиоактивного распада является постоянная распада λ . Постоянная распада λ – это есть вероятность распада ядра за 1 с. Важнейшей особенностью радиоактивного распада является независимость постоянной распада от времени. Пусть dw – вероятность распада за время dt . Тогда dw = λdt . Число распавшихся ядер за время dt будет dN = − Ndw , N – число нераспавшихся ядер в момент времени t . Подставим вместо dw найденное выше значение: dN = −λNdt , (4.10.1.1) знак (−) означает, что в процессе радиоактивного распада число материнских ядер убывает. Из (4.10.1.1) следует N = N 0 ⋅ e − λt ,
N 0 – число исходных ядер в начальный момент времени. Уравнение (4.10.1.2) называется законом радиоактивного распада. Введем понятие активность препарата a , определив его как число распадов ядер за 1 с: dN a=− = λN 0 ⋅ e − λt = λN (4.10.1.3) dt [a ] = распад/с = Беккерель = Бк ; 1Бк = 1 распад/с. В настоящее время кроме единицы активности, используемой в СИ, Беккерель, широко применяется внесистемная единица активности Кюри . По первоначальному определению 1 Кюри - это активность 1г изотопа радия 226 88 Ra . Однако для удобства измерений это определение в дальнейшем было заменено: 1 Ки = 3, 700 ⋅ 1010 распад/с . Таким образом, активность 1 Кюри =1 Ки есть активность нуклида, в котором за время 1с происходит 3, 700 ⋅ 1010 актов распада.
(4.
285
Из (4.10.1.2) и (4.10.1.3) следует, что активность препарата со временем убывает по экспоненциальному закону, значит, и масса данного препарата убывает по экспоненциальному закону. Теперь предположим, что препарат состоит из смеси двух радиоактивных нуклидов, причем второй изотоп возникает в результате распада первого. Запишем дифференциальные уравнения, описывающие в препарате распад первого и второго нуклидов: dN1 = −λ1 N1dt , ⎫ (4.10.1.4) ⎬ dN 2 = λ1 N1dt − λ 2 N 2 dt.⎭
Второе дифференциальное уравнение системы уравнений (4.10.1.4) описывает изменение числа вторичных дочерних ядер в процессе радиоактивного распада, причем первое слагаемое в нем отображает прирост вторичных дочерних радиоактивных ядер в результате распада первичных ядер, т.е. число первичных распавшихся ядер за время dt , второе слагаемое равно числу вторичных дочерних ядер, выбывших из препарата за время dt . Решения дифференциальных уравнений (4.10.1.4) имеют вид: ⎫ N1 = N10 ⋅ e − λ1t , ⎪ λ1 N1 − λ 2t − ( λ 2 − λ1 )t ⎬, (4.10.1.5) 1− e N 2 = N 20 ⋅ e + ⎪ λ 2 − λ1 ⎭ где N10 , N 20 – первоначальное число материнских и дочерних радиоактивных ядер. Если λ 2 >> λ1 и N 20 = 0 , то λN N 2 ≈ 1 1 1 − e−λ 2t (4.10.1.6) λ2
(
(
)
)
Тогда при λ 2t > 4,5 из (4.10.1.6) получаем λ1 N1 = λ12 N 2 ,⎫ (4.10.1.7) ⎬. a1 = a2 . ⎭ Уравнение (4.10.1.7) называется вековым уравнением равновесия. Физический смысл его ясен из следующего. Так как λN = a есть число распадов за 1с, то уравнение (4.10.1.7) означает, что число распадов ядер материнского вещества за 1с равно числу распадов ядер дочернего вещества за 1с.
286
Вековое уравнение широко используется для определения периода полураспада T1 . Но при этом следует помнить, что оно справедливо 2
лишь тогда, когда период полураспада материнских ядер много больше периода полураспада дочерних ядер и, кроме того, N 20 = 0 . Если в препарате происходит ряд последовательных радиоактивных превращений, то с учетом указанных выше ограничений вековое уравнение можно продолжить, записав λ1 N1 = λ 2 N 2 = ... = λ n N n . (4.10.1.8) Конечным продуктом цепочки радиоактивных превращений всегда является стабильный изотоп, который накапливается в препарате по мере распада материнского вещества. По величине начального и конечного (стабильного) вещества можно определить возраст горных пород, в которых эти вещества содержатся. Рассмотрим примеры, поясняющие практическую значимость уравнения (4.10.1.8). 1. Необходимо определить возраст минерала, в котором на три 206 атома 238 92 U приходится один атом изотопа свинца 82 Pb , считая, что в начальный момент времени в составе минерала указанный изотоп 9 свинца отсутствовал. У 238 92 U период полураспада T1 = 4,5 ⋅ 10 лет, он 2
на несколько порядков величин превышает периоды полураспада всех остальных нуклидов радиоактивного семейства 238 92 U . Поэтому с большой точностью можно считать, что
238 92 U
непосредственно пре-
238 вращается в 206 82 Pb . Тогда число материнских ядер 92 U , которые в данный момент времени сохранились в горной породе, будет N1 = N10 ⋅ e − λ1t , где 0,693 λ1 = . T1
2
Число вновь образовавшихся ядер 206 82 Pb равно N 2 = N10 − N1 . Отсюда N1 N1 N 2 = = 3 или N10 N1 = 4 3 . N10 − N1 С другой стороны, отношение N10 N1 = e λ1t . Тогда
287
ln 4 − ln 3 4,5 ⋅ 109 = 1,9 ⋅ 109 лет . 0,693 Именно таким способом определяется возраст пород, когда необходимо проследить различные фазы геологической жизни минералов, входящих в состав горной породы. 2. Метод определения даты археологических раскопок. При изучении событий прошлого археологам важно правильно установить, к какому периоду развития человеческого общества относится та или иная археологическая находка. Археологи умеют это определять по письменным источникам, по последовательности наслоений пластов земли, содержащих остатки древней культуры, по рисункам годичных колец на срезах стволов деревьев, использованных для древних построек. Но перечисленные выше методы не всегда дают однозначный количественный ответ в абсолютной форме. В 1948 г. американский ученый Либби предложил радиоуглеродный метод хронологической маркировки ископаемых находок органического происхождения. Такой способ хронологической маркировки получил название радиоуглеродного метода. В 1960 г. за разработку этого метода ему была присуждена Нобелевская премия по физике. Идея радиоуглеродного метода заключается в измерении остаточной радиоактивности найденного предмета и сравнения ее с некоторым стандартным значением. Чем сильнее такое различие, тем древнее предмет. Известно, что в процессе обмена веществ растение усваивает из воздуха углекислый газ CO2 . Основная часть углерода, входящая в состав углекислого газа, представлена стабильными изотопами углерода 126C (99%) и 136C ( ≈ 1%). t=
Однако, кроме них, в составе CO2 имеется незначительная примесь радиоактивного изотопа 146C ( 10−10 %). Этот изотоп возникает в атмосфере благодаря ядерной реакции 14 1 14 1 7 N + 0 n→ 6 C +1 p , причем нейтроны, необходимые для этой реакции, появляются в атмосфере за счет процессов, вызываемых космическими протонами. В результате изотоп 14С усваивается растениями вместе с основными изотопами 126C и 136C . А так как содержание изотопа 146C в атмосфере с течением времени практически не меняется, а если меняется, то оно
288
легко учитывается, то и процентное содержание изотопа 146C в живом растении также является практически неизменным. Так, 1 г углерода в древесине живого растения содержит сегодня примерно такое же количество изотопа 146C , как, скажем, 10000 лет назад. Это обстоятельство и позволяет располагать археологические находки во времени. Рассмотрим конкретный пример. Активность изотопа 146C , содержащегося в деревянном предмете, составляет 0,6 активности того же изотопа в свежесрубленном дереве: a1 (t0 + ∆t ) λN1 N1 = = = 0,6 . a2 (t0 ) λN 2 N 2 Изотоп 146C испытывает β − -распад, T1 = 5570 лет: 2
C ⎯⎯→ N + −10e+ 00v~e .
14 6
β−
14 7
Тогда ln 0,6 a1 N10e − λ (t 0 + ∆t ) = = e − λ∆t = 0,6 , ∆t = − ; ∆t = 4106 лет. − λt 0 a2 λ N10e Таким методом можно определить дату события, если при археологических раскопках найдены деревянные предметы того времени, которые могут быть использованы для хронологических исследований. 4.10.2. α - распад α - распадом называется самопроизвольный процесс испускания ядрами α - частиц, при котором материнское ядро ZA X превращается в
дочернее ядро ZA −−42Y . Распад протекает по схеме ZA X → ZA −−42Y + 24He . Необходимое условие энергетической возможности α - распада состоит в том, что масса материнского ядра должна быть больше общей массы дочернего ядра и α -частицы. Предполагается, что α - частица образуется внутри ядра ZA X еще до момента возникновения распада и некоторое весьма малое время существует в нем самостоятельно. Согласно капельной модели, невозбужденное ядро имеет сферическую форму, на нуклоны ядра действуют ядерные силы притяжения, преобладающие над расталкивающим действием кулоновских сил между протонами. Но за пределами ядра на вылетевшую α -частицу действует только кулоновская сила отталкивания.
289
Пусть до столкновения нуклоны в ядре находились в основном, т.е. невозбужденном состоянии, и поэтому занимали нижние уровни полной энергии (см. рис. 4.10.2.1). После одновременного столкновения двух протонов и двух нейтронов в ядре возникает α -частица, у которой оказываются полностью заполненными первые протонная и нейтронная ядерные оболочки, при этом высвобождается дополнительная энергия, равная дефекту массы. В результате α -частица может занять один из свободных уровней полной энергии ε1 , ε 2 , ε3 . U , МэВ 10 5
ρ
ρ
υα
ε3
0
0,5
−5
ε1 − 10
υα
ε2
1,0
y1
1,5
2,0
y1 =
2,5
3,0
y
R1 R ,y = 1 Rя Rя
− 15 − 20
− 60
Рис. 4.10.2.1. Уровни полной энергии ядра Так как α -частица представляет собой ядро атома 24 He 2 , то дефект массы, возникший при образовании α -частицы, будет ∆m = 0,029267 а.е.м., что эквивалентно выделяемой энергии ∆ε = 27,25 МэВ. Возникшая α -частица находится в поле ядерных сил притяжения нуклонов и отталкивания протонов. Обладая энергией возбуждения, частица в ядре непрерывно сталкиваются как с нуклонами ядра, так и со стенкой потенциальной ямы. Если толщина потенциальной ямы
290
бесконечно велика, то процесс будет продолжаться до тех пор пока α -частица не распадется на составляющие ее нуклоны. Этому процессу соответствует энергия ε1 , в ядре не происходит α -распад. Если энергия α - частицы ε > 0 , то ядерные силы не в состоянии удержать в ядре образовавшуюся α -частицу. Первоначально возникнув, она под действием сил кулоновского отталкивания вылетит за пределы ядра, при этом в пространстве возникнут две частицы: дочернее ядро и α - частица. И хотя вероятность такого распада очень мала, но все же она отлична от нуля. Здесь могут встретиться два случая: 1. Энергия α - частицы ε 3 < U max . На пути движения α - частицы находится потенциальный барьер конечной весьма малой толщины. Поэтому всегда существует заметная вероятность преодолеть его при помощи туннельного эффекта. Итак, в результате одного из таких удачных столкновений α - частица может преодолеть потенциальный барьер туннельным способом. Следовательно, за пределами ядра α частица должна иметь ту же энергию, что и в материнском ядре перед столкновением с потенциальным барьером. А так как внутри ядра уровни полной энергии квантованы, то и за пределами ядра α частицы должны обладать дискретными значениями полной энергии. Опыт подтверждает эту точку зрения. Состояния с такими значениями энергии называются метастабильными. Из рис. 4.10.2.1 следует, что чем больше энергия ε3 , тем меньше должна быть толщина потенциального барьера и тем больше вероятность возникновения α - распада. 2. Энергия α - частицы ε 2 > U max . В этом случае α - частица покидает материнское ядро классическим способом, но энергия α частицы по-прежнему дискретна. Однако на осуществление такого процесса необходима слишком большая энергия возбуждения, поэтому вероятность такого процесса весьма мала. Вылетевшая за пределы материнского ядра α -частица теперь находится в поле короткодействующих ядерных сил притяжения и расталкивающих кулоновских сил протонов дочернего ядра. Но вблизи дочернего ядра электрические силы, действующие на α -частицу, не являются строго кулоновскими, ведь теперь взаимодействие α частицы происходит не с точечным зарядом дочернего ядра и даже не с его сферически распределенным электрическим зарядом, а с объемным зарядом дочернего ядра, форма которого в результате взаимодействия с электрическим зарядом α - частицы несколько отличается от сферической.
291
На рис. 4.10.2.2 изображены мгновенные положения дочернего ядра и α - частицы. Заменим распределенный электрический заряд дочернего ядра воображаемым эффективным электрическим зарядом. Теперь положение эффективного заряда в общем случае не совпадает с центром симметрии ядра, мгновенное положение эффективного заряда будет смещено на величину ∆R . Так как α -распад происходит только в ядрах с большим числом нуклонов, причем число протонов в ядре всегда намного меньше числа нейтронов, то можно считать, что форма дочернего ядра практически не изменится, она останется сферически симметричной. В дальнейшем положение α -частицы будем отсчитывать от центра симметрии ядра. q* = Ze
R qα = 2e
q*
0
∆R
A
r
RЯ 2 Rα RЯ + Rα
Рис. 4.10.2.2. Схема расположения дочернего ядра и α - частицы Пусть точка A – точка касания α - частицы с воображаемой поверхностью дочернего ядра. В точке A потенциалы электрических полей дочернего ядра и α - частица равны между собой: q q* ϕ А ( RЯ ) = ϕ А ( Rα ) или = α . R я + ∆Rmax Rα Отсюда 1 + ∆Rmax R я (4.10.2.1) q* = qα Rя , Rα где Rя – эффективный радиус дочернего ядра, Rα – эффективный радиус α - частицы. Дальнейшие рассуждения проведем применительно к радиоактивному распаду радия
292 α 226 138 222 136 4 ⎯ ⎯→ + 2 He 2 88 Ra 86 Rn 1, 6 ⋅10 3 лет
.
Оценки показывают, что эффективные радиусы ядер радона и α −15 м, Rα ≈ 0,8 ⋅ 10 −15 м, т.е. Rα Rя ≈ 0,1 . частицы равны Rя ( 222 86 Rn) ≈ 8 ⋅ 10 Кроме того, q* qα = Z 2 . Найденные значения поставим в (4.10.2.1): Z 0,1 = 1 + ∆ymax , 2 где ∆Rmax ∆ymax = , Rя откуда для радона получаем: 0,1 ⋅ 86 ∆ymax = − 1 = 3,3 . 2 Предположим, что относительное смещение ∆y эффективного заряда, возникающего под действием электрического поля α - частицы, равно 2
∆y = ∆ymax e1− y .
(4.10.2.2) Сила, действующая на α - частицу со стороны дочернего ядра (рис. 4.10.2.2), q*qα Fα = . (4.10.2.3) 4πε0 ( R + ∆R ) 2 Подставим в (4.10.2.3) значения из формул (4.10.2.1) и (4.10.2.2). Тогда 4e 2 1 + ∆y . Fα = 2 2 0,1 4πε0 RЯ ( y + ∆y )
Величину потенциальной энергии взаимодействия между α частицей и дочерним ядром можно вычислить после интегрирования: y
U = −U 0
1 + 3,3 e1− y
∫ (y + 3,3 e 1
2
1− y 2
)
2
dy ,
(4.10.2.4)
где U0 =
e2 , U 0 = 7,19 МэВ , RЯ = 8 ⋅10 −15 м . 0,1 πε0 RЯ
293
На рис. 4.10.2.1 приведен график потенциальной энергии, построенный по формуле (4.10.2.4). На рис. 4.10.2.1 y = 1 – граница дочернего ядра, y1 = R1 RЯ – относительная координата точки туннельного вылета α - частицы за пределы ядра. Оценим вероятность вылета α частицы за пределы материнского ядра. В разделе 1.7.5 рассматривалось прохождение электронов туннельным эффектом через потенциальный барьер прямоугольной формы. Такая форма потенциального барьера была выбрана не случайно и преследовала две цели: одна – показать в общих чертах, как решаются в квантовой механике подобные задачи; другая – какие физические выводы вытекают из полученного решения. Точно такой же подход к решению подобной задачи можно применить не только для электронов, но и для микрочастиц иной физической природы, в частности и для α - частиц, двигающихся в сторону потенциального барьера конечной толщины. Тогда аналогичное выражение для коэффициента прозрачности потенциального барьера будет справедливо и для α частиц. Напомним его: ⎛a ⎞ 4⎜⎜ 3 ⎟⎟ ⎝ a1 ⎠
D= ⎛a ⎞ 4⎜⎜ 3 ⎟⎟ ⎝ a1 ⎠
2
2
2
⎛ ⎛ a ⎞2 ⎞ + ⎜ ⎜⎜ 3 ⎟⎟ − 1⎟ sh 2 (a3l ) ⎜ a1 ⎟ ⎝⎝ ⎠ ⎠
,
(4.10.2.5)
где l – толщина потенциального барьера; a12
2m 2m = 2α ε , a32 = 2α (U − ε) ; η η
2
⎛ a3 ⎞ U − ε ⎜⎜ ⎟⎟ = ; ε ⎝ a1 ⎠ 2
⎛ e a 3l − e − a 3l ⎞ ⎟ . sh (a3l ) = (sh (a3l ) ) = ⎜ ⎜ ⎟ 2 ⎝ ⎠ a3l − a3l Если выполняется условие e >> e , то 1⎞ ⎛ 2l 1 sh 2 (a3l ) = exp⎜⎜ (2mα (U − ε) )2 ⎟⎟ . 4 ⎝η ⎠ Подставим найденные значения в (4.10.2.5). После некоторых преобразований получаем: 2
2
294 1 ⎞ ⎛ 2l ⎛ ⎞ D = D0 exp⎜ ⎜ 2mα (U − ε) 2 ⎟ ⎟ , ⎟⎟ ⎜ ⎜η ⎠⎠ ⎝ ⎝
(4.10.2.6)
где D0 =
16 ⎛ ⎛ ε ⎞2 ⎞ 4 + ⎜1 − ⎜ ⎟ ⎟ ⎜ ⎝U − ε ⎠ ⎟ ⎝ ⎠
2
.
(4.10.2.7)
Величина коэффициента прозрачности сильно зависит от высоты потенциального барьера. Оценим его величину на примере α - распада радия. Высоту потенциального барьера вычислим по формуле: 2Ze 2 U max = . (4.10.2.8) 4πε0 ( RЯ + Rα ) Так как у
222 86 Rn
Z = 86 ,
RЯ = 8 ⋅ 10−15 м, радиус α -частицы
Rα = 0,8 ⋅ 10 −15 м, то после вычислений по формуле (4.10.2.8) получаем U max =
2 ⋅ 86 ⋅ 1,6 ⋅ 10 −19 ⋅ 10 −6
= 28,3 МэВ . 4π ⋅ 8,85 ⋅ 10 −12 ⋅ 8,8 ⋅ 10 −15 По формуле (4.10.2.6) можно вычислить коэффициент прозрачности потенциального барьера, однако по физическому смыслу он отличается от вероятности вылета α - частицы за пределы ядра. Для определения вероятности вылета из ядра за 1 с (постоянная распада) необходимо умножить коэффициент прозрачности на число столкновений α - частицы с потенциальным барьером за 1 с. Поэтому v λ= α D, (4.10.2.9) 2 RЯ где vα – средняя скорость α - частицы в материнском ядре. Для оценки величины vα воспользуемся соотношением неопределенности: mα ∆υα ⋅ ∆r = η Полагаем, что скорость α - частицы vα равна неопределенности скорости в потенциальном барьере ∆vα , а неопределенность ее координаты ∆r равна толщине стенки потенциального барьера l на уровне полной η энергии, vα = Тогда число столкновений с барьером за 1 с mα λ
295
vα η = 2 RЯ mα ⋅ l ⋅ 2 RЯ и после подстановки значений в (4.10.2.9) получаем 1 η ⎛ 2l ⎞ D0 exp⎜ − (2mα (U − ε) )2 ⎟ . (4.10.2.10) λ= mα ⋅ l ⋅ 2 RЯ ⎝ η ⎠ Из (4.10.2.10) видно, что постоянная распада очень сильно зависит от толщины потенциального барьера: чем толще потенциальный барьер l , тем меньше вероятность α - частице преодолеть его туннельным эффектом, тем меньше постоянная распада λ и тем больше будет период полураспада T1 . Следовательно, быстрым α - частицам должен ν=
2
соответствовать меньший период полураспада, медленным – больший, что полностью соответствует экспериментальным наблюдениям. 238 Известно, что у 226 88 Ra , возникающего в радиоактивном ряду 92 U , период полураспада T1 = 1,6 ⋅ 103 лет = 5,04 ⋅ 1010 с. Подстановка соот2
ветствующих значений в (4.10.2.8) и (4.10.2.10) позволяет определить толщину стенки потенциального барьера на уровне полной энергии ε = 4,2 МэВ. Вычисления по формуле (4.10.2.10) дали следующий результат: l = 9,072 ⋅ 10 −15 м, что представляется вполне правдоподобным. К настоящему времени установлено из опыта несколько законов α - распада. 1. α - излучение для каждого изотопа практически однородно. Характерной константой α - излучения является пробег α - частицы в веществе. Между пробегом α - частицы в воздухе и ее начальной скоростью существует зависимость, выражаемая формулой Гейгера
v03 = aR0 ,
(4.10.2.11)
м2 м , [v0 ] = , [ R0 ] = м . с с 2. Зависимость между величиной пробега частицы и постоянной распада четно-четных ядер описывается формулой Гейгера-Нэттола lg λ = b1 + b2 lg R0 , (4.10.2.12) где b1 и b2 – коэффициенты, каждый из которых имеет свои значения в различных радиоактивных семействах. 3. Пробег R α - частиц в любом веществе приближенно можно определить при помощи уравнения Брэгга - Климена: где a = 1,08 ⋅ 1023
296 1
R0 2 A , (4.10.2.13) ρ [ R ] = [R 0 ] = м ; ρ – плотность вещества, кг/м, A – массовое число. R = 0,3
4.10.3. β- распад Под общим названием β - распад в настоящее время понимаются
три самостоятельные процесса: β + , β − , e − – захват. Между ними имеется много общего. β - распад сопровождается γ -излучением, поскольку при β - распаде дочернее ядро находится в возбужденном состоянии. В настоящее время установлено, что примерно 46% существующих в природе искусственных и естественных нуклидов испытывают β − - распад. β + - распад связан с испусканием позитрона, он возникает только у ядер, полученных в лабораторных установках, в естественных условиях не наблюдается. Около 11% всех известных изотопов распадаются с испусканием позитрона. β + - распад имеет место главным образом у легких ядер. e − - захват наблюдается лишь у тяжелых ядер, это вызвано тем, что некоторые тяжелые ядра могут захватывать ближайшие электроны из электронной оболочки своего атома. При этом заряд ядра уменьшается на единицу. Если захват электрона происходит с ближайшей к ядру K -оболочки, т.е. захватывается электрон 1s , то такой процесс называется K -захватом, если же захват электрона происходит с L -оболочки, т. е. захватывается один из электронов слоя 2s 2 p , то такой процесс называется L -захватом. Обычно вероятность L -захвата во много раз меньше вероятности K захвата. На K -захват приходится примерно 25% всех радиоактивных распадов в природе. Важнейшие особенности β -распада. 1. β − - распад характерен для пересыщенных нейтронами ядер, когда один из нейтронов ядра переходит в протонное состояние и при этом испускает электрон и антинейтрино. Например, 0 3 3 0 0~ 1 H → 2 H + −1 e + 0 ve ; T1 = 12 лет. Энергия вылетающего электрона −1 e и 2
антинейтрино v~e : ε( −10 e + v~e ) = 18 кэВ.
297 +
2. β - распад характерен для пересыщенных протонами ядер, когда один из протонов ядра переходит в нейтронное состояние и при этом испускает позитрон и нейтрино. Например, 116C →115B + +10e + ve ; T1 = 20,4 мин. Энергия вылетающего позитрона
0 +1 e
равна 970 кэВ.
2
3. При K -захвате существует заметная вероятность ядру захватить ближайший к нему K -электрон, при этом один из протонов ядра переходит в нейтронное состояние, а из ядра вылетает нейтрино. Например, 47 Be+ −10e→37 Li + ve ; T1 = 53,6 дня. 2
4. Энергетический спектр электронов и позитронов непрерывен (рис. 4.10.3.1). Непрерывность спектра, на первый взгляд, кажется удивительной, так как энергия любой частицы в ядре, также как и в атоме, должна быть квантована, сами частицы должны находиться на определенном уровне энергии. dN dK
β − ,β
0
ε max
+
ε max
K
Рис. 4.10.3.1. Энергетический спектр электронов и позитронов Объяснение физической причины непрерывности спектра было дано В. Паули. Он предположил, что в данном процессе наряду с электроном одновременно из ядра вылетает какая-то новая частица, которая на опыте не обнаруживается. Эту частицу Э. Ферми назвал нейтрино (маленький нейтрон). В настоящее время считается, что при β − распаде вместе с электроном из ядра вылетает антинейтрино v~e , а при
298
β + - распаде вместе с позитроном из ядра вылетает нейтрино ve . Дальнейшими исследованиями было установлено, что нейтрино – это частицы, у которых Z = 0 , A = 0 , масса покоя mv ≤ 2,5 эВ, барионный заряд B = 0 , спиновое квантовое число sv = 1 2 . Из таблицы элементарных частиц следует, что нейтрино ve , электрон −1 e , мюон µ обладают одной важнейшей характеристикой, а именно, лептонным зарядом λ . У всех этих частиц λ = 1 , а у остальных частиц, в том числе и у фотонов, лептонный заряд отсутствует. У антилептонов λ = −1 . В природе, наряду с другими законами сохранения, выполняется закон сохранения лептонного заряда. Поэтому в ядерных реакциях общий лептонный заряд всегда сохраняется неизменным. Нейтрино – очень распространенные в природе частицы. Так, на массу потока нейтрино приходится примерно 25% от общей массы излучаемой солнцем материи. То же самое можно сказать и о звездах. Важнейшей особенностью нейтрино является очень слабое взаимодействие с другими частицами материи. Насколько слабо это взаимодействие, свидетельствует тот факт, что обычно нейтрино пролетает через всю Землю, так и не провзаимодействовав с частицами вещества земли. Для нейтринных потоков Земля является практически прозрачной средой. Для обнаружения нейтрино применяют специальные установки, спектрометры нейтрино, представляющие собой цистерны, заполненные C2Cl4 . Один из таких спектрометров создан в США (Брукхейвен, 1968 г), он расположен на глубине 1480 м в бывшей соляной шахте. Там находится цистерна, содержащая 610 т C2Cl4 . Регистрация нейтрино основана на счете числа радиоактивных атомов 37 18 Ar , образующихся в ядерной реакции: 37 17 Cl
37 37 37 + ve →18 Ar + −10e ; 18 Ar →17 Cl + +10e + ve ; −10 e+ +10e → 2 γ . В спектрометре регистрируются 2γ кванта, разлетающиеся по закону сохранения импульса в противоположные стороны. Заметим, 37 17 Cl – стабильный изотоп, в природе его 24,6%. Наряду с ним суще35 ствует стабильный изотоп 17 Cl , в природе его 75, 4%. Нейтрино рождаются при высоких температурах в недрах солнца и звезд в результате протекающих там ядерных реакций. Поэтому изучение углового распределения потоков нейтрино позволяет как бы заглянуть в глубь солнца и даже некоторых звезд.
299 −
Исходя из сказанного, β - распад можно записать в виде ядерной реакции β− A A 0 ~ Z X ⎯⎯→ Z +1Y + −1 e + ve + Q1 . Этот процесс при β − - распаде происходит потому, что в ядре один из нуклонов переходит из нейтронного в протонное состояние: n⎯ ⎯→ p + −10e + v~e . Становится понятной физическая причина возникновения антинейтрино. При β − - распаде один из нуклонов перешел из нейтронного состояния в протонное, этот процесс сопровождается испусканием электрона, что необходимо для выполнения закона сохранения электрического заряда. Но рождение электрона означает, что возникла частица, у которой лептонный заряд λ = +1 . И для того, чтобы не нарушился закон сохранения лептонного заряда, необходимо появление античастицы, у которой лептонный заряд λ = −1 . Такой частицей является антинейтрино. β + - распад происходит по следующей схеме: +
β A 0 ⎯⎯→ Z −1Y + +1 e + ve + Q2 , при этом в ядре происходит превращение одного из протонов в нейтрон: p⎯ ⎯→ n + +10e + ve . Здесь для выполнения законов сохранения электрического и лептонного зарядов необходимо появление позитрона и нейтрино. При e − -захвате имеет место поглощение ядром ближайшего к нему атомного электрона из K - или L - слоя: A 0 ⎯→ Z −A1Y + + ve + Q3 , Z X + −1 e ⎯ при этом в ядре протон поглощает электрон, и возникают нейтрон и нейтрино: p + −10e ⎯ ⎯→ n + ve . A Z X
4.11. Ядерные реакции
Ядерными реакциями называются процессы превращения атомных ядер, происходящие в результате их взаимодействия с элементарными частицами или с другими ядрами. Обычно ядерная реакция вызывается бомбардировкой ядер некоторого вещества потоком ускоренных частиц: протонов, нейтронов, α - частиц и др.
300
В результате интенсивного взаимодействия исходного ядра ZA X и сталкивающейся частицы a образуется новое ядро – ядро-продукт A1 Z 1Y и некоторая частица b , разлетающиеся в разных направлениях от места столкновения. Ядерные реакции символически записываются следующим образом: ⎧ ZA X + a или ZAX (a, a ) ZAX − упругое рассеяние, ⎪ ⎪ ZA X * + a или ZAX (a, a) ZAX * − неупругое рассеяние, ⎪ A A1 Z X + a → ⎨ A1 A ⎪ Z1Y + b или Z X (a, b) Z1Y , ⎪ A1 A1 A ⎪⎩ Z1Y + γ или Z X (a, γ ) Z1Y − радиационный захват. При большой энергии частицы a вместо одной частицы b могут возникнуть несколько новых частиц b1 , b2 , ... . Ядерные реакции могут протекать как с выделением, так и с поглощением энергии. В качестве примера приведем две реакции: 14 17 14 4 17 1 7 N + 2 He→ 8 O +1p , сокращенное обозначение 7 N (α, p) 8 O = N (α, p)O ; 9 4 12 1 4 Be+ 2 He→ 6 C + 0 n
, сокращенное обозначение 49Be(α, n)126C = Be(α, n)C .
Ядерные реакции типа
A1 A Z X ( a, b) Z1Y
сопровождаются перестройкой
атомных ядер. Однако при этом всегда выполняются следующие законы сохранения: электрического, барионного зарядов, полной энергии, импульса, момента импульса и некоторых других характеристик атомного ядра. Исследование ядерных реакций позволило установить экспериментальные закономерности, на основании которых было дано теоретическое объяснение процессов ядерных превращений. Одна из этих теорий, теория составного ядра, впервые была предложена Н. Бором в 1936 г. Она удовлетворительно объясняет ядерные превращения при энергии бомбардирующих частиц до 50 МэВ. A Ядерная реакция ZA X ( a , b) Z11Y по этой теории протекает в два этапа. На первом этапе ядро образуется составное ядро
A Z X Ac * Z cY
захватывает частицу a . В результате в возбужденном состоянии:
A Z X
+ a → ZAcc Y * .
301
Энергия возбуждения ε воз составного ядра складывается из энергии связи ε св частицы a в составе ядра и части кинетической энергии частицы, преобразующуюся затем в энергию покоя ядра Aa ε воз = ε св + Ka , A + Aa где A – массовое число ядра, Aa – массовое число налетающей частицы, K a – кинетическая энергия налетающей частицы. A Если A >> Aa , то ε воз ≈ ε св + a K a . A В результате сильных взаимодействий между нуклонами ядра и непрерывных столкновений нуклонов между собой энергия возбуждения, которая привносится в ядро налетающей частицей a , быстро перераспределяется между остальными нуклонами. Благодаря флуктуациям в определенный момент времени значительная часть энергии возбуждения оказывается сосредоточена на одном из нуклонов вблизи поверхности ядра. Допустим, что этой энергии вполне хватает для вылета частицы b за пределы составного ядра. Тогда наступает второй этап реакции – распад составного ядра на ядро ZA11Y и частицу b : Ac * A1 Z c Y → Z1 Y
+b.
Из опыта следует, что время жизни составного ядра τ ≥ 10 −14 c . На рис. 4.11.1 условно изображено невозбужденное ядро урана 238 92 U . С ним сталкивается налетающая частица a . В диаметре ядра укладывается примерно 26 нуклонов. Значит, возбуждение передается от одного края ядра к другому путем последовательных столкновений в цепочке из 26-ти нуклонов. Время передачи возбуждения τ0 = 2 RЯ с ; τ0 = 6 ⋅ 10 −15 3 ⋅ 108 = 2 ⋅ 1023 с ,
RЯ – радиус ядра, с = 3 ⋅ 108 м/с. Следовательно, отношение τ τ0 =1 ⋅ 10−14 2 ⋅ 10−23 = 5 ⋅ 108 . Таким образом, относительное время жизни τ τ0 составного ядра настолько велико, что составное ядро как бы успевает "забыть" о причине своего возбуждения, и спустя время τ = 10 −14 с составное ядро распадается по законам радиоактивного распада с учетом вероятности протекания того или иного распада.
302
2 RЯ ≈ 6 ⋅10 −15 м
ρ
υa a
2 RЯ
Рис. 4.11.1. Схема соударения α - частицы с ядром В качестве примера приведем различные ядерные реакции, приводящие к возникновению одного и того же составного ядра, а также к появлению различных каналов распада составного ядра; разумеется, вероятности реализации различных каналов распада здесь разные, способ распада составного ядра определяется величиной энергии возбуждения. 23 11
25 12
Na + α
Mg + d
27 13
Al + γ
27 13
Al *
23 11
Na + α
25 12
Mg + d
27 13
Al + γ
Примечание. В приведенной схеме ядерных реакций использованы следующие обозначения: α = 24He , α - частица (ядро атома гелия); d = 12H , дейтрон (ядро тяжелого изотопа водорода); γ = hν (гаммаквант).
303
4.12. Эффективное сечение ядерной реакции
Для оценки вероятности протекания ядерной реакции широко пользуются понятием эффективное сечение реакции или эффективное сечение взаимодействия частиц A и a . Для определения вероятности взаимодействия частицы с ядром рассмотрим плоскую мишень, изготовленную из однородного вещества (см. рис. 4.12.1). В случае толстой мишени число частиц a , прошедших через слой x , меняется с глубиной. Поэтому для оценки числа частиц, прошедших через определенный слой вещества, должно быть составлено дифференциальное уравнение для некоторого слоя толщиной dx , расположенного на глубине x . l N0
N (x)
N (l )
a
a a
a
a
x
dx
Рис. 4.12.1. Взаимодействие частиц с ядрами мишени Тогда число частиц dN , вступивших в ядерную реакцию за время t , т.е. число частиц, выбывших из первичного пучка за время t после прохождения потока через слой толщиной dx , dN = −σN ( x)ndx , (4.12.1) где σ характеризует вероятность того, что ядро A в результате попадания в него частицы а превратится в ядро B с испусканием частицы b , σ – эффективное сечение реакции; N ( x) – число частиц a , дошедших до слоя dx на глубине x за время t ; n - концентрация ядер A в мишени. После интегрирования (4.12.1) получаем N ( x) = N 0 exp(−nσ x) , (4.11.2) N 0 – число частиц а, падающих на наружную поверхность мишени A . Тогда через мишень толщиной l пройдет число частиц N (l ) :
304
N (l ) = N 0 exp(−nσ l ) . (4.12.3) По определению, вероятность протекания ядерной реакции на глубине x в слое толщиной dx пропорциональна как концентрации ядер, так и толщине слоя dx , причем коэффициентом пропорциональности служит эффективное сечение взаимодействия σ : dw = σ ndx . Отсюда 1 dw σ= . (4.12.4) n dx Из формулы (4.12.4) следует, что размерность эффективного сечения м 2 . Из (4.12.3) после логарифмирования получаем выражение для эффективного сечения ядерной реакции: 1 N σ = ln 0 . (4.12.5) nl N (l ) Как следует из (4.12.5), для определения эффективного сечения взаимодействия потока частиц а с ядрами мишени A достаточно в специальных опытах измерить ослабление потока частиц а в слое мишени толщиной l . Эффективное сечение измеряется в м 2 , либо в барнах: 1 барн = 1 ⋅10−28 м 2 . 4.13. Деление тяжелых ядер при захвате нейтрона
В 1919 г. Э. Резерфорд открыл реакцию превращения одного ядра в другое: 14 17 7 N + α→ 8 O + p , или в сокращенной форме записи 14 17 7 N (α, p ) 8 O . Во все последующие годы вплоть до 1938 г. физики наблюдали ядерные реакции типа A1 A Z X ( a , b ) Z1Y . Но в 1938–39 гг. при облучении тяжелых ядер потоком нейтронов была обнаружена реакция нового типа; оказалось, что наряду с обычA ной ядерной реакцией ZA X ( a , b) Z11Y , где a – нейтрон, возникает реакция деления ядра на осколки:
305 A Z X
( n,3n)( ZA11Y + ZA22 Y ) .
Таким образом, было установлено, что в составном ядре, возникшем после поглощения материнским ядром нейтрона, в ядре происходит столь сильная перестройка состояний нуклонов, что оно делится на две неравные по величине части с испусканием двух или трех нейтронов. Может возникнуть вопрос: почему такое деление ядер не наблюдалось ранее? Ответ может быть таким. Реакции с нейтронами могли быть проведены лишь после открытия нейтронов. Но нейтроны были открыты лишь в 1932 г., и потребовались годы исследований, пока не выяснили все особенности ядерных реакций с участием нейтронов. Почему же из всех видов столкновений частиц с тяжелыми ядрами столкновения с нейтронами приводят к качественно новым результатам по сравнению со столкновениями других элементарных частиц? Все дело в том, что нейтрон – электрически нейтральная частица. Поэтому при движении в сторону тяжелого ядра нейтрон без изменения своей кинетической энергии, без изменения направления движения может вплотную подойти к ядру и проникнуть внутрь его. Для нейтрона нет силы, препятствующей его движению в сторону ядра. Протону и другим положительно заряженным частицам для проникновения в ядро необходимо предварительно затратить энергию, необходимую для преодоления силы электростатического отталкивания, которые оказываются особенно большими вблизи ядра. Кроме того, наличие силы отталкивания приводит к тому, что в процессе движения протон, α -частица, как правило, отклоняются в сторону от ядра. Все это приводит к тому, что вероятность столкновения заряженных частиц с ядром оказывается гораздо меньше вероятности столкновения нейтральной частицы с ядром. Наконец, положительно заряженная частица, сталкиваясь с ядром, постепенно теряет свою кинетическую энергию. Стало быть, не всякая заряженная частица может проникнуть в ядро, а лишь та, у которой кинетическая энергия больше потенциальной энергии сил отталкивания. Что же касается электронов, то они могут проникать в ядро, об этом свидетельствует наличие в природе явления e − -захвата. Но если кинетическая энергия электронов меньше 1 МэВ, то проникновение электрона в ядро не вызовет деления ядра на осколки. Что же касается других отрицательно заряжен-
306
ных частиц, например, различных видов гиперонов, то потоки их большой плотности в настоящее время получить очень трудно. Как уже отмечалось ранее, теоретически вопросы деления тяжелых ядер впервые рассматривались Бором, Уилером и независимо от них Френкелем в 1939 г. В основу своих рассуждений они положили модель жидкой капли. В результате проведенного анализа они пришли к выводу, что способность ядер к делению определяется соотношением сил электростатического расталкивания протонов ядра и ядерных сил притяжения. Процесс деления можно представить следующим образом. На материнское ядро падает нейтрон, проникает в него. В результате возникает составное ядро, находящееся в возбужденном состоянии. Энергия возбужденного ядра после проникновения в него нейтрона, как это следует из графика εсв A = f ( A) , порядка 6 МэВ. Эта энергия столь значительна, что возникает сильное возбуждение ядра. Процесс символически можно записать следующим образом: A 1 A +1 * Z X + 0 n→ Z X , где A +Z1 X * – возбужденное составное ядро. Энергия возбуждения составного ядра складывается из двух составляющих: энергии связи нейтрона в составном ядре и кинетической энергии налетающего нейтрона A ε ε воз = св + Kn , A A +1 K n – кинетическая энергия налетающего нейтрона. Опыт показывает, что энергия возбуждения составного ядра у различных тяжелых ядер находится в интервале 5,8 МэВ ≤ ε воз ≤ 6,9 МэВ . В результате возбуждения ядро приходит в колебательное движения, вытягиваясь то в одну, то в другую стороны, ядро испытывает непрерывную деформацию своего объема (рис. 4.13.1). Если энергия возбуждения ε воз превышает некоторую минимальную энергию, энергию активации ε а , то деформация составного ядра достигает такой величины, при которой у ядра возникает перетяжка, и силы расталкивания между положительными электрическими зарядами различных частей составного ядра становятся больше ядерных сил притяжения. В результате ядро делится на два осколка. Следовательно, если бы ядро было бы электрически нейтрально, то наличие пере-
307
тяжки не привело бы к делению ядра на две части: деление ядра возникает потому, что между протонами ядра существуют силы электрического расталкивания. Таким образом, нейтроны ответственны за возбуждение, а протоны – за деление ядра.
1 0
n
ρ
υn
A Z
t0
A+1 * Z
A+1 * Z
X
X
1 МэВ. На рис. 4.13.2 изображена последовательность изменения состояний составного ядра во времени до момента его распада после попадания в материнское ядро нейтрона. A Z
1 0
n
ρ
υn
A+1 * Z
A+1 * Z
X
X
X
A1 Z1
Y*
A2 Z2 1 0
n
ρ
+q
+ q1
+ q2
+ q1
+ q2
υ1
ρ
+ q1
+ q2 1 0
t0
Y*
1, N > N 0 , число нейтронов со временем растет; это развивающаяся цепная реакция. • k - 1 = 0, N = N 0 , число нейтронов во времени не меняется; это самоподдерживающаяся цепная реакция. • k - 1 < 0, k < 1, N < N 0 , число нейтронов со временем убывает; это затухающая цепная реакция. Для получения управляемой цепной реакции необходимо иметь коэффициент размножения k ≈ 1 . В этом случае число активных нейтронов будет меняться столь незначительно, что таким потоком нейтронов легко управлять. Для этого в активную зону вводят специальные стержни – замедлители ядерной реакции. Вводя и выводя из активной зоны такие стержни, можно управлять ходом цепной реакции, делая ее самоподдерживающейся. В зависимости от величины коэффициента размножения k можно получить три режима работы: k = 1 – критический режим, k > 1 – надкритический режим, k < 1 – подкритический режим. Система, состоящая только из ядер 238 92 U , не может находиться в критическом режиме, поскольку у 238 92 U вероятность поглощения быстрого нейтрона с энергией ε к > 1,4 МэВ и последующего деления составного ядра меньше вероятности неупругого рассеяния быстрого нейтрона примерно в 3 раза. Таким образом, 238 92 U очень хорошо осуществляет неупругое рассеяние по схеме 238 238 * 92 U ( n, n') 92 U ,
при этом потеря энергии у быстрых нейтронов происходит за весьма короткое время. Для протекания самоподдерживающейся ядерной реакции необходимо k = 1 . Но в данном случае из трех нейтронов только один вызовет деление, а два испытают неупругое рассеяние. Значит, величина k = 1 может быть только в идеальном случае, а с учетом возникающих здесь дополнительных потерь реальное значение k оказывается меньше единицы. Таким образом, получается, что при k = 1 цепная реакция оказывается затухающей. Итак, для того чтобы цепная самоподдерживающаяся ядерная реакция шла на быстрых нейтронах, необходимо, чтобы коэффициент размножения k > 1 , а само делящееся вещество было бы обогащено ядрами 235 92 U или ядрами другого делящегося под действием тепловых нейтронов вещества.
319
4.16. Реакции синтеза легких ядер 4.16.1. Термоядерные реакции Ранее мы подробно рассмотрели процесс деления тяжелых ядер, возникающий в результате поглощения тяжелым ядром одного нейтрона. Такое ядро делится на два осколка, обладающих огромной кинетической энергией, и, кроме того, в пространство вылетают два или три мгновенных нейтрона. Общая энергия, которая выделяется в результате реакции деления тяжелых ядер, составляет примерно 200 МэВ. Но, наряду с делением тяжелых ядер, в природе существуют реакции синтеза, т.е. реакции образования более тяжелых ядер из легких, сопровождающехся выделением энергии большей, чем при реакции деления. Для того чтобы понять физическую причину выделения большой энергии в процессе синтеза легких ядер, обратимся еще раз к анализу ε графика св , приведенного на рис. 4.3.1. Из опыта следует: A ε ε св 2 1 ε (1 H ) = 1,2 МэВ, св (13H 2 ) = 1,8 МэВ, св ( 24He2 ) = 7,2 МэВ. A A A ε св 4 2 ( 2 He ) A ε далеко выходит за пределы графика усредненных значений св . ПоA 2 1 4 2 этому, если из двух нуклонов 1 H образуется ядро 2 He , то такое ядро должно находиться в возбужденном состоянии, поскольку при этом высвобождается энергия, равная энергии связи. Нечто подобное имеет место и при синтезе других легких ядер. Конечно, было бы заманчивым в какой-то точке пространства вызвать столкновение сразу четырех протонов с последующим образованием ядра атома гелия. Однако такое четверное столкновение – событие маловероятное, оно осуществляется чрезвычайно редко. Поэтому гораздо проще осуществить столкновения двух дейтронов с последующим образованием ядра 4 2 2 He . Возможные ядерные реакции синтеза будут иметь следующий вид:
Как видно из рис. 4.3.1, экспериментальное значение
320 2 1 2 1 3 2 1 0 1 H + 1 H →1 H +1 H + 4,03 2 1 2 1 3 1 1 1 1 H + 1 H → 2 He + 0 n + 3,25 2 1 3 1 4 2 1 1 1 H +1 H → 2 He + 0 n + 17,6
МэВ , МэВ ,
МэВ . Из приведенных ядерных реакций мы видим, что при этом выделяется значительная энергия. Следует подчеркнуть, что в этих реакциях выделение энергии в расчете на единицу массового числа A в несколько раз превышает выделение энергии, которое имеет место при реакции деления тяжелых ядер, например, 235 92 U , под действием нейтрона. В самом деле, применительно к этому случаю, мы можем записать: A1 A2 235 1 236 * 92 U + 0 n →( 92 U )→ Z 1 Y + Z 2 Y + k ⋅ n + 205 МэВ , где k = 2 или 3 . Но A = A1 + A2 + k = 236 , поэтому
ε * A = 205 236 = 0,85 МэВ . В случае же реакции синтеза имеем 3 2 1 4 1 H (1 H , 0 n) 2 He + 17,6 МэВ , и A = 4 + 1 = 5 . Тогда ε* A = 17,6 5 = 3,5 МэВ . Таким образом, при реакции синтеза высвобождение энергии на один нуклон оказывается примерно в четыре раза больше, чем при реакции деления. И если сравнивать между собой ядерную реакцию деления с ядерной реакцией синтеза, то между этими реакциями с энергетической точки зрения нет принципиальной разницы: реакция синтеза в расчете на одну а.е.м. дает выигрыш в энергии примерно в четыре раза больше по сравнению с реакцией деления. Тем не менее, в настоящее время ученые многих стран стремятся овладеть управляемой реакцией синтеза. В чем же здесь причина? А дело здесь в том, что исходный продукт реакции синтеза в природе встречается в очень большом количестве. Известно, что в природной воде всегда в небольшом количестве имеются изотопы дейтерия и трития. Так, 1 л воды содержит 0, 033 л дейтерия, а всего в океанах Земли содержится около 5 ⋅ 1013 т дейтерия. При современном уровне энергетических потребностей запасов дейтерия на Земле могло бы хватить на 20 миллиардов лет. И если человечество сумеет овладеть этой реакцией, заставит ее служить на свою пользу, то оно на многие столетия вперед освободит себя от заботы о дешевом источнике энергии. Тогда во
321
многих странах проблема энергетического голода не будет стоять так остро, как сейчас. Вот почему взоры всех ученых энергетиков привлекает заманчивая картина овладения термоядерной реакцией синтеза. В чем же состоит особенность реакций синтеза легких ядер? Синтез должен осуществляться либо из легких ядер, либо из нуклонов. ε При этом у них отношение св должно находиться на возрастающей A части графика рис. 4.3.1. К нуклонам, как мы знаем, относятся лишь протоны и нейтроны. Однако нейтроны в свободном состоянии в природе не существуют. Поэтому синтез ядер из нейтронов в природных условиях осуществить в заметных количествах не удается, это можно сделать только из протонов, а также из ядер дейтерия и трития. Но ядра этих изотопов имеют электрический заряд. Поэтому в ядерных реакциях синтеза существенную роль играют кулоновские силы отталкивания, препятствующие преодолению потенциального барьера между сталкивающимися частицами. Если полная кинетическая энергия сталкивающихся частиц невелика, то ядерная реакция на заряженных частицах не произойдет вообще. У легких ядер кулоновский потенциальный барьер сравнительно невысок, но все же для сближения двух дейтронов и последующего образования ядра атома 24 He необходимо, чтобы их полная кинетическая энергия была не менее 0,1 МэВ. В самом деле, для того чтобы произошел синтез двух дейтронов, их необходимо сблизить на расстояние около 3 Ф , т.е. на удвоенный радиус сталкивающихся дейтронов. На таком расстоянии между ядрами потенциальная энергия отталкивания e2 ε пот = . (4.16.1) 4πε0 (2 R) max Так как столкновения дейтронов в большом количестве возможны только в достаточно плотной среде, то для осуществления такой реакции необходима кинетическая энергия сталкивающихся дейтронов 3 (4.16.2) ε к = kT . 2 Решая уравнения (4.16.1) и (4.16.2) совместно, получим e2 T= . (4.16.3) 12πε0 kR
322
После подстановки в (4.16.3) табличных значений, а также R = 1, 5 Ф и выполнения вычислений получаем T = 3,7 ⋅109 K . Эта температура столь высока, что превышает температуру в центральной
области Солнца, которая примерно равна 1,5 ⋅107 K . Так как процессы слияния ядер в массовом количестве возникают лишь в результате хаотических столкновений при очень высокой температуре, то рассмотренные выше реакции синтеза называются термоядерными реакциями. Таким образом, термоядерные реакции – это реакции синтеза атомных ядер, эффективно протекающие при сверхвысоких температурах и способствующие поддержанию этой температуры за счет большого энерговыделения. Для поддержания термоядерной реакции необходима температура порядка 109 К, а в то же время в центральной области Солнца температура достигает величины порядка 107 К. Тем не менее считают, что огромная энергия, излучаемая Солнцем в окружающее пространство, возникает за счет протекающих в нем термоядерных реакций. Так в чем же здесь дело? Оказывается, реакции синтеза могут протекать и при температуре, значительно меньшей, чем 109 К. Правда, при этом в реакции должны участвовать только ограниченное число ядер. Рассмотрим более подробно эти процессы. 1. Если два дейтрона 12 H движутся навстречу друг другу, то они могут преодолеть потенциальный барьер сил отталкивания туннельным эффектом и затем войти в соприкосновение и испытать слияние, образуя ядро атома гелия, α - частицу. На протекание такого процесса требуется энергия в 10–100 раз меньшая, чем при прямом слиянии ядер дейтерия. Известно, чем больше энергия налетающей частицы, тем меньше толщина потенциального барьера, тем больше становится вероятность преодолеть такой барьер туннельным эффектом. Оценки показывают, что вероятность таких столкновений имеет заметную величину. 2. При достаточно высокой температуре оголенные ядра дейтерия имеют максвелловское распределение по скоростям. Ядра, у которых скорости хаотического движения во много раз больше их средних скоростей в распределении Максвелла, обладают настолько большой энергией, что при их столкновении может произойти синтез ядер атомов гелия (рис. 4.16.1). Из рис. 4.16.1 видно, что, хотя количество таких ядер и невелико, они в объеме все-таки существуют.
323
f (υ )
υ н.в.
υ
υ
Рис. 4.16.1. Распределение Максвелла по скоростям движения Таким образом, в плазме, состоящей из оголенных ядер и электронов при температуре 107 К, всегда имеются частицы с энергией, достаточной для возбуждения термоядерной реакции. Вот почему температура, при которой могут реально происходить термоядерные реакции синтеза, находится в интервале 107 − 108 К . Итак, для протекания термоядерной реакции синтеза легких ядер в объеме необходима температура порядка 107 К и наличие условий, при которых количество энергии, выделяющейся при термоядерной реакции, превышало бы возможные энергетические потери. Если же энергетические потери будут превышать выделяющуюся энергию, то температура плазмы будет постепенно понижаться, и реакция синтеза в конце концов прекратится. В настоящее время в земных условиях такая температура может быть создана либо при помощи взрыва атомной бомбы, либо с помощью магнитных ловушек, которые позволяют сконцентрировать плазму в малом объеме, отделив ее при этом от стенки экспериментальной установки и тем самым уменьшив различные виды потери энергии, возникающие при контакте горячей плазмы со стенкой. Но работа на термоядерных реакторах как в стационарном, так и в импульсном режимах при генерации избыточной энергии в настоящее время не привела пока к положительным результатам. Физической причиной возникающих трудностей является наличие в объеме горячей плазмы множества мелкомасштабных неустойчивостей, нарушающих стабильную работу реактора.
324
4.16.2. Термоядерные источники энергии Солнца Спектроскопические исследования показывают, что в состав Солнца входят протоны (80%), ядра атомов гелия (19%) и ядра атомов углерода, азота, кислорода – всего 1%. Поэтому главное значение для поддержания постоянства излучения Солнца имеют реакции синтеза ядер водорода. В настоящее время принято, что на Солнце осуществляются два цикла синтеза легких ядер: а. протонно-протонный цикл
1. 11H +11H →12H + +1e + ve + 0,421 МэВ , 1 1 2 1 H +1H →1 H + +1e + ve 10
t = 1,4 ⋅ 10 2.
+1 e + −1e →
+1 e + −1e →
+ 0,421 МэВ ,
лет, t – средняя продолжительность реакции.
γ + 1,02 МэВ ,
γ + 1,02 МэВ , t = 0 .
3. 12 H +11H → 23He + γ + 5,49 МэВ , 2 1 3 1 H +1 H → 2 He +
4.
γ + 5,49 МэВ , t = 5,7 с .
3 3 4 1 2 He+ 2 He→ 2 He + 21 H
+ 12,85 МэВ , t = 1⋅ 106 лет.
Следовательно, полная энергия, выделяющаяся за 1 цикл, Q = 26,71 МэВ. Тогда все реакции синтеза протонно-протонного цикла можно сокращенно записать в виде одной обобщенной: 411H →24He + 2+1 e + 2ve + 2 γ + Q . б. углеродно-азотный цикл Этот цикл достаточно интенсивно протекает лишь при более высокой температуре, чем протонно-протонный. Поэтому условия для его осуществления в недрах Солнца менее благоприятные. Углеродноазотный цикл состоит из шести последовательных циклов, причем каждый из них имеет свою продолжительность. 1. 126C +11H →137N + γ + 1,95 МэВ , t = 1,3 ⋅ 10 лет. 2.
13 13 7 N → 6 C + +1e + ve
3.
13 1 14 6 C +1H → 7 N
4.
14 1 15 7 N +1H → 8 O +
5.
15 15 8 O → 7 N + +1e + ve
+ 2,2 МэВ , t = 7 мин.
+ γ + 7,54 МэВ , t = 2,7 ⋅ 106 лет.
γ + 7,35 МэВ , t = 3,3 ⋅ 108 лет. + 2,71 МэВ , t = 82 c.
325 15 1 12 4 7 N +1H → 6 C + 2 He + 4,96
5
6. МэВ , t = 1,1 ⋅ 10 лет. В итоге при сокращенной форме записи имеем: 411H → 24He + 2 +1 e + 2ve + 3γ + 26,73 МэВ . Ядро
12 6C
является реагентом, оно синтезирует ядро 24 He из четы-
рех протонов. Так как температура в ядре Солнца порядка 107 К, то в нем преимущественно протекает протонно-протонный цикл. При более высокой температуре, по-видимому, будет преобладать углеродноазотный цикл. Стало быть, для поддержания равновесного состояния возникают условия, при которых энергетические потери в окружающую среду равны энергии, выделившейся в результате реакций синтеза. В 1967 г. немецкому ученому Хансу Бете была присуждена Нобелевская премия за его вклад в теорию ядерных реакций, особенно за открытия, относящиеся к источникам энергии звезд. Из приведенных выше термоядерных реакций синтеза следует, что одним из побочных продуктов реакций являются нейтрино. Наибольший поток нейтрино будет вылетать из тех объемов ядра Солнца, где наиболее интенсивно протекают термоядерные реакции, т.е. из областей ядра Солнца с наиболее высокой температурой. Следовательно, изучая распределение нейтрино в пространстве по направлениям, можно определить размеры ядра Солнца, интенсивность термоядерных реакций и объем, в пределах которого они протекают. Разогретая плазма в ядре Солнца удерживается в сжатом состоянии внешними гравитационными силами, действующими снаружи на ядро Солнца. Этим обеспечивается естественное течение самоподдерживающихся термоядерных реакций. В результате протекания термоядерных реакций синтеза содержание протонов в Солнце постепенно уменьшается, и после того, как весь водород выгорит, термоядерные реакции прекратятся, излучение Солнца постепенно будет затухать. Но процесс этот весьма и весьма длительный, он займет многие миллиарды лет.
326
Приложение
Рассмотрим многоэлектронный атом, в электронной оболочке которого имеется лишь один валентный электрон. Для наглядности такой атом можно представить состоящим из остова, т.е. ядра с электрическим зарядом Ze > 0 и электронной оболочки с зарядом (Z - 1)e < 0 , и валентного электрона с зарядом e < 0 . Следовательно, эффективный электрический заряд остова атома q* = e > 0 . Так как электронная оболочка атома не обладает сферической симметрией, то электрическое поле остова атома должно отличаться от кулоновского, оно не обладает сферической симметрией. В результате вырождение состояний по орбитальному квантовому числу λ теперь снимаются, каждому значению λ соответствует свое значение полной энергии электрона. Движущийся вокруг остова атома валентный электрон создает орбитальный ток I e (рис. 1). Z
ρ Bλ ρ pmλ Iλ q* > 0
ρ
Rλ
υ( + e) e0 Tλ
Tλ - период обращения валентного электрона вокруг остова, Rλ радиус мгновенной окружности, по которой движется валентный ρ электрон; k - единичный вектор, направленный вдоль оси oz . Мгновенный орбитальный ток создает магнитное поле, вектор индукции которого на оси симметрии
ρ ρ Bλ = Bλk
ρ
На рис. 1 υ ( − e ) - вектор мгновенной скорости валентного электро-
ρ
на, υ ( + e ) -вектор скорости воображаемого положительного заряда, направление движения которого совпадает с направлением мгновенного тока I λ , υ ( − e ) = υ ( + e ) .
ρ
Но кроме мгновенного орбитального магнитного момента pmλ у
ρ
электрона всегда имеется собственный магнитный момент pms , возникающий в результате вращения электрона вокруг оси симметрии с ρ угловой скоростью ω s (рис. 2).
ρ
Rs
ωs
ρ
ωs
Рис. 2
328
По определению, собственный магнитный момент электрона
pms = I s ss где
Is =
e , Ts
Ts - период вращения электрона вокруг оси симметрии, Rs - радиус электрона. Тогда
pms =
e πRs2 Ts
Собственный момент импульса электрона
Ls = Iω s
где 2
mR I= e s , 2
ω
I - момент инерции электрона относительно собственной оси
вращения, ω s - угловая скорость вращения электрона вокруг собственной оси вращения. Следовательно, отношение собственного магнитного момента к собственному моменту импульса есть −1
⎛ m R 2 2π ⎞ pms e e ⎟ = = πRs2 ⎜⎜ e s = gs ⎟ Ls Ts T m 2 s e ⎝ ⎠ или
pms = g s Ls
g s - гиромагнитное отношение электрона.
329
Движение валентного электрона по воображаемой орбите можно представить в виде движения по мгновенной круговой траектории, результатом которого является возникновение мгновенного кругового тока. Вектор индукции магнитного поля такого кругового тока
ρ µ0 pρmλ Bλ = 2π r 3 Но так как
pmλ =
e πR 2 λ Tλ
Lλ = me Re2
то после подстановки соответствующих значений имеем
pmλ e = = gλ Lλ 2me
gλ =
e - гиромагнитное отншение при орбитальном движении 2me
электрона вокруг остова атома. Тогда
pmλ = g λ Lλ
Из сравнения (2) и (3) находим
g s = 2 gλ
Наличие у электрона собственного магнитного момента приводит к изменению его полной энергии. Для оценки такого изменения введем собственную для электрона систему отсчета. В этой системе отсчета остов атома вращается вокруг электрона. В результате теперь элек-
330
трон находится в магнитном поле, созданном движущимся эффективным зарядом q* остова(рис. 3). z = z1
q* > 0 ρ
υq
e