HÜTTE Das Ingenieurwissen
HÜTTE Herausgeber: Akademischer Verein Hütte e.V., Berlin
Das Ingenieurwissen 33., aktualisierte Auflage Herausgegeben von
Horst Czichos Manfred Hennecke Mit 1811 Abbildungen und 340 Tabellen
123
Professor Dr.-Ing. Dr. h. c. Horst Czichos Technische Fachhochschule Berlin Luxemburger Straße 10 13353 Berlin
[email protected] Professor Dr. rer. nat. Manfred Hennecke Präsident BAM Bundesanstalt für Materialforschung und -prüfung Unter den Eichen 87 12200 Berlin
[email protected] Wissenschaftlicher Ausschuss des Akademischen Vereins Hütte e.V., Berlin Dr.-Ing. Karl Feutlinske, Vorsitzender Carmerstraße 12 10623 Berlin E-Mail:
[email protected] Homepage, mit Übersicht zu den HÜTTE-Handbüchern: http://www.av-huette.de
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
ISBN 978-3-540-71851-2 Springer Berlin Heidelberg New York ISBN 978-3-540-20325-4 32. Auflage Springer Berlin Heidelberg New York Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg 1989, 1995, 2000, 2004, 2008 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Sollte in diesem Werk direkt oder indirekt auf Gesetze, Vorschriften oder Richtlinien (z. B. DIN, VDI, VDE) Bezug genommen oder aus ihnen zitiert worden sein, so kann der Verlag keine Gewähr für die Richtigkeit, Vollständigkeit oder Aktualität übernehmen. Es empfiehlt sich, gegebenenfalls für die eigenen Arbeiten die vollständigen Vorschriften oder Richtlinien in der jeweils gültigen Fassung hinzuziehen. Satz und Herstellung: LE-TEX Jelonek, Schmidt & Vöckler GbR, Leipzig Einbandgestaltung: eStudio Calamar S.L., F. Steinen-Broo, Pau/Girona, Spanien Gedruckt auf säurefreiem Papier
7/3180/YL – 5 4 3 2 1 0
Mitarbeiter
Joachim AHRENDTS, Professor Dr.-Ing., Institut für Thermodynamik, HelmutSchmidt-Universität/Universität der Bundeswehr Hamburg (F) Torsten BAHKE, Dr.-Ing., Direktor des Deutschen Instituts für Normung e.V. (DIN), Berlin (O) Wolfgang BEITZ† , Professor Dr.-Ing., Institut für Maschinenkonstruktion, Technische Universität Berlin (K1–K5) Jürgen BEYERER, Professor Dr.-Ing., Leiter des Fraunhofer-Instituts für Informations- und Datenverarbeitung (IITB), Karlsruhe; Institut für Technische Informatik, Universität Karlsruhe; (K6) Carolin BIRK, Dr. rer. nat., Institut für Statik und Dynamik der Tragwerke, Technische Universität Dresden (A1–A37) Hartmut BUCK, Fraunhofer-Institut für Arbeitswissenschaft und Organisation (IAO), Stuttgart (N5) Karl BÜHLER, Professor Dr.-Ing. habil., Fachbereich Maschinenbau und Verfahrenstechnik, Fachhochschule Offenburg (E7–E10) Horst CLAUSERT, Professor Dr.-Ing., Fachbereich Elektrotechnik und Informationstechnik, Technische Universität Darmstadt (G9–G15) Horst CZICHOS, Professor Dr.-Ing. Dr. h. c., Fachbereich Elektrotechnik und Feinwerktechnik, Technische Fachhochschule Berlin (D) Frank ENGELMANN, Dr.-Ing., Fakultät für Maschinenbau, Otto-von-GuerickeUniversität Magdeburg (K1–K5) Gerhard FISCHERAUER, Professor Dr.-Ing., Fakultät für Angewandte Naturwissenschaften, Universität Bayreuth (H) Thomas FLIK, Dr.-Ing., Institut für Technische Informatik und Mikroelektronik, Technische Universität Berlin (J6–J8) Walter FRENZ, Professor Dr. jur., Fachbereich Georessourcen und Materialtechnik, Rheinisch-Westfälische Technische Universität, Aachen (P) Karl-Heinrich GROTE, Professor Dr.-Ing., Fakultät für Maschinenbau, Otto-vonGuericke-Universität Magdeburg (K1–K5) Manfred HENNECKE, Professor Dr. rer. nat., Präsident der Bundesanstalt für Materialforschung und -prüfung, Berlin (C)
VI
Mitarbeiter
Karl HOFFMANN, Professor Dr.-Ing., Fachbereich Elektrotechnik und Informationstechnik, Technische Universität Darmstadt (G19–G27) Stephan KABELAC, Professor Dr.-Ing., Institut für Thermodynamik, HelmutSchmidt-Universität/Universität der Bundeswehr, Hamburg (F) Frank LEY, Professor Dr.-Ing., Fachbereich Informations- und Elektrotechnik, Fachhochschule Dortmund (I14) Jens LEYH, Fraunhofer-Institut für Arbeitswissenschaft und Organisation (IAO), Stuttgart (N6–N11) Hans LIEBIG, Professor Dr.-Ing., Institut für Technische Informatik und Mikroelektronik, Technische Universität Berlin (J1–J5) Wolfgang MATHIS, Professor Dr.-Ing., Fachgebiet Theoretische Elektrotechnik, Universität Hannover (G19–G27) Hanspeter MÖSSENBÖCK, Professor Dr. Dr. h. c., Institut für Systemsoftware, Johannes Kepler Universität Linz (J9–J13) Heinz NIEDRIG, Professor Dr.-Ing., Optisches Institut, Technische Universität Berlin (B) Peter OHLHAUSEN, Dr.-Ing., Fraunhofer-Institut für Arbeitswissenschaft und Organisation (IAO), Stuttgart (N6–N11) Wilhelm OPPERMANN, Professor Dr. rer. nat., Institut für Physikalische Chemie, Technische Universität Clausthal (C) Bodo PLEWINSKY, Privatdozent Dr. rer. nat., Berlin (C) Wulff PLINKE, Professor Dr. rer. oec., European School of Management and Technology, Berlin; Wirtschaftswissenschaftliche Fakultät, Humboldt-Universität zu Berlin, (M) Peter RECHENBERG, Professor Dr.-Ing., Institut für Pervasive Computing, Johannes Kepler Universität Linz (J1–J2, J9–J13) Mario RESE, Professor Dr. rer. pol., Fakultät für Wirtschaftswissenschaft, RuhrUniversität Bochum (M) Hans Albert RICHARD, Professor Dr.-Ing., Fakultät für Maschinenbau, Universität Paderborn (E1–E6) Michael RICHTER, Fraunhofer-Institut für Arbeitswissenschaft und Organisation (IAO), Stuttgart (N1–N4) Peter RUGE, Professor Dr.-Ing. habil., Institut für Statik und Dynamik der Tragwerke, Technische Universität Dresden (A1–A37) Jürgen SCHADE, Dr. jur., Präsident des Deutsches Patent- und Markenamtes, München (Q) Franz-Georg SIMON, Dr. rer. nat., Bundesanstalt für Materialforschung und -prüfung, Berlin (D) Birgit SKROTZKI, Dr.-Ing., Bundesanstalt für Materialforschung und -prüfung, Berlin (D) Dieter SPATH, Professor Dr.-Ing. Dr.-Ing. E. h., Leiter des Fraunhofer-Instituts für Arbeitswissenschaft und Organisation (IAO), Stuttgart; Institut für Arbeitswissenschaft und Technologiemanagement, Universität Stuttgart; (N)
Mitarbeiter
Günter SPUR, Professor Dr.-Ing. Dr. h. c. mult. Dr.-Ing. E. h., Institut für Werkzeugmaschinen und Fertigungstechnik, Technische Universität Berlin (L) Martin STERNBERG, Professor Dr.-Ing., Fachbereich Elektrotechnik und Informatik, Fachhochschule Bochum (B) Max SYRBE, Professor Dr. rer. nat. Dr.-Ing. E. h., Altpräsident der Fraunhofer Gesellschaft, Karlsruhe; Institut für Technische Informatik, Universität Karlsruhe (K6) Hans-Rolf TRÄNKLER, Professor Dr.-Ing., Institut für Mess- und Automatisierungstechnik, Universität der Bundeswehr München (H) Heinz UNBEHAUEN, Professor Dr.-Ing., Lehrstuhl für Elektrische Steuerung und Regelung; Ruhr-Universität Bochum (I1–I13) Joachim WARSCHAT, Professor Dr.-Ing. habil., Fraunhofer-Institut für Arbeitswissenschaft und Organisation (IAO), Stuttgart (N6–N11) Manfred WERMUTH, Professor Dr. rer. nat., Institut für Verkehr und Stadtbauwesen, Technische Universität Braunschweig (A38–A44) Gunther WIESEMANN; Professor Dr.-Ing., Fachbereiche Elektrotechnik und Informatik, Fachhochschule Braunschweig/Wolfenbüttel (G1–G8, G25–G27) Volker WINTERFELDT, Dr. rer. nat., Vorsitzender Richter am Bundespatentgericht, München (Q) Jens WITTENBURG, Professor Dr.-Ing. Dr.-Ing. h. c., Institut für Technische Mechanik Universität Karlsruhe (E1–E6) Jürgen ZIEREP, Professor Dr.-Ing. habil., Dr. tech. E. h., Institut für Strömungslehre, Universität Karlsruhe (E7–E10) Helmut ZÜRNECK, Professor Dr.-Ing., Fachbereich Elektrotechnik und Informationstechnik, Technische Universität Darmstadt (G16–G18) Die Angaben in Klammern benennen die von dem betreffenden Autor erstellten Kapitel. Die Professorentitel der Autoren wurden aufgrund der unterschiedlichen Regelungen in den Bundesländern undifferenziert angegeben.
VII
Geleitwort des Akademischen Vereins Hütte zur Jubiläumsausgabe
Der Akademische Verein Hütte e.V. Berlin begrüßt zum Jubiläum „150 Jahre HÜTTE“ das Erscheinen dieser Jubiläumsausgabe und wünscht als Namens- und Herausgeber der HÜTTE-Handbücher der 33. Auflage eine positive Resonanz bei seinen Nutzern, sowohl im Studium wie auch im Beruf. Den stetig verändernden Anforderungen wird sich der Ingenieur auch in der heutigen Zeit stellen können und ihnen genügen, wenn er die Grundlagen der Ingenieurwissenschaften beherrscht oder zumindest weiß, wo sie stehen – in der HÜTTE. 150 Jahre HÜTTE-Handbuch bedeuten die Weiterentwicklung unseres Erstlingswerks von 1857 „Des Ingenieurs Taschenbuch“, seine kontinuierliche Verbesserung im Laufe der Auflagen zum umfassenden Standard-Nachschlagewerk für alle Ingenieurwissenschaften, die stete Aktualisierung seines Inhaltes sowie auch die Arbeiten zu den Übersetzungen in über 10 Sprachen und seine Verbreitung in vielen Ländern der Erde. Die HÜTTE ist damit heute bestimmt das älteste ständig aktualisierte technische Nachschlagewerk der Welt. Die Grundlage hierfür wurde vom Verein Hütte schon gleich nach seiner Gründung im Jahre 1846 gelegt. Der erste Schritt dazu war die Bildung einer Zeichnungskommission zur Herausgabe nützlicher und ständig erweiterter Sammlungen von Konstruktionszeichnungen ausgeführter technischer Anlagen. Wesentlich wurde damals auch an der Erarbeitung technischer Vorschriften für die preußischen Staatsbahnen mitgewirkt und es entstanden die „Preußischen Normalien“. 1856 ging der VDI, der Verein Deutscher Ingenieure, aus der Hütte hervor. Eine Kommission der Hütte stellte in diesen ersten Jahren die Vorträge der Lehrer des damaligen Königlichen Gewerbeinstituts, des Vorgängers der heutigen Technischen Universität Berlin, zusammen; daraus entstand 1857 die 1. Auflage der HÜTTE. Seit diesen Anfängen ist der heute noch in Berlin und seit 1948 auch in Karlsruhe existierende Akademische Verein Hütte mit der Technik-Geschichte stets eng verbunden gewesen. Die Förderung des studentischen Nachwuchses ist unser vorrangiges Satzungsziel. Das Erreichen eines studentenfreundlichen Preises auch für das vorliegende HÜTTE-Handbuch war daher wesentlich für unsere Bemühungen. Es konnten Sponsoren wie die TÜV Rheinland Group, die Thyssen Krupp AG, die Wirtschaftsvereinigung Stahl und der TÜV Österreich gewonnen werden, die mit ihrer Unterstützung dazu beitragen, dass das aktuelle Handbuch „HÜTTE – Das Ingenieurwissen“ auch wieder zu einem für Studenten attraktiven Preis erscheinen kann.
X
Geleitwort des Akademischen Vereins Hütte zur Jubiläumsausgabe
Der Akademische Verein Hütte bedankt sich bei den Bandherausgebern und bei den Autoren aus über 20 Hochschulen und Instituten für ihre geleistete Arbeit, die Verbesserung und die Aktualisierung der HÜTTE. Besonderer Dank gilt auch den Mitarbeitern des Springer-Verlags für die ausgezeichnete Qualität und Ausstattung dieses Jubiläumswerks. Die HÜTTE wird auch über ihr Jubiläum hinaus weiterentwickelt werden, dazu ist ihre ständige Aktualisierung erforderlich. Neben dem Fachwissen der Autoren und dem ehrenamtlichen Engagement unserer Mitglieder bilden Verbesserungsvorschläge unserer Leser hierzu eine wesentliche Grundlage. Wir bitten Sie daher um ständige Rückäußerungen an unsere vorn im Buch abgedruckte Adresse, hierfür möchten wir uns an dieser Stelle schon im Voraus ganz besonders bedanken. Berlin, im September 2007
Wissenschaftlicher Ausschuss des Akademischen Vereins Hütte e. V. Berlin Dr. Karl Feutlinske
Geleitworte
Ohne Übertreibung darf die HÜTTE als Standardwerk gelten, da sie – in ihrer inzwischen 150-jährigen Tradition – Generationen von jungen ebenso wie erfahrenen Ingenieuren in Ausbildung und Alltag begleitet hat. So vereint das Buch nicht nur das Ingenieurwissen, wie der Titel selbstbewusst zum Ausdruck bringt, sondern ist seinerseits ein Teil der Technikgeschichte und des technischen Fortschritts geworden. Auch die aktuelle Auflage der HÜTTE unterstützen wir als TÜV Rheinland Group, denn wir sind jederzeit in unserem Schaffen bestrebt, für Mensch und Umwelt gleichermaßen die Qualität und die Sicherheit technischer Lösungen zu gewährleisten. Das ist unser Anspruch, dem wir nur durch hochqualifizierte Mitarbeiterinnen und Mitarbeiter gerecht werden können. So wiederum profitieren auch wir als Unternehmen ganz konkret vom umfassenden Wissen, das die HÜTTE pflegt und stets aktuell bereithält. Die Geschichte des Buches, das Sie in der Hand halten, ist eng mit der Historie des Vereins Deutscher Ingenieure e.V. verbunden, zu dessen Präsident ich 2007 gewählt wurde. HÜTTE und VDI gehen auf die gleichen Wurzeln zurück: den Akademischen Verein Hütte e.V. Berlin. Der VDI trägt mit seiner technisch-wissenschaftlichen Arbeit sowie seinen Weiterbildungen dazu bei, den ingenieurwissenschaftlichen Nachwuchs zu fördern und den Stellenwert der Ingenieure in der Gesellschaft zu erhöhen. Eine maßgebliche Herausforderung der Zukunft ist es, den Technikstandort Deutschland durch die Behebung des Ingenieurmangels sowie mehr technikbezogenen Unterricht an allgemeinbildenden Schulen zu stärken. Vor diesem Hintergrund bedarf es künftig umso mehr eines Werkes wie dem HÜTTE-Handbuch, das in einzigartiger Form Wissen zu bündeln und zu vermitteln weiß. Köln, im September 2007
Prof. Dr. Bruno O. Braun Vorstandsvorsitzender der TÜV Rheinland Group
Technisches Know-how in komprimierter Form, das ist im Standardwerk „HÜTTE“ in der 33. Auflage up to date gegeben. Im Laufe der Jahrzehnte hat das technische Wissen beträchtlich zugenommen, so dass auch die „HÜTTE“ zusehends umfangreicher wurde. Das Sammeln von Wissen und Erfahrung ist auch eines der Aufgaben des TÜV AUSTRIA, der 1872 gegründet wurde, um den verheerenden Dampfkessel-
XII
Geleitworte
Explosionen mit enormen Personen- und Sachschaden ein Ende zu setzen. Gerade die Sammlung von Wissen und Erkenntnissen hat bei der Überwachungstätigkeit, die alsbald zur Eindämmung der katastrophalen Explosionen geführt hat, einen entscheidenden Faktor gebildet. Heute ist für die Experten im TÜV AUSTRIA die „HÜTTE“ ein Standardwerk, das aus dem Alltag kaum wegzudenken ist. Wien, im September 2007
Dipl.-Ing. Dr. Hugo Eberhardt Vorstandsvorsitzender TÜV AUSTRIA HOLDING AG
Vorwort
Die 33. Auflage der „HÜTTE“ ist eine Jubiläumsausgabe. 150 Jahre hat die HÜTTE das Grundlagenwissen der Ingenieure bereitgestellt und die Zeiten der stürmischen Entwicklung der Natur- und Ingenieurwissenschaften begleitet: von den Entwicklungen des Maschinenbaus und der Produktionstechnik, der Elektrotechnik, Elektronik und Computertechnik bis zur heutigen Technischen Informatik, Mikrosystemtechnik und der interdisziplinären Mechatronik. Die HÜTTE erschien erstmalig im Jahr 1857 als „Des Ingenieurs Taschenbuch“ mit folgender Zielsetzung: Grundlage für das Studium und Unterstützung der praktischen Ingenieurarbeit durch eine geschickte Verbindung wissenschaftlicher Grundlagen mit praktischen Erfahrungen, die starre Rezepte ebenso wie weitschweifige Theorie zu vermeiden weiß. Die Erstauflage von 1857 enthielt in einem Band drei Teile, Mathematik und Mechanik, Maschinenbau und Technologie sowie Bauwissenschaft. Bereits 1864 erschien die 5. Auflage, 1875 die 10. und 1908 die 20. Auflage. Mit der 25. Auflage im Jahr 1925 betrug die Gesamtauflagenhöhe mehr als 1/3 Million Exemplare. Die bis heute gültige Konzeption dieses Standardwerks der Ingenieurwissenschaften wurde zum 100-jährigen Jubiläum der HÜTTE im Vorwort der 28. Auflage von 1955 wie folgt dargestellt: Die HÜTTE bringt mit Grundlagen für Studium und Ingenieurarbeit eine Zusammenfassung des grundsätzlich Wichtigen aus möglichst allen technischen Fachgebieten sowohl für den praktisch als auch für den wissenschaftlich tätigen Ingenieur. Mit der 31. Auflage erhielt die HÜTTE im Jahr 2000 eine neue Struktur – inhaltlich orientiert am Stand von Wissenschaft und Technik im 21. Jahrhundert und den Studienplänen der Technischen Universitäten und Fachhochschulen. Die Jubiläumsauflage zeichnet sich durch eine Reihe von Erweiterungen und Neuerungen aus: Aufnahme des neuen Kapitels Management, gegliedert in Personalmanagement, Qualitätsmanagement, Projektmanagement Fachliche Ergänzungen, Beispiele: Biochemisch relevante Makromoleküle, Material und Umwelt, Recycling, Mikrosensorik, Binäre Steuerungstechnik, Software Engineering, Mensch-Maschine-Relationen und Antropotechnik
XIV
Vorwort
Neufassung der Kapitel Normung, Recht, Patente unter Berücksichtigung neuer Entwicklungen im europäischen Rechts- und Wirtschaftsraum. Das Ingenieurwissen ist gegliedert in fachübergreifende Themenfelder, um das für die Anwendung in der Technik besonders wichtige interdisziplinäre Systemdenken zu betonen:
Mathematisch-naturwissenschaftliche Grundlagen Technologische Grundlagen Grundlagen für Produkte und Dienstleistungen Ökonomisch-rechtliche Grundlagen.
Die 33. Auflage der HÜTTE ist wiederum das Werk einer guten Zusammenarbeit der langjährig bewährten und der neuen Autoren mit den Herausgebern. Unser herzlicher Dank gilt allen Kolleginnen und Kollegen, die durch ihre Beiträge das Ingenieurwissen aktualisiert und erweitert haben sowie Dr. Angelika Recknagel für die sachkundige Mitarbeit bei der technisch-wissenschaftlichen Koordinierung. Den Mitarbeiterinnen und Mitarbeitern des Springer-Verlages und der Herstellung sei für die redaktionelle Bearbeitung und dem Verlag für die vorzügliche Ausstattung des Buches im neuen Design der internationalen Springer Handbooks gedankt. Berlin, im August 2007
Horst Czichos Manfred Hennecke
___________________
V o r r e d e der 1. Auflage von 1857 Unter den Studirenden des königlichen Gewerbe-Instituts hat sich schon längst das Bedürfniß herausgestellt ein Werk zu besitzen, welches in übersichtlicher Weise Formeln, Tabellen und Resultate aus den Vorträgen der Herren Lehrer zusammenfaßt, und ihnen nicht allein bei den auf dem Gewerbe-Institut angestellten Uebungen im Entwerfen und Berechnen, sondern besonders in ihrer künftigen practischen Lebensstellung bei dem Projectiren und Veranschlagen von Maschinen und baulichen Anlagen als ein sicher und bequem zu gebrauchendes Handbuch dienen und das zeitraubende Nachschlagen in voluminösen Heften ersparen kann. Der schon seit 1846 unter den Studirenden des Gewerbe-Instituts bestehende wissenschaftliche und gesellige Verein, die Hütte, der durch seine Herausgabe technischer Zeichnungen bereits einer größeren Zahl von Technikern nützlich geworden ist, suchte diesem Bedürfnis dadurch abzuhelfen, daß er eine Vereins-Commission mit der Abfassung des vorliegenden Werks: des Ingenieurs Taschenbuch, beauftragte. Die Commission hat sich bestrebt, in diesem Werke die sämmtlichen Hauptwissenschaften des Ingenieurs, besonders mit Rücksicht auf ihre Anwendung in der Praxis, zu behandeln, und war dabei bemüht eine übersichtliche Anordnung des Ganzen, gedrängte Kürze und Vollständigkeit des Inhalts möglichst mit einander zu verbinden. Sie rechnet auf die Nachsicht des technischen Publicums, wenn ihr die Lösung dieser vielleicht zu schwierigen Aufgabe nicht überall in gleicher Weise geglückt ist; sie würde es gerne sehen und zu schätzen wissen, wenn ihr von Männern der Technik und andern Sachverständigen Rath ertheilt würde und ihr Verbesserungsvorschläge zugingen, welche bei einer zweiten Auflage benutzt werden könnten. Des Ingenieurs Taschenbuch enthält, seinem Zweck entsprechend, nur Formeln, Tabellen, empirische und theoretische Resultate aus dem Gebiet der elementaren und höheren Mathematik, der Mechanik, des Maschinenbaues, der Bauwissenschaft, der mechanischen und chemischen Technologie. Man erwarte in ihm nicht Entwickelungen von Lehrsätzen und Theorien, sondern nur die Ergebnisse derselben, nicht Vorführung von Constructionen zur Auswahl, sondern nur die Mittel zum Projectiren, nicht Berechnungen specieller Fälle, sondern nur die erforderlichen Angaben und Formeln, dieselben aufzuführen. Die Bibliothek der technischen Deputation des Ministeriums für Handel, Gewerbe und öffentliche Arbeiten, so wie die der Hütte, die Vorträge der Herren Lehrer des Gewerbe – Instituts, von Sachmännern erbetene Mittheilungen, auch eigene Erfahrungen, lieferten der Commission das Material zu ihrer Arbeit. Da sich bei der Ausdehnung des zu behandelnden Stoffs ein größeres Volumen des Werks voraussetzen ließ, als zum bequemen Gebrauch desselben als Taschenbuch rathsam erschien, so ist es in drei Theile getheilt, von denen der erste die Mathematik und Mechanik, der zweite die Maschinenbaukunde und in einem Anhange die Eisenhüttenkunde und Gasfabrikation, der dritte die Bauwissenschaft enthält. Da jeder Theil für sich ein abgeschlossenes Ganze bildet, so ist jedem Techniker durch diese Anordnung die Gelegenheit geboten, nur den ihn interessirenden Theil zu benutzen; für die größere Zahl wird indessen der erste Theil ein nothwendiges Supplement zu jedem der beiden folgenden Theile bilden. Hinsichtlich der Anordnung des Textes wird man bemerken, daß in dem Theil für Bauwissenschaft, abweichend von den beiden ersten Theilen, eine alphabetische Ord-
XVI
V o r r e d e der 1. Auflage von 1857
nung desselben gewählt ist, welche unstreitig das Nachschlagen wesentlich erleichtert. Eine solche Anordnung auch in den beiden ersten Theilen vorzunehmen, war bei dem einen nicht zulässig, bei dem andern wegen der großen Verschiedenartigkeit des Stoffs nicht wünschenswerth und unterblieb daher. Es war dies unbeschadet der Einheit des ganzen Werks zulässig, weil, wie schon bemerkt, jeder Theil für sich abgeschlossen dasteht. Für die Maaß- und Gewichts-Angaben ist durchgängig das preußische Maaß und Gewicht zu Grunde gelegt; doch ist Bedacht genommen durch Aufnahme von Reductionstabellen jede Umwandlung von Maaßen und Gewichten leicht vornehmen zu können. Die Vademecum-Commission, Berlin, 1857 ___________________
Die erste Auflage der HÜTTE stammt aus dem Jahre 1857. Herausgegeben von dem Verein „die Hütte“ erschien „Des Ingenieurs Taschenbuch“, wie es damals hieß, in Berlin beim Verlag von Ernst & Korn, Gropius’sche Buchund Kunsthandlung. Das Vorwort nannte man damals Vorrede. Der Jubiläumsausgabe der HÜTTE ist dieses Vorwort zur 1. Auflage von 1857 im Original vorangestellt.
* „150 Jahre HÜTTE-Handbuch“
Inhaltsverzeichnis
A
Mathematik und Statistik
P. Ruge, C. Birk, M. Wermuth Mathematik P. Ruge, C. Birk 1
Mengen, Logik, Graphen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A1 A1
1.1.1 Grundbegriffe der Mengenlehre – 1.1.2 Mengenrelationen und -operationen
1.2 1.3 1.4
Verknüpfungsmerkmale spezieller Mengen . . . . . . . . . . . . . . . . . . . . Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Graphen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Zahlen, Abbildungen, Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A2 A3 A4 A5 A5
2.1.1 Zahlenmengen, Mittelwerte – 2.1.2 Potenzen, Wurzeln, Logarithmen
2.2 2.3
Stellenwertsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A6 A6
2.3.1 Grundoperationen, Koordinatendarstellung – 2.3.2 Potenzen, Wurzeln
2.4 2.5
Intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abbildungen, Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A7 A7
2.5.1 Abbildungen, Funktionen – 2.5.2 Folgen und Reihen – 2.5.3 Potenzen von Reihen
3
Matrizen und Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A10 A10
3.1.1 Bezeichnungen, spezielle Matrizen – 3.1.2 Rechenoperationen – 3.1.3 Matrixnormen
3.2 3.3
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A13 A14
3.3.1 Vektoreigenschaften – 3.3.2 Basis – 3.3.3 Inneres oder Skalarprodukt – 3.3.4 Äußeres oder Vektorprodukt – 3.3.5 Spatprodukt, Mehrfachprodukte
3.4
Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A18
3.4.1 Tensoren n-ter Stufe – 3.4.2 Tensoroperationen
4
Elementare Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1
Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Koordinaten, Basen – 4.1.2 Kartesische Koordinaten – 4.1.3 Polarkoordinaten – 4.1.4 Flächenkoordinaten – 4.1.5 Volumenkoordinaten – 4.1.6 Zylinderkoordinaten – 4.1.7 Kugelkoordinaten
A19 A19
XVIII
Inhaltsverzeichnis
4.2
Kurven, Flächen 1. und 2. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . .
A21
4.2.1 Gerade in der Ebene – 4.2.2 Ebene im Raum – 4.2.3 Gerade im Raum – 4.2.4 Kurven 2. Ordnung – 4.2.5 Flächen 2. Ordnung
4.3
Planimetrie, Stereometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 6
Projektionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebraische Funktionen einer Veränderlichen . . . . . . . . . . . . .
6.1 6.2
Sätze über Nullstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
Transzendente Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 7.2 7.3
Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hyperbolische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Höhere Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 8.2 8.3
Algebraische Funktionen 3. und 4. Ordnung . . . . . . . . . . . . . . . . . . . . Zykloiden, Spiralen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Delta-, Heaviside- und Gammafunktion . . . . . . . . . . . . . . . . . . . . . . .
9
Differenziation reeller Funktionen einer Variablen . . . . . . . . . .
9.1 9.2
Grenzwert, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ableitung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A26 A33 A35 A35 A36 A36 A36 A36 A40 A42 A42 A42 A42 A46 A46 A47
9.2.1 Funktionsdarstellung nach Taylor – 9.2.2 Grenzwerte durch Ableitungen – 9.2.3 Extrema, Wendepunkte
9.3
Fraktionale Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Integration reeller Funktionen einer Variablen . . . . . . . . . . . . .
10.1 Unbestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Bestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A52 A53 A53 A55
10.2.1 Integrationsregeln – 10.2.2 Uneigentliche Integrale
11
Differenziation reeller Funktionen mehrerer Variablen . . . . . .
11.1 Grenzwert, Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A57 A57 A58
11.2.1 Funktionsdarstellung nach Taylor – 11.2.2 Extrema
12
Integration reeller Funktionen mehrerer Variablen . . . . . . . . .
12.1 12.2 12.3 12.4 12.5 12.6 12.7
Parameterintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uneigentliche Bereichsintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dreifachintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Variablentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
Differenzialgeometrie der Kurven . . . . . . . . . . . . . . . . . . . . . . . .
13.1 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A61 A61 A62 A63 A63 A64 A65 A66 A66 A66
13.1.1 Tangente, Krümmung – 13.1.2 Hüllkurve
13.2 Räumliche Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14 15 16
Räumliche Drehungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Differenzialgeometrie gekrümmter Flächen . . . . . . . . . . . . . . . . Differenzialgeometrie im Raum . . . . . . . . . . . . . . . . . . . . . . . . . .
16.1 Basen, Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.2 Krummlinige Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
Differenziation und Integration in Feldern . . . . . . . . . . . . . . . . .
17.1 Nabla-Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A68 A69 A70 A71 A71 A72 A73 A73
Inhaltsverzeichnis
17.2 Fluss, Zirkulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.3 Integralsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
Differenziation und Integration komplexer Funktionen . . . . . .
18.1 Darstellung, Stetigkeit komplexer Funktionen . . . . . . . . . . . . . . . . . . 18.2 Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.3 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19 20 21
Konforme Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonalsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21.1 Reelle Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Komplexe Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22 23
Polynomentwicklungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integraltransformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23.1 Fourier-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23.2 Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23.3 z-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
Gewöhnliche Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . .
24.1 Einteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24.2 Geometrische Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
Lösungsverfahren für gewöhnliche Differenzialgleichungen . .
25.1 25.2 25.3 25.4 25.5 25.6 25.7 25.8 25.9
Trennung der Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Totales Differenzial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Substitution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Differenzialgleichung, konstante Koeffizienten . . . . . . . . . . . Normiertes Fundamentalsystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Green’sche Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integration durch Reihenentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . Integralgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26 27 28 29 30 31
Systeme von Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . Selbstadjungierte Differenzialgleichung . . . . . . . . . . . . . . . . . . . Klassische nichtelementare Differenzialgleichungen . . . . . . . . . Partielle Differenzialgleichungen 1. Ordnung . . . . . . . . . . . . . . . Partielle Differenzialgleichungen 2. Ordnung . . . . . . . . . . . . . . . Lösungen partieller Differenzialgleichungen . . . . . . . . . . . . . . .
31.1 Spezielle Lösungen der Wellen- und Potenzialgleichung . . . . . . . . . . 31.2 Fundamentallösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
Variationsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32.1 Funktionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2 Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.3 Lineare Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33.1 33.2 33.3 33.4
Gestaffelte Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gaußverwandte Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Überbestimmte Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Testmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
Nichtlineare Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A75 A76 A77 A77 A78 A79 A82 A84 A85 A85 A86 A88 A89 A89 A90 A92 A94 A94 A94 A95 A95 A95 A96 A96 A97 A98 A99 A100 A101 A101 A103 A104 A106 A106 A108 A108 A110 A111 A111 A115 A116 A117 A117 A118 A121 A121 A122
XIX
XX
Inhaltsverzeichnis
34.1 Fixpunktiteration, Konvergenzordnung . . . . . . . . . . . . . . . . . . . . . . . . A122 34.2 Spezielle Iterationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A123 34.3 Nichtlineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . A125 35 Matrizeneigenwertproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A126 35.1 Homogene Matrizenfunktionen, Normalformen . . . . . . . . . . . . . . . . . A126 35.2 Symmetrische Matrizenpaare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A128 35.3 Testmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A130 35.4 Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A131 36 Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A132 36.1 Nichtperiodische Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A132 36.2 Periodische Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A136 36.3 Integration durch Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A136 37 Numerische Integration von Differenzialgleichungen . . . . . . . . A139 37.1 Anfangswertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A139 37.2 Randwertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A143 37.3 Mehrgitterverfahren (Multigrid method) . . . . . . . . . . . . . . . . . . . . . . . A145
Wahrscheinlichkeitsrechnung und Statistik M. Wermuth 38
Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . A147
38.1 38.2 38.3 38.4 38.5 38.6
Zufallsexperiment und Zufallsereignis . . . . . . . . . . . . . . . . . . . . . . . . Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wahrscheinlichkeit von Zufallsereignissen . . . . . . . . . . . . . . . . . . . . . Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Unabhängigkeit von Ereignissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechenregeln für Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . .
39 39.1 39.2 39.3 39.4
A147 A147 A149 A149 A150 A150 Zufallsvariable und Wahrscheinlichkeitsverteilung . . . . . . . . . . A152 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A152 Wahrscheinlichkeits- und Verteilungsfunktion einer diskreten Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A152 Wahrscheinlichkeitsdichte- und Verteilungsfunktion einer stetigen Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A153 Kenngrößen von Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . A153
39.4.1 α-Quantil – 39.4.2 Erwartungswert einer Funktion einer Zufallsgröße – 39.4.3 Lageparameter einer Verteilung – 39.4.4 Streuungsparameter einer Verteilung
39.5 Stochastische Unabhängigkeit von Zufallsgrößen . . . . . . . . . . . . . . . . A163 39.6 Korrelation von Zufallsgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A164 40 Deskriptive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A165 40.1 Aufgaben der Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A165 40.2 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A167 40.3 Häufigkeit und Häufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . A167 40.4 Kenngrößen empirischer Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . A169 40.4.1 Lageparameter – 40.4.2 Streuungsparameter
40.5 Empirischer Korrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . A170 41 Induktive Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A170 41.1 Stichprobenauswahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A171 41.2 Stichprobenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A171 42 Statistische Schätzverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A171
Inhaltsverzeichnis
42.1 Schätzfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A171 42.2 Punktschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A171 42.3 Intervallschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A172 43 Statistische Prüfverfahren (Tests) . . . . . . . . . . . . . . . . . . . . . . . . A173 43.1 Ablauf eines Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A173 43.2 Test der Gleichheit des Erwartungswerts μ eines quantitativen Merkmals mit einem gegebenen Wert μ0 (Parametertest) . . . . . . . . . . A174 43.3 Test der Gleichheit des Anteilswerts p eines qualitativen Merkmals mit einem gegebenen Wert p0 (Parametertest) . . . . . . . . . . . . . . . . . . A175 43.4 Test der Gleichheit einer empirischen mit einer theoretischen Verteilung (Anpassungstest) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A176 43.5 Prüfen der Unabhängigkeit zweier Zufallsgrößen (Korrelationskoeffizient) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A176 44 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A177 44.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A177 44.2 Schätzwerte für α, β und σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A177 44.3 Konfidenzintervalle für die Parameter β, σ2 und μ(χ) . . . . . . . . . . . . . A177 44.4 Prüfen einer Hypothese über den Regressionskoeffizienten . . . . . . . . . A178 44.5 Beispiel zur Regressionsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . A178 Formelzeichen der Wahrscheinlichkeitsrechnung und Statistik . . . . . A179 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A180
B
Physik
H. Niedrig, M. Sternberg 0 1
Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Physikalische Größen und Einheiten . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2 1.3
Physikalische Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basisgrößen und -einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Internationale Einheitensystem, Konstanten und Einheiten . . . . .
B1 B2 B2 B2 B2
I. Teilchen und Teilchensysteme 2
Kinematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 2.2 2.3
Geradlinige Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kreisbewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gleichförmig translatorische Relativbewegung . . . . . . . . . . . . . . . . . .
B7 B7 B9 B10
2.3.1 Galilei-Transformation – 2.3.2 Lorentz-Transformation – 2.3.3 Relativistische Kinematik
2.4 2.5
Geradlinig beschleunigte Relativbewegung . . . . . . . . . . . . . . . . . . . . Rotatorische Relativbewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Kraft und Impuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 3.2
Trägheitsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kraftgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B14 B14 B15 B16 B16
3.2.1 Gewichtskraft – 3.2.2 Federkraft – 3.2.3 Reibungskräfte
3.3
Reaktionsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B18
3.3.1 Kräfte bei elastischen Verformungen – 3.3.2 Kräfte zwischen freien Körpern („innere Kräfte“)
3.4 3.5
Äquivalenzprinzip: Schwer- und Trägheitskräfte . . . . . . . . . . . . . . . . Trägheitskräfte bei Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Zentripetal- und Zentrifugalkraft – 3.5.2 Coriolis-Kraft
B20 B20
XXI
XXII
Inhaltsverzeichnis
3.6 3.7 3.8
Drehmoment und Gleichgewicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . Drehimpuls (Drall) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Drehimpulserhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Arbeit und Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 4.2 4.3 4.4 4.5
Beschleunigungsarbeit, kinetische Energie . . . . . . . . . . . . . . . . . . . . . Potenzielle Energie, Hub- und Spannungsarbeit . . . . . . . . . . . . . . . . . Energieerhaltung bei konservativen Kräften . . . . . . . . . . . . . . . . . . . . Energiesatz bei nichtkonservativen Kräften . . . . . . . . . . . . . . . . . . . . Relativistische Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 5.2
Kinematik der harmonischen Bewegung . . . . . . . . . . . . . . . . . . . . . . . Der ungedämpfte, harmonische Oszillator . . . . . . . . . . . . . . . . . . . . .
B21 B22 B23 B23 B24 B24 B26 B26 B27 B29 B29 B30
5.2.1 Mechanische harmonische Oszillatoren – 5.2.2 Schwingungsgleichung und Schwingungsenergie des harmonischen Oszillators
5.3
Freie gedämpfte Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B34
5.3.1 Periodischer Fall (Schwingfall) – 5.3.2 Aperiodischer Grenzfall – 5.3.3 Aperiodischer Fall (Kriechfall) – 5.3.4 Abklingzeit
5.4
Erzwungene Schwingungen, Resonanz . . . . . . . . . . . . . . . . . . . . . . . .
B37
5.4.1 Resonanz – 5.4.2 Leistungsaufnahme des Oszillators
5.5
Überlagerung von harmonischen Schwingungen . . . . . . . . . . . . . . . .
B40
5.5.1 Schwingungen gleicher Frequenz – 5.5.2 Schwingungen verschiedener Frequenz
5.6
Gekoppelte Oszillatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B43
5.6.1 Gekoppelte Pendel – 5.6.2 Mehrere gekoppelte Oszillatoren
5.7
Nichtlineare Oszillatoren. Chaotisches Schwingungsverhalten . . . . . .
6
Teilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B46 B48
6.1
Schwerpunkt (Massenzentrum), Impuls und Drehimpuls von Teilchensystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B49
6.1.1 Schwerpunktbewegung ohne äußere Kräfte – 6.1.2 Schwerpunktbewegung bei Einwirkung äußerer Kräfte – 6.1.3 Drehimpuls eines Teilchensystems
6.2
Energieinhalt von Teilchensystemen . . . . . . . . . . . . . . . . . . . . . . . . . .
B52
6.2.1 Energieerhaltungssatz in Teilchensystemen – 6.2.2 Bindungsenergie eines Teilchensystems
6.3
Stöße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B54
6.3.1 Zentraler elastischer Stoß – 6.3.2 Nichtzentraler elastischer Stoß – 6.3.3 Unelastischer Stoß
7
Dynamik starrer Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 7.2 7.3 7.4 7.5
Translation und Rotation eines starren Körpers . . . . . . . . . . . . . . . . . . Rotationsenergie, Trägheitsmoment . . . . . . . . . . . . . . . . . . . . . . . . . . Drehimpuls eines starren Körpers . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kreisel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vergleich Translation — Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Statistische Mechanik — Thermodynamik . . . . . . . . . . . . . . . . .
8.1 8.2 8.3 8.4 8.5
Kinetische Theorie der Gase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Temperaturskalen, Gasgesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Freiheitsgrade, Gleichverteilungssatz . . . . . . . . . . . . . . . . . . . . . . . . . Reale Gase, tiefe Temperaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Energieaustausch bei Vielteilchensystemen . . . . . . . . . . . . . . . . . . . .
B59 B59 B61 B63 B64 B65 B65 B66 B69 B72 B74 B78
8.5.1 Volumenarbeit – 8.5.2 Wärme – 8.5.3 Energieerhaltungssatz für Vielteilchensysteme
8.6
Wärmemengen bei thermodynamischen Prozessen . . . . . . . . . . . . . . . 8.6.1 Spezifische und molare Wärmekapazitäten – 8.6.2 Phasenumwandlungsenthalpien
B81
Inhaltsverzeichnis
8.7 8.8
Zustandsänderungen bei idealen Gasen . . . . . . . . . . . . . . . . . . . . . . . Kreisprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B85 B88
8.8.1 Wärmekraftmaschine – 8.8.2 Kältemaschine und Wärmepumpe
8.9
Ablaufrichtung physikalischer Prozesse (Entropie) . . . . . . . . . . . . . . .
9
Transporterscheinungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 9.2 9.3 9.4
Stoßquerschnitt, mittlere freie Weglänge . . . . . . . . . . . . . . . . . . . . . . Molekulardiffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wärmeleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Innere Reibung: Viskosität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Hydro- und Aerodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1 Strömungen idealer Flüssigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Strömungen realer Flüssigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B91 B95 B95 B96 B97 B99 B103 B104 B108
II. Wechselwirkungen und Felder 11
Gravitationswechselwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B111
11.1 11.2 11.3 11.4 11.5
Der Feldbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Planetenbewegung: Kepler-Gesetze . . . . . . . . . . . . . . . . . . . . . . . . . . Newton’sches Gravitationsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Gravitationsfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Satellitenbahnen im Zentralfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Elektrische Wechselwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1 12.2 12.3 12.4 12.5 12.6 12.7 12.8 12.9
Elektrische Ladung, Coulomb’sches Gesetz . . . . . . . . . . . . . . . . . . . . Das elektrostatische Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elektrisches Potenzial, elektrische Spannung . . . . . . . . . . . . . . . . . . . Quantisierung der elektrischen Ladung . . . . . . . . . . . . . . . . . . . . . . . . Energieaufnahme im elektrischen Feld . . . . . . . . . . . . . . . . . . . . . . . . Elektrischer Strom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elektrische Leiter im elektrostatischen Feld, Influenz . . . . . . . . . . . . . Kapazität leitender Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nichtleitende Materie im elektrischen Feld, elektrische Polarisation . .
13
Magnetische Wechselwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.1 13.2 13.3 13.4
Das magnetostatische Feld, stationäre Magnetfelder . . . . . . . . . . . . . . Die magnetische Kraft auf bewegte Ladungen . . . . . . . . . . . . . . . . . . Die magnetische Kraft auf stromdurchflossene Leiter . . . . . . . . . . . . . Materie im magnetischen Feld, magnetische Polarisation . . . . . . . . . .
14
Zeitveränderliche elektromagnetische Felder . . . . . . . . . . . . . . .
14.1 14.2 14.3 14.4 14.5
Zeitveränderliche magnetische Felder: Induktion . . . . . . . . . . . . . . . . Selbstinduktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Energieinhalt des Magnetfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wirkung zeitveränderlicher elektrischer Felder . . . . . . . . . . . . . . . . . . Maxwell’sche Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
Elektrische Stromkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.1 Ohm’sches Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2 Gleichstromkreise, Kirchhoff’sche Sätze . . . . . . . . . . . . . . . . . . . . . . 15.3 Wechselstromkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 Wechselstromarbeit – 15.3.2 Transformator – 15.3.3 Scheinwiderstand von R, L und C
B111 B111 B112 B113 B115 B118 B118 B119 B124 B126 B127 B129 B130 B132 B134 B140 B140 B143 B147 B149 B156 B156 B160 B161 B161 B162 B163 B164 B165 B166
XXIII
XXIV
Inhaltsverzeichnis
15.4 Elektromagnetische Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . B170 15.4.1 Freie, gedämpfte elektromagnetische Schwingungen – 15.4.2 Erzwungene elektromagnetische Schwingungen, Resonanzkreise – 15.4.3 Selbsterregung elektromagnetischer Schwingungen durch Rückkopplung
16 Transport elektrischer Ladung: Leitungsmechanismen . . . . . . B175 16.1 Elektrische Struktur der Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B175 16.1.1 Atomstruktur – 16.1.2 Elektronen in Festkörpern
16.2 Metallische Leitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B184 16.3 Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B187 16.4 Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B191 16.4.1 Eigenleitung – 16.4.2 Störstellenleitung – 16.4.3 Hall-Effekt in Halbleitern – 16.4.4 PN-Übergänge
16.5 Elektrolytische Leitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B197 16.6 Stromleitung in Gasen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B198 16.6.1 Unselbstständige Gasentladung – 16.6.2 Selbstständige Gasentladung – 16.6.3 Der Plasmazustand
16.7 Elektrische Leitung im Hochvakuum . . . . . . . . . . . . . . . . . . . . . . . . . B202 16.7.1 Elektronenemission 16.7.2 Bewegung freier Ladungsträger im Vakuum
17
Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen . . . . . . . . . . . . . . . . . . . . . . . B208
17.1 Atomkerne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B208 17.2 Massendefekt, Kernbindungsenergie . . . . . . . . . . . . . . . . . . . . . . . . . B210 17.3 Radioaktiver Zerfall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B211 17.3.1 Alphazerfall – 17.3.2 Betazerfall
17.4 Künstliche Kernumwandlungen, Kernenergiegewinnung . . . . . . . . . . B214 17.5 Elementarteilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B219
III. Wellen und Quanten 18 Wellenausbreitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B224 18.1 Beschreibung von Wellenbewegungen, Wellengleichung . . . . . . . . . . B224 18.2 Elastische Wellen, Schallwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B229 18.3 Doppler-Effekt, Kopfwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B232 19 Elektromagnetische Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B234 19.1 Erzeugung und Ausbreitung elektromagnetischer Wellen . . . . . . . . . . B235 19.2 Elektromagnetisches Spektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B240 20 Wechselwirkung elektromagnetischer Strahlung mit Materie B242 20.1 Ausbreitung elektromagnetischer Wellen in Materie, Dispersion . . . . B242 20.2 Emission und Absorption des schwarzen Körpers, Planck’sches Strahlungsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B245 20.3 Quantisierung des Lichtes, Photonen . . . . . . . . . . . . . . . . . . . . . . . . . B249 20.4 Stationäre Energiezustände, Spektroskopie . . . . . . . . . . . . . . . . . . . . . B252 20.5 Induzierte Emission, Laser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B255 21 Reflexion und Brechung, Polarisation . . . . . . . . . . . . . . . . . . . . . B258 21.1 Reflexion, Brechung, Totalreflexion . . . . . . . . . . . . . . . . . . . . . . . . . . B258 21.2 Optische Polarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B262 22 Geometrische Optik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B264 22.1 Optische Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B264 22.2 Abbildungsfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B268 23 Interferenz und Beugung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B270
Inhaltsverzeichnis
23.1 Huygens’sches Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B270 23.2 Fraunhofer-Beugung an Spalt und Gitter . . . . . . . . . . . . . . . . . . . . . . B273 24 Wellenaspekte bei der optischen Abbildung . . . . . . . . . . . . . . . . B277 24.1 Abbe’sche Mikroskoptheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B277 24.2 Holografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B278 25 Materiewellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B280 25.1 Teilchen, Wellen, Unschärferelation . . . . . . . . . . . . . . . . . . . . . . . . . . B280 25.2 Die De-Broglie-Beziehung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B281 25.3 Die Schrödinger-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B283 25.4 Elektronenbeugung, Elektroneninterferenzen . . . . . . . . . . . . . . . . . . . B284 25.5 Elektronenoptik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B286 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B289
C
Chemie
B. Plewinsky, M. Hennecke, W. Oppermann 1
Atombau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2 1.3 1.4
Das Atommodell von Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Bohr’sche Atommodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ionisierungsenergie, Elektronenaffinität . . . . . . . . . . . . . . . . . . . . . . . Das quantenmechanische Atommodell . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Die Ψ-Funktion – 1.4.2 Die Schrödinger-Gleichung für das Wasserstoffatom – 1.4.3 Darstellung der Wasserstoff-Orbitale – 1.4.4 Mehrelektronensysteme
1.5 1.6 1.7
Besetzung der Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Darstellung der Elektronenkonfiguration . . . . . . . . . . . . . . . . . . . . . . Aufbau des Atomkerns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Das Periodensystem der Elemente . . . . . . . . . . . . . . . . . . . . . . . .
2.1 2.2
Aufbau des Periodensystems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Periodizität einiger Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Chemische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Atombindung (kovalente Bindung) . . . . . . . . . . . . . . . . . . . . . . . . . . .
C1 C1 C1 C2 C3 C5 C5 C5 C6 C6 C8 C8 C8
3.1.1 Modell nach Lewis – 3.1.2 Molekülorbitale – 3.1.3 Hybridisierung – 3.1.4 Elektronegativität
3.2
Ionenbindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C11
3.2.1 Gitterenergie – 3.2.2 Born-Haber’scher Kreisprozess – 3.2.3 Atomund Ionenradien
3.3 3.4
Metallische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Van-der-Waals’sche Bindung und Wasserstoffbrückenbindung (Nebenvalenzbindungen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Chemische Gleichungen und Stöchiometrie . . . . . . . . . . . . . . . .
4.1 4.2 4.3
Chemische Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chemische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundgesetze der Stöchiometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C12 C13 C13 C13 C13 C14
4.3.1 Gesetz von der Erhaltung der Masse – 4.3.2 Gesetz der konstanten Proportionen – 4.3.3 Gesetz der multiplen Proportionen
4.4 4.5 4.6
Stoffmenge, Avogadro-Konstante . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die molare Masse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quantitative Beschreibung von Mischphasen . . . . . . . . . . . . . . . . . . . 4.6.1 Der Massenanteil – 4.6.2 Der Stoffmengenanteil – 4.6.3 Die Konzentration (oder Stoffmengenkonzentration)
C15 C15 C15
XXV
XXVI
Inhaltsverzeichnis
4.7
Stöchiometrische Berechnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C16
4.7.1 Gravimetrische Analyse – 4.7.2 Maßanalyse – 4.7.3 Verbrennungsvorgänge
5
Zustandsformen der Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Gase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C18 C18
5.1.1 Ideale Gase – 5.1.2 Zustandsgleichung idealer Gase – 5.1.3 Spezialfälle der Zustandsgleichung idealer Gase – 5.1.4 Reale Gase – 5.1.5 Die Virialgleichung – 5.1.6 Die van-der-Waals’sche Gleichung. Der kritische Punkt
5.2
Flüssigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C22
5.2.1 Einteilung der Flüssigkeiten – 5.2.2 Struktur von Flüssigkeiten – 5.2.3 Eigenschaften des flüssigen Wassers – 5.2.4 Gläser – 5.2.5 Flüssige Kristalle oder Flüssigkristalle
5.3
Festkörper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C26
5.3.1 Kristalle – 5.3.2 Bindungszustände in Kristallen – 5.3.3 Reale Kristalle – 5.3.4 Grenzflächen
5.4
Plasmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C30 C30 C30
6.1.1 Einteilung der thermodynamischen Systeme – 6.1.2 Die Umsatzvariable
6.2
Anwendung des 1. Hauptsatzes der Thermodynamik auf chemische Reaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C31
6.2.1 Der 1. Hauptsatz der Thermodynamik – 6.2.2 Die Reaktionsenergie – 6.2.3 Die Reaktionsenthalpie – 6.2.4 Der Heß’sche Satz – 6.2.5 Die Standardbildungsenthalpie von Verbindungen – 6.2.6 Temperatur- und Druckabhängigkeit der Reaktionsenthalpie
6.3
Anwendung des 2. und 3. Hauptsatzes der Thermodynamik auf chemische Reaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C35
6.3.1 Grundlagen – 6.3.2 Reaktionsentropie – 6.3.3 Die Freie Enthalpie und das chemische Potenzial – 6.3.4 Die Freie Reaktionsenthalpie. Die Gibbs-Helmholtz’sche Gleichung – 6.3.5 Phasenstabilität
6.4
Das Massenwirkungsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C38
6.4.1 Chemisches Gleichgewicht – 6.4.2 Homogene Gasreaktionen – 6.4.3 Heterogene Reaktionen – 6.4.4 Berechnung von Gleichgewichtskonstanten aus thermochemischen Tabellen – 6.4.5 Temperaturabhängigkeit der Gleichgewichtskonstante – 6.4.6 Prinzip des kleinsten Zwanges – 6.4.7 Gekoppelte Gleichgewichte
7
Geschwindigkeit chemischer Reaktionen. Reaktionskinetik . . .
7.1 7.2 7.3 7.4
Reaktionsgeschwindigkeit und Freie Reaktionsenthalpie . . . . . . . . . . Reaktionsgeschwindigkeit und Reaktionsordnung . . . . . . . . . . . . . . . Elementarreaktion. Reaktionsmechanismus und Molekularität . . . . . . Konzentrationsabhängigkeit der Reaktionsgeschwindigkeit . . . . . . . .
C41 C41 C41 C42 C43
7.4.1 Zeitgesetz 1. Ordnung – 7.4.2 Zeitgesetz 2. Ordnung
7.5 7.6 7.7 7.8 7.9
Reaktionsgeschwindigkeit und Massenwirkungsgesetz . . . . . . . . . . . . Temperaturabhängigkeit der Reaktionsgeschwindigkeit . . . . . . . . . . . Kettenreaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Explosionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Katalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C44 C45 C45 C46 C46
7.9.1 Grundlagen – 7.9.2 Homogene Katalyse – 7.9.3 Heterogene Katalyse – 7.9.4 Haber-Bosch-Verfahren
8
Stoffe und Reaktionen in Lösung . . . . . . . . . . . . . . . . . . . . . . . . .
8.1
Disperse Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C48 C48
8.1.1 Kolloide – 8.1.2 Lösungen – 8.1.3 Elektrolyte, Elektrolytlösungen
8.2
Kolligative Eigenschaften von Lösungen . . . . . . . . . . . . . . . . . . . . . .
C49
8.2.1 Dampfdruckerniedrigung – 8.2.2 Gefrierpunktserniedrigung und Siedepunktserhöhung – 8.2.3 Osmotischer Druck
8.3
Löslichkeit von Gasen in Flüssigkeiten . . . . . . . . . . . . . . . . . . . . . . . .
C52
Inhaltsverzeichnis
8.4 8.5 8.6 8.7
Verteilung gelöster Stoffe zwischen zwei Lösungsmitteln . . . . . . . . . . Wasser als Lösungsmittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigendissoziation des Wassers, Ionenprodukt des Wassers . . . . . . . . . Säuren und Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C52 C52 C53 C53
8.7.1 Definitionen von Arrhenius und Brønsted – 8.7.2 Starke und schwache Säuren und Basen – 8.7.3 Der pH-Wert – 8.7.4 pH-Wert der Lösung einer starken Säure bzw. Base – 8.7.5 pH-Wert der Lösung einer schwachen Säure bzw. Base – 8.7.6 pH-Wert von Salzlösungen (Hydrolyse) – 8.7.7 Löslichkeitsprodukt
8.8
Härte des Wassers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
Redoxreaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 9.2 9.3
Oxidationszahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Oxidation und Reduktion, Redoxreaktionen . . . . . . . . . . . . . . . . . . . . Beispiele für Redoxreaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C58 C58 C58 C58 C59
9.3.1 Verbrennungsvorgänge – 9.3.2 Auflösen von Metallen in Säuren – 9.3.3 Darstellung von Metallen durch Reduktion von Metalloxiden
9.4 9.5
Redoxreaktionen in elektrochemischen Zellen . . . . . . . . . . . . . . . . . . Elektrodenpotenziale, elektrochemische Spannungsreihe . . . . . . . . . .
C60 C61
9.5.1 Definition von Anode und Kathode – 9.5.2 Konzentrations- bzw. Partialdruckabhängigkeit des Elektrodenpotenzials einer Halbzelle – 9.5.3 Berechnung der EMK elektrochemischer Zellen aus Elektrodenpotenzialen – 9.5.4 Edle und unedle Metalle
9.6 9.7 9.8
Elektrochemische Korrosion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erzeugung von elektrischem Strom durch Redoxreaktionen . . . . . . . . Elektrolyse, Faraday-Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C63 C63 C64
9.8.1 Technische Anwendungen elektrolytischer Vorgänge
10
Die Elementgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1 10.2 10.3 10.4
Wasserstoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I. Hauptgruppe: Alkalimetalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II. Hauptgruppe: Erdalkalimetalle . . . . . . . . . . . . . . . . . . . . . . . . . . . III. Hauptgruppe: die Borgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C65 C65 C66 C66 C67
10.4.1 Bor – 10.4.2 Aluminium
10.5 IV. Hauptgruppe: die Kohlenstoffgruppe . . . . . . . . . . . . . . . . . . . . . .
C69
10.5.1 Kohlenstoff – 10.5.2 Silicium – 10.5.3 Germanium, Zinn und Blei
10.6 V. Hauptgruppe: die Stickstoffgruppe . . . . . . . . . . . . . . . . . . . . . . . . .
C71
10.6.1 Stickstoff – 10.6.2 Phosphor – 10.6.3 Arsen, Antimon
10.7 VI. Hauptgruppe: Chalkogene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C73
10.7.1 Sauerstoff – 10.7.2 Schwefel
10.8 VII. Hauptgruppe: Halogene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C75
10.8.1 Fluor – 10.8.2 Chlor – 10.8.3 Brom und Iod
10.9 VIII. Hauptgruppe: Edelgase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.10 Scandiumgruppe (III. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . 10.11 Titangruppe (IV. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C76 C76 C77
10.11.1 Titan – 10.11.2 Zirconium
10.12 Vanadiumgruppe (V. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . .
C77
10.12.1 Vanadium
10.13 Chromgruppe (VI. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C78
10.13.1 Chrom – 10.13.2 Molybdän – 10.13.3 Wolfram
10.14 Mangangruppe (VII. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . .
C79
10.14.1 Mangan
10.15 Eisenmetalle und Elementgruppe der Platinmetalle (VIII. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.15.1 Eisen – 10.15.2 Cobalt – 10.15.3 Nickel
C80
XXVII
XXVIII
Inhaltsverzeichnis
10.16 Kupfergruppe (I. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C81
10.16.1 Kupfer – 10.16.2 Silber – 10.16.3 Gold
10.17 Zinkgruppe (II. Nebengruppe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C82
10.17.1 Zink – 10.17.2 Quecksilber
10.18 Die Lanthanoide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.19 Die Actinoide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C83 C84
10.19.1 Thorium – 10.19.2 Uran – 10.19.3 Plutonium
11
Organische Verbindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1 Organische Chemie: Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Isomerie bei organischen Molekülen . . . . . . . . . . . . . . . . . . . . . . . . .
C86 C86 C86
11.2.1 Strukturisomerie – 11.2.2 Stereoisomerie
11.3 Kohlenwasserstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
C87
11.3.1 Aliphatische Kohlenwasserstoffe – 11.3.2 Alicyclische Kohlenwasserstoffe – 11.3.3 Aromatische Kohlenwasserstoffe
11.4 Verbindungen mit funktionellen Gruppen . . . . . . . . . . . . . . . . . . . . . .
C94
11.4.1 Halogenderivate der aliphatischen Kohlenwasserstoffe – 11.4.2 Alkohole – 11.4.3 Aldehyde – 11.4.4 Ketone – 11.4.5 Carbonsäuren und ihre Derivate – 11.4.6 Aminocarbonsäuren (Aminosäuren)
12 Synthetische und natürliche Makromoleküle . . . . . . . . . . . . . . . C101 12.1 Synthetische Polymere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C101 12.1.1 Verknüpfung von Monomeren – 12.1.2 Mittelwerte der Molmassen – 12.1.3 Synthese von Polymeren
12.2 Gestalt synthetischer Makromoleküle . . . . . . . . . . . . . . . . . . . . . . . . . C105 12.2.1 Knäuelmoleküle – 12.2.2 Charakterisierung der Gestalt
12.3 Konfiguration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C106 12.4 Kristallisation von Polymeren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C106 12.5 Biopolymere (natürliche Makromoleküle) . . . . . . . . . . . . . . . . . . . . . C107 12.5.1 Polypeptide und Proteine – 12.5.2 Polynucleotide – 12.5.3 Polysaccharide
Formelzeichen der Chemie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C111 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C111
D
Werkstoffe
H. Czichos, B. Skrotzki, F.-G. Simon 1
Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2 1.3
Der Materialkreislauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Werkstoffe in Kultur, Wirtschaft, Technik und Umwelt . . . . . . . . . . . . Gliederung des Werkstoffgebietes . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Aufbau der Werkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12
Aufbauprinzipien von Festkörpern . . . . . . . . . . . . . . . . . . . . . . . . . . . Mikrostruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Werkstoffoberflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Werkstoffgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mischkristalle und Phasengemische . . . . . . . . . . . . . . . . . . . . . . . . . . Gleichgewichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zustandsdiagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diffusionsprozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Keimbildung von Phasenumwandlungen . . . . . . . . . . . . . . . . . . . . . . Metastabile Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Erholung und Rekristallisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ausscheidungs- und Umwandlungsprozesse . . . . . . . . . . . . . . . . . . . .
D1 D1 D2 D5 D5 D6 D8 D9 D9 D11 D12 D13 D15 D17 D18 D18 D19
Inhaltsverzeichnis
3
Metallische Werkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 3.2 3.3
Herstellung metallischer Werkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . Einteilung der Metalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eisenwerkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D20 D20 D20 D21
3.3.1 Eisen-Kohlenstoff-Diagramm – 3.3.2 Wärmebehandlung – 3.3.3 Stahl – 3.3.4 Gusseisen
3.4
Nichteisenmetalle und ihre Legierungen . . . . . . . . . . . . . . . . . . . . . . .
D27
3.4.1 Aluminium – 3.4.2 Magnesium – 3.4.3 Titan – 3.4.4 Kupfer – 3.4.5 Nickel – 3.4.6 Zinn – 3.4.7 Zink – 3.4.8 Blei
4
Anorganisch-nichtmetallische Werkstoffe . . . . . . . . . . . . . . . . . .
4.1 4.2 4.3
Mineralische Naturstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kohlenstoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Keramische Werkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D31 D31 D32 D33
4.3.1 Herstellung keramischer Werkstoffe – 4.3.2 Silicatkeramik – 4.3.3 Oxidkeramik – 4.3.4 Nichtoxidkeramik
4.4 4.5 4.6
Glas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Glaskeramik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Baustoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D36 D37 D37
4.6.1 Bindemittel – 4.6.2 Zement – 4.6.3 Beton
4.7
Erdstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Organische Stoffe; Polymerwerkstoffe . . . . . . . . . . . . . . . . . . . .
5.1
Organische Naturstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D39 D40 D40
5.1.1 Holz und Holzwerkstoffe – 5.1.2 Fasern
5.2 5.3 5.4 5.5 5.6 5.7
Papier und Pappe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polymerwerkstoffe: Herstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polymerwerkstoffe: Aufbau und Eigenschaften . . . . . . . . . . . . . . . . . Thermoplaste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Duroplaste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elastomere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Verbundwerkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 6.2 6.3 6.4 6.5
Teilchenverbundwerkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Faserverbundwerkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stahlbeton und Spannbeton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schichtverbundwerkstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Oberflächenbeschichtungen und Oberflächentechnologien . . . . . . . . .
7
Ressourcennutzung und Umweltauswirkungen . . . . . . . . . . . . .
7.1 7.2
Materialflüsse in der Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recycling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Beanspruchung von Werkstoffen . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 8.2 8.3 8.4
Volumenbeanspruchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Oberflächenbeanspruchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zeitlicher Verlauf von Beanspruchungen . . . . . . . . . . . . . . . . . . . . . . Umweltbeanspruchung und Umweltsimulation . . . . . . . . . . . . . . . . . .
9
Werkstoffeigenschaften und Werkstoffkennwerte . . . . . . . . . . .
9.1 9.2
Dichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mechanische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Elastizität – 9.2.2 Viskoelastizität – 9.2.3 Festigkeit und Verformung – 9.2.4 Kriechen und Zeitstandverhalten – 9.2.5 Ermüdung und Wechselfestigkeit – 9.2.6 Bruchmechanik – 9.2.7 Betriebsfestigkeit – 9.2.8 Härte
D41 D42 D42 D43 D45 D45 D47 D47 D47 D48 D49 D49 D51 D51 D53 D54 D54 D54 D55 D55 D58 D58 D58
XXIX
XXX
Inhaltsverzeichnis
9.3
Thermische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D70
9.3.1 Wärmekapazität und Wärmeleitfähigkeit – 9.3.2 Thermische Ausdehnung – 9.3.3 Schmelztemperatur
9.4
Sicherheitstechnische Kenngrößen . . . . . . . . . . . . . . . . . . . . . . . . . . .
D74
9.4.1 Sicherheitsbeiwerte von Konstruktionswerkstoffen
9.5 9.6 9.7
Elektrische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Magnetische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Optische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Materialverhalten: Schadenskunde . . . . . . . . . . . . . . . . . . . . . . .
10.1 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Alterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Bruch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D75 D76 D77 D78 D78 D78 D80
10.3.1 Gewaltbruch – 10.3.2 Schwingbruch – 10.3.3 Warmbruch
10.4 Korrosion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D82
10.4.1 Korrosionsarten – 10.4.2 Korrosionsmechanismen – 10.4.3 Korrosionsschutz
10.5 Biologische Materialschädigung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D83
10.5.1 Materialschädigungsarten – 10.5.2 Materialschädlinge und Schadformen – 10.5.3 Materialschutz gegen Organismen
10.6 Tribologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D85
10.6.1 Reibung – 10.6.2 Verschleiß – 10.6.3 Verschleißmechanismen – 10.6.4 Verschleißschutz
10.7 Methodik der Schadensanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Materialprüfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1 Planung von Messungen und Prüfungen . . . . . . . . . . . . . . . . . . . . . . . 11.2 Chemische Analyse von Werkstoffen . . . . . . . . . . . . . . . . . . . . . . . . .
D89 D89 D90 D90
11.2.1 Analyse anorganischer Stoffe – 11.2.2 Analyse organischer Stoffe – 11.2.3 Oberflächenanalytik
11.3 Mikrostruktur-Untersuchungsverfahren . . . . . . . . . . . . . . . . . . . . . . .
D92
11.3.1 Gefügeuntersuchungen – 11.3.2 Oberflächenrauheitsmesstechnik
11.4 Experimentelle Beanspruchungsanalyse . . . . . . . . . . . . . . . . . . . . . . . 11.5 Werkstoffmechanische Prüfverfahren . . . . . . . . . . . . . . . . . . . . . . . . .
D94 D94
11.5.1 Festigkeits- und Verformungsprüfungen – 11.5.2 Bruchmechanische Prüfungen – 11.5.3 Härteprüfungen – 11.5.4 Technologische Prüfungen
11.6 Zerstörungsfreie Prüfverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
D98
11.6.1 Akustische Verfahren: Ultraschallprüfung, Schallemissionsanalyse – 11.6.2 Elektrische und magnetische Verfahren – 11.6.3 Radiografie und Computertomografie
11.7 Komplexe Prüfverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D100 11.7.1 Bewitterungsprüfungen – 11.7.2 Korrosionsprüfungen – 11.7.3 Tribologische Prüfungen – 11.7.4 Biologische Prüfungen
11.8 Bescheinigungen über Materialprüfungen . . . . . . . . . . . . . . . . . . . . . D103 11.9 Anforderungen an die Kompetenz von Prüflaboratorien . . . . . . . . . . . D103 12 Materialauswahl für technische Anwendungen . . . . . . . . . . . . . D104 12.1 Strukturmaterialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D104 12.2 Funktionsmaterialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D104 12.3 Festigkeitsbezogene Auswahlkriterien . . . . . . . . . . . . . . . . . . . . . . . . D105 12.4 Systemmethodik zur Materialauswahl . . . . . . . . . . . . . . . . . . . . . . . . D105 13 Referenzmaterialien und Referenzverfahren . . . . . . . . . . . . . . . D107 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D108
Inhaltsverzeichnis
E
Technische Mechanik
J. Wittenburg, H.A. Richard, J. Zierep, K. Bühler Mechanik fester Körper J. Wittenburg, H.A. Richard 1
Kinematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Kinematik des Punktes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E1 E1
1.1.1 Lage. Lagekoordinaten – 1.1.2 Geschwindigkeit. Beschleunigung
1.2
Kinematik des starren Körpers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E2
1.2.1 Winkellage. Koordinatentransformation – 1.2.2 Winkelgeschwindigkeit – 1.2.3 Winkelbeschleunigung
1.3 1.4 1.5 1.6
Kinematik des Punktes mit Relativbewegung . . . . . . . . . . . . . . . . . . . Freiheitsgrade der Bewegung. Kinematische Bindungen . . . . . . . . . . . Virtuelle Verschiebungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kinematik offener Gliederketten . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Statik starrer Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E9 E10 E10 E11 E13 E13
2.1.1 Kraft. Moment – 2.1.2 Äquivalenz von Kräftesystemen – 2.1.3 Zerlegung von Kräften – 2.1.4 Resultierende von Kräften mit gemeinsamem Angriffspunkt – 2.1.5 Reduktion von Kräftesystemen – 2.1.6 Ebene Kräftesysteme – 2.1.7 Schwerpunkt. Massenmittelpunkt – 2.1.8 Das 3. Newton’sche Axiom „actio = reactio“ – 2.1.9 Innere Kräfte und äußere Kräfte – 2.1.10 Eingeprägte Kräfte und Zwangskräfte – 2.1.11 Gleichgewichtsbedingungen für einen starren Körper – 2.1.12 Schnittprinzip – 2.1.13 Arbeit. Leistung – 2.1.14 Potenzialkraft. Potenzielle Energie – 2.1.15 Virtuelle Arbeit. Generalisierte Kräfte – 2.1.16 Prinzip der virtuellen Arbeit
2.2
Lager. Gelenke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E23
2.2.1 Lagerreaktionen. Lagerwertigkeit – 2.2.2 Statisch bestimmte Lagerung – 2.2.3 Berechnung von Lagerreaktionen
2.3
Fachwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E26
2.3.1 Statische Bestimmtheit – 2.3.2 Nullstäbe – 2.3.3 Knotenschnittverfahren – 2.3.4 Ritter’sches Schnittverfahren für ebene Fachwerke – 2.3.5 Prinzip der virtuellen Arbeit – 2.3.6 Methode der Stabvertauschung
2.4
Ebene Seil- und Kettenlinien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E27
2.4.1 Gewichtsloses Seil mit Einzelgewichten – 2.4.2 Schwere Gliederkette – 2.4.3 Schweres Seil – 2.4.4 Schweres Seil mit Einzelgewicht – 2.4.5 Rotierendes Seil
2.5
Coulomb’sche Reibungskräfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E30
2.5.1 Ruhereibungskräfte – 2.5.2 Gleitreibungskräfte
2.6
Stabilität von Gleichgewichtslagen . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Kinetik starrer Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E33 E33 E33
3.1.1 Inertialsystem und absolute Beschleunigung – 3.1.2 Impuls – 3.1.3 Newton’sche Axiome – 3.1.4 Impulssatz. Impulserhaltungssatz – 3.1.5 Kinetik der Punktmasse im beschleunigten Bezugssystem – 3.1.6 Trägheitsmomente. Trägheitstensor – 3.1.7 Drall – 3.1.8 Drallsatz (Axiom von Euler) – 3.1.9 Drallerhaltungssatz – 3.1.10 Kinetische Energie – 3.1.11 Energieerhaltungssatz – 3.1.12 Arbeitssatz
3.2
Kreiselmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E40
3.2.1 Reguläre Präzession – 3.2.2 Nutation – 3.2.3 Linearisierte Kreiselgleichungen – 3.2.4 Präzessionsgleichungen
3.3
Bewegungsgleichungen für holonome Mehrkörpersysteme . . . . . . . . . 3.3.1 Synthetische Methode – 3.3.2 Lagrange’sche Gleichung – 3.3.3 D’Alembert‘sches Prinzip
E43
XXXI
XXXII
Inhaltsverzeichnis
3.4
Stöße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E45
3.4.1 Vereinfachende Annahmen über Stoßvorgänge – 3.4.2 Stöße an Mehrkörpersystemen – 3.4.3 Der schiefe exzentrische Stoß – 3.4.4 Gerader zentraler Stoß – 3.4.5 Gerader Stoß gegen ein Pendel
3.5 3.6 3.7
Körper mit veränderlicher Masse . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gravitation. Satellitenbahnen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stabilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1
Lineare Eigenschwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E48 E49 E51 E51 E52
4.1.1 Systeme mit einem Freiheitsgrad – 4.1.2 Eigenschwingungen bei endlich vielen Freiheitsgraden
4.2
Erzwungene lineare Schwingungen . . . . . . . . . . . . . . . . . . . . . . . . . .
E54
4.2.1 Systeme mit einem Freiheitsgrad – 4.2.2 Erzwungene Schwingungen bei endlich vielen Freiheitsgraden
4.3 4.4
Lineare parametererregte Schwingungen . . . . . . . . . . . . . . . . . . . . . . Freie Schwingungen eindimensionaler Kontinua . . . . . . . . . . . . . . . .
E59 E60
4.4.1 Saite. Zugstab. Torsionsstab – 4.4.2 Biegeschwingungen von Stäben
4.5
Näherungsverfahren zur Bestimmung von Eigenkreisfrequenzen . . . .
E63
4.5.1 Rayleigh-Quotient – 4.5.2 Ritz-Verfahren
4.6
Autonome nichtlineare Schwingungen mit einem Freiheitsgrad . . . . .
E66
4.6.1 Methode der kleinen Schwingungen – 4.6.2 Harmonische Balance – 4.6.3 Störungsrechnung nach Lindstedt – 4.6.4 Methode der multiplen Skalen
4.7
Erzwungene nichtlineare Schwingungen . . . . . . . . . . . . . . . . . . . . . .
E69
4.7.1 Harmonische Balance – 4.7.2 Methode der multiplen Skalen – 4.7.3 Subharmonische, superharmonische und Kombinationsresonanzen
5
Festigkeitslehre. Elastizitätstheorie . . . . . . . . . . . . . . . . . . . . . . .
5.1
Kinematik des deformierbaren Körpers . . . . . . . . . . . . . . . . . . . . . . .
E71 E71
5.1.1 Verschiebungen. Verzerrungen. Verzerrungstensor – 5.1.2 Kompatibilitätsbedingungen – 5.1.3 Koordinatentransformation – 5.1.4 Hauptdehnungen. Dehnungshauptachsen – 5.1.5 Mohr’scher Dehnungskreis
5.2
Spannungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E73
5.2.1 Normal- und Schubspannungen. Spannungstensor – 5.2.2 Koordinatentransformation – 5.2.3 Hauptnormalspannungen. Spannungshauptachsen – 5.2.4 Hauptschubspannungen – 5.2.5 Kugeltensor. Spannungsdeviator – 5.2.6 Ebener Spannungszustand. Mohr’scher Spannungskreis – 5.2.7 Volumenkraft. Gleichgewichtsbedingungen
5.3 5.4
Hooke’sches Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Geometrische Größen für Stab- und Balkenquerschnitte . . . . . . . . . . .
E75 E76
5.4.1 Flächenmomente 2. Grades – 5.4.2 Statische Flächenmomente – 5.4.3 Querschubzahlen – 5.4.4 Schubmittelpunkt oder Querkraftmittelpunkt – 5.4.5 Torsionsflächenmoment – 5.4.6 Wölbwiderstand
5.5
Schnittgrößen in Stäben und Balken . . . . . . . . . . . . . . . . . . . . . . . . .
E84
5.5.1 Definition der Schnittgrößen für gerade Stäbe – 5.5.2 Berechnung von Schnittgrößen für gerade Stäbe
5.6
Spannungen in Stäben und Balken . . . . . . . . . . . . . . . . . . . . . . . . . . .
E87
5.6.1 Zug und Druck – 5.6.2 Gerade Biegung – 5.6.3 Schiefe Biegung – 5.6.4 Druck und Biegung. Kern eines Querschnitts – 5.6.5 Biegung von Stäben aus Verbundwerkstoff – 5.6.6 Biegung vorgekrümmter Stäbe – 5.6.7 Reiner Schub – 5.6.8 Torsion ohne Wölbbehinderung (Saint-Venant-Torsion) – 5.6.9 Torsion mit Wölbbehinderung
5.7
Verformungen von Stäben und Balken . . . . . . . . . . . . . . . . . . . . . . . .
E92
5.7.1 Zug und Druck – 5.7.2 Gerade Biegung – 5.7.3 Schiefe Biegung – 5.7.4 Stab auf elastischer Bettung (Winkler-Bettung) – 5.7.5 Biegung von Stäben aus Verbundwerkstoff – 5.7.6 Querkraftbiegung – 5.7.7 Torsion ohne Wölbbehinderung (Saint-Venant-Torsion) – 5.7.8 Torsion mit Wölbbehinderung
5.8
Energiemethoden der Elastostatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . E100 5.8.1 Formänderungsenergie. Äußere Arbeit – 5.8.2 Prinzip der virtuellen Arbeit – 5.8.3 Arbeitsgleichung oder Verfahren mit einer Hilfskraft – 5.8.4 Sätze von Castigliano – 5.8.5 Steifigkeitsmatrix. Nachgiebigkeitsmatrix. Satz von Maxwell
Inhaltsverzeichnis
und Betti – 5.8.6 Statisch unbestimmte Systeme. Kraftgrößenverfahren – 5.8.7 Satz von Menabrea – 5.8.8 Verfahren von Ritz für Durchbiegungen
5.9 Rotierende Stäbe und Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E107 5.10 Flächentragwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E108 5.10.1 Scheiben – 5.10.2 Platten – 5.10.3 Schalen
5.11 Dreidimensionale Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E113 5.11.1 Einzelkraft auf Halbraumoberfläche (Boussinesq-Problem) – 5.11.2 Einzelkraft im Vollraum (Kelvin-Problem) – 5.11.3 Druckbehälter. Kesselformeln – 5.11.4 Kontaktprobleme. Hertz’sche Formeln – 5.11.5 Kerbspannungen
5.12 Stabilitätsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E116 5.12.1 Knicken von Stäben – 5.12.2 Biegedrillknicken – 5.12.3 Kippen – 5.12.4 Plattenbeulung – 5.12.5 Schalenbeulung
5.13 Finite Elemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E121 5.13.1 Elementmatrizen. Formfunktionen – 5.13.2 Matrizen für das Gesamtsystem – 5.13.3 Aufgabenstellungen bei Finite-Elemente-Rechnungen
5.14 Übertragungsmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E126 5.14.1 Übertragungsmatrizen für Stabsysteme – 5.14.2 Übertragungsmatrizen für rotierende Scheiben – 5.14.3 Ergänzende Bemerkungen
5.15 Festigkeitshypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E131 5.16 Kerbspannungen. Kerbwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E132 5.16.1 Spannungsverteilungen an Kerben – 5.16.2 Elastizitätstheoretische Lösungen grundlegender Kerbprobleme – 5.16.3 Kerbfaktoren – 5.16.4 Kerbwirkung
6 6.1
Plastizitätstheorie. Bruchmechanik . . . . . . . . . . . . . . . . . . . . . . . E137 Grundlagen der Plastizitätstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . E137 6.1.1 Fließkriterien – 6.1.2 Fließregeln – 6.1.3 Gleitlinien
6.2
Elementare Theorie technischer Umformprozesse . . . . . . . . . . . . . . . E138 6.2.1 Schrankensatz für Umformleistung – 6.2.2 Streifen-, Scheiben- und Röhrenmodell
6.3
Traglast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E140 6.3.1 Fließgelenke. Fließschnittgrößen – 6.3.2 Traglastsätze – 6.3.3 Traglasten für Durchlaufträger – 6.3.4 Traglasten für Rahmen
6.4
Grundlagen der Bruchmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E142 6.4.1 Spannungsverteilungen an Rissen. Spannungsintensitätsfaktoren – 6.4.2 Bruchmechanische Bewertung der Bruchgefahr – 6.4.3 Ermüdungsrissausbreitung
6.5
Zusammenwirken von Festigkeitsberechnung und Bruchmechanik . . E146
Strömungsmechanik J. Zierep, K. Bühler 7
Einführung in die Strömungsmechanik . . . . . . . . . . . . . . . . . . . . E146
7.1 7.2 7.3 7.4
Eigenschaften von Fluiden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Newton’sche und nichtnewton’sche Medien . . . . . . . . . . . . . . . . . . . . Hydrostatik und Aerostatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gliederung der Darstellung: Nach Viskositätsund Kompressibilitätseinflüssen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss . . . . . . . . . . . . . . . . . . . . . . . . . E149
8.1
E146 E148 E148 E149
Eindimensionale reibungsfreie Strömungen . . . . . . . . . . . . . . . . . . . . E149 8.1.1 Grundbegriffe – 8.1.2 Grundgleichungen der Stromfadentheorie – 8.1.3 Anwendungsbeispiele
8.2
Zweidimensionale reibungsfreie, inkompressible Strömungen . . . . . . E154 8.2.1 Kontinuität – 8.2.2 Euler’sche Bewegungsgleichungen – 8.2.3 Stationäre ebene Potenzialströmungen – 8.2.4 Anwendungen elementarer und zusammengesetzter Potenzialströmungen – 8.2.5 Stationäre räumliche Potenzialströmungen
XXXIII
XXXIV
Inhaltsverzeichnis
8.3
Reibungsbehaftete inkompressible Strömungen . . . . . . . . . . . . . . . . . E160 8.3.1 Grundgleichungen für Masse, Impuls und Energie – 8.3.2 Kennzahlen – 8.3.3 Lösungseigenschaften der Navier-Stokes’schen Gleichungen – 8.3.4 Spezielle Lösungen für laminare Strömungen – 8.3.5 Turbulente Strömungen – 8.3.6 Grenzschichttheorie – 8.3.7 Impulssatz – 8.3.8 Anwendungsbeispiele
8.4
Druckverlust und Strömungswiderstand . . . . . . . . . . . . . . . . . . . . . . . E170 8.4.1 Durchströmungsprobleme – 8.4.2 Umströmungsprobleme
8.5
9 9.1 9.2
Strömungen in rotierenden Systemen . . . . . . . . . . . . . . . . . . . . . . . . . E182 Gasdynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E183 Erhaltungssätze für Masse, Impuls und Energie . . . . . . . . . . . . . . . . . E183 Allgemeine Stoßgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E184 9.2.1 Rankine-Hugoniot-Relation – 9.2.2 Rayleigh-Gerade – 9.2.3 Schallgeschwindigkeit – 9.2.4 Senkrechter Stoß – 9.2.5 Schiefer Stoß – 9.2.6 Busemann-Polare – 9.2.7 Herzkurve
9.3 9.4
Kräfte auf umströmte Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E190 Stromfadentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E191 9.4.1 Lavaldüse
9.5
10
Zweidimensionale Strömungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E194
9.5.1 Kleine Störungen, M∞ ≶ 1 – 9.5.2 Transformation auf Charakteristiken – 9.5.3 Prandtl-Meyer-Expansion – 9.5.4 Düsenströmungen – 9.5.5 Profilumströmungen – 9.5.6 Transsonische Strömungen
Gleichzeitiger Viskositäts- und Kompressibilitätseinfluss . . . . . E204 Eindimenionale Rohrströmung mit Reibung . . . . . . . . . . . . . . . . . . . . Kugelumströmung, Naumann-Diagramm für cW . . . . . . . . . . . . . . . . Grundsätzliches über die laminare Plattengrenzschicht . . . . . . . . . . . . (M, Re)-Ähnlichkeit in der Gasdynamik . . . . . . . . . . . . . . . . . . . . . . . Auftriebs- und Widerstandsbeiwerte aktueller Tragflügel . . . . . . . . . .
E204 E206 E206 E208 E209 Formelzeichen der Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E211 Formelzeichen der Strömungsmechanik . . . . . . . . . . . . . . . . . . . . . . . . E215 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E216
10.1 10.2 10.3 10.4 10.5
F
Technische Thermodynamik
J. Ahrendts, C. Kabelac 1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Energie und Energieformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F1 F1
1.1.1 Erster Hauptsatz der Thermodynamik – 1.1.2 Zweiter Hauptsatz der Thermodynamik
1.2
Fundamentalgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F4
1.2.1 Innere Energie – 1.2.2 Spezifische, molare und partielle molare Größen – 1.2.3 Legendre-Transformierte der inneren Energie
1.3
Gleichgewichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F7
1.3.1 Extremalbedingungen – 1.3.2 Notwendige Gleichgewichtsbedingungen – 1.3.3 Stabilitätsbedingungen und Phasenzerfall
1.4 1.5
Messung der thermodynamischen Temperatur . . . . . . . . . . . . . . . . . . Bilanzgleichungen der Thermodynamik . . . . . . . . . . . . . . . . . . . . . . .
F11 F13
1.5.1 Stoffmengen- und Massenbilanzen – 1.5.2 Energiebilanzen – 1.5.3 Entropiebilanzen. Bernoullische Gleichung
1.6
Energieumwandlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F18
1.6.1 Beispiele stationärer Energiewandler. Kreisprozesse – 1.6.2 Wertigkeit von Energieformen
2
Stoffmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Reine Stoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F22 F22
Inhaltsverzeichnis
2.1.1 Ideale Gase – 2.1.2 Inkompressible Fluide – 2.1.3 Reale Fluide – 2.1.4 Fundamentalgleichungen
2.2
Gemische . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F33
2.2.1 Ideale Gasgemische – 2.2.2 Gas-Dampf-Gemische. Feuchte Luft – 2.2.3 Reale Gemische
3
Phasen- und Reaktionsgleichgewichte . . . . . . . . . . . . . . . . . . . . .
3.1
Phasengleichgewichte reiner Stoffe . . . . . . . . . . . . . . . . . . . . . . . . . .
F45 F45
Phasengleichgewichte fluider Mehrstoffsysteme . . . . . . . . . . . . . . . . .
F50
3.2
3.1.1 p, v, T -Fläche – 3.1.2 Koexistenzkurven – 3.1.3 Sättigungsgrößen des Nassdampfgebietes – 3.1.4 Eigenschaften von nassem Dampf – 3.1.5 T, s- und h, s-Diagramm
3.2.1 Phasendiagramme – 3.2.2 Differenzialgleichungen der Phasengrenzkurven – 3.2.3 Punktweise Berechnung von Phasengleichgewichten
3.3
Gleichgewichte reagierender Gemische . . . . . . . . . . . . . . . . . . . . . . .
F58
3.3.1 Thermochemische Daten – 3.3.2 Gleichgewichtsalgorithmus – 3.3.3 Empfindlichkeit gegenüber Parameteränderungen
4
Energie- und Stofftransport in Temperaturund Konzentrationsfeldern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1
Konstitutive Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F64 F64
4.1.1 Fourier’sches Gesetz – 4.1.2 Maxwell-Stefan’sche Gleichungen und Fick’sches Gesetz
4.2
Bilanzgleichungen der Thermofluiddynamik . . . . . . . . . . . . . . . . . . .
F73
4.2.1 Stoffbilanzen – 4.2.2 Impuls- und mechanische Energiebilanz – 4.2.3 Energiebilanz – 4.2.4 Entropiebilanz und konstitutive Gleichungen
4.3
Feldgleichungen der intensiven Zustandsgrößen . . . . . . . . . . . . . . . . .
F76
4.3.1 Kennzahlen bei erzwungener Konvektion – 4.3.2 Kennzahlen bei natürlicher Konvektion
4.4
Turbulente Strömungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F80
4.4.1 Reynolds’sche Gleichungen – 4.4.2 Wandgesetze – 4.4.3 Turbulenzmodelle
4.5
Grenzschichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
F84
4.5.1 Grenzschichtgleichungen bei erzwungener Konvektion – 4.5.2 Grenzschichtgleichungen bei natürlicher Konvektion
4.6
Wärme- und Stoffübergangskoeffizienten . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G
F88 F91
Elektrotechnik
H. Clausert, K. Hoffmann, W. Mathis, G. Wiesemann, H. Zürneck Netzwerke G. Wiesemann 1
Elektrische Stromkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Elektrische Ladung und elektrischer Strom . . . . . . . . . . . . . . . . . . . .
G1 G1
1.1.1 Elementarladung – 1.1.2 Elektrischer Strom – 1.1.3 1. Kirchhoff’scher Satz (Satz von der Erhaltung der Ladungen; Strom-Knotengleichung)
1.2
Energie und elektrische Spannung; Leistung . . . . . . . . . . . . . . . . . . .
G2
1.2.1 Definition der Spannung – 1.2.2 Energieaufnahme eines elektrischen Zweipols – 1.2.3 Elektrisches Potenzial – 1.2.4 Spannungsquellen – 1.2.5 2. Kirchhoff’scher Satz (Satz von der Erhaltung der Energie; Spannungs-Maschengleichung)
1.3
Elektrischer Widerstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G4
1.3.1 Ohm’sches Gesetz – 1.3.2 Spezifischer Widerstand und Leitfähigkeit – 1.3.3 Temperaturabhängigkeit des Widerstandes
2
Wechselstrom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Beschreibung von Wechselströmen und -spannungen . . . . . . . . . . . . .
G7 G7
XXXV
XXXVI
Inhaltsverzeichnis
2.2 2.3 2.4 2.5 2.6
Mittelwerte periodischer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . Wechselstrom in Widerstand, Spule und Kondensator . . . . . . . . . . . . . Zeigerdiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Impedanz und Admittanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kirchhoff’sche Sätze für die komplexen Effektivwerte . . . . . . . . . . . .
3
Lineare Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Widerstandsnetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G8 G8 G9 G10 G10 G10 G10
3.1.1 Gruppenschaltungen – 3.1.2 Brückenschaltungen – 3.1.3 Stern-DreieckUmwandlung
3.2
Strom- und Spannungsberechnung in linearen Netzen . . . . . . . . . . . .
G13
3.2.1 Der Überlagerungssatz (Superpositionsprinzip) – 3.2.2 Ersatz-Zweipolquellen – 3.2.3 Maschen- und Knotenanalyse
3.3
Vierpole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G19
3.3.1 Vierpolgleichungen in der Leitwertform – 3.3.2 Vierpolgleichungen in der Widerstandsform – 3.3.3 Vierpolgleichungen in der Kettenform
4
Schwingkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 4.2
Phasen- und Betragsresonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einfache Schwingkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G20 G20 G20
4.2.1 Reihenschwingkreis – 4.2.2 Parallelschwingkreis – 4.2.3 Spannungsüberhöhung am Reihenschwingkreis – 4.2.4 Bandbreite
4.3 4.4
Parallelschwingkreis mit Wicklungsverlusten . . . . . . . . . . . . . . . . . . . Reaktanzzweipole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G22 G22
4.4.1 Verlustloser Reihen- und Parallelschwingkreis – 4.4.2 Kombinationen verlustloser Schwingkreise
5
Leistung in linearen Schaltungen . . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Leistung in Gleichstromkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G24 G24
5.1.1 Wirkungsgrad – 5.1.2 Leistungsanpassung – 5.1.3 Belastbarkeit von Leitungen
5.2
Leistung in Wechselstromkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G25
5.2.1 Wirk-, Blind- und Scheinleistung – 5.2.2 Wirkleistungsanpassung
6
Der Transformator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 6.2
Schaltzeichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der eisenfreie Transformator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G27 G27 G27
6.2.1 Transformator-Gleichungen – 6.2.2 Verlustloser Transformator – 6.2.3 Verlustund streuungsfreier Transformator – 6.2.4 Idealer Transformator – 6.2.5 Streufaktor und Kopplungsfaktor – 6.2.6 Vierpolersatzschaltungen – 6.2.7 Zweipolersatzschaltung
6.3
Transformator mit Eisenkern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
Drehstrom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 7.2 7.3
Spannungen symmetrischer Drehstromgeneratoren . . . . . . . . . . . . . . Die Spannung zwischen Generator- und Verbrauchersternpunkt . . . . . Symmetrische Drehstromsysteme (symmetrische Belastung symmetrischer Drehstromgeneratoren) . . . . Asymmetrische Belastung eines symmetrischen Generators . . . . . . . .
7.4
G29 G29 G29 G31 G31 G32
7.4.1 Verbraucher-Sternschaltung – 7.4.2 Verbraucher-Dreieckschaltung
7.5
Wirkleistungsmessung im Drehstromsystem (Zwei-Leistungsmesser-Methode, Aronschaltung) . . . . . . . . . . . . . . .
8
Nichtlineare Schaltungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 8.2
Linearität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nichtlineare Kennlinien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G33 G33 G33 G34
8.2.1 Beispiele nichtlinearer Strom-Spannungs-Kennlinien von Zweipolen – 8.2.2 Verstärkungskennlinie des Operationsverstärkers
8.3
Graphische Lösung durch Schnitt zweier Kennlinien . . . . . . . . . . . . .
G35
Inhaltsverzeichnis
8.3.1 Arbeitsgerade und Verbraucherkennlinie – 8.3.2 Stabile und instabile Arbeitspunkte einer Schaltung mit nichtlinearem Zweipol – 8.3.3 Rückkopplung von Operationsverstärkern
8.4
Graphische Zusammenfassung von Strom-Spannungs-Kennlinien . . .
G38
8.4.1 Reihenschaltung – 8.4.2 Parallelschaltung
8.5
Lösung durch abschnittweises Linearisieren . . . . . . . . . . . . . . . . . . . .
G39
Felder H. Clausert 9
Leitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 9.2 9.3 9.4 9.5
Die Differenzialgleichungen der Leitung und ihre Lösungen . . . . . . . Die charakteristischen Größen der Leitung . . . . . . . . . . . . . . . . . . . . . Die Leitungsgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Eingangswiderstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Reflexionsfaktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Elektrostatische Felder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9
Skalare und vektorielle Feldgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . Die elektrische Feldstärke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die elektrische Flussdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Potenzialfunktion spezieller Ladungsverteilungen . . . . . . . . . . . . Influenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Kapazität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Kapazität spezieller Anordnungen . . . . . . . . . . . . . . . . . . . . . . . . Energie und Kräfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bedingungen an Grenzflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Stationäre elektrische Strömungsfelder . . . . . . . . . . . . . . . . . . . .
11.1 Die Grundgesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Methoden zur Berechnung von Widerständen . . . . . . . . . . . . . . . . . . . 11.3 Bedingungen an Grenzflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Stationäre Magnetfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1 12.2 12.3 12.4 12.5
Die magnetische Flussdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die magnetische Feldstärke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der magnetische Fluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bedingungen an Grenzflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Magnetische Kreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
Zeitlich veränderliche Magnetfelder . . . . . . . . . . . . . . . . . . . . . .
13.1 Das Induktionsgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Die magnetische Energie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3 Induktivitäten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G40 G40 G41 G41 G42 G42 G42 G42 G42 G43 G45 G45 G45 G46 G47 G48 G49 G49 G49 G50 G50 G50 G51 G53 G53 G53 G55 G55 G56 G57
13.3.1 Die Selbstinduktivität – 13.3.2 Die Gegeninduktivität – 13.3.3 Berechnung von Selbst- und Gegeninduktivitäten – 13.3.4 Die gespeicherte Energie
13.4 Kräfte im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
Elektromagnetische Felder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.1 Die Maxwell’schen Gleichungen in integraler und differenzieller Form . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Die Einteilung der elektromagnetischen Felder . . . . . . . . . . . . . . . . . . 14.3 Die Maxwell’schen Gleichungen bei harmonischer Zeitabhängigkeit .
15
Elektromagnetische Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G59 G60 G60 G60 G61 G61
XXXVII
XXXVIII
Inhaltsverzeichnis
15.1 15.2 15.3 15.4
Die Wellengleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Anregung elektromagnetischer Wellen . . . . . . . . . . . . . . . . . . . . . Die abgestrahlte Leistung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Phase und aus dieser abgeleitete Begriffe . . . . . . . . . . . . . . . . . . .
G61 G63 G64 G64
Energietechnik H. Zürneck 16
Prinzipien der Energieumwandlung . . . . . . . . . . . . . . . . . . . . . .
16.0 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G66 G66
16.0.1 Energie, Leistung, Wirkungsgrad – 16.0.2 Energietechnische Betrachtungsweisen – 16.0.3 Definitionen
16.1 Elektrodynamische Energieumwandlung . . . . . . . . . . . . . . . . . . . . . .
G67
16.1.1 Energiedichte in magnetischen und elektrischen Feldern – 16.1.2 Energiewandlung in elektrischen Maschinen – 16.1.3 Kommutatormaschinen – 16.1.4 Magnetisches Drehfeld – 16.1.5 Synchronmaschine – 16.1.6 Asynchronmotoren
16.2 Elektromagnete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.3 Thermische Wirkungen des elektrischen Stromes . . . . . . . . . . . . . . . .
G73 G74
16.3.1 Widerstandserwärmung – 16.3.2 Bogenentladung
16.4 Chemische Wirkungen des elektrischen Stromes . . . . . . . . . . . . . . . .
G74
16.4.1 Primärelemente – 16.4.2 Akkumulatoren
16.5 Direkte Energiewandlung, fotovoltaischer Effekt, Solarzellen . . . . . . .
17
Übertragung elektrischer Energie . . . . . . . . . . . . . . . . . . . . . . . .
17.1 Leistungsdichte, Spannungsabfall . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.2 Stabilitätsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.3 Grundsätzliches zum Berührungsschutz . . . . . . . . . . . . . . . . . . . . . . .
G75 G76 G76 G77 G77
17.3.1 Körperströme – 17.3.2 Schutzmaßnahmen
18
Umformung elektrischer Energie . . . . . . . . . . . . . . . . . . . . . . . . .
18.1 Schalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.2 Gleichrichter, Wechselrichter, Umrichter . . . . . . . . . . . . . . . . . . . . . .
G78 G78 G80
18.2.1 Leistungselektronik – 18.2.2 Netzgeführte Stromrichter mit natürlicher Kommutierung – 18.2.3 Selbstgeführte Stromrichter mit Zwangskommutierung oder abschaltbaren Ventilen
Nachrichtentechnik K. Hoffmann, W. Mathis 19
Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19.1 Signal, Information, Nachricht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G82 G82
19.1.1 Beschreibung zeitabhängiger Signale – 19.1.2 Deterministische und stochastische Signale – 19.1.3 Symbolische Darstellungsweise, Bewertung – 19.1.4 Unverschlüsselte und codierte Darstellung
19.2 Aufbereitung, Übertragung, Verarbeitung . . . . . . . . . . . . . . . . . . . . . .
G83
19.2.1 Grundprinzip der Signalübertragung – 19.2.2 Eigenschaften von Quellen und Senken – 19.2.3 Grundschema der Kommunikation – 19.2.4 Betriebsweise der Vielfachnutzung
19.3 Schnittstelle, Funktionsblock, System . . . . . . . . . . . . . . . . . . . . . . . .
G84
19.3.1 Konstruktive und funktionelle Abgrenzung – 19.3.2 Mathematische Beschreibungsformen – 19.3.3 Darstellung in Funktionsblockbildern – 19.3.4 Zusammenwirken und Betriebsverhalten
20
Signaleigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20.1 Signaldynamik, Verzerrungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G85 G85
20.1.1 Dämpfungsmaß und Pegelangaben – 20.1.2 Lineare und nichtlineare Verzerrungen
20.2 Auflösung, Störungen, Störabstand . . . . . . . . . . . . . . . . . . . . . . . . . . .
G86
Inhaltsverzeichnis
20.2.1 Empfindlichkeit und Aussteuerung – 20.2.2 Störungsarten und Auswirkungen – 20.2.3 Maßnahmen zur Störverminderung
20.3 Informationsfluss, Nachrichtengehalt . . . . . . . . . . . . . . . . . . . . . . . . .
G87
20.3.1 Herleitung des Entscheidungsbaumes – 20.3.2 Darstellung mit Nachrichtenquader – 20.3.3 Grenzwerte und Mittelungszeitraum – 20.3.4 Kanalkapazität und Informationsverlust
20.4 Relevanz, Redundanz, Fehlerkorrektur . . . . . . . . . . . . . . . . . . . . . . . .
G88
20.4.1 Erkennungssicherheit bei Mustern – 20.4.2 Störeinflüsse und Redundanz – 20.4.3 Fehlererkennung und Fehlerkorrektur
21
Beschreibungsweisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21.1 Signalfilterung, Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G89 G89
21.1.1 Reichweite des Filterungsbegriffes – 21.1.2 Lineare und nichtlineare Verzerrungen – 21.1.3 Redundanzverteilung in Mustern – 21.1.4 Kreuzund Autokorrelation – 21.1.5 Änderung der Redundanzverteilung
21.2 Analoge und digitale Signalbeschreibung . . . . . . . . . . . . . . . . . . . . . .
G90
21.2.1 Lineare Beschreibungsweise, Überlagerung – 21.2.2 Beschreibung nichtlinearer Zusammenhänge – 21.2.3 Parallele und serielle Bearbeitung
22
Aufbereitungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22.1 Basisbandsignale, Signalwandler . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G91 G91
22.1.1 Dynamik der Signalquellen – 22.1.2 Direktwandler, Steuerungswandler
22.2 Abtastung, Quantisierung, Codierung . . . . . . . . . . . . . . . . . . . . . . . . .
G93
22.2.1 Zeitquantisierung, Abtasttheorem – 22.2.2 Amplitudenquantisierung – 22.2.3 Differenz- und Blockcodierung – 22.2.4 Quellen- und Kanalcodierung
22.3 Sinusträger- und Pulsmodulation . . . . . . . . . . . . . . . . . . . . . . . . . . . .
G95
22.3.1 Modulationsprinzip und Darstellungsarten – 22.3.2 Zwei-, Ein- und Restseitenbandmodulation – 22.3.3 Frequenz- und Phasenmodulation – 22.3.4 Zeitkontinuierliche Umtastmodulation – 22.3.5 Kontinuierliche Pulsmodulation – 22.3.6 Pulscode-, Deltaund Sigma-Delta Modulation
22.4 Raum-, Frequenz- und Zeitmultiplex . . . . . . . . . . . . . . . . . . . . . . . . . G100 22.4.1 Baum- und Matrixstruktur – 22.4.2 Durchschalt- und Speicherverfahren – 22.4.3 Zugänglichkeit und Blockierung – 22.4.4 Trägerfrequenzverfahren – 22.4.5 Geschlossene und offene Systeme – 22.4.6 Zeitschlitz- und Amplitudenauswertung
23 Signalübertragung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G103 23.1 Kanaleigenschaften, Übertragungsrate . . . . . . . . . . . . . . . . . . . . . . . . G103 23.1.1 Eigenschaften, Verzerrungen, Entzerrung – 23.1.2 Nutzungsgrad und Kompressionssysteme
23.2 Leitungsgebundene Übertragungswege . . . . . . . . . . . . . . . . . . . . . . . G104 23.2.1 Symmetrische und unsymmetrische Leitungen – 23.2.2 Hohlleiterund Glasfaserarten – 23.2.3 Kabelnetze
23.3 Datennetze, integrierte Dienste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G106 23.3.1 Netzgestaltung, Vermittlungsprotokoll – 23.3.2 Fernschreiben, Bildfernübertragung – 23.3.3 Verbundnetze mit Dienstintegration
23.4 Richtfunk, Rundfunk, Sprechfunk . . . . . . . . . . . . . . . . . . . . . . . . . . . G107 23.4.1 Funkwege, Antennen, Wellenausbreitung – 23.4.2 Punkt-zu-Punkt-Verbindung, Systemparameter – 23.4.3 Ton- und Fernsehrundfunk – 23.4.4 Stationärer und mobiler Sprechfunk
24 Signalverarbeitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G109 24.1 Detektionsverfahren, Funkmessung . . . . . . . . . . . . . . . . . . . . . . . . . . G109 24.1.1 Detektionsprinzipien, Auflösungsgrenze – 24.1.2 Aussteuerung und Verzerrungen – 24.1.3 Amplituden- und Frequenzdemodulation – 24.1.4 Pulsdemodulation, Augendiagramm – 24.1.5 Funkmessprinzip und Signalauswertung
24.2 Signalrekonstruktion, Signalspeicherung . . . . . . . . . . . . . . . . . . . . . . G112 24.2.1 Systemadaption und Umsetzalgorithmen – 24.2.2 Speicherdichte, Schreibund Leserate – 24.2.3 Flüchtige und remanente Speicherung – 24.2.4 Magnetische, elektrische und optische Speicher
XXXIX
XL
Inhaltsverzeichnis
24.3 Signalverarbeitung und Signalvermittlung . . . . . . . . . . . . . . . . . . . . . G114 24.3.1 Strukturen für die Verarbeitung analoger und digitaler Signale – 24.3.2 Signalauswertung und Parametersteuerung – 24.3.3 Rekursion, Adaption, Stabilität, Verklemmung – 24.3.4 Netzarten, Netzführung, Ausfallverhalten – 24.3.5 Belegungsdichte, Verlust und Wartezeitsysteme
Elektronik K. Hoffmann, W. Mathis, G. Wiesemann 25 Analoge Grundschaltungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G117 25.1 Passive Netzwerke (RLC-Schaltungen) . . . . . . . . . . . . . . . . . . . . . . . G117 25.1.1 Tief- und Hochpassschaltung – 25.1.2 Differenzier- und Integrierglieder – 25.1.3 Bandpässe, Bandsperren, Allpässe – 25.1.4 Resonanzfilter und Übertrager
25.2 Nichtlineare Zweipole (Dioden) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G120 25.2.1 Diodenverhalten (Beschreibung) – 25.2.2 Gleichrichterschaltungen – 25.2.3 Mischer und Demodulatoren – 25.2.4 Besondere Diodenschaltungen
25.3 Aktive Dreipole (Transistoren) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G124 25.3.1 Transistorverhalten – 25.3.2 Lineare Kleinsignalverstärker – 25.3.3 Lineare Großsignalverstärker (A- und B-Betrieb) und Sinusoszillatoren – 25.3.4 Nichtlineare Großsignalverstärker, Flip-Flop und Relaxationsoszillatoren
25.4 Operationsverstärker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G135 25.4.1 Verstärkung – 25.4.2 Idealer und realer Operationsverstärker – 25.4.3 Komparatoren – 25.4.4 Anwendungen des Umkehrverstärkers – 25.4.5 Anwendungen des Elektrometerverstärkers – 25.4.6 Mitkopplungsschaltungen (Schmitt-Trigger)
26 Digitale Grundschaltungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G143 26.1 Gatter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G143 26.1.1 Diodengatter – 26.1.2 Der Transistor als Inverter – 26.1.3 DTL-Gatter – 26.1.4 TTL-Gatter – 26.1.5 Schaltkreisfamilien (Übersicht) – 26.1.6 Beispiele digitaler Schaltnetze
26.2 Ein-Bit-Speicher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G149 26.2.1 Einfache Kippschaltungen – 26.2.2 Getaktete SR-Flipflops – 26.2.3 Flipflops mit Zwischenspeicherung (Master-Slave-Flipflops, Zählflipflops)
26.3 Schaltwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G153 26.3.1 Auffang- und Schieberegister – 26.3.2 Zähler
27 Halbleiterbauelemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G155 27.1 Grundprinzipien elektronischer Halbleiterbauelemente . . . . . . . . . . . . G155 27.1.1 Ladungsträger in Silizium – 27.1.2 Das Bändermodell – 27.1.3 Stromleitung in Halbleitern – 27.1.4 Ausgleichsvorgänge bei der Injektion von Ladungsträgern
27.2 Halbleiterdioden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G159 27.2.1 Aufbau und Wirkungsweise des PN-Überganges – 27.2.2 Der PN-Übergang in Flusspolung – 27.2.3 Der PN-Übergang in Sperrpolung – 27.2.4 Durchbruchmechanismen – 27.2.5 Kennliniengleichung des PN-Überganges – 27.2.6 Zenerdioden – 27.2.7 Tunneldioden – 27.2.8 Kapazitätsdioden („Varaktoren“) – 27.2.9 Leistungsgleichrichterdioden, PIN-Dioden – 27.2.10 Mikrowellendioden, Rückwärtsdioden
27.3 Bipolare Transistoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G164 27.3.1 Prinzip und Wirkungsweise – 27.3.2 Universaltransistoren. Kleinleistungstransistoren – 27.3.3 Schalttransistoren
27.4 Halbleiterleistungsbauelemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G167 27.4.1 Der Thyristor – 27.4.2 Der abschaltbare Thyristor – 27.4.3 ZweirichtungsThyristordiode (Diac) – 27.4.4 Bidirektionale Thyristordiode (Triac)
27.5 Feldeffektbauelemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G170 27.5.1 Sperrschicht-Feldeffekt-Transistoren (Junction-FET, PN-FET, MSFET oder JFET) – 27.5.2 Feldeffekttransistoren mit isoliertem Gate (IG-FET, MISFET, MOSFET oder MNSFET)
Inhaltsverzeichnis
27.6 Optoelektronische Halbleiterbauelemente . . . . . . . . . . . . . . . . . . . . . G174 27.6.1 Innerer Fotoeffekt – 27.6.2 Der Fotowiderstand – 27.6.3 Der PN-Übergang bei Lichteinwirkung – 27.6.4 Der Fototransistor – 27.6.5 Die Lumineszenzdiode (LED)
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G177
H
Messtechnik
H.-R. Tränkler, G. Fischerauer 1
Grundlagen der Messtechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H1 H1
1.1.1 Messsysteme und Messketten – 1.1.2 Anwendungsgebiete und Aufgabenstellungen der Messtechnik
1.2
Übertragungseigenschaften von Messgliedern . . . . . . . . . . . . . . . . . .
H2
1.2.1 Statische Kennlinien von Messgliedern – 1.2.2 Dynamische Übertragungseigenschaften von Messgliedern – 1.2.3 Testfunktionen und Übergangsfunktionen für Übertragungsglieder – 1.2.4 Das Frequenzverhalten des Übertragungsgliedes – 1.2.5 Das Frequenzverhalten des Übertragungsgliedes 2. Ordnung – 1.2.6 Sprungantwort eines Übertragungsgliedes 2. Ordnung – 1.2.7 Frequenzgang eines Übertragungsgliedes 2. Ordnung – 1.2.8 Kenngrößen für Messglieder höherer Ordnung
1.3
Messfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H9
1.3.1 Zufällige und systematische Fehler – 1.3.2 Definition von Fehlern, Fehlerkurven und Fehleranteilen – 1.3.3 Linearitätsfehler und zulässige Fehlergrenzen – 1.3.4 Einflussgrößen und Einflusseffekt – 1.3.5 Diskrete Verteilungsfunktionen zufälliger Messwerte – 1.3.6 Die Normalverteilung – 1.3.7 Gauß’sche Fehlerwahrscheinlichkeit – 1.3.8 Wahrscheinlichkeitspapier – 1.3.9 Fehlerfortpflanzung zufälliger Fehler – 1.3.10 Fehlerfortpflanzung systematischer Fehler
2
Strukturen der Messtechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Messsignalverarbeitung durch strukturelle Maßnahmen . . . . . . . . . . .
H15 H15
2.1.1 Die Kettenstruktur – 2.1.2 Die Parallelstruktur (Differenzprinzip) – 2.1.3 Die Kreisstruktur
2.2 2.3
Das Modulationsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Struktur eines digitalen Instrumentierungssystems . . . . . . . . . . . . . . .
H18 H19
2.3.1 Erhöhung des nutzbaren Informationsgehalts – 2.3.2 Struktur von Mikroelektroniksystemen mit dezentraler Intelligenz
3
Messgrößenaufnehmer (Sensoren) . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Sensoren und deren Umfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H21 H21
3.1.1 Aufgabe der Sensoren – 3.1.2 Messeffekt und Einflusseffekt – 3.1.3 Anforderungen an Sensoren – 3.1.4 Signalform der Sensorsignale
3.2
Sensoren für geometrische und kinematische Größen . . . . . . . . . . . . .
H22
3.2.1 Resistive Weg- und Winkelaufnehmer – 3.2.2 Induktive Weg- und Längenaufnehmer – 3.2.3 Kapazitive Aufnehmer für Weg und Füllstand – 3.2.4 Magnetische Aufnehmer – 3.2.5 Codierte Weg- und Winkelaufnehmer – 3.2.6 Inkrementale Aufnehmer – 3.2.7 Laser-Interferometer – 3.2.8 Drehzahlaufnehmer – 3.2.9 Beschleunigungsaufnehmer
3.3
Sensoren für mechanische Beanspruchungen . . . . . . . . . . . . . . . . . . .
H31
3.3.1 Dehnungsmessung mit Dehnungsmessstreifen – 3.3.2 Kraftmessung mit Dehnungsmessstreifen – 3.3.3 Druckmessung mit Dehnungsmessstreifen – 3.3.4 Drehmomentmessung mit Dehnungsmessstreifen – 3.3.5 Messung von Kräften über die Auslenkung von Federkörpern – 3.3.6 Messung von Drücken über die Auslenkung von Federkörpern – 3.3.7 Kraftmessung über Schwingsaiten – 3.3.8 Waage mit elektrodynamischer Kraftkompensation – 3.3.9 Piezoelektrische Kraft- und Druckaufnehmer
3.4
Sensoren für strömungstechnische Kenngrößen . . . . . . . . . . . . . . . . . 3.4.1 Durchflussmessung nach dem Wirkdruckverfahren – 3.4.2 SchwebekörperDurchflussmessung – 3.4.3 Durchflussmessung über magnetische Induktion – 3.4.4 Ultraschall-Durchflussmessung – 3.4.5 Turbinen-Durchflussmesser (mittelbare Volumenzähler mit Messflügeln) – 3.4.6 Verdrängungszähler (unmittelbare Volumenzähler)
H36
XLI
XLII
Inhaltsverzeichnis
3.5
Sensoren zur Temperaturmessung . . . . . . . . . . . . . . . . . . . . . . . . . . .
H39
3.5.1 Platin-Widerstandsthermometer – 3.5.2 Andere Widerstandsthermometer – 3.5.3 Thermoelemente als Temperaturaufnehmer – 3.5.4 Strahlungsthermometer (Pyrometer)
3.6
Mikrosensorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H44
3.6.1 Herstellungstechnologien – 3.6.2 Mikrosensoren für mechanische Größen – 3.6.3 Mikrosensoren für Temperatur – 3.6.4 Mikrosensoren für (bio)chemische Größen – 3.6.5 Mikrosensoren für magnetische Größen
3.7
Sensorspezifische Messsignalverarbeitung . . . . . . . . . . . . . . . . . . . . .
H47
3.7.1 Analoge Messsignalverarbeitung – 3.7.2 Inkrementale Messsignalverarbeitung – 3.7.3 Digitale Grundverknüpfungen und Grundfunktionen – 3.7.4 Physikalische Modellfunktionen für einen Sensor – 3.7.5 Skalierung und Linearisierung von Sensorkennlinien durch Interpolation – 3.7.6 Interpolation von Sensorkennlinien mit kubischen Splines – 3.7.7 Ausgleichskriterien zur Approximation von Sensorkennlinien – 3.7.8 Korrektur von Einflusseffekten auf Sensorkennlinien – 3.7.9 Dynamische Korrektur von Sensoren
4
Messschaltungen und Messverstärker . . . . . . . . . . . . . . . . . . . . .
4.1
Signalumformung mit verstärkerlosen Messschaltungen . . . . . . . . . . .
H53 H53
4.1.1 Strom-Spannungs-Umformung mit Messwiderstand – 4.1.2 Spannungsteiler und Stromteiler – 4.1.3 Direktanzeigende Widerstandsmessung
4.2
Messbrücken und Kompensatoren . . . . . . . . . . . . . . . . . . . . . . . . . . .
H56
4.2.1 Qualitative Behandlung der Prinzipschaltungen – 4.2.2 Spannungs- und Stromkompensation – 4.2.3 Messbrücken im Ausschlagverfahren (Teilkompensation) – 4.2.4 Wheatstone-Brücke im Abgleichverfahren – 4.2.5 Wechselstrombrücken
4.3
Grundschaltungen von Messverstärkern . . . . . . . . . . . . . . . . . . . . . . .
H60
4.3.1 Operationsverstärker – 4.3.2 Anwendung von Operationsverstärkern als reine Nullverstärker – 4.3.3 Das Prinzip der Gegenkopplung am Beispiel des reinen Spannungsverstärkers – 4.3.4 Die vier Grundschaltungen gegengekoppelter Messverstärker
4.4
Ausgewählte Messverstärker-Schaltungen . . . . . . . . . . . . . . . . . . . . .
H63
4.4.1 Vom Stromverstärker mit Spannungsausgang zum Invertierer – 4.4.2 Aktive Brückenschaltung – 4.4.3 Addier- und Subtrahierverstärker – 4.4.4 Der Elektrometerverstärker (Instrumentation Amplifier) – 4.4.5 Präzisionsgleichrichtung – 4.4.6 Aktive Filter – 4.4.7 Ladungsverstärker – 4.4.8 Integrationsverstärker für Spannungen
5
Analoge Messtechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1
Analoge Messwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H67 H67
5.1.1 Prinzip des linearen Drehspulmesswerks – 5.1.2 Statische Eigenschaften des linearen Drehspulmesswerks
5.2
Funktionsbildung und Verknüpfung mit Messwerken . . . . . . . . . . . . .
H69
5.2.1 Kernmagnetmesswerk mit radialem Sinusfeld – 5.2.2 Quotientenbestimmung mit Kreuzspulmesswerken – 5.2.3 Bildung von linearen Mittelwerten und Extremwerten – 5.2.4 Bildung von quadratischen Mittelwerten – 5.2.5 Multiplikation mit elektrodynamischen Messwerken – 5.2.6 Integralwertbestimmung mit Induktionszählern
5.3
Prinzip und Anwendung des Elektronenstrahloszilloskops . . . . . . . . .
H75
5.3.1 Elektronenstrahlröhre. Ablenkempfindlichkeit – 5.3.2 Darstellung des zeitlichen Verlaufs periodischer Messsignale – 5.3.3 Blockschaltbild eines Oszilloskops in Standardausführung – 5.3.4 Anwendung eines Oszilloskops im x,y-Betrieb – 5.3.5 Frequenzkompensierter Eingangsteiler
6
Digitale Messtechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
Quantisierung und digitale Signaldarstellung . . . . . . . . . . . . . . . . . . .
H79 H79
6.1.1 Informationsverlust durch Quantisierung – 6.1.2 Der relative Quantisierungsfehler
6.2
Abtasttheorem und Abtastfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H80
6.2.1 Das Shannon’sche Abtasttheorem – 6.2.2 Frequenzgang bei Extrapolation nullter Ordnung – 6.2.3 Abtastfehler eines Haltekreises
6.3
Digitale Zeit- und Frequenzmessung . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Prinzip der digitalen Zeit- und Frequenzmessung – 6.3.2 Der Quarzoszillator – 6.3.3 Digitale Zeitmessung – 6.3.4 Digitale Frequenzmessung – 6.3.5 Auflösung und
H82
Inhaltsverzeichnis
XLIII
Messzeit bei der Periodendauer- bzw. Frequenzmessung – 6.3.6 Reziprokwertbildung und Multiperiodendauermessung
6.4
Analog-Digital-Umsetzung über Zeit oder Frequenz als Zwischengrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
H86
6.4.1 Charge-balancing-Umsetzer – 6.4.2 Dual-slope-Umsetzer – 6.4.3 Integrierende Filterung bei integrierenden Umsetzern
6.5
Analog-Digital-Umsetzung nach dem Kompensationsprinzip . . . . . . .
H89
6.5.1 Prinzip – 6.5.2 Digital-Analog-Umsetzer mit bewerteten Leitwerten – 6.5.3 Digital-Analog-Umsetzer mit Widerstandskettenleiter – 6.5.4 Nachlaufumsetzer mit Zweirichtungszähler – 6.5.5 Analog-Digital-Umsetzer mit sukzessiver Approximation
6.6
Schnelle Analog-Digital-Umsetzung und Transientenspeicherung . . .
H93
6.6.1 Parallele Analog-Digital-Umsetzer (Flash-Converter) – 6.6.2 Transientenspeicherung
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I
H95
Regelungs- und Steuerungstechnik
H. Unbehauen, F. Ley Regelungstechnik H. Unbehauen 1
Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2 1.3 1.4
Einordnung der Regelungs- und Steuerungstechnik . . . . . . . . . . . . . . Darstellung im Blockschaltbild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Unterscheidung zwischen Regelung und Steuerung . . . . . . . . . . . . . . Beispiele von Regel- und Steuerungssystemen . . . . . . . . . . . . . . . . . .
2
Modelle und Systemeigenschaften . . . . . . . . . . . . . . . . . . . . . . . .
2.1 2.2
Mathematische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Systemeigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I1 I1 I1 I2 I3 I4 I4 I5
2.2.1 Lineare und nichtlineare Systeme – 2.2.2 Systeme mit konzentrierten und verteilten Parametern – 2.2.3 Zeitvariante und zeitinvariante Systeme – 2.2.4 Systeme mit kontinuierlicher und diskreter Arbeitsweise – 2.2.5 Systeme mit deterministischen oder stochastischen Variablen – 2.2.6 Kausale Systeme – 2.2.7 Stabile und instabile Systeme – 2.2.8 Eingrößen- und Mehrgrößensysteme
3
Beschreibung linearer kontinuierlicher Systeme im Zeitbereich
3.1
Beschreibung mittels Differenzialgleichungen . . . . . . . . . . . . . . . . . .
I9 I9
3.1.1 Elektrische Systeme – 3.1.2 Mechanische Systeme – 3.1.3 Thermische Systeme
3.2
Beschreibung mittels spezieller Ausgangssignale . . . . . . . . . . . . . . . .
I11
3.2.1 Die Übergangsfunktion (Normierte Sprungantwort) – 3.2.2 Die Gewichtsfunktion (Impulsantwort) – 3.2.3 Das Faltungsintegral (Duhamel’sches Integral)
3.3
Zustandsraumdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I12
3.3.1 Zustandsraumdarstellung für Eingrößensysteme – 3.3.2 Zustandsraumdarstellung für Mehrgrößensysteme
4
Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 4.2 4.3
Die Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Fourier-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Begriff der Übertragungsfunktion . . . . . . . . . . . . . . . . . . . . . . . .
I14 I14 I15 I16
4.3.1 Definition – 4.3.2 Pole und Nullstellen der Übertragungsfunktion – 4.3.3 Das Rechnen mit Übertragungsfunktionen – 4.3.4 Zusammenhang zwischen G(s) und der Zustandsraumdarstellung – 4.3.5 Die komplexe G-Ebene
4.4
Die Frequenzgangdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Definition – 4.4.2 Ortskurvendarstellung des Frequenzganges – 4.4.3 Darstellung des Frequenzganges durch Frequenzkennlinien (Bode-Diagramm)
I18
XLIV
Inhaltsverzeichnis
4.5
Das Verhalten der wichtigsten Übertragungsglieder . . . . . . . . . . . . . .
I20
4.5.1 Das proportional wirkende Glied (P-Glied) – 4.5.2 Das integrierende Glied (I-Glied) – 4.5.3 Das differenzierende Glied (D-Glied) – 4.5.4 Das Verzögerungsglied 1. Ordnung (PT1 -Glied) – 4.5.5 Das Verzögerungsglied 2. Ordnung (PT2 -Glied und PT2 S-Glied) – 4.5.6 Bandbreite eines Übertragungsgliedes – 4.5.7 Systeme mit minimalem und nichtminimalem Phasenverhalten
5
Das Verhalten linearer kontinuierlicher Regelkreise . . . . . . . . .
5.1 5.2 5.3
Dynamisches Verhalten des Regelkreises . . . . . . . . . . . . . . . . . . . . . . Stationäres Verhalten des Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . Der PID-Regler und die aus ihm ableitbaren Reglertypen . . . . . . . . . .
6
Stabilität linearer kontinuierlicher Regelsysteme . . . . . . . . . . . .
6.1 6.2
Definition der Stabilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebraische Stabilitätskriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I26 I26 I27 I28 I31 I31 I32
6.2.1 Das Hurwitz-Kriterium – 6.2.2 Das Routh-Kriterium
6.3
Das Nyquist-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I34
6.3.1 Das Nyquist-Kriterium in der Ortskurvendarstellung – 6.3.2 Das NyquistKriterium in der Frequenzkennliniendarstellung – 6.3.3 Vereinfachte Formen des Nyquist-Kriteriums
7
Das Wurzelortskurvenverfahren . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 7.2
Der Grundgedanke des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . Regeln zur Konstruktion von Wurzelortskurven . . . . . . . . . . . . . . . . .
8
Entwurfsverfahren für lineare kontinuierliche Regelsysteme . .
8.1 8.2
Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entwurf im Zeitbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I37 I37 I38 I40 I40 I40
8.2.1 Gütemaße im Zeitbereich – 8.2.2 Integralkriterien – 8.2.3 Quadratische Regelfläche – 8.2.4 Ermittlung optimaler Einstellwerte eines Reglers nach dem Kriterium der minimalen quadratischen Regelfläche – 8.2.5 Empirisches Vorgehen
8.3
Entwurf im Frequenzbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I45
8.3.1 Kenndaten des geschlossenen Regelkreises im Frequenzbereich und deren Zusammenhang mit den Gütemaßen im Zeitbereich – 8.3.2 Kenndaten des offenen Regelkreises und deren Zusammenhang mit den Gütemaßen des geschlossenen Regelkreises im Zeitbereich – 8.3.3 Reglerentwurf nach dem FrequenzkennlinienVerfahren – 8.3.4 Korrekturglieder für Phase und Amplitude – 8.3.5 Reglerentwurf mit dem Wurzelortskurvenverfahren
8.4
Analytische Entwurfsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I50
8.4.1 Vorgabe des Verhaltens des geschlossenen Regelkreises – 8.4.2 Das Verfahren nach Truxal-Guillemin – 8.4.3 Algebraisches Entwurfsverfahren
9
Nichtlineare Regelsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 9.2 9.3
Allgemeine Eigenschaften nichtlinearer Regelsysteme . . . . . . . . . . . . Regelkreis mit Zwei- und Dreipunktreglern . . . . . . . . . . . . . . . . . . . . Analyse nichtlinearer Regelsysteme mithilfe der Beschreibungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . .
I55 I55 I55 I57
9.3.1 Definition der Beschreibungsfunktion – 9.3.2 Stabilitätsuntersuchung mittels der Beschreibungsfunktion
9.4
Analyse nichtlinearer Regelsysteme in der Phasenebene . . . . . . . . . . .
I58
9.4.1 Zustandskurven – 9.4.2 Anwendung der Methode der Phasenebene zur Untersuchung von Relaissystemen
9.5
Stabilitätstheorie nach Ljapunow . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I60
9.5.1 Der Grundgedanke der direkten Methode von Ljapunow – 9.5.2 Stabilitätssätze von Ljapunow – 9.5.3 Ermittlung geeigneter Ljapunow-Funktionen
9.6
Das Stabilitätskriterium von Popov . . . . . . . . . . . . . . . . . . . . . . . . . .
I61
9.6.1 Absolute Stabilität – 9.6.2 Formulierung des Popov-Kriteriums – 9.6.3 Geometrische Auswertung der Popov-Ungleichung
10
Lineare zeitdiskrete Systeme: Digitale Regelung . . . . . . . . . . . .
10.1 Arbeitsweise digitaler Regelsysteme . . . . . . . . . . . . . . . . . . . . . . . . .
I63 I63
Inhaltsverzeichnis
10.2 Darstellung im Zeitbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Die z-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I64 I66
10.3.1 Definition der z-Transformation
10.4 Darstellung im Frequenzbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I66
10.4.1 Die Übertragungsfunktion diskreter Systeme – 10.4.2 Die z-Übertragungsfunktion kontinuierlicher Systeme
10.5 Stabilität diskreter Regelsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I68
10.5.1 Stabilitätsbedingungen – 10.5.2 Stabilitätskriterien
10.6 Regelalgorithmen für die digitale Regelung . . . . . . . . . . . . . . . . . . . .
I70
10.6.1 PID-Algorithmus – 10.6.2 Der Entwurf diskreter Kompensationsalgorithmen – 10.6.3 Kompensationsalgorithmus für endliche Einstellzeit
11
Zustandsraumdarstellung linearer Regelsysteme . . . . . . . . . . . .
11.1 11.2 11.3 11.4
Allgemeine Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Normalformen für Eingrößensysteme . . . . . . . . . . . . . . . . . . . . . . . . . Steuerbarkeit und Beobachtbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . Synthese linearer Regelsysteme im Zustandsraum . . . . . . . . . . . . . . .
I73 I73 I74 I75 I76
11.4.1 Das geschlossene Regelsystem – 11.4.2 Der Grundgedanke der Reglersynthese – 11.4.3 Die modale Regelung – 11.4.4 Das Verfahren der Polvorgabe – 11.4.5 Optimaler Zustandsregler nach dem quadratischen Gütekriterium – 11.4.6 Das Messproblem
12
Systemidentifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.1 Deterministische Verfahren zur Systemidentifikation . . . . . . . . . . . . .
I80 I80
12.1.1 Wendetangenten- und Zeitprozentkennwerte-Verfahren – 12.1.2 Identifikation im Frequenzbereich – 12.1.3 Berechnung des Frequenzganges aus der Übergangsfunktion – 12.1.4 Berechnung der Übergangsfunktion aus dem Frequenzgang
12.2 Statistische Verfahren zur Systemidentifikation . . . . . . . . . . . . . . . . .
I83
12.2.1 Korrelationsanalyse – 12.2.2 Spektrale Leistungsdichte – 12.2.3 Statistische Bestimmung dynamischer Eigenschaften linearer Systeme – 12.2.4 Systemidentifikation mittels Parameterschätzverfahren
13
Weitere Reglerentwurfsverfahren . . . . . . . . . . . . . . . . . . . . . . . .
13.1 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Einige weitere klassische Regelkreisstrukturen . . . . . . . . . . . . . . . . . .
I86 I86 I86
13.2.1 Vermaschte Regelkreise – 13.2.2 Smith-Prädiktor – 13.2.3 IMC-Regler
13.3 13.4 13.5 13.6 13.7 13.8
Robuste Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modellbasierte prädiktive Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . GMV-Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Adaptive Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nichtlineare Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . „Intelligente“ Regler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I89 I89 I90 I91 I91 I92
Steuerungstechnik F. Ley 14
Binäre Steuerungstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.1 Grundstruktur binärer Steuerungen . . . . . . . . . . . . . . . . . . . . . . . . . . .
I93 I93
14.1.1 Signalflussplan – 14.1.2 Klassifizierung binärer Steuerungen
14.2 Grundlagen der kombinatorischen und der sequentiellen Schaltungen
I95
14.2.1 Kombinatorische Schaltungen – 14.2.2 Synthese und Analyse sequentieller Schaltungen
14.3 Darstellung von Zuständen durch Zustandsgraphen und Petri-Netze . . 14.4 Technische Realisierung von verbindungsprogrammierten Steuerungseinrichtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.4.1 Relaistechnik – 14.4.2 Diskrete Bausteinsysteme (DTL- und TTL-Logikfamilien)
I97 I100
XLV
XLVI
Inhaltsverzeichnis
14.5 Speicherprogrammierbare Steuerungen . . . . . . . . . . . . . . . . . . . . . . .
I100
14.5.1 Sprachen für Steuerungen nach der Norm IEC61131-3 – 14.5.2 SPS und Prozessrechner – 14.5.3 Prozesssignale von Speicherprogrammierbaren Steuerungen
Formelzeichen der Regelungs- und Steuerungstechnik . . . . . . . . . . . . Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J
I116 I117
Technische Informatik
H. Liebig, Th. Flik, P. Rechenberg, H. Mössenböck Mathematische Modelle H. Liebig, P. Rechenberg 1
Boole’sche Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Logische Verknüpfungen und Rechenregeln . . . . . . . . . . . . . . . . . . . .
J3 J3
1.1.1 Grundverknüpfungen – 1.1.2 Ausdrücke – 1.1.3 Axiome – 1.1.4 Sätze
1.2
Boole’sche Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J5
1.2.1 Von der Mengen- zur Vektordarstellung – 1.2.2 Darstellungsmittel
1.3
Normal- und Minimalformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J7
1.3.1 Kanonische Formen Boole’scher Funktionen – 1.3.2 Minimierung von Funktionsgleichungen
1.4
Boole’sche Algebra und Logik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J9
1.4.1 Begriffe – 1.4.2 Logisches Schließen und mathematisches Beweisen in der Aussagenlogik – 1.4.3 Beispiel für einen aussagenlogischen Beweis – 1.4.4 Entscheidbarkeit und Vollständigkeit
2
Automaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Endliche Automaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J11 J12
2.1.1 Automaten mit Ausgabe – 2.1.2 Funktionsweise
2.2
Hardwareorientierte Automatenmodelle . . . . . . . . . . . . . . . . . . . . . . .
J12
2.2.1 Von der Mengen- zur Vektordarstellung – 2.2.2 Darstellungsmittel – 2.2.3 Netzdarstellungen
2.3
Softwareorientierte Automatenmodelle . . . . . . . . . . . . . . . . . . . . . . .
J17
2.3.1 Erkennende Automaten und formale Sprachen – 2.3.2 Erkennende endliche Automaten – 2.3.3 Turingmaschinen – 2.3.4 Grenzen der Modellierbarkeit
Digitale Systeme H. Liebig 3
Schaltnetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Signaldurchschaltung und -verknüpfung . . . . . . . . . . . . . . . . . . . . . . .
J21 J22
3.1.1 Schalter und Schalterkombinationen – 3.1.2 Durchschaltglieder – 3.1.3 Verknüpfungsglieder
3.2
Schaltungen für Volladdierer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J26
3.2.1 Volladdierer mit Durchschaltgliedern – 3.2.2 Volladdierer mit Verknüpfungsgliedern
3.3
Schaltnetze zur Datenverarbeitung und zum Datentransport . . . . . . . .
J28
3.3.1 Arithmetisch-logische Einheiten – 3.3.2 Multiplexer – 3.3.3 Shifter – 3.3.4 Busse
3.4
Schaltnetze zur Datencodierung/-decodierung und -speicherung . . . . .
J32
3.4.1 Codierer, Decodierer – 3.4.2 Festwertspeicher – 3.4.3 Logikfelder – 3.4.4 Beispiel eines PLA-Steuerwerks
4
Schaltwerke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1
Signalverzögerung und -speicherung . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Flipflops, Darstellung mit Taktsignalen – 4.1.2 Flipflops, Abstraktion von Taktsignalen
J35 J36
Inhaltsverzeichnis
4.2
Registertransfer und Datenspeicherung . . . . . . . . . . . . . . . . . . . . . . .
J39
4.2.1 Flipflops auf der Registertransfer-Ebene – 4.2.2 Register, Speicherzellen – 4.2.3 Schreib-/Lesespeicher – 4.2.4 Speicher mit speziellem Zugriff
4.3
Schaltwerke zur Datenverarbeitung . . . . . . . . . . . . . . . . . . . . . . . . . .
J42
4.3.1 Zähler – 4.3.2 Shiftregister – 4.3.3 Logik-/Arithmetikwerke
4.4
Schaltwerke zur Programmsteuerung und zur programmgesteuerten Datenverarbeitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J45
4.4.1 PLA- und ROM-Steuerwerke – 4.4.2 Beispiele für programmgesteuerte Datenverarbeitungswerke (Prozessoren)
5
Prozessorstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 5.2
Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Maschinenbefehle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J48 J48 J50
5.2.1 Befehlsformate – 5.2.2 Befehlssatz – 5.2.3 Adressierungsarten
5.3
Akkumulator-Architektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J54
5.3.1 Einadressrechner – 5.3.2 Beispiel für Mikroprogrammierung – 5.3.3 Beispiel zur Maschinenprogrammierung
5.4
Register-Architektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J56
5.4.1 Dreiadressrechner (RISC) – 5.4.2 Beschleunigung durch Fließbandtechnik – 5.4.3 Beispiel zur Maschinenprogrammierung
5.5
Parallel-Architektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J59
5.5.1 Superskalar vs. VLIW – 5.5.2 Fünfbefehlrechner (VLIW) – 5.5.3 Beispiel zur Maschinenprogrammierung
Rechnerorganisation Th. Flik 6
Informationsdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
Zeichen- und Zifferncodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J64 J64
6.1.1 ASCII – 6.1.2 EBCDIC – 6.1.3 Binärcodes für Dezimalziffern (BCD-Codes) – 6.1.4 Oktalcode und Hexadezimalcode
6.2 6.3
Codesicherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Datentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J66 J68
6.3.1 Zustandsgröße – 6.3.2 Bitvektor – 6.3.3 Ganze Zahl – 6.3.4 Gleitpunktzahl – 6.3.5 Vektor
6.4
Maschinen- und Assemblerprogrammierung . . . . . . . . . . . . . . . . . . .
J71
6.4.1 Assemblerschreibweise – 6.4.2 Assembleranweisungen – 6.4.3 Makros – 6.4.4 Unterprogramme
7
Rechnersysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1
Verbindungsstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J76 J77
7.1.1 Ein- und Mehrbussysteme – 7.1.2 Systemaufbau – 7.1.3 Busfunktionen – 7.1.4 Busmerkmale – 7.1.5 Zentrale Busse und Punkt-zu-Punkt-Verbindungen – 7.1.6 Periphere Busse und Punkt-zu-Punkt-Verbindungen
7.2
Speicherorganisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J89
7.2.1 Hauptspeicher – 7.2.2 Speicherverwaltungseinheiten – 7.2.3 Caches – 7.2.4 Hintergrundspeicher
7.3
Ein-/Ausgabeorganisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J98
7.3.1 Prozessorgesteuerte Ein-/Ausgabe – 7.3.2 DMA-Controllergesteuerte Ein-/Ausgabe – 7.3.3 Ein-/Ausgabeprozessor – 7.3.4 Schnittstellen – 7.3.5 Ein-/Ausgabegeräte
7.4
Parallelrechner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J104
7.4.1 Vektorrechner – 7.4.2 Feldrechner – 7.4.3 Speichergekoppelte Mehrprozessorsysteme – 7.4.4 Nachrichtengekoppelte Mehrprozessorsysteme
7.5
Rechnernetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J107
7.5.1 Serielle Datenübertragung – 7.5.2 Weitverkehrsnetze (WANs) – 7.5.3 Lokale Netze (LANs)
7.6
Leistungskenngrößen von Rechnersystemen und ihre Einheiten . . . . .
J112
XLVII
XLVIII
Inhaltsverzeichnis
8 8.1
Betriebssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J114 Betriebssystemarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J114
8.1.1 Stapelbetrieb – 8.1.2 Dialogbetrieb – 8.1.3 Einbenutzer- und Netzsysteme – 8.1.4 Mehrbenutzer- und Mehrprogrammsysteme – 8.1.5 Verteilte Systeme – 8.1.6 Echtzeitsysteme
8.2
Prozessorunterstützung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J116
8.2.1 Privilegierungsebenen – 8.2.2 Traps und Interrupts – 8.2.3 Ausnahmeverarbeitung (exception processing)
8.3
Betriebssystemkomponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J118
8.3.1 Prozessverwaltung – 8.3.2 Interprozesskommunikation – 8.3.3 Speicherverwaltung – 8.3.4 Dateiverwaltung – 8.3.5 Ein-/Ausgabeverwaltung
Programmierung P. Rechenberg, H. Mössenböck 9
Algorithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . J124
9.1 9.2
Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Darstellungsarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J124 J124
9.2.1 Abstraktionsschichten
9.3
Einteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J126
9.3.1 Einteilung nach Strukturmerkmalen – 9.3.2 Einteilung nach Datenstrukturen – 9.3.3 Einteilung nach Aufgabengebiet
9.4
Komplexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Datentypen und Datenstrukturen . . . . . . . . . . . . . . . . . . . . . . . . .
10.1 Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J129 J130 J130
10.1.1 Datentyp – 10.1.2 Datenstruktur
10.2 Elementare Datentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Zusammengesetzte Datentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J131 J132
10.3.1 Felder – 10.3.2 Verbunde – 10.3.3 Zeiger
10.4 Verkettete Listen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Bäume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Graphen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7 Hashtabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.8 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.9 Dateien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.10 Abstrakte Datentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Programmiersprachen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1 Begriffe und Einteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J134 J135 J137 J138 J138 J139 J140 J141 J141
11.1.1 Universal- und Spezialsprachen – 11.1.2 Sequenzielle und parallele Sprachen – 11.1.3 Imperative und nichtimperative Sprachen (Denkmodelle)
11.2 Beschreibungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J144
11.2.1 Syntax – 11.2.2 Semantik
11.3 Konstruktionen imperativer Sprachen . . . . . . . . . . . . . . . . . . . . . . . . .
J145
11.3.1 Deklarationen – 11.3.2 Ausdrücke – 11.3.3 Anweisungen – 11.3.4 Prozeduren – 11.3.5 Module – 11.3.6 Klassen – 11.3.7 Ausnahmebehandlung – 11.3.8 Parallelität
11.4 Programmiersprachen für technische Anwendungen . . . . . . . . . . . . . .
J151
11.4.1 Sprachfamilien – 11.4.2 Die Fortran-Familie – 11.4.3 Die Pascal-Familie – 11.4.4 Die Ada-Familie – 11.4.5 Die C-Familie
11.5 Programmbibliotheken für numerisches Rechnen . . . . . . . . . . . . . . . . 11.6 Programmiersysteme für numerisches und symbolisches Rechnen . . .
12
Softwaretechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J155 J156 J156
Inhaltsverzeichnis
12.1 Begriffe, Aufgaben und Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . .
J156
12.1.1 Eigenschaften großer Programme – 12.1.2 Begriff der Softwaretechnik – 12.1.3 Software-Qualität – 12.1.4 Vorgehensmodelle
12.2 Problemanalyse und Anforderungsdefinition . . . . . . . . . . . . . . . . . . . 12.3 Entwurf und Implementierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J159 J160
12.3.1 Grobentwurf – 12.3.2 Feinentwurf – 12.3.3 Mensch-Maschine-Kommunikation
12.4 Testen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
J163
12.4.1 Statische Testmethoden – 12.4.2 Dynamische Testmethoden – 12.4.3 Qualitätssicherung
12.5 Dokumentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6 Werkzeuge der Softwaretechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13 Ausblick: Informatik und Kommunikation . . . . . . . . . . . . . . . . . Formelzeichen zur Programmierung . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K
J165 J167 J168 J168 J168
Entwicklung und Konstruktion
K.-H. Grote, F. Engelmann, W. Beitz† , M. Syrbe, J. Beyerer 1
Produktentstehung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Lebensphasen eines Produkts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K1 K1
1.1.1 Technischer Lebenszyklus – 1.1.2 Wirtschaftlicher Lebenszyklus
1.2
Produktplanung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K2
1.2.1 Bedeutung – 1.2.2 Grundlagen – 1.2.3 Vorgehensschritte
1.3
Produktentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K4
1.3.1 Generelles Vorgehen – 1.3.2 Produktspezifisches Vorgehen
2
Aufbau technischer Produkte . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Funktionszusammenhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K8 K8
2.1.1 Allgemeines – 2.1.2 Spezielle Funktionen
2.2
Wirkzusammenhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K9
2.2.1 Physikalische, chemische und biologische Effekte – 2.2.2 Geometrische und stoffliche Merkmale
2.3 2.4 2.5 2.6
Bauzusammenhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Systemzusammenhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Generelle Zielsetzungen für technische Produkte . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Konstruktionsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Allgemeine Lösungsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K12 K12 K12 K13 K13 K13
3.1.1 Allgemeiner Lösungsprozess – 3.1.2 Systemtechnisches Vorgehen – 3.1.3 Problem- und Systemstrukturierung – 3.1.4 Allgemeine Hilfsmittel
3.2
Methoden des Konzipierens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K16
3.2.1 Intuitiv-betonte Methoden – 3.2.2 Diskursiv-betonte Methoden
3.3
Methoden der Gestaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K17
3.3.1 Grundregeln der Gestaltung – 3.3.2 Gestaltungsprinzipien – 3.3.3 Gestaltungsrichtlinien
3.4
Baustrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K25
3.4.1 Baureihen – 3.4.2 Baukästen – 3.4.3 Differenzialbauweise – 3.4.4 Integralbauweise – 3.4.5 Verbundbauweise
3.5 3.6
Methoden der Auswahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Praxisbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K29 K32
3.6.1 Präzisierung der Aufgabenstellung – 3.6.2 Konzipieren – 3.6.3 Entwerfen
4
Konstruktionselemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K47
XLIX
L
Inhaltsverzeichnis
4.1
Bauteilverbindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K47
4.1.1 Funktionen und generelle Wirkungen – 4.1.2 Formschluss – 4.1.3 Reibschluss – 4.1.4 Stoffschluss – 4.1.5 Allgemeine Anwendungsrichtlinien
4.2
Federn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K50
4.2.1 Funktionen und generelle Wirkungen – 4.2.2 Zug-druckbeanspruchte Metallfedern – 4.2.3 Biegebeanspruchte Metallfedern – 4.2.4 Drehbeanspruchte Metallfedern – 4.2.5 Gummifedern – 4.2.6 Gasfedern – 4.2.7 Allgemeine Anwendungsrichtlinien
4.3
Kupplungen und Gelenke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K54
4.3.1 Funktionen und generelle Wirkungen – 4.3.2 Feste Kupplungen – 4.3.3 Drehstarre Ausgleichskupplungen – 4.3.4 Elastische Kupplungen – 4.3.5 Schaltkupplungen – 4.3.6 Allgemeine Anwendungsrichtlinien
4.4
Lagerungen und Führungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K58
4.4.1 Funktionen und generelle Wirkungen – 4.4.2 Wälzlagerungen und -führungen – 4.4.3 Hydrodynamische Gleitlagerungen und -führungen – 4.4.4 Hydrostatische Gleitlagerungen und -führungen – 4.4.5 Magnetische Lagerungen und -führungen – 4.4.6 Allgemeine Anwendungsrichtlinien
4.5
Mechanische Getriebe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K62
4.5.1 Funktionen und generelle Wirkungen – 4.5.2 Zahnradgetriebe – 4.5.3 Kettengetriebe – 4.5.4 Riemengetriebe – 4.5.5 Reibradgetriebe – 4.5.6 Kurbel-(Gelenk-) und Kurvengetriebe – 4.5.7 Allgemeine Anwendungsrichtlinien
4.6
Hydraulische Getriebe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K68
4.6.1 Funktionen und generelle Wirkungen – 4.6.2 Hydrostatische Getriebe (Hydrogetriebe) – 4.6.3 Hydrodynamische Getriebe (Föttinger-Getriebe) – 4.6.4 Allgemeine Anwendungsrichtlinien
4.7
Elemente zur Führung von Fluiden . . . . . . . . . . . . . . . . . . . . . . . . . . .
K70
4.7.1 Funktionen und generelle Wirkungen – 4.7.2 Rohre – 4.7.3 Absperrund Regelorgane (Armaturen) – 4.7.4 Allgemeine Anwendungsrichtlinien
4.8
Dichtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K72
4.8.1 Funktionen und generelle Wirkungen – 4.8.2 Berührungsfreie Dichtungen zwischen relativ bewegten Teilen – 4.8.3 Berührungsdichtungen zwischen relativ bewegten Teilen (Dynamische Dichtungen) – 4.8.4 Berührungsdichtungen zwischen ruhenden Teilen (Statische Dichtungen) – 4.8.5 Membrandichtungen zwischen relativ bewegten Bauteilen – 4.8.6 Anwendungsrichtlinien
5
Konstruktionsmittel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 5.2
Zeichnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechnerunterstützte Konstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . .
K75 K75 K76
5.2.1 Grundlagen – 5.2.2 Rechnereinsatz in den Konstruktionsphasen
5.3 5.4
Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kostenerkennung, Wertanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K77 K77
5.4.1 Beeinflussbare Kosten – 5.4.2 Methoden der Kostenerkennung – 5.4.3 Wertanalyse
Mensch-Maschine-Wechselwirkungen, Anthropotechnik M. Syrbe, J. Beyerer 6
Anthropotechnisches Basiswissen für Mensch-Maschine-Wechselwirkungen . . . . . . . . . . . . . . . . .
6.1 6.2 6.3 6.4 6.5
Phänomene und Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sinnesorgane, Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Informationsverarbeitung des Menschen, Modelle . . . . . . . . . . . . . . . Gestaltungssystematik für Mensch-Maschine-Systeme . . . . . . . . . . . . Qualitative Gestaltungsregeln, Standards (insbesondere Richtlinien, Normen) . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
K80 K80 K85 K87 K90 K95 K99
Inhaltsverzeichnis
L
Produktion
G. Spur 1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2 1.3 1.4
Produktionsfaktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktivität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Rohstoffgewinnung und -erzeugung durch Urproduktion . . . .
2.1 2.2 2.3 2.4
Biotische und abiotische Rohstoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . Energierohstoffe und Güterrohstoffe . . . . . . . . . . . . . . . . . . . . . . . . . Erschließen und Gewinnen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufbereiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Stoffwandlung durch Verfahrenstechnik . . . . . . . . . . . . . . . . . . .
3.1 3.2 3.3 3.4
Verfahrenstechnische Prozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mechanische Verfahrenstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Thermische Verfahrenstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chemische Reaktionstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Formgebung und Fügen durch Fertigungstechnik . . . . . . . . . . .
4.1
Fertigungsverfahren und Fertigungssysteme: Übersicht . . . . . . . . . . .
L1 L1 L2 L3 L3 L4 L4 L4 L6 L7 L7 L7 L8 L11 L13 L13 L13
4.1.1 Einteilung der Fertigungsverfahren – 4.1.2 Fertigungsgenauigkeit – 4.1.3 Fertigungssysteme und Fertigungsprozesse – 4.1.4 Integrierte flexible Fertigungssysteme
4.2
Urformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L18
4.2.1 Gießen – 4.2.2 Pulvermetallurgie – 4.2.3 Galvanoformen
4.3
Umformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L21
4.3.1 Walzen – 4.3.2 Schmieden – 4.3.3 Strang- und Fließpressen – 4.3.4 Blechumformung
4.4
Trennen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L24
4.4.1 Scherschneiden – 4.4.2 Drehen – 4.4.3 Bohren, Senken, Reiben – 4.4.4 Fräsen – 4.4.5 Hobeln, Stoßen, Räumen, Sägen – 4.4.6 Schleifen – 4.4.7 Honen – 4.4.8 Läppen – 4.4.9 Polieren – 4.4.10 Abtragen
4.5 4.6 4.7
Fügen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beschichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stoffeigenschaft ändern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Produktionsorganisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 5.2 5.3 5.4 5.5
Produktplanung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionspersonalorganisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionsplanung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionssteuerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Produktionsbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Produktionsinformatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 6.2 6.3
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Informationsfluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechnerintegrierter Fabrikbetrieb . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L38 L41 L43 L46 L46 L47 L48 L49 L51 L51 L51 L52 L53 L54
LI
LII
Inhaltsverzeichnis
M
Betriebswirtschaft
W. Plinke, M. Rese 1 2 3 3.1
Gegenstand der Betriebswirtschaftslehre . . . . . . . . . . . . . . . . . . Das Grundmodell der Betriebswirtschaftslehre . . . . . . . . . . . . . Konstitutive Entscheidungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gründung des Betriebes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
M1 M2 M2 M2
3.1.1 Einflussfaktoren der Gründungsentscheidung – 3.1.2 Der betriebliche Standort
3.2 3.3 3.4
Das Wachstum des Betriebes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Beendigung des Betriebes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Verfassung des Betriebes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
M3 M4 M4
3.4.1 Die Rechtsform des Betriebes – 3.4.2 Die Mitbestimmung
3.5
Betriebliche Zusammenschlüsse . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Funktionsbezogene Entscheidungen . . . . . . . . . . . . . . . . . . . . . .
4.1
Das Realgütersystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
M7 M8 M8
4.1.1 Beschaffung – 4.1.2 Produktion – 4.1.3 Absatz
4.2 4.3
Das Finanzsystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das soziale System . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
M10 M11
4.3.1 Die Organisation des Betriebes – 4.3.2 Personalwirtschaft
4.4
Das Informationssystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
M15
4.4.1 Informationssysteme des Betriebes – 4.4.2 Das externe Rechnungswesen – 4.4.3 Das interne Rechnungswesen
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . M24
N
Management
H. Buck, J. Leyh, P. Ohlhausen, M. Richter, D. Spath, J. Warschat Qualitätsmangement M. Richter, D. Spath 1
Entwicklung des Qualitätsmanagements . . . . . . . . . . . . . . . . . . .
1.1 1.2
Aufgaben des Qualitätsmanagements . . . . . . . . . . . . . . . . . . . . . . . . . Total Quality Management . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 3
Bedeutung des Qualitätsmanagements . . . . . . . . . . . . . . . . . . . . Wesentliche Methoden des Qualitätsmanagements . . . . . . . . . .
3.1 3.2 3.3 3.4 3.5
Quality Function Deployment (QFD) . . . . . . . . . . . . . . . . . . . . . . . . . Fehlermöglichkeits- und -Einfluss-Analyse (FMEA) . . . . . . . . . . . . . Qualitätsregelkartentechnik im Rahmen der statistischen Prozesslenkung (SPC) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Six Sigma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8D-Report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Bewertung von Qualitätsmanagementsystemen . . . . . . . . . . . . .
4.1 4.2
Das Qualitäts-Audit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . EFQM-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
N2 N2 N3 N5 N7 N7 N9 N11 N13 N14 N15 N15 N18
Personalmanagement H. Buck, D. Spath 5
Aufgaben des Personalmanagements . . . . . . . . . . . . . . . . . . . . . .
5.1
Der zentrale Fokus des Personalmanagements: Der Mensch . . . . . . . .
N20 N21
Inhaltsverzeichnis
5.2 5.3 5.4 5.5
Herausforderung: Unternehmenskultur und Leitbilder als handlungsleitenden Rahmen gestalten . . . . . . . . . . . . . . . . . . . . . Herausforderung: Wissensintensivierung und Kompetenzentwicklung Herausforderungen des demographischen Wandels für die betriebliche Personalpolitik . . . . . . . . . . . . . . . . . . . . . . . . . . Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
N22 N23 N24 N28
Projektmanagement J. Leyh, P. Ohlhausen, D. Spath, J. Warschat 6
Projektmanagement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
Grundlagen des Projektmanagement . . . . . . . . . . . . . . . . . . . . . . . . .
7
Wesentliche Definitionen des Projektmanagements . . . . . . . . . .
7.1 7.2
Das „Projekt“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das „Projektmanagement“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
Rollen im Projekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 8.2
Projektleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektteam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9 10
Aufbauorganisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektplanung, -steuerung und -abschluss . . . . . . . . . . . . . . . .
10.1 10.2 10.3 10.4
Projektziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektstrukturplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektsteuerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektabschluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11 Zertifizierung des Projektmanagers . . . . . . . . . . . . . . . . . . . . . . . Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
O
N29 N29 N29 N29 N30 N30 N30 N31 N32 N34 N34 N35 N36 N37 N38 N38
Normung
T. Bahke 1
Normung in Deutschland . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1
1.3 1.4 1.5 1.6 1.7
Normung: eine technischwissenschaftliche und wirtschaftliche Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . DIN Deutsches Institut für Normung e.V.: Grundsätze der Normungsarbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . DIN-Normen: Verfahren zu ihrer Erarbeitung . . . . . . . . . . . . . . . . . . . DIN-Normen: Rechtliche Bedeutung . . . . . . . . . . . . . . . . . . . . . . . . . Neuartige Erfordernisse zur Erstellung technischer Regeln . . . . . . . . . Entwicklungsbegleitende Normung (EBN) . . . . . . . . . . . . . . . . . . . . . Öffentlich verfügbare Spezifikation (PAS) . . . . . . . . . . . . . . . . . . . . .
1.2
2
Internationale und Europäische Normung . . . . . . . . . . . . . . . . .
2.1 2.2 2.3
Internationale Normung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Europäische Normung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übernahme Internationaler Normen in das Deutsche Normenwerk . . .
3
Ergebnisse der Normung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 3.2 3.3 3.4
Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sicherheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ergonomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Qualitätsmanagement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
O1 O1 O1 O2 O3 O4 O5 O5 O6 O6 O6 O8 O9 O9 O9 O10 O11
LIII
LIV
Inhaltsverzeichnis
3.5 3.6
Normung und Verbraucherschutz . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konformitätsbewertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
O12 O13
3.6.1 Zeichen – 3.6.2 CE-Kennzeichnung
3.7
Umweltschutz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
O13
3.7.1 Einleitung – 3.7.2 Prüfnormen – 3.7.3 Umweltmanagementsystem-Normen – 3.7.4 Produktnormen mit Umweltbezug
3.8
Informationstechnik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
O16
3.8.1 Standardisierung und Normung von Architekturen, Plattformen, Netzen und Schnittstellen der IT – 3.8.2 Standards und Normen für Anwendungen der IT – 3.8.3 Standards und Normen für den Lebenszyklus von IT Systemen – 3.8.4 Standards und Normen für die Sicherheit von IT Systemen – 3.8.5 Standards und Normen für Internet und Semantic Web – 3.8.6 Ausblick
3.9
Dienstleistungs-Normung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P
O20 O21
Recht
W. Frenz 1 2
Recht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Europarecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P1 P1
2.1
Europäische Union, Europäische Gemeinschaften und Mitgliedstaaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gemeinschaftsorgane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P1 P2
2.2
2.2.1 Der Rat – 2.2.2 Kommission – 2.2.3 Europäisches Parlament – 2.2.4 Europäischer Gerichtshof – 2.2.5 Ausschüsse – 2.2.6 Europäische Investitionsbank
2.3
Rechtsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P3
2.3.1 Verordnungen (Art. 249 Abs. 2 EGV) – 2.3.2 Richtlinien (Art. 249 Abs. 3 EGV) – 2.3.3 Entscheidungen (Art. 249 Abs. 4 EGV) – 2.3.4 Empfehlungen und Stellungnahmen (Art. 249 Abs. 5 EGV) – 2.3.5 Sonstige Rechtsakte
2.4
Grundfreiheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P5
2.4.1 Grundschema der Grundfreiheiten – 2.4.2 Die Warenverkehrsfreiheit – 2.4.3 Arbeitnehmerfreizügigkeit – 2.4.4 Niederlassungsfreiheit – 2.4.5 Freier Dienstleistungsverkehr – 2.4.6 Kapitalfreiheit – 2.4.7 Wettbewerbsfreiheit
2.5 2.6
Diskriminierungsverbot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundrechte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Staatsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 3.2
Rangordnung der Rechtsquellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Grundrechte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P9 P9 P9 P9 P10
3.2.1 Allgemeines – 3.2.2 Prüfung der Verletzung eines Freiheitsrechts – 3.2.3 Die Grundrechtsprüfung am Beispiel der Berufsfreiheit – 3.2.4 Die Eigentumsgarantie gemäß Art. 14 GG – 3.2.5 Grundrechtliche Schutzpflichten: Art. 2 Abs. 2 S. 1 GG
3.3 3.4 3.5
Staatsstrukturprinzipien des Grundgesetzes . . . . . . . . . . . . . . . . . . . . Die Gesetzgebung des Bundes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Verwaltungsaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Verwaltungsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 4.2 4.3
Das Verwaltungsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Handlungsformen der Verwaltung . . . . . . . . . . . . . . . . . . . . . . . . Abgrenzung des öffentlich-rechtlichen vom privatrechtlichen Handeln der Verwaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Verwaltungsakt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4
4.4.1 Definition – 4.4.2 Begriffsmerkmale des Verwaltungsaktes (VA) – 4.4.3 Die Nebenbestimmung – 4.4.4 Die formelle Rechtmäßigkeit des Verwaltungsaktes – 4.4.5 Die materielle Rechtmäßigkeit des Verwaltungsaktes – 4.4.6 Aufhebung von Verwaltungsakten nach Unanfechtbarkeit
P12 P12 P13 P13 P13 P13 P13 P13
Inhaltsverzeichnis
4.5
Weitere Grundbegriffe des Verwaltungsrechts . . . . . . . . . . . . . . . . . .
P15
4.5.1 Ermessen – 4.5.2 Unbestimmter Rechtsbegriff – 4.5.3 Subjektiv-öffentliches Recht
4.6
Der öffentlich-rechtliche Vertrag . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Anlagenzulassungsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 5.2
System . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P16 P16 P16 P17
5.2.1 Anlage – 5.2.2 Emissionen/Immissionen – 5.2.3 Luftverunreinigungen – 5.2.4 Schädliche Umwelteinwirkungen – 5.2.5 Stand der Technik
5.3
Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
P18
5.3.1 Verlauf des Verfahrens – 5.3.2 Präklusion
6
Abfallrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 6.2 6.3 6.4 6.5
Abfallbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Objektiver Abfallbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verwertung und Beseitigung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundsätzlicher Vorrang der Vermeidung und Produktverantwortung . Betriebsorganisation und Beauftragter für Abfall . . . . . . . . . . . . . . . .
7
Strafrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1
Haftung für Handlungen von untergeordneten Mitarbeitern . . . . . . . .
P19 P19 P20 P20 P20 P20 P21 P21
7.1.1 Vorsätzliches Verhalten der Unternehmensleitung – 7.1.2 Fahrlässiges Handeln der Unternehmensleitung
7.2
Organ- und Vertreterhaftung bei Sonderdelikten . . . . . . . . . . . . . . . . .
8
Zivilrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 8.2 8.3 8.4
Wesen und Vorgehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Vertragsentstehung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Kaufvertrag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Werkvertrag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9 Arbeitsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Handels-, Gesellschafts- und öffentliches Wirtschaftsrecht . . . Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Q
P22 P22 P22 P23 P23 P23 P24 P25 P26
Patente
J. Schade, V. Winterfeldt 1
Gewerbliche Schutzrechte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 1.2
Technische Schutzrechte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Patente und Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Q1 Q1 Q1
1.2.1 Informationsgehalt von Patenten – 1.2.2 Anmeldestatistik und -analyse
1.3
Patentämter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Q3
1.3.1 Deutsches Patent- und Markenamt (DPMA) – 1.3.2 Europäisches Patentamt (EPA) – 1.3.3 Das Internationale Büro der WIPO
2
Patente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Grundvoraussetzungen der Patentfähigkeit . . . . . . . . . . . . . . . . . . . . .
Q4 Q4
2.1.1 Technischer Charakter der Erfindung – 2.1.2 Neuheit – 2.1.3 Erfinderische Tätigkeit – 2.1.4 Gewerbliche Anwendbarkeit – 2.1.5 Schutz von biotechnologischen Erfindungen
2.2 2.3 2.4
Die Patentanmeldung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prüfungsverfahren vor dem Patentamt . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Klassifizierung, Offensichtlichkeitsprüfung und Offenlegung – 2.4.2 Materielle Prüfung auf Patentfähigkeit – 2.4.3 Beschwerde gegen Entscheidungen der Prüfungsstellen des DPMA
Q6 Q6 Q7
LV
LVI
Inhaltsverzeichnis
2.5 2.6
Einspruchsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gültigkeitszeitraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Q9 Q10
2.6.1 Schutzdauer – 2.6.2 Ergänzende Schutzzertifikate – 2.6.3 Erlöschen
2.7 2.8 2.9 2.10
Jahresgebühren und Zahlungserleichterungen . . . . . . . . . . . . . . . . . . . Verfügungen über das Patent und Lizenzvereinbarungen . . . . . . . . . . Wirkungen des Patents und Patentverletzung . . . . . . . . . . . . . . . . . . . Nichtigkeitsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Europäisches Patentrecht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 3.2 3.3
Die europäische Patentanmeldung . . . . . . . . . . . . . . . . . . . . . . . . . . . Das europäische Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das erteilte Europäische Patent . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 5
Entwurf eines Gemeinschaftspatents . . . . . . . . . . . . . . . . . . . . . . Internationaler Patentzusammenarbeitsvertrag (PCT) . . . . . . .
5.1 5.2
Die PCT-Anmeldung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das PCT-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Gebrauchsmuster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 6.2 6.3
Grundvoraussetzungen der Schutzfähigkeit . . . . . . . . . . . . . . . . . . . . Anmeldung und Eintragung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wirkungen und Laufzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
Arbeitnehmererfindungsrecht . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 7.2 7.3 7.4 7.5
Freie und gebundene Erfindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . Meldung und Inanspruchnahme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pflichten des Arbeitgebers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vergütungsanspruch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Streitigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
S
Sachverzeichnis
Q10 Q11 Q11 Q12 Q12 Q13 Q14 Q15 Q15 Q15 Q15 Q16 Q16 Q17 Q17 Q18 Q18 Q18 Q18 Q19 Q19 Q20 Q20
A1
Mathematik P. Ruge, C. Birk 1 Mengen, Logik, Graphen
Gewisse Standard-Zahlenmengen werden durch bestimmte Buchstabensymbole gekennzeichnet.
1.1 Mengen
Leere Menge
enthält kein Element ∅ = {}
1.1.1 Grundbegriffe der Mengenlehre
Endliche Menge
enthält endlich viele Elemente
Mächtigkeit |M|
auch Kardinalität card(M) einer endlichen Menge M ist die Anzahl ihrer Elemente.
Eine Menge M ist die Gesamtheit ihrer Elemente x. Man schreibt x ∈ M (x ist Element von M) und fasst die Elemente in geschweiften Klammern zusammen. Eine erste Möglichkeit der Darstellung einer Menge ist die Aufzählung ihrer Elemente: M = {x1 , x2 , . . . , xn } .
(1-1)
Weit reichender ist folgende Art der Darstellung: Eine Menge M im klassischen Sinn ist eine Gesamtheit von Elementen x mit einer bestimmten definierenden Eigenschaft P, die eine eindeutige Entscheidung ermöglicht, ob ein Element a aus einer Klasse („Vorrat“) A zur Menge M gehört. a∈M
falls
P(a) wahr: μ = 1 ,
aM
falls
P(a) nicht wahr: μ = 0 .
Die Zugehörigkeitsfunktion μ(a) ordnet jedem Objekt einen der Werte 0 oder 1 zu. Man schreibt M = {x | x ∈ A, P(x)} .
(1-2)
M ist die Menge aller Elemente aus A, für welche die Eigenschaft P zutrifft. Beispiel: M1 = {x | x ∈ C, x4 + 4 = 0} = {1 + j, 1 − j, −1 + j, −1 − j} . j2 = −1 . Tabelle 1-1. Bezeichnungen der Standard-Zahlenmengen
Natürlich Ganz N Z
Rational Q
Reell R
Komplex C
Gleichmächtigkeit A ist gleichmächtig B, A ∼ B, wenn sich jedem Element von A genau ein Element von B zuordnen lässt und umgekehrt. Zum Beispiel: N\{0} = {1, 2, 3, 4, 5, . . .} , U = {1, 3, 5, 7, 9, . . .} . Zu jedem Element k aus N\{0} gibt es ein Element 2k − 1 aus U und umgekehrt. Zudem sind alle Elemente von U in N\{0} enthalten. Unendliche Menge Eine Menge A ist unendlich, falls sich eine echte Teilmenge B von A angeben lässt, die mit A gleichmächtig ist. Abzählbarkeit
Jede unendliche Menge, die mit N gleichmächtig ist, heißt abzählbar.
Überabzählbarkeit Eine Menge M heißt überabzählbar, falls M nicht abzählbar ist. Kontinuum
Eine überabzählbare Menge hat die Mächtigkeit des Kontinuums.
A Mathematik und Statistik
A
Mathematik und Statistik
P. Ruge C. Birk M. Wermuth
A2
A Mathematik und Statistik / Mathematik
Fuzzy-Menge (unscharfe Menge). Unter einem Element f einer Fuzzy-Menge versteht man ein Paar aus einem Objekt x und der Bewertung μ(x) seiner Mengenzugehörigkeit mit Werten aus dem Intervall [0, 1]; d. h., 0 ≤ μ ≤ 1. Die Elemente werden einzeln aufgezählt, Element f = (x, μ(x)), μ ∈ [0, 1] , F = { f1 , f2 , . . . , fn } , oder durch geschlossene Darstellung der Objekte und der Bewertung wie im folgenden Beispiel. Die Fuzzy-Mengen F1 = {(x, μ(x))| x ∈ R und μ = (1 + x2 )−1 } , F2 = {(x, μ(x))| x ∈ R und μ = (1 + x4 )−4 } können mit den die Unschärfe andeutenden Namen F1 = NAHENULL, F2 = SEHRNAHENULL belegt werden. Weitere Einzelheiten und Anwendungen siehe in der Literatur [1], [2]. 1.1.2 Mengenrelationen und -operationen
Mengen und ihre Beziehungen zueinander lassen sich durch Punktmengen in der Ebene, z. B. Ellipsen, veranschaulichen; sog. Venn-Diagramme, siehe Bild 1-1. Gleichheit, A = B Jedes Element von A ist auch Element von B und umgekehrt. Teilmenge, A B A Teilmenge von B. Jedes Element von A ist auch Element von B. Gleichheit ist möglich. Echte Teilmenge, A ⊂ B Gleichheit wird ausgeschlossen. Potenzmenge, P(M) Potenz von M. Menge aller Teilmengen der Men-
ge M. Zum Beispiel M = {a, b}, P(M) = {∅, {a}, {b}, {a, b}}. Durchschnitt, A ∩ B A geschnitten mit B. Menge aller Elemente, die sowohl zu A als auch zu B gehören. Vereinigung, A ∪ B A vereinigt mit B. Menge aller Elemente, die zumindest zu A oder B gehören. Differenz, B\A B ohne A. Menge aller Elemente von B, die nicht gleichzeitig Elemente von A sind. Komplement, C B A Komplement von A bezüglich B. Für A B ist C B A = B\A. Symmetrische Differenz, AΔB Menge aller Elemente von A oder B außerhalb des Durchschnitts: AΔB = (A\B) ∪ (B\A) = (A ∪ B)\(A ∩ B) . Produktmenge, A × B A kreuz B. Menge aller geordneten Paare (ai , b j ), die sich aus je einem Element der Menge A und der Menge B bilden lassen. Zum Beispiel A = {a1 , a2 , a3 }, B = {b1 , b2 } , A × B = {(a1 , b1 ), (a1 , b2 ), (a2 , b1 ), (a2 , b2 ) , (a3 , b1 ), (a3 , b2 )} . Anmerkung: Bei einem geordneten Paar ist die Reihenfolge von Bedeutung: (x, y) (y, x) für x y. A1 × A2 × . . . × An Menge aller geordneten n-Tupel (A1i , A2 j , . . . , Ank ) aus je einem Element der beteiligten Mengen.
1.2 Verknüpfungsmerkmale spezieller Mengen Charakteristische Eigenschaften von Verknüpfungen und Relationen sind: Kommutativität, a ◦ b = b ◦ a a verknüpft mit b. Falls die Reihenfolge der Verknüpfung zweier Elemente a und b einer Menge unerheblich ist, dann ist die betreffende Verknüpfung in der Menge kommutativ.
Bild 1-1. Venn-Diagramme. Ergebnismengen sind schraf-
fiert
Assoziativität, a ◦ (b ◦ c) = (a ◦ b) ◦ c Gilt dies für alle Tripel (a, b, c) einer Menge, so
1 Mengen, Logik, Graphen
ist die betreffende Verknüpfung in der Menge assoziativ. Distributivität, a ◦ (b c) = (a ◦ b) (a ◦ c) Gilt dies für zwei verschiedenartige Verknüpfungen (Kreis und Karo) angewandt auf alle Tripel einer Menge, so sind die Verknüpfungen in der Menge distributiv. Reflexivität, a ◦ a Relation ◦ reflektiert a auf sich selbst; z. B. a = a, g parallel g (g Gerade). Symmetrie, a ◦ b ↔ b ◦ a Relation ist symmetrisch; z. B. a = b, g parallel h (g, h Geraden). Transitivität, a ◦ b und b ◦ c → a ◦ c Zum Beispiel aus a = b und b = c folgt a = c. Aus A ⊂ B und B ⊂ C folgt A ⊂ C. Äquivalenz Eine Relation, die reflexiv, symmetrisch und transitiv ist, heißt Äquivalenzrelation, z. B. die Gleichheitsrelation. Drei in der modernen Mathematik wichtige algebraische Strukturen sind Gruppen, Ringe und Körper. Gruppe: Eine Menge G = {a1 , a2 , . . .} heißt Gruppe, wenn in G eine Operation a1 ◦ a2 = b erklärt ist und gilt: 1. b ∈ G Abgeschlossenheit 2. (ai ◦ a j ) ◦ ak = ai ◦ (a j ◦ ak ) Assoziativität Existenz eines Eins3. ai ◦ e = e ◦ ai = ai , e ∈ G elementes −1 = a ◦ a = e Existenz von inver4. ai ◦ a−1 i i i sen Elementen. Abel’sche Gruppe. Es gilt zusätzlich: Kommutativität. 5. ai ◦ a j = a j ◦ ai
Ring: Eine Menge R = {r1 , r2 , . . .} heißt assoziativer Ring, wenn in R zwei Operationen ◦ und erklärt sind und Folgendes gilt: 1. R ist eine Abel’sche Gruppe bezüglich der Operation ◦ 2. ri r j = c, c ∈ R Abgeschlossenheit 3. ri (r j rk ) = (ri r j ) rk Assoziativität 4. ri (r j ◦ rk ) = (ri r j ) ◦ (ri rk ) Distributivität. (ri ◦ r j ) rk = (ri rk ) ◦ (r j rk ) Kommutativer Ring: Es gilt zusätzlich 5. ri r j = r j ri Kommutativität. Kommutativer Ring mit Einselement: Es gilt zusätzlich 6. ri e = e ri = ri ; e Einselement. Körper: Kommutativer Ring mit Einselement und Division (außer durch ri = 0). 7. ri ri−1 = ri−1 ri = e, ri 0.
1.3 Aussagenlogik Gegenstand der Aussagenlogik sind die Wahrheitswerte verknüpfter Aussagen (Tabelle 1-2). a heißt eine Aussage, wenn a einen Sachverhalt behauptet. Besonders wichtig ist die Menge A2 der zweiwertigen Aussagen, die entweder wahr (W, true) oder falsch (F, false) sein können; üblich ist auch eine Codierung durch die Zahlen 1 (wahr) und 0 (falsch). Die logischen Verknüpfungen in Tabelle 1-3 entsprechen den Verknüpfungen der Boole’schen Algebra (siehe Abschnitt J 1). Aussagenverknüpfungen, die unabhängig vom Wahrheitswert der Einzelaussagen stets den Wert wahr (1) besitzen, heißen Tautologien (Tabelle 1-4).
Tabelle 1-2. Verknüpfungen der Aussagenlogik (Junktoren)
Symbol/Verwendung ¬ a (auch: a¯ ) a∧b a∨b Abgeleitete Verknüpfungen a→b a↔b a↔ | b a∧b a∨b
Sprechweise: Definition nicht a a und b a oder b a impliziert b: a äquivalent b: entweder a oder b: a und b nicht zugleich: weder a noch b:
Benennung Negation Konjunktion, UND-Verknüpfung Disjunktion, ODER-Verknüpfung a¯ ∨ b ¯ (a ∧ b) ∨ (¯a ∧ b) ¯ ∨ (¯a ∧ b) (a ∧ b) a ∧ b = a¯ ∨ b¯ a ∨ b = a¯ ∧ b¯
Implikation, Subjunktion Äquivalenz, Äquijunktion Antivalenz, XOR-Funktion NAND-Funktion NOR-Funktion
A3
A4
A Mathematik und Statistik / Mathematik
Tabelle 1-3. Wahrheitswerte von Aussagenverknüpfungen
a b 0 0 1 1
0 1 0 1
a∧b a ∨ b a → b UND ODER Impliziert 0 0 1 0 1 1 0 1 0 1 1 1
a↔b Äquivalent 1 0 0 1
a∧b a∨b NAND NOR 1 1 1 0
1 0 0 0
Tabelle 1-4. Beispiele von Tautologien
(a ∧ (a → b)) → b (a ∧ (b¯ → a¯ )) → b ((a ∨ b) ∧ (a → c) ∧ (b → c)) → c ((a → b) ∧ (b → c)) → (a → c) ((a → b) ∧ (b → a)) → (a ↔ b)
Abtrennungsregel Indirekter Beweis Fallunterscheidung Kettenschluss Schluss auf eine Äquivalenz Kontraposition
Tabelle 1-6. Methode der vollständigen Induktion
Eine Aussage „Für jedes x aus der Menge X gilt p(x) mit X = {x|(x ∈ N) ∧ (x a)}, a ∈ N“ ist wahr, wird in 4 Schritten bewiesen. 1. Induktionsbeginn: Nachweis der Wahrheit von p(a). 2. Induktionsannahme: p(k) mit beliebigem k > a sei wahr. 3. Induktionsschritt: Berechnung von p(k + 1) als P(k + 1) von p(k) ausgehend. 4. Induktionsschluss: p(x) ist wahr, falls P(k + 1) = p(k + 1). Beispiel. Aussage: p(x) = 12 + 22 + . . . + x2 = x(x + 1)(2x + 1)/6.
1. a = 1. p(1) = 12 = 1(1 + 1)(2 + 1)/6. 2. p(k) = k(k + 1)(2k + 1)/6. 3. P(k + 1) = p(k) + (k + 1)2 4.
(a → b) → (b¯ → a¯ ) (b¯ → a¯ ) → (a → b)
Tabelle 1-5. Wahrheitstabelle für den Kettenschluss
a b c u=a→b v=b→c w=a→c x=u∧v
0 0 0 1 1 1 1
1 0 0 0 1 0 0
0 1 0 1 0 1 0
1 1 0 1 0 0 0
0 0 1 1 1 1 1
1 0 1 0 1 1 0
0 1 1 1 1 1 1
1 1 1 1 1 1 1
x→w
1
1
1
1
1
1
1
1
Mithilfe von Wahrheitstabellen lassen sich die Wahrheitswerte von Aussagenverknüpfungen systematisch ermitteln. Bei Tautologien muss die Schlusszeile (vgl. Tabelle 1-5) überall den Wahrheitswert 1 aufweisen. Tautologien wie in Tabelle 1-4 liefern die Bausteine für Beweistechniken, so zum Beispiel der Methode der vollständigen Induktion, siehe Tabelle 1-6.
1.4 Graphen Graphen und die Graphentheorie finden als mathematische Modelle für Netze jeder Art Anwendung. Ein Graph G besteht aus einer Menge X = {x1 , . . . , xn } von n Knoten und einer Menge V von Kanten als Verbindungen zwischen je 2 Knoten.
= (k + 1)k(2k + 1)/6 + (k + 1) = (k + 1)(2k2 + 7k + 6)/6. p(k + 1) = (k + 1)(k + 2)(2k + 3)/6 = P(k + 1).
Gerichtete Kanten werden durch ein geordnetes Knotenpaar (xi , xk ) beschrieben, ungerichtete Kanten durch eine zweielementige Knotenmenge {xi , xk }. Schlichte Graphen enthalten keine Schlingen, d. h. keine Kanten {x, y} mit x = y, und keine Parallelkanten zu Kanten (x, y) oder Mengen {x, y}. Ein Graph G mit ungerichteten Kanten lässt sich durch eine symmetrische Verknüpfungsmatrix V mit Elementen 1 , falls {xi , x j } ∈ G (1-1) vi j = 0 , falls {xi , x j } G beschreiben. Der Grad d(x) eines Knotens x bezeichnet die Anzahl der Kanten, die sich in x treffen. Bei einem gerichteten Graphen unterscheidet man d+ und d − : d+ (x) Anzahl der vom Knoten abgehenden Kanten, d− (x) Anzahl der in den Knoten einlaufenden Kanten, d(x) = d + (x) + d− (x) . Die Summe aller Knotengrade eines schlichten Graphen ist gleich der doppelten Kantenanzahl. Eine endliche Folge benachbarter Kanten nennt man Kantenfolge. Sind End- und Anfangsknoten identisch, so heißt die Kantenfolge geschlossen, andernfalls offen.
2 Zahlen, Abbildungen, Folgen
Eine Kantenfolge mit paarweise verschiedenen Kanten heißt Kantenzug und speziell Weg, falls dabei jeder Knoten nur einmal passiert wird. Geschlossene Wege nennt man Kreise. Ein ungerichteter Graph, bei dem je zwei Knoten durch einen Weg verbunden sind, heißt zusammenhängend. Einen zusammenhängenden ungerichteten Graphen ohne Kreise nennt man Baum. Beispiel: Verknüpfungsmatrix V sowie spezielle Kantenfolgen für den Graphen in Bild 1-2. ⎡ ⎤ ⎢⎢⎢ 0 1 0 0 1 0 ⎥⎥⎥ ⎢⎢⎢⎢ 1 0 1 0 1 0 ⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 0 1 0 1 1 0 ⎥⎥⎥⎥⎥ ⎢ ⎥⎥ , V = V T . V = ⎢⎢⎢ ⎢⎢⎢ 0 0 1 0 1 1 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 1 1 1 1 0 0 ⎥⎥⎥⎥⎥ ⎣ ⎦ 0 0 0 1 0 0 Kantenfolge, geschlossen: {5, 2}, {2, 1}, {5, 3}, {3, 2}, Kantenzug, offen: {5, 2}, {2, 1}, {5, 3}, {3, 2} Weg: {6, 4}, {4, 5}, Kreis: {4, 3}, {3, 2}, {5, 4} .
{1, 5}, {2, 5} {1, 5} {5, 1} {2, 5},
2 Zahlen, Abbildungen, Folgen 2.1 Reelle Zahlen 2.1.1 Zahlenmengen, Mittelwerte
Mithilfe der Zahlen können reale Ereignisse quantifiziert und geordnet werden. Rationale Zahlen lassen sich durch ganze Zahlen einschließlich null darstellen.
Natürliche Zahlen : N = {0, 1, 2, 3, . . .} , Ganze Zahlen : Z = {. . . , −2, −1, 0, 1, 2, . . .} ,
Rationale Zahlen : Q = ab |a ∈ Z ∧ b ∈ Z\{0} , a, b teilerfremd .
(2-1)
Algebraische und transzendente Zahlen, z. B. als Lösungen x der Gleichungen x2 = 2 bzw. sin x = 1, erweitern die Menge Q der rationalen Zahlen zur Menge R der reellen Zahlen. Die Elemente der Menge R bilden einen Körper bezüglich der Addition und Multiplikation. Für jedes Paar r1 , r2 ∈ R gilt genau eine der drei Ordnungsrelationen: r1 < r2
oder r1 = r2
oder r1 > r2 .
(2-2)
Zur Charakterisierung einer Menge n reeller Zahlen sind gewisse Mittelwerte erklärt: Arithmetischer Mittelwert: A = (a1 + . . . + an )/n . Geometrischer Mittelwert: G n = a1 · a2 · . . . · an .
(2-3)
Harmonischer Mittelwert: −1 H −1 = a−1 1 + . . . + an /n . Für ai > 0, n ∈ N gilt: HGA. Pythagoreische Zahlen sind gekennzeichnet durch ein Tripel a, b, c ∈ Z ganzer Zahlen mit der Eigenschaft a 2 + b 2 = c2 .
(2-4)
Ein beliebiges Paar (m, n) ∈ Z garantiert mit a = m2 − n2 , b = 2mn die Eigenschaft (2-4). Beispiel: m = 7, n = 1 → a = 48, b = 14, c = 50 . 2.1.2 Potenzen, Wurzeln, Logarithmen
Potenzen. Die Potenz ab (a hoch b) mit der Basis a und dem Exponenten b ist für die drei Fälle a > 0 ∧ b ∈ R , a 0 ∧ b ∈ Z, a ∈ R ∧ b ∈ N reell. Rechenregeln:
Bild 1-2. Schlichter Graph mit ungerichteten Kanten
a1 = a , a0 = 1 (a 0) , 1b = 1 , a−b = 1/ab , ab ac = ab+c , (2-5) (ab)c = ac bc , (ab )c = abc , ab /ac = ab−c , (a/b)c = ac /bc .
A5
A6
A Mathematik und Statistik / Mathematik
√ Wurzeln. Die Wurzel b c = c1/b = a (b-te Wurzel aus c) ist eine Umkehrfunktion zur Potenz c = ab mit dem „Wurzelexponenten“ b und dem Radikanden c. Für c > 0 ∧ b 0 ist a reell. Bei der Quadratwurzel √ √ schreibt man die 2 in der Regel nicht an: 2 c = c. Rechenregeln: √b √b √b √1 c=c, 1=1, cb = c , ca = ca/b ,
√ √b √ ab a √ b √ b a dac = dc , ab c = c= c, (2-6) √ √c √ √a √b √ ab c c a+b c· c= c , ab = a · b , c √ √c a/b = c a/ b . Logarithmen. Der Logarithmus loga c = b (Logarithmus vom Numerus c zur Basis a) ist eine weitere Umkehrfunktion zur Potenz c = ab . Für a > 0\1 ∧ c > 0 is b reell. Bevorzugte Basen sind
Beispiel: n = [10100]2 = 1 · 24 + 0 · 23 + 1 · 22 + 0 · 21 + 0 · 20 = [20]10.
2.3 Komplexe Zahlen 2.3.1 Grundoperationen, Koordinatendarstellung
Die Menge C der komplexen Zahlen z besteht aus geordneten Paaren reeller Zahlen a und b. z = a + jb ,
auch z = (a, b) ,
j imaginäre Einheit mit j2 = −1 , a∈R,
Realteil von z, Re(z) = a ,
b∈R,
Imaginärteil von z, Im(z) = b .
z1 + z2 = (a1 + a2 ) + j(b1 + b2 ) , z1 − z2 = (a1 − a2 ) + j(b1 − b2 ) ,
Rechenregeln:
(2-7)
z1 · z2 = (a1 a2 − b1 b2 ) + j(a1 b2 + b1 a2 ) , a1 + jb1 a2 − jb2 · z1 /z2 = a2 + jb2 a2 − jb2 (a1 a2 + b1 b2 ) + j(b1 a2 − a1 b2 ) = . a22 + b22
(2-10)
Konjugiert komplexe Zahl z zu z: z = a + jb ;
Umrechnung zwischen verschiedenen Basen:
z = a − jb
zz = a + b . 2
loga c = loga b logb c , loga b = 1/ logb a , lg c = ln c lg e , ln c = lg c ln 10 , lg e = 1/ ln 10 = M , [M] = [0,434294, 0,434295] .
2
(2-11)
Die Paare (a, b) können als kartesische Koordinaten eines Punktes in einer Zahlenebene aufgefasst werden. Die gerichtete Strecke vom Ursprung (0, 0) zum Punkt z = (a, b) heißt auch Zeiger. √ (2-12) Zeigerlänge: r = zz = a2 + b2 .
2.2 Stellenwertsysteme Natürliche Zahlen n ∈ N werden durch Ziffernfolgen dargestellt, wobei jedes Glied einen Stellenwert bezüglich einer Basis g besitzt: n = [am . . . a1 a0 ]g = am gm + . . . + a0 g0 mit ai ∈ {0, 1, . . . , g − 1} .
(2-9)
Grundoperationen
a = 10, dekadischer (Brigg’scher) Logarithmus log10 c = lg c. a = e, natürlicher Logarithmus loge c = ln c. loga 1 = 0 , loga ab = b , aloga c = c , loga (1/b) = − loga b , loga (bc) = loga b + loga c , loga (b/c) = loga b − loga c , √c loga bc = c loga b , loga b = c−1 loga b .
Dualsystem g = 2. ai ∈ {0, 1},
(2-8)
Dezimalsystem g = 10. ai ∈ {0, 1, . . . , 9}. Beispiel: n = [5309]10 = 5 · 103 + 3 · 102 + 0 · 101 + 9 · 100 .
Bild 2-1. Komplexe Zahl z in Polarkoordinaten r, ϕ
2 Zahlen, Abbildungen, Folgen
Sinnvoll ist ebenfalls eine Umrechnung in Polarkoordinaten z = (r, ϕ) nach Bild 2-1 mit Zeigerlänge r und Winkel ϕ. a = r cos ϕ , b = r sin ϕ , √ (2-13) r = + a2 + b2 . z1 · z2 = r1 r2 [cos(ϕ1 + ϕ2 ) + j sin(ϕ1 + ϕ2 )] , z1 /z2 = (r1 /r2 )[cos(ϕ1 − ϕ2 ) + j sin(ϕ1 − ϕ2 )] .
Grundrechenarten [u]+[v] = [u + v, u + v] , [u]−[v] = [u − v, u − v] , [u] · [v] = [pmin , pmax ], p = {uv, uv, uv, uv} , [u]/[v] = [qmin , qmax ], q = {u/v, u/v, u/v, u/v} . (2-18) Runden: u abrunden, u aufrunden. Beispiel: A = (a + b) (a − b), a2 = 9,9 , b = π ,
2.3.2 Potenzen, Wurzeln
[a] = [3,146, 3,147] , [b] = [3,141, 3,142] ,
Potenz. Für Exponenten a ∈ Z gilt die Moivre’sche Formel:
[a] + [b] = [6,287, 6,289] , [a] − [b] = [4,000 · 10−3 , 6,000 · 10−3 ] , [A] = [2,514 · 10−2 , 3,774 · 10−2 ] .
z = r(cos ϕ + j sin ϕ) = r · ejϕ a ∈ Z : za = ra [cos(aϕ) + j sin(aϕ)] .
(2-14)
Im Allgemeinen ist die Potenz jedoch mehrdeutig: a ∈ R : za = ra {cos[a(ϕ + 2k π)] + j sin[a(ϕ + 2k π)]} , k ∈ Z . (2-15) Hauptwert für k = 0 : za = ra [cos(aϕ) + j sin(aϕ)] . √a 1 Wurzel. Umkehrfunktion b = b a = z zur Potenz b = za . Die Wurzeln – auch reeller Zahlen – sind afach. a ∈ N: √a √a ϕ + 2k π ϕ + 2k π + j sin z = r cos , a a (2-16) k ∈ {0, 1, . . . , a − 1} .
In der Menge der Intervalle definiert man Ordnungsrelationen nach Bild 2-2. 1. [u] < [v] gilt, wenn u < v . 2. [u] [v] gilt, wenn u v und u v . 3. [u] [v] gilt, wenn v u und u v .
Weiteres zur Intervallrechnung findet man in [1].
2.5 Abbildungen, Folgen und Reihen 2.5.1 Abbildungen, Funktionen
X und Y seien zwei Mengen. Dann heißt A ⊂ X × Y eine Abbildung der Menge X in die Menge Y, falls zu jedem Original x ∈ X nur ein einziges Bild y ∈ Y gehört, also eine eindeutige Zuordnung existiert. Statt Abbildung spricht man auch von Funktion oder Operator f : f : x → y . f bildet x in y ab . Auch x → y = f (x) .
Beispiel: √4 4 z = 1 = cos 0 + j sin 0 , z = {1, j, −1, −j} .
2.4 Intervalle Beim Rechnen mit konkreten Zahlen muss man sich mit endlich vielen Stellen begnügen, also mit Näherungszahlen. Aussagekräftiger sind Zahlenangaben durch gesicherte untere und obere Schranken. An die Stelle diskreter reeller Zahlen tritt die Menge I der abgeschlossenen Intervalle mit Elementen [u] = [u, u] = {u | u ∈ R , u u u} .
(2-17)
(2-19)
Bild 2-2. Ordnungsrelationen von Intervallen
(2-20)
A7
A8
A Mathematik und Statistik / Mathematik
Tabelle 2-1. Einteilung der Funktionen y = f (x)
Name
Darstellung
Algebraisch
Pn (x)yn + . . . + P1 (x)y + P0 (x) = 0, Pk (x): Polynome in x
Algebraisch ganz rational
Pn (x) bis P2 (x) = 0, P1 (x) = 1: y = a0 xn + a1 xn−1 + . . . + an−1 x + an
n∈N
Beispiel √ x y = y + 1 d. h. 2 y + y(2 − x2 ) + 1 = 0 y = 4x3 − 1
Pn (x) bis P2 (x) = 0, a0 xm + . . . + am−1 x + am y= b0 xn + . . . + bn−1 x + bn m < n: echt-, sonst unecht gebrochen Algebraisch nicht rational: Irrational
y = x1/n
Nicht algebraisch: Transzendent
y = ax , y = sin x
Algebraisch gebrochen rational
Bei Gültigkeit der Abbildung (2-20) sowie S ⊂ X und T ⊂ Y sind die Begriffe Bildmenge f (S) von S ,
f (S) = { f (x) | x ∈ S } ,
−1
Urbildmenge f (T ) von T , f −1 (T ) = {x | f (x) ∈ T } , definiert. Injektiv heißt eine Abbildung (2-20) dann, wenn keine zwei Elemente von X auf dasselbe Element y abgebildet werden. Surjektiv heißt eine Abbildung (2-20) dann, wenn jedes Element y ∈ Y Bild eines Originals x ∈ X ist. Bijektiv heißt eine Abbildung (2-20) dann, wenn sie injektiv und surjektiv ist. Für diesen Sonderfall hat die inverse Relation f −1 den Charakter einer Abbildung und heißt Umkehrfunktion. 2.5.2 Folgen und Reihen
Unter einer Folge mit Gliedern ak , k = 1, 2, . . ., versteht man eine Funktion f , die auf der Menge N der natürlichen Zahlen definiert ist. Arithmetische Folge. Die Differenzen Δk k-ter Ordnung von k + 1 aufeinander folgenden Gliedern sind konstant. k = 1 : Δ1j = a j+1 − a j = const k = 2 : Δ2j = Δ1j+1 − Δ1j = const
(2-21)
Geometrische Folge. Der Quotient q von zwei aufeinander folgenden Gliedern ist konstant. Reihen. Die Summe der Glieder von Folgen nennt man Reihen.
y=
x2 + 7x x3 − 1
Einige Reihen. Summation jeweils von k = 1 bis k = n. k = n(n + 1)/2 . 2 k = n(n + 1)(2n + 1)/6 . 3 k = [n(n + 1)/2]2 . 4 k = n(n + 1) × (2n + 1)(3n2 + 3n − 1)/30 . (2k − 1) = n2 . (2-22) (2k − 1)2 = n(2n − 1)(2n + 1)/3 . 3 2 2 (2k − 1) = n (2n − 1) . k−1 kx = [1 − (n + 1)xn + nxn+1 ]/(1 − x)2 , x1. k n+2 =2− n . 2 2k Konvergenz. Eine Folge von Gliedern ak , k = 1, 2, . . . , n, heißt konvergent und g der Grenzwert der Folge, lim ak = g ,
k→∞
falls
|g − an | < ε ,
n > N , (2-23)
falls bei beliebig kleinem ε > 0 stets ein gewisser Index N angebbar ist, ab dem die Ungleichung (2-23) gilt. Beispiel: ⎧ ⎪ ∞ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎨ lim ak = ⎪ ⎪ ⎪ k→∞ 0 ⎪ ⎪ ⎪ ⎪ ⎩ divergent
für für für für
a>1 a=1 −1 < a < 1 a −1
2 Zahlen, Abbildungen, Folgen
Eine unendliche Reihe ∞ r= ak ,
sn =
n
k=1
ak ,
(2-24)
k=1
heißt konvergent, wenn die Folge der Teilsummen sn konvergiert. Notwendige Bedingung: lim ak = 0 .
(2-25)
k→∞
Der Konvergenzbereich |x| < 0 einer Potenzreihe wird durch den Konvergenzradius bestimmt. Für gleichmäßige Konvergenz im Bereich |x| < darf die n-te Teilsumme sn (x) ab einem gewissen Index N (n > N) eine vorgegebene Differenz ε > 0 zum Grenzwert p(x) der Reihe nicht überschreiten. sn (x) =
∞ k=1
falls r˜ =
∞
|ak |
konvergiert .
(2-26)
Rechenregel: r1 =
ak ,
r2 =
k=1
∞
∞ k
bl
absolut konvergent ;
p(x) =
|ak |
∞
xk /k .
k=1
ak+1−l bl .
(2-27)
Majorantenprinzip. Wenn r1 =
(2-32) ak . k→∞ ak+1
Potenzreihen dürfen innerhalb des Konvergenzbereiches differenziert und integriert werden.
k=1 l=1
∞
a k xk .
Beispiel:
l=1
→ r1 r2 =
∞ k=1
k→∞
k=1
∞
p(x) =
|p(x) − sn (x)| ε für n > N . k
−1 = lim |ak | oder = lim
absolut konvergent ,
ak
a k xk ,
k=1
Absolute Konvergenz: r=
n
−1 konvergent und
k=1
|b s | |a s | , für s ≥ N, N ∈ N\0 ∞ r2 = |bk | konvergent .
dann ist auch (2-28)
⎫ k + 1 ⎪ ⎪ = 1 ⎪ = lim ⎪ ⎪ ⎪ k→∞ k ⎪ ⎬ → |x| < 1 . ⎪ ⎪ ⎪ ⎪ k 1 ⎪ ⎪ ⎪ =1 ⎭ = lim k→∞ k
2.5.3 Potenzen von Reihen
Polynomiale Sätze beschreiben die Bildung der Potenzen von Reihen.
k=1
Hinreichende Konvergenzkriterien: k lim |ak | < 1 , Wurzelkriterium ; k→∞ ak+1 < 1 , Quotientenkriterium . lim k→∞ ak
(a1 + a2 + . . . + an )m .
(2-29)
Notwendig und hinreichend für alternierende Reihen (wechselndes Vorzeichen): lim |ak | = 0 .
k→∞
(2-30)
Potenzreihen sind ein Spezialfall von Reihen mit veränderlichen Gliedern und vorgegebenen Koeffizienten ak : ∞ a k xk . (2-31) p= k=1
(2-33)
Wichtig ist der Fall n = 2 der binomialen Sätze. Mit dem Symbol n! (n Fakultät) und den Binomialkoeffizienten bck (lies: c über k) gilt der Binomische Satz. c c(c − 1)(c − 2) . . . [c − (k − 1)] , bck = = k k! k ∈ N , c ∈ R , k! = 1 · 2 · . . . · k , 0! = 1 , (2-34) n n n−k k (a + b)n = a b , n∈N. k k=0 Beispiel: (a ± b)5 = a5 ±5a4b+10a3b2 ±10a2b3 +5ab4 ±b5 .
A9
A10
A Mathematik und Statistik / Mathematik
Die Binomialkoeffizienten lassen sich aus dem Pascal’schen Dreieck in Bild 2-3 ablesen. Rechenregeln: k n n =1, = , 0 k n−k c c c+1 (2-35) + = . k k+1 k+1
3 Matrizen und Tensoren 3.1 Matrizen 3.1.1 Bezeichnungen, spezielle Matrizen
Eine zweidimensionale Anordnung von m × n Zahlen ai j in einem Rechteckschema nennt man Matrix A, auch genauer (m, n)-Matrix A = (ai j ). Die Zahlen ai j heißen auch Elemente. ⎡ ⎤ ⎢⎢⎢ a11 . . . a1n ⎥⎥⎥ ⎢⎢ . .. ⎥⎥⎥⎥ (3-1) A = (ai j ) = ⎢⎢⎢⎢ .. . ⎥⎥⎥ , ⎢⎣ ⎦ am1 . . . amn 1. Index i : Zeilenindex, m Zeilenanzahl. 2. Index j : Spaltenindex, n Spaltenzahl. Teilfelder des Rechteckschemas kann man zu Untermatrizen zusammenfassen, so speziell zu n Spalten ai oder m Zeilen a j . ⎤ ⎡ 1⎤ ⎡ ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎢ a1i ⎥⎥⎥ ⎢⎢ . ⎥⎥ ⎢⎢ . ⎥⎥ (3-2) A = [a1 . . . an ] = ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ , ai = ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ , ⎥⎦ ⎢⎣ ⎥⎦ ⎢⎣ am ami a j = [a j1 . . . a jn ] .
Bild 2-3. Pascal’sches Dreieck. Nicht-Einselemente sind gleich Summe aus darüberstehendem Element und dessen linkem Nachbarn
Durch Vertauschen von Zeilen und Spalten entsteht die sogenannte transponierte Matrix AT (gesprochen: A transponiert) zu A. ⎤ ⎡ ⎤ ⎡ ⎢⎢⎢ a11 . . . am1 ⎥⎥⎥ ⎢⎢⎢ aT1 ⎥⎥⎥ ⎢ ⎢ . .. ⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ 1 AT = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥ = ⎢⎢⎢ . ⎥⎥⎥ = aT . . . am T , . ⎥⎦ ⎢⎣ ⎥⎦ ⎢⎣ a1n . . . amn aTn ⎤ ⎡ ⎢⎢⎢ a j1 ⎥⎥⎥ ⎢⎢ . ⎥⎥ j aT = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , aTi = [a1i . . . ami ] . (3-3) ⎥⎦ ⎢⎣ a jn Durch Vertauschen von Zeilen und Spalten der komplexen Matrix C und zusätzlichem Austausch der Elemente cik = aik + j bik durch die konjugiert komplexen cik = aik − j bik entsteht die konjugiert Transponierte T C¯ zu C. Beispiel: 3−j C= 5+j
2 , 1+j
3+j 5−j T C¯ = . 2 1−j
Spezielle Matrizen (auch Bild 3-1) D mit di j = 0 für i j D = diag(d1 . . . dn ) Einheitsmatrix I = diag(1 . . . 1), auch 1 oder E (3-4) Nullmatrix A = 0 mit ai j = 0 Rechteckmatrix Zeilenanzahl Spaltenanzahl Quadratische Matrix Zeilenanzahl = Spaltenanzahl Diagonalmatrix
Bild 3-1. Spezielle Matrizen. Kreuze × stehen für Hauptdiagonalelemente
3 Matrizen und Tensoren
Symmetrische Matrix Schiefsymmetrische Matrix Hermite’sche Matrix Schiefhermite’sche Matrix
AT = A , ai j = a ji AT = −A , aii = 0 , ai j = −a ji ¯ T = A , ai j = a¯ ji . A ¯ T = −A , ai j = −¯a ji . A
Voraussetzung Zeilenanzahlen mB = mC und Spaltenanzahlen nB = nC sind gleich: ai j = bi j ± ci j
A = As + Aa Aufspaltung einer unsymmetrischen quadratischen Matrix A in symmetrischen und schiefsymmetrischen Teil: As = ( A + AT )/2, Aa = ( A − AT )/2
Rang
Spur einer Matrix, kurz sp A, ist die Summe der Hauptdiagonalelemente sp A = aii einer Matrix ist die Anzahl der linear unabhängigen Spalten oder Zeilen von A.
Multiplikation Matrizenprodukt. Das Produkt C = AB (Signifikanz der Reihenfolge) zweier Matrizen ist nur bei passendem Format ausführbar: Spaltenanzahl von A gleich Zeilenanzahl von B. (mA , nA )-Matrix A · (mB , nB )-Matrix B
(3-5)
ist gleich (mA , nB )-Matrix C , falls nA = mB . Für die Zahlenrechnung empfiehlt sich die elementweise Ermittlung der Elemente ci j über Skalarprodukte, ci j = ai b j . Siehe Tabelle 3-1 und das Beispiel. Skalarprodukt: Das Produkt einer Zeile a1 (n1 Elemente) mit einer Spalte a2 (n2 Elemente) ist berechenbar für n1 = n2 und unabhängig von der Reihenfolge. c = a1 a2 = aT2 a1T ,
2. Blockweise über Summation von Dyaden n C= ak bk , n = nA = mB . 3. Spaltenweise
B = k A = Ak Multiplikation mit Skalar k: bi j = kai j
Spur
1. Elementweise über Skalarprodukte ci j = ai b j .
k=1
3.1.2 Rechenoperationen
Addition A = B±C
Tabelle 3-1. Praxis der Matrizenmultiplikation. Vier Versionen zur Berechnung der Matrix C = AB sind praktikabel
falls n1 = n2 .
(3-6)
Dyadisches Produkt. Die Dyade C = ab als Anordnung linear abhängiger Spalten ck = bk a oder Zeilen ck = ak b ist erklärt für beliebige Elementanzahl na , nb und hat den Rang 1. T
C = [Ab1 Ab2 . . . Abn ] , 4. Zeilenweise ⎡ 1 ⎤ ⎢⎢⎢ a B ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ , C = ⎢⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎣ ⎦ an B
n = nB .
n = mA .
Beispiel: 101 A= , 211
⎡ ⎤ ⎢⎢⎢1 3 0⎥⎥⎥ ⎢⎢⎢ ⎥ B = ⎢⎢⎢1 −1 0⎥⎥⎥⎥⎥ . ⎣ ⎦ 1 1 1
Typisches Skalarprodukt
⎡ ⎤ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢ ⎥ 1 a b1 = [1 0 1] ⎢⎢⎢⎢⎢ 1 ⎥⎥⎥⎥⎥ = 2 . ⎣ ⎦ 1
Typische Dyade 1 130 [1 3 0] = . a1 b1 = 2 260 1 a b1 a1 b2 a1 b3 241 AB = 2 = , 461 a b1 a2 b2 a2 b3 AB = a1 b1 + a2 b2 + a3 b3 130 0 0 0 111 = + + 260 1 −1 0 111 241 . = 461 Das Produkt BA ist nicht ausführbar, da Spaltenanzahl von B und Zeilenanzahl von A nicht übereinstimmen. Falk-Anordnung. Insbesondere für die Handausführung von Mehrfachprodukten, z. B. D = ABC = ( AB)C, empfiehlt sich das folgende Anordnungsschema. Das Zwischenergebnis Z = AB ist dabei nur einmal hinzuschreiben.
A11
A12
A Mathematik und Statistik / Mathematik
Bei quadratischen (2,2)-Matrizen gilt
a12 , a22
a11 A= a21
−1
A
=A
−1
a22 −a21
−a12 , a11
falls A = det( A) = a11 a22 − a12 a21 0 . Die durchgezogene Umrahmung zeigt das Skalarprodukt z11 = a1 b1 , die gestrichelte Umrahmung d21 = z2 c1 . Multiplikative Eigenschaften Orthogonale Matrizen (quadratisch) enthalten Spalten ai (Zeilen ak ), deren Skalarprodukte aTi a j entweder 1 (i = j) oder 0 (i j) werden: AT A = AAT = I
(3-7)
Beispiel: A=
c −s , s c
s = sin ϕ ,
c = cos ϕ .
Unitäre Matrizen (quadratisch) erweitern die reelle Orthogonalität auf komplexe Matrizen: T T A¯ A = A A¯ = I
(3-8)
Beispiel:
A=
c js , js c
s = sin ϕ ,
T A¯ =
c −js , −js c
(3-9)
Beispiel: c A= s
s , −c
−c A= −js
js . c
( A1 A2 . . . Ak )T = ATk . . . AT2 AT1 −1 −1 ( A1 A2 . . . Ak )−1 = A−1 k . . . A2 A1 A(B + C) = AB + AC
(3-12)
( A + B)C = AC + BC Kronecker-Produkt (auch: direktes Produkt). Das Kronecker-Produkt ist definiert als multiplikative Verknüpfung (Symbol ⊗) zweier Matrizen A (p Zeilen, q Spalten) und B (r Zeilen, s Spalten) zu einer Produktmatrix K (pr Zeilen, qs Spalten) nach folgendem Schema: a11 B . . . a1q B . .. K = A ⊗ B = .. . . a p1 B . . . a pq B
(3-13)
( A ⊗ B)(C ⊗ D) = ( AC) ⊗ (BD) ( A ⊗ B)T = AT ⊗ BT ( A ⊗ B)
−1
−1
=A
(3-14) −1
⊗ B , falls A, B regulär
det( A ⊗ B) = (detA)nb (detB)na für p = q = na , r = s = nb . Man beachte die Unterschiede zu den Rechenregeln (3-12) für gewöhnliche Matrizenprodukte.
Die Kehrmatrix oder inverse Matrix A−1 zu einer gegebenen Matrix A ist erklärt als Faktor zu A derart, dass die Einheitsmatrix entsteht: AA−1 = A−1 A = I .
AB BA, von Sonderfällen abgesehen ABC = ( AB)C = A(BC)
A ⊗ B B ⊗ A , von Sonderfällen abgesehen A ⊗ (B ⊗ C) = ( A ⊗ B) ⊗ C
Involutorische Matrizen sind orthogonal und symmetrisch (reell) bez. unitär und hermite’sch (komplex):
Rechenregeln:
Beziehungen:
c = cos ϕ .
A2 = I .
(3-11)
(3-10)
3.1.3 Matrixnormen
Bei der Beurteilung und globalen Abschätzung von linearen Operationen sind Normen von großer Bedeutung.
3 Matrizen und Tensoren
Tabelle 3-2. Notwendige Eigenschaften von Normen
Spaltennorm a a > 0 für a 0 Homogenität ca = |c| a Dreiecksa + b a + b ungleichung |aT b| a j bk Name
Matrixnorm A A > 0 für A 0 cA = |c| A A+ B A+B AB A j Bk
Abschätzung eines Skalarproduktes ⎧ ⎪ a2 b1 ⎪ ⎪ ⎪ ⎪ ⎨ T |a b| ⎪ a1 b2 . ⎪ ⎪ ⎪ ⎪ ⎩ a b 3 3 Abschätzung einer linearen Abbildung Axk Ak xk , k = 1, 2 oder 3 .
mit
(3-15)
n k=1
|ak |
Betragssummennorm
√
Euklid’sche Norm Zeilennorm
n
A2 = max ak 2 A3 =
(3-16)
Spaltennorm
=
n n
i=1 k=1
|aik |2 Euklid’sche Norm
T ¯ A sp A
3.2 Determinanten
√ a1 = 4 , a2 = 10 , a3 = 30 . √ b1 = 2 , b2 = 5 , b3 = 7 . √ 30 · 7 = 14,5 (aT b = 14) 10 · 2 , 4 · 5 , ⎡ ⎤ ⎡ ⎤ ⎢⎢⎢ 5 −1 2 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢ ⎥ ⎢ ⎥ A = ⎢⎢⎢⎢⎢ −1 0 2 ⎥⎥⎥⎥⎥ , x = ⎢⎢⎢⎢⎢ −j ⎥⎥⎥⎥⎥ , ⎣ ⎦ ⎣ ⎦ 3 −2 1 2 ⎡ ⎤ ⎢⎢⎢ 9 + j ⎥⎥⎥ ⎢ ⎥ y = Ax = ⎢⎢⎢⎢⎢ 3 ⎥⎥⎥⎥⎥ . ⎣ ⎦ 5 + 2j Ak xk Ak xk yk
a2 =
k=1
bT = [1 1 1 −2]
k=2 9 4 36 17,44
Maximumnorm
k=1
k=1
aT b = 14 .
k=1 8 2 16 √ 82
Spaltennorm a n a1 = max |ak |
a3 = a¯ T a Matrixnorm A n A1 = max ak 2
Beispiele : aT = [1 2 3 −4] ,
Tabelle 3-3. Spezielle Normen und Abschätzungen
k=3 √ 49 = 7 √ 6 17,15 √ 120
Für inverse Formen gibt es folgende Abschätzungen, die für alle Normen k = 1, 2, 3 gelten: hack A−1 ( A + B)−1 , 1 − A−1 B falls Nenner > 0 , (3-17) A−1 ( A + B)−1 , 1 − A−1 B falls Nenner > 0 .
Die Determinante ist eine skalare Kenngröße einer quadratischen Matrix mit reellen oder komplexen Elementen: a11 . . . a1n . .. A = det( A) = .. (3-18) . = | A| . an1 . . . ann Theoretisch ist det( A) gleich der Summe der n! Produkte (3-19) det( A) = (−1)r a1k1 a2k2 . . . ankn mit den n! verschiedenen geordneten Indexketten k1 , k2 , . . . , kn ; ki ∈ {1, 2, . . . , n}. Der Exponent r ∈ N gibt die Anzahl der Austauschungen innerhalb der Folge 1, 2, . . . , n, k1 , k2 , . . . , kn an. Die praktische Berechnung erfolgt über eine Dreieckszerlegung. Beispiel: n = 3, n! = 6 k1 1 1 2 2 3 3
k2 2 3 3 1 1 2
k3 3 2 1 3 2 1
r 0 1 0 1 0 1
Summand a11 a22 a33 −a11 a23 a32 a12 a23 a31 −a12 a21 a23 a13 a21 a32 −a13 a22 a31
Adjungierte Elemente Ai j zu a ji (Indexvertauschung) sind als partielle Ableitungen der Determi-
A13
A14
A Mathematik und Statistik / Mathematik
nante erklärt oder als Unterdeterminanten D ji des Zahlenfeldes der Matrix A, das durch Streichen der i-ten Spalte und j-ten Zeile entsteht. Ai j =
∂A , ∂a ji
Ai j = (−1)i+ j D ji .
(3-20)
Die adjungierte Matrix Aadj = (Ai j ) zu A ist gleich dem A-fachen der Inversen: Aadj = (Ai j ) , −1
Aadj = AA
AAadj = Aadj A = AI , .
(3-21)
Beispiel: Entwickung einer Determinante 3. Ordnung nach der 1. Zeile a11 a12 a13 det( A) = a21 a22 a23 a31 a32 a33 a22 a23 a21 a23 a21 a22 − a12 + a13 = a11 a32 a33 a31 a33 a31 a32
3.3 Vektoren 3.3.1 Vektoreigenschaften
Rechenregeln: 1. det(A) = det( AT ) = A 2. det(a1 , λa2 , a3 , . . .) = λ det(a1 , a2 , a3 , . . .) det (λA) = λn A, A = (a1 , . . . , an ) 3. Additivität det(a1 , a2 + b2 , a3 , . . .) = det(a1 , a2 , a3 , . . .) + det(a1 , b2 , a3 , . . .) 4. Vorzeichenänderung pro Austausch det(a1 , a3 , a2 , a4 , . . .) = −det(a1 , a2 , a3 , a4 , . . .) 5. Lineare Kombination von Zeilen und/oder Spalten verändert A nicht. (3-22) det(a1 , a2 + λa1 , a3 , . . .) = det(a1 , a2 , a3 , . . .) 6. det(Dreiecksmatrix) = Produkt der Hauptdiagonalelemente 7. det(AB) = det( A) det(B) = det(BA) 8. Regeln 2 bis 5 gelten analog für Zeilen. 9. Hadamard’sche Ungleichung n n a2ik [det( A)]2
In der Physik treten gerichtete Größen auf, die durch einen Skalar alleine nicht vollständig bestimmt sind; so zum Beispiel das Moment. Zu seiner Charakterisierung benötigt man insgesamt drei Angaben, die zusammengenommen einen Vektor v bestimmen. Bildlich wird v durch einen Pfeil dargestellt, siehe Bild 3-2. Ein Vektor ist gekennzeichnet durch die drei Größen Betrag (Länge, Norm), Richtung und Richtungssinn (Orientierung). Im dreidimensionalen Raum unserer Anschauung lassen sich Vektoren als geordnetes Paar eines Anfangspunktes A und eines Endpunktes E darstellen; sog. gerichtete Strecke. Dabei ist die absolute Lage der Endoder Anfangspunkte unerheblich, siehe Bild 3-2. In der Physik kommen Vektoren besonderer Art vor, die
i=1 k=1
10.
det
AB = det( A) det( D − C A−1 B) C D
Entwicklungssatz: Eine Determinante det( A) lässt sich nach den Elementen einer beliebigen Zeile i oder Spalte k entwickeln.
Bild 3-2. Feld gleicher freier Vektoren v. B: Betrag; R: Richtung; RS: Richtungssinn
det( A) = ai1 A1i + ai2 A2i + ai3 A3i + · · · + ain Ani , det( A) = a1k Ak1 + a2k Ak2 + a3k Ak3 + · · · + ank Akn . (3-23) Ai j : adjungierte Elemente zu a ji
Bild 3-3. Feld gleicher linienflüchtiger Vektoren v beim starren Körper. W: Wirkungslinie
3 Matrizen und Tensoren
Tabelle 3-4. Merkmale von Vektoren
Merkmale Freier Vektor B R RS Linienflüchtiger Vektor B RS W Gebundener Vektor B RS W A B Betrag, R Richtung, RS Richtungssinn, W Wirkungslinie, A Angriffspunkt
zusätzliche Merkmale aufweisen. Beim starren Körper z. B. verursachen nur solche Kräfte identische Wirkungen, die in Betrag, Wirkungslinie und Richtungssinn übereinstimmen, wobei die Wirkungslinie die Richtung enthält, Bild 3-3. In der Mathematik versteht man unter einem „Vektor“ stets einen freien Vektor. Wird im Raum (mit dem Sonderfall der Ebene) ein Bezugspunkt (auch: Initialpunkt) O ausgezeichnet, so nennt man die gerichtete Strecke von O zu einem beliebigen anderen Punkt P Ortsvektor. Einheitsvektoren haben den Betrag 1 und werden durch den Exponenten null oder mit dem Buchstaben e bezeichnet. Vektor a ,
Betrag a = |a| ,
Richtungseinheitsvektor a0 ea = a0 = a/a .
oder ea zu a : (3-24)
Ein Vektor mit der Länge null heißt Nullvektor o. Die Norm (Betrag, Länge) eines Vektors hat die Eigenschaften der Spaltennorm. Kollineare Vektoren sind einander parallel. Komplanare Vektoren im Raum haben eine gemeinsame Senkrechte.
tion eines Vektors mit einem Skalar c verhalten sich Vektoren wie Skalare. c1 (c2 a) = (c1 c2 )a , c(a + b) = ca + cb , (c1 + c2 )a = c1 a + c2 a . 3.3.2 Basis
Die Vektoren g1 , g2 , g3 , im Raum sind linear unabhängig voneinander, wenn zwei beliebige von ihnen nicht den dritten darstellen können: c1 g1 + c2 g2 + c3 g3 = o nur für c1 = c2 = c3 = 0 .
Dies ist gegeben, falls das Vektortripel nicht komplanar ist, also ein Volumen (Parallelepiped, Spat) nach Bild 3-5 aufspannt. Jeder Vektor v des Raumes lässt sich dann eindeutig als Linearkombination des Tripels gi darstellen. Man spricht in diesem Zusammenhang von einer Koordinatendarstellung des Vektors v bezüglich der Basis gi . Falls (3-27) für g1 , g2 , g3 gilt: gi Basis. (3-28) v = vi gi = v1 g1 + v2 g2 + v3 g3 . vi , auch vi , Koordinaten; vi gi , auch vi gi , Komponenten. Der Kopfzeiger i ∈ N ist eine Nummerierungsgröße und keine Potenz.
(3-25)
Addition zweier Vektoren geschieht im Raum unserer Anschauung durch Aneinanderreihung der Vektoren (Vektorzug), wobei der Summenvektor s als gerichtete Strecke vom willkürlichen Anfangspunkt A bis zum abhängigen Endpunkt E unabhängig von der Reihung der Vektorsummanden ist, siehe Bild 3-4.
Bild 3-4. Vektoraddition s = a + b − c = b + a − c
a+b= b+a, a + b + c = a + (b + c) = (a + b) + c , a − b = a + (−b) = (−b) + a , (3-26) a + (−a) = o . Der negative Vektor −a unterscheidet sich von a nur durch den Richtungssinn. Bezüglich der Multiplika-
(3-27)
Bild 3-5. Spat eines nicht komplanaren Tripels gi
A15
A16
A Mathematik und Statistik / Mathematik
Tabelle 3-5. Spezielle Basen
Bezeichnung Allgemein Normiert Orthogonal Orthonormal
Darstellung x = x1 g1 + x2 g2 + x3 g3 = xi gi x = xi gi , |gi | = 1 g1 , g2 , g3 senkrecht zueinander x = xi ei , |ei | = 1 und e1 , e2 , e3 senkrecht zueinander; xi heißen hier kartesische Koordinaten
Im Raum unserer Anschauung, Bild 3-6, entspricht das Skalarprodukt der Projektion des Einheitsvektors ea in die Richtung eb multipliziert mit dem Produkt der Beträge a, b und umgekehrt. a · b = abea · eb = ab cos ϕ , a = |a| , b = |b| , (3-31) ϕ Winkel zwischen a und b, 0 ϕ π . Rechenregeln:
Summationskonvention: Über gleiche Indizes ist zu summieren. Eine Basis gi bildet ein Rechtssystem, wenn beim Drehen von g1 nach g2 auf kürzestem Wege eine Rechtsschraube in die Richtung von g3 vorrücken würde oder wenn g1 dem Daumen, g2 dem Zeigefinger und g3 dem Mittelfinger der gespreizten rechten Hand zugeordnet werden kann. Koordinatendarstellungen für Vektoren ermöglichen das konkrete Rechnen besonders im Fall nur einer einheitlichen Basis gi . Die Addition reduziert sich dann auf die skalare Addition der Koordinaten.
u · v = u1 v1 a1 · a1 + u1 v2 a1 · a2 + u1 v3 a1 · a3 + u2 v1 a2 · a1 + u2 v2 a2 · a2 + u2 v3 a2 · a3 + u3 v1 a3 · a1 + u3 v2 a3 · a2 + u3 v3 a3 · a3 3 3
u j vk a j · ak = u j vk a jk .
v = vi gi ,
(3-29)
i
Die Multiplikation zweier Vektoren a und b wird in zweckmäßiger Weise zurückgeführt auf die skalare Multiplikation der Koordinaten. Die Motivation für die zwei eingeführten Multiplikationstypen
a jk = ak j = a j · ak Metrikkoeffizienten . (3-33)
√ v = v · v = v j vk a jk . (3-34) Skalarprodukt orthonormaler Basisvektoren ei 0 für i j ei · e j = δ i j = , 1 für i = j δi j Kronecker-Symbol.
inneres (Skalar-, Punkt-)Produkt a · b = c , c Skalar ;
Beispiel:
äußeres (Vektor-, Kreuz-)Produkt a × b = c , c Vektor ;
a = 5e1 + 2e2 + e3 b = −e1 − 4e2 + 2e3
ergibt sich aus den Anwendungen. 3.3.3 Inneres oder Skalarprodukt
Das Skalarprodukt von zwei Vektoren a und b im Raum ist bei einheitlicher orthonormaler Basis gleich dem Skalarprodukt ihrer Koordinatenspalten. a = ai ei ,
b = b i ei ,
ei orthonormal ,
a · b = a b = a b + a b + a3 b3 = ai bi . T
1 1
2 2
(3-32)
j=1 k=1
s = (u + v ) gi . i
= a · b/(ab) , = b·a, = c(a · b) , = a·b+a·c, = a2 = |a|2 .
Beliebige Basis ai , u = ui ai , v = vi ai
=
Addition s = u + v , u = ui gi ,
cos ϕ a·b (ca) · b a · (b + c) a·a
(3-30)
Bild 3-6. Skalarprodukt
(3-35)
3 Matrizen und Tensoren
Betrag:
Koordinatenspalten ⎡ ⎤ ⎢⎢⎢ 5 ⎥⎥⎥ ⎢ ⎥ a = ⎢⎢⎢⎢⎢ 2 ⎥⎥⎥⎥⎥ , ⎣ ⎦ 1 cos ϕ =
⎡ ⎤ ⎢⎢⎢ −1 ⎥⎥⎥ ⎢ ⎥ b = ⎢⎢⎢⎢⎢ −4 ⎥⎥⎥⎥⎥ ⎣ ⎦ 2
aT b −11 a·b = √ √ = √ = −0,438 , ab 30 21 630 Rechenregeln:
ϕ = 64,0◦ .
a × b = −b × a , (ca) × b = c(a × b) ,
3.3.4 Äußeres oder Vektorprodukt
Das Vektorprodukt von zwei Vektoren a und b im Raum ist bei einheitlicher orthonormaler Basis erklärt als schiefsymmetrische Linearkombination der beteiligten Koordinatenspalten. a = a i ei ,
c = ab sin ϕ, 0 ϕ π ϕ Winkel zwischen a und b c gleich der Fläche des Parallelogramms mit den Kanten a und b .
b = b i ei ,
a × b = c , c = ci ei , ⎡ 1⎤ ⎡ 3 2 ⎤ ⎢⎢⎢ c ⎥⎥⎥ ⎢⎢⎢ b a − b2 a3 ⎥⎥⎥ ⎢⎢⎢ 2 ⎥⎥⎥ ⎢⎢⎢ 3 1 ⎥ = (a ×) b ⎢⎢⎢ c ⎥⎥⎥ = ⎢⎢⎢ −b a + b1 a3 ⎥⎥⎥⎥⎥ ⎣ 3⎦ ⎣ 2 1 ⎦ = −(b ×) a , c b a − b1 a2 ⎤ ⎡ ⎢⎢⎢ 0 −a3 a2 ⎥⎥⎥ ⎥ ⎢ (a ×) = ⎢⎢⎢⎢⎢ a3 0 −a1 ⎥⎥⎥⎥⎥ = ! a. ⎦ ⎣ 2 1 −a a 0
e1 × e2 = e3 , e3 × e1 = e2 , |a × b| . sin ϕ = ab
(3-37)
e2 × e3 = e1 ,
3.3.5 Spatprodukt, Mehrfachprodukte (3-36)
Im Raum unserer Anschauung, Bild 3-7, entspricht das Vektorprodukt a× b einem Vektor c mit folgenden Eigenschaften: c = a × b: Richtung: Senkrecht auf a und b Richtungssinn: a, b, c bilden in dieser Reihenfolge ein Rechtssystem
a × (b + c) = a × b + a × c , a×a= o,
Das gemischte Produkt (a1 × a2 ) · a3 eines Vektortripels ist ein Skalar, dessen Betrag bei Priorität des Vektorproduktes unabhängig ist von der Reihung der Vektoren und Verknüpfungen. Bei Veränderung des Zyklus 1, 2, 3 verändert sich lediglich das Vorzeichen. Im Anschauungsraum entspricht das Produkt (a1 × a2 ) · a3 dem Volumen V des Parallelepipeds mit a1 , a2 und a3 als Kanten; es wird deshalb auch Spatprodukt genannt. (a1 , a2 , a3 ) = (ai × a j ) · ak = ai · (a j × ak ) . i, j, k sind zyklisch : (ai , a j , ak ) = V , i, j, k antizyklisch: (ai , ak , a j ) = −V , Bei einheitlicher orthonormaler Basis für alle 3 Vektoren ist V gleich der Determinante. a1 = ai1 ei , V = det( A) ,
a2 = ai2 ei ,
a3 = ai3 ei ,
A = (ai j ) .
(3-38)
Regeln (a, b, c + d) = (a, b, c) + (a, b, d) . (a, b, c + a) = (a, b, c) . Bild 3-7. Kreuzprodukt c = a × b
(3-39)
(a, b, c) = 0 heißt, dass a, b, c komplanar sind.
A17
A18
A Mathematik und Statistik / Mathematik
Doppeltes Kreuzprodukt a × (b × c) = (a · c)b − (a · b)c . (a × b) × (c × d) = (a, c, d)b − (b, c, d) a = (a, b, d)c − (a, b, c) d . d = [(d, b, c)a + (a, d, c)b + (a, b, d)c]/V , falls V = (a, b, c) 0. (a × b) · (c × d) = (a · c)(b · d) − (a · d)(b · c) . (a × b) · (a × b) = a2 b2 − (a · b)2 .
Tabelle 3-6. Eigenschaften des tensoriellen Produktes T = uv u, v, w ∈ T (1) , c ∈ R.
u(v + w) = uv + uw, (u + v)w = uw + vw Distributiv (cu)v = u(cv) = cuv Assoziativ bez. Skalar Koordinatendarstellung u = ui gi , v = v j g j , T = ui v j gi g j = ti j gi g j , ti j Tensorkoordinaten, gi g j Basis Indexnotation T = ti j gi g j ⎡ 11 12 13 ⎤ ⎢⎢⎢ t t t ⎥⎥⎥ ⎢ ⎥ Matrixnotation T = ⎢⎢⎢⎢⎢ t21 t22 t23 ⎥⎥⎥⎥⎥ gi g j ⎣ 31 32 33 ⎦ t t t
3.4 Tensoren Spezielle Tensoren und Tensoreigenschaften:
3.4.1 Tensoren n-ter Stufe
Vektoren im Raum unserer Anschauung, kurz im R3 , stehen für reale, z. B. physikalische Größen, die drei skalare Einzelinformationen enthalten. Die Beschreibung eines Vektors v in verschiedenen Basen ai und bi mit entsprechenden Koordinaten ändert nichts an seinem eigentlichen Wert; man nennt v auch eine invariante Größe. v = via ai = vib bi .
(3-40)
Die Menge aller invarianten Größen nennt man Tensor. Ein Skalar ist dann ein Tensor, wenn er als Skalarprodukt u · v von zwei Vektoren gebildet wird.
Einheitstensor E (2) Transposition T Symmetrie TT Antimetrie TT Inverser Tensor TT −1 3.4.2 Tensoroperationen
Addition: Erklärt für Tensoren gleicher Stufe. Zum Beispiel (3)
(3)
(3)
T1 + T2 = T3 , i jk
Skalar T (0) = u · v Tensor 0. Stufe . Vektor T (1) = T i gi Tensor 1. Stufe . T i: Koordinaten des Tensors bezüglich der Basis gi .
(3-41)
T
=t,
T
(1)
= ti gi ,
T (2) = ti j gi g j ,
(3-42)
T (3) = ti jk gi g j gk , T (4) = ti jkl gi g j gk gl
usw .
i jk
T (3) T (3) 1 = t1 gi g j gk , 2 = t2 gi g j gk , i jk i jk (3) T 3 = t1 + t2 gi g j gk .
(3-44)
Tensorielles Produkt:
Rein operativ kommt man zu Tensoren höherer Stufe durch Definition des dyadischen oder tensoriellen Produktes T = uv von zwei Vektoren. Zwischen den Vektoren ist keine Verknüpfung erklärt. Allgemeiner Tensor n-ter Stufe ist eine invariante Größe T (n) , deren Basis ein tensorielles Produkt von n-Grundvektoren ist: (0)
= δi j ei e j = Iei e j = uv , T T = vu =T = −T (3-43) −1 =T T =E
T (m) T (n) = T (m+n) ,
(3-45)
Zum Beispiel T (2) = ti j gi g j , T
(2)
T
(1)
T (1) = tk gk ,
(3-46)
= t t gi g j gk = t gi g j gk . ij k
i jk
Tabelle 3-7. Skalar- und Kreuzprodukte aus T (1) = u
und T (2) = vw Verknüpfung
Umrechnung
T (1) · T (2) T (2) · T (1) T (1) × T (2) T (2) × T (1)
u · (vw) (vw) · u u × (vw) (vw) × u
= (u · v)w = v(w · u) = (u × v)w = v(w × u)
Typ des Produktes T (1) T (1) T (2) T (2)
4 Elementare Geometrie
Tabelle 3-8. Skalar- und Kreuzprodukte aus T 1 = ab und T 2 = uv, T 1 , T 2 ∈ T (2)
Verknüpfung T1 · T T1 × T2 T · ·T 2 E (2) · ·T (2)
Umrechnung
Typ des Produktes (ab) · (uv) = (b · u)(av) T (2) (ab) × (uv) = a(b × u)v T (3) (ab) · · (uv) = (a · v)(b · u) T (0) DoppelSkalar-Produkt δi j tkl (ei e j ) · · (ek el ) = tii Spur von T
Bild 4-1. Polarkoordinaten
Koordinatenlinien r = const: Kreise um Koordinatenursprung 0 . ϕ = const: Halbgeraden durch 0 .
Beispiel: Volumenbezogenes elastisches Potenzial Π. Verzerrungstensor ε ∈ T (2) , Elastizitätstensor E ∈ T (4) , 2Π = ε · ·E · · ε ∈ T (0) .
4.1.4 Flächenkoordinaten
Für Operationen in Dreiecksnetzen (Bild 4-2) ist ein Koordinatentripel (L1 , L2 , L3 ) zweckmäßig. Rein anschaulich entspricht zum Beispiel die L1 -Koordinate des Punktes P dem Verhältnis der schraffierten Fläche AP23 zur gesamten A123 .
4 Elementare Geometrie 4.1 Koordinaten
L1 = AP23 /A123 ,
4.1.1 Koordinaten, Basen
Der Lagebeschreibung eines Punktes dienen nach 3.3.2 Ortsvektoren mit bestimmten Koordinaten bezüglich einer vorgegebenen Basis. Die Basen selbst können punktweise verschieden sein (lokale Basis; siehe Differenzialgeometrie), müssen aber vor einer Verknüpfung miteinander auf eine gemeinschaftliche Basis (globale Basis) transformiert werden. 4.1.2 Kartesische Koordinaten
Sie sind bezüglich einer rechtshändigen Orthonormalbasis definiert, siehe Tabelle 3-5, und werden bevorzugt als globales Bezugssystem benutzt. x = x1 e1 + x2 e2 + x3 e3 auch x = xe1 + ye2 + ze3 .
A123 = Fläche 123 .
L1 + L2 + L3 = (AP23 + AP13 + AP12 )/A123 = 1 . (4-3) Koordinatenlinien L1 = const: Linien parallel zur Dreiecksseite 23. L2 , L3 = const: entsprechend. Die Flächenkoordinaten entstehen durch lineare Transformation der kartesischen Koordinaten x, y mittels der speziellen Paare (xi , yi ), der 3 Eckpunkte des Dreiecks i = 1, 2, 3. x = x1 L1 + x2 L2 + x3 L3 , y = y1 L1 + y2 L2 + y3 L3 , 1 = L1 + L2 + L3 .
(4-1)
4.1.3 Polarkoordinaten
Ein Punkt in der Ebene (z. B. e1 , e2 -Ebene nach Bild 4-1) wird durch Nullpunktabstand r 0 und Orientierung zur e1 -Richtung bestimmt. Koordinaten r, ϕ .
x = r cos ϕ,
y = r sin ϕ . (4-2)
Bild 4-2. Flächenkoordinaten
(4-4)
A19
A20
A Mathematik und Statistik / Mathematik
Die Integration von Flächenkoordinatenpotenzen über der Dreiecksfläche gestaltet sich einfach: " p!q!r! · 2A123 . (4-5) L1p Lq2 Lr3 dA = (p + q + r + 2)! A123
Für Operationen in räumlichen Tetraedernetzen (Bild 4-3) sind Volumenkoordinaten L1 , L2 , L3 , L4 zweckmäßig. Rein anschaulich entspricht der L1 -Koordinate des Punktes P das Verhältnis des Teilvolumens VP234 zum gesamten. V1234 = Volumen 1234 . (4-6)
= (VP234 + VP134 + VP124 + VP123 )/V1234 = 1 . Koordinatenflächen L1 = const: Flächen parallel zur Fläche 234 . L2 , L3 , L4 = const: entsprechend. Volumen- und kartesische Koordinaten sind linear verknüpft mittels der Eckpunktkoordinaten (xi , yi , zi ), i = 1, 2, 3, 4. x= y= z= 1=
x1 L1 y1 L1 z1 L1 L1
+ + + +
x2 L2 y2 L2 z2 L2 L2
+ x3 L3 + y3 L3 + z3 L3 + L3
Ein Punkt P im kartesischen Raum kann nach Bild 4-4 durch seine z-Koordinate und die Polarkoordinaten , ϕ seiner Projektion P∗ in die e1 , e2 -Ebene dargestellt werden. Koordinaten , ϕ, z.
4.1.5 Volumenkoordinaten
L1 = VP234 /V1234 , L1 + L2 + L3 + L4
4.1.6 Zylinderkoordinaten
+ + + +
x4 L4 , y4 L4 , z4 L4 , L4 .
x = cos ϕ , r2 = 2 + z2 .
y = sin ϕ,
p q
L1 L2 Lr3 L4s dV =
= const: Zylinder mit e3 als Achse . ϕ = const: Ebenen durch die e3 -Achse . (4-10) z = const: Ebenen senkrecht zur e3 -Achse . 4.1.7 Kugelkoordinaten
Ein Punkt P im kartesischen Raum kann nach Bild 4-5 durch seine Projektion in die z-Achse und die Polarkoordinaten seiner Projektion P∗ in die e1 , e2 -Ebene beschrieben werden.
(4-7)
V1234
p!q!r!s! · 6V1234 . (p + q + r + s + 3)!
Bild 4-4. Zylinderkoordinaten
(4-8)
Bild 4-3. Volumenkoordinaten
(4-9)
Koordinatenflächen
Die Integration von Volumenkoordinatenpotenzen im Bereich des Tetraedervolumens gestaltet sich einfach: "
z=z.
Bild 4-5. Kugelkoordinaten
4 Elementare Geometrie
Koordinaten r, v, ϕ. x = r sin ϕ cos ϑ , z = r cos ϕ .
Tabelle 4-1. Darstellung einer Geraden in der Ebene
y = r sin ϕ sin ϑ ,
(4-11)
Koordinatenflächen r = const: Kugeln um den Koordinatenursprung O . ϑ = const: Ebenen durch die e3 -Achse . ϕ = const: Kegel mit e3 als Achse und O als Spitze .
(4-12)
Punkt P1 Steigung m Punkt P1 Richtung v
4.2 Kurven, Flächen 1. und 2. Ordnung 4.2.1 Gerade in der Ebene
In einem kartesischen x, y-System nach Bild 4-6 ist jede Gerade der Graph einer linearen Funktion ax + by + c = 0
mit a + b > 0 , 2
2
a = 0 : Parallele zur x-Achse mit y = −c/b , b = 0 : Parallele zur y-Achse mit x = −c/a , c = 0 : Gerade durch den Nullpunkt ,
(4-13)
wobei ein Koeffizient beliebig zu 1 normiert werden kann. Das Tripel (a, b, c) bestimmt alle charakteristischen Größen einer Gerade. Achsenabschnitte xˆ = −c/a zu yˆ = 0 falls a 0 , yˆ = −c/b zu xˆ = 0 falls b 0 . b Richtungsvektor v = ± . −a a Normalenvektor n = ± . b
Bild 4-6. Gerade in kartesischer Basis
Gegeben Achsenabschnitte xa auf x-Achse ya auf y-Achse 2 Punkte P1 P2 Pi (xi , yi )
Geradengleichung y x + =1 xa ya ( y − y1 )(x2 − x1 ) = (x − x1 )( y2 − y1 ) x y 1 oder x1 y1 1 = 0 x2 y2 1 y − y1 = m(x − x1 ) r = r1 + tv, t beliebiger Skalar r1 Ortsvektor zum Punkt P1
Steigung m = −a/b = tan α , y = mx − c/b . Abstand Gerade − Ursprung √ √ d0 = |rT n|/ a2 + b2 = |c|/ a2 + b2 . (4-16) r : Ortsvektor zu einem Punkt P der Geraden. Abstand di eines beliebigen Punktes Pi (xi , yi ) von der Geraden: axi + byi + c (−sgn c) . (4-17) di = √ a2 + b2 sgn c : Vorzeichen von c . di > 0 : Gerade zwischen Pi und Ursprung .
(4-14)
Beispiel: Der Punkt P1 (x1 = 2, y1 = 1) hat nach (4-17) von der Geraden 3x + 4y + 12 = 0 den Abstand
(4-15)
3 · 2 + 4 · 1 + 12 (−1) = −4,4 , √ 9 + 16 wobei das Minuszeichen anzeigt, dass P1 und Ursprung gleichseitig zur Geraden liegen. Drei Punkte P1 , P2 , P3 liegen auf einer Geraden, falls ihre Koordinatendeterminante D verschwindet; ansonsten ist D gleich dem doppelten Flächeninhalt des Dreiecks A123 . Bei positivem Umlaufsinn P1 , P2 , P3 (x-Achse auf kürzestem Wege in die y-Achse gedreht) ist die Determinante positiv. x1 y1 1 (4-18) D = x2 y2 1 = 2A123 . x3 y3 1
A21
A22
A Mathematik und Statistik / Mathematik
Zwei nicht parallele Geraden g1 , g2 schneiden sich in einem Punkt mit den Koordinaten (xs , ys ). g1: a1 x + b1 y + c1 = 0 oder y = m1 x + n1 g2: a2 x + b2 y + c2 = 0 oder y = m2 x + n2 xs =
b 1 c2 − b 2 c1 n1 − n2 = a 1 b 2 − a 2 b 1 m2 − m1
ys =
c1 a 2 − c2 a 1 m2 n 1 − m1 n 2 = . a1 b2 − a2 b1 m2 − m1
(4-19)
Drei Geraden ai x + bi x + ci = 0, i = 1, 2, 3, sind parallel oder schneiden sich in einem Punkt, falls ihre Koeffizienten linear abhängig sind: a1 b1 c1 a2 b2 c2 = 0 . (4-20) a 3 b 3 c3 Strahlensätze beschreiben die Relationen der Abschnitte ai auf Parallelen p1 , p2 und ai j auf nicht parallelen Geraden g1 , g2 nach Bild 4-7.
a22 a12 = , a21 a11 a2 a22 = , a1 a21
a22 − a21 a12 − a11 = , a21 a11 a2 a12 = . a1 a11
4.2.2 Ebene im Raum
In einem kartesischen x, y, z-System nach Bild 4-8 ist jede Ebene der Graph einer linearen Funktion ax + by + cz + d = 0 mit a2 + b2 + c2 > 0 , a = 0 : Ebene parallel zur x-Achse , a = b = 0 : Ebene parallel zur x, y-Ebene ,
(4-21)
d = 0 : Ebene durch den Nullpunkt , wobei ein Koeffizient beliebig zu 1 normiert werden kann. Das Quadrupel (a, b, c, d) bestimmt alle charakteristischen Größen einer Ebene. Achsenabschnitte xˆ = −d/a zu yˆ = zˆ = 0 falls a 0 , yˆ = −d/b zu xˆ = zˆ = 0 falls b 0 , zˆ = −d/c zu xˆ = yˆ = 0 falls c 0 .
(4-22)
Normalenvektor nT = ±[a b c], Abstand Ebene - Ursprung
Bild 4-7. Geradenabschnitte für die Strahlensätze
d0 = |rT n|/n = |d|/n , n2 = a2 + b2 + c2 . (4-23) Abstand di eines beliebigen Punktes Pi (xi , yi , zi ) von der Ebene. axi + byi + czi + d (−sgn d) . (4-24) di = √ a 2 + b 2 + c2 sgn d: Vorzeichen von d. di > 0: Ebene zwischen Pi und Ursprung. Vier Punkte P1 , P2 , P3 , P4 liegen in einer Ebene, falls ihre Koordinatendeterminante D verschwindet; ansonsten ist D gleich dem sechsfachen Volumen des Tetraeders V1234 . Das Vorzeichen ist abhängig vom Umlaufsinn. x1 y1 z1 1 x y z 1 2 2 2 = 6V1234 . (4-25) D = x3 y3 z3 1 x4 y4 z4 1
Bild 4-8. Ebene in kartesischer Basis
Der Flächeninhalt A dreier Punkte Pi in der Ebene ax + by + cz + d = 0 wird für d 0 durch die Koordi-
4 Elementare Geometrie
naten von Pi (xi , yi , zi ) und den Abstand d0 bestimmt. Das Vorzeichen ist abhängig vom Umlaufsinn. y z x 1 1 1 1 d2 2 A= . (4-26) x2 y2 z2 , d0 = 2 2d0 a + b 2 + c2 x y z 3
3
3
Beispiel. Eine Ebene ist gegeben durch ihre Achsenabschnitte mit den Punkten P1 (xa , 0, 0), P2 (0, ya , 0), P3 (0, 0, za ). Gesucht ist die von P1 , P2 , P3 aufgespannte Fläche A. Aus der Achsenabschnittsform x/xa + y/ya + z/za = 1 folgt die Normalform xya za + yxa za + zxa ya + d = 0 mit d = −xa ya za und d02 = x2a y2a z2a /(y2a z2a + x2a z2a + x2a y2a ) nach (4-26). Die Koeffizientendeterminante in (4-26) ist nur in der Hauptdiagonale belegt, und es gilt
A = xa ya za /(2d0) = y2a z2a + x2a z2a + x2a y2a /2 . Der Schnittpunkt Ps (xs , ys , zs ) dreier Ebenen E1 bis E3 berechnet sich aus einem linearen System. E i : a i x + b i y + ci z + d i = 0 , Ars + d = o , A = a b c ,
(4-27)
dT = [d1 d2 d3 ] . Die Normalenvektoren n1 und n2 zweier Ebenen bestimmen den Winkel α zwischen den Ebenen und einen Vektor v in Richtung der Schnittgerade. cos α = n1 · n2 /(n1 n2 ) ,
nTi = [ai bi ci ] ,
n2i = a2i + b2i + c2i ,
v = n1 × n2 .
(4-28)
Tabelle 4-2. Darstellungen einer Ebene
Gegeben Achsenabschnitte xa auf x-Achse ya auf y-Achse za auf z-Achse 3 Punkte nicht auf einer Geraden Punkt P1 Normale n Punkt P1 , 2 Vektoren a b in der Ebene
Tabelle 4-3. Darstellungen einer Geraden im Raum
Gegeben 2 Punkte P1 , P2 Punkt P1 Richtung v
Tabelle 4-4. Lagebeziehungen zweier räumlicher Geraden
g1 , g2 :
g1 : r = r1 + t1 v1 , g2 : r = r2 + t2 v2
Kreuzprodukt v1 × v2 o o
Richtungsbeziehung Abstand d Geraden parallel d = |vi × (r1 − r2 )|/|vi |, i = 1 oder 2 Geraden nicht parallel |(r2 − r1 )(v1 × v2 )| d= |v1 × v2 | d = 0: Geraden schneiden einander d 0: windschiefe Geraden
4.2.3 Gerade im Raum
Die Gerade g im Raum entsteht als Schnittlinie v (4-28) zweier Ebenen E1 , E2 mit den Normalenvektoren n1 , n2 . Drei Punkte P1 , P2 , P3 liegen auf einer Geraden (sind kollinear), falls die von P1 , P2 , P3 aufgespannte Fläche A in (4-26) verschwindet. 4.2.4 Kurven 2. Ordnung
Sie genügen einer quadratischen Gleichung mit 2 Koordinaten und beschreiben Kegelschnitte: Ellipse, Hyperbel und Parabel. xc11 x + xc12 y + b1 x + yc12 x + yc22 y + b2 y + a0 = 0 ,
Ebenengleichung y z x + + =1 xa ya za x y z 1 x y z 1 1 1 =0 1 x2 y2 z2 1 x3 y3 z3 1 nT = [a b c], a(x − x1 ) + b(y − y1 ) + c(z − z1 ) = 0 r = r1 + ua + vb, u, v beliebige Skalare r1 Ortsvektor zum Punkt P1
Geradengleichung y − y1 z − z1 x − x1 = = x2 − x1 y2 − y1 z2 − z1 r = r1 + tv, t beliebiger Skalar
(4-29)
xT Cx + bT x + a0 = 0, C, b, a0 ∈ R , b1 c11 c12 x . C= = CT , b = , x= y c12 c22 b2
kurz
Kegelschnitte entstehen als Schnittkurven von Ebenen und Kreiskegeln. Geht die Ebene durch die Kegelspitze, entstehen entartete Kegelschnitte, Geradenpaare oder auch nur ein Punkt. Koeffizientenpaarungen C, b, a0 , die nicht durch reelle Koordinaten erfüllt werden können, nennt man imaginäre Kegelschnitte.
A23
A24
A Mathematik und Statistik / Mathematik
Beispiel: a2 x2 + b2 y2 + 1 = 0. Eine globale Klassifikation gelingt durch 2 Koeffizientendeterminanten. C b/2 (4-30) C = |C| , D = T . b /2 a0
D0
D=0
C>0 Ellipse (reell oder imaginär) Punkt
C0 >0 >0 >0 λ1 >0 >0 >0 =0
λ2 >0 >0 0 >0 >0 >0
λ2 >0 >0 >0 >0 >0
λ3 >0 >0 0 0 ,
Hn−3 > 0 ,
... ,
an−2 > 0 ,
(6-7)
H1 = a 1 > 0 .
= (e3jx − 3e2jx e−jx + 3ejx e−2jx − e−3jx )/(−8j) = (3 sin x − sin 3x)/4 .
7.2 Trigonometrische Funktionen
Routh: Rk > 0 ,
k = 1, 2, . . . , n ,
Rk = Hk /Hk−1 ,
H0 = 1 .
(6-8)
Allgemein benutzt werden vier trigonometrische Funktionen (Kreisfunktionen),
7 Transzendente Funktionen
Tabelle 7-1. Spezielle Werte trigonometrischer Funktionen
Bogenmaß x Gradmaß x
0 0◦
π/6 30◦
sin x
0
cos x
1
1/2 √ 3/2 √ 3/3 √ 3
tan x
0
cot x
–
π/4 45◦ √ 2/2 √ 2/2 1 1
Cosinus Tangens Cotangens
π +x 2
π/3 60◦ √ 3/2
π/2 90◦
y
1
sin y =
1/2 √ 3 √ 3/3
0
g , h a f (x) = cos x = , h g f (x) = tan x = , a a f (x) = cot x = , g
π+x
3 π+x 2
cos x
− sin x
− cos x
cos y =
− sin x
− cos x
sin x
–
tan y =
− cot x
tan x
− cot x
0
cot y =
− tan x
cot x
− tan x
f (x) = sin x =
Sinus
Tabelle 7-2. Periodizität bezüglich π/2
Zusammenhang zwischen den trigonometrischen Funktionen bei gleichem Argument: (7-4)
sin2 x + cos2 x = 1 , tan x · cot x = 1 .
sin (x ± y) = sin x cos y ± cos x sin y ; cos (x ± y) = cos x cos y ∓ sin x sin y ; tan (x ± y) =
tan x ± tan y ; 1 ∓ tan x tan y
cot (x ± y) =
cot x cot y ∓ 1 . cot y ± cot x
Umrechnung zwischen Bogenmaß und Gradmaß: (7-5)
Periodizität: sin (x + 2πk) = sin x , cos (x + 2πk) = cos x , tan (x + πk) = tan x , cot (x + πk) = cot x ; sin (−x) = − sin x , tan (−x) = − tan x ,
(7-6)
k∈Z. cos (−x) = cos x , cot (−x) = − cot x .
(7-7)
Bild 7-1. Trigonometrische Funktionen am Kreis mit
Radius h
(7-8)
Additionstheoreme: Für Summe und Differenz zweier Argumente:
die am Kreis nach Bild 7-1 für ein rechtwinkliges Dreieck mit Gegenkathete g, Ankathete a und Hypotenuse h darstellbar sind. Für die Rechenpraxis sind spezielle Funktionswerte (Vielfache von π/12) von Nutzen. 180xBogen = πxGrad .
tan x = sin x/cos x ,
Bild 7-2. Trigonometrische Funktionen
(7-9)
A37
A38
A Mathematik und Statistik / Mathematik
Tabelle 7-3. Beziehungen zwischen trigonometrischen Funktionen gleichen Arguments
sin2 x
cos2 x
sin2 x =
–
1 − cos2 x
cos2 x =
1 − sin2 x 2
tan2 x = cot2 x =
sin x 1 − sin2 x 1 − sin2 x sin2 x
tan2 x tan2 x 1 + tan2 x 1 1 + tan2 x
– 1 − cos2 x cos2 x cos2 x 1 − cos2 x
– 1 tan2 x
x tan = ± 2
2 tan x ; 1 + tan2 x sin 3x = 3 sin x − 4 sin3 x ;
sin 2x = 2 sin x cos x =
sin 4x = 8 cos3 x sin x − 4 cos x sin x ; 1 − tan2 x ; 1 + tan2 x cos 3x = 4 cos3 x − 3 cos x ;
cos 2x = cos2 x − sin2 x =
cos 4x = 8 cos4 x − 8 cos2 x + 1 ; 2 tan x 2 = ; 1 − tan2 x cot x − tan x
–
1 − cos x 1 + cos x 1 − cos x sin x = ; = 1 + cos x sin x x 1 + cos x cot = ± 2 1 − cos x sin x 1 + cos x = = . 1 − cos x sin x
Für Vielfache des Argumentes:
tan 2x =
cot2 x 1 1 + cot2 x cot2 x 1 + cot2 x 1 cot2 x
(7-11)
Produkte von Funktionen: (7-10)
3 tan x − tan3 x tan 3x = ; 1 − 3 tan2 x
sin(x + y) sin(x − y) = cos2 y − cos2 x ; cos(x + y) cos(x − y) = cos2 y − sin2 x ; ' 1 sin x sin y = cos(x − y) ∓ cos(x + y) ; (7-12) cos x cos y 2 ' 1 sin x cos y = sin(x + y) ± sin(x − y) . cos x sin y 2
tan 4x =
4 tan x − 4 tan3 x ; 1 − 6 tan2 x + tan4 x
cot 2x =
cot2 x − 1 cot x − tan x = ; 2 cot x 2
cot 3x =
cot3 x − 3 cot x ; 3 cot2 x − 1
sin2 x =
cot 4x =
cot4 x − 6 cot2 x + 1 . 4 cot3 x − 4 cot x
cos2 x =
Für halbe Argumente: (Das Vorzeichen ist entsprechend dem Argument x/2 zu wählen.) x 1 − cos x ; sin = ± 2 2 x 1 + cos x cos = ± ; 2 2
Potenzen:
sin3 x = cos3 x = sin4 x = cos4 x =
1 (1 − cos 2x) ; 2 1 (1 + cos 2x) ; 2 1 (3 sin x − sin 3x) ; 4 1 (3 cos x + cos 3x) ; 4 1 (cos 4x − 4 cos 2x + 3) ; 8 1 (cos 4x + 4 cos 2x + 3) . 8
(7-13)
7 Transzendente Funktionen
Tabelle 7-4. Additionstheoreme für Summe und Differenz zweier trigonometrischer Funktionen
f
g
sin x
sin y
cos x
cos y
cos x
sin x
tan x
tan y
cot x
cot y
tan x
cot y
cot x
tan y
f +g
x+y x−y 2 sin cos ; 2 2 x+y x−y 2 cos cos ; 2 2
( f ± g)
x+y x−y sin 2 2 x+y x−y −2 sin sin 2 2 2 cos
$ √ $ #π ± x = 2 cos ∓x 4 4 sin(x ± y) cos x cos y sin(x ± y) ± sin x sin y √
2 sin
#π
cos(x − y) cos x sin y cos(x + y) sin x cos y
Bezug zu harmonischen Schwingungen mit der Frequenz ω, der Zeit t, der Amplitude A und der Phase ϕ: f (t) = a sin ωt + b cos ωt = A sin(ωt + ϕ) , A2 = a2 + b2 , tan ϕ = b/a . n Ai sin(ωt + ϕi ) = A sin(ωt + ϕs ) ,
(7-14)
i=1
n = 2:
f −g
tan ϕs = (A1 sin ϕ1 + A2 sin ϕ2 )/ (A1 cos ϕ1 + A2 cos ϕ2 ) .
Inverse trigonometrische Funktionen
Sie werden auch Arcus- oder zyklometrische Funktionen genannt und ergeben sich durch Spiegelung an der Geraden y = x. Allgemein werden vier Arcusfunktionen benutzt, siehe Bild 7-3. Arcussinus Arcuscosinus Arcustangens Arcuscotangens
f (x) = arcsin x f (x) = arccos x f (x) = arctan x f (x) = arccot x
Bild 7-3. Inverse trigonometrische Funktionen. Kennzeichnung der Hauptwerte durch H()
(auch sin−1 x) , (auch cos−1 x) , (auch tan−1 x) , (auch cot−1 x) . (7-15)
A39
A40
A Mathematik und Statistik / Mathematik
Tabelle 7-5. Beziehungen zwischen hyperbolischen Funktionen gleichen Arguments
sinh2 x
cosh2 x
sinh2 x
–
cosh2 x − 1
cosh2 x
sinh2 x + 1
–
sinh2 x sinh2 x + 1 sinh2 x + 1 sinh2 x
cosh2 x − 1 cosh2 x cosh2 x cosh2 x − 1
tanh2 x coth2 x
tanh2 x
coth2 x
tanh2 x 1 − tanh2 x 1 1 − tanh2 x
1 coth2 x − 1 coth2 x coth2 x − 1 1 coth2 x
– 1 tanh2 x
–
Die Arcusfunktionen sind mehrdeutig, deshalb werden sogenannte Hauptwerte definiert: −π/2 arcsin x +π/2 , 0 arccos x π , −π/2 < arctan x < +π/2 , 0 < arccot x < π ,
auch Arcsin x , auch Arccos x , auch Arctan x , auch Arccot x .
(7-16)
Beziehungen im Bereich der Hauptwerte: √ arcsin x = π/2 − arccos x = arctan x/ 1 − x2 , √ arccos x = π/2 − arcsin x = arccot x/ 1 − x2 , √ arctan x = π/2 − arccot x = arcsin x/ 1 + x2 , √ arccot x = π/2 − arctan x = arccos x/ 1 + x2 , ⎧ ⎪ ⎪ für x > 0 , ⎨ arctan(1/x) , arccot x = ⎪ (7-17) ⎪ ⎩ π + arctan(1/x) für x < 0 .
7.3 Hyperbolische Funktionen Allgemein benutzt werden vier hyperbolische Funktionen, auch Hyperbelfunktionen genannt, siehe Bild 7-4. Hyperbolischer Sinus, Hyperbelsinus sinh x = (e x − e−x )/2 ,
Hyperbolischer Cotangens, Hyperbelcotangens coth x = (e x + e−x )/(ex − e−x ) .
Beziehungen zwischen den hyperbolischen Funktionen entstehen formal aus den entsprechenden trigonometrischen Gleichungen, wenn man sin x durch j sinh x ersetzt und cos x durch cosh x. Beispiel: sin 2x = 2 sin x cos x → j sinh 2x = 2j sinh x cosh x , → sinh 2x = 2 sinh x cosh x .
Hyperbolischer Cosinus, Hyperbelcosinus cosh x = (ex + e−x )/2 , Hyperbolischer Tangens, Hyperbeltangens tanh x = (ex − e−x )/(ex + e−x ) ,
Bild 7-4. Hyperbolische Funktionen
Spezielle Beziehungen bei gleichem Argument: (7-18)
cosh2 x − sinh2 x = 1 ,
tanh x = sinh x/cosh x , tanh x coth x = 1 .
8 Transzendente Funktionen
Additionstheoreme für Summe und Differenz zweier Argumente: sinh(x ± y) = sinh x cosh y ± cosh x sinh y ; cosh(x ± y) = cosh x cosh y ± sinh x sin y ; tanh(x ± y) =
tanh x ± tanh y ; 1 ± tanh x tanh y
coth(x ± y) =
1 ± coth x coth y . coth x ± coth y
(7-19)
Theoreme für doppeltes und halbes Argument: Bild 7-5. Inverse hyperbolische Funktionen
sinh 2x = 2 sinh x cosh x ; cosh 2x = sinh2 x + cosh2 x ; tanh 2x =
2 tanh x ; 1 + tanh2 x
coth 2x =
1 + coth2 x ; 2 coth x
(7-20)
sinh2 x = (cosh 2x − 1)/2 ; cosh x = (cosh 2x + 1)/2 ;
Inverse hyperbolische Funktionen Sie werden auch Areafunktionen genannt (entsprechend der Flächenzuordnung an der Einheitshyperbel) und ergeben sich durch Spiegelung an der Geraden y = x, siehe Bild 7-5. Areasinus
f (x) = arsinh x ;
Areacosinus
f (x) = arcosh x ;
Areatangens
f (x) = artanh x ;
Areacotangens
f (x) = arcoth x .
2
sinh 2x cosh 2x − 1 = . tanh x = sinh 2x cosh 2x + 1 Summe und Differenz zweier Funktionen: 1 1 sinh x ± sinh y = 2 sinh (x ± y) cosh (x ∓ y) ; 2 2 cosh x + cosh y 1 1 = 2 cosh (x + y) cosh (x − y) ; (7-21) 2 2 1 1 cosh x − cosh y = 2 sinh (x + y) sinh (x − y) ; 2 2 tanh x ± tanh y = sinh(x ± y)/cosh x cosh y . Potenzen werden nach (7-2) über e-Funktionen berechnet. Satz von Moivre: (cosh x ± sinh x)n = cosh nx ± sinh nx = e±nx . (7-22)
Statt Areasinus usw. sagt man auch Areasinus hyperbolicus oder Areahyperbelsinus. Explizite Darstellung durch logarithmische Funktionen: ⎧ √ ⎪ 2−1 , ⎪ x ln x + ⎪ ⎪ ⎨ y = arcosh x = ⎪ √ ⎪ ⎪ ⎪ ⎩ ln x − x2 − 1 ,
x > 1 ,y 0 , x 1 ,y 0 ,
√ arsinh x = ln x + x2 + 1 , artanh x =
1 1+x ln , 2 1−x
|x| < 1 ,
arcoth x =
1 x+1 ln , 2 x−1
|x| > 1 .
(7-23)
A41
A42
A Mathematik und Statistik / Mathematik
8 Höhere Funktionen 8.1 Algebraische Funktionen 3. und 4. Ordnung Algebraische Kurven in der Ebene sind Graphen von Potenzfunktionen mit ganzzahligen Exponenten. F(xm , yn ) = 0 .
(8-1)
Die Vielfalt ihrer Erscheinungsformen ist sehr groß, und die Hervorhebung spezieller Funktionen ist weitgehend historisch bedingt, siehe Tabelle 8-1.
8.2 Zykloiden, Spiralen Zykloiden (Rollkurven) entstehen durch Abrollen eines zentrischen Kreises mit Radius r auf einer Kreisscheibe K mit Radius RS längs einer Leitkurve kL , indem man die Bahn eines fest gewählten Punktes P
Bild 8-2. Verlängerte Zykloide mit r p > r
auf K mit Mittelpunktabstand r p aufzeichnet, siehe Bilder 8-2, 8-3 und Tabellen 8-2, 8-3. (Tabelle 8-3 und Bild 8-4 siehe S. A 43.)
8.3 Delta-, Heaviside- und Gammafunktion Deltafunktion von Dirac. Sie ist definiert über die Integraltransformation einer Funktion f (x), die an einer Stelle x = xi stetig ist. Bei gleicher Gewichtung der Randwerte xi = a und xi = b spricht man von einer symmetrischen Deltafunktion: ⎧ ⎪ 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎪ ⎪ ⎪ f (a) ⎪ b ⎪ " ⎪ 2 ⎪ ⎪ ⎨ f (x)δ(x − xi ) dx = ⎪ f (xi ) ⎪ ⎪ ⎪ ⎪ ⎪ a ⎪ 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎪ ⎪ ⎩ f (b) 2
für xi < a für xi = a für a < xi < b für xi > b für xi = b . (8-2)
Für f (x) ≡ 1 erhält man die Sprung- oder HeavisideFunktion mit d H(x − xi ) = δ(x − xi ) . dx ⎧ ⎪ 0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎨1 Symmetrisch H(x − xi ) = ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎩1 0 AntiH− (x − xi ) = metrisch 1 0 H+ (x − xi ) = 1 Bild 8-1. Cassini’sche Kurven. a2x = a2 + b2 , b2x = a2 − b2 ,
a2y = −a2 + b2 . Fall c auch Lemniskate
für x < xi , für x = xi , für für für für für
x > xi , x < xi , x xi , x xi , x > xi .
(8-3)
Eine exakte mathematische Analyse der Deltafunktion erfolgt in der Theorie der Distributionen; kontinuierliche Approximationen der Delta- und Sprung-
8 Höhere Funktionen
Tabelle 8-1. Einige Kurven 3. und 4. Ordnung (a > 0, b > 0)
Name Zissoide Strophoide
Kartesische Koordinaten y2 (a − x) = x3 (a − x)y2 = (a + x)x2
Kartesisches Blatt
x3 + y3 = 3axy
Konchoide
(x − a)2 (x2 + y2 ) = x2 b2
Cassini’sche Kurve
(x2 + y2 )2 − 2a2 (x2 − y2 ) = b4 − a4
Polarkoordinaten r = a sin2 ϕ/cos ϕ r = −a cos 2ϕ/cos ϕ 3a sin ϕ cos ϕ r= sin3 ϕ + cos3 ϕ r = b + a/cos ϕ
r2 = a2 cos 2ϕ ± b4 − a4 sin2 2ϕ
Bild 8-1
Tabelle 8-2. Zykloiden. rP = r gewöhnliche Form, rP > r verlängerte Form, rP < r verkürzte Form
Leitkurve Gerade
Name Zykloide
Kreis KL mit Radius R
Abrollen auf Außenseite von KL : Epizykloide
Kreis KL mit Radius R>r
Abrollen auf Innenseite von KL : Hypozykloide
Kreis r = R
Epizykloide: Kardioide (Herzkurve)
Kreis r = rP = R/4
Hypozykloide: Astroide (Sternkurve)
Parameterdarstellung x = rt − rP sin t y = rt − rP cos t # rt $ #R + r $ − rP cos x = (R + r) cos t R R # rt $ #R + r $ − rP sin y = (R + r) sin t R R # rt $ #R − r $ + rP cos x = (R − r) cos t R R # rt $ #R − r $ t y = (R − r) sin − rP sin R R Kartesisch/Polar (x2 + y2 − rP2 )2 = 4rP2 [(x − rP )2 + y2 ]
= 2rP (1 − cos ϕ), siehe Bild 8-3a (x2 + y2 − R2 )3 + 27R2 x2 y2 = 0 siehe Bild 8-3b
Bild 8-3. a Gewöhnliche Epizykloide mit r = rP , b gewöhnliche Hypozykloide mit r = rP = R/4
A43
A44
A Mathematik und Statistik / Mathematik
Tabelle 8-3. Weitere kinematisch begründete Kurven
Name
Entstehung, Darstellung
Kreisresolvente
Bahn des Angriffspunktes A an einem Faden, der straff von einer festen Rolle mit Radius r abgewickelt wird, wobei der jeweils freie „Fadenstrahl“ AB die Rolle in B tangiert. τ = t/r. x = r(cos τ + τ sin τ), y = r(sin τ − τ cos τ). t: abgewickelte Kreisbogenlänge. Siehe Bild 8-4a. Gleichgewichtsform eines Seiles (keine Biegesteifigkeit) mit konstantem Querschnitt, das im Schwerefeld zwischen 2 Punkten aufgehängt ist. y = a cosh(x/a). Evolvente der Kettenlinie. x = h(t − tanh t), y = h/cosh t. Der Tangentenabschnitt von einem beliebigen Kurvenpunkt P bis zum Schnitt T der Tangente in P mit der x-Achse ist für alle P konstant. Bahn eines Punktes P, dessen Abstand r zum Nullpunkt 0 proportional ist zum Umlaufwinkel ϕ, der von einem festen Anfangsstrahl durch 0 gemessen wird, siehe Bild 8-4b. r = aϕ, 0 ϕ < ∞. Gekennzeichnet durch inverse Proportionalität zwischen r und ϕ. r = a/ϕ, 0 < ϕ < ∞. r = a emϕ , m > 0, a > 0. Die Tangente in einem Spiralenpunkt P bildet mit dem Strahl P einen konstanten Winkel τ. τ = arccot m Ihre Bogenlänge s ist proportional zur Krümmung: s = a2 dα/ds. 2 2 "s "s σ σ x= cos sin dσ, y = dσ. 2a2 2a2 0 0 √ C, S : Fresnel’sche Integrale. σ = ta π. "u # π $2 u5 #π $ # π $4 u9 C= cos t2 dt = u − · · + − +... 2 2 2!5 2 4!9 0 "u # π $3 u7 # π $5 u11 #π $ π u3 − + − +... S = sin t2 dt = · · · 2 2 1!3 2 3!7 2 5!11
Kettenlinie Schleppkurve, auch Traktrix
Archimed’sche Spirale
Hyperbolische Spirale Logarithmische Spirale
Klothoide (Cornu’sche Spirale)
0
Bild 8-4. a Kreisresolvente, b Archimed’sche Spirale
8 Höhere Funktionen
funktion beruhen auf einer Kontraktion der wirksamen „Belastungslänge“ a, so zum Beispiel: a δ(x − 0) : , π(x2 + a2 ) 1 √ exp(−x2 /a2 ) . a π 1 1 H(x − 0) : + arctan (x/a) . (8-4) 2 π Jeweils a → 0 . Rechenregeln für H(x) und δ(x). d H(x) = δ(x) , xδ(x) = 0 , dx δ(ax) = (1/a)δ(x) (a > 0) , δ(x − x j ) mit δ[ f (x)] = | f (x j )| j
Bild 8-6. Gammafunktion
Gammafunktion Γ(x) und Gauß’sche Pi-Funktion Π(x) sind Erweiterungen der Fakultät-Funktion auf nichtganzzahlige Argumente x, siehe Bild 8-6, es gilt Π(x) = Γ(x + 1).
f (x j ) = 0 einfache Nullstelle , δ(x) dn δ(x) = (−1)n n! n , n dx x "∞ δ(xi − x)δ(x − x j ) dx = δ(xi − x j ) , −∞ "∞
f (x)δ (x j − x) dx = f (x j ) −∞
H(s) =
1 2π
"∞ −∞
1 δ(x − a) = 2π
Formeln für Γ(x): "∞
(falls f in x j stetig) ,
Γ(x) =
e−t t x−1 dt ,
x>0.
0
n x (n − 1)! , n→∞ x(x + 1)(x + 2) . . . (x + n − 1) x −1, −2, . . .
Γ(x) = lim
1 sin st dt + , t 2
Γ(x + 1) = xΓ(x) ,
"∞ e
(x−a)jt
dt .
(8-5)
−∞
Γ(x)Γ(1 − x) = π/(sin πx) für x2 0, 1, 4, 9, . . . , n = 0, 1, 2, . . . : Γ(n + 1) = Π(n) = n! , √ Γ n + 12 = (2n)! π/(n! 22n) . (8-6) Betafunktion "1 B(x, y) =
Bild 8-5. a Heaviside-Funktion, b Approximation der δ-
Funktion
t x−1 (1 − t)y−1 dt = 0
Γ(x)Γ(y) . Γ(x + y)
(8-7)
A45
A46
A Mathematik und Statistik / Mathematik
9 Differenziation reeller Funktionen einer Variablen 9.1 Grenzwert, Stetigkeit Reellwertige Funktionen beschreiben eindeutige Zuordnungen von Elementen y einer Teilmenge W der reellen Zahlen zu den Elementen x einer Teilmenge D der reellen Zahlen D: Definitionsbereich (-menge), Argumentmenge der Funktion (Abbildung) f W: Bildbereich (-menge), Wertebereich der (9-1) Funktion f W( f ) = {y| y = f (x) für x ∈ D}. Die Eindeutigkeit der Zuordnung ist das kennzeichnende Merkmal von Funktionen. Der Definitionsbereich muss kein Kontinuum sein. Funktionen können z. B. durch Gleichungen mit zwei Variablen x und y erklärt sein oder durch Wertetabellen, die durch graphische Darstellungen veranschaulicht werden können. Beispiel 1: f1 : y = (x2 − x)/x ,
Beispiel 2: f2 : y =
(x2 − x)/x 1
für für
x0 x=0.
Nicht zur Funktion gehörende Paare {x, y = f (x)} werden in der Abbildung durch einen leeren Kreis markiert, siehe Bild 9-1. Grenzwert. Konvergiert bei jeder Annäherung von x gegen einen festen Wert x0 (das heißt x → x0 ohne x = x0 ) die zugehörige Folge der Funktionswerte f (x) gegen einen Grenzwert g0 , so heißt g0 der Grenzwert der Funktion f an der Stelle x = x0 . Hierbei ist vorausgesetzt, dass in der Umgebung von x0 unendlich viele Werte x aus D für die Annäherung x → x0 zur Verfügung stehen (x0 Häufungspunkt). lim f (x) = g0 (x ∈ D) .
x→x0
Grenzwert g0 (falls überhaupt vorhanden) und Funktionswert f (x0 ) (falls definiert) sind wohl zu unterscheiden. Man definiert 3 Grenzwerte:
D = R\{0} , d. h., x 0 , W = R\{−1} , d. h., y −1 .
Grenzwert, allgemein:
lim f (x) = g ,
x→x0
Tabelle 9-1. Ableitungen elementarer reeller Funktionen. D: Bereich der Differenzierbarkeit f (x) c
f
D
f (x)
f
D
0
c∈R
x (n ∈ N)
nxn−1 1 nx1−1/n
x∈R
x−1
x>0
x (r ∈ R)
rx
e x , auch exp(x)
ex
r
r−1
n
x>0
x
x∈R
ln x
1/n
(n ∈ N)
sin x
cos x
x∈R
arcsin x
cos x
− sin x
x∈R
arccos x
tan x
1 = 1 + tan2 x cos2 x
x π/2 + nπ
arctan x
cot x
−
x nπ
arccot x
sinh x
cosh x
x∈R
arsinh x
cosh x
sinh x
x∈R
arcosh x
1 = 1 − tanh2 x cosh2 x 1 − = 1 − coth2 x sinh2 x
x∈R
artanh x
x0
arcoth x
tanh x coth x
1 = −1 − cot2 x sin2 x
(9-2)
1
x>0
√ 1 − x2 1 −√ 1 − x2 1 1 + x2
|x| < 1
1 1 + x2
x∈R
1 √ 1 + x2 1 √ x2 − 1 1 1 − x2
x∈R
−
1 1 − x2
|x| < 1 x∈R
x>1 |x| < 1 |x| > 1
9 Differenziation reeller Funktionen einer Variablen
Grenzwert, linksseitig:
lim f (x) = gl ,
(9-3)
x→x0 −0
Grenzwert, rechtsseitig:
lim f (x) = gr .
lim f2 = lim (x − 1) = −1 . x→0
Grenzwertsätze. Mit lim für lim und lim f1 (x) = g1 lim c f = c lim f = cg , lim ( f1 ± f2 ) = (lim f1 ) ± (lim f2 ) = g1 ± g2 , (9-4)
g2 0 .
Stetigkeit. Eine Funktion f (x) heißt an der Stelle x0 ihres Definitionsbereiches stetig, wenn dort der Grenzwert g0 existiert und g0 = f (x0 ) gilt: lim f (x) = f (x0 ) .
(9-5)
Beispiel 4: f2 ist bei x0 = 0 nicht stetig, weil g0 = −1 und f2 (x0 ) = 1 nicht übereinstimmen. Beispiel 5: ⎧ 2 2 x (x − 1) ⎪ ⎪ ⎪ ⎪ ⎨ (x + 1)(x − 1) f3 : y = ⎪ ⎪ ⎪ ⎪ ⎩ 1 f3 stetig für alle x ∈ R .
x x0 (9-6)
f (x0 + Δx) − f (x0 ) Δx Δf = lim , x = x0 + Δx . Δx→0 Δx
(9-7)
Nach Bild 9-2 steht der Differenzenquotient für die Steigung tan α = Δy/Δx der Sekante, die für x gegen x0 gegen die Tangente im Punkt (x0 , f (x0 )) konvergiert, falls f in x0 existiert. Den Grenzwert des Differenzenquotienten nennt man auch Differenzialquotient; sein Zähler d f = dy gibt den differenziellen Zuwachs der Funktion beim Fortschreiten um dx in x-Richtung an. dy Δf = oder dy = f dx , Δx dx f (x0 + dx) = f (x0 ) + dy . (9-8)
f = lim
Δx→0
Beispiel 1: f (x) = x2 + x .
für
x ±1
für
x = ±1
,
9.2 Ableitung einer Funktion Eine Funktion f ist in x0 differenzierbar, wenn der Differenzenquotient
Bild 9-1. Unstetige Funktion
und
Δx→0
x→x0
x→x0
x, x0 ∈ D
f (x0 ) = lim
und lim f2 (x) = g2 sowie g1 , g2 , c ∈ R gilt:
lim ( f1 f2 ) = (lim f1 )(lim f2 ) = g1 g2 , lim ( f1 / f2 ) = (lim f1 )/(lim f2 ) = g1 /g2 ,
mit
für x gegen x0 einen Grenzwert besitzt, den man mit f ( f Strich) oder auch f˙ ( f Punkt, falls x z. B. für die Zeit steht) bezeichnet und auch Ableitung der Funktion f nennt.
x→x0 +0
Beispiel 3: x→0
f (x) − f (x0 ) x − x0
[(x0 + Δx)2 + x0 + Δx] − [x20 + x0 ] Δx→0 Δx = lim (2x0 + Δx + 1) = 2x0 + 1 .
f (x0 ) = lim
Δx→0
Beispiel 2: f (x) = sin x . sin(x0 + Δx) − sin x0 f (x0 ) = lim Δx→0 Δx
Bild 9-2. Sekante und Tangente
A47
A48
A Mathematik und Statistik / Mathematik
sin x0 cos Δx + cos x0 sin Δx − sin x0 Δx cos Δx − 1 = sin x0 lim Δx→0 Δx sin Δx = cos x0 . + cos x0 lim Δx→0 Δx
= lim
Beispiel 1:
Δx→0
Für die Grenzwertberechnung der Quotienten benutze man die Reihenentwicklungen in Tabelle 9-3. Einseitige Ableitungen in x0 sind dann von Bedeutung, wenn der Grenzwert des Differenzenquotienten (9-6) nur bei einseitiger Annäherung an den Wert x0 existiert. Man spricht dann von links- oder rechtsseitiger Ableitung, siehe Bild 9-3.
f (x) = sin(x2 ) . g(x) = x2 . 2 d(sin g) d(x ) f = dg dx = (cos g) 2x = 2x cos x2 . Beispiel 2: f (x) = [sin x2 ]3 .
Ableitungen von Umkehrfunktionen. Bei Umkehrfunktionen wird die Gleichberechtigung von x und y = f (x) benutzt.
−1 dx dy = . dx dy
(9-11)
Beispiel:
f = const = c : (cg) = cg ,
h(x) = x2 .
f = (3g2 )(cos h)2x = 6x[sin x2 ]2 cos x2 .
Ableitungsregeln. Bei Existenz der Ableitungen f und g zweier Funktionen f (x) und g(x) gilt: ( f ± g) = f ± g , ( f g) = f g + f g ,
g(x) = sin h ,
( f /g) = ( f g − f g )/g , 2
(9-9)
g0.
Kettenregel. Lässt sich eine Funktion als ineinandergeschachtelter Ausdruck von differenzierbaren Teilfunktionen darstellen, dann ist die Kettenregel von Nutzen, wobei die einzelnen Differenzialquotienten als Einheit zu behandeln sind. f (x) = f [g(x)] f (x) = f {g[h(x)]} df df dg dg dh f (x) = · f (x) = · · dg dx dg dh dx (9-10) Die Quotientenkette lässt sich beliebig weiterführen.
f (x) = y = arcsin x . Umkehrung x = sin y . √ √ dx/dy = cos y = 1 − x2 , f = 1/ 1 − x2 . Logarithmisches Ableiten. Statt f (x) wird die logarithmierte Hilfsform h = ln f (x) abgeleitet. h = f / f
(Kettenregel)
→ f = h f .
(9-12)
Beispiel: √ f (x) = x 1 + x/(1 + x2 ) . 1 h = ln f (x) = ln x + ln(1 + x) − ln(1 + x2 ) . 2 √ 1 1 2x f = + − 1 + x/(1 + x2 ) . x x 2(1 + x) 1 + x2 Ableitungen höherer Ordnung. Die n-te Ableitung f (n) einer entsprechend oft differenzierbaren Funktion f ist die einfache Ableitung von f (n−1) . d d f (n−2) d f (n−1) = f (n) = dx dx dx n d f = ... = . (9-13) dxn
Bild 9-3. Einseitige Ableitungen bei einem Gelenkträger
Man schreibt auch f (0) = f, f (1) = f , f (2) = f usw.
9 Differenziation reeller Funktionen einer Variablen
Tabelle 9-2. MacLaurin-Restglieder mit Abschätzung Rn (xξ) Rn (x)
f (x) e
x
ln(1 + x)
(1 + x) x > −1, r ∈ R
Rn (xξ) eξx xn+1 (n + 1)! xn+1 (−1)n · n+1 (1 + ξx) n+1
Rn (x) e|x| |x|n+1 (n + 1)! xn+1 (x 0) n+1 |x|n+1 (−1 < x < 0) 1+x
B(1 + ξx)r−n−1 xn+1 ⎞ ⎛ ⎜⎜ r ⎟⎟⎟ ⎟⎟⎠ B = ⎜⎜⎜⎝ n+1
|B|xn+1(x 0, r < n + 1) ⎫ ⎪ (n + 1)|B||x|n+1 ⎬ ⎪ (r 1, −1 < x < 0) ⎭ ⎫ |x|n+1 ⎪ ⎪ ⎪ (n + 1)|B| ⎬ (1 + x)1−r ⎪ ⎪ ⎪ (r < 1, −1 < x < 0) ⎭
Mehrfache Ableitung eines Produktes f (x) = u(x)v(x) . n n (n−k) (k) v . [u(x)v(x)](n) = u k k=0
Rn (x, x0 ) =
(9-14)
Die Binomialkoeffizienten entnimmt man zweckmäßig dem Pascal’schen Dreieck, siehe 2.5.3. Beispiel: (uv) = u v + 3u v + 3u v + uv . 9.2.1 Funktionsdarstellung nach Taylor
Jedes Polynom n-ten Grades p(x) lässt sich durch seine n Ableitungswerte an einer beliebigen Stelle x0 darstellen. Taylor-Formel für Polynome: n n f (k) (x0 ) (x − x0 )k . (9-15) a k xk = p(x) = k! k=0 k=0
f (n+1) (x0 + ξ(x − x0 )) (x − x0 )n+1 , (n + 1)! (9-16)
0 1
Die Substitutionsmethode ist das Analogon zur Kettenregel, wobei die geeignete Wahl einer Hilfsfunktion von entscheidender Bedeutung ist; s. Tabelle 10-2. " " f (g) dg . (10-4) f [g(x)] dx = g Tabelle 10-2. Geeignete Hilfsfunktionen zur Substitution
Typ f (x) ⎞ ⎛ ⎜⎜⎜ n ax + b ⎟⎟⎟ ⎟⎟ ⎜ 1 f ⎜⎝ x, cx + d ⎠ √ 2 f (x, 1 ± x2 ) √ 3 f (x, ax2 + bx + c) Δ = b2 − 4ac 4
f (ex )
5
f (cos x, sin x)
6
f (sinh x, cosh x)
g(x) n ax + b cx + d √ 1 ± x2 2ax + b → Typ 2 Δ > 0: √ Δ 2ax + b → Typ 2 Δ < 0: √ −Δ x e x (trigonometrische tan Umformungen 2 nutzen) ex
Tabelle 10-3. Integralfunktionen
f (x) (ax + b)n
.
f (x) dx = F(x) + C
F(x) (ax + b)n+1 /(a(n + 1)) , n −1 ln |ax + b|/a , n = −1 (a2 + x2 )−1 a−1 arctan(x/a) 1 a + x (a2 − x2 )−1 ln 2a a − x ⎧ 2ax + b 2 ⎪ ⎪ ⎪ arctan Δ2 > 0 : ⎪ ⎪ ⎪ Δ Δ ⎪ ⎪ ⎪ ⎪ (ax2 + bx + c)−1 , ⎨ Δ = 0 : −2/(2ax + b) ⎪ ⎪ ⎪ Δ2 = 4ac − b2 ⎪ ⎪ ⎪ ⎪ j 2ax + b + jΔ ⎪ ⎪ ⎪ ln ⎩ Δ2 < 0 : Δ 2ax + b − jΔ x b . dx x 1 = ln |q(x)| − ax2 + bx + c q(x) 2a 2a q(x) √ 1/ a2 − x2 arcsin(x/a); − arccos(x/a) √ √ 2 2 1/ a + x ln(x + x2 + a2 ) √ √ a2 − x2 (x/2) a2 − x2 +(a2 /2) arcsin(x/a) √ x2 + a2 = f (x) (x/2) f (x) + (a2 /2) ln(x + f (x)) cos(m − n)x cos(m + n)x sin mx cos nx − − (m2 n2 ) 2(m − n) 2(m + n) sin(m − n)x sin(m + n)x sin mx sin nx − (m2 n2 ) 2(m − n) 2(m + n) sin(m − n)x sin(m + n)x cos mx cos nx + (m2 n2 ) 2(m − n) 2(m + n) eax sin bx eax (a sin bx − b cos bx)/(a2 + b2 ) eax cos bx eax (a cos bx + b sin bx)/(a2 + b2 ) 1/ sin x ln | tan(x/2)| 1/(1 + cos x) tan(x/2) tan x − ln | cos x| 1/ sinh x −2 artanh(e x ) ln x x ln x − x √ arcsin x x arcsin x + 1 − x2 √ arccos x x arccos x − 1 − x2 √ arctan x x arctan x − ln 1 + x2 √ arccot x x arccot x + ln 1 + x2 sin2 x (2x − sin 2x)/4 tan2 x tan x − x x sin x sin x − x cos x x2 sin x 2x sin x − (x2 − 2) cos x 1/ cos x ln | tan(x/2 + π/4)| 1/(1 − cos x) − cot(x/2) cot x ln | sin x|
10 Integration reeller Funktionen einer Variablen
Tabelle 10-3. Fortsetzung
Tabelle 10-4. Nichtelementare Integralfunktionen
1/ cosh x ln x/x
2 arctan(ex ) (ln x)2 /2
f (x)
arsinh x
x arsinh x −
sin x x
√ 1 + x2 √ x arcosh x − x2 − 1 √ x artanh x + ln 1 − x2 √ x arcoth x + ln x2 − 1 (2x + sin 2x)/4 − cot x − x cos x + x sin x 2x cos x + (x2 − 2) sin x
arcosh x artanh x arcoth x cos2 x cot2 x x cos x x2 cos x
Beispiel 1: " " cos g dg [cos(3x + 1)] dx = 3 1 = sin(3x + 1) + C . 3 Beispiel 2: " √ x dx . g = x2 + a , √ 2 x +a " √ √ 2 g = x/ x + a → F = dg = x2 + a + C . Partialbruchzerlegung. Sie ist anwendbar bei einer echt gebrochen rationalen Funktion f (x) = un (x)/vm (x) (Nennergrad m > Zählergrad n), die sich nach den Regeln der Algebra in eine Summe von Partialbrüchen P(x) zerlegen lässt. Die Zerlegung wird durch die Nullstellen des Nennerpolynoms gesteuert. k-fache reelle Nullstelle x0 : k Ai P(x) = (x − x0 ) i i=1 k-fache konjugiert komplexe Nullstelle x0 = s0 ± jt0 : P(x) =
k i=1
Bi + xCi x2 − 2s0 x + s20 + t02
(10-5)
i .
Die Koeffizienten Ai , Bi , Ci , werden bestimmt durch Koeffizientenvergleich, Gleichsetzen an den Nullstellen x0 oder Gleichsetzen an beliebigen Stellen xi . Die Darstellbarkeit einer Integralfunktion durch elementare Funktionen ist relativ selten. Beispiele dazu zeigen die Tabellen 10-1 und 10-3. Als Ausweg bleibt die numerische Integration oder die gliedweise Inte-
. F(x) = f (x) dx Integralsinus ∞ (−1)k x2k+1 k=0
(2k + 1)(2k + 1)!
+C
cos x x
Integralcosinus ∞ (−1)k x2k ln x + +C , 2k(2k)! k=1
sinh x x
Hyperbolischer Integralsinus ∞ x2k+1 +C (2k + 1)(2k + 1)! k=0
cosh x x
Hyperbolischer Integralcosinus ∞ x2k ln x + +C , 0 < x . 2k(2k)! k=1
(ln x)−1
ln | ln x| +
∞ (ln x)k k=1
kk!
+C ,
0<x.
0<x.
Gauß’sches Fehlerintegral ∞ (−1)k x2k+1
−x2
e
k=0
k!(2k + 1)
gration einer Reihenentwicklung von f (x); siehe dazu Tabelle 10-4.
10.2 Bestimmtes Integral 10.2.1 Integrationsregeln
Die Fläche zwischen der x-Achse und dem Bild der Funktion f (x) in Bild 10-1 lässt sich als Flächensumme über- oder unterschießender Rechtecke darstellen, die im Übergang zu unendlich vielen Streifen dem wahren Wert der Fläche A zustrebt. n n fi (links) Δx A fi (rechts) Δx , i=1
A = lim
n→∞
n i=1
"xe fi Δx =
i=1
f dx ,
xe xa .
xa
(10-6)
Für die konkrete Rechnung wesentlich ist der Hauptsatz der Differenzial- und Integralrechnung "xe f (x) dx = F(xe ) − F(xa ) , F (x) = f (x) . xa
(10-7)
A55
A56
A Mathematik und Statistik / Mathematik
10.2.2 Uneigentliche Integrale
Bei unbeschränkten Integrationsgrenzen oder unbeschränkten Funktionswerten f (ξ) an einer Stelle x = ξ berechnet man die uneigentlichen Integrale als Grenzwerte bestimmter Integrale. "∞
"b f (x) dx = lim
Bild 10-1. Geometrische Interpretation des bestimmten In-
tegrals im Intervall x0 x xn
a
"e f (x) dx +
a
a
f (x) dx = z
a
ξ+δ
a
→ 0, δ → 0 unabhängig voneinander , falls f (ξ) unbeschränkt ;
a
(10-8)
"∞
"a f (x) dx = lim
f (x) dx
a→∞ −a
⎡ ξ−ε ⎤ "b ⎢⎢⎢" ⎥⎥⎥ ⎢ ⎥ f (x) dx = lim ⎢⎢⎢⎢⎢ f (x) dx + f (x) dx⎥⎥⎥⎥⎥ , ε→0 ⎣ ⎦
"b
falls
a
f (x) g(x) . ⎧ e 2 ⎪ . ⎪ ⎪ ⎪ f (x)g(x) dx ⎪ ⎪ ⎪ ⎪ ⎪ a ⎪ ⎪ ⎨ e e . . ⎪ ⎪ 2 2 ⎪ ⎪ f (x) dx g (x) dx , ⎪ ⎪ ⎪ ⎪ a a ⎪ ⎪ ⎪ ⎩ Schwarz’sche Ungleichung ; ⎧ ⎪ .e ⎪ ⎪ ⎪ ⎪ ⎪ [ f (x) + g(x)] dx ⎪ ⎪ ⎪ ⎪ ⎪ ⎨a ⎪ .e .e ⎪ ⎪ ⎪ ⎪ | f (x)| dx + |g(x)| dx , ⎪ ⎪ ⎪ ⎪ a a ⎪ ⎪ ⎩ Dreiecksungleichung ; ⎧ ⎪ ⎪ .e ⎪ ⎪ ⎪ ⎨ f (x) dx = f (z)(e − a) , a z e , ⎪ ⎪ a ⎪ ⎪ ⎪ ⎩ Mittelwertsatz der Integralrechnung .
ε, δ > 0 .
Bei zweiseitiger Annäherung mit gleicher Rate spricht man vom Cauchy’schen Hauptwert.
−∞
g(x) dx
(10-12)
a
a
a "e
f (x) dx
f (x) dx ,
b→∞
a → −∞ und b → ∞ unabhängig voneinander . ⎤ ⎡ ξ−ε "b "b ⎥⎥⎥ ⎢⎢⎢" ⎥⎥⎥⎥ , ⎢⎢⎢⎢ f (x) dx + f (x) dx = lim f (x) dx ⎥⎥⎦ ⎢⎣ ε→0 ⎢ δ→0
f (x) dx ,
aze. e " "e f (x) dx | f (x)| dx .
a "e
a
"b
−∞
e
"e
a
"∞ f (x) dx = a→−∞ lim
Das bestimmte Integral ist vorzeichenbehaftet und positiv erklärt für f (x) > 0 sowie xe xa . Für im Intervall xa x xe stetige Funktionen gelten folgende Regeln für bestimmte Integrale (xa = a, xe = e): "a "e "a f (x) dx = 0 , f (x) dx = − f (x) dx . "z
f (x) dx .
b→∞
a
ξ+ε
a
ε>0,
falls f (ξ) unbeschränkt . (10-13)
(10-9)
Beispiel 1: .∞ x dx ist divergent. Der Cauchy’sche Hauptwert ist −∞
bestimmt, und zwar null. Beispiel 2:
(10-10)
"1
"1 ln x dx = lim
ε→0
0
= lim[x ln x − ε→0
(10-11)
ε
x]1ε
lim ε ln ε = lim
ε→0
ln x dx = lim(−1 + ε − ε ln ε) = −1 . ε→0
ln ε ε−1 = lim =0. ε−1 −ε−2
11 Differenziation reeller Funktionen mehrerer Variablen
Tabelle 10-5. Einige Werte bestimmter Integrale
f (x)
a
e
F=
.e
f (x) dx
a
(sin x)2n (cos x)2n (sin x)2n+1 (cos x)2n+1
0 0
π 2 π 2
cos mx cos nx sin mx sin nx
0
π
(sin x)2m+1 (cos x)2n+1
0
π 2
e−x xr−1
0
∞
e−ax cos bx e−ax sin bx exp(−x2 a2 )
0 0 0
∞ ∞ ∞
sin mx cos nx m−n=d
0
π
π 1 · 3 · 5 . . . (2n − 1) · , n ∈ N\{0} . 2 2 · 4 · 6 . . . (2n) 2 · 4 · 6 . . . (2n) , n∈N. 3 · 5 · 7 . . . (2n + 1) ⎧ ⎪ ⎪ ⎪ ⎪ ⎨ 0 für m n , m, n ∈ N . ⎪ π ⎪ ⎪ ⎪ für m = n ⎩ 2 ⎧ ⎪ ⎪ ⎪ Γ(m + 1)Γ(n + 1) ⎪ ⎪ ⎪ ; m, n −1 . ⎪ ⎪ ⎪ 2Γ(m + n + 2) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ m!n! ⎪ ⎪ ⎪ ; m, n ∈ N\{0} . ⎨ 2(m + n + 1)! ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ Gammafunktion Γ ⎪ ⎪ ⎪ ⎪ nr n! ⎪ ⎪ ⎪ , Γ(r) = lim ⎪ ⎪ ⎪ n→∞ r(r + 1)(r + 2) . . . (r + n) ⎩ ⎧ ⎪ ⎨ Γ(r) , r > 0. ⎪ ⎩ (r − 1)!, r ∈ N\{0} . a/(a2 + b2 ), 1/a für b = 0 b/(a2 + b2 ) √ π/(2a) ⎧ ⎪ ⎪ ⎪ 0 d gerade ⎪ ⎪ ⎨ ⎪ 2m ⎪ ⎪ ⎪ ⎪ ⎩ m2 − n2 d ungerade
11 Differenziation reeller Funktionen mehrerer Variablen
r>0.
Im dreidimensionalen Raum R3 unserer Anschauung sei jedem Punkt (x, y) ein Wert z eindeutig zugeordnet, vgl. Bild 11-1. Für vorgegebene konstante z-Werte c erhält man sogenannte Niveaulinien c = f (x, y).
11.1 Grenzwert, Stetigkeit Reellwertige Funktionen mit mehreren Veränderlichen beschreiben eine eindeutige Zuordnung von Elementen f (x) einer Teilmenge W der reellen Zahlen zu den Elementen x1 bis xn (n ∈ N), (auch zusammengefasst zur Spalte x), einer Teilmenge D der reellen Zahlen des Rn . D : Definitionsbereich (-menge) der Funktion. W : Wertebereich (-menge) der Funktion. W( f ) = { f (x) |x ∈ D} .
(11-1)
Übliche Bezeichnung bei n = 2 Veränderlichen: x1 = x ,
x2 = y ;
f (x, y) = z .
Bild 11-1. Abbildung z = f (x, y) für einen Punkt i im R3
A57
A58
A Mathematik und Statistik / Mathematik
Beispiel:
z = f (x, y) = 1 − x2 − y2 . Halbkugel. Niveaulinien mit 0 c < 1 sind Kreise √ mit dem Radius 1 − c2 . Grenzwert. Konvergiert bei jeder Annäherung von x gegen einen festen Wert x0 (das heißt x → x0 ohne x = x0 ) die zugehörige Folge der Funktionswerte f (x) gegen einen Grenzwert g0 , so heißt g0 der Grenzwert der Funktion f an der Stelle x0 . Hierbei ist vorausgesetzt, dass in jeder Umgebung von x0 unendlich viele Punkte aus D für die Annäherung x → x0 zur Verfügung stehen (d. h. x0 ist Häufungspunkt). lim f (x) = g0 (x ∈ D) . x→ x0
(11-2)
Grenzwert g0 (falls überhaupt vorhanden) und Funktionswert f (x0 ) (falls definiert) sind wohl zu unterscheiden. Beispiel: f = (x2 + y2 )/(xy). x y lim f = lim + . x→0 x→0 y x Ein Grenzwert g0 existiert nicht (g0 = 2 ist falsch), da beim Annäherungsprozess x → 0 das Verhältnis x/y beliebig gewählt werden kann. Es gelten die Grenzwertsätze und der Stetigkeitsbegriff nach 9.1.
11.2 Ableitungen
Zur Bezeichnung. Statt f, x und f,y schreibt man oft nur f x und fy . Zur Unterscheidung gegenüber Indizes, (11-4) besonders bei Tensoren und Matrizen, ist das zusätzliche Komma sehr zu empfehlen. Die partiellen Ableitungen entsprechen nach Bild 11-2 den Tangentensteigungen in den Koordinatenflächen. Entsprechende Differenzierbarkeit vorausgesetzt, sind höhere partielle Ableitungen möglich. ∂ ∂2 f ( f, x ) = f, xx = 2 , ∂x ∂x ∂ ∂2 f ( f, x ) = f, xy = , (11-5) ∂y ∂x∂y ∂ ∂2 f ( f,y ) = f,yx = . ∂x ∂y∂x Wenn f, xy und f,yx stetig in D, dann f, xy = f,yx . Für die partiellen Ableitungen gelten die Ableitungsformeln nach 9-2. Beispiel. f = xy2 sin(xy). f, x = y2 [sin(xy) + xy cos(xy)] , f,y = x[2y sin(xy) + y2 x cos(xy)] , f, xy = 2y[sin(xy) + xy cos(xy)] + y2 [x cos(xy) − x2 y sin(xy) + x cos(xy)] , f,yx = 2y sin(xy) + y2 x cos(xy)
Eine reellwertige Funktion f (x, y) ist in einem beliebigen Punkt (x, y) ∈ D partiell differenzierbar, wenn die Differenzenquotienten beim Grenzübergang f (x + Δx, y) − f (x, y) Δx ∂f = f, x (x, y) = (x, y), ∂x f (x, y + Δy) − f (x, y) lim Δy→0 Δy ∂f = f,y (x, y) = (x, y) ∂y
als unveränderlich, also wie eine Konstante zu behandeln. Entsprechendes gilt für f,y bzw. x.
+ x[2y2 cos(xy) − y3 x sin(xy) + y2 cos(xy)] .
lim
Δx→0
(11-3)
jeweils Grenzwerte besitzen; man nennt diese partielle Ableitungen. Bei der Berechnung von f, x ist y
Bild 11-2. Partielle Ableitungen f, x und f,y als Tangentensteigungen in den Koordinatenflächen
11 Differenziation reeller Funktionen mehrerer Variablen
Eine reellwertige Funktion ist total differenzierbar, wenn die Differenz der Funktionszuwächse (Δ f )1 und (Δ f )e bei Annäherung der Punkte (x, y) und (x + Δx, y + Δy) relativ zum Abstand r gegen null strebt (1: lineare Entwicklung, e: exakt). lim[(Δ f )e − (Δ f )1 ]/r = 0 , r→0
r2 = Δx2 + Δy2 ,
(Δ f )e = f (x + Δx, y + Δy) − f (x, y) , (Δ f )1 = f, x Δx + f,y Δy .
(11-6)
Dies ist für stetige partielle Ableitungen gewährleistet. Beim Übergang von Differenzen Δx, Δy zu Differenzialen dx, dy entsteht das totale Differenzial (11-7) d f = f, x dx + f,y dy , n allgemein d f = f,k dxk , f,k = ∂ f /∂xk . k=1
Gleichung der Tangentialebene im Punkt (x0 , y0 ): z(x, y) = f (x0 , y0 ) + f, x (x0 , y0 )(x − x0 ) + f,y (x0 , y0 )(y − y0 ) . (11-8) Totale Differenziale höherer Ordnung d2 f = f, xx (dx)2 + 2 f, xy dx dy + f,yy (dy)2 = (∂, x dx + ∂,y dy)2 f ,
∂, x = ∂/∂x ,
d f = (∂, x dx + ∂,y dy) f , k n k allgemein d f = ∂,r dxr f , k
k
r=1
(11-9)
∂,r = ∂/∂xr .
Kettenregel. Sind die Argumente x und y in f (x, y) ihrerseits differenzierbare Funktionen x(t), y(t) (Parameterdarstellung in t ∈ R) oder x(u, v), y(u, v), so gilt für die totalen Differenziale dx, dy (11-7). x(t), y(t) : d f = f, x x,t dt + f, y y, t dt . (11-10) x(u, v), y(u, v) : d f = f, x (x,u du + x,v dv) + f,y (y,u du + y,v dv) = f, u du + f, v dv . x u , , x= → grad f = J grad f, u = y v u x (11-11) x,u y,u Jacobi- oder Funktionalmatrix : J = , x,v y,v f, x Gradient von f nach x : grad f = , f,y x Umkehrung: grad f = J −1 grad f . u x
Beispiel: Gesucht F = f 2 , x + f 2 , y in Polarkoordinaten r/ = u und ϕ = v , x = r cos ϕ , y = r sin ϕ . cos ϕ sin ϕ J= , −r sin ϕ r cos ϕ 1 r cos ϕ − sin ϕ J−1 = . r r sin ϕ cos ϕ f, x −T −1 f,u = [ f,u f,v ]J J . F = [ f, x f,y ] f,y f,v 1 0 J −T J −1 = → F = f 2 ,u + f 2 , v /r2 . 0 1/r2 Zweite Ableitung. f,uu = ( f,u ),u . f,uu = ( f, xx x,u + f, xy y,u )x,u + ( f,yx x,u + f,yy y,u )y,u .
(11-12)
Implizites Differenzieren ist nützlich, wenn eine Funktion y = f (x) nur einer Veränderlichen x in der sogenannten impliziten Form F(x, y) = 0 vorliegt. Durch Bilden des totalen Differenzials dF/dx = 0 nach (11-7) gilt (11-13) f (x) = −F, x /F,y . Entsprechend gilt für z = f (x, y) in impliziter Form, F(x, y, z) = 0: (11-14) f, x = −F, x /F,z ; f,y = −F,y /F,z . Beispiel: F(x, y) = x2 − xy + y2 = 0 , f = dy/dx = −(2x − y)/(2y − x) , x 2y . Vollständiges Differenzial. Eine Form Δ = g1 (x, y)dx + g2 (x, y)dy mit 2 gegebenen Funktionen g1 , g2 hat dann den Charakter eines totalen Differenzials d f = f, x dx + f,y dy, wenn g1 und g2 auf f rückführbar sind. f, x = g1 , f,y = g2
oder
f, xy = g1 , y , f,yx = g2 , x .
Aus f, xy = f,yx folgt die Bedingung, dass g1 (x, y) und g2 (x, y) ein vollständiges Differenzial bilden: g1,y = g2,x .
(11-15)
Beispiel: g1 = 3x2 y und g2 = x3 bilden wegen g1 ,y = g2 , x = 3x2 ein vollständiges Differenzial mit d f . Aus g1 = f, x und g2 = f,y folgt f = x3 y + C.
A59
A60
A Mathematik und Statistik / Mathematik
11.2.1 Funktionsdarstellung nach Taylor
f (x, y) = f (0, 0) +
Für eine reellwertige Funktion f (x, y), die in der Umgebung x = x0 + th x ,
y = y0 + thy ,
|t| 1 von (x0 , y0 )
(n + 1)-mal differenzierbar ist, gilt eine Entwicklung zunächst im Parameter t f (x, y) = f (t) tk dk f (t = 0) + Rn (t, 0) , = k! (dt)k
(11-16)
wobei die Zuwächse dk f durch partielle Ableitungen bezüglich x und y darstellbar sind. d f /dt = f, x h x + f,y hy , d2 f /dt2 = f, xx h2x + 2 f, xy h x hy + f,yy h2y ,
(11-17)
allgemein d f /dt = n
n
n n r=0
r
r hn−r x hy
∂n f . ∂xn−r ∂yr
Für t = 1, also x = x0 + h x , y = y0 + hy , entsteht die Taylor-Formel mit Restglied: f (x0 + h x , y0 + hy ) n dk f (x0 , y0 ) + Rn (ξ, x0 , y0 ) , = f (x0 , y0 ) + (dt)k n! k=1 (11-18) dn+1 f (x0 + ξh x , y0 + ξhy ) 1 · , (n + 1)! (dt)n+1 ξ aus Abschätzung des Restgliedes.
Rn (ξ, x0 , y0 ) = 0 0 . y,u y,v y,w
z,u z,v . z,w
dz d dϕ
r2 sin ϕ dr dϕ dϑ
y = b0 + b1 ξ + b2 η . x = a0 + a1 ξ + a2 η , P1: x = x1 , y = y1 ; ξ = 0 , η = 0 . P2: x = x2 , y = y2 ; ξ = 1 , η = 0 . P3: x = x3 , y = y3 ; ξ = 0 , η = 1 . ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ 1 0 0 ⎥⎥⎥ ⎢⎢⎢ a0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎢ ⎥ ⎢⎢⎢ x2 ⎥⎥⎥ = ⎢⎢⎢ 1 1 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ a1 ⎥⎥⎥⎥⎥ ergibt ai (xi ) . ⎣ ⎦ ⎣ ⎦⎣ ⎦ x3 1 0 1 a2 x2 − x1 x3 − x1 ξ x x1 + . (12-16) = y y1 y2 − y1 y3 − y1 η x2 − x1 y2 − y1 Jacobi-Matrix J = , x3 − x1 y3 − y1 "" "" → f dx dy = f J dξ dη , − (x3 − x1 )(y2 − y1 ) . Transformation zum Einheitstetraeder nach Bild 12-4b. ⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎢⎢⎢ x ⎥⎥⎥ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ x2 − x1 x3 − x1 x4 − x1 ⎥⎥⎥ ⎢⎢⎢ ξ ⎥⎥⎥ ⎥⎢ ⎥ ⎢⎢⎢⎢ y ⎥⎥⎥⎥ = ⎢⎢⎢⎢ y ⎥⎥⎥⎥ + ⎢⎢⎢⎢ y − y y − y y4 − y1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ η ⎥⎥⎥⎥⎥ , 1 3 1 ⎢⎢⎣ ⎥⎥⎦ ⎢⎢⎣ 1 ⎥⎥⎦ ⎢⎢⎣ 2 ⎦⎣ ⎦ z1 z2 − z1 z3 − z1 z4 − z1 ζ z
B: Originalbereich, T: transformierter Bereich, x, y, u u J = x, y, . v v
x,u J = x,v x,w
r dr dϕ
J = 2A = (x2 − x1 )(y3 − y1 ) J>0.
T
B
J du dv (dw)
T
(12-15)
Transformation in das Einheitsdreieck nach Bild 12-4a. Sie folgt aus einer linearen Transformation mit punktweiser Zuordnung der Eckkoordinaten.
kurz """
x = x1 + Jξ , """ f dx dy dz = f J dξ dη dζ ,
(12-17)
J = 6V .
V Volumen des Originaltetraeders. Nichtlineare kartesische Transformationen ermöglichen die Abbildung von krummlinig begrenzten Gebieten auf gradlinig begrenzte. Für ein krummliniges Dreieck nach Bild 12-4c gilt x = a0 + a1 ξ + a2 η + a3 ξ2 + a4 ξη + a5 η2 , y = b0 + b1 ξ + b2 η + b3 ξ2 + b4 ξη + b5 η2 . (12-18)
12 Integration reeller Funktionen mehrerer Variablen
12.6 Kurvenintegrale Ist über einer Kurve K nach Bild 12-5 eine eindeutige Funktion f (x) gegeben, so sind über dem Definitionsbereich D zwei Kurvenintegrale erklärt. Nichtorientiert: " n f (x) ds = lim f (xk )Δsk . (12-20) n→∞
K
k=1
Orientiert (als Skalarprodukt): " n f (x) · dx = lim f (xk ) · Δxk . n→∞
K
(12-21)
k=1
Bei einer Parameterdarstellung x = x(t) ergeben sich gewöhnliche Integrale in t. x = x(t):
ds = dx2 + dy2 + dz2 = x˙2 + y˙ 2 + z˙2 dt , (12-22) d()/dt = ()· dx = x˙ dt . Für f = 1 folgt aus (12-20) die Bogenlänge Bild 12-4. Transformationen auf Einheitsgebiete
Aus sechsmaliger Koordinatenzuordnung (xi , yi ) → (ξi , ηi ) folgt a = Ax , b = Ay , ⎡ 0 0 ⎢⎢⎢ 1 ⎢⎢⎢ 0 ⎢⎢⎢ −3 −1 ⎢⎢⎢ −3 0 −1 ⎢ A = ⎢⎢⎢⎢ ⎢⎢⎢ 2 2 0 ⎢⎢⎢ ⎢⎢⎢ 4 0 0 ⎣ 2 0 2 aT = [a0 bT = [b0 xT = [x1 yT = [y1 "" → f
a1 b1 x2 y2
a2 b2 x3 y3
dx dy =
0 4 0 −4 −4 0
a3 b3 x4 y4 ""
0 0 0 0 4 0 a4 b4 x5 y5
⎤ 0 ⎥⎥⎥ ⎥ 0 ⎥⎥⎥⎥ ⎥⎥ 4 ⎥⎥⎥⎥ ⎥⎥ , 0 ⎥⎥⎥⎥ ⎥ −4 ⎥⎥⎥⎥⎥ ⎦ −4
x˙2 + y˙ 2 + z˙2 dt .
(12-23)
t0
Beispiel: Für die Kurve xT (t) = [sin t, cos t, sin 2 t] ,
0tπ,
und
f (x) = [z, 1, y] T
(12-19)
a5 ] , b5 ] , x6 ] , y6 ] .
f J dξ dη ,
a1 + 2a3 ξ + a4 η J = J(ξ, η) = a2 + a4 ξ + 2a5 η
s=
"t1
b1 + 2b3 ξ + b4 η . b2 + b4 ξ + 2 b5 η
ist das Kurvenintegral (12-21) zu berechnen. "
"π f (x) · dx =
f (t) · x˙ dt 0
⎡ ⎤ ⎡ ⎤ "π ⎢⎢ sin 2 t ⎥⎥ ⎢⎢ cos t ⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 1 ⎥⎥⎥ · ⎢⎢⎢ − sin t ⎥⎥⎥⎥⎥ dt = ⎣ ⎦ ⎣ ⎦ cos t 2 cos 2 t 0 2 4 = −2+0=− . 3 3 Wegunabhängiges Kurvenintegral. Das Kurvenintegral (12-21) zwischen zwei Punkten P0 und P1 auf K ist unabhängig vom Integrationsweg, falls f Gradient einer Funktion Φ ist.
A65
A66
A Mathematik und Statistik / Mathematik
Orientiert (als Skalarprodukt): " "" f (x) · dS = f (x(u)) · (x,u ×x,v ) du dv S
S
"
f (x) · n0 dS .
=
(12-26)
S
Für f = 1 folgt aus (12-25) der Flächeninhalt A der Oberfläche S : "" 1 + z,2x +z,2y dx dy . (12-27) A=
Bild 12-5. Funktion f (x) längs einer Kurve K
f T (x) = [Φ, x Φ,y Φ,z ] ,
S
"P1 f (x) · dx = Φ1 − Φ0 .
(12-24)
P0
12.7 Oberflächenintegrale Ist über einer Oberfläche S nach Bild 12-6 eine eindeutige Funktion f (x) gegeben, so sind über dem Definitionsbereich D zwei Oberflächenintegrale erklärt. Nichtorientiert: "" " f (x) dS = f (x(u))|x,u ×x,v |du dv . S
S
""
=
13.1.1 Tangente, Krümmung
Ist der Ortsvektor x im Raum R2 unserer Anschauung eine Funktion eines unabhängigen Parameters t, so wird durch x(t) eine ebene Kurve nach Bild 13-1 beschrieben. (13-1)
Durch Elimination des Parameters t entstehen zwei typische Formen:
f (x, y, z(x, y)) 1 + z,2x +z,2y dx dy .
S
(12-25)
Bild 12-6. Funktion f (x) über einer Oberfläche S
13.1 Ebene Kurven
x(t) = x(t)e1 + y(t)e2 .
Falls z(x, y) die Oberfläche beschreibt, gilt " f (x) dS S
13 Differenzialgeometrie der Kurven
Explizit: y = f (x) oder implizit: F(x, y) = 0 .
x = g(y) , (13-2)
Beispiel. Für eine Ellipse (Halbachse a in e1 Richtung, Halbachse b in e2 -Richtung) sind die
Bild 13-1. Ebene Kurve
13 Differenzialgeometrie der Kurven
Darstellungen (13-1), (13-2) anzugeben. Parameterdarstellung x = a cos t, y = b sin t. 2 2 y2 /b2 − 1 = 0. Explizit: Implizit: F(x, y) = x /a + y = b 1 − x2 /a2 oder x = a 1 − y2 /b2 . Bei entsprechender Differenzierbarkeit zeigt der Differenzialvektor dx mit dem Betrag ds als Bogenlänge in Richtung der Tangente t, die in der Regel als Einheitsvektor mit t · t = 1 eingeführt wird. dx = ds t = dx e1 +dy e2 , Bogenlänge s =
.P1
ds2 = dx2 +dy2 . (13-3)
ds.
P0
Mit Parameter t : "t1 s= x˙2 + y˙ 2 dt ,
1 −˙y , n= 2 x˙ x˙ + y˙ 2 1 −dy/dx n= 1 1 + (dy/dx)2 1 −1 = . dx/dy (dx/dy)2 + 1
(13-8)
Bei Vorgabe der Kurve in Polarkoordinaten r, ϕ mit r = r(ϕ) folgt aus der trigonometrischen Parameterdarstellung x = r cos ϕ, y = r sin ϕ die Steigung in Polarkoordinaten y˙ r˙ sin ϕ + r cos ϕ = , x˙ r˙ cos ϕ − r sin ϕ r = r(ϕ) , r˙ = dr/dϕ . tan α =
()· = d()/dt .
Ohne Parameter: ⎧ "x1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 + (dy/dx)2 dx ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ x0 s=⎪ . ⎪ "y1 ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ (dx/dy) + 1 dy ⎪ ⎪ ⎪ ⎩
κ = dα/ds = (13-4)
y0
Tangente
1 dx dt x˙ · = , t = dx/ds = 2 y˙ dt ds x˙ + y˙ 2 1 1 t= dy/dx 1 + (dy/dx)2 1 dx/dy . = 1 (dx/dy)2 + 1
(13-5)
Geradengleichung der Tangente: r = x + τt , τ Skalar , x Ortsvektor zum Kurvenpunkt mit der
(13-6)
Tangente t . Steigung: tan α = dy/dx = y˙/ x˙ . Normale: n· t = 0 .
(13-9)
Die Krümmung κ ist definiert als Änderung der Tangentenneigung beim Fortschreiten entlang der Bogenlänge.
t0
n senkrecht zu t ,
(13-7)
=
α˙
dα dt · dt ds
x˙2 + y˙ 2
,
tan α =
y˙ . x˙
(13-10)
Jedem Punkt P(x, y) oder P(r, ϕ) der Kurve k kann ein Kreis mit Radius R – der Krümmungskreis – zugeordnet werden, der in P Tangente und Krümmung κ = 1/R mit der Kurve k gemeinsam hat. Evolute einer Kurve k1 ist die Kurve k2 als Verbindungslinie aller Krümmungskreis-Mittelpunkte; k2 ist die Einhüllende der Normalenschar von k1 . Umgekehrt nennt man k1 die Evolvente zu k2 . Beispiel. Für eine Kurve k in Parabelform y2 = 2ax erhält man durch implizites Ableiten y y = a und y y + y2 = 0 und damit die Koordinaten (x M , y M ) des Krümmungskreis-Mittelpunktes. Wählt man y als Parameter der Kurve k, folgt aus Tabelle 13-1: 2 y3 (1 + a2 /y2 ) −a/y y /2a xM + = 1 y yM (−a2 ) und daraus x M = 3y2 /2a + a, y M = −y3 /a2 . Diese Evolutendarstellung im Parameter y lässt sich durch Elimination von y in eine explizite Form 27ay2M − 8(x M − a)3 = 0 überführen; dies ist die Gleichung einer Neil’schen Parabel.
A67
A68
A Mathematik und Statistik / Mathematik
Tabelle 13-1. Krümmungskreis mit Radius R = 1/|κ| und Mittelpunkt M(xM , yM ) zum Kurvenpunkt x
Kurvendarstellung Invariante Darstellung
Krümmung κ
Mittelpunkt xM
dx/ds 2 d x/ds2
xM = x +
dy/ds d2 y/ds2
s Bogenlänge x = x(t) y = y(t)
x˙y¨ − y˙ x¨ , ( x˙2 + y˙2 )3/2
()· =
d() dt
y = y(x)
y , (1 + y 2 )3/2
() =
d() dx
r = r(ϕ)
r2 + 2˙r2 − r¨r , (r2 + r˙2 )3/2
()· =
⎡ ⎤ x˙2 + y˙ 2 ⎢⎢⎢ −˙y ⎥⎥⎥ ⎢⎣ ⎥⎦ x˙y¨ − y˙ x¨ x˙ ⎡ ⎤ 1 + y2 ⎢⎢⎢ −y ⎥⎥⎥ ⎢ xM = x + ⎣ ⎦⎥ y 1 ⎤ ⎡ ⎢⎢ r cos ϕ + r˙ sin ϕ ⎥⎥⎥ ⎥⎦ xM = x − ⎢⎣⎢ r sin ϕ − r˙ cos ϕ xM = x +
d() dϕ
=
13.1.2 Hüllkurve
Eine implizite Kurvengleichung F(x, y, λ) = 0 mit kartesischen Koordinaten x, y kann zusätzlich von einem Parameter λ abhängen, wodurch eine ganze Kurvenschar beschrieben wird. Unter gewissen notwendigen Voraussetzungen kann die Schar durch eine Hüllkurve (Enveloppe) umhüllt werden, die jede Scharkurve in einem Punkt berührt (gemeinsame Tangente) und nur aus solchen Punkten besteht. Notwendig für Existenz einer Hüllkurve: ∂F/∂x ∂F/∂y 2 2 0. ∂ F/∂λ 0 , 2 ∂ F/(∂x∂λ) ∂2 F/(∂y∂λ) (13-11) Parameterdarstellung x(λ), y(λ) aus der Lösung zweier Gleichungen:
1 n κ
r2 + r˙2 r2 + 2˙r2 − r¨r
∂F/∂λ = F,λ (x, y, λ) = 0 ,
F(x, y, λ) = 0 . (13-12)
Beispiel. Für die Kurvenschar F(x, y, λ) = x2 + (y − λ)2 − λ2 /4 = 0 nach Bild 13-2 gelten die Voraussetzungen (13-11) und mit F,λ = 2(y − λ)(−1) − λ/2 erhält man die Gleichungen (13-12) mit den Lösungen y = 3λ/4 und x2 = 3λ2 /16. Nach Elimination √ von λ erweist sich die Hüllkurve als Paar y = ±x 3 von Nullpunktgeraden.
13.2 Räumliche Kurven Ist der Ortsvektor x im Raum R3 unserer Anschauung eine Funktion einer Veränderlichen t (man kann dabei an die Zeit denken), so wird durch x(t) eine Raumkurve nach Bild 13-3 beschrieben. x(t) = x(t)e1 + y(t)e2 + z(t)e3 oder x(t) =
3
xi (t) ei
(13-13)
i=1
= xi (t) ei (Summationskonvention) . Bei entsprechender Differenzierbarkeit zeigt der Differenzialvektor dx mit dem Betrag ds in Richtung der Tangente t, mit t · t = 1. Bild 13-2. Kreisschar mit Hüllkurve
dx = tds , ds2 = (dx) · (dx) dx dt · = x˙ / ( x˙ ) · ( x˙ ) , →t= ds dt
(13-14)
()· = d() dt .
14 Räumliche Drehungen
Die Differenzialbeziehungen (13-16), (13-18) und n = (b × t) = b × t + b × t = −n × t/τ + b × n/
ergeben zusammen die Frenet’schen Formeln der Basis N = [t n b]: ⎡ ⎤ ⎢⎢⎢ 0 −1/ 0 ⎥⎥⎥ d ⎢⎢⎢ ⎥ [t n b] = [t n b] ⎢⎢⎢ 1/ 0 −1/τ ⎥⎥⎥⎥⎥ , ds ⎣ ⎦ 0 1/τ 0 kurz
κ, N = N !
κT = [1/τ 0 1/ ] . (13-20)
Bild 13-3. Raumkurve als Graph eines Vektors x mit nur einer Variablen s
κ Darboux’scher Vektor. κ˜ vgl. 3.3.4, (3-36).
Die Ableitung d(t · t − 1)/dt = 2dt · t = 0 erweist dt als Senkrechte zur Tangente. Die dazugehörige Richtung nennt man Normalenrichtung n mit n·n = 1. n = ˙t / ˙t · ˙t (Normale) . (13-15)
14 Räumliche Drehungen
Die Einheitsvektoren t und n spannen eine Ebene auf, in die man nach Bild 13-3 einen Kreissektor mit Radius und Öffnungswinkel dϕ einbeschreiben kann. Mit dϕ = ds und dt = n dϕ enthält dt/ds die Krümmung |κ| = 1/ .
t = dt/ds = n/ ,
() = d()/ds .
(13-16)
Insgesamt bilden t, n und die Binormale b = t × n das begleitende orthogonale Dreibein: √ t = x = x˙ / x˙ · x˙ , n = t = ˙t / ˙t · ˙t , b = t × n ; () = d()/ds ,
(13-17) · () = d()/dt .
Die Veränderung db der Binormalen beim Fortschreiten in positiver s-Richtung ist ein Vielfaches von n, welches man Windung 1/τ nennt: b = db/ds = −n/τ .
(13-18)
Bei gegebenem Ortsvektor x(t) kann man Krümmung 1/ und Windung 1/τ berechnen. x(t) gegeben → x˙ , x¨ . √ s˙ = ds/dt = x˙ · x˙ , −1
= | x˙ × x¨ |/ s˙ , 3
...
τ−1 = ( x˙ , x¨ , x)/( x˙ × x¨ )2 . (Spatprodukt, siehe 3.3.5)
Die Drehung eines beliebigen Vektors x = xi ei (Summationskonvention für i = 1, 2, 3) in sein Bild y = yi ei ist dann winkel-, richtungs- und längentreu, wenn die Abbildungsmatrix A orthonormal (3.3.2) ist. Drehung von x in y : y = Ax ,
AT A = A AT = I ,
det A = 1 . (14-1)
Speziell die Achsen ei werden in die Achsen ai (Spalten von A) gedreht. Durch die Forderung A T A = I werden 6 Bestimmungsgleichungen für die 9 Koeffizienten ai j formuliert. Für die Beschreibung der eigentlichen Drehung verbleiben dann noch 3 Parameter. Durch ein gegebenes Paar (x, y) wird die Drehung bestimmt. Drehachse: c = x × y/|x × y| , Drehwinkel δ : x · y = |x| |y| cos δ .
(14-2)
A = cos δ I + (1 − cos δ)cc + sin δ˜c . T
c˜ = (c ×) ,
siehe 3.3.4 (3-36) ,
c · c = cT c = 1 .
Man kann unabhängig von einem Paar (x, y) diese Matrix A auch als Funktion von vier Parametern mit einer Nebenbedingung auffassen. Parameter einer Drehung:
(13-19)
Drehachse c mit cT c = 1 und Drehwinkel δ . (14-3) Andere Parameter (Euler, Gibbs usw.) lassen sich auf c und δ zurückführen.
A69
A70
A Mathematik und Statistik / Mathematik
Bei einer Drehung mit einem beliebig kleinen Winkel dδ 0 (sin dδ = dδ, cos dδ = 1) spricht man von einer infinitesimalen Drehung y = (I + dδ c˜ ) x = x + dδ c × x , c c= c·c=1. T
(14-4)
Die Achsen ai als Spalten der Matrix A werden speziell in ihre Bilder bi als Spalten der Matrix B gedreht, wobei B − A zu deuten ist als infinitesimale Basisveränderung infolge Drehung mit dδ um die Achse c, cT c = 1. B = A + dδ c˜ A → B − A = dδ c˜ A oder dA/dδ = c˜ A = −A˜c . ⎡ ⎤ ⎢⎢⎢ 0 −c3 c2 ⎥⎥⎥ ⎢ ⎥ c˜ = (c ×) = ⎢⎢⎢⎢⎢ c3 0 −c1 ⎥⎥⎥⎥⎥ , ⎣ ⎦ −c2 c1 0
(14-5) ⎡ ⎤ ⎢⎢⎢ c1 ⎥⎥⎥ ⎢ ⎥ c = ⎢⎢⎢⎢⎢ c2 ⎥⎥⎥⎥⎥ . ⎣ ⎦ c3
Die schiefsymmetrische Struktur in (14-5) ist von fundamentaler Bedeutung für die räumliche Kinematik.
15 Differenzialgeometrie gekrümmter Flächen Ist ein Ortsvektor x im Raum R3 unserer Anschauung Funktion von zwei Veränderlichen u1 , u2 , so wird durch x(u1 , u2 ) eine gekrümmte Fläche beschrieben: x(u1 , u2 ) =
3
xi (u1 , u2 )ei .
(15-1)
i=1
Bei entsprechender Differenzierbarkeit liegt der Differenzialvektor dx im Flächenpunkt P00 in der Tangentialebene in P00 , die durch die Vektoren x,1 und x,2 aufgespannt wird: dx = x,1 du1 + x,2 du2 = x,α duα . x,α = ∂x/∂uα .
einer jedem Punkt zugeordneten lokalen Basis, wobei die Skalarprodukte gα · gβ als Metrikkoeffizienten gαβ der Matrix G, g11 g12 G= , gαβ = gα · gβ , α, β = 1, 2 ; g21 g22 g12 = g21
(15-3)
die Metrik auf der gekrümmten Fläche charakterisieren. Nur im Sonderfall einer Orthonormalbasis wird G zur Einheitsmatrix E; in der Regel gilt G E. Die Fläche dS des infinitesimalen Vierecks P00 P10 P11 P01 in Bild 15-1 wird in erster Näherung durch das Parallelogramm mit den Seiten x,1 du1 und x,2 du2 beschrieben. dS = |x,1 ×x,2 | du1 du2 mit |x,1 × x,2 | = (x,1 ×x,2 )2
√ = g11 g22 − g212 = G , "" √ G du1 du2 . (15-4) S = Das Kreuzprodukt in (15-4) beschreibt auch den Normalenvektor f , der senkrecht zur Tangentialfläche steht: √ (15-5) f = (x,1 × x,2 )/ G. f · f = 1 . Durch Reduktion der Variablen u1 = u1 (t) und u2 = u2 (t) auf eine einzige unabhängige Größe t werden Kurven x(t) auf der Fläche x(u1 , u2 ) beschrieben. Über die Tangente t = dx(u1 (t), u2 (t))/ds erhält man auch die Kurvennormale n = dt/ds.
(15-2)
Summationskonvention: Über gleiche Indizes wird summiert. i, j, k = 1, 2, 3 ; α, β = 1, 2 . Die Richtungsvektoren x,1 (u1 , u2 ) und x,2 (u1 , u2 ) bilden ein Gauß’sches Koordinatennetz nach Bild 15-1. Es entsteht durch die aufspannenden Vektoren g1 = x,1 , g2 = x,2 ,
Bild 15-1. Raumfläche als Graph eines Vektors x mit zwei unabhängig Veränderlichen u1 und u2
16 Differenzialgeometrie im Raum
t= n/ =
dx dt dt = (x,1 u˙ 1 + x,2 u˙ ) , dt ds ds dt dt dt ds
dt = (x,αβ u˙ α u˙ β + x,α u¨ α ) ds
()· = d()/dt ,
2 + x,α u˙ α
d2 t . ds2 (15-6)
Der Winkel γ zwischen Flächennormale f und Kurvennormale n folgt aus ihrem Skalarprodukt: 2 dt cos γ = f · n = f · x,αβ u˙ α u˙ β
. ds Aus (15-2) folgt (dx)2 = ds2 = g11 du21 + 2g12 du1 du2 + g22 du22 = gαβ duα duβ . (ds/dt)2 = gαβ u˙ α u˙ β .
(15-7)
Die Skalarprodukte f · x,αβ erklärt man zu Komponenten des Krümmungstensors B : bαβ = f · x,αβ =
(x,1 × x,2 ) · x,αβ . √ G
(15-8)
Für cos γ = 1 sind f und n parallel. Die dazugehörigen Krümmungen (1/ 1 ), (1/ 2 ) nennt man Hauptkrümmungen, die Hauptkrümmungsrichtungen x˙ = x,α u˙ α ergeben sich aus den Eigenvektoren des zu (15-7) zugeordneten Eigenwertproblems (15-9). Hauptkrümmungen 1/ = λ, Koordinaten hT = [u˙ 1 , u˙ 2 ] der Hauptkrümmungsrichtungen aus cos γ = 1 in (15-7): bαβ u˙ α u˙ β hT Bh λ= = T , gαβ u˙ α u˙ β h Gh
B =B, T
G =G. T
Eigenwertproblem (B − λG)h = o
(15-9)
ergibt Lösungen λ1 , h1 ; λ2 , h2 . Für die Eigenwerte λ1 , λ2 gelten die Vieta’schen Wurzelsätze, siehe 6.1, (6-4).
Mittlere Krümmung: 1 1 1 + H= 2 1 2 1 = (g11 b22 − 2g12 b12 + g22 b11 ) . 2G Klassifizierung der Flächen: K(xP ) > 0 : elliptischer Flächenpunkt P , K(xP ) < 0 : hyperbolischer Flächenpunkt P , K(xP ) = 0 : parabolischer Flächenpunkt P . (15-11)
16 Differenzialgeometrie im Raum 16.1 Basen, Metrik Vektoren im Raum R3 unserer Anschauung werden durch 3 Komponenten in den 3 Richtungen einer Basis g1 , g2 , g3 dargestellt, wobei man als Bezugssystem gerne eine kartesische Basis e1 , e2 , e3 benutzt. Die Basisvektoren müssen einen Raum aufspannen (Spatprodukt 0) und sind ansonsten bezüglich Betrag und Richtung zueinander vollkommen beliebig. In der Vektoranalysis und -algebra erweist es sich als nützlich, einer Basis g1 , g2 , g3 eine andere g1 , g2 , g3 zuzuordnen, und zwar so, dass die Basen zueinander orthonormal sind. gi · g j = δij , ej = ej , (16-1) 1 für i = j j . Kronecker-Symbol δi = 0 für i j
Allgemeine Basis kartesische Basis
Die willkürlich mit unterem Index bezeichnete Basis nennt man kovariant, die mit oberem Index kontravariant. Die dazugehörigen Koordinaten xi bzw. xi ordnet man „umgekehrt“ den Basen zu, wobei eine besondere Summationsregel gilt. Summationsregel Tritt in einem Produkt ein Zeiger sowohl als Kopf als Tabelle 16-1. Darstellung eines Vektors x = xk gk = xk gk
Gauß’sches Krümmungsmaß: K=
1 B b11 b22 − b212 = = .
1 2 G g11 g22 − g212
(15-10)
Basis Koordinaten Metrikkoeffizienten
Kovariant g1 , g2 , g3 x1 , x2 , x3 gi j = gi · g j
Kontravariant g1 , g2 , g3 x1 , x2 , x3 gi j = gi · g j
A71
A72
A Mathematik und Statistik / Mathematik
auch als Fußzeiger auf, ist über ihn im Rn von 1 bis n zu summieren. Speziell im R : x = x gk = x g1 + x g2 + x g3 . (16-2) 3
k
1
2
3
Durch Einklammerung eines Index wird die Summationsregel blockiert. Die Beziehungen (16-1) zwischen ko- und kontravarianten Elementen erlauben die Berechnung von xi und gi bei gegebenem xi und gi (und umgekehrt): xi = g i j x j , xi = g i j x j , gi = gi j g j , gi = gi j g j ,
mit gi j g jk = δik . (16-3)
Die Matrizen der Metrikkoeffizienten sind invers zueinander: (g jk ) = (gi j )−1 . Möglich ist auch eine Berechnung der gi über Kreuzprodukte. R : g = ( g j × gk )/( g1 , g2 , g3 ) , 3
i
i, j, k zyklisch vertauschen . (Spatprodukt siehe 3.3.5) .
(16-4)
Christoffel-Symbole Γimj =
Im R3 ist ein Vektor x = xk ek in kartesischen Komponenten gegeben, wobei die Koordinaten xk ihrerseits Funktionen von 3 allgemeinen Koordinaten Θk sind: x = xk ek ,
xk = xk (Θ1 , Θ2 , Θ3 ) .
(16-5)
Γimj = Γ mji .
x1 = Θ1 sin Θ2 cos Θ3 ,
x2 = Θ1 sin Θ2 sin Θ3 ,
x3 = Θ1 cos Θ2 .
⎤ ⎡ 1 ⎢⎢⎢ ∂x /∂Θk ⎥⎥⎥ ∂xi ⎥ ⎢⎢⎢ 2 gk = ei = E ⎢⎢⎢ ∂x /∂Θk ⎥⎥⎥⎥⎥ , k ∂Θ ⎦ ⎣ 3 ∂x /∂Θk Θ1 cos Θ2 cos Θ3 Θ1 cos Θ2 sin Θ3 −Θ1 sin Θ2
E = [e1 e2 e3 ] . ⎤ −Θ1 sin Θ2 sin Θ3 ⎥⎥⎥ ⎥ Θ1 sin Θ2 cos Θ3 ⎥⎥⎥⎥⎥ , ⎦ 0
⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ 1 0 0 ⎥⎥⎥ ⎢ (gi j ) = ⎢⎢⎢⎢⎢ 0 (Θ1 )2 0 ⎥⎥⎥ , ⎣ 1 2 2⎦ 0 0 (Θ sin Θ ) ⎡ ⎤ ⎢⎢⎢ 1 0 ⎥⎥⎥ 0 ⎢⎢ ⎥⎥⎥ ⎢ ij −1 1 −2 0 (g ) = (gi j ) = ⎢⎢⎢ 0 (Θ ) ⎥⎥⎥ . ⎣ ⎦ 0 0 (Θ1 sin Θ2 )−2
Das Differenzial dx ordnet jedem Raumpunkt mit dem Ortsvektor x eine lokale Basis gk zu. dx = x,k dΘk ,
( ),k = ∂( )/∂Θk .
(16-6)
Lokale Basis ↔ kartesische Basis ' gk = x,k = (∂xi /∂Θk )ei ∂xi ∂Θ j · = δkj . (16-7) ek = (∂Θi /∂xk ) gi ∂Θk ∂xi Die partiellen Ableitungen gi, j der Basisvektoren gi aus (16-7) enthalten eine Kette von Differenziationen, für die man spezielle Symbole Γ eingeführt hat: gi, j =
∂ 2 xk ek = Γimj gm . ∂Θi ∂Θ j
(16-8)
Entsprechend gi , j = −Γ ijm gm . Die Christoffel-Symbole lassen sich auf partielle Ableitungen der Metrikkoeffizienten gi j und gi j zurückführen: 1 Γ ijk = gim (gkm , j +gm j ,k −g jk ,m ) . (16-9) 2 Beispiel. Für Kugelkoordinaten nach Bild 16-1 sind die Basen, Metrikkoeffizienten und ChristoffelSymbole als Funktion der Koordinaten Θ1 bis Θ3 zu berechnen.
⎡ ⎢⎢⎢ sin Θ2 cos Θ3 ⎢ [ g1 g2 g3 ] = E ⎢⎢⎢⎢⎢ sin Θ2 sin Θ3 ⎣ cos Θ2
16.2 Krummlinige Koordinaten
∂ 2 xk ∂Θm · , ∂Θi ∂Θ j ∂xk
Bild 16-1. Vektor x in Kugelkoordinaten Θi
17 Differenziation und Integration in Feldern
Aus g j = gi j gi folgt wegen gi j = 0 für i j : gk = g(kk) gk , z. B. g2 = g2 /(Θ2 )2 . Christoffel-Symbole. Wegen gi j = gi j = 0 für i j gilt speziell 2Γ ijk = gii (gki , j +gi j ,k −g jk ,i ), z. B. 3 2Γ23
= g (g33 ,2 +g32 ,3 −g23 ,3 ) = g g33 ,2 33
33
= (Θ1 sin Θ2 )−2 2(Θ1 sin Θ2 )Θ1 cos Θ2 = 2 cot Θ2 . ⎤ ⎡ ⎥⎥⎥ 0 ⎢⎢⎢⎢ 0 0 ⎥⎥⎥ Γi1j = ⎢⎢⎢⎢⎢ 0 −Θ1 0 ⎥⎥⎥ , ⎣ 1 2 2⎦ 0 0 −Θ (sin Θ ) ⎤ ⎡ 1 ⎥⎥⎥ 0 ⎢⎢⎢⎢ 0 1/Θ ⎥⎥⎥ Γi2j = ⎢⎢⎢⎢⎢ 1/Θ1 0 0 ⎥⎥⎥ , ⎣ 2 2⎦ 0 0 − sin Θ cos Θ ⎤ ⎡ 0 1/Θ1 ⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥ Γi3j = ⎢⎢⎢⎢⎢ 0 0 cot Θ2 ⎥⎥⎥⎥⎥ . ⎦ ⎣ 1/Θ1 cot Θ2 0
Summation nach 16.1, (16-2).
17.1 Nabla-Operator In den Anwendungen treten typische Verkettungen partieller Ableitungen auf, für die man besondere Symbole und einen speziellen vektoriellen Operator ∇ (Nabla) eingeführt hat: Nabla-Operator
⎤ ⎡ ⎢⎢⎢ ∂( )/∂x1 ⎥⎥⎥ ∂( ) ∂( ) ∂( ) ⎥ ⎢⎢⎢ ∇( ) = e1 + e2 + e3 = E ⎢⎢⎢ ∂( )/∂x2 ⎥⎥⎥⎥⎥ , ∂x1 ∂x2 ∂x3 ⎦ ⎣ ∂( )/∂x3
(17-3) E = [e1 e2 e3 ] . Der relative Zuwachs in einer vorgegebenen Einheitsrichtung n wird beschrieben durch die Projektion des Gradienten in n.
17 Differenziation und Integration in Feldern Wenn z. B. im dreidimensionalen Raum R3 unserer Anschauung jedem Punkt – mit dem Ortsvektor x – eindeutig ein Skalar, Vektor oder Tensor zugeordnet ist, spricht man von einem Feld. Die Orientierung im Raum erfolgt durch eine kartesische Basis mit orthonormalen Einheitsrichtungen e1 , e2 , e3 und Koordinaten x1 , x2 , x3 . Bei krummlinigen Koordinaten Θ1 , Θ2 , Θ3 (Kopfzeiger, keine Exponenten) benutzt man zusätzlich lokale Basen g1 , g2 , g3 . Global: x = x1 e1 + x2 e2 + x3 e3 , ei · e j = δ i j , 1 für i = j δi j = (17-1) 0 für i j . Lokal: x j = x j (Θ1 , Θ2 , Θ3 ) . Kovariante Basis gk = ∂x/∂Θk ,
Richtungsableitung: (17-4) ∂ f /∂n = f,n = (grad f ) · n, n · n = 1 . Beziehungen zwischen grad, div und rot: grad (u + v) = grad u + grad v , grad (u v) = v grad u + u grad v , grad (u · v) = (∇ · v)u + (∇ · u)v + u × rot v +v × rot u , rot (u + v) = rot u + rot v , rot (λu) = λ rot u + (grad λ) × v , (17-5) rot (u × v) = (∇ · v)u − (∇ · u)v + u div v −v div u , div (u + v) = div u + div v , div λu = λ div u + u · grad λ , div (u × v) = v · rot u − u · rot v , rot (grad u) = 0 , div(rot u) = 0 . Tabelle 17-1. Ableitungen von Feldgrößen f
Typ der Feldgröße (allg. Tensor n-ter Stufe) Skalar v
gi · g j = gi j δi j .
Vektor v
Kontravariante Basis gk = (gi j )−1 gk ,
Vektor v
g · g = g δi j . i
j
ij
(17-2)
Name der Ableitung
Darstellung Typ der mit Nabla- Ableitung Operator (allg. Tensor k-ter Stufe) grad v ∇(v) Vektor (Gradient) (k = n + 1) div v ∇·v Skalar (Divergenz) (k = n − 1) rot v ∇×v Vektor (Rotation) (k = n)
A73
A74
A Mathematik und Statistik / Mathematik
Tabelle 17-2. Koordinatendarstellungen der Ableitungen
grad v div v rot v
Kartesische Basis v = v1 e1 + v2 e2 + v3 e3 ; (), i = ∂()/∂xi v,1 e1 + v,2 e2 + v,3 e3 v1,1 + v2,2 + v3,3 (v3,2 − v2,3 ) e1 + (v1,3 − v3,1 ) e2 + (v2,1 − v1,2 ) e3
Laplace-Operator ∇ · ∇ = Δ (Delta). Δ() = (),11 +(),22 +(),33 , Δu = div(grad u) , (17-6) Δu = grad(div u) − rot(rot u) , Δ(uv) = uΔv + vΔu + 2(grad u) · (grad v) . Spezielle Darstellungen in Zylinder- und Kugelkoordinaten: Die dazugehörigen Basen g1 , g2 , g3 sind orthogonal (gi j = gi j = 0 für i j) aber nicht zu Eins normiert. Es ist üblich und zweckmäßig, auf Einheitsrichtun√ gen gk / gkk überzugehen, wobei sogenannte physikalische Koordinaten Xi auftreten, die hier zur Unterscheidung von Index und Potenz fußindiziert sind. Zylinderkoordinaten x1 = cos ϕ , x2 = sin ϕ ,
⎫ x3 = z . ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 2 3 ⎪ ⎪ Θ = , Θ =ϕ, Θ =z. ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0 0 0 ⎪ x = X1 g1 + X2 g2 + X3 g3 . ⎪ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎪ ⎢⎢⎢ cos ϕ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢ ⎥ ⎪ ⎢ ⎥ 0 ⎪ ⎢ ⎥ g1 = g1 = ⎢⎢⎢ sin ϕ ⎥⎥⎥ , ⎪ ⎪ ⎪ ⎪ ⎣ ⎦ ⎬ 0 (17-7) ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎢⎢⎢ − sin ϕ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢ ⎥ ⎪ ⎪ ⎪ g02 = g2 / = ⎢⎢⎢⎢⎢ cos ϕ ⎥⎥⎥⎥⎥ , ⎪ ⎪ ⎪ ⎣ ⎦ ⎪ ⎪ 0 ⎪ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎢⎢⎢ 0 ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ 0 ⎪ g3 = g3 = ⎢⎢⎢ 0 ⎥⎥⎥ . ⎪ ⎪ ⎪ ⎣ ⎦ ⎪ ⎭ 1 ⎫ ⎪ ⎪ Volumenelement dV = d dϕ dz . ⎬ (17-8) 2 2 2 2 2 ⎪ ⎭ Linienelement ds, ds = d + dϕ + dz . ⎪ ⎫ ∂u 1 ∂u ∂u ⎪ T ⎪ ⎪ , · , (grad u) = , ⎪ ⎪ ⎪ ∂ ∂ϕ ∂z ⎪ ⎪ ⎪ ⎪ ⎪ ∂U1 U1 1 ∂U2 ∂U3 ⎬ (17-9) ⎪ + + · + ,⎪ div u = ⎪ ⎪ ∂
∂ϕ ∂z ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0 0 0 ⎭ u = U 1 g1 + U 2 g2 + U 3 g3 ,
Krummlinige Basis (),i = ∂()/∂Θi v,k gk (v j ,i +vk Γkij )gi · g j (g j × gk )vk, j + (g j × gk , j )vk
⎫ 1 ∂U3 ∂U2 ∂U1 ∂U3 ⎪ ⎪ ⎪ · − , − , ⎪ ⎪ ⎪
∂ϕ ∂z ∂z ∂ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ∂U2 1 ∂U1 U2 ⎬ − · + (17-9) . ⎪ ⎪ ⎪ ∂
∂ϕ
⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ∂2 u ∂2 u 1 ∂u ∂2 u ⎪ ⎪ ⎪ + 2+ 2· 2+ 2 , Δu = · ⎭
∂ ∂
∂ϕ ∂z ⎤ ⎡ 2 1 ∂U1 U1 1 ∂2 U1 ⎥⎥ ⎢⎢⎢ ∂ U1 ⎥⎥⎥ · − + + · ⎢⎢⎢⎢ ∂ 2
∂
2
2 ∂ϕ2 ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 ⎥⎥⎥ ∂ U1 2 ∂U2 ⎢⎢⎢ + − 2· ⎥⎥⎥⎥ ⎢⎢⎢ 2 ∂z
∂ϕ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 ⎢⎢⎢ ∂2 U 1 ∂U2 U2 1 ∂ U2 ⎥⎥⎥⎥ 2 ⎢ Δu = ⎢⎢⎢ − 2 + 2· + · ⎥⎥⎥⎥ . ⎢⎢⎢ ∂ 2
∂
∂ϕ2 ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 ⎥⎥⎥ ∂ U2 2 ∂U1 ⎢⎢⎢ ⎥⎥⎥ + + 2· ⎢⎢⎢ 2 ⎥⎥⎥ ∂ϕ ∂z
⎢⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 1 ∂2 U3 ∂2 U3 ⎥⎥⎥⎥ 1 ∂U3 ⎢⎢⎣ ∂ U3 ⎦ + 2· + · +
∂
∂ 2
∂ϕ2 ∂z2 (17-10)
(rot u) = T
Kugelkoordinaten
⎫ x2 = r sin ϑ sin ϕ , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ x3 = r cos ϕ . ⎪ ⎪ ⎪ ⎪ ⎪ 1 2 3 ⎪ ⎪ Θ =r, Θ =ϕ, Θ =ϑ. ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0 0 0 ⎪ ⎪ x = X1 g1 + X2 g2 + X3 g3 . ⎪ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎢⎢⎢ sin ϕ cos ϑ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢ ⎥ ⎪ 0 ⎢ ⎥ ⎪ sin ϕ sin ϑ ⎥⎥ , g1 = g1 = ⎢⎢⎢ ⎬ ⎥ (17-11) ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎣ cos ϕ ⎦ ⎪ ⎪ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎢⎢⎢ cos ϕ cos ϑ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢ ⎥ ⎪ ⎢ ⎥ ⎪ 0 ⎪ g2 = g2 /r = ⎢⎢⎢⎢ cos ϕ sin ϑ ⎥⎥⎥⎥ , ⎪ ⎪ ⎪ ⎣ ⎦ ⎪ ⎪ ⎪ − sin ϕ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ ⎪ ⎪ ⎢⎢⎢ − sin ϑ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ 0 ⎪ g3 = g3 /(r sin ϕ) = ⎢⎢⎢ cos ϑ ⎥⎥⎥ . ⎪ ⎪ ⎪ ⎣ ⎦ ⎪ ⎭ 0 x1 = r cos ϑ sin ϕ ,
17 Differenziation und Integration in Feldern
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ Linienelement ds , ⎪ ⎪ ⎪ 2 2 2 2 2 2 2 ⎪ ds = dr + r sin ϕ dϑ + r dϕ . ⎭ ∂u 1 ∂u 1 ∂u , · , · (grad u)T = , ∂r r ∂ϕ r sin ϕ ∂ϑ
T
(17-12)
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ∂U3 ∂U1 1 ∂U2 ⎪ ⎪ ⎪ + · + · div u = ⎪ ⎪ ⎪ ∂r r ∂ϕ r sin ϕ ∂ϑ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 cot ϕ ⎪ ⎪ ⎪ U2 , + U1 + ⎪ ⎪ ⎪ r r ⎪ ⎬ ⎤⎪ ⎡ ⎪ ⎢⎢⎢ 1 ∂U3 1 ∂U2 cot ϕ ⎥⎥⎥ ⎪ ⎪ ⎪ ⎢⎢⎢ · − · + U3 ⎥⎥⎥ ⎪ ⎪ ⎪ ⎥⎥⎥ ⎪ ⎢⎢⎢ r ∂ϕ r sin ϕ ∂ϑ r ⎪ ⎪ ⎥⎥⎥ ⎪ ⎢⎢⎢ ⎪ ⎪ ⎪ ⎥ ⎢⎢⎢ 1 ⎪ ⎥ ∂U ∂U 1 ⎪ 1 3 ⎥ ⎥ ⎢ ⎪ ⎥⎥⎥ ⎪ · − − U3 rot u = ⎢⎢⎢ ⎪ ⎪ ⎥⎥ ⎪ ⎢⎢⎢ r sin ϕ ∂ϑ ∂r r ⎪ ⎥ ⎪ ⎥⎥⎥ ⎪ ⎢⎢⎢ ⎪ ⎪ ⎥⎥⎥ ⎪ ⎢⎢⎢ ∂U2 1 ∂U1 1 ⎪ ⎪ ⎥⎥⎦ ⎪ ⎢⎢⎣ ⎪ − · + U2 ⎪ ⎭ ∂r r ∂ϕ r (17-13)
∂ 1 ∂ 2 ∂u 1 ∂u · Δu = 2 · r + 2 sin ϕ r ∂r ∂r r sin ϕ ∂ϕ ∂ϕ +
Δu =
∂2 u 1 · , (r sin ϕ)2 ∂ϑ2
∂u 1 ∂u , · ,0 , (grad u) = ∂r r ∂ϕ ∂U1 U1 1 ∂U2 + + · , div u = ∂r r r ∂ϕ ∂U2 1 ∂U1 U2 T (rot u) = 0, 0, − · + , ∂r r ∂ϕ r
Volumenelement dV = r2 sin ϕ dr dϕ dϑ .
(17-14)
∂2 1 ∂2 1 ∂2 U + · U + · U ∂r2 r2 ∂ϕ2 (r sin ϕ)2 ∂ϑ2 (17-15)
cot ϕ ∂ 2 ∂ U + · U+ 2 r ∂r r ∂ϕ ⎡ ⎤ ⎢⎢⎢ 2 ∂U2 ⎥⎥⎥ 2 ∂U 2U 2 cot ϕ 3 1 ⎢⎢⎢ − · ⎥ ⎢⎢⎢ r2 ∂ϕ − r2 sin ϕ · ∂ϑ − r2 − r2 U2 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 cos ϕ ∂U3 2 ∂U1 ⎥⎥⎥ 1 ⎢ ⎥⎥⎥ , · U2 + 2 · − + ⎢⎢⎢ − 2 2 ⎥⎥⎥ ⎢⎢⎢ (r sin ϕ) ∂ϑ r ∂ϕ (r sin ϕ) ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 2 ∂U1 2 cos ϕ ∂U2 1 ⎢⎢⎣ 2 · U3 ⎥⎥⎥⎦ · + − 2 2 r sin ϕ ∂ϑ (r sin ϕ) ∂ϑ (r sin ϕ) ⎡ ⎤ ⎢⎢⎢ U1 ⎥⎥⎥ ⎢ ⎥ (17-16) U = ⎢⎢⎢⎢⎢ U2 ⎥⎥⎥⎥⎥ , u = Ui g0i . ⎣ ⎦ U3 Polarkoordinaten in der Ebene ergeben sich aus Zylinderkoordinaten mit = r, ϑ = ϕ und z = 0.
Δu =
(17-17)
1 ∂u ∂2 u 1 ∂2 u · + + · . r ∂r ∂r2 r2 ∂ϕ2
Zweifache Anwendung des Laplace-Operators beschreibt die Bipotenzialgleichung Δ(Δu) = ΔΔu. Kartesische Koordinaten x1 , x2 : ⎞2 ⎛ 2 ⎜⎜⎜ ∂ ∂2 ⎟⎟⎟ ⎜ ΔΔu = ⎝ 2 + 2 ⎟⎠ u = u,1111 +2u,1122 +u,2222 . ∂x1 ∂x2 (17-18) Polarkoordinaten r, ϕ:
∂2 1 ∂2 1 ∂ · + + · ΔΔu = ∂r2 r ∂r r2 ∂ϕ2
2 u.
17.2 Fluss, Zirkulation Die mit div und rot bezeichneten Ableitungskombinationen lassen sich auf natürliche, koordinatenunabhängige Weise durch Grenzwerte gewisser Integrale darstellen, wobei zwei physikalisch motivierte Begriffe von Belang sind. Fluss F eines Vektorfeldes f (x) durch eine Fläche S: " " f (x) · dS = f (x) · n dS , (17-19) F= S
S
n Normaleneinheitsvektor auf S . Zirkulation Z eines Vektorfeldes f (x) längs einer geschlossenen Kurve C: 0 0 Z= f (x) · dx = f (x) · t dk , (17-20) 0
C
C
Ringintegral, dk Kurvendifferenzial , t Tangenteneinheitsvektor an C .
A75
A76
A Mathematik und Statistik / Mathematik
V ist das Volumen, das von der Oberfläche S eingeschlossen wird. Der Normalenvektor n zeigt zur volumenabgewandten Seite. Beispiel. Für ein Zentralkraftfeld f T = r[x1 , x2 , x3 ], r2 = x21 + x22 + x23 ,
Bild 17-1. Zum Fluss des Vektorfeldes f (x) durch ein Oberflächenelement dSn 3 Divergenz eines Vektorfeldes 1 f (x) im Punkt x des R ist definiert über den Fluss f (x)·n dS durch eine ge-
ist der Fluss durch eine Kugeloberfläche x21 + x22 + x23 = R2 zu berechnen. Mit div f = 4r gilt in Kugelkoordinaten (12) " " " 0 f · n dS = 4r r2 sin ϕ dr dϕ dϑ S
V
"R
S
schlossene Oberfläche S nach Bild 17-1, die ein Volumen V (zum Beispiel Kugel mit Radius r) einschließt, das nach einem Grenzübergang (r → 0) nur noch den Punkt x enthält: 1 f (x) · n dS S
. (17-21) V(r) Rotation (hier speziell als Projektion n · rot f in eine Einheitsrichtung n) eines Vektorfeldes f (x p ) im 3 1Punkt x p des R ist definiert über die Zirkulation f (x) · dx längs einer eindeutigen ebenen Kurve C div f (x) = lim
=4
um P (zum Beispiel einem Kreis um P mit Radius r), die eine Fläche A einschließt. Der Einheitsvektor n steht dabei senkrecht auf der Ebene E mit der Kurve C. 1 f (x) · dx n · rot f (x) = lim
A→0
C
A(r)
.
Die Integralsätze erlauben die Reduktion von Volumenintegralen auf Oberflächenintegrale und von Oberflächenintegralen auf Randintegrale. Auch der umgekehrte Weg kann in der Rechenpraxis zweckmäßig sein. Sie gelten bei Stetigkeit der beteiligten partiellen Ableitungen und bei bereichsweise eindeutigen Berandungsfunktionen. Integralsatz von Gauß im Raum: 0 " div f dV = f · n dS , n · n = 1 . (17-23) V
S
"2π sin ϕ dϕ
0
dϑ = 4πR4 . 0
Integralsatz von Gauß in der Ebene: " 0 div f dA = f · n dk , n · n = 1 . A
(17-24)
C
A ist die Fläche, die von der Kurve C eingeschlossen wird. Der Normalenvektor n steht senkrecht zur Kurve C und zeigt zur flächenabgewandten Seite. Wendet man den Gauß-Satz auf die spezielle Vektorfunktion f = u grad v zweier Skalarfelder u(x) und v(x) an, so gelangt man über die Umformung div(u grad v) =
3 ∂u ∂v · + uΔv , ∂x i ∂xi i=1
(17-25)
Δv = v,11 +v,22 +v,33 ,
(17-22)
17.3 Integralsätze
r 0
V→0
C
"π 3
zu den drei Green’schen Formeln (Summation über i = 1, 2, 3): " " 1. u,i v,i dV + u(Δv) dV V
un · (grad v) dS .
= 2.
V
0
(17-26)
S
"
(uΔv − vΔu) dV V
0 (u grad v − v grad u) · n dS .
= S
(17-27)
18 Differenziation und Integration komplexer Funktionen
3. Speziell für u = 1: 0 " Δv dV = (grad v) · n dS . V
(17-28)
S
Weitere Sonderformen des Integralsatzes von Gauß: " 0 grad f dV = f n dS , V
S
"
0
f × n dS = − S
rot f dV .
(17-29)
V
xT = [x1 , x2 , 1 − x1 − x2 /2] ;
Der Integralsatz von Stokes stellt eine Beziehung her zwischen Oberflächenintegralen über einer Fläche S und Integralen über deren geschlossene Berandungskurve C, wobei der Umlaufsinn auf der Kurve C im Rechtssystem mit der Richtung der Normalen n übereinstimmen muss; siehe Bild 17-2. Integralsatz von Stokes: " 0 f (x) · dx = (rot f (x)) · n dS . C
Bild 17-3. Beispiel zum Satz von Stokes
(17-30)
x,T1 = [1, 0, −1] ,
x,T2 = [0, 1, −1/2] . nT dS = [1, 1/2, 1]dx1 dx2 . " " Z= (2x1 − 2x3 ) dx1 dx2 S
⎛ ⎞ "1 ⎜⎜ 2(1−x " 1) ⎟⎟⎟ ⎜⎜⎜ ⎟ = 2 ⎜⎜⎜ (−1 + 2x1 + x2 /2) dx2 ⎟⎟⎟⎟ dx1 = 0 . ⎝ ⎠ 0
0
S
n dS = x,1 ×x,2 dx1 dx2 ,
vgl. Kap. 15 .
18 Differenziation und Integration komplexer Funktionen 18.1 Darstellung, Stetigkeit komplexer Funktionen Eine komplexe Zahl z kann in dreifacher Form dargestellt werden:
Bild 17-2. Zum Integralsatz von Stokes
Beispiel: Gegeben ist ein Vektorfeld f T (x) = [x2 x3 , −x1 x3 , x1 x2 ] und die zusammengesetzte Raumkurve k in Bild 17-3 von A über B und C zurück nach A. Gesucht ist die Zirkulation Z von f längs k mithilfe des Satzes von Stokes. (rot f ) = [2x1 , 0, −2x3 ] . T
Fläche x mit der gegebenen Randkurve:
z = x + jy , z = r(cos ϕ + j sin ϕ) ,
(18-1a) (18-1b)
z = rejϕ ,
(18-1c)
r = |z| =
x2 + y2 ,
tan ϕ = y/x ,
wobei x, y Koordinaten in der Gauß’schen Zahlenebene (Bild 18-1) sind und r, ϕ Länge und Richtung eines Zeigers. Die Identität der Formen (1b) und (1c) folgt aus der Euler-Formel ejϕ = cos ϕ + j sin ϕ ,
(18-2)
die anhand der Taylor-Reihen (9.2.1) für exp (jϕ), cos ϕ und sin ϕ bewiesen werden kann:
A77
A78
A Mathematik und Statistik / Mathematik
exp(jϕ) = 1 + jϕ + (jϕ)2 /2! + (jϕ)3 /3! + . . .
ε-Umgebung |z − z0 | < ε ,
= (1 − ϕ /2! + . . .) + j(ϕ − ϕ /3! + . . .) 2
3
= cos ϕ + j sin ϕ .
(18-3)
Die exponentielle Form erlaubt eine einfache Formulierung der Multiplikation und Division: z1 z2 = r1 r2 ej(ϕ1 +ϕ2 ) , z1 /z2 = (r1 /r2 )ej(ϕ1 −ϕ2 ) , −jϕ
1/z = (1/r)e
(18-4)
.
Komplexwertige Funktionen f (z) beschreiben eindeutige Zuordnungen von Elementen z einer Teilmenge D der komplexen Zahlen zu Elementen w als Teilmenge W der komplexen Zahlen. D : Definitionsbereich der Funktion f, Argumentmenge. W : Wertebereich der Funktion f . W( f ) = {w| w = f (z)
(18-5)
für z ∈ D} .
Die kreisförmige ε-Umgebung eines Punktes z0 in der Gauß’schen Zahlenebene enthält nach Bild 18-1 alle Punkte z ∈ D innerhalb des Kreises.
z∈D.
Häufungspunkt z0 : Jede ε-Umgebung von z0 enthält mindestens einen Punkt z ∈ D, z z0 , und damit (18-6) unendlich viele Punkte zk ∈ D . Isolierter Punkt z0 : ε-Umgebung enthält keine weiteren zk ∈ D . Grenzwert. Konvergiert bei jeder Annäherung von z ∈ D gegen einen festen Wert z0 (das heißt z → z0 ohne z = z0 ) die zugehörige Folge der Funktionswerte f (z) gegen einen Wert g0 , so heißt g0 der Grenzwert der Funktion f an der Stelle z0 . Hierbei ist z0 als Häufungspunkt vorausgesetzt. lim f (z) = g0 ,
z→z0
z∈D.
Stetigkeit einer komplexen Funktion f (z = x + jx) = w = u(x, y) + jv(x, y) im Punkt z0 liegt vor, wenn der Grenzwert g für z → z0 existiert und mit dem Funktionswert f (z0 ) übereinstimmt. Falls die reellen Funktionen u(x, y) und v(x, y) in z0 stetig sind, so gilt dies auch für die komplexe Funktion f (z).
18.2 Ableitung Eine Funktion f ist im Punkt z0 differenzierbar, wenn der Differenzenquotient f (z) − f (z0 ) z − z0
mit z, z0 ∈ D
und z z0
(18-7)
Bild 18-1. Zeiger z in Polarkoordinaten, ε-Umgebung eines
für z → z0 einen Grenzwert besitzt, der unabhängig von der Annäherungsrichtung an z0 ist. Man bezeichnet ihn mit f .
Tabelle 18-1. Geometrische Bedeutung von Einheitsmulti-
f (z) = u(x, y) + jv(x, y) .
Punktes z0 mit |z − z0 | < ε
plikationen für einen Zeiger z Faktor z0exp-Form j exp(jπ/2) (−j)
exp(j · 3π/2)
1 (−1)
exp(j · 0) exp(jπ)
z0 z Geometrische Deutung Zeiger z wird um ϕ = π/2 gedreht Zeiger z wird um ϕ = 3π/2 gedreht Zeiger z bleibt unverändert Zeiger z wird um ϕ = π gedreht
Annäherung parallel zur x-Achse; Δz = Δx. Δu Δv Δf = lim +j f = lim = u, x + jv, x . Δx→0 Δx Δx→0 Δx Δx Annäherung parallel zur y-Achse; Δz = jΔy. Δv Δu Δf f = lim = lim +j Δy→0 jΔy Δy→0 jΔy jΔy = −ju,y +v,y .
18 Differenziation und Integration komplexer Funktionen
Daraus folgt die notwendige und auch hinreichende Bedingung für die Differenzierbarkeit der Funktion f (z): Cauchy-Riemann’sche Differenzialgleichung: (18-8) u, x −v,y = 0 und v, x +u,y = 0 . Ableitung f = u, x + jv, x = v,y −ju,y . (18-9) Funktionen mit der Eigenschaft (18-8) heißen holomorphe Funktionen. Durch partielles Ableiten der Gleichungen (18-8) nach x und y erhält man isolierte Gleichungen für u(x, y) und v(x, y), die notwendigerweise erfüllt sein müssen, wenn u + jv eine holomorphe Funktion sein soll. Δ() = (), xx +(),yy (Laplace-Operator) , Δu = 0 , Δv = 0 . (18-10) Die Ableitungsbedingung (18-8) lässt sich auch in Polarkoordinaten formulieren. Cauchy-Riemann’sche Differenzialgleichung: f (z) = u(r, ϕ) + jv(r, ϕ) , (18-11) ru,r −v,ϕ = 0 und u,ϕ +rv,r = 0 . Beispiel: Gegeben ist eine Funktion u(x, y) = x3 − 3xy2 . Zunächst ist zu prüfen, ob u Summand einer holomorphen Funktion sein kann. Trifft dies zu, berechne man den Partner v(x, y) und die Ableitung d f /dz = f . Mit u, xx = 6x und u,yy = −6x gilt Δu = 0. Den Partner v(x, y) liefert die Integration der Cauchy-RiemannGleichung: v,y = u, x = 3x2 − 6y2 → v = 3x y − 2y + f (x) + c1 . v, x = −u,y = 6xy 2
3
→ v = 3x2 y + f (y) + c2 . Insgesamt v(x, y) = 3x2 y − 2y3 + c. Ableitungsfunktion f = u, x + jv, x = (3x2 − 6y2 ) + j(6xy) .
18.3 Integration Das bestimmte Integral einer Funktion f (z) längs eines vorgegebenen Weges k in der Gauß’schen Zahlenebene von einem Anfangspunkt A bis zu einem Endpunkt E wird an einem zugeordneten n-gliedrigen Polygonzug nach Bild 18-2 erklärt.
Bild 18-2. Integral längs der Kurve k von A nach E
Die elementweisen Produkte (zi+1 − zi ) f (˜zi ) mit einem beliebigen Zwischenpunkt z˜i streben zusammengenommen für n → ∞ einem Grenzwert zu. " n (zi+1 − zi ) f (˜zi ) = f (z) dz . (18-12) lim n→∞
i=1
k
k: vorgegebener Integrationsweg von zA nach zE . Mit w = f (z) = u(x, y) + jv(x, y), z = x + jy : " " " f (z) dz = (u dx − v dy) + j (u dy + v dx) . (18-13)
Parameterdarstellung x = x(t), y = y(t), d()/dt = ()· : " " " f (z) dz = (u x˙ − v˙y) dt + j (u˙y + v x˙) dt ; " " oder f dz = f z˙ dt . (18-14) Jede Punktmenge G in der Gauß-Ebene, die nur aus inneren Häufungspunkten besteht, nennt man Gebiet. Gehören die Randpunkte von G zur Punktmenge, spricht man von einem abgeschlossenen Gebiet. Ein n-fach zusammenhängendes Gebiet besitzt n geschlossene Ränder. Ferner gibt es unbeschränkte Gebiete, siehe Bild 18-3. Es gelten analoge Integrationsregeln wie bei reellen Funktionen. . Beispiel: Das Integral z¯ dz ist auszurechnen von zA = 0 bis zE = 2 + j. z¯ = x − jy. 1. Weg entlang der Kurve z = 2t2 + jt. 2. Weg von zA = 0 bis zB = 2 und von zB = 2 bis zE = 2 + j. f (z) = z¯ = x − jy, also u(x, y) = x und v(x, y) = −y.
A79
A80
A Mathematik und Statistik / Mathematik
Bild 18-3. Gebiete. a einfach zusammenhängend, Rand R gehört nicht zu G; b zweifach zusammenhängend, abgeschlossen, R1 und R2 gehören zu G; c unbeschränktes Gebiet mit Re(z) > 1
1. Weg: x(t) = 2t2 , x˙ = 4t , y(t) = t , y˙ = 1. 0 t 1. " " " z¯ dz = (x x˙ + y˙y) dt + j (x˙y − y x˙) dt . "2+ j "1 "1 3 z¯ dz = (8t + t) dt + j (2t2 − 4t2 ) dt 0
0
0
= 5/2 − j2/3 . 2. Weg: Von zA bis zB gilt v = 0, dy = 0. Von zB bis zE gilt u = 2, dx = 0. "2+ j "2 "1 "1 z dz = x dx + (+y) dy + j 2 dy = 5/2 + 2j . 0
0
0
0
Im Allgemeinen ist der Wert des bestimmten Integrals vom Integrationsweg abhängig, doch gilt der Cauchy’sche Integralsatz:
Dies begründet das Konzept der Konturintegration. . Eine wesentliche Bedeutung hat das Integral z−1 dz. Es ist auszurechnen für einen Kreis um den Nullpunkt mit Radius r > 0 als Integrationsweg. Bis auf den Nullpunkt z0 = 0 ist f (z) = z−1 in der gesamten Zahlenebene holomorph. Der Cauchy’sche Integralsatz (18-16) ist also nicht anwendbar. " " I= f dz = f (z)˙z dt , z(t) = rejt , 0 t 2π ; "2π I=
1 jt rje dt = z
0
"2π
"2π j dt = j · 2π , 0
1 dz = j · 2π . z
(18-17)
0
Als Konsequenz des Integralsatzes erhält man die Cauchy’schen Integralformeln: f (z) sei in einem n-fach zusammenhängenden beschränkten Gebiet G holomorph. Falls der Integrationsweg k ganz in G liegt, so gilt für einen Punkt z0 (Bild 18-4) innerhalb des Weges k: 0 f (z) 1 f (z0 ) = dz , 2πj z − z0 0k f (z) n! f (n) (z0 ) = dz . 2πj (z − z0 )n+1 (18-18) k Ist die Kurve k speziell ein Kreis mit Radius R, so gilt für einen Punkt z = rejϕ (r < R) innerhalb des Kreises die Poisson-Formel für einen Kreis in Polarkoordinaten.
Ist die Funktion f (z) in einem einfach zusammenhängenden Gebiet G der Gauß-Ebene holomorph, so hat das Integral
1 f (z0 ) = 2π
"E
z0 = r exp(jϕ0 ) .
"2π 0
(R2 − r2 ) f (Rejϕ ) dϕ , R2 − 2Rr cos(ϕ0 − ϕ) + r2 (18-19)
f (z) dz für jeden Integrationsweg in G A
von zA nach ZE denselben Wert.
(18-15)
Ist dieser Weg eine geschlossene, hinreichend glatte Kurve k in G, so gilt 0 f (z) dz = 0 , falls f (z) in G holomorph . k
(18-16)
Bild 18-4. Integrationsweg k in G um einen Punkt z0
18 Differenziation und Integration komplexer Funktionen
Ist f (z) in der oberen Halbebene (y 0) holomorph, so gilt eine entsprechende Formel für jeden Punkt z0 der oberen Halbebene. Poisson-Formel für Halbebene y 0. z0 = x0 + jy0 , "∞ y0 f (x) 1 f (z0 ) = dx . π (x − x0 )2 + y20
(18-20)
−∞
Entwicklung einer Funktion. In der Umgebung G eines Punktes z0 nach Bild 18-5 lässt sich jede holomorphe Funktion darstellen als Taylor-Reihe f (z) =
∞ 1 (k) [ f (z0 )](z − z0 )k . k! k=0
(18-21)
Sie konvergiert, solange der Kreis um z0 keine singulären Punkte enthält. Ist eine Funktion f in der Umgebung des Punktes z0 nicht holomorph, wohl aber in dem Kreisgebiet nach Bild 18-6 mit Zentrum in z0 , so gibt es eine sogenannte Laurent-Reihe
f (z) =
∞
ak (z − z0 )−k +
k=1
∞
Bild 18-6. Entwicklungsgebiet G mit Zentrum z0 ohne die singulären Punkte S i
Beispiel: Gesucht ist die Laurent-Reihe für die Funktion f (z) = (z − 1)−1 (z − 4)−1 . Sie ist offensichtlich für z = 1 und z = 4 singulär, also im Ringgebiet 1 < |z| < 4 holomorph. Durch Partialbruchzerlegung erzeugt man aus f (z) eine Summe einzeln entwickelbarer Teile. Dabei ergibt sich eine Darstellung nach (18-22). 1 1 −1 + . f (z) = z−1 z−4 3 ∞ 1 = z−k , |z| > 1 ; z − 1 k=1 1 = (z/4)k , |z| < 4 ; 1 − z/4 k=0 ∞
bk (z − z0 )k
k=0
also insgesamt ⎡∞ ⎤ ∞ ⎥ 1 ⎢⎢⎢⎢ −k 1 k⎥ (z/4) ⎥⎥⎥⎦ . f (z) = − ⎢⎣ z + 3 k=1 4 k=0
kurz f (z) =
∞
ck (z − z0 )k , r < |z − z0 | < R .
(18-22)
k=−∞
ck =
1 2πj
0
f (z) dz . (z − z0 )k+1
Ist f (z) auch im inneren Kreis einschließlich z0 holomorph, so geht (18-22) in (18-21) über.
Über die Laurent-Reihe kann das Randintegral längs einer Kurve k in G berechnet werden, die nach Bild 18-7 mehrere singuläre Punkte z1 bis z s enthält. f (z) =
∞
a1k (z − z1 )−k +
k=1
+ 0
∞
b1k (z − z1 )k
k=0
.. .
+
∞
.. .
a sk (z − z s )−k +
k=1
f (z) dz = 2πj
.. . ∞
.. .
(18-23)
b sk (z − z s )k ,
k=0 s
ak1 .
k=1
Bild 18-5. Umgebung G eines Punktes z0 ohne singulären
Punkt zs
Die Koeffizienten ak1 nennt man auch Residuen der Funktion f an der singulären Stelle zk .
A81
A82
A Mathematik und Statistik / Mathematik
Exponentialfunktionen mit komplexen Argumenten werden häufig benötigt. Es gelten weiterhin die Additionstheoreme aus 7.2 und 7.3. sin z = (ejz − e−jz )/(2j) , cos z = ejz + e−jz /2 , Bild 18-7. Integrationsweg k in G mit drei relevanten singu-
lären Punkten S 1 bis S 3
Res f (z)|zk = ak1 .
(18-24)
Für eine singuläre Stelle m-ter Ordnung gilt allgemeiner Res f (z)|zk =
3 2 d 1 lim (z − zk )m f (z) . (m − 1)! z→zk dzm−1 m−1
Speziell für m = 1: Res f (z) = lim [(z − zk ) f (z)] . z→zk
(18-25)
z4 − 2 . Gesucht ist das Ringintez2 (z − 1) gral längs des Kreises z(t) = 2ejt . z1 = 0 ist doppelter Pol (m = 2), z2 = 1 einfacher Pol. Beispiel: f (z) =
z4 − 2 = −1, z→1 z2 4 z −2 Res f |z1 = lim =2. z→0 z − 1 Res f |z2 = lim
Also
1
Stammfunktion F(z) zu f (z) heißt eine in G holomorphe Funktion dann, wenn ihre Ableitung F gleich f ist.
sinh jz = j sin z ,
cosh jz = cos z , 4 5 arcsin z = (−j) ln jz + 1 − z2 , 4 5 arccos z = (−j) ln z + z2 − 1 , 1 1 + jz ln , 2j 1 − jz 1 z+ j , arccot z = ln 2j z − j 4 5 arsinh z = ln z + z2 + 1 , 5 4 arcosh z = ln z + z2 − 1 , arctan z =
(18-28)
1 1+z ln , 2 1−z 1 z+1 . arcoth z = ln 2 z−1 Beispiel: artanh z =
Trigonometrische Funktionen Sinus und Cosinus eines komplexen Argumentes können also betragsmäßig größer als 1 werden, was bei reellen Argumenten ausgeschlossen ist.
19 Konforme Abbildung
(18-26)
Für eine in G holomorphe Funktion f (z) ist das bestimmte Integral in F darstellbar und unabhängig vom Integrationsweg. "E f (z) dz = F(zE ) − F(zA ) = [F(z)]EA .
cos jz = cosh z ,
f (z) = cos j = (e−1 + e1 )/2 = cosh 1 = 1,54308 . . .
f dz = 2πj.
F (z) = f (z) : F Stammfunktion zu f .
sin jz = j sinh z ,
(18-27)
A
Die entsprechende Tabelle 10-1 für Stamm- oder Integralfunktionen reeller Variablen in 10.1 gilt auch für komplexwertige Argumente.
Die Abbildung einer komplexen Zahl z = x + jy in ihr Bild w = u(x, y) + jv(x, y) kann auch durch zugeordnete Vektoren beschrieben werden: x u(x, y) (19-1) z= , f (z) = w = . y v(x, y) Die totalen Zuwächse spannen in jedem Punkt mit dem Ortsvektor z eine lokale Basis auf, 1 0 dz = z, x dx + z,y dy = dx + dy , (19-2) 0 1
19 Konforme Abbildung
u, x u,y d f = f , x dx + f ,y dy = dx + dy , v, x v,y die auch für das Bild f orthogonal ist, wenn man die Cauchy-Riemann-Bedingung (19-8) in 18.2 beachtet. u,y −v, x (19-3) = → f , x · f ,y = 0 . f ,y = v,y u, x Die Längenquadrate dz2 vom Original und d f 2 vom Bild stehen in jedem Punkt P in einem konstanten Verhältnis zueinander, das unabhängig ist von der Orientierung in P. dz2 = dx2 + dy2 , d f 2 = (dx2 + dy2 ) u,2x +v,2x → d f 2 /dz2 = | f |2 . (19-4) Insgesamt ist die Abbildung f von z nach w winkeltreu und lokal maßstabstreu, falls die Funktion f holomorph ist. Diese besondere Abbildung nennt man konform. Inverse Abbildung nennt man die Abbildung w = 1/z.
z = x + jy → w = (x − jy)/ x2 + y2 . (19-5) z = rejϕ → w = e−jϕ/r . Der längenbezogene Teil 1/r dieser Abbildung ist eine sogenannte Spiegelung am Einheitskreis, der richtungsbezogene Teil eine Spiegelung an der reellen Achse.
Beispiel: Das Gebiet ABCD im Bild 19-1 wird be
grenzt durch 2 Kreisbögen AB, CD und durch 2 Geraden BC, AD jeweils durch den Nullpunkt. Nach Tabelle 19-1 wird das Bildgebiet w = 1/z nur durch Geraden begrenzt.
Bild 19-1. Konforme Abbildung eines Kreisgebietes ABCD in ein Trapez A BC D
Tabelle 19-1. Eigenschaften von w = 1/z
z-Ebene Kreis nicht durch Nullpunkt Gerade nicht durch Nullpunkt Kreis durch Nullpunkt Gerade durch Nullpunkt
w-Ebene Kreis nicht durch Nullpunkt Kreis durch Nullpunkt Gerade nicht durch Nullpunkt Gerade durch Nullpunkt
Lineare Abbildung nennt man w = a + bz; a, b ∈ C. Geometrisch interpretiert ist dies eine Kombination von Translation und Drehstreckung, also eine Ähnlichkeitsabbildung. Gebrochen lineare Abbildung nennt man a0 + a1 z w= ; ai , bi ∈ C . b0 + b1 z
(19-6)
Diese Abbildung ist eine Zusammenfassung inverser und linearer Funktionen, wobei eine Umformung nützlich sein kann. a3 a1 w = a2 + , a2 = , (19-7) b0 + b1 z b1 a0 b1 − a1 b0 a3 = . b1 Durch die Vorgabe von 3 Paaren (zk , wk ) ist die gebrochen lineare Abbildung bestimmt zu w − w1 w2 − w3 z − z1 z2 − z3 · = · . w − w3 w2 − w1 z − z3 z2 − z1
(19-8)
Die Abbildung eines durch ein Polygon begrenztes Gebiet nach Bild 19-2 in den oberen Teil der z-Ebene bei Vorgabe der Bildpunktkoordinaten xk zu drei beliebigen Polygonecken wk leistet die Schwarz-Christoffel-Abbildung:
Bild 19-2. Schwarz-Christoffel-Abbildung
A83
A84
A Mathematik und Statistik / Mathematik n
dw = Ap(z) , p(z) = (z − xk )−1+ak /π , dz k=1 " w(z) = A p(z) dz + B , ak Innenwinkel im Bogenmaß .
f (x) =
∞
ak βk (x) ,
(20-2)
k=1
(19-9)
wobei die Koeffizienten ak durch Multiplikation mit βk (x) und Integration im Intervall a x b isolierbar sind. "b
Falls xn = ∞ gewählt wird, ist das Produkt nur bis n − 1 zu erstrecken.
"b f βk dx = ak
β2k dx = ak c2k
a
(20-3)
a
.b → f (x) =
∞
a
k=1
.b
f βk dx βk ,
fn (x) =
βk βk dx
n
() .
k=1
a
(20-4) Bild 19-3. Abbildung eines geschlitzten Gebietes in die
obere z-Ebene
Beispiel: Das geschlitzte Gebiet in Bild 19-3 ist auf die obere z-Ebene abzubilden. Mit den Winkeln aS = aU = π/2 sowie aT = 2π und den drei vorgegebenen Punkten xS = −1, xT = 0, xU = +1 erhält man das Produkt p = (z + 1)−1/2 · (z − 0)1 · (z − 1)−1/2 = z/ z2 − 1 . Aus Integration und der Zuordnung
Bei vorzeitigem Abbruch der Summation in (20-4) ist die Differenz δ zwischen gegebener Funktion f (x) und deren Approximation fn (x) theoretisch angebbar: δ = f (x) − fn (x) =
∞
ak βk (x) .
(20-5)
k=n+1
Orthogonalisierung einer gegebenen Menge nicht orthogonaler linear unabhängiger Funktionen pk (x) ist ein stets möglicher Prozess. Entsprechend der Vorschrift
S → S : für w = 0 U → U : für w = 0 T → T : für w = jh
ist z = −1 , ist z = +1 , ist z = 0 √ folgt die gesuchte Abbildung w(z) = h z2 − 1.
β0 = p0 β1 = c10 p0 + p1 β2 = c20 p0 + c21 p1 + p2 usw.
(20-6)
sind die Koeffizienten c jk sukzessive aus der Orthogonalitätsforderung zu berechnen.
20 Orthogonalsysteme Eine Menge von Funktionen βk (x) mit der besonderen Integraleigenschaft
"b βi (x) β j (x) dx = a
0 für i j c2k für i = k , j = k
Beispiel: Die Polynome pk = xk , k = 0, 1, 2, sind für das Intervall −1 x 1 in ein Orthogonalsystem zu überführen. Mit der Abkürzung "1 f1 (x) f2 (x) dx = ( f1 , f2 ) gilt
(20-1)
bildet ein Orthogonalsystem im Intervall a x b, das speziell für ck = 1 zum normierten Orthogonalsystem wird. Eine gegebene hinreichend glatte Funktion f (x) lässt sich durch eine Reihenentwicklung in den Funktionen βk (x) darstellen,
−1
k = 0 : β0 = 1 . k = 1 : β1 = c10 + x .
(β1 , β0 ) = 0 → c10 = 0 .
k = 2 : β2 = c20 + c21 x + x2 . (β2 , β0 ) = 0 → c20 = −1/3 , (β2 , β1 ) = 0 → c21 = 0 .
21 Fourier-Reihen
Insgesamt: β0 = 1 ;
β1 = x ;
β2 = x2 − 1/3 .
Führt man die Entwicklung des vorgehenden Bei! spiels weiter und normiert speziell auf βk (x = 1) = 1, so entstehen die Legendre’schen- oder Kugelfunktionen Pk (x). Mit P0 = 1, P1 = x erhält man alle weiteren aus Pk = [(2k − 1)xPk−1 − (k − 1)Pk−2]/k , "1 Pk Pk dx = c2k = −1
P0 = 1 ,
2 . 2k + 1
(20-7)
P1 = x ,
P2 = (3x − 1)/2 , 2
Bild 20-1. Tschebyscheff-Polynome T 0 bis T 4 mit Beschränkung T 2 1 im Intervall x2 1
P3 = (5x3 − 3x)/2 usw.. Ein Funktionssystem in trigonometrischer Parameterdarstellung Pk = cos kt = Pk (cos t)
mit
cos t = x ,
(20-8)
mit der Rückführung aller k-fachen Argumente auf cos t und anschließender Abbildung auf x = cos t erzeugt ein sogenanntes gewichtetes Orthogonalsystem
"1 w(x) Pi (x) P j (x) dx = −1
0 für i j , c2k für i = k , j = k
(20-9) falls man als Gewichtsfunktion w(x) = (1 − x2 )−1/2 ! wählt. Mit der Normierung Pk (x = 1) = 1 erhält man die Tschebyscheff- oder T-Polynome.
"1 −1
21.1 Reelle Entwicklung Ein Orthogonalsystem besonderer Bedeutung bilden die trigonometrischen Funktionen im Intervall −π ξ π: sk (ξ) = sin kξ , k = 1, 2, 3 . . . , ck (ξ) = cos kξ , k = 0, 1, 2 . . . . "π f1 (ξ) f2 (ξ) dξ = ( f1 , f2 ) . −π
(s j , sk ) = (c j , ck ) =
0 für π für
(21-1)
(21-2)
jk , (21-3) j=k0
(s j , ck ) = 0 .
TiT j dx = 0 für i j . √ 1 − x2
Mit T 0 = 1, T 1 = cos t = x erhält man alle Weiteren aus T k = 2xT k−1 − T k−2 , T 2 = cos 2t = 2x2 − 1 , T 3 = cos 3t = 4x3 − 3 ,
21 Fourier-Reihen
(20-10)
T 4 = cos 4t = 8x4 − 8x2 + 1 . Das Bild 20-1 zeigt das auf den Extremalwert T 2 = 1 begrenzte Oszillieren der T -Polynome im Intervall, was die gleichmäßige Approximation einer Funktion f (x) nach (20-2) ermöglicht.
Die Periodizität der trigonometrischen Funktionen lässt sie besonders geeignet erscheinen zur Darstellung periodischer Funktionen der Zeit t oder des Ortes x nach Bild 21-1, wobei eine vorbereitende Normierung der Zeitperiode T oder der Wegperiode l auf das Intervall −π ξ π erforderlich ist. f (t) mit Periode T im Intervall ta t tb , T = tb − ta . ta + tb T 2π 4 ta + tb 5 t= + ξ→ξ= t− . (21-4) 2 2π T 2 Entsprechend l 2π 4 xa + xb xa + xb 5 + ξ→ξ= x= x− . 2 2π l 2
A85
A86
A Mathematik und Statistik / Mathematik
Bild 21-1. Periodische Funktionen in Ort (l = xb − xa ) und
Bild 21-2. Ungerade periodische Funktion
Zeit (T = tb − ta )
"0
Die Koeffizienten ak , bk der Fourier-Reihe ∞ F[ f (ξ)] = a0 + (ak cos kξ + bk sin kξ)
πbk = (21-5)
erhält man durch Multiplikation von (21-5) mit cos kξ sowie sin kξ und Integration im Intervall −π ξ π: 1 .π a0 = f dξ , 2π −π "π f cos kξ dξ, −π
1 bk = π
(−A) sin kξ dξ + −π
k=1
1 ak = π
"π
"π f sin kξ dξ .
ξ = 2πx/l ; "π πbk = 2A sin kξ dξ = −2A(cos kπ − 1)/k 0
4A , (2k − 1)π b2k = 0 ; k = 1, 2, . . . , → b2k−1 =
oder F[ f (x)] =
−π
(21-6)
Symmetrieeigenschaften der gegebenen Funktion f (ξ) erleichtern die Berechnung.
Cosinus-Anteile ak = 0 .
(21-8)
Unstetige Funktionen im Punkt ξu werden approximiert durch das arithmetische Mittel der beidseitigen Grenzwerte f (ξu − δ), f (ξu + δ). F(ξu ) = [ f (ξu − δ) + f (ξu + δ)]/2 ,
F[ f (x = 0)] = 0 = [ f (−0) + f (+0)]/2
(21-7)
f (−ξ) = − f (ξ) : ungerade; f ist punktsymmetrisch zum Nullpunkt ;
δ > 0 . (21-9)
Die Integration über unstetige Funktionen im Periodenintervall wird stückweise durchgeführt. Beispiel: Die punktsymmetrische Funktion f (x) = A für 0 < x l/2 und f (x) = −A für −l/2 x < 0 nach Bild 21-2 ist durch eine Fourier-Reihe darzustellen. Nach (21-8) gilt ak = 0.
4A 2πx 1 2πx sin + sin 3 π l 3 l 2πx 1 + ... , + sin 5 5 l − l/2 x +l/2 ;
f (−ξ) = f (+ξ) : gerade; f ist symmetrisch zur y-Achse ; Sinus-Anteile bk = 0 .
(+A) sin kξ dξ , 0
= (−A + A)/2 .
21.2 Komplexe Entwicklung Mit der exponentiellen Darstellung der trigonometrischen Funktionen in 7.1, (7-2) cos x = (ejx + e−jx )/2, sin x = −j(ejx − e−jx )/2, lässt sich die Reihe (21-5) umschreiben, ∞
F[ f (ξ)] = a0 + (ak − jbk )ejkξ + (ak + jbk )e−jkξ /2 k=1
und mit komplexen Koeffizienten kompakt formulieren: ∞ ck ejkξ , F[ f (ξ)] = −∞
1 ck = 2π
"π
f (ξ)e −π
(21-10) −jkξ
dξ ; k = 0, ±1, ±2, . . .
21 Fourier-Reihen
Tabelle 21-1. Fourier-Reihen
A87
A88
A Mathematik und Statistik / Mathematik
1. Entwicklung in rationaler Form von einem Punkt (xk ) aus (Taylor). 2. Entwicklung in gebrochen rationaler Form von einem Punkt (xk ) aus (Padé). 3. Entwicklung in rationaler Form von zwei Punkten (x0 ), (x1 ) aus (Hermite). 4. Entwicklung in rationaler Form von vielen Punkten (Stützstellen xi ) aus (Lagrange). Padé-Entwicklungen P(m, n) sind gebrochen rationale Darstellungen der Taylor-Entwicklung T (x); Tabelle 22-1.
Bild 21-3. Diskretes Fourier-Spektrum
Im Zeitbereich −T/2 t T/2 erhält man mit t ξ = 2π , ω = 2π/T , T ⎫ ⎧ ⎪ ⎪ "T/2 ⎪ ⎪ ∞ ⎪ ⎪ ⎪ ⎪ 1⎨ −jωkt ⎬ jωkt F[ f (t)] = f (t)e dt . e ⎪ ⎪ ⎪ ⎪ ⎪ T⎪ ⎪ ⎪ ⎭ ⎩−T/2 −∞
(21-11)
Die Koeffizienten ck bilden das sogenannte diskrete Spektrum der fourierentwickelten Funktion f (t). Beispiel: Für die Rechteckfunktion nach Bild 21-2 erhält man die Spektralfolge 1 ck = 2π =
"0
−jkξ
(−A)e −π
1 dξ + 2π
"π
(+A)e−jkξ dξ
0
jA (cos kπ − 1) . kπ
Daraus folgt:
a 0 + a 1 x + . . . + a m xm = T (x) . b 0 + b 1 x + . . . + b n xn
P(m, n) =
(22-1)
Die Koeffizienten ak , bk folgen aus einem Koeffizientenvergleich. Von besonderem Interesse ist die Entwicklung der e-Funktion. x2 x3 x + + . . . = P(m, n) . (22-2) T (e ) = 1 + x + 2 6 Hermite-Entwicklungen, üblicherweise im normierten Intervall 0 x 1, benutzen die Funktionswerte f (k) an den Intervallrändern; Tabelle 22-2. f (x) = H(m, n) =
m
h0i (x) f (i) (0) +
i=0
f (k) =
n
h1k (x) f (k) (1) ,
k=0
dk f . dxk
(22-3)
Lagrange-Entwicklungen benutzen die Funktionsc0 = 0 ; k gerade:
ck = c−k = 0 , 2A k ungerade: ck = . k πj
Das diskrete Spektrum der ck -Werte zeigt Bild 21-3.
22 Polynomentwicklungen Nichtorthogonale Polynomentwicklungen einer Funktion f (x) spielen im Rahmen der Approximationstheorien eine große Rolle. Man unterscheidet folgende Typen:
werte f (xi ) an n-Stützstellen xi ; Tabelle 22-3. n
li (x) = f (x) =
(x − x j ) , (xi − x j ) j=1, ji n
li (x) f (xi ) ,
i=1
(x − x1 )(x − x2 )1(x − x4 ) (x3 − x1 )(x3 − x2 )1(x3 − x4 ) für n = 4 .
z. B. l3 =
(22-4)
23 Integraltransformationen
Tabelle 22-1. P(m, n)-Entwicklungen von ex
m=0
m=1
m=2
n=0
1 1
1+x+
n=1
1 1−x
1+x 1 1 1+ x 2 1 1− x 2
n=2
n=3
1−x+
1 x 3 2 1 1 − x + x2 3 6 1 1+ x 4 3 1 3 1 1 − x + x2 − x 4 4 24
1 2 x 2
1 1 2 1 3 1−x+ x − x 2 6
Tabelle 22-2. Hermite-Entwicklungen
n=m
f (x)
0
(1 − x) f (0) + x f (1)
1
(1 − 3x2 + 2x3 ) f (0) + (x − 2x2 + x3 ) f (0)
23 Integraltransformationen 23.1 Fourier-Transformation
+ (3x2 − 2x3 ) f (1) + (−x2 + x3 ) f (1) (1 − 10x3 + 15x4 − 6x5 ) f (0) +(x − 6x3 + 8x4 − 3x5 ) f (0) + (x2 − 3x3 + 3x4 − x5 )/2 f (0) +(10x3 − 15x4 + 6x5 ) f (1) + (−4x3 + 7x4 − 3x5 ) f (1) +(x3 − 2x4 + x5 )/2 f (1) .
2
1 2 1 1 + x + x2 3 6 1 1− x 3 1 1 2 1+ x+ x 2 12 1 1 2 1− x+ x 2 12 2 1 2 1+ x+ x 5 20 3 1 3 3 2 1− x+ x − x 5 20 60
1+
1
1 2 x 2
Tabelle 22-3. Lagrange-Entwicklungen in Intervall [0, 1]
Periodische Funktionen f (t + T ) = f (t) mit der Periode T lassen sich nach Kap. 21 durch ein diskretes Spektrum exponentieller (trigonometrischer) Funktionen exp(jk · 2πt/T ) darstellen. 2πt = T ξ , −T/2 t T/2 , ∞ 2π 1 ck exp j kt , f (t) = T T −∞ "T/2 ck =
bei äquidistanten Stützstellen n
x1 bis xn
l1 bis ln
2
0, 1
1 − x, x
3
0, 1/2, 1
4
0, 1/3, 2/3, 1
2(x − 1/2)(x − 1), −4x(x − 1), 2x(x − 1/2) 9 1 2 − x− x− (x − 1) , 2 3 3 27 2 (x − 1) , x x− 2 3 27 1 (x − 1) , − x x− 2 3 1 2 9 x x− x− 2 3 3
−T/2
(23-1)
2π f (t) exp −j kt dt . T
Durch den Übergang von diskreten Werten k zum Kontinuum, beschrieben durch Zuwächse dk = (k + 1) − k = 1, gelangt man heuristisch zu einer kontinuierlichen sogenannten Spektraldarstellung in einem Parameter ω: ω = (2π/T )k , dω = 2π/T ,
dω → 0 für T → ∞ . (23-2) Spektralfunktion oder Fourier-Transformierte "∞ F(ω) = −∞
f (t)e−jωt dt = F[ f (t)] .
(23-3)
A89
A90
A Mathematik und Statistik / Mathematik
Die Umkehrtransformation überführt F(ω) zurück in die Originalfunktion f (t): "∞ f (t) = −∞
Addition
1 F(ω)ejωt dω . 2π
L[ f1 (t) + f2 (t)] = L[ f1 (t)] + L[ f2 (t)] .
Hinreichende Bedingungen für die FourierTransformation, denen f (t) genügen muss: Dirichlet’sche Bedingungen: Endlich viele Extrema und endlich viele Sprungstellen mit endlichen Sprunghöhen in einem beliebigen endlichen Intervall (stückweise Stetigkeit) und "∞ | f (t)| dt < ∞ . (23-4) −∞
23.2 Laplace-Transformation Die
Einschränkung
Für Operationen mit Laplace-Transformierten gelten folgende Rechenregeln:
Bei Verschiebung eines Zeitvorganges f (t) um eine Zeitspanne b in positiver Zeitrichtung spricht man von einer Variablentransformation im Zeitbereich. L[ f (t − b)] = e−sb L[ f (t)] , s = σ + jω .
der
Eine lineare Transformation des Spektralparameters s bewirkt eine Dämpfung der Funktion f (t):
"∞ F(s + a) =
0
Die Umkehrtransformation reproduziert f (t) aus F(s):
f (t) = 0
σ+ " jω
F(s)est ds
"∞ L[ f˙] =
Hinreichende Bedingungen für die LaplaceTransformation, denen f (t) genügen muss: ⎫ a) Die Dirichlet’schen Bedingungen ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ müssen erfüllt sein. ⎬ (23-6) ∞ ⎪ . ⎪ ⎪ −σt ⎪ ⎪ b) | f (t)|e dt < ∞ . ⎪ ⎭
d f −st e dt = [ f e−st ]∞ 0 +s dt
0
= sL[ f (t)] − f (0) .
"∞
f e−st dt
0
(23-10)
L[ f¨] = s L[ f ] − s f (0) − f˙(0) . 2
Allgemein: L[dn f (t)/dtn ] = sn L[ f (t)] − sn−1 f (0) − sn−2 f˙(0) − . . . − f (n−1) (0) . (23-11)
σ−jω
f (t) Originalfunktion; Darstellung im Zeitbereich F(s) Bildfunktion; Darstellung im Frequenzbereich.
0
Differenziation im Zeitbereich setzt voraus, dass die Laplace-Transformierte von f˙ = d f /dt existiert.
für t ≥ 0 , (23-5)
für t < 0 .
f (t)e−(s+a)t dt = L[e−at f (t)] . (23-9)
0
−∞
lässt sich abschwächen, wenn man die Gewichtsfunktion exp(−jωt) exponentiell dämpft mit exp(−σt), σ + jω = s, und den Integrationsbereich auf die positive t-Achse beschränkt. Laplace-Transformierte L[ f (t)] von f (t): "∞ f (t)e−st dt = L[ f (t)] . f (t) → F(s) =
1 lim 2πj ω→∞
(23-8)
(Stauchung und Phasenänderung)
Variablentransformation im Frequenzbereich
Fourier-Transformation .∞ durch den endlichen Wert des Integrals | f | dt
f (t) =
(23-7)
Zu gegebenen Paaren f1 (t), F1 (s) und f2 (t), F2 (s) ist das Bildprodukt F1 (s) · F2 (s) ausführbar; gesucht ist das dazugehörige Original, das als symbolisches Produkt f1 ∗ f2 geschrieben wird. Es gilt der sogenannte Faltungssatz ( f1 gefaltet mit f2 ): Es sei F1 das Bild zum Original f1 , F2 das Bild zum Original f2 , f1 ∗ f2 das Original zum Bild F1 · F2 , dann ist
23 Integraltransformationen
Tabelle 23-1. Originale f (t) und Bilder F(ω) der Fourier-Transformation
F(ω) = F[ f (t)] 1 1 + πδ(ω) jω 2πδ(ω) 1 jπδ(ω) − 2 ω 2 − 2 ω 1 a + jω 1 (a + jω)2 2a (a2 + ω2 ) 2 π ω exp − a 4a π[δ(ω − Ω) + δ(ω + Ω)] −jπ[δ(ω − Ω) − δ(ω + Ω)] π jω [δ(ω − Ω) + δ(ω + Ω)] + 2 2 Ω − ω2 Ω jπ − [δ(ω − Ω) − δ(ω + Ω)] + 2 2 Ω − ω2 Ω (a + jω)2 + Ω2 2 sin(ωh/2) h ωh/2
f (t) δ(t), Dirac-Distribution Heaviside-, Sprungfunktion H(t), ε(t) 1 tH(t) |t| e−at H(t), a > 0 t e−at H(t), a > 0 exp(−a|t|), a > 0 exp(−at2 ), a > 0 cos Ωt sin Ωt H(t) cos Ωt H(t) sin Ωt H(t)e−at sin Ωt 1 − |t|/h für |t| < h 0 für |t| > h
"t f1 ∗ f2 =
L[tn f (t)] = (−1)n [F(s)](n)
f1 (t − τ) f2 (τ)dτ
Divisionssatz:
0
"t f2 (t − τ) f1 (τ) dτ
=
(23-12)
Aus dem Faltungssatz folgt mit f2 ≡ 1 der Integrationssatz: ⎤ ⎡ t ⎥⎥⎥⎥ ⎢⎢⎢⎢" (23-13) L ⎢⎢⎢⎢ f (τ) dτ⎥⎥⎥⎥ = L[ f (t)]/s , ⎦ ⎣ 0
"∞ F(r) dr .
(23-16)
Transformation einer periodischen Funktion f (t) = f (t + T ): L[ f (t)] = (1 − e
−sT −1
"T
)
e−st f (t)dt ,
σ>0.
0
(23-17)
Ähnlichkeitssatz: 1 F(s/a) , a > 0 , a Multiplikationssatz für n ∈ N:
L[t−1 f (t)] =
s
0
L[ f (at)] =
(23-15)
(23-14)
Der Nutzen der Integraltransformationen liegt darin, dass sich gegebene Funktionalgleichungen (z. B. Differenzialgleichungen) im Originalbereich nach der
A91
A92
A Mathematik und Statistik / Mathematik
Transformation in den Bildbereich dort einfacher lösen lassen. Abschließend ist die Lösung F(s) dann allerdings in den Originalbereich zurück zu transformieren. Dazu benutzt man Korrespondenztabellen zwischen f (t) und F(s), wobei das Bild F(s) gelegentlich vorweg aufzubereiten ist. So zum Beispiel durch eine Partialbruchzerlegung Z(s) N(s) ck1 ckrk ck2 = + + . . . + , s − sk (s − sk )2 (s − sk )rk k (23-18)
F(s) =
sk : Nullstellen des Nenners mit Vielfachheit rk , oder durch eine Reihenentwicklung der Bildfunktion F(s). Bei einfachen Nullstellen sk des Nenners in (23-18) gilt mit der Korrespondenz L[eat ] = 1/(s−a) der Heaviside’sche Entwicklungssatz Z(sk ) e sk t . f (t) = (s ) N k k
N = dN/ds .
(23-19)
Beispiel: Die Lösungsfunktion u(t) der Differenzialgleichung u˙ + cu = P cos Ωt ist mithilfe der LaplaceTransformation für beliebige Anfangswerte u0 zu berechnen. a) Laplace-Transformation s , s2 + Ω2 s u0 . L[u] = P 2 + (s + Ω2 )(s + c) s + c sL[u] − u0 + cL[u] = P
b) Partialbruchzerlegung L[u] =
Pc u0 1 − · s + c (c2 + Ω2 ) (s + c) s Pc · + 2 c + Ω2 s2 + Ω2 PΩ Ω + 2 · 2 . 2 c + Ω s + Ω2
c) Umkehrtransformation mit Tabelle 23-2 P + Ω2 −ct · [−ce + c cos Ωt + Ω sin Ωt] .
u(t) = u0 e−ct +
c2
Tabelle 23-2. Originale f (t) und Bilder F(s) der LaplaceTransformation
f (t) t 0 δ(t), Dirac-Distribution δ(t − a), a > 0 δ+ (t) H(t) = 1 für t 0 tn , n ∈ N tn eat 1 − eat (eat − 1 − at) (1 + at)eat t2 at e 2 sin Ωt cos Ωt t sin Ωt t cos Ωt eat sin Ωt eat cos Ωt eat f (t) (−t)n f (t)
1 a2
F(s) = L[ f (t)] 1/2 exp(− as) 1 1 s n! sn+1 n! (0! = 1) (s − a)n+1 −a s(s − a) 1 s2 (s − a) s (s − a)2 1 (s − a)3 Ω s2 + Ω 2 s s2 + Ω 2 2Ωs (s2 + Ω 2 )2 (s2 − Ω 2 (s2 + Ω 2 )2 Ω (s − a)2 + Ω 2 s−a (s − a)2 + Ω 2 F(s − a) dn F(s) dsn
23.3 z-Transformation Integraltransformationen verknüpfen zeitkontinuierliche Original- und Bildfunktionen. Die z-Transformation überführt eine Folge f0 , f1 , f2 diskreter Werte in eine Bildfunktion F(z). ∞ fn z−n = F(z) , Z[ fn ] = (23-20) n=0 Z[ fk+1 − fk ] = (z − 1)F(z) − z f0 .
23 Integraltransformationen
Tabelle 23-3. Originale fn und Bilder Z[ fn ] der z-
Transformation fn (n = 0, 1, . . .) δ+ H(n) = 1 für n 0 n n2 n3 ⎛ ⎞ ⎜⎜⎜ n ⎟⎟⎟ ⎝⎜ ⎟⎠ k an ean n ean n2 ean 1 − ean sin nΩ cos nΩ an
e sin nΩ ean cos nΩ 1 − (1 − an)ean 1+
bean − aebn a−b
Tabelle 23-4. Gebräuchliche Transformationen
Integraltransformationen Z[ fn ] 1 z z−1 z (z − 1)2 z(z + 1) (z − 1)3 z(z + 4z + 1) (z − 1)4 z (z − 1)k+1 z z−a z z − ea ea z (z − ea )2 ea z(z + ea ) (z − ea )3 (1 − ea )z (z − 1)(z − ea ) z sin Ω z2 − 2z cos Ω + 1 z2 − z cos Ω z2 − 2z cos Ω + 1 ea z sin Ω z2 − 2ea z cos Ω + e2a z2 − ea z cos Ω − 2ea z cos Ω + e2a z z aea z − + a z−1 z−e (z − ea )2 z2
bz z + z − 1 (a − b)(z − ea ) az − (a − b)(z − eb )
Auf diese Weise werden Differenzengleichungen in algebraische Gleichungen transformiert. Beispiel 1: Für fn = 1 für alle n gilt z Z[1] = 1 + z−1 + z−2 + . . . = . z−1 Konvergenz für |z| > 1 .
Laplace-Transformation "∞ L[ f (t)] = f (t)e−st dt; s komplex 0
Fourier-Transformation "∞ F[ f (t)] = f (t)e−jωt dt; ω reell −∞
Mellin-Transformation "∞ M[ f (t)] = f (t)t s−1 dt; s komplex 0
Stieltjes-Transformation "∞ f (t) dt; s komplex, |arg s| < π S[ f (t)] = t+s 0
Hilbert-Transformation "∞ 1 f (t) H[ f (t)] = dt; ω reell π t−ω −∞
Fourier-Cosinus-Transformation "∞ Fc [ f (t)] = f (t) cos(ωt) dt; ω > 0, reell 0
Fourier-Sinus-Transformation "∞ Fs [ f (t)] = f (t) sin(ωt) dt; ω > 0, reell 0
Diskrete Transformationen z-Transformation ∞ Z[ fn ] = fn z−n n=0
Diskrete Laplace-Transformation ∞ L[ fn ] = fn e−ns ; s komplex n=0
Beispiel 2: Aus der Differenzengleichung uk+1 − uk = 2k berechne man mithilfe der z-Transformation die Lösung un = f (n) mit der Anfangsbedingung u0 = 1
A93
A94
A Mathematik und Statistik / Mathematik
[xi , y(xi )] bis {x j , [y(x j )](k) }, k n − 1, wird die allgemeine zur partikulären oder speziellen Lösung. Je nach Lage der Stellen x j unterscheidet man 2 Gruppen:
a) z-Transformation z (z − 1)2 2z z + → F(z) = . z − 1 (z − 1)3
(z − 1)F(z) − z · 1 = 2 ·
Anfangswertaufgaben: Alle Vorgaben – hier Anfangsbedingungen – betreffen eine einzige Stelle x j des Definitionsbereiches der Dgl.
b) Rücktransformation mit Tabelle 23-3. n un = 1 + 2 = 1 + n(n − 1) . 2
Randwertaufgaben: Die Vorgaben – hier Randbedingungen – betreffen verschiedene Stellen des Definitionsbereiches.
24 Gewöhnliche Differenzialgleichungen 24.1 Einteilung Die Bestimmungsgleichung für eine Funktion f heißt gewöhnliche Differentialgleichung (Dgl.) n-ter Ordnung, wenn f = y(x) Funktion nur einer Veränderlichen (hier x) ist und y(n) die höchste in der Gleichung F(x, y, y , . . . , y(n) ) = 0 ,
y(n) = dn y/dxn
(24-1)
vorkommende Ableitung ist. Ist (24-1) nach y(n) auflösbar, spricht man von der Normal- oder expliziten Form y(n) = f (x, y, y , . . . , y(n−1) ) .
(24-2)
Eine gewöhnliche lineare Dgl. n-ter Ordnung an (x)y(n) + . . . + a0 (x)y = r(x)
(24-3)
mit nichtkonstanten Koeffizienten ak (x) wird nach der Existenz der rechten Seite (Störglied) nochmals klassifiziert. Inhomogene gewöhnliche lineare Dgl., falls r(x) 0 , Homogene gewöhnliche lineare Dgl., falls r(x) ≡ 0 .
(24-5)
(24-4)
Periodische Koeffizienten ak (x+l) = ak (x) mit der Periode l oder konstante Koeffizienten sind weitere Sonderfälle von (24-3). Wie auch bei der Berechnung unbestimmter Integrale enthält die Lösungsschar, auch allgemeine Lösung genannt, einer Dgl. n-ter Ordnung n zunächst freie Integrationskonstanten Ci . Durch Vorgabe von n Paaren
(24-6)
Eine homogene Randwertaufgabe heißt Eigenwertaufgabe, wenn Dgl. und/oder Randbedingungen einen zunächst freien Parameter λ enthalten. Gibt es für spezielle Werte λ j nichttriviale Lösungen y j (x) 0, so spricht man von Eigenpaaren mit dem Eigenwert λ j und der Eigenfunktion y j (x).
24.2 Geometrische Interpretation Explizite Differenzialgleichungen erster Ordnung, y = f (x, y), ordnen jedem Punkt (x, y) der Ebene eine Richtung zu. Durch Vorgabe eines Punktes (x0 , y0 ) wird genau eine Kurve bestimmt, die in das Richtungsfeld hineinpasst. Das aufwändige punktweise Zeichnen des Richtungsfeldes erleichtert man sich durch das Eintragen von Linien gleicher Steigung c – Isoklinen – mit mehrfacher Antragung der Steigungen. Beispiel: Das Isoklinenfeld für die Dgl. y = x/(x − y) ist zu zeichnen und die Lösungskurven für x0 = 0, y0 = 1 sowie x0 = 0, y0 = −1 sind einzutragen. Isoklinenfeld: c = x/(x − y) → y = x(c − 1)/c. Für c = 0, ∞, 1, −1, 1/2 sind die Geraden y(x, c) und die Lösungsspiralen in Bild 24-1 eingetragen. Ist die Funktion f (x, y) in einem abgeschlossenen Gebiet G um einen Punkt Pk (xk , yk ) stetig und beschränkt und zudem die Lipschitz-Bedingung | f,y | L oder | f (xk , yk ) − f (xk , yk + Δy)| |Δy|L , L Lipschitz-Konstante ,
(24-7)
25 Lösungsverfahren für gewöhnliche Differenzialgleichungen
die Dgl. y = g/ f erzeugt, nennt man H die HamiltonFunktion zu y = g/ f : H, x = −g und
H,y = f .
(24-11)
Beispiel, Fortsetzung: Für die Dgl. y = x/(x − y) mit g(x, y) = x und f (x, y) = x − y ist der Nullpunkt x0 = y0√ = 0 isoliert singulär. Die Eigenwerte λ1,2 = (1 ± j 3)/2 aus 1 − λ 1 2 =λ −λ+1=0 −1 −λ Bild 24-1. Isoklinenfeld y = x(1 − 1/c) für verschiedene
kennzeichnen den Nullpunkt als Strudelpunkt.
Steigungen c
für y = f (x, y) in G erfüllt, so gibt es genau eine Lösungskurve in G zu dem Startpunkt Pk ; ansonsten ist Pk ein singulärer Punkt. Im Sonderfall y = g/ f mit f (x0 , y0 ) = g(x0 , y0 ) = 0 ist (x0 , y0 ) ein isolierter singulärer Punkt, dessen Charakteristik aus den Eigenwerten λ der zugehörigen Jacobi-Matrix J folgt. ⎤ ⎡ ⎢⎢⎢ f, x g, x ⎥⎥⎥ g(x, y) J = ⎢⎢⎣ , ⎥⎥⎦ zu y = f (x, y) f,y g,y f, x = ∂ f /∂x . Eigenwerte λ aus det |J − λI| = 0 . λ1 · λ2 > 0 λ1 , λ2 ∈ R : λ1 · λ2 < 0 λ1 , λ2 = α ± jβ , α 0 λ1 , λ2 = ±jβ
Knotenpunkt , Sattelpunkt . Strudelpunkt . Wirbelpunkt .
(24-8)
25.1 Trennung der Veränderlichen Lässt sich in y = f (x, y) die rechte Seite gemäß f (x, y) = f1 (x) f2 ( y) mit f2 ( y) 0 separieren, so verbleiben 2 gewöhnliche Integrale: " " f1 (x) dx + C . y = f1 (x) f2 (y) → [ f2 (y)]−1 dy = (25-1) Ein Sonderfall ist die lineare Dgl. y + a(x)y = r(x) mit nichtkonstantem Koeffizienten a. Hierfür gilt
. y(x) = C + rε(x) dx /ε(x) , . ε(x) = exp a(x) dx .
(24-9)
Eine Darstellung der Dgl. y = g/ f mit einem Parameter t (z. B. die Zeit), x˙ = f (x, y) , y˙ = g(x, y) mit y˙ / x˙ = y = g/ f, y˙ = dy/dt ,
25 Lösungsverfahren für gewöhnliche Differenzialgleichungen
(24-10)
ordnet jedem Wert t einen Punkt (x, y) des sogenannten Phasenporträts zu. Falls eine Funktion H mit dem vollständigen Differenzial dH = H, x dx + H,y dy = dx(H, x +y H,y ) = 0
Beispiel: Dgl. y + y/x = x2 . y = (C + x4 /4)/x.
ε(x) = x,
25.2 Totales Differenzial Aus dem Vergleich von Differenzialgleichung f (x, y) dx + g(x, y) dy = 0 und totalem Differenzial F, x dx + F,y dy = dF = 0 folgt:
(25-2)
A95
A96
A Mathematik und Statistik / Mathematik
⎫ ⎪ Falls f = F, x und g = F,y , ⎪ ⎪ ⎪ ⎬ d. h. wenn f,y = g, x = F, xy , ⎪ ⎪ ⎪ ⎪ gilt F(x, y) = C , C = const . ⎭
(25-3)
Die nichtlineare Bernoulli’sche Dgl. lässt sich in eine lineare Dgl. überführen: Aus y + a(x)y + b(x)yn = 0 wird mit y = z1/(1−n) , n 1 , z + (1 − n)(az + b) = 0 .
Beispiel: Dgl. 2x cos y + 3x2 + (4y3 − x2 sin y)y = 0.
(25-7)
a) Prüfung: f,y = −2x sin y , g, x = −2x sin y .
Das Verfahren der wiederholten Ableitung kann zu einfacheren Dgln. führen:
F, x = f → F = x2 cos y + x3 + h1 ( y) , F,y = g → F = x2 cos y + y4 + h2 (x) .
(25-8)
f = 2x cos y + 3x2 , g = 4y3 − x2 sin y ,
Aus y = F(x, y ) wird mit y = z y = dF/dx = z = F, x +F,z z .
b) Integration:
Die nichtlineare Riccati’sche Dgl. lässt sich in eine lineare homogene Dgl. 2. Ordnung überführen:
c) Lösung: x cos y + x + y = C . 2
3
4
Gilt die Bedingung f,y −g, x = 0 eines totalen Differenzials nicht, so kann es einen integrierenden Faktor ϕ(x, y) geben, sodass gilt ⎫ ⎪ (ϕ f ),y = (ϕg), x . ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ Sonderfälle: ⎪ ⎪ ⎪ ⎪ ⎪ Falls ( f,y −g, x )/g.= q(x) , gilt ⎪ ⎬ (25-4) ⎪ ⎪ ⎪ ϕ(x) = exp q dx ; ⎪ ⎪ ⎪ ⎪ ⎪ falls (g, x − f,y )/ f .= q(y), gilt ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ ϕ( y) = exp q dy .
25.3 Substitution Von der Vielzahl der Möglichkeiten wird hier nur eine Auswahl vorgeführt. Gleichgradige Dgln. y = f (x, y) zeichnen sich aus durch eine Streckungsneutralität: f (sx, sy) = f (x, y) . Durch die Substitution z(x) = y(x)/x → y(x) = xz ,
y = z + xz
(25-5)
lässt sich die Form z = f1 (x) f2 (z) erreichen. Die Euler’sche Dgl. mit nichtkonstanten Koeffizienten lässt sich in eine Dgl. mit konstanten Faktoren überführen. Aus an xn y(n) + . . . + a0 y = 0 , y(n) = dn y/dxn , (25-6) wird mit x = et , dx = x dt , bn y(n) + . . . + b0 y = 0 ,
y(n) = dn y/dtn .
Aus y + a(x)y2 + b(x)y = r(x) wird mit y = z /(az) a(x)z − (a − ab)z + a2 rz = 0 .
(25-9)
Bei Kenntnis einer partikulären Lösung y1 gilt: Aus y + ay2 + by = r wird mit y = y1 + 1/z ; y = y1 − z /z2 (25-10) z − a(2y1 z + 1) − bz = 0 . Beispiel: √ Aus der Dgl. y + y2 = 4x + 1/ x wird mit √ √ y1 = 2 x : z = 4 x z + 1 .
25.4 Lineare Differenzialgleichungen Lineare Differenzialgleichungen formuliert man auch abkürzend mithilfe des linearen Differenzialoperators L, der die wichtigen Eigenschaften der Additivität und Homogenität besitzt: L[y] = an (x)y(n) + . . . + a0 (x)y = r(x) . L[y1 + y2 ] = L[y1 ] + L[y2 ] , L[αy1 ] = αL[y1 ] .
(25-11)
Die homogene Dgl. L[y] = 0 n-ter Ordnung besitzt n linear unabhängige Lösungsfunktionen y1 bis yn , die man zum Fundamentalsystem der Dgl. L[y] = 0 zusammenfasst: y1 (x), . . . , yn (x) .
(25-12)
25 Lösungsverfahren für gewöhnliche Differenzialgleichungen
Jede Linearkombination ist Lösung: L[ y] = 0 für y = C1 y1 (x) + . . . + Cn yn (x) . Eine Menge von n Funktionen y1 (x) bis yn (x) ist dann linear abhängig, – also kein Fundamentalsystem – wenn im Definitionsbereich a x b der Dgl. ein Wert x = x0 existiert, für den die Wronski-Determinante y1 (x) y2 (x) . . . yn (x) .. .. .. (25-13) W(x) = . . . (n−1) y1 (x) y2 (n−1) (x) . . . yn (n−1) (x) verschwindet. Fundamentalsystem und eine partikuläre Lösung yp einer gegebenen rechten Seite r(x) bilden zusammengenommen die Gesamtlösung für L[ y] = 0 + r(x) : L[ yp ] = r , y(x) =
n
L[ yk ] = 0 , (25-14)
Ck yk (x) + yp (x) . Ck : Konstante .
k=1
Die Partikularlösung yp einer Summe r1 (x) bis r s (x) von rechten Seiten ist gleich der Summe der jeweiligen Partikularlösungen; es gilt das sog. Superpositionsprinzip: Gegeben: L[ y] = r1 (x) + . . . + r s (x) . Mit
L[ yp1 ] = r1 (x), . . . , L[ yps ] = r s (x)
(25-15)
gilt yp = yp1 + . . . + yps .
kurz W(x)C(x) = R(x) ,
W : Wronski-Matrix.
Speziell n = 2 : Dgl. y + f (x)y + g(x)y = r(x) . y1 y2 C1 0 C aus = , y1 y2 C2 r(x) W(x) = y1 y2 − y2 y1 . " r(x) dx yp = y2 (x) y1 (x) W(x) " r(x) dx . − y1 (x) y2 (x) W(x)
(25-18)
Beispiel: Gegeben ist eine lineare Euler’sche Dgl. x2 y + xy − y = ln x mit dem Fundamentalsystem y1 = x, y2 = 1/x. W(x) = x(−1/x2 ) − (1/x) = −2/x , r(x) = ln x/x2 . " " yp = −1/(2x) ln x dx + (x/2) (ln x/x2 ) dx = − ln x .
Variation der Konstanten C in (25-12) ist eine Möglichkeit, bei bekanntem Fundamentalsystem eine partikuläre Lösung von L[ y] = r zu bestimmen: L[ y] = r, L[C1 y1 + . . . + Cn yn ] = 0 , yp = C1 (x)y1 (x) + . . . + Cn (x)yn (x) .
(25-16)
Die neuerliche Integrationsaufgabe zur Berechnung der n Funktionen C(x) eröffnet eine Mannigfaltigkeit weiterer Integrationskonstanten. Durch n − 1 Vorgaben C1 y1 (k) + . . . + Cn y(k) n =0
und Einsetzen des Ansatzes (25-16) in die Dgl. erhält man genau n Gleichungen zur Berechnung der n Funktionen Ck . ⎡ ⎤⎡ ⎤ ⎢⎢⎢ y1 (x) y2 (x) . . . yn (x) ⎥⎥⎥ ⎢⎢⎢ C1 (x) ⎥⎥⎥ ⎢⎢⎢⎢ . .. .. ⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ ⎢⎢⎢ .. . . ⎥⎥⎥⎥ ⎢⎢⎢⎢ . ⎥⎥⎥⎥ ⎢⎣ ⎦ (n−1) (n−1) (n−1) ⎦ ⎣ y2 . . . yn y1 Cn (x) ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎢ . (25-17) = ⎢⎢⎢ ⎥⎥⎥ , ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎦ ⎢⎣ r(x)/an (x)
für k = 0 bis n − 2
25.5 Lineare Differenzialgleichung, konstante Koeffizienten Das Fundamentalsystem der homogenen Gleichung dieses Typs lässt sich stets aus e-Funktionen mit noch unbekannten Argumenten λ bilden: L[ y] = 0 + r(x) ,
L[ y] = an y(n) + . . . + a0 y .
Homogene Lösung y = exp(λx). Einsetzen in die Dgl. gibt die charakteristische Gleichung Pn (λ) = an λn + . . . + a0 = 0 .
(25-19)
A97
A98
A Mathematik und Statistik / Mathematik
Folgende Situationen bezüglich der Wurzeln λk ∈ C sind typisch: Verschiedene Wurzeln λk , die jeweils nur einmal auftreten, korrespondieren mit der Lösung exp(λk x). Mehrfache Wurzeln λ j , die k-fach auftreten, entsprechen einer Lösungsmenge exp(λ j x), x exp(λ j x) bis xk−1 exp(λ j x). Komplexe Wurzeln treten paarweise konjugiert komplex auf. Aufgrund der Euler-Formel exp( jϕ) = cos ϕ + j sin ϕ korrespondiert ein Wurzelpaar λ = α ± jβ mit dem Lösungspaar exp(αx) cos( βx) ,
exp(αx) sin(βx) .
Beispiel: Dgl. des Bernoulli-Balkens mit Biegesteifigkeit EI und Axialdruck H. EIw + Hw = 0. Charakteristische Gleichung: λ4 + δ2 λ2 = 0 , λ12 = 0 ,
δ2 = H/(EI) ,
λ11 = 0 ,
λ2 = ±jδ .
Fundamentalsystem: y11 = 1 ,
y12 = x ,
y21 = cos δx ,
y22 = sin δx .
Partikuläre Lösungen der inhomogenen Dgl. erhält man über die Variation der Konstanten oder oft einfacher durch einen Ansatz nach Art der rechten Seite mit noch freien Faktoren, die aus einem Koeffizientenvergleich folgen. Beispiel: Eine partikuläre Lösung der Dgl. y + ay + by = cos Ωx
wird gesucht .
Ansatz nach Art der rechten Seite: yp = p cos Ωx + q sin Ωx. Einsetzen in die Dgl. gibt 2 Gleichungen für p und q. p 1 b − Ω2 aΩ = . 0 −aΩ b − Ω2 q
25.6 Normiertes Fundamentalsystem Die Linearkombination des Fundamentalsystems mit Faktoren Ck kann in eine solche mit Faktoren y(0), y(0) bis y(n−1) (0) umgeschrieben werden. L[ y] = an y(n) + . . . + a0 y = 0 , y(x) = C1 y1 (x) + . . . + Cn yn (x) .
Normiertes Fundamentalsystem: y(x) = y(0) f1 (x) + y (0) f2 (x) + . . . +y
(n−1)
(25-20)
(0) fn (x) .
Die auf Randdaten y(k) an der Stelle x = 0 normierten Funktionen fk+1 sind selbst Linearkombinationen des nicht normierten Systems. Die konkrete Berechnung erfordert die Lösung eines algebraischen Gleichungssystems der Ordnung n. Beispiel: Für die Dgl. y − y = 0 mit dem Fundamentalsystem sin x, cos x, sinh x, cosh x bestimme man die normierte Version. Normierung von y(x) = C0 sin x + C1 cos x + C2 sinh x + C3 cosh x : ⎡ ⎤ ⎡ ⎢⎢⎢ y(0) ⎥⎥⎥ ⎢⎢⎢ 0 ⎢⎢⎢ ⎥ ⎢ ⎢⎢⎢ y (0) ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ 1 ⎢⎢⎢ ⎥=⎢ ⎢⎢⎣ y (0) ⎥⎥⎥⎥⎦ ⎢⎢⎢⎢⎣ 0 y (0) −1
1 0 −1 0
0 1 0 1
⎤⎡ ⎤ 1 ⎥⎥ ⎢⎢ C0 ⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ C1 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ 1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ C2 ⎥⎥⎥⎥ ⎦⎣ ⎦ 0 C3
kurz y0 = KC. Umkehrung gibt die Elimination der Ci durch Randdaten ⎡ ⎤ 0 −1 ⎥⎥ ⎢⎢⎢ 0 1 ⎥⎥ ⎢⎢⎢ 1 ⎢⎢ 1 0 −1 0 ⎥⎥⎥⎥ ⎢ ⎥⎥ y C = ⎢⎢ 0 1 ⎥⎥⎥⎥ 0 2 ⎢⎢⎢ 0 1 ⎣ ⎦ 1 0 1 0 und das normierte Fundamentalsystem 2y(x) = (cosh x + cos x)y(0) + (sinh x + sin x)y (0) + (cosh x − cos x)y (0) + (sinh x − sin x)y (0) . Das normierte Fundamentalsystem erleichtert die Berechnung einer partikulären Lösung L[ yp ] = r. Die Wirkung der rechten Seite r(ξ) dξ an der Stelle ξ nach Bild 25-1, 0 ξ x, auf die Lösung yp (x) an der Stelle x entspricht der Wirkung von y(n−1) (0). Normiertes Fundamentalsystem: y(x) = y(0) f1 (x) + . . . + y(n−1) (0) fn (x) . Duhamel-Formel:
25 Lösungsverfahren für gewöhnliche Differenzialgleichungen
1 yp (x) = an
"x r(ξ) fn (x − ξ) dξ ,
Partikularlösung über Duhamel-Formel: (25-21)
0
fn (x − ξ) : fn mit dem Argument x − ξ . Die Duhamel-Formel hat den Charakter eines Faltungsintegrals, wie aus einer entsprechenden Analyse mithilfe der Laplace-Transformation hervorgeht. Beispiel 1: Für die Dgl. y −y = x ist eine partikuläre Lösung gesucht. Mit fn = (sinh x − sin x)/2 vom vorigen Beispiel gilt yp (x) =
1 2
"x ξ[sinh(x − ξ) − sin(x − ξ)] dξ , 0
1 yp (x) = (−x + sinh x − x + sin x) 2 = (sin x + sinh x)/2 − x . Beispiel 2: Speziell für die Dgl. des gedämpften Einmassenschwingers m x¨ + b x˙ + kx = f (t) ,
()· = d()/dt ,
und weiter δ = ω0 D ,
"t
e−δ(t−τ) [sin ω(t − τ)] f (τ)dτ .
0
Die normierte Fundamentallösung (25-20) mit ihren n − 1 Ableitungen beschreibt den Einfluss des Zustandes z(0) an der Stelle x = 0 auf den Zustand z(x) an einer beliebigen Stelle x mittels der Übertragungsma¨ trix U: ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ y ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ y ¨ z = ⎢⎢⎢⎢ . z(x) = U(x)z ⎥⎥⎥⎥ , 0 , . ⎥⎥⎥ ⎢⎢⎢ . ⎥ ⎢⎣ (n−1) ⎦ y ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ f1 . . . f n ⎥⎥⎥ ⎢⎢⎢⎢ ⎢⎢⎢ f1 fn ⎥⎥⎥⎥ U¨ = ⎢⎢⎢⎢ . .. ⎥⎥⎥⎥⎥ . ⎢⎢⎢ .. . ⎥⎥⎥ ⎢⎢⎢ ⎣ f (n−1) . . . fn(n−1) ⎥⎥⎦ 1
(25-22)
U¨ entspricht der Wronski-Matrix .
gilt mit den Abkürzungen ω20 = k/m ,
1 yp = mω
√ 2D = b/ km √ ω = ω0 1 − D2 :
Normiertes Fundamentalsystem: $ # δ x(t) = e−δt cos ωt + sin ωt x0 ω −δt sin ωt x˙0 , +e ω x0 = x(t = 0) , x˙0 = x˙(t = 0) .
Aus dem Zusammenhang (25-22) folgen einige Eigenschaften der Übertragungsmatrix. ¨ = 0) = I , (Einheitsmatrix) , U(x ¨ ¨ U(x)U(−x) =I, ¨ 1 ) = U(x ¨ 1 + x2 ) , ¨ U(x2 )U(x (25-23) allgemein n ¨ 1 ) = U(s) ¨ ¨ n ) · . . . · U(x , s= xk . U(x k=1
25.7 Green’sche Funktion Während Duhamel-Formel (25-21) und Übertragungsmatrix (25-22) die Lösung vom Nullpunkt aus entwickeln, was dem Vorgehen bei Anfangswertproblemen entspricht, erzeugt die Green’sche Funktion G(x, ξ) die partikuläre Lösung yp zur rechten Seite r(x) einer Randwertaufgabe im Definitionsbereich a x b. Dgl. L[ y] = an y(n) + . . . + a0 y = r(x) , .b (25-24) L[ yp ] = r , yp = G(x, ξ)r(ξ) dξ .
Bild 25-1. Über die Länge dξ integrierte Wirkung der rech-
ten Seite r(ξ)
a
Randbedingungen Ra [ y] = ra ,
Rb [ y] = rb .
A99
A100
A Mathematik und Statistik / Mathematik
Durch Ableiten von yp und Einsetzen in die Randwertaufgabe ergeben sich die notwendigen Eigenschaften von G(x, ξ): a) L[G(x, ξ)] = 0 für x ξ. Ableitungen betreffen nur die Variable x. b) G(x, ξ) muss die Randbedingung erfüllen. c) ∂kG/∂xk (k = 0 bis k = n − 2) muss an der Stelle ξ stetig sein. d) Die (n − 1)-te Ableitung muss an der Stelle x = ξ einen Einheitssprung aufweisen 1 . an (x)
[∂n−1G(x, ξ)/∂xn−1 ] x=ξ+0 x=ξ−0 =
(25-25)
Die praktische Berechnung der Green’schen Funktion geht aus von einer Linearkombination der Lösungsfunktionen y1 (x) bis yn (x) des Fundamentalsystems, wobei wegen der Unstetigkeit bei x = ξ zwei Bereiche unterschieden werden. ⎧ n ⎪ ⎪ ⎪ ⎪ (ck + dk )yk ; x ξ ⎪ ⎪ ⎪ ⎪ ⎨ k=1 (25-26) , G(x, ξ) = ⎪ n ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ (ck − dk )yk ; x ξ k=1
ck = ck (ξ) ,
dk = dk (ξ) ,
yk = yk (x) .
Berechnung der n Funktionen dk : Stetigkeit ∂iG/∂xi (i = 0 bis n − 2) für x = ξ gibt n − 1 Gleichungen. n
dk (ξ)yk(i) (ξ) = 0 .
k=1
Einheitssprung von ∂n−1G/∂xn−1 für x = ξ , n
dk (ξ)y(n−1) (ξ) = − k
k=1
(25-27)
1 . 2an
Beispiel: Zur Dgl. y − δ2 y = 0 + r berechne man die Green’sche Funktion für das Intervall 0 x l mit den Randbedingungen R0 [ y] = y (0) = 0 und Rl [ y] = y(l) = 0. Mit dem Fundamentalsystem y1 = cosh δx, y2 = sinh δx wird (25-26) zu: ⎧ ⎪ (c1 + d1 ) cosh δx + (c2 + d2 ) sinh δx ; ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨x ξ G(x, ξ) = ⎪ ⎪ ⎪ ⎪ (c1 − d1 ) cosh δx + (c2 − d2 ) sinh δx ; ⎪ ⎪ ⎪ ⎩x ξ . Berechnung der dk nach (25-27): 0 cosh δξ sinh δξ d1 = , −1/2 δ sinh δξ δ cosh δξ d2 sinh δξ − cosh δξ , d2 = . d1 = 2δ 2δ Berechnung der ck nach (25-28): (c1 + d1 )y1 (0) + (c2 + d2 )y2 (0) = 0 , (c1 − d1 )y1 (l) + (c2 − d2 )y2 (l) = 0 , 0 1 c1 → cosh δl sinh δl c2 −d2 = . d1 cosh δl + d2 sinh δl Nach einigen Umformungen erhält man die Green’sche Funktion, wobei oberer und unterer Teil in x und ξ symmetrisch sind. ⎧ cosh δx sinh δ(ξ − l) ⎪ ⎪ ⎪ · , xξ ⎪ ⎪ ⎪ δ cosh δl ⎨ G(x, ξ) = ⎪ ⎪ ⎪ ⎪ cosh δξ sinh δ(x − l) ⎪ ⎪ ⎩ · , xξ. δ cosh δl
Berechnung der n-Unbekannten ck : Erfüllung der jeweils n/2 Randbedingungen in Ra [G] und in Rb [G] für x = a und x = b gibt: ⎡ n ⎤ ⎢⎢⎢ ⎥⎥ (25-28) Ra ⎢⎢⎣ (ck + dk )yk ⎥⎥⎥⎦ = ra , k=1
⎡ n ⎤ ⎢⎢⎢ ⎥⎥ ⎢ Rb ⎢⎣ (ck − dk )yk ⎥⎥⎥⎦ = rb . k=1
25.8 Integration durch Reihenentwicklung Unter gewissen Voraussetzungen kann die Lösung einer Differenzialgleichung durch Potenzreihen an einer Entwicklungsstelle x0 approximiert werden. y=
∞ k=0
ak (x − x0 )k .
(25-29)
26 Systeme von Differenzialgleichungen
Durch Einsetzen in die Dgl. und Ordnen nach Potenzen erhält man algebraische Gleichungen für die Koeffizienten. Die explizite Anfangswertaufgabe y(n) = f (x, y, . . . , y(n−1) ) mit gegebenen Anfangswerten y(0) = y0 bis y(n−1) (0) = y(n−1) 0
(25-30)
y(n−1) 0
(n−1)
) an der Stelle in y entwickelbar ist. f (y Bei linearen Dgln. zweiter Ordnung, y + a(x)y + b(x)y = r ,
(25-31)
kann die an der Stelle x0 = 0 nicht mögliche Entwicklung nach (25-29) in einem Pol erster Ordnung von a(x) und einem solchen zweiter Ordnung von b(x) begründet sein, wie es sich in folgender Dgl. darstellt: A(x) B(x) y + 2 y=0, x x A(x) , B(x) in x0 = 0 stetig .
y +
(25-32)
Für eine Dgl. nach (25-32) ist x0 = 0 eine Stelle der Bestimmtheit mit einer verallgemeinerten Form der Entwicklung für das Fundamentalsystem. y1 = xλ 1
∞
a k xk ,
y2 = xλ 2
∞
k=0
b k xk .
"b K(x, ξ) y(ξ) dξ ,
r(x) =
(25-33)
Verallgemeinerungen von (25-34) enthalten y(x) auch außerhalb des Integrals: "b a
g(x) = 1 : Integralgleichung 2. Art ,
λ(λ − 1) + λA(0) + B(0) = 0 .
25.9 Integralgleichungen Die Green’sche Funktion (25-24) erzeugt die partikuläre Lösung y(x) zu einer beliebigen rechten Seite r(x) für ein Randwertproblem im Definitionsbereich a x b. "b G(x, ξ) r(ξ) dξ ,
y(x) = a
G(x, ξ), r(ξ)
gegeben ;
y(x) gesucht .
(25-35)
g(x) beliebig: Integralgleichung 3. Art . Für feste Integrationsgrenzen spricht man von Fredholm’schen, sonst von Volterra’schen Integralgleichungen.
26 Systeme von Differenzialgleichungen Systeme von Differenzialgleichungen – hier werden nur lineare mit konstanten Koeffizienten behandelt – in der kompakten Matrizenschreibweise z˙ (t) = Az(t) + b(t) , zT = [z1 (t) . . . zn (t)] ,
k=0
Wurzeln der determinierenden Gleichung
K(x, ξ) y(ξ) dξ + r(x) ,
g(x) y(x) =
λ1 − λ2 0, ±1, ±2, . . . λ1 , λ2
(25-34)
a
Kern K(x, ξ) , r(x) gegeben ; y(ξ) gesucht .
ist an der Stelle x0 nach (25-29) entwickelbar, falls die rechte Seite f in (25-30) als Funktion f ( y) an der Stelle y0 in y entwickelbar ist, .. . (n−1)
Die Umkehrung dieser Aufgabenstellung, zu einer gegebenen linken Seite die passende „Belastung“ zu finden, definiert die Integralgleichung 1. Art:
()· = d()/dt ,
homogen: ˙z − Az = o , inhomogen: z˙ − Az = b ,
(26-1)
ergeben sich direkt bei Problemen mit mehreren Freiheitsgraden oder durch Umformulierung einer Dgl. n-ter Ordnung in n Dgl. 1. Ordnung. Dazu werden n − 1 neue abhängig Veränderliche eingeführt, die möglichst eine physikalische Bedeutung haben sollen. Beispiel: Dgl. 4. Ordnung des Biegebalkens: EIw = qz . Sinnvolle abhängig Veränderliche: Neigung ϕ = −w , () = d()/dx, Moment M = EIϕ ,
A101
A102
A Mathematik und Statistik / Mathematik
Querkraft Q = M . Zusammen mit der ursprünglichen Dgl. in neuer Form Q = −qz gilt ⎡ ⎤ ⎢⎢⎢ w ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢ϕ⎥ z = ⎢⎢⎢⎢ ⎥⎥⎥⎥ , ⎢⎢⎢⎣ M ⎥⎥⎥⎦ Q bT = [0
⎡ ⎢⎢⎢ 0 ⎢⎢⎢ ⎢0 A = ⎢⎢⎢⎢ ⎢⎢⎢ 0 ⎣ 0
−1 0 0 0
0 1/(EI) 0 0
⎤ 0 ⎥⎥ ⎥⎥ 0 ⎥⎥⎥⎥ ⎥⎥ , (26-2) 1 ⎥⎥⎥⎥ ⎦ 0
− qz ] .
0 0
Homogene Lösungen zu (26-1) erhält man auf einem ersten möglichen Weg durch einen Exponentialansatz z(t) = c eλt ,
c konstante Spalte .
Eingesetzt in Az − ˙z = o gibt charakteristisches Gleichungssystem
(26-3)
( A − λI)c = o für λ1 , c1 bis λn , cn . Notwendige Bedingung für Lösungen: | A − λI| = λ + a1 λ n
n−1
+ . . . + an = 0 .
(26-4)
Die Berechnung der Nullstellen als Eigenwerte λ des speziellen Eigenwertproblems (A − λI)c = o erfolgt mit Hilfe bewährter numerischer Verfahren. Ein alternativer Weg strebt die Lösung in Form einer Übertragungsmatrix an: z(t) = exp[ A · (t − t0 )]z(t0 ) .
+
1 ( At)2 2!
0 0 0 0
−1 0 0 0
⎤ 0 ⎥⎥ ⎥⎥ 1 ⎥⎥⎥⎥ 1 ⎥⎥ , 0 ⎥⎥⎥⎥ EI ⎦ 0
⎡ ⎤ ⎢⎢⎢ 0 0 0 −1 ⎥⎥⎥ ⎢⎢⎢⎢ 0 0 0 0 ⎥⎥⎥⎥ 1 ⎥⎥ A3 = ⎢⎢⎢⎢ , A4 = O , ⎢⎢⎢ 0 0 0 0 ⎥⎥⎥⎥⎥ EI ⎣ ⎦ 0 0 0 0 ¨ gilt z(x) = U(x)z(0) , ⎡ ⎤ ⎢⎢⎢ x3 ⎥⎥⎥ x2 ⎥⎥ − ⎢⎢⎢⎢ 1 −x − 2EI 6EI ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥ ⎢⎢⎢ x2 ⎥⎥⎥⎥ x ¨ U(x) = ⎢⎢⎢⎢⎢ 0 1 ⎥⎥ . ⎢⎢⎢ EI 2EI ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥ ⎢⎢⎢ 0 0 1 x ⎥⎥⎥⎥ ⎣ ⎦ 0 0 0 1 Das charakteristische Polynom (26-4) dient nicht nur der Berechnung der gesuchten Eigenwerte λ. Es gilt darüber hinaus der wichtige Satz von CayleyHamilton: Die Matrix A erfüllt ihr eigenes charakteristisches Polynom: det( A − λI) = 0 . Aus (4): λn + a1 λn−1 + . . . + an 1 = 0 folgt: An + a1 An−1 + . . . + an I = O . (26-6) Damit kann jede ganzzahlige Potenz Ak mit k n durch ein Polynom mit höchstens An−1 dargestellt werden; dies gilt auch für die Entwicklung
Speziell für t0 = 0: exp( At) = I + At +
Mit
⎡ ⎢⎢⎢ 0 ⎢⎢⎢ ⎢0 A2 = ⎢⎢⎢⎢ ⎢⎢⎢ 0 ⎣ 0
(26-5)
1 ( At)3 + . . . 3!
d Mit exp( At) = A exp( At) = [exp( At)] A gilt in der dt Tat ˙z − Az = o. Für die Reihenentwicklung der e-Funktion mit Matrixexponenten gilt eine der skalaren Darstellung entsprechende Form. In der Regel ist die Reihe nach einem bestimmten Kriterium abzubrechen. Im Sonderfall der Matrix A aus (26-2) verschwindet bereits A4 und damit alle folgenden Potenzen. Beispiel: Biegebalken nach (26-2) mit dem Verfahren der Reihenentwicklung.
exp( At) = a0 I + a1 A + a2 A2 + . . . + an−1 An−1 , ak = ak (t) ,
(26-7)
mit weiteren Faktorfunktionen ak (t), die über die Eigenwerte λk mit den Basislösungen exp(λk t) verknüpft sind. Bei n verschiedenen λ-Werten gilt ⎤ ⎡ ⎤ ⎤⎡ ⎡ ⎢⎢⎢ 1 λ1 . . . λn−1 ⎥⎥⎥ ⎢⎢⎢⎢ a0 (t) ⎥⎥⎥⎥ ⎢⎢⎢⎢ exp(λ1 t) ⎥⎥⎥⎥ 1 ⎥ ⎢⎢⎢ ⎥⎥ ⎢⎢⎢ a (t) ⎥⎥⎥ ⎢⎢⎢ exp(λ t) ⎥⎥⎥ ⎢⎢⎢ 1 λ2 . . . λn−1 2 ⎥ ⎥⎥⎥ = ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 1 2 ⎥ ⎥⎥⎥ . (26-8) ⎢⎢⎢ . . .. . .. ⎥⎥⎥⎥ ⎢⎢⎢⎢ ... ⎥⎥⎥⎥ ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢⎢ .. .. . ⎥ ⎥ ⎢ ⎢ ⎦ ⎣ ⎦ ⎦⎣ ⎣ a exp(λ 1 λn λn−1 (t) t) n−1 n n Die auf Anfangswerte z(0) normierte Übertragungsform (26-5) erschließt entsprechend der Duhamel-Formel (25-21) in 25.6 auch die partikuläre Lösung z˙ p − Azp = b,
27 Selbstadjungierte Differenzialgleichung
"t zp (t) =
exp[ A(t − τ)]b(τ)dτ .
(26-9)
0
Für spezielle rechte Seiten empfiehlt sich die Benutzung der Tabelle 26-1. Tabelle 26-1. Spezielle Ansätze zp (t) zur Lösung der Dgl.
˙zp − Azp = b b
Ansatz m
b0 t m , m∈N
b0 eαt
Lösungssystem für die Ansatzkoeffizienten Aam = −b0
ak t k
k=0
Aam−1 = mam .. .. . . Aa0 = 1 a1 (A − αI)a = −b0 falls α Eigenwert von A ⎤⎡ ⎤ ⎡ ⎡ ⎤ ⎢⎢⎢ A −ωI ⎥⎥⎥ ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎢ −c0 ⎥⎥⎥ ⎦⎥ ⎣⎢ ⎦⎥ = ⎣⎢ ⎣⎢ ⎦⎥ b ωI A −s0
a eαt
c0 cos ωt a cos ωt +s0 sin ωt +b sin ωt
Die letzte Beziehung in (27-2) lässt sich nach λk auflösen, wobei der entstehende Quotient für beliebige x infolge seiner Extremaleigenschaft fundamentale Bedeutung hat; es ist dies der Rayleigh-Quotient xT Ax , A = AT , B = BT , (27-3) xT Bx Rextr aus R,i = 0 , i = 1 . . . n , (),i = ∂R/∂xi . (27-4) → ( A − Rextr B)xextr = o → Rextr = λk . R=
Aus dem Vergleich von (27-4) mit (27-2) erweisen sich die extremalen Werte des Rayleigh-Quotienten als Eigenwerte λk des Paares A, B. Sie werden angenommen, wenn für x die Eigenvektoren xk eingesetzt werden. Eine Übertragung von Matrizen A auf lineare Differenzialoperatoren L führt zunächst zur Definition des adjungierten Operators L¯ zu L: " " ! ¯ v(x) L[u(x)] dx → L¯ , (27-5) u(x) L[v(x)] dx = und zur besonderen Benennung der wichtigen Situation, falls " " u(x) L[v(x)] dx = v(x) L[u(x)] dx . (27-6)
27 Selbstadjungierte Differenzialgleichung
L¯ = L Bei Bilinearformen Zeile × Matrix × Spalte ist das skalare Ergebnis unabhängig von der links- oder rechtsseitigen Multiplikation mit a oder b, falls die Matrix A symmetrisch ist. Bilineare Form: aT Ab = bT AT a ,
allgemein:
speziell AT = A : aT Ab = bT Aa .
(27-1)
Die Symmetrieeigenschaft hat weitgehende analytische und numerische Konsequenzen; so sind zum Beispiel die Eigenwerte λ des homogenen Problems ( A − λB)x = o für definites B stets reell und die Eigenvektoren x haben Orthogonalitätseigenschaften. Falls ( A − λk B)xk = o, k = 1 bis n, A = AT , B = BT gilt xTi Bx j = 0 , falls ⎧ ⎪ ⎪ ⎨ 0 , falls xTi Ax j = ⎪ ⎪ ⎩ λ xT Bx , k k
k
i j. i j falls i = j = k .
(27-2)
ist selbstadjungierter Operator .
Die Überprüfung von (27-6) bezüglich der Berechnung von L¯ aus (27-5) erfolgt durch partielle Integration, wobei die entstehenden Randterme zunächst nicht beachtet werden. Operatoren der Form 6 7 6 7 L[ y] = a0 y − a1 y + a2 y − . . . (m) + (−1)m am y(m) , (27-7) ak = ak (x) ,
y = y(x) ,
sind für hinreichend oft differenzierbare Funktionen ak selbstadjungiert. Für ein homogenes Randwertproblem mit Operatoren M, N, Dgl.
M[ y] − λN[ y] = 0 ,
Randbedingungen R0 [ y] = 0 , R1 [ y] = 0 , (27-8) gelten für die Eigenwerte λk und Eigenlösungen yk (x) bei selbstadjungierten Operatoren ebenfalls Orthogonalitätsbedingungen:
A103
A104
A Mathematik und Statistik / Mathematik
Falls M[ yk ] − λk N[ yk ] = 0 , R0 [ yk ] = 0 , R1 [ yk ] = 0 und ¯ = M , N¯ = N gilt : M " yi N[ yi ] dx = 0 , falls i j , Ni j = " 0 falls i j (27-9) Mi j = yi M[ y j ] dx = λk Nkk , falls i = j = k . Falls in R0 und R1 noch diskrete Randelemente (in der Mechanik sind dies Federn und Massen) enthalten sind, ist (27-9) zur sogenannten belasteten Orthogonalität zu erweitern. Die letzte Aussage in (27-9) führt wie bei Matrizen zum Rayleigh-Quotienten: . yM[ y] dx R= . , M = M¯ , N = N¯ , (27-10) yN[ y] dx Rextr aus M[yextr ] − Rextr N[ yextr ] = 0 mit R0 [ yextr ] = 0 , R1 [ yextr ] = 0 .
Die gewöhnlichen Dgln. 2. Ordnung mit variablen Koeffizienten, y + a1 (x)y + a0 (x)y = 0 (28-1) oder (p(x)y ) + q(x)y = 0 " mit p(x) = exp a1 dx , q(x) = a0 p(x) sind für spezielle Paare a1 (x), a0 (x) mit traditionellen Namen belegt. Die nachfolgende Aufstellung enthält charakteristische Merkmale einiger klassischer Dgln. Hypergeometrische Dgl.: x(x − 1)y + [(a + b + 1)x − c]y + aby = 0 . (28-2) Eine Lösung ist
(27-11)
→ Rextr = λk . Die extremalen Werte des Rayleigh-Quotienten entsprechen den Eigenwerten λk der Randwertaufgabe (27-8), falls zur Extremwertberechnung nur solche Funktionen y(x) zugelassen werden, welche gewissen Randstetigkeiten genügen. Einzelheiten werden im Rahmen der Variationsrechnung (siehe Kapitel 32) behandelt. Für die konkrete Rechnung ist es vorteilhaft, die Operatoren M und N durch partielle Integration gleichmäßig nach links und rechts aufzuteilen: " " yM[ y] dx → {P[ y]}{P[ y]} dx , " " yN[ y] dx → {Q[ y]}{Q[ y]} dx . (27-12) Beispiel: Dgl. des Knickstabes mit w + λ2 w = 0 ,
28 Klassische nichtelementare Differenzialgleichungen
λ2 = F/EI ,
w(0) = 0 , w (0) = 0 , w(l) = 0 , w (l) = 0 . . . wM[w] dx = ww dx . = [ww − w w ]l0 + w w dx , . . wN[w] dx = − ww dx. = −[ww ]l0 + w w dx . Alle Randterme sind wegen der Randbedingungen gleich null.
ab x c a(a + 1)b(b + 1) 2 x c(c + 1) a(a + 1)(a + 2)b(b + 1)(b + 2) 3 x c(c + 1)(c + 2)
y = F(a, b, c; x) = 1 + 1 · 2! 1 · + 3! +...
+
F : hypergeometrische Funktion. Fundamentalsysteme: y1 = F(a, b, c; x) y2 = x1−c F(a − c + 1, b − c + 1, 2 − c; x) c 0, 1, 2, . . . ; |x| < 1 . y1 = F(a, b, a + b − c + 1; 1 − x) y2 = (1 − x)c−a−b · F(c − b, c − a, c − a − b + 1; 1 − x) a + b − c nicht ganzzahlig , |x − 1| < 1 . y1 = x−a F(a, a − c + 1, a − b + 1; 1/x) y2 = x−b F(b, b − c + 1, b − a + 1; 1/x) a − b nicht ganzzahlig , |x| > 1 . Legendre’sche Dgl.: (1 − x2 )y − 2xy + (n + 1)ny = 0 , n 0 ganz .
(28-3)
29 Klassische nichtelementare Differenzialgleichungen
Eine Lösung ist 1−x Pn (x) = F −n, n + 1, 1; . 2 ⎧ "1 ⎪ 0 mn ⎪ ⎪ ⎨ . Pm (x)Pn (x) dx = ⎪ 2 ⎪ ⎪ ⎩ m=n −1 2n + 1
Bessel’sche Dgl.: x2 y + xy + (x2 − n2 )y = 0 .
(28-4)
auch die Zylinderfunktionen 3. Art oder Hankel’sche Funktionen (28-5)
Hn1 (x) = Jn (x) + jNn (x) Hn2 (x) = Jn (x) − jNn (x) .
(28-11)
Eine besondere Bedeutung hat die Mathieu’sche Dgl.:
Kummer’sche Dgl.: xy + (1 − x)y + ny = 0 .
(28-6)
Ln (x) = n!K(−n, 1; x)
mit der
y(t + π) = eαπ y(t) ,
konfluenten hypergeometrischen Reihe: a 1 a(a + 1) 2 K(a, c; x) = 1 + x + · x c 2! c(c + 1) 1 a(a + 1)(a + 2) 3 x +... + · 3! c(c + 1)(c + 2) (28-7) ∞ . 0 nm . e−x Lm Ln dx = 2 (n!) n=m 0 Ln+1 (x) = (2n + 1 − x)Ln (x) − n2 Ln−1 (x) . Dgl. der Hermite’schen Polynome: y − 2xy + 2ny = 0 .
(28-8)
Eine Lösung ist n
y¨ + (λ − 2h cos 2t)y = 0
(28-12)
mit einem periodischen Koeffizienten cos 2t =cos 2(t + π). Es gibt nach Floquet stets Lösungen
Eine Lösung ist
d [exp(−x)2 ] . dxn "∞ 0 mn 2 . exp(−x )Hm (x)Hn (x) dx = n √ 2 n! π m = n
−∞
Eine Lösung sind die Zylinderfunktionen 1. Art ∞ # x $n 1 Jn (x) = (−1)k 2k x2k , 2 k=0 2 k!(n + k)! auch die Zylinderfunktionen 2. Art oder Neumann’sche Funktionen 1 [cos(nπ)Jn(x) − J−n (x)] ; (28-10) Nn (x) = sin(nπ)
(1 − x2 )y − xy + n2 y = 0 .
Hn (x) = (−1)n exp(x2 )
(28-9)
x>0;
Tschebyscheff’sche Dgl.:
Eine Lösung ist 1 1−x T n (x) = F n, −n, ; . 2 2 ⎧ ⎪ 0 mn "1 ⎪ ⎪ T m (x)T n (x) dx ⎪ ⎨ =⎪ π/2 m = n 0 . √ ⎪ ⎪ 2 ⎪ 1−x ⎩ π m=n=0 −1
A105
(28-13)
deren Stabilität vom Exponenten α abhängt. Im konkreten Fall wird man von y(t = 0) ausgehend durch numerische Integration y(π) errechnen, wobei der Quotient y(π)/y(0) stabilitätsentscheidend ist. Bei einem System 1. Ordnung mit Periode T , z˙ = A(t)z ,
A(t + T ) = A(t) ,
(28-14)
integriert man über eine Periode (zweckmäßig von t = 0 bis t = T ) und erhält die Übertragungsmatrix U¨ (auch Transitionsmatrix): ¨ 0 , z0 = z(t = 0) , z1 = z(t = T ) . (28-15) z1 = Uz Der Lösungsansatz zk = αk z0 überführt (28-15) in ein Eigenwertproblem. √ (U¨ − αI)z0 = o → α = a + jb = a2 + b2 ejϕ . (28-16) Stabilität, falls a2 + b2 1.
A106
A Mathematik und Statistik / Mathematik
29 Partielle Differenzialgleichungen 1. Ordnung Eine Bestimmungsgleichung für die Funktion u(x1 , . . . , xn ) von n unabhängig Veränderlichen xi heißt partielle Differenzialgleichung k-ter Ordnung, j falls u in partiell abgeleiteter Form ∂ j u/∂xi erscheint, wobei die höchste Ableitung jmax = k die Ordnung der Dgl. bestimmt. Das Wesentliche einer linearen Dgl. 1. Ordnung, n i=1
⎡ ⎤ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢ . ⎥⎥ ai (x)u,i +b(x)u + c(x) = 0 , x = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , (29-1) ⎢⎣ ⎥⎦ xn
∂()/∂xi = (),i , zeigt sich in der verkürzten homogenen Form n
ai (x)u,i = 0 ,
kurz
aT (x) grad u = 0 . (29-2)
i=1
Mit einer zunächst noch unbekannten Darstellung u[x(t)] = c ,
c = const ,
(29-3)
der Lösung in Form eines parametergesteuerten Zusammenhanges zwischen den Variablen (Reduktion der Vielfalt auf n − 1) ist über den Zuwachs n
die in beliebiger funktioneller Verknüpfung Φ( f1 , . . . , fn−1 ) = u , aT (x) grad u = 0 ,
(29-7)
eine spezielle Lösung der Dgl. (29-2) darstellen, falls nur Φ stetige partielle Ableitungen 1. Ordnung besitzt. Auf diese Weise lassen sich beliebig viele Lösungen u(x) erzeugen. Beispiel: Für die Dgl. xu, x +yu,y +2(x2 + y2 )u,z = 0 mit x1 = x, x2 = y, x3 = z berechne man die Grundcharakteristiken f1 , f2 und weise nach, dass Φ( f1 , f2 ) = f1 f2 ebenfalls Lösung der Dgl. ist. Durch Integration der Dgln. dx/dt = x, dy/dt = y, dz/dt = 2(x2 + y2 ) erhält man zunächst x(t) = c1 et , y(t) = c2 et und daraus über dz/dt = 2e2t (c21 + c22 ) die Parameterdarstellung z(t) = (c21 + c22 )e2t + c3 . Elimination von t liefert die Grundcharakteristiken y/x = c2 /c1 = C1 , C2 = c3 = z−(x2 +y2 ). Die partiellen Ableitungen der Funktion Φ = C1 ·C2 ergeben in der durch die Dgl. bestimmten Kombination in der Tat die Summe null. ⎫ yz y2 ⎪ ⎪ x|Φ, x = − 2 − y 1 − 2 ⎪ ⎪ ⎪ x x ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ 2 3y z =0. ⎪ ⎪ y|Φ,y = − x + ⎪ ⎪ ⎪ x x ⎪ ⎪ ⎪ ⎪ y ⎪ ⎪ ⎭ 2(x2 + y2 )|Φ,z = x
(29-4)
30 Partielle Differenzialgleichungen 2. Ordnung
ein implizites Erfüllen der Dgl. (29-2) garantiert, falls die Koeffizienten von u,i in (29-2) und (29-4) übereinstimmen. Insgesamt gibt dies die n charakteristischen Gleichungen für x(t),
Das Charakteristische einer linearen partiellen Differenzialgleichung 2. Ordnung
dc/dt = 0 =
u,i dxi /dt
i=1
dx1 /dt = a1 (x1 , . . . , xn ) , dxn /dt = an (x1 , . . . , xn ) ,
xk = xk (t) .
(29-5)
die unter Einbeziehung von n Integrationskonstanten zu integrieren sind. Durch Elimination des Parameters t erhält man die Grundcharakteristiken C1 = f1 (x1 , . . . , xn ) Cn−1 = fn−1 (x1 , . . . , xn ) ,
Ck = const ,
(29-6)
L[u] = a11 (x)u,11 +a12 (x)u,12 + . . . + a1n (x)u,1n + a12 (x)u,12 +a22 (x)u,22 + . . . + a2n (x)u,2n + a1n (x)u,1n +a2n (x)u,2n + . . . + ann (x)u,nn + b1 (x)u,1 +b2 (x)u,2 + . . . + bn (x)u,n + c(x)u = r(x) ,
xT = [x1 , x2 , . . . , xn ] , (30-1)
mit n Variablen xi und der gesuchten Funktion u(x) zeigt sich in den Eigenwerten λ1 (x) bis λn (x) der Koeffizientenmatrix A(x), die ihrerseits eine Funktion
30 Partielle Differenzialgleichungen 2. Ordnung
ξ, x η,y −ξ,y η, x 0 .
Tabelle 30-1. Klassifikation von Dgln. 2. Ordnung
Eigenschaften aller λi in allen Punkten x Alle λi 0 und dasselbe Vorzeichen Alle λi 0 und genau ein Vorzeichen entgegengesetzt zu allen anderen Mindestens ein λi = 0
Typ der Dgl. Elliptisch Hyperbolisch Parabolisch
der Koordinaten x des Definitionsgebietes ist; Tabelle 30-1. Im Sonderfall n = 2 entscheidet die Koeffizientendeterminante a11 (x) a12 (x) (30-2) A = − a12 (x) a22 (x) über den Typ der Dgl.: ⎧ ⎪ < 0 für alle x : elliptisch ⎪ ⎪ ⎪ ⎨ n = 2 : A(x) ⎪ = 0 für alle x : parabolisch . ⎪ ⎪ ⎪ ⎩ > 0 für alle x : hyperbolisch (30-3) Wie quadratische Formen auf Diagonalform mit ai j = 0 für i j transformiert werden können, lassen sich Dgln. auf ihre Normalformen transformieren. Mit neuen Variablen ξ, η anstelle von x1 = x und x2 = y sowie entsprechenden Ableitungen nach ξ und η, ξ = ξ(x, y) ,
η = η(x, y) ,
(30-4)
u = u[x(ξ, η), y(ξ, η)] ↔ u[ξ(x, y), η(x, y)] , u, x = u,ξ ξ,η +u,η η, x usw. , lässt sich der Übergang zur transformierten Form anschreiben. u = f1 (x, y) : a11 u, xx +2a12 u, xy +a22 u,yy +F(x, y, u, x , u,y ) = 0 , u = f2 (ξ, η) : b11 u, ξξ + 2b12 u,ξη +b22 u,ηη +G(ξ, η, u, u, ξ , u,η ) = 0 , ai j = fi j (x, y) ,
bi j = gi j (ξ, η) .
(30-5)
b11 = a11 ξ2 , x +2a12 ξ, x ξ,y +a22 ξ2 ,y , b22 = a11 η2 , x +2a12 η, x η,y +a22 η2 ,y , b12 = a11 ξ, x η, x +a12 (ξ, x η,y +ξ,y η, x ) + a22 ξ,y η, . Der Typ der Dgl. und die Eindeutigkeit der Umkehrung (ξ, η) ↔ (x, y) ist gewährleistet durch die JacobiDeterminante
(30-6)
Alle Bedingungen der Tabelle 30-2 lassen sich zu zwei Dgln. für ξ, x und ξ,y bez. η, x und η,y zusammenführen: √ a11 ϕ, x +(a12 + A)ϕ,y = 0 , √ a11 ϕ, x +(a12 − A)ϕ,y = 0 , ϕ = {ξ(x, y), η(x, y)} . Charakteristische Gleichung: √ √ a11 y (x) = a12 + A , a11 y = a12 − A oder zusammengefasst zu a11 y 2 − 2a12 y + a22 = 0 .
(30-7)
Aus den Charakteristiken ϕ1 (x, y) und ϕ2 (x, y) folgen die Transformationen C1 = ϕ1 (x, y) = ξ ,
C2 = ϕ2 (x, y) = η .
(30-8)
Beispiel. Die Dgl. 2yu, xx +2(x + y)u, xy +2xu,yy +u = 0 ist im Gebiet ohne x = y auf Normalform zu transformieren. Der Typ ist zufolge A = (x + y)2 − 4xy = (x − y)2 > 0 hyperbolisch. Die charakteristische Gleichung 2yy2 − 2(x + y)y + 2x = 2(yy − x)(y − 1) = 0 hat die Lösungen ϕ1 = y2 − x2 = C1 und ϕ2 = y − x = C2 aus der getrennten Integration der Faktoren. Daraus folgen die Transformation mitsamt der Umkehrung: ξ = y2 − x2 = ( y + x)( y − x) , 2x = (−η + ξ/η) ,
η=y−x ;
2y = η + ξ/η .
Zum Einsetzen in die anfangs gegebene Dgl. werden die partiellen Ableitungen von u[ξ(x, y), η(x, y)] benötigt. u, x = u,ξ (−2x) + u,η (−1) , u,y = u,ξ (2y) + u,η (1) , u, xx = 4x2 u,ξξ +4xu,ξη +u,ηη −2u,ξ , u,yy = 4y2 u,ξξ +4yu,ξη +u,ηη +2u,ξ , u, xy = −[4xyu,ξξ +2(x + y)u,ξη +u,ηη ] .
A107
A108
A Mathematik und Statistik / Mathematik
Tabelle 30-2. Normalformen für n = 2
Normalform u,ξη +G1 (ξ, η, u, u,ξ , u,η ) = 0 u,ξξ −u,ηη +G2 (ξ, η, u, u,ξ , u,η ) = 0 u,ξξ +G(ξ, η, u, u,ξ , u,η ) = 0 u,ξξ +u,ηη +G(ξ, η, u, u,ξ , u,η ) = 0
Bedingungen für bi j b11 = 0 , b22 = 0, b12 0 b11 + b22 = 0, b12 = 0 b11 0, b12 = b22 = 0 b11 = b22 0, b12 = 0
Tabelle 30-3. Allgemeine Lösungen für einfachste Normalformen. F, G sind stetig differenzierbare, ansonsten beliebige Funktionen
Einfachste Form u, xy = 0 u, xx = 0 u, xx +a2 u,yy = 0 u, xx −a2 u,yy = 0
Lösungen u = F(x) + G( y) u = xF( y) + G( y) u = F( y + jax) + G( y − jax) u = F( y + ax) + G( y − ax)
Mit x = x(ξ, η)
und y = y(ξ, η)
Typ Hyperbolisch Hyperbolisch Parabolisch Elliptisch
gleichartige sukzessive Behandlung des Restes zur Gesamtlösung. Beispiel. Die Dgl. u, xy +yu, x −xu,y = 0 ist mittels des Ansatzes u(x, y) = f1 (x) f2 (y) zu lösen. Einsetzen und Separation liefert x f1 / f1, x = 1 + y f2 / f2, y . Aus der Integration von x f1 / f1, x = c1 zu 2 f1 = c0 exp 2cx 1 und der Integration der rechten # 2 $ Seite zu f2 = c2 exp 2(cy1 −1) folgt die Gesamtlösung C1 2 y2 u(x, y) = C0 exp . x + 2 1 − C1
erscheint die Ausgangsdgl. in der Tat in der Normalform:
Beispiel. Man zeige, dass die speziellen Lösungen u = ( y + jax)n die Dgl. u, xx +a2 u,yy = 0 erfüllen. Mit
u,ξη +u,ξ /η − u/(4η2) = 0 .
u, xx = n(n − 1)( y + jax)n−2 (−a2 ) ,
Im Sonderfall konstanter Koeffizienten ai j werden die Charakteristiken zu Geraden √ C1 = a11 y − (a12 + A)x , √ C2 = a11 y − (a12 − A)x , (30-9) A = a212 − a11 a22 . Separationsverfahren in Form von Produktansätzen L[u(x)] = r(x) , (30-10) u(x1 , . . . , xn ) = f1 (x1 ) f2 (x2 ) · . . . · fn (xn ) für die Normalformen können auch bei Dgln. mit nichtkonstanten Koeffizienten erfolgreich sein, wenn es nur gelingt, eine Funktion fk (xk ) zusammen mit der Variablen xk zu separieren; so zum Beispiel für k = 1: F1 (x1 , f1 , f1,1 , f1,11 ) = −F(x2 , . . . , xn , f2 , . . . , fn , f2,2 , . . .) = c1 , c1 = const.
(30-11)
Beginnend mit der Lösung der gewöhnlichen Dgl. F1 (x1 , f1 , f1,1 , . . .) = c1 gelangt man über eine
u,yy = n(n − 1)( y + jax)n−2 wird in der Tat die Dgl. befriedigt.
31 Lösungen partieller Differenzialgleichungen 31.1 Spezielle Lösungen der Wellen- und Potenzialgleichung Mit der Wellengleichung ΔΦ = aΦ·· + 2bΦ· + cΦ , ()· = d()/dt ,
(31-1)
Δ Laplace-Operator; a, b, c Konstante, ΔΦ = Φ, xx +Φ,yy +Φ,zz in kartesischen Koordinaten, erfasst man einen weiten Bereich von Schwingungserscheinungen in den Ingenieurwissenschaften. Ein Produktansatz Φ(x, t) = u(x)v(t) ,
(31-2)
31 Lösungen partieller Differenzialgleichungen
getrennt für Zeit t und Ort x, ermöglicht eine Separation Δu a¨v + 2b˙v + cv = = −λ2 u v
(31-3)
Φ(x, t = 0) = u0 (x) ,
bestimmt, indem man die Orthogonalität der Eigenfunktionen aus (31-5) "l ui (x) u j (x) dx = 0 für i j
2
mit der Konstanten (−λ ). Die Integration der Zeitgleichung belässt Integrationskonstanten A, B zum Anpassen an gegebene Anfangsbedingungen. a¨v + 2b˙v + (c + λ2 )v = 0 . ⎧ −bt ⎪ ⎪ e a (A cos ωt + B sin ωt) ⎪ ⎪ ⎪ 2 ⎪ ⎪ ⎪ b λ2 + c ⎪ 2 ⎪ ⎪ − = . mit ω ⎪ ⎪ ⎪ a a ⎪ ⎪ ⎨ v(t) = ⎪ b = 0 : A cos ωt + B sin ωt ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ mit ω2 = (λ2 + c)/a . ⎪ ⎪ ⎪ ⎪ ⎪ c + λ2 ⎪ ⎪ ⎪ t . ⎪ a = 0 : A exp − ⎩ 2b
(31-4)
Die Integration der Ortsgleichung Δu + λ2 u = 0, auch Helmholtz-Gleichung genannt, hat gegebene Randbedingungen zu berücksichtigen. Für den Sonderfall nur einer unabhängig Veränderlichen x steht dafür ein weiteres Paar D, E von Integrationskonstanten zur Verfügung. Dgl. u, xx +λ2 u = 0 . Lösung u(x) = D sin λx + E cos λx . Spezielle Randbedingungen u(x = 0) = 0 , u(x = l) = 0 .
(31-8)
0
derart ausnutzt, dass man (31-7) jeweils mit uk (x) multipliziert und über dem Definitionsbereich 0 x l integriert. iπ Fi sin x = u0 (x) l i "l 2 kπ → Fk = u0 (x) sin x dx , (31-9) l l 0 iπ iπ Gi sin x = u˙ 0 (x) lα l i "l 2α kπ → Gk = u˙ 0 (x) sin x dx . kπ l 0
Die Gleichungsfolge (31-2) bis (31-9) ist typisch für alle eindimensionalen Ortsprobleme in der Zeit. Für ebene und räumliche Gebiete besteht zwar kein Mangel an Lösungsfunktionen, so zum Beispiel im Raum, u, xx +u,yy +u,zz +λ2 u = 0 , u(x, y, z) = A exp[j(±αx ± βy ± yz)] mit λ = α + β + γ , 2
(31-5) Aus u(x = 0) = 0 folgt E = 0 . Aus u(x = l) = 0 folgt 0 = D sin λl mit beliebig vielen Lösungsparametern oder Eigenwerten λi l = iπ , i = 1, 2, 3, . . . und Eigenfunktionen ui (x) = D sin(iπx/l) .
Die Gesamtlösung (31-2) setzt sich aus den Anteilen (31-4) und (31-5) zusammen; z. B. für b = c = 0: # iπ iπ $ (sin iπx/l) Fi cos t + Gi sin t , Φ(x, t) = lα lα i α2 = a .
Φ· (x, t = 0) = u˙ 0 (x) (31-7)
(31-6)
Die Konstantenpaare Fi , Gi werden durch die gegebene Anfangskonstellation
2
2
2
(31-10)
j = −1 , 2
doch gelingt es damit in aller Regel nicht, vorgegebene Randbedingungen zu erfüllen. Beispiel. Ein lösbarer Sonderfall betrifft die Helmholtz-Gleichung Δu + λ2 u = 0 in einem homogenen achsenparallelen Quader mit den Kantenlängen a x , ay , az und vorgeschriebenen Werten u = 0 auf allen 6 Oberflächen. Eigenfunktionen iπ jπ kπ ui jk = Ai jk sin x sin y sin z , ax ay az ⎛ 2 ⎞ 2 2 ⎜⎜ i j k ⎟⎟ Δui jk = π2 ⎜⎜⎝− 2 − 2 − 2 ⎟⎟⎠ u = −λ2 u , a x ay az Eigenwerte ⎛ 2 ⎞ ⎜⎜ i j2 k2 ⎟⎟⎟ 2 2⎜ ⎜ λi jk = π ⎝ 2 + 2 + 2 ⎟⎠ ; i, j, k ∈ N , a x ay az
A109
A110
A Mathematik und Statistik / Mathematik
Tabelle 31-1. Lösungsvielfalt für Δu = 0, ΔΔu = 0
Differenzialgleichung u, xx +u,yy = Δu = 0 Kartesische Koordinaten
Lösungen Alle holomorphen Funktionen u = F(x + jy) + G(x − jy), z. B. Real- und Imaginärteil von (x ± jy)k oder exp[α(x ± jy)].
1 1 u,rr + u,r + 2 u,ϕ,ϕ = 0 r r Polarkoordinaten
u = r±α ejαϕ , α beliebig. r u = A + B ln , A, B, r0 beliebig. r0 rk cos kϕ, rk sin kϕ, k = . . . , −2, −1, 0, 1, 2 . . .
u, xx +u,yy +u,zz = 0
u = [(x − ax )2 + ( y − ay )2 + (z − az )2 ]− 2 ax , ay , az beliebig. 2 2 2 x y z 1 1 1 u = exp + + + + = 0. mit ax ay az ax ay az u = A + Bx + Cy + Dz.
1 1 u,rr + u,r + 2 u,ϕϕ +u,zz = 0 r r Zylinderkoordinaten
u = exp[±j(αz + βϕ)]Zβ (jαr),
1
u, xxxx +u,yyyy +2u, xxyy = ΔΔu = 0 Kartesische Koordinaten Δ(Δu) = 0 mit 1 1 Δ() = (),rr + (),r + 2 (),ϕϕ r r Polarkoordinaten
Z: Zylinderfunktion. u = (Az + B)rα e±jαϕ . r u = (Az + B)(Cϕ + D) E + F ln . r0 Mit Δu = 0 gilt u = v; xv; yv; (x2 + y2 )v z. B. sinh αy sin αx, x cos αy sinh αx. r r r z. B. u = r2 , ln , r2 ln , ϕ, r2 ϕ, ϕ ln , r0 r0 r0
r ln
r cos ϕ, r0
⎛
z. B.
λ2min
⎞ 1 1 ⎟⎟⎟ 1 = π ⎝ 2 + 2 + 2 ⎟⎠ . a x ay az ⎜⎜⎜ 2⎜
Besonders augenfällig ist die Lösungsvielfalt für die Potenzialgleichung Δu = 0 und die Bipotenzialgleichung ΔΔu = 0 in der Ebene.
31.2 Fundamentallösungen Die Vielzahl möglicher Lösungen für lineare partielle Dgln. LP[u(x, t)] + r = 0 lässt den Wunsch nach einer charakteristischen oder Fundamentallösung aufkommen. Sie ist definiert als Antwort u(x, t, x0 , t0 ) des Systems in einem Ort x und zu einer Zeit t auf eine punktuelle Einwirkung entsprechend dem Charakter der Störung r im Raum-Zeit-Punkt x0 , t0 , auch Aufpunkt genannt. Die punktuelle Einwirkung wird
rϕ cos ϕ,
r2 ϕ ln
r , r0
rk cos kϕ.
so normiert, dass ihr Integral im Definitionsgebiet zu eins wird. LP[u(x, t)] + [δ(x − x0 )[δ(t − t0 )] = 0 im Gebiet G → u(x, t, x0 , t0 ) Fundamentallösung. δ(x − x0 ) = 0 für x x0 , δ(t − t0 ) = 0 für t t0 , " [δ(x − x0 )][δ(t − t0 )] dG = 1 ,
(31-11)
G
" v(x, t)[δ(x − x0 )][δ(t − t0 )] dG = v(x0 , t0 ) . G
Im Gegensatz zur Green’schen Funktion wird die Fundamentallösung nicht durch die Randbedingungen bestimmt, sondern allein durch die Forderung
32 Variationsrechnung
Tabelle 31-2. Fundamentallösungen einiger linearer partieller Dgln. LP[u] + δ(x − 0)δ(t − 0) = 0
Operator LP u, xx +δ(x − 0) = 0 u, xx +λ2 u + δ(x − 0) = 0 1 u, xx − u,t +δ(x − 0)δ(t − 0) = 0 k
Fundamentallösungen
u = r/2, r = x2 1 u=− sin(λr), r = x2 2λ 2 −H(t) x u= √ , exp − 4kt 4πkt H : Heaviside-Funktion H(t < 0) = 0 ,
u, xx +u,yy +δ(r − 0) = 0
u=
H(t 0) = 1
1 R ln , r 2 = x2 + y2 , 2π r
R: Konstante k1 u, xx +k2 u,yy +δ(r − 0) = 0
u=
c2 (u, xx +u,yy ) − u,tt +δ(r − 0)δ(t − 0) = 0
u=
u,tt −λ2 ΔΔu + δ(r − 0)δ(t − 0) = 0
1 R x2 y2 ln , r 2 = + . √ r k1 k2 2π k1 k2
H(ct − r) , r 2 = x2 + y2 . √ 2πc c2 t2 − r 2 "∞ sin z H(t) # r $ S , S (ξ) = − dz . u= 4πλ 4λt z ξ
u, xx +u,yy +u,zz +δ(r − 0) = 0
u=
1 , r 2 = x2 + y2 + z2 4πr
u, xx +u,yy +u,zz +λ2 u + δ(r − 0) = 0
u=
1 exp(−jλr) 4πr
k1 u, xx +k2 u,yy +k3 u,zz +δ(r − 0) = 0
u=
c2 (u, xx +u,yy +u,zz ) − u,tt +δ(r − 0)δ(t − 0) = 0
nach totaler Symmetrie bezüglich des Aufpunktes. Die Berandung des Integrationsgebietes ist durch zusätzliche Maßnahmen in die Lösungsmenge einzuführen, zum Beispiel nach dem Konzept der Randintegralmethoden, mit der numerischen Verwirklichung als Randelementmethode (BEM, Boundary Element Method). Beispiel. Für die Potenzialgleichung Δu+δ(r−r0) = 0 mit r0 = 0 in Kugelkoordinaten bestimme man die Fundamentallösung. Bei totaler Symmetrie gilt u,ϕ = u,ϑ = 0 und es verbleibt eine gewöhnliche Dgl. zunächst für r r0 = 0, 1 2 (r u,r ),r = u,rr +2u,r /r = 0 , r2 mit der Lösung u(r) = A/r. Integration der Dgl. in einem beliebig kleinen Kugelgebiet um den Aufpunkt liefert mithilfe der 3. Green’schen Formel
1 1 x2 y2 z2 · √ , r2 = + + . 4πr k1 k2 k3 k1 k2 k3 $ # r δ t− c u= 4πr
.
. Δu dV = u,n dS aus 17.3 mit u,n = u,r und dS = r2 sin ϕ dϕ dϑ eine Bestimmungsgleichung für die Konstante A. " "π "2π u,r r2 sin ϕ dϕ dϑ + 1 (Δu + δr)dV = ϕ=0 ϑ=0
= −4Aπ + 1 = 0 1 1 , u= . →A= 4π 4πr
32 Variationsrechnung 32.1 Funktionale Die Lösungsfunktionen y mancher Aufgaben der Angewandten Mathematik lassen sich durch Extremalaussagen charakterisieren mit der Fragestellung,
A111
A112
A Mathematik und Statistik / Mathematik
für welche Funktionen y(x) eines oder mehrerer Argumente x ein bestimmtes Integral J als Funktion von y einen zumindest stationären Wert annimmt. Speziell: Gesucht eine Funktion y einer Veränderlichen x. "b Gegeben: J =
F(x, y, y . . . , y(n) )dx , y(n) =
dn y . dxn
a
Gesucht: Lösungsfunktionen yE(x) , für die J stationär wird. J : Funktional. yE : Extremale des Variationsproblems.
(32-1)
Während die Extremalwerte gewöhnlicher Funktionen y(x) durch die Stelle xE mit verschwindendem Zuwachs dy|xE = 0 markiert werden, bedarf die Ableitung nach Funktionen einer zusätzlichen Idee. Durch Einbettung der Extremalen yE in eine lineare Vielfalt von Variationsfunktionen v(x) mit einem Parameter ε wird das Funktional unter anderem auch zu einer gewöhnlichen Funktion des Skalars ε, wobei die Lösungsstelle mit verschwindendem Zuwachs dJ/dε = 0 durch den besonderen Wert ε = 0 markiert wird. y(x) = yE (x) + εv(x) → J = J x, yE , v, . . . , yE(n) , v(n) , ε . y = yE
für ε = 0 .
(32-2)
Notwendige Bedingung für stationäres J: dJ = δJ = 0 . dε ε=0 δJ : Variation des Funktionals
(32-3)
δy = v : Variation der Extremalen . Die Ableitung nach ε im Punkt ε = 0 nennt man auch Variation δJ des Funktionals. Mit Hilfe partieller Ableitungen lässt sich der Integrand von δJ als Produkt mit Faktor v formulieren, "b δJ =
(2n)
vG x, yE , . . . , yE
dx + Randterme = 0 ,
a
(32-4)
das bei beliebiger Variationsfunktion v nur verschwindet für (32-5) G x, yE , . . . , y(2n) =0 E (Euler’sche Dgl. der Ordnung 2n des Variationsproblems).
Damit erhält man eine Bestimmungsgleichung für die Extremale yE (x), die im Zusammenhang mit der Variationsrechnung speziell Euler’sche Dgl. genannt wird. Im Sonderfall n = 1 erhält man über das "b Funktional J = F(x, y, y ) dx , die a
Einbettung y(x) = yE (x) + εv(x), die Kettenregel dF ∂F dy ∂F dy = · + = F,y v + F,y v (32-6) · dε ∂y dε ∂y dε und durch partielle Integration dJ = dε
"b
d F,y − F,y v dx + [F,y v]ba = 0 dx
a
die sogenannte Euler-Lagrange’sche Gleichung des Variationsproblems für die Extremale yE (x): d =0. (32-7) F,y − F,y dx ε=0 In der Regel ist (32-7) eine Dgl. 2. Ordnung für y(x). In Sonderfällen sind sog. erste Integrale angebbar: F = F(x, y ) : F,y = const . d F = F(y, y ) : y F,y − F,y dx d (F − y F,y ) = 0 = dx → F − y F,y = const .
(32-8)
(32-9)
Beispiel. In einer vertikalen Ebene im Schwerefeld liege ein Punkt P um ein Stück yP = h unter dem Ursprung O und um xP = a horizontal gegenüber O versetzt. Gesucht ist die Kurve y(x) minimaler Fallzeit T von O nach P. Dem Funktional J entspricht
32 Variationsrechnung
hier die Zeitspanne T =
.P
dt =
.
ds/v mit der Bo-
0
genlänge ds2 = dx2 + dy2 und der Bahngeschwindigkeit v = 2gy nach den Regeln der Mechanik, g ist die Erdbeschleunigung; insgesamt ergibt sich ein Minimalfunktional vom Typ (32-6) mit dem 1. Integral (32-9). 8 "P 1 + y 2 . F dx → Minimum , F = T= 2gy 0
Euler-Lagrange’sche Bestimmungsgleichung: 8 1 + yE2 y = yE E + c1 yE yE 1 + yE2 oder yE 1 + yE2 = c22 . Bei der praktischen Rechnung wird der Index E fortgelassen. Die Lösung der Dgl. ist eine Zykloide als Kurve kürzester Fallzeit, auch Brachystochrone genannt. Quadratische Funktionale (hier für den häufigen Fall n = 2 formuliert) führen auf lineare Dgln. mit Randtermen, wobei jeder Summand für sich verschwinden muss. Gesucht: Jextr von 1 J= 2
"b
f2 y2 + f1 y2 + f0 y2 + 2r1 y + r0 dx .
a
Notwendige Bedingung für Extremale yE : dJ =0 δJ = dε ε=0 "b 6 7 6 7 = f2 yE − f1 yE + f0 yE + r1 vdx (32-10) a
6
7
+ f2 yE v − f2 yE
Wenn der Faktor R[yE ] die Randbedingungen des Randwertproblems darstellt, sind die Randwerte S [v] der Variationsfunktion unbeschränkt. Anderenfalls ist der Extremalpunkt Jextr nur extremal bezüglich einer ! durch S [v] = 0 beschränkten Variationsvielfalt. Die Aussage (32-11) ist von wesentlicher Bedeutung für die klassischen Finite-Element-Methoden. Ansatzfunktionen zur Approximation des Funktionals müssen lediglich die sogenannten wesentlichen Randbedingungen in y(0) bis einschließlich y(n−1) erfüllen (sog. zulässige Ansatzfunktionen). Die restlichen Randbedingungen in y(n) bis y(2n−1) sind implizit in der Variationsformulierung enthalten; man spricht deshalb auch von natürlichen Randbedingungen. Ansatzfunktionen, die alle Randbedingungen (wesentliche und restliche) erfüllen, heißen Vergleichsfunktionen. Bei Variationsaufgaben "b J= a
mit festen Grenzen werden die zwei Konstanten bei der Integration der Dgl. d F,y = 0 dx durch je eine Bedingung pro Rand bestimmt. Bei Variationsaufgaben mit noch freien Grenzen sind diese in den Variationsprozess einzubeziehen und liefern entsprechende Bestimmungsgleichungen für die Integrationskonstanten. Variation bei fester unterer Grenze und freier oberer Grenze: "x1 F(x, y, y ) dx → Extremum J= F,y −
x0
b v + f1 yE v .
mit δx0 = 0
a
Falls R[ yE ] = 0 : R natürliche Randbedingung mit S [v] beliebig , Falls R[ yE ] 0 : S wesentliche Randbedingung mit S [v] = 0 .
und δx1 0 .
Notwendige Extremalbedingungen:
Randterme allgemein: [R[yE ] · S [v]]ba .
!
F(x, y, y ) dx → Extremum
(32-11)
d F,y = 0 dx und [F − y F,y ] x1 δx1 + [F,y ] x1 δy1 = 0 . (32-12) F,y −
Soll die Variation des Endpunktes (x1 , y1 ) längs einer vorgeschriebenen Kurve y1 = f (x1 ) verlaufen, so gilt die Transversalitätsbedingung
A113
A114
A Mathematik und Statistik / Mathematik
[F + ( f − y )F,y ] x1 = 0 und
F,y =
d F,y . dx (32-13)
Funktionale mit mehreren gesuchten Extremalen yE1 (x) bis yEn (x) werden durch voneinander unabhängige Variationen y j (x) = yE j (x) + ε j v j (x) ,
Gegeben: J=
"b Funktional
J=
F(x, y, y ) dx → Extremum .
a
(32-18)
Verknüpft man Funktional und Nebenbedingungen mittels Lagrange’scher Multiplikatoren λ1 bis λm , so ist zunächst deren Konstanz beweisbar und es verbleibt die Variation einer Hilfsfunktion F ∗ . λ Konstantenspalte .
Notwendige Bedingung für Jextr F ∗ ,y j −
Notwendige Bedingungen: d F,y = 0 , dx j
j = 1, 2, . . . , n .
Nebenbedingungen gk (x, y, y ) = 0 , k = 1, . . . , m. "b J=
F(x, y, y ) dx → Extremum ,
a
yT = [ y1 (x), . . . , yn (x)] .
F ∗ = F + λT g .
j = 1, 2, . . . , n ,
(32-19)
k = 1, 2, . . . , m .
a
Insgesamt n + m Gleichungen für n-Funktionen y j (x) und m-Konstante λk . Funktionale mit mehrdimensionalen Integralen zum Beispiel einer gesuchten Extremalen uE (x, y, z) führen auf partielle Dgln.: Gegeben: "b F(x, y, z, u, u, x , u,y , u,z ) dV → Extremum
J= a
Einbettung der Extremalen uE : u(x, y, z) = uE (x, y, z) + εv(x, y, z) .
Notwendige Bedingungen: d F ∗ ,y j − F ∗ ,yj = 0 , j = 1, 2, . . . , n , dx k = 1, 2, . . . , m .
Gk dx = ck ,
(32-16)
Verknüpft man Funktional und Nebenbedingungen mittels Lagrange’scher Multiplikatoren λ1 bis λm , so ist die Hilfsfunktion F ∗ wie üblich zu variieren.
gk (x, y, y ) = 0 ,
d ∗ F ,yj = 0 , dx
"b (32-15)
Variationsproblemen mit Nebenbedingungen ordnet man zwei Typen zu. Erster Typ:
a
F ∗ = F + λT G ,
a
Funktional
Gk (x, y, y ) dx = ck ,
k = 1, . . . , m .
F(x, y, y ) dx → Extremum ,
yT = [ y1 (x), . . . , yn (x)] .
F,y j −
Nebenbedingung
j = 1, . . . , n , (32-14)
zu gewöhnlichen Funktionen in ε j , deren lokaler Zuwachs dJ im Extremalpunkt mit ε j = 0 verschwinden muss. "b
"b
Notwendige Bedingung: (32-17)
Ingesamt n + m Gleichungen für n Funktionen y j (x) und m Funktionen λk (x). Der zweite Typ, auch isoperimetrisches Problem genannt, wird durch Nebenbedingungen in Form konstant vorgegebener anderer Funktionale charakterisiert.
δJ =
"b dJ = 0 = E(u)v dV + Randterm dε ε=0 a
mit der Euler’schen Dgl. E(u) = F,u −
∂ ∂ ∂ F,u,x − F,u,y − F,u,z = 0 . ∂x ∂y ∂z (32-20)
32 Variationsrechnung
Die Potenzialgleichung in ebenen kartesischen Koordinaten mit der Feldgleichung u, xx +u,yy = r0 (x, y)
(32-21)
s Bogenkoordinate des Randes , lässt sich als notwendige Bedingung einer zugeordneten Variationsaufgabe formulieren mit " J= u2 , x +u2 ,y +2r0 u dx dy G
+
" r1 u2 − 2r2 u ds → Extremum , (32-22) R
G : endliches Gebiet , R : endlicher Rand . Die Bipotenzialgleichung bestehend aus Feldgleichung
und speziellen Randbedingungen u,n = 0
längs aller Ränder
(32-23)
lässt sich als notwendige Bedingung einer zugeordneten Variationsaufgabe formulieren mit " J= u2 , xx +u2 ,yy +2u2 , xy −2r0 u dx dy G
→ Extremum .
(32-24)
Für allgemeinere Randbedingungen ist J entsprechend zu ergänzen. Rayleigh-Quotient ist ein Extremalfunktional in Quotientenform. "b R = J1 /J2 ,
Jk =
Bei quadratischen Funktionalen Jk nach (32-10) erweist sich der stationäre Wert Rstat als Eigenwert einer zugeordneten homogenen Variationsgleichung.
32.2 Optimierung Bei der Bewertung dynamischer Prozesse liegt es nahe, die Systemenergie zu minimieren. Enthält der Zustandsvektor x die Zustandsgrößen und deren zeitliche Ableitungen, ist die quadratische Form xT x ein Energiemaß. Eine Variante xT Qx mit symmetrischer positiv definiter Matrix Q erlaubt eine Gewichtung der einzelnen Energieanteile. Ein Prozessablauf x(t) mit linearer Zustandsgleichung dx/dt = x˙ = Ax und der Forderung nach minimaler Prozessenergie wird bestimmt durch die Ljapunow-Gleichung. Energieminimierung mit der Prozessgleichung
u, xxxx +2u, xxyy +u,yyyy = r0 (x, y)
u=0,
δR = δJ1 /J2 − J1 /J22 δJ2 = 0 , 0 = (δJ1 − Rstat δJ2 )/J2 , J2 0 .
und den Randbedingungen u,n +r1 (s)u(s) = r2 (s) ; u,n Normalableitung am Rand ,
Notwendige Bedingung
Fk (x, y, y , . . . , y(n) ) dx .
a
x˙ = Ax als Nebenbedingung . "∞ "∞ 1 T x Qx dt + λT ( Ax − x˙ ) dt J= 2 0
0
→ Minimum .
(32-25)
δJ = 0 mit Q = Q führt auf x x˙ A O = ˙ . −Q −AT λ λ T
(32-26)
Der Ansatz λ = Px überführt (32-26) in die Ljapunow-Gleichung ˙ + Q + AT P + PA = O . P
(32-27)
Bei Systemen mit Stellgrößen u stellt sich die Frage nach deren optimaler Dimensionierung, die ebenfalls über eine Bilanz aus Systemenergie xT Qx und Stellenergie uT Ru beantwortet werden kann.
Gesucht: Lösungsfunktion yE (x), für die R stationär wird; R(yE ) = Rstat .
Riccati-Gleichung. Energieminimierung mit der Prozessgleichung x˙ = Ax + Bu als Nebenbedingung.
A115
A116
A Mathematik und Statistik / Mathematik
1 J= 2
"∞ (xT Qx + uT Ru) dt 0
"∞ +
λT ( Ax + Bu − x˙ ) dt → Minimum . (32-28) 0
δJ = 0
mit Q = QT , R = RT −1
führt auf
u = −R B λ und x˙ A −BR−1 BT x = ˙ . λ λ −Q −AT T
(32-29) (32-30)
Der Ansatz λ = Px überführt (32-30) in die RiccatiGleichung ˙ + Q + AT P + PA − PBR−1 BT P = O . P
(32-31)
Eine allgemeinere Optimierung aktiver Systeme mit der Systemgleichung x˙ = f (x, u, t) , der Extremalforderung "t1
H(x, uopt , p, t) = Extremum von H(x, u, p, t) . (32-35) Dieses Prinzip gilt auch für Systeme mit Stellgrößenbeschränkungen. Beispiel. Ein lineares System x˙ = Ax + bu mit den Randbedingungen x(t0 = 0) = o und 2x1 + x2 − 2 = 0 zum Endzeitpunkt t1 = 1 soll so gesteuert werden, .2 dass die Stellenergie 12 u2 dt minimal wird. 0
Gegeben: 0 1 1 x2 + u A= , b= , also f = , 0 0 1 u 1 G = u2 , r1 = 2x1 + x2 − 2 . 2 Hamilton-Funktion
G(x, u, t) dt → Extremum
1 H = p0 u2 + p1 (x2 + u) + p2 u . 2
t0
und den Randbedingungen x(t0 ) − x0 = o , [r1 (x, t)]t=t1 = 0
(32-32)
bis [rα (x, t)]t=t1 = 0 gelingt über die Hamilton-Funktion n pi fi , H = p0 G +
(32-33)
i=1
pi (t) adjungierte Funktionen (Lagrange-Multiplikatoren). .t1 Die Variation δ H dt = 0 über der Prozessstrecke t0
führt auf Bestimmungsgleichungen für x und p, x˙ i = ∂H/∂pi
plus Randbedingungen , n p j ∂ f j /∂xi p˙i = −p0 ∂G/∂xi − j=1
und
mit noch freien Parametern λ, die aus den Randbedingungen für x zum Zeitpunkt t1 folgen. Nach dem Pontrjagin’schen Prinzip erhält man schließlich die optimale Steuerung uopt derart, dass die HamiltonFunktion damit extremal wird.
⎤ ⎡ α ⎥⎥⎥ ⎢⎢⎢ ⎢ pi (t1 ) = − ⎢⎢⎣ λ j ∂r j /∂xi ⎥⎥⎥⎦ j=1
t1
Die Integration des adjungierten Systems p˙ = −AT p, p1 = 0, p˙ 2 = −p1 , mit den Endbedingungen p1 (t1 = 1) = −λ1 2, p2 (t1 = 1) = −λ1 belässt zunächst den Multiplikator λ1 : p1 = −2λ1 , p2 = λ1 (2t − 3). Partielles Ableiten der Hamilton-Funktion nach u gibt eine Bestimmungsgleichung p0 u+(p1 +p2 ) = 0 mit einer willkürlichen Skalierungsmöglichkeit für p0 ; üblich ist die Wahl p0 = −1 mit der Lösung u = p1 + p2 = λ1 (2t − 5). Der Multiplikator λ1 wird durch die Endbedingung für x bestimmt, was die vorherige Lösung der Systemgleichung erfordert. Aus x˙1 = x2 + u und x2 = u erhält man zunächst x2 = λ1 (t2 − 5t) und x1 = λ1 (2t3 − 9t2 − 30t)/6 und schließlich über 2x1 + x2 = 2 zum Zeitpunkt t1 = 1 den Parameter λ1 = −6/49 mit der endgültigen Stellgrößenfunktion u = −6(2t − 5)/49 und dem Endpunkt xT (t1 = 1) = [37, 24]/49.
32.3 Lineare Optimierung (32-34)
Die Suche nach Extremwerten linearer Funktionen z = c1 x1 + . . . + cn xn = cT x unter Beachtung ge-
33 Lineare Gleichungssysteme
wisser Nebenbedingungen in Form von linearen Ungleichungen y1 (x) 0 bis ym (x) 0 ist eine Aufgabe der linearen Optimierung, die nicht mithilfe der Differenzialrechnung gelöst werden kann, da die Extremalwerte von z infolge des linearen Charakters nur auf dem Rand des Definitionsgebietes liegen können. Bei realen Problemen sind die Variablen x stets positive Größen. Ix o n Ungleichungen y = Ax + b o m Ungleichungen z = cT x → Extremum: Zielfunktion
V1 3 8
V2 8 4
nach V1 nach V2 nach V3 nach V1 nach V2 nach V3
0 0 −x1 +24 0 −x1 +12 0 −x2 +18 0 x1 +x2 −4 0 −3x1 + 6x2 + 360 → Minimum x1
y1 = y2 = y3 = y4 = z=
x2 −x2
(32-36)
Die Variablen x und y (Schlupfvariable) sind formal gleichberechtigt und werden in der Tat beim bewährten Simplexverfahren so ausgetauscht, dass die Zielfunktion stetig gegen ihr Extremum strebt. Grundlage dieses Verfahrens ist die Erkenntnis, dass die Menge der zulässigen Lösungen ein von m-Hyperebenen begrenztes Polyeder P im Rn darstellt. Die lineare Zielfunktion nimmt ihr Extremum in mindestens einer Ecke von P an. Im Sonderfall n = 2 ist der graphische Lösungsweg durchaus konkurrenzfähig. Beispiel. Drei Verkaufsstellen, V1 (12), V2 (18), V3 (20), sollen von zwei Depots, D1 (24), D2 (26), mit Paletten beliefert werden, wobei in Klammern die erwünschten bez. abgebbaren Stückzahlen notiert sind. Die Entfernung in Kilometern zwischen den Depots und Verkaufsstellen ist in einer Tabelle gegeben:
D1 D2
D1 D1 D1 D2 D2 D2
V3 10 12
Gesucht ist eine Verteilung derartig, dass die Summe aller Lieferfahrtstrecken von Di nach V j minimal wird. Die insgesamt 6 gesuchten Stückzahlen lassen sich auf zwei unabhängig Veränderliche reduzieren, wobei die Zuordnung von x1 , x2 zu D1 V1 , D1 V2 willkürlich und ohne Einfluss auf das Extremalergebnis ist. Die Zielfunktion folgt aus den Stückzahlen x1 , x2 , y1 bis y4 multipliziert mit den jeweiligen Entfernungen zu z = 3x1 + 8x2 + 10(−x1 − x2 + 24) + 8(−x1 + 12) + 4(−x2 + 18) + 12(−4 + x1 + x2 ). Im Bild 32-1 umschreiben die Bedingungen xi = 0 und yi = 0 ein zulässiges Lösungsgebiet. Eine spezielle Zielgerade wird für einen zeichentechnisch günstigen Wert (hier
Bild 32-1. Zulässiges Lösungsgebiet mit Minimalpunkt E
z = 360) eingetragen; alle Zielgeraden sind parallel zueinander, wobei die Richtung zunehmender zWerte durch einen Pfeil gekennzeichnet ist. Im Punkt E mit x1 = 12, x2 = 0 findet man den Minimalwert mit zMin = −36 + 360 = 324 km; die dazugehörigen weiteren Stückzahlen sind y1 = 12, y2 = 0, y3 = 18, y4 = 8.
33 Lineare Gleichungssysteme 33.1 Gestaffelte Systeme Die Lösung von n linearen Gleichungen mit n Unbekannten x1 bis xn geht zweckmäßig von einer Matrixdarstellung aus: Ax = r , ⎡ 1⎤ ⎡ ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎢ a11 ⎢⎢⎢ 2 ⎥⎥⎥ ⎢⎢⎢ ⎢⎢ a ⎥⎥ ⎢⎢ a21 A = ⎢⎢⎢⎢⎢ . ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢⎢ . ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎢ .. ⎢⎣ ⎥⎦ ⎢⎣ an an1
a12 a22 an2
⎤ . . . a1n ⎥⎥⎥ ⎥ . . . a2n ⎥⎥⎥⎥ ⎥ .. ⎥⎥⎥⎥ , . ⎥⎥⎥⎥ ⎦ . . . ann
A117
A118
A Mathematik und Statistik / Mathematik
⎡ ⎤ ⎢⎢⎢ r1 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢ r2 ⎥⎥ r = ⎢⎢⎢⎢⎢ . ⎥⎥⎥⎥⎥ , ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎣ ⎥⎦ rn
⎡ ⎤ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢ x2 ⎥⎥ x = ⎢⎢⎢⎢⎢ . ⎥⎥⎥⎥⎥ . ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎣ ⎥⎦ xn
(33-1)
Das Prinzip aller Verfahren besteht darin, das vollbesetzte Koeffizientenschema A durch Transformationen in eine gestaffelte Matrix A zu überführen derart, dass es eine skalare Gleichung (im folgenden Beispiel die 3.) für nur eine Unbekannte (x2 ) gibt, eine zweite Gleichung (im Beispiel die 1.) mit einer weiteren Unbekannten (x4 ) und so fort. Durch Umsortieren der Zeilen und Spalten von A tritt die Staffelungsstruktur besonders deutlich hervor, wobei untere Dreiecksform L (L steht für lower) und obere Dreiecksform U (U steht für upper) gleichermaßen geeignet sind. Für n = 4 gilt ⎡ ⎢⎢⎢ l11 ⎢⎢⎢ ⎢ l21 l22 L = ⎢⎢⎢⎢ ⎢⎢⎢ l31 l32 l33 ⎣ l41 l42 l43 ⎡ ⎢⎢⎢ u11 u12 ⎢⎢⎢ u22 ⎢ U = ⎢⎢⎢⎢ ⎢⎢⎢ ⎣ O
⎤ O ⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ . ⎥⎥⎥ ⎦ l44 u13 u23 u33
⎤ u14 ⎥⎥ ⎥⎥ u24 ⎥⎥⎥⎥ ⎥⎥ . u34 ⎥⎥⎥⎥ ⎦ u44
(33-2)
Beispiel. Gestaffeltes Gleichungssystem, n = 4. ⎡ ⎢⎢⎢ 0 ⎢⎢⎢ ⎢⎢⎢ 1 ⎢⎢⎢ ⎢⎢⎣ 0 2 3. 1. 2. 4.
3 −1 2 1
Zeile liefert Zeile liefert Zeile liefert Zeile liefert
⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎤ 0 5 ⎥⎥ ⎢⎢ x1 ⎥⎥ ⎢⎢ 8 ⎥⎥ ⎢⎢ r1 ⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ 0 2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ r2 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ = ⎢⎢ ⎥⎥ = ⎢⎢ ⎥⎥ . 0 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x3 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ r3 ⎥⎥⎥⎥ ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦ r4 3 −1 x4 4 x2 x4 x1 x3
=1, = (8 − 3x1 )/5 = 1 , = (x2 − 2x4 ) = −1 , = (−2x1 − x2 + x4 + 4)/3 = 2 .
⎡ ⎢⎢⎢ 2 ⎢⎢⎢ ⎢1 Zeilentausch: ⎢⎢⎢⎢ ⎢⎢⎢ 0 ⎣ 0
1 −1 3 2
3 0 0 0
⎤ ⎡ ⎤ −1 ⎥⎥ ⎢⎢⎢ r4 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ r 2 ⎥⎥⎥ ⎥⎥⎥ x = ⎢⎢⎢⎢⎢ 2 ⎥⎥⎥⎥⎥ ⎢⎢⎢ r1 ⎥⎥⎥ 5 ⎥⎥⎥ ⎦ ⎣ ⎦ r3 0
⎡ ⎢⎢⎢ 3 ⎢ Spaltentausch ⎢⎢⎢⎢ 0 ⎢⎢⎢ ⎢⎢⎢ 0 gibt U : ⎣ 0 ⎡ 0 ⎢⎢⎢ ⎢⎢⎢ ⎢0 Zeilentausch: ⎢⎢⎢⎢ ⎢⎢⎢ 1 ⎣ 2 ⎡ ⎢⎢⎢ 2 ⎢ Spaltentausch ⎢⎢⎢⎢ 3 ⎢⎢⎢ ⎢⎢⎢ −1 gibt L : ⎣ 1
2 −1 1 2 0 5 0 0 2 0 3 0 −1 0 1 3 0 0 5 0 2 1 −1 2
⎤⎡ ⎤ ⎡ ⎤ 1 ⎥⎥ ⎢⎢ x3 ⎥⎥ ⎢⎢ 4 ⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ −1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ = ⎢⎢ ⎥⎥ ; 3 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x4 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 8 ⎥⎥⎥⎥ ⎦⎣ ⎦ ⎣ ⎦ 2 2 x2 ⎤ ⎡ ⎤ 0 ⎥⎥ r ⎢⎢⎢⎢ 3 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ r ⎥⎥ 5 ⎥⎥⎥⎥ ⎥⎥⎥ x = ⎢⎢⎢⎢⎢ 1 ⎥⎥⎥⎥⎥ ⎢⎢⎢ r2 ⎥⎥⎥ 2 ⎥⎥⎥ ⎦ ⎣ ⎦ r4 −1 ⎤⎡ ⎤ ⎡ ⎤ 0 ⎥⎥ ⎢⎢ x2 ⎥⎥ ⎢⎢ 2 ⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x4 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 8 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ = ⎢⎢ ⎥⎥ . 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ x1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎦⎣ ⎦ ⎣ ⎦ 4 3 x3
33.2 Gaußverwandte Verfahren Bei gegebener Matrix A (1) erhält man die 1. Spalte der U-Matrix, indem man in einem 1. Gaußschritt das (−a j1 /a11 )-fache der 1. Zeile a1 zur j-ten Zeile a j ( j = 2 bis n) hinzufügt. Den Fortschritt der Rechnung für n = 4 zeigt Tabelle 33-1. Die Transformationsmatrizen Gi in Tabelle 33-1 zeichnen sich durch analytisch angebbare Inverse aus, Gi = I − q i e i ,
i G−1 i = I + qi e ,
(33-3)
da die Produkte qTi ei mit der i-ten Einheitsspalte null sind. Die Transformationskette von A bis U lässt sich demnach durch sukzessive Linksmultiplikation mit G−1 k nach A auflösen, wobei automatisch eine Faktorisierung A = LU auftritt. Gauß-Transformation von Ax = r: Gn . . . G1 A = Gn . . . G1 r , Gn . . . G1 A = U ,
U obere Dreiecksmatrix . (33-4)
Auflösen nach A ergibt die Gauß-Banachiewicz-Zerlegung: −1 −1 A = G−1 1 G2 . . . Gn U = LU ,
L= I+
n−1
qk ek ,
L untere Dreiecksmatrix .
k=1
(33-5)
33 Lineare Gleichungssysteme
Tabelle 33-1. Gauß-Transformation für n = 4
Anfangsmatrix A
Nach 1. Gaußschritt
Nach 2. Gaußschritt
Nach 3. Gaußschritt
Aktuelle Koeffizientenmatrix ⎡ 1⎤ ⎡ ⎤ ⎢⎢⎢⎢ a ⎥⎥⎥⎥ ⎢⎢ a11 . . . a14 ⎥⎥ ⎥ ⎢⎢⎢ a2 ⎥⎥⎥ ⎢⎢⎢ ⎢. .. ⎥⎥⎥⎥⎥ A = ⎢⎢⎢⎢⎢ 3 ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢ .. ⎥⎥⎥ . . ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎣ ⎥⎦ ⎣ 4⎦ a41 . . . a44 a ⎡ 1 ⎤ ⎡ ⎤ ⎢⎢⎢⎢ a ⎥⎥⎥⎥ ⎢⎢⎢⎢ a11 a12 a13 a14 ⎥⎥⎥⎥ ⎢⎢⎢ a2 − (a /a )a1 ⎥⎥⎥ ⎢⎢⎢ 0 b11 b12 b13 ⎥⎥⎥⎥⎥ 21 11 ⎢⎢⎢ ⎥ ⎢ ⎥ = G1 A mit G1 = I − q1 e1 . ⎢⎢⎢ a3 − (a /a )a1 ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢⎢ 0 b21 b22 b23 ⎥⎥⎥⎥⎥ 31 11 ⎢⎣⎢ ⎥⎦⎥ ⎢⎣⎢ ⎦ a4 − (a41 /a11 )a1 0 b31 b32 b33 a21 a31 a41 qT1 = 0 , e1 = [1 0 0 0] . a11 a11 a11 ⎡ 1 ⎤ ⎡ ⎤ ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎢ a11 a12 a13 a14 ⎥⎥⎥ ⎢ ⎢⎢⎢ ⎥ ⎥ ⎥⎥⎥ ⎢⎢⎢ 0 1 b11 b12 b13 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 b ⎥⎥⎥ = ⎢⎢⎢ ⎥ = G2 G1 A mit G2 = I − q2 e2 . ⎢⎢⎢ 0 b2 − (b /b )b1 ⎥⎥⎥ ⎢⎢⎢ 0 0 c11 c12 ⎥⎥⎥⎥⎥ 21 11 ⎢⎣⎢ ⎥⎦⎥ ⎢⎣⎢ ⎦ 0 b3 − (b31 /b11 )b1 0 0 c21 c22 b21 b31 qT2 = 0 0 , e2 = [0 1 0 0] . b11 b11 ⎡ 1 ⎤ ⎡ ⎤ ⎢⎢⎢ a ⎥⎥⎥ ⎢⎢⎢ a11 a12 a13 a14 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥ 1 b11 b12 b13 ⎥⎥⎥⎥⎥ ⎢⎢⎢ 0 b ⎥⎥⎥ ⎢⎢⎢ 0 ⎢⎢⎢ ⎥⎥⎥ = ⎢⎢⎢ ⎥ = G3 G2 G1 A mit G3 = I − q3 e3 . 1 0 c11 c12 ⎥⎥⎥⎥⎥ ⎢⎢⎢ 0 0 c ⎥⎥⎥ ⎢⎢⎢ 0 ⎣ ⎦ ⎣ ⎦ 0 0 c2 − (c21 /c11 )c1 0 0 0 d11 4 5 c21 qT3 = 0 0 0 , e3 = [0 0 1 0] . c11
Die Determinante von A ist das Produkt der Determinanten von L und U: n
A = LU → A = det A =
lkk ukk .
(33-6)
k=1
Das Wissen von der Existenz der Zerlegung von A hat zu verschiedenen direkten numerischen Zugängen zu L und U geführt. A = LDU mit lkk = ukk = 1 und D = diag (dkk ) .
n
A = LDLT → A =
dkk . k=1
Falls alle dkk > 0, ist A positiv definit. (33-7)
Doolittle-Algorithmus: Abwechselndes Berechnen der Zeilen uk und Spalten lk . Crout-Zerlegung: A = LU mit ukk = 1 . Symmetrische Matrizen A = AT lassen sich symmetrisch zerlegen: A = LDLT mit lkk = 1 und D = diag(dkk ) . (33-8) Cholesky-Zerlegung : A = LLT .
Die Cholesky-Zerlegung (33-9) erfordert Wurzelziehen und gelingt ohne Modifikation nur bei positiv definiten Matrizen. Die Variante (33-8) vermeidet beide Nachteile. Determinantenberechnung für A = AT :
(33-9)
n
A = LLT → A =
l2kk .
(33-10)
k=1
Die Zerlegung A = LDLT erfolgt zeilenweise, beginnend mit d11 , l12 bis l1n , d22 , l23 bis l2n und so fort. Die Zerlegung A = LLT mit lkk anstelle von dkk geschieht ebenso mit der ersten typischen Wurzel √ l11 = a11 . Beispiel. Für die Matrix A = AT bestimme man die Zerlegung A = LDLT und prüfe die Definitheit. Für
A119
A120
A Mathematik und Statistik / Mathematik
eine Matrix B = BT wird die Cholesky-Zerlegung gesucht. ⎡ ⎤ ⎢⎢⎢ 2 2 4 ⎥⎥⎥ ⎢⎢⎢ ⎥ A = ⎢⎢⎢ 2 0 1 ⎥⎥⎥⎥⎥ , ⎣ ⎦ 4 1 3 ⎡ ⎤⎡ ⎤⎡ ⎤ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎢ 2 ⎥⎥⎥ ⎢⎢⎢ 1 1 2 ⎥⎥⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎥⎥ ⎢⎢⎢ −2 ⎥⎥⎥ ⎢⎢⎢ 1 1,5 ⎥⎥⎥⎥ . LDLT = ⎢⎢⎢⎢⎢ 1 1 ⎥ ⎢ ⎥⎥⎦ ⎢⎢⎣ ⎥⎥⎦ ⎥ ⎢ ⎣ ⎦⎣ 2 1,5 1 −0,5 1 Infolge verschiedener Vorzeichen der Elemente dkk von D ist A indefinit. ⎡ √ ⎡ ⎤ ⎤ ⎢⎢⎢ ⎢⎢⎢ 2 2 4 ⎥⎥⎥ ⎥⎥⎥ 2 √ ⎢⎢⎢ ⎢⎢ ⎥⎥⎥ ⎥⎥ ⎢ ⎥ T B = ⎢⎢⎢ 2 3 3 ⎥⎥⎥ = LL , L = ⎢⎢⎢ 2 1 ⎥ . √ ⎥⎥⎦ ⎣ √ ⎣ ⎦ 4 3 12 2 2 −1 3 Infolge der Möglichkeit der Cholesky-Zerlegung im Reellen ist B positiv definit. Die unsymmetrische Koeffizientenmatrix A AT einer Gleichung Ax = r wird durch Linksmultiplikation von links mit AT symmetrisch: AT Ax = AT r ,
A = AT .
LDLT x = r Ly = r ,
A AT .
Ay = r mit A = LDU, r, y .
(33-12)
Lösung x für Bx = r mit B = A − bcT . cT y h , mit Hilfsspalte (33-13) 1 − cT h h aus Ah = b (Zerlegung von A siehe oben) . x= y+
Gleichung (33-12) kann bei bekannter Matrix A−1 auch zur expliziten Darstellung der Inversen von B = A − bcT genutzt werden: B = A − bcT .
wird aufgeteilt in „Vorwärts“-Berechnung der Hilfsgrößen y1 bis yn , und T −1 L x = D y , „Rückwärts“-Berechnung der Unbekannten xn bis x1 . Ax = r ,
Gegeben:
Gesucht:
S = AT A = S T .
Der Aufwand zur Berechnung von S = AT A und die Konditionsverschlechterung von S gegenüber A sprechen allerdings gegen diese Maßnahme. Die Zerlegungen A = LDU oder A = LDLT für A = AT führen bei der Lösung von Gleichungssystemen auf natürliche Art zu einer Strategie der Vorwärts- und Rückwärtselimination: Ax = r ,
le 33-1 und damit auch in (33-7) und (33-8) eine besondere Bedeutung zu. Sie sind „Drehpunkte“ der Elimination oder auch die sogenannten Pivotelemente. Sind sie numerisch null, bricht die Rechnung zusammen; dabei ist zu beachten, dass der wahre Wert null in der Regel nur sehr unvollkommen durch die Numerik wiedergegeben wird. Zugunsten der numerischen Stabilität sollten die Beträge der Pivotelemente möglichst groß sein. Im 1. Gaußschritt wählt man deshalb das betragsgrößte Element aller ai j zum Drehpunkt, im 2. Gaußschritt das betragsgrößte bi j und so fort. Zerlegung modifizierter Matrizen. Im Zuge des Entwurfs eines technischen Systems mit der algebraischen Beschreibung Ay = r ist die Änderung des Systems, die zu einer neuen Matrix B und unveränderter rechter Seite führt, ein Standardproblem. Unterscheiden sich A und B nur in einer Dyade bcT , geht man wie folgt vor.
(33-11)
LDUx = r Ly = r ,
wird aufgeteilt in „Vorwärts“-Berechnung y1 bis yn , und Ux = D−1 y , „Rückwärts“-Berechnung xn bis x1 . Pivotstrategien. Die schrittweise Überführung einer Matrix A in die faktorisierte Form weist den Hauptdiagonalelementen akk , bkk , ckk und so fort in Tabel-
B−1 = A−1 +
A−1 bcT A−1 . (33-14) 1 − cT A−1 b
Die ist die in der Strukturmechanik wohlbekannte Morrison-Formel. Beispiel. Das Problem Ay = r mit ⎡ ⎤ ⎡ ⎤ ⎢⎢⎢ 1 1 1 0 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢⎢ 1 2 0 1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 1 1 ⎥⎥ ⎥⎥⎥ , L = ⎢⎢⎢ A = LLT = ⎢⎢⎢⎢ ⎢⎢⎢ 1 −1 1 ⎥⎥⎥⎥⎥ , ⎢⎢⎢ 1 0 3 1 ⎥⎥⎥⎥ ⎢⎣ ⎥⎦ ⎣ ⎦ 0 1 1 6 0 1 2 1 ⎡ ⎤ ⎡ ⎤ ⎢⎢⎢ 2 ⎥⎥⎥ ⎢⎢⎢ 3 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ 1 ⎢ ⎥ ⎢ 3⎥ y = ⎢⎢⎢⎢ ⎥⎥⎥⎥ , r = ⎢⎢⎢⎢ ⎥⎥⎥⎥ , ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎣ ⎦ ⎣ ⎦ −1 −5
33 Lineare Gleichungssysteme
ist gegeben, ebenso die Störung mit cT = bT = 0 1 0 −1 . Gesucht ist die Lösung x der modifizierten Aufgabe ( A − bbT )x = r. Aus Vorwärtselimination Lz = b folgt z und aus Rückwärtselimination LT h = z folgt h. zT = 0 1 1 −4 , hT = −23 14 9 −4 . bT y = 2 , bT h = 18 . 2 xT = 2 1 0 −1 + −23 14 9 −4 . −17 T x = 80 −11 −18 −9 /17 .
33.3 Überbestimmte Systeme Stehen für die Berechnung von n Unbekannten x1 bis xn mehr als n untereinander gleichberechtigte Bestimmungsgleichungen zur Verfügung, so sind diese nur in einem gewissen ausgewogenen Mittel möglichst gut erfüllbar derart, dass das Defekt oder Residuenquadrat bezüglich x minimal wird. Gegeben A, r. Gesucht x. ⎤ ⎡ ⎤ ⎡ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ a11 . . . a1n ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . .. ⎥⎥⎥⎥ x = ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ , A = ⎢⎢⎢⎢ .. . ⎥⎥⎥⎥ , ⎢⎣ ⎥⎦ ⎢⎣ ⎦ xn am1 . . . amn
⎡ ⎤ ⎢⎢⎢ r1 ⎥⎥⎥ ⎢⎢ . ⎥⎥ r = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ . ⎢⎣ ⎥⎦ rm
Ax = r, m > n . Defekt d = Ax − r. Gauß-Ausgleich:
Gegeben ⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎢⎢⎢ a11 . . . a1n ⎥⎥⎥ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ r1 ⎥⎥⎥ ⎢ ⎥ ⎢⎢⎢⎢ . .. ⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ ⎥ ⎢⎢⎢ .. . ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ = ⎢⎢⎢⎢ . ⎥⎥⎥⎥ , ⎢⎢⎢ ⎥⎥⎥ ⎣ ⎦ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ xn ⎢⎢⎢ ⎥⎥⎥ ⎢⎣ ⎦ ⎣ ⎦ am1 . . . amn rm Gesucht ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎢⎢⎢ r11 . . . r1n ⎥⎥⎥ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢⎢ c1 ⎥⎥⎥ ⎥ ⎢ ⎥ ⎢ ⎢⎢⎢⎢ . . .. ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢ .. ⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ ⎢⎢⎢ . . ⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ = ⎢⎢ . ⎥⎥ , ⎢⎢⎢ ⎥⎥ ⎣ ⎦ ⎢⎢ ⎢⎢⎢ cn ⎥⎥⎥⎥⎥ ⎢⎢⎢ O rmn ⎥⎥⎥⎥⎥ xn ⎥ ⎢⎢⎢ ⎢⎣ ⎦ ⎢⎢⎢ cn+1 ⎥⎥⎥⎥⎥ O ⎥⎦ ⎢⎣ cm
Ax = r .
Rx = c , R = QA , c = Qr ,
mit Erhaltung der Spaltennormen m m 2 2 2 2 ak1 , r12 + r22 = a2k2 r11 = k=1
(33-16)
usw . (33-17)
k=1
und der speziellen Transformationseigenschaft n
Q=
Qi ,
Qk Qk = I ,
(33-18)
i=1
Normalgleichung Rnn x = cn , Rnn oberes Dreieck .
(33-19)
Die Orthogonaleigenschaft Qk Qk = I wird erfüllt durch die Householder-Transformation. Q= I−2
wwT wT w
mit Q2 = I .
(33-20)
!
1. Householder-Schritt Q1 a1 = r11 e1 . m wT a 1 ! 2 a1 − 2 T1 w1 = r11 e1 , r11 = a2k1 , w1 w1 k=1 Richtung von w1 = a1 − r11 e1 .
!
grad(dT d) = o x
Beispiel. Für aT1 = [ 1 2 3 1 2 ] bestimme man Q1 .
bestimmt die Normalgleichung: AT Ax = AT r ,
AT A = ( AT A)T .
(33-15)
Die Koeffizientenmatrix AT A in (33-15) ist symmetrisch, doch ist die Kondition der quasi-quadrierten Matrix schlecht, sodass eine Transformation von A zur oberen Dreiecksform R = QA nach (33-16) mithilfe einer normerhaltenden Methode – Spiegelung oder Householder-Transformation – empfohlen wird.
2 r11 = (1 + 4 + 9 + 1 + 4) = 19 . √ T w1 = [(1 − 19) 2 3 1 2 ] . 1 Q1 = I − √ w1 wT1 . 19 − 19
33.4 Testmatrizen Zum Test vorliegender Rechenprogramme eignen sich Matrizen mit einfach angebbaren Elementen ai j
A121
A122
A Mathematik und Statistik / Mathematik
und ebensolchen Elementen bi j der zugehörigen Inversen, die man spaltenweise (bk ) als Lösung einer rechten Einheitsspalte r = ek auffassen kann. Abk = ek ,
B = [b1 . . . bn ] = A−1 .
(33-21)
Interessant sind speziell Matrizen mit unangenehmen numerischen Eigenschaften, was sich in einer großen Konditionszahl κ ausdrückt; siehe auch [1] und Tabelle 33-2. |λmax | , λ Eigenwerte der Matrix A , κ= |λmin | κoptimal = 1 , det A 0 . (33-22) Tabelle 33-2. Testmatrizen der Ordnung n
Name Dekker A := D
Hilbert A := H
Zielke A := Z
Elemente ai j der Ausgangsmatrix A Elemente bi j der Inversen B = A−1 . ⎞ ⎞⎛ ⎛ ⎜⎜⎜ n + i − 1 ⎟⎟⎟ ⎜⎜⎜ n − 1 ⎟⎟⎟ n ⎟⎠ . ⎟⎠ ⎜⎝ ⎜⎝ ai j = n− j i−1 i+ j−1 3n 2 2 bi j = (−1)i+ j ai j . χ > . 13n ai j = 1/(i + j − 1) bi j = (−1)i+ j ai j qi q j , (n + k − 1)! qk = . (k − 1)!2 (n − k)! n A= ⎧ C − en e + E, ⎪ ⎪ ⎨ 1 für i + j n ei j ⎪ ⎪ ⎩ 0 für i + j > n c beliebiger Skalar, ci j = c . χ ∼ 2nc2 . ⎧ ⎪ b11 = −c , bnn = −c − 1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ b1n = bn1 = c ⎪ ⎪ ⎪ ⎨ bi j ⎪ 1 für i + j = n ⎪ ⎪ ⎪ ⎪ ⎪ −1 für i + j = n + 1 mit i, j n ⎪ ⎪ ⎪ ⎪ ⎩ 0 sonst.
Beispiel. Für n = 4 werden die Testmatrizen explizit angegeben. ⎡ ⎤ ⎢⎢⎢ 4 6 4 1 ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 10 20 15 4 ⎥⎥⎥⎥⎥ D4 = ⎢⎢ , ⎢⎢⎢ 20 45 36 10 ⎥⎥⎥⎥⎥ ⎣ ⎦ 35 84 70 20 ⎡ ⎤ 4 −1 ⎥⎥ ⎢⎢⎢ 4 −6 ⎥⎥ ⎢⎢⎢⎢ −10 20 −15 4 ⎥⎥⎥⎥ −1 ⎢ ⎥⎥ . D4 = ⎢⎢⎢ ⎢⎢⎢ 20 −45 36 −10 ⎥⎥⎥⎥ ⎣ ⎦ −35 84 −70 20
⎡ ⎤ ⎢⎢⎢ 1/1 1/2 1/3 1/4 ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢ 1/2 1/3 1/4 1/5 ⎥⎥⎥⎥⎥ , H4 = ⎢⎢⎢⎢ ⎢⎢⎢ 1/3 1/4 1/5 1/6 ⎥⎥⎥⎥⎥ ⎣ ⎦ 1/4 1/5 1/6 1/7 ⎡ ⎤ 240 −140 ⎥⎥ ⎢⎢⎢ 16 −120 ⎥⎥ ⎢⎢⎢ 1200 −2700 1680 ⎥⎥⎥⎥ ⎢⎢⎢ −120 ⎥⎥ . = H−1 4 ⎢⎢⎢⎢ 240 −2700 6480 −4200 ⎥⎥⎥⎥ ⎢⎣ ⎦ −140 1680 −4200 2800 ⎡ ⎤ ⎢⎢⎢ c + 1 c + 1 c + 1 c ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ c ⎢⎢⎢ c + 1 c + 1 c ⎥⎥⎥ Z 4 = ⎢⎢ ⎥⎥⎥ , ⎢⎢⎢ c + 1 c c c ⎥⎥⎦ ⎣ c c c c−1 ⎡ ⎤ 0 1 c ⎥⎥ ⎢⎢⎢ −c ⎥⎥ ⎢⎢⎢⎢ 0 1 −1 0 ⎥⎥⎥⎥ −1 ⎢ ⎢ ⎥⎥ . Z 4 = ⎢⎢ ⎢⎢⎢ 1 −1 0 0 ⎥⎥⎥⎥ ⎣ ⎦ c 0 0 −c − 1
34 Nichtlineare Gleichungen 34.1 Fixpunktiteration, Konvergenzordnung Die Berechnung der Nullstellen x nichtlinearer Funktionen f (x) = 0 lässt sich stets auch als Abbildung von x mittels einer zugeordneten Funktion F(x) in sich selbst formulieren. (34-1) x = F(x) ↔ f (x) = 0 , allgemein : F(x) = x + λ(x) f (x) , λ(x) 0 .
In der Regel gibt es bei gegebenem f (x) mehrere zugeordnete Funktionen F(x). Beispiel 1: Für f (x) = x2 − 4x + 3 = 0 erhält man über verschiedene Auflösungsmöglichkeiten nach x folgende zugeordnete Darstellungen x = F(x): F1 (x) = (x2 + 3)/4 , F3 (x) = 3/(4 − x) .
F2 (x) = 4 − 3/x ,
Fixpunktiteration ist eine Interpretation der Zuordnung (34-1) derart, dass ein Startwert ξ0 so lange der Abbildung ξk+1 = F(ξk ) ,
k = 0, 1, 2, . . . ,
(34-2)
unterworfen wird, bis ξk+1 und F(ξk+1 ) numerisch ausreichend übereinstimmen und mit ξk = x eine
34 Nichtlineare Gleichungen
Nullstelle f (x) = 0 vorliegt; formal spricht man in dieser besonderen Situation von ξk als einem Fixpunkt der Abbildung x → F(x). Die Konvergenz der Folge (34-2) gegen eine Nullstelle x = ξk der Funktion f (x) ist gesichert, falls der Betrag der Steigung von F, also |F = dF/dξ|, kleiner ist als der Betrag der Steigung der linken Seite in (34-2), nämlich dξ/dξ = 1; siehe Bild 34-1. Konvergenz der Iteration
ξk+1 = F(ξk ) für |F | < 1 : F ist kontrahierende Abbildung .
(34-3)
In der Theorie der Normen hat F die Bedeutung einer Lipschitz-Konstanten L. F(ξk+1 ) − F(ξk ) L. ξk+1 − ξk
(34-4)
Die Konvergenz hängt durchaus ab von der Art der f (x) zugeordneten Funktion F(x). Beispiel 1, Fortsetzung: Die Konvergenzbereiche der Abbildungen Fi sind unterschiedlich. Fi
3 + ξ2 4
4−
Fi
ξ/2
3/ξ 2
|Fi | < 1 für
ξ2 < 4
ξ2 > 3
3 ξ
3 4−ξ 3/(4 − ξ)2 √ ξ 4+ 3
Bei dem Startwert ξ0 = 5/2 kann demnach nur die Version F2 = 4−3/ξ erfolgreich sein. Folgende Tabelle belegt die, wenn auch langsame, Konvergenz gegen die Nullstelle x = 3
k ξk
0 1 2 3 4 5 2,500 2,800 2,929 2,976 2,992 2,997
Kk =
|ξk+1 − 3| 0,40 |ξk − 3|
0,35
0,34
0,33
0,33
–
Als Maß für die Konvergenzgeschwindigkeit dient der Konvergenzquotient |ξk+1 − x| = Kk , |ξk − x| p ξk Iterierte , x Nullstelle f (x) = 0 , p Konvergenzordnung ,
(34-5)
der bei ausreichend hoher Iterationsstufe k und passendem Exponenten p gegen einen Grenzwert K konvergiert. Im Sonderfall p = 1 lässt sich K = K(F ) als Funktion der Abbildung F formulieren. p = 1 : K = |F (x)| < 1 . 1 p > 1: K max |F (p) (ξ)| , p!
|F (ξ)| < 1 . (34-6)
Im obigen Beispiel stellt man in der Tat für p = 1 eine recht schnelle Konvergenz der Quotienten Kk gegen 0,33 fest; ein Wert, der mit F = 3/ξ2 = 3/9 hinreichend übereinstimmt.
34.2 Spezielle Iterationsverfahren In der Regel wird man sich bei der Suche nach Nullstellen x einer Funktion f (x) vorweg einen groben Eindruck vom ungefähren Funktionsverlauf verschaffen, wobei x-Intervalle I = [a, b] mit wechselndem Vorzeichen der Funktionen auftreten werden ( f (a) f (b) < 0). Aus Stetigkeitsgründen liegt in einem solchen Intervall mindestens eine Nullstelle f (x) = 0. Intervallschachtelung, auch Bisektion genannt, ist ein Verfahren, das den Funktionswert f (ξk ) in Intervallmitte ξk = (a + b)/2 nutzt, um das aktuelle Intervall zu halbieren. Falls f (a) f (ξk ) < 0, wiederholt man die Prozedur für I = [a, ξk ], ansonsten für I = [ξk , b]. Intervallschachtelung. Startintervall
Bild 34-1. Iterationsfolge ξk+1 = F(ξk ). a konvergent;
b divergent
I = [a, b]
mit
f (a) f (b) < 0 ,
ξk Intervallmittelpunkt nach k-Halbierungen. x gesuchte Nullstelle mit f (x) = 0 .
A123
A124
A Mathematik und Statistik / Mathematik
A-priori-Fehlerabschätzung: b−a |ξk − x| k+1 , k = 0, 1, 2, . . . 2 Konvergenzordnung p = 1 .
(34-7)
Funktion f (ξk ) im aktuellen Näherungswert ξk mittels ihrer Tangente (lineare Taylor-Entwicklung im Punkt ξk ) erhält man eine Folge f (ξk ) . f (ξk ) Konvergenzordnung p 2 ,
ξk+1 = ξk −
Regula falsi ist eine Variante, die ebenfalls ein Startintervall I = [a, b] mit f (a) f (b) < 0 benötigt, den Zwischenwert ξk des nächstkleineren Intervalls jedoch durch lineare Interpolation bestimmt: Regula falsi.
f (x) 0 . Falls ξn bereits ein guter Näherungswert ist, dann verkürztes Newton-Verfahren
Zwischenwert a f (b) − b f (a) . ξk = f (b) − f (a) Konvergenzordnung p=1
falls
p = 1:
ξk+1 = ξk −
f (a) f (b) < 0 ,
(34-8)
f (x), f (x) 0 .
Durch zusätzliche Entscheidungen lässt sich die Regula falsi in der Form der Pegasusmethode zur Konvergenzordnung p = 1,642 verbessern. Sekantenmethode heißt eine Alternative zur Intervallschachtelung, die unabhängig von den Vorzeichen f (a), f (b) zweier Startwerte ξk−1 = a, ξk = b durch lineare Interpolation eine Näherungs-Nullstelle ξk+1 liefert. Durch Wiederholung des Vorganges mit ξk+1 und ξk oder ξk−1 gelangt man zu einer Nullstelle x, falls die monotone Abnahme der Folge | f (ξk )| garantiert ist. Sekantenmethode: Startpaare [ξk−1 , fk−1 = f (ξk−1 )] , [ξk , fk = f (ξk )] . Interpolation ξk − ξk−1 ξk+1 = ξk − fk . (34-9) fk − fk−1 Konvergenzordnung √ p = (1 + 5)/2 = 1,618, falls f (x), f (x) 0 . Newton-Verfahren. Diese Iteration zur Bestimmung einer Nullstelle von f wird gerne benutzt für den Fall, dass die Ableitung d f /dx = f problemlos zu beschaffen ist. Durch lineare Approximation der
falls
mit Startintervall I = [a, b] mit
(34-10)
f (ξk ) , f (ξn )
kn.
(34-11)
Deflation. Bei bekanntem x1 mit f (x1 ) = 0 möchte man bei der Suche nach einer weiteren Nullstelle x2 nicht abermals auf x1 zusteuern. Mittels Division der Originalfunktion f (x) durch x − x1 erzeugt man eine modifizierte Form f¯ = f /(x− x1 ), die bei x = x1 eine Polstelle besitzt. Bei Polynomfunktionen ist diese Division us Genauigkeitsgründen auf keinen Fall tatsächlich durchzuführen; vielmehr verbleibt die Differenz (x − x1 ) explizit im Iterationsprozess z. B. des Newton-Verfahrens: Newton-Iteration für die (n + 1)-te Nullstelle xn+1 bei bekannten Nullstellen x1 bis xn : ⎫−1 ⎧ n ⎪ ⎪ ⎪ ⎪ ⎨ f (ξk ) −1 ⎬ ξk+1 = ξk − ⎪ − (ξk − xi ) ⎪ , ⎪ ⎪ ⎭ ⎩ f (ξk ) i=1
ξk → xn+1 .
(34-12)
Horner-Schema. Die Berechnung der Funktionswerte P(ξ) und P (ξ) eines Polynoms P(x), z. B. im Rahmen des Newton-Verfahrens, kann sehr effektiv nach Horner in rekursiver Art erfolgen. Gegeben: Pn (x) = a0 xn + . . . + an−1 x + an , a0 0 . Gesucht: Pn (ξ), Pn (ξ), Pn (ξ) Startend mit b0 = a0 gilt
usw.
b1 = a1 + ξb0 , b2 = a2 + ξb1 , . . . , bn = an + ξbn−1 = Pn (ξ) . Start c0 = b0: c1 = b1 + ξc0 , . . . , cn−1 = bn−1 + ξcn−2 = Pn (ξ) . Start d0 = c0: d1 = c1 + ξd0 , . . . , dn−2 = cn−2 + ξdn−3 = Pn (ξ) .
(34-13)
34 Nichtlineare Gleichungen
Iteration bezüglich k=0 k=5 k = 10 k = 15 k = 20 |P(ξ20 )|
x1 = 1
x2 = 1
x3 = 1
x4 = 1
x5 = 1
ξk : 0,0 0,672320 0,892626 0,964816 0,988471 2,04 · 10−10
ξk : 0,0 0,764967 0,946790 0,987606 0,993692 9,98 · 10−12
ξk : 0,0 0,873778 1,02200 1,00487 1,00137 4,85 · 10−15
ξk : 0,0 0,979439 1,00541 1,00089 1,00035 5,13 · 10−18
ξk : 0,0 1,00050 1,00015 1,00005 1,00002 2,01 · 10−24
Beispiel: Der fünffache Eigenwert x = 1 des Polynoms P(x) = x5 − 5x4 + 10x3 − 10x2 + 5x − 1 = (x − 1)5 ist mit dem Newton-Verfahren einschließlich Deflation zu berechnen, wobei jeweils 20 Iterationsschritte mit ξ0 = 0 beginnend durchzuführen sind. Offensichtlich nimmt die Güte der Ergebnisse für gleiche Iterationsstufen k mit fortschreitender Deflation zu. In der Rechenpraxis wird man ein Abbruchkriterium |(ξk+1 − ξk )/ξk | < ε
für ξk 0 benutzen .
34.3 Nichtlineare Gleichungssysteme Die simultane Lösung n gekoppelter nichtlinearer Gleichungen f1 (x1 , . . . , xn ) = 0 .. , . fn (x1 , . . . , xn ) = 0
kurz
f (x) = o
(34-14)
für n Unbekannte xi kann über eine lineare TaylorEntwicklung der Vektorfunktion f an der Stelle ξk einer Näherungslösung für x erfolgen. Ein Startwert ξ0 ist vorzugeben. !
f1 (ξ + Δξ) = f1 (ξ) + f1, 1 (ξ)Δξ1 + . . . + f1, n (ξ)Δξn = 0 , .. . !
fn (ξ + Δξ) = fn (ξ) + fn, 1 (ξ)Δξ1 + . . . + fn, n (ξ)Δξn = 0 , fk, i = ∂ fk /∂xi . ξ ≡ ξk . Matrizendarstellung: f (ξk ) + J(ξk )Δξk = o ,
ξk+1 = ξk + Δξk (34-15)
mit der Funktional- oder Jacobi-Matrix ⎤ ⎡ ⎢⎢⎢ f1, 1 . . . f1, n ⎥⎥⎥ ⎢⎢ . .. ⎥⎥⎥⎥ J = ⎢⎢⎢⎢⎢ .. . ⎥⎥⎥⎥ = [ f, 1 . . . f, n ] . ⎢⎣ ⎦ fn, 1 . . . fn, n
(34-16)
Die dem Newton-Verfahren entsprechende Iteration (34-15) konvergiert quadratisch, wobei man durch Mitführen der Fehlernorm f T (ξk ) f (ξk ) = δ2 die Monotonie der Iteration überprüfen sollte. Ist diese nicht gegeben, ist die Rechnung mit neuem Startwert ξ0 zu wiederholen. Zur Verringerung des erheblichen Rechenaufwandes infolge einer ständig neuen Koeffizientenmatrix J in (34-15) empfiehlt es sich, die Jacobi-Matrix für eine gewisse Anzahl von Schritten unverändert beizubehalten. Eine weitere Variante verzichtet auf die simultane Berechnung aller Verbesserungen Δξ. Vielmehr wird das Inkrement Δξi der i-ten Komponente ξki der k-ten 1 bis Iterationsstufe mithilfe schon neuer Werte ξk+1 i−1 i+1 n ξk+1 und der noch alten Werte ξk bis ξk berechnet. Newton’sches Einzelschrittverfahren: i Δξi = ξk+1 − ξki 1 2 i−1 fi ξk+1 , ξk+1 , . . . , ξk+1 , ξki , . . . , ξkn . = −Ω 1 , ξ2 , . . . , ξi−1 , ξi , . . . , ξn fi,i ξk+1 k+1 k+1 k k (34-17)
Häufig ist es zweckmäßig, die Verbesserung mit einem Relaxationsfaktor Ω, 0 Ω 2, zu multiplizieren, also nicht mit dem „an sich richtigen“ Wert Ω = 1. Gradientenverfahren suchen die Lösung x nichtlinearer Gleichungssysteme f (x) = o als Null- und gleichzeitig Minimalpunkte einer zugeordneten quadratischen Form
A125
A126
A Mathematik und Statistik / Mathematik
Q = fT f = 0 ,
grad Q = 2J T f ,
(grad Q) = [Q,1 T
...
(34-18)
Q,n ] .
Bei Vorliegen einer Näherung ξk mit dem Wert Qk = Q( f k ) findet man eine Verbesserung Δξ mit einem besseren Wert Qk+1 = Qk + (grad Q)T Δξ + . . . = 0 in Richtung des Gradienten Δξ = t grad Q. Aus der Forderung Qk+1 = 0 der linearen Entwicklung folgt der Skalar t und damit ' Qk T Δξ = ξk+1 − ξk = − J f . (34-19) 2(J T f )T (J T f ) k Beispiel. Gegeben ist ein System von zwei nichtlinearen algebraischen Gleichungen. f1 = 3 x21 + x22 − 10x1 − 14x2 + 23 = 0 (Ellipse) , f2 = x21 − 2x1 − x2 + 3 = 0 (Parabel) . Mit der Jacobi-Matrix 6x1 − 10 J= 2x1 − 2
6x2 − 14 −1
ξk
0 0 0
1 1,055 0,8889
2 0,2038 1,908
3 0,9341 1,471
5 0,9868 1,956
7 1,000 2,000
35 Matrizeneigenwertproblem 35.1 Homogene Matrizenfunktionen, Normalformen Die Eigenwerttheorie fragt nach nichttrivialen Lösungen x für homogene Gleichungssysteme Fx = o wobei F zunächst quadratisch und reell sei und einen Parameter λ enthalte. Gegeben: F(λ)x = o . Gesucht: Lösungen
x o.
Notwendige Bedingung: F = det F = 0 = f (λ) . Charakteristische Gleichung f (λ) = 0 zur (35-1) Berechnung der Eigenwerte λ1 , λ2 , . . .
Beispiel: Eigenwerte für verschiedene Funktionen F(λ). ⎡ ⎤ ⎢⎢⎢ 3 2 ⎥⎥⎥ ⎥⎦ − λI , F = ⎣⎢ −1 1 f (λ) = (3 − λ)(1 − λ) + 2 = 0 , 4 1 3 2 F= −λ , 1 0 2 1 f (λ) = −λ2 − 1 = 0 , −1 1 0 F= +λ 0 2 0
λ = 2 + j, 2 − j .
λ = j , −j . 1 2 1 +λ −2 0
4 , 1
f (λ) = (−1 + λ2 )(2 − 2λ + λ2 ) = 0 ,
konvergiert die Anfangslösung ξ0 = o gegen eine Lösung xT = [1, 2]. Folgende Tabelle zeigt den Iterationsverlauf des vollständigen Newton-Verfahrens. k
Die Eigenwerte λk sind im Allgemeinen konjugiertkomplex, doch gibt es Klassen spezieller Matrizenfunktionen mit stets reellen Eigenwerten; siehe Tabelle 35-1.
λ = −1, 1, 1 + j, 1 − j . sin λ sinh λ F= , cos λ cosh λ f (λ) = sin λ cosh λ − sinh λ cos λ = 0 , λ = 0; 3,9266; 7,0686; 10,210; 13,352; . . . ; λk+1 ≈ (k + 0,25)π . Expansion. Ein nichtlineares EWP mit F als Matrizenpolynom kann stets zu einem äußerlich linearen Hypersystem expandiert werden; für k = 2 gilt: Aus ( A0 + λA1 + λ2 A2 )x = o wird (H0 + λH1 )y = o mit O R H0 = , A0 A1 x −R O . , y= H1 = λx O A2 R reguläre Hilfsmatrix, zweckmäßig
(35-2)
R=I.
Bei symmetrischen, zudem positiv definiten Matrizen Ak werden H0 , H1 für R = A0 ebenfalls symmetrisch. Dennoch sind die Eigenwerte λ komplex, da H1 indefinit ist. Die innere Struktur einer Matrix A kann durch eine Links-rechts-Transformation aufgedeckt werden, wobei drei Typen unterschieden werden.
35 Matrizeneigenwertproblem
Tabelle 35-1. Typische Matrizenfunktionen F(λ). F quadratisch, fi j reell, n-Zeilen und n-Spalten
λ reell falls
F = A − λI
Anzahl Eigenwerte n
F = A − λB
n
F = A0 +λA1 +. . .+λk Ak
nk
A = AT , B = BT und B positiv oder negativ definit –
Name
Gleichung
L EWP speziell L EWP allgemein NL EWP Matrizenpolynom NL EWP allgemein
Elemente fi j von F sind ∞ beliebige Funktionen z. B. fi j = exp(λ) L/NL EWP: Lineares/nichtlineares Eigenwertproblem.
Gegeben ( A − λI)x = o oder ( A − λB)x = o . Transformation (/ A − λLIR)y = o oder ( / A − λ/ B)y = o x = Ry , / A = LAR , L, R regulär .
/ B = LBR ,
A = AT
–
⎫ ⎪ XT AX = D1 , X T BX = D2 . ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ X = [x1 . . . xn ] Modalmatrix ⎪ ⎪ ⎪ ⎪ mit Eigenvektoren x aus Ax = λBx . ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ Falls ⎪ ⎪ ⎪ ⎪ T T ⎪ X BX = I , gilt X AX = Λ , ⎪ ⎪ ⎪ ⎪ ⎭ Λ = diag(λk ) , k = 1 bis n . Ferner gilt die dyadische Spektralzerlegung
(35-3)
F(λ) =
Äquivalenz
n (λk − λ)Sk = A − λB ,
(35-5)
(35-6)
k=1
LIR I ,
Sk =
Ähnlichkeit als spezielle Äquivalenz LIR = RIL = I ,
L = R−1 ,
R = L−1 .
Kongruenz als spezielle Ähnlichkeit L = RT
mit
RT IR = I .
Für ein Paar A, B mit den Eigenschaften B = BT B = I: B I:
A A
Bei komplexen Eigenwerten und Eigenvektoren ist xT durch x¯ T (konjugiert transponiert) zu ersetzen. Beispiel: Für das Matrizenpaar ⎡ ⎤ ⎢⎢⎢ −1 −3 8 ⎥⎥⎥ ⎢ ⎥ A = ⎢⎢⎢⎢⎢ 3 15 12 ⎥⎥⎥⎥⎥ , B = diag(1 1 2) ⎣ ⎦ 8 −12 26 gilt die Normalitätsbedingung (35-4). Mit den Eigenwerten
und definit,
AT B−1 A = AB−1 AT ,
(Bxk )(Bxk )T . xTk Bxk
(35-4)
heißt normal , heißt B-normal ,
gibt es stets eine Kongruenztransformation auf Diagonalformen Dk :
Λ = diag(15 + 9j 15 − 9j und der Modalmatrix
⎡ ⎤ ⎢⎢⎢ j −j 4 ⎥⎥⎥ 1 ⎢⎢⎢ ⎥ X= ⎢ 3 3 0 ⎥⎥⎥⎥⎥ 18 ⎢⎢⎣ ⎦ 2j −2j −1
− 3)
A127
A128
A Mathematik und Statistik / Mathematik
λ1 R λn ,
verifiziert man ¯ T BX = I , die Diagonaltransformation X ¯ T AX = Λ und die Zerlegung (35-6). X Die simultane Diagonaltransformation eines Tripels ( A0 , A1 , A2 ) mit A0 = AT0 , und definitem A2 = AT2 gelingt nur im Fall der Vertauschbarkeitsbedingung −1 A1 A−1 2 A0 = A0 A2 A1 .
(35-7)
Typischer Sonderfall (modale Dämpfung in der Strukturdynamik): A1 = a0 A0 + a2 A2 . Statt (λ2 A2 + λA1 + A0 )x = o berechnet man (σA2 + A0 )x = o , λk1 , λk2
(35-8)
aus λ + λ(a2 − σk a0 ) − σk = 0 . 2
Nichtnormale Matrizen sind bestenfalls durch Ähnlichkeitstransformation zu reduzieren auf die sogenannte Jordan’sche Normalform J = T −1 AT , jkl = 0 bis auf jkk (k = 1 bis n) 0 und
(35-9)
jk, k+1(k = 1 bis n − 1) 0 für wenigstens einen Index k .
35.2 Symmetrische Matrizenpaare Ein Paar ( A, B) reellsymmetrischer Matrizen mit zumindest einem definiten Partner hat nur reelle Eigenwerte. Ax = λBx ,
A = AT ,
B = BT ,
B definit
Faktorisierung 33.2, (33-8) entscheidet über Definitheit: B = LDL , D = diag(dkk ) , lkk = 1 . > 0 B positiv definit alle dkk (35-10) . < 0 B negativ definit T
Der dem EWP (35-10) zugeordnete RayleighQuotient vT Av , Rextr = R(xk ) = λk , vT Bv mit dem reellen Wertebereich R=
λ1 λ2 . . . λn ,
(35-11)
nimmt seine lokalen Extrema R = λ2 bis λn−1 und globalen Extrema R = λ1 , λn , an, wenn man für die an sich beliebigen Vektoren v speziell die Eigenvektoren xk von (35-10) einsetzt. Die Vielfalt von „Eigenwertlösern“ lässt sich in 2 Gruppen einteilen: Globalalgorithmen. Wesentlich ist als Vorarbeit eine Transformation des Paares ( A, B) auf eine Tridiagonalmatrix T zum Partner I mithilfe des Lanczos- oder Givens-Verfahrens. Daran anschliessend liefert der QR-Algorithmus eine sukzessive Transformation des Paares T, I auf Diagonalform. Das Jacobi-Rotationsverfahren ist ein klassischer Globalalgorithmus ohne Vorarbeit, allerdings mit dem Nachteil der Profil- oder Bandbreitenzerstörung. Selektionsalgorithmen. Separate oder gruppenweise Berechnung einiger Eigenwerte unabhängig von den anderen. Typische Vertreter sind die Vektoriteration nach v. Mises – auch Potenzmethode genannt – mit der Spektralverschiebung nach Wielandt und die Ritz-Iteration für den Rayleigh-Quotienten mittels sukzessiver Unterraumprojektion. Neuentwicklungen sind der Spezialliteratur zu entnehmen. Bei der Eigenwertanalyse technischer Systeme sind in aller Regel nur einige Eigenwerte λ von Interesse, wofür Selektionsalgorithmen besonders geeignet sind; sie arbeiten grundsätzlich iterativ. Die wesentliche Frage nach dem Index k des Eigenwertes λk , den ein aktueller Näherungswert Λ ansteuert, beantwortet der Sylvester-Test. Gegeben: Ax = λBx, Λ ,
Ordnung n .
A= A , B=B T
T
positiv definit .
Gesucht: Anzahl der Eigenwerte mit λ < Λ . Verfahren: Zerlegung ( A − ΛB) = LDLT , lii = 1 , D = diag(dii ) , k Werte dii < 0 , liefert n − k Werte dii > 0 . (35-12) Demnach gibt es k-Eigenwerte λ kleiner als Λ. Der Sylvester-Test erlaubt die Einschließung von Eigenwerten. Gilt für zwei Werte Λ1 , Λ2 :
35 Matrizeneigenwertproblem
Tabelle 35-2. Nützliche Beziehungen zwischen Eigenwerten und Eigenvektoren algebraisch verwandter Eigenwert-
problem-Paare Verwandte Paare ⎧ ⎪ ⎨ Ax = λx ⎪ ⎩ Ak y = σy ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ (AB−1 )k Ay = σBy ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ By = σAy ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ (A − ΛB)y = σBy ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ By = σ(A − ΛB)y ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ AT y = σBT y ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ LARy = σLBRy ⎧ ⎪ ⎨ Ax = λBx ⎪ ⎩ (AB−1 A − sA + pB)y = σBy
Eigenvektoren
Eigenwerte
x=y
σ = λk
x=y
σ = λk+1
x=y
σλ = 1
x=y
λ = Λ + σ,
x=y
λ=Λ+
λ→Λ
xy
λ=σ
L, R regulär x = Ry
λ=σ
x=y
σ = (λ − Λ0 )(λ − Λ1 ), s = Λ0 + Λ1 , p = Λ0 Λ1
dann liegt dazwischen garantiert der k2 -te Eigenwert. Λ1 ≤ λk2 ≤ Λ2 . Gilt für zwei andere Λ-Werte: Λ3 → k3 Eigenwerte < Λ3 , Λ4 > Λ3 → k4 = k3 Eigenwerte < Λ4 , dann liegt zwischen Λ3 und Λ4 garantiert kein Eigenwert; dies ist ein Ausschliessungssatz. Vektoriteration. Beginnend mit einem beliebigen Startvektor v0 oder u0 konvergieren die Vektorfolgen Rk+1 = R(vk+1 ) → λmin Rk+1 = R(uk+1 ) → λmax
zum Eigenwertproblem Ax = λBx ,
1 σ
σ → ∞:
Λ1 → k1 Eigenwerte < Λ1 , Λ2 > Λ1 → k2 = k1 + 1 Eigenwerte < Λ2 ,
Avk+1 = Bvk , Buk+1 = Auk ,
Λ Konstante
R = (vT Av)/(vT Bv)
(35-13)
gegen die äußeren Eigenwerte und die dazugehörigen Vektoren des Paares ( A, B). Die Konvergenzgeschwindigkeit ist proportional der Inversen der Konditionszahl κ: Konvergenzgeschwindigkeit ∼ κ−1 = |λmin |/|λmax | . (35-14)
Die Nichtkonvergenz signalisiert die Ansteuerung eines Unterraumes mit mehrfachem Eigenwert oder eines Nestes. In diesem Fall hilft eine Simultaniteration der Ordnung s: 4 5 1 2 s x = Vk n , V = v v . . . v , nT = [n1
n2 . . . n s ] ,
AV k+1 = BV k ,
wobei den Rayleigh-Quotienten ein UnterraumEigenwertproblem der Ordnung s zugeordnet ist. / A = V Tk+1 AV k+1 ,
/ B = V Tk+1 BV k+1 .
/ An = R/ Bn → R1 . . . R s , N = [n1 n2 . . . ns ], V k+1 := V k+1 N .
(35-15)
Spektralverschiebung. Die nach Abspalten der Anteile x1 bis xr−1 zum nächsten Eigenpaar xr , λr tendierende Iteration kann bei Kenntnis einer Näherung Λr für λr wesentlich beschleunigt werden durch eine Spektralverschiebung: λ = Λr + σ
führt auf
( A − ΛB)vk+1 = Bvk .
(35-16)
Beispiel: Die Eigenwerte λ = 2, 4, 6, 8 eines speziellen EWP Ax = λx mit
A129
A130
A Mathematik und Statistik / Mathematik
⎡ ⎢⎢⎢ 5 −1 −2 ⎢⎢⎢ 5 0 ⎢ −1 A = ⎢⎢⎢⎢ ⎢⎢⎢ −2 0 5 ⎣ 0 2 1
⎤ 0 ⎥⎥ ⎥⎥ 2 ⎥⎥⎥⎥ ⎥⎥ 1 ⎥⎥⎥⎥ ⎦ 5
n: Zeilen- und Spaltenzahl von P . i, j = 1 bis n, c: beliebige Konstante .
seien bekannt .
Beginnend mit vT0 = [1 − 1 − 1 1] zeigt folgende Tabelle die Iteration einmal für Λ = 0 mit |λmin /λmax | = 0,25 und dann für Λ = 2,1 mit |σmin /σmax | = 0,1/5,9 = 0,017. Die Unterschiede in der Konvergenzgeschwindigkeit sind offensichtlich. k Rk Rk
für für
Λ=0 Λ = 2,1
1 3,84 1,66
2 2,2417 1,9996
3 2,0818 2,0000
4 2,0177 2,000
35.3 Testmatrizen Zum Test vorhandener Rechenprogramme eignen sich Matrizen mit einfach angebbaren Elementen ai j , bi j und ebensolchen Eigenwerten und Eigenvektoren. Ganzzahlige Eigenwerte mit weitgehender Vielfachheit liefert die Links-rechts-Multiplikation eines Paares D = diag (dii ), I mit regulären Matrizen L, R. Vorgabe: Paar diag (dii )x = λx mit vorgegebenen Eigenwerten λi = dii und Einheitsvektoren ei als Eigenvektoren xi . Konstruktion eines vollbesetzten Paares: Ay = σBy mit σi = λi , Ryi = ei : A = LDR , B = LR , L, R regulär . (35-17) A = AT
für
L = RT .
Reguläre Matrizen L, R mit linear unabhängigen Spalten und Zeilen liefern diskrete Abtastwerte kontinuierlicher Funktionen. Analog zu einer Folge x j von Polynomen mit kontinuierlicher Argumentmenge x konstruiert man Spalten i j mit diskreten Argumenten i. Durch Nutzung von Orthogonalsystemen lassen sich mühelos Kongruenztransformationen (35-3) erzeugen. Polynomtransformation j+c ⎧ ⎪ 2i − 1 ⎪ j+c ⎪ ⎪ i , ⎪ ⎪ ⎨ 2 j+c (35-18) R := P , pi j = ⎪ # i $ j+c ⎪ ⎪ 2i − 1 ⎪ ⎪ ⎪ , ⎩ n 2n
Transzendente Transformation. # ij $ 2 R := S , si j = sin π . n+1 n+1 S2 = I . (35-19)
5 2,0041 2,000
6 2,0010 2,000
Beispiel: Für n = 4 erzeuge man eine P-Version mit c = −1 und die S-Transformation. i, j : 1 bis n = 4. Für ⎡ ⎤ j−1 ⎢⎢⎢ 1/8 ⎥⎥⎥ j−1 ⎢⎢⎢⎢ 3/8 ⎥⎥⎥⎥ 2i − 1 ⎥⎥ pi j = gilt p j = ⎢⎢⎢⎢ , ⎢⎢⎢ 5/8 ⎥⎥⎥⎥⎥ 2n ⎣ ⎦ 7/8 ⎡ 2 2 3 3⎤ ⎢⎢⎢ 1 1/8 1 /8 1 /8 ⎥⎥⎥ ⎢⎢⎢⎢ 1 3/8 32 /82 33 /83 ⎥⎥⎥⎥ ⎥⎥ . P = ⎢⎢⎢⎢ ⎢⎢⎢ 1 5/8 52 /82 53 /83 ⎥⎥⎥⎥⎥ ⎣ ⎦ 1 7/8 72 /82 73 /83 ⎡ ⎤ ⎢⎢⎢⎢ sin β sin 2β sin 3β sin 4β ⎥⎥⎥⎥ 2 ⎢⎢⎢⎢ sin 2β sin 4β sin 6β sin 8β ⎥⎥⎥⎥ ⎢⎢ ⎥⎥ , S= 5 ⎢⎢⎢⎢ sin 3β sin 6β sin 9β sin 12β ⎥⎥⎥⎥ ⎣ ⎦ sin 4β sin 8β sin 12β sin 16β π β= . 5 Ein Eigenwertspektrum −2 < κ < +2 mit Verdichtung an den Rändern erzeugt ein spezielles Paar Ks = κs aus der Theorie der Differenzengleichungen. Ks = κs mit 1 für (i − j)2 = 1 ki j = , 0 sonst ⎡ ⎤ 1 ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ · ⎥⎥⎥ · O ⎢⎢⎢ 1 ⎥⎥⎥ · · ⎢⎢⎢ ⎥ K = ⎢⎢⎢ · · · ⎥⎥⎥⎥⎥ , · · 1 ⎥⎥ ⎢⎢⎢⎢ ⎢⎢⎣ O · · ⎥⎥⎥⎥⎦ 1 0 Für
(35-20)
35 Matrizeneigenwertproblem
π , j = 1, . . . , n . gilt κ j = 2 cos jβ , β = n+1 2 sTj = [sin jβ sin 2 jβ . . . sin n jβ] . n+1 Durch Potenzierung, Spektralverschiebung und weitere Operationen gemäß Tabelle 35-2 erhält man aus (35-20) einen ganzen Vorrat an Testpaaren; siehe auch [1], S. 24–28. (K + cI)x = λx , K y = σy , k
xj = sj ,
yj = sj
σj =
λj = κj + c . κkj
.
(35-21)
K : symmetrisch, mit Bandstruktur . k
Bei einem Test auf komplexe Eigenwerte zum Beispiel eines Tripels (λ2 A2 + λA1 + λA0 )x = o übergibt man einem Programm das Problem in der Hyperform (35-2), wobei man die Matrizen Ak durch Aufblähung einer Diagonalform erzeugt oder die Vertauschbarkeitsbedingung in der einfachen Form (35-8) in Verbindung mit der Differenzenmatrix K aus (35-20) nutzt.
λ λ λ λ
Beispiel 2: Mit L = RT ist nach (35-22) ein Tripel mit n = 3 und 3 vorgegebenen Eigenwertpaaren zu konstruieren. Vorgabe: Λ = 1, 1, j, −j , −1 + j , −1 − j . f j j = −2, 0, 2 . g j j = 1, 1, 2 . ⎡ ⎤ ⎢⎢⎢ 1 1 1 ⎥⎥⎥ ⎢⎢⎢ ⎥ Mit R = ⎢⎢⎢ 1 2 −1 ⎥⎥⎥⎥⎥ ⎣ ⎦ 1 3 1 erhält man ein Tripel
⎡ ⎤ ⎢⎢⎢ 3 6 1 ⎥⎥⎥ ⎢ ⎥ A2 = RT IR = ⎢⎢⎢⎢⎢ 6 14 2 ⎥⎥⎥⎥⎥ , ⎣ ⎦ 1 2 3 ⎡ ⎤ ⎢⎢⎢ 0 4 0 ⎥⎥⎥ ⎢ ⎥ A1 = RT FR = ⎢⎢⎢⎢⎢ 4 16 4 ⎥⎥⎥⎥⎥ , ⎣ ⎦ 0 4 0 ⎡ ⎤ ⎢⎢⎢ 4 9 2 ⎥⎥⎥ ⎢ ⎥ A0 = RT GR = ⎢⎢⎢⎢⎢ 9 23 5 ⎥⎥⎥⎥⎥ . ⎣ ⎦ 2 5 4
Vorgabe: Tripel (λ2 I + λF + G)x = o . F = diag( fii ) ,
G = diag(gii ) .
Eigenwerte paarweise als Λ j1 , Λ j2 vorgebbar. (λ − Λ j1 )(λ − Λ j2 ) = 0 → f j j = −(Λ j1 + Λ j2 ) , Λ j1 = Λ¯ j2 → f j j , g j j reell .
g j j = Λ j1 Λ j2 .
Konstruktion eines vollbesetzten Tripels. (σ2 A2 + σA1 + A0 )y = o , x = Ry , σ = λ , A2 = LR , A1 = LFR , A0 = LGR . (35-22) Beispiel 1: Das Eigenwertproblem Ax = λx, n = 4, mit A = (K + 3I)2 hat Eigenwerte nach (35-21). ⎡ ⎤ ⎢⎢⎢ 3 1 0 0 ⎥⎥⎥ ⎢⎢⎢⎢ 1 3 1 0 ⎥⎥⎥⎥ ⎥⎥ , n = 4, c = 3 : K + 3I = ⎢⎢⎢⎢ ⎢⎢⎢ 0 1 3 1 ⎥⎥⎥⎥⎥ ⎣ ⎦ 0 0 1 3 ⎡ ⎤ ⎢⎢⎢ 10 6 1 0 ⎥⎥⎥ ⎢⎢⎢⎢ 6 11 6 1 ⎥⎥⎥⎥ ⎥⎥ . (K + 3I)2 = ⎢⎢⎢⎢ ⎢⎢⎢ 1 6 11 6 ⎥⎥⎥⎥⎥ ⎣ ⎦ 0 1 6 10
2 ⎫ ⎪ ⎪ 2π π $2 ⎪ ⎬ ; 3 + 2 cos ; ⎪ = 3 + 2 cos ⎪ 5 5 ⎪ ⎪ ⎪ ⎭ = 21,326 ; 13,090 ; 2 2 ⎫ ⎪ ⎪ 4π 3π ⎪ ⎬ ; 3 + 2 cos . ⎪ = 3 + 2 cos ⎪ 5 5 ⎪ ⎪ ⎪ ⎭ = 5,6738 ; 1,9098 . #
Es gilt:
σ=Λ
mit
(σ2 A2 + σA1 + A0 )x = 0.
Kronecker-Produktmatrix Die Eigenwerte λ und Eigenvektoren x einer Kronecker-Produktmatrix K = A ⊗ B (siehe 3.1.2) lassen sich mithilfe der Eigendaten von A und B darstellen. Mit Ay = μy, yT = [y1 . . . y p ], Bz = νz gilt ⎡ ⎤ ⎢⎢⎢ y1 z ⎥⎥⎥ ⎢⎢ . ⎥⎥ x = y ⊗ z = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , λ = μν für Kx = λx . (35-23) ⎢⎣ ⎥⎦ yp z
35.4 Singulärwertzerlegung Eine symmetrische Matrix A = AT der Ordnung n lässt sich nach (35-5) auf Diagonalform transformieren.
A131
A132
A Mathematik und Statistik / Mathematik
XT AX = Λ
XT X = I .
mit
Λ = diag(λ1 . . . λn ) , X = [x1 . . . xn ] , xi , λi Eigenvektoren und Eigenwerte
(35-24)
Ax = λx .
des speziellen EWP
A = XΛX T =
λi xi xTi ,
xTi xi = 1 .
(35-25)
i=1
Die Inverse von A folgt aus der Inversion von (35-24). (XT AX)−1 = X −1 A−1 X −T = Λ−1 , n 1 A−1 = XΛ−1 X T = xi xTi . λ i i=1
(35-26)
Wenn λ = 0 s-facher Eigenwert ist, definiert man mit r = n − s die Pseudoinverse r 1 xi xTi , λi 0 . (35-27) A+ = λ i i=1 Entsprechend definiert man die Singulärwertzerlegung A=
r
λi xi xTi ,
λ1 bis λr 0 .
(35-28)
i=1
Die eigentliche Motivation zur Einführung von (35-27) und (35-28) liefern Rechteckmatrizen. ⎡ ⎤ ⎢⎢⎢ r11 . . . r1n ⎥⎥⎥ ⎢⎢ . .. ⎥⎥⎥⎥ R = ⎢⎢⎢⎢⎢ .. . ⎥⎥⎥⎥ , m > n . ⎢⎣ ⎦ rm1 . . . rmn Die Eigenwerte σ2i 0 und die dazugehörigen Eigenvektoren hi des speziellen EWP RT Rh = σ2 h ,
σ21 bis σ2r > 0 ,
(35-29)
bestimmen die spektrale Zerlegung. Singulärwertzerlegung R=
r
σi gi hTi =
i=1
mit gi =
r
Rhi hTi
i=1
1 Rhi , σi
σi 0 .
(35-31)
Eigenschaften der Pseudoinversen:
Durch Multiplikation der Gl. (35-24) von rechts mit X T und von links mit X erhält man die Spektralzerlegung (35-6) für A. n
Pseudoinverse r r 1 1 hi gTi = h (Rhi )T . R+ = 2 i σ σ i i i=1 i=1
(35-30)
RR+ R = R , + T
R+ RR+ = R+ , +
(RR ) = RR ,
+
(35-32) +
(R R) = R R . T
Beispiel. Die singulären Werte σ2i 0 der Matrix ⎡ ⎤ ⎢⎢⎢ 1 2 0 3 ⎥⎥⎥ ⎢ ⎥ RT = ⎢⎢⎢⎢⎢ 2 1 3 0 ⎥⎥⎥⎥⎥ ⎣ ⎦ 1 1 1 1 aus RT Rh = σ2 h sind σ21 = 10 , σ22 = 22 , √ √ hT1 = [−1 1 0]/ 2 , hT2 = [3 3 2]/ 22 , √ (Rh1 )T = [1 − 1 3 − 3]/ 2 , √ (Rh2 )T = [1 1 1 1]11/ 22 . Pseudoinverse:
⎡ ⎢⎢⎢ 3 13 1 ⎢⎢⎢ R+ = ⎢ 13 2 110 ⎢⎢⎣ 5 5 ⎡ ⎢ 10 −1 1 ⎢⎢⎢⎢⎢ R+ R = ⎢ −1 10 11 ⎢⎢⎣ 3 3
⎤ −9 24 ⎥⎥⎥ ⎥ 24 −9 ⎥⎥⎥⎥⎥ , ⎦ 5 5 ⎤ 3 ⎥⎥⎥ ⎥ 3 ⎥⎥⎥⎥⎥ . ⎦ 2
Mit R+ R verifiziert man in der Tat R(R+ R) = R nach (35-32).
36 Interpolation Bei der Interpolation bildet man eine Menge von k = 0 bis n diskreten Stützpunkten Pk (xk , yk ) in der Ebene oder Pk (xk , yk , zk ) im Raum auf einen kontinuierlichen Bereich ab; dadurch ist man in der Lage, zu differenzieren, zu integrieren und beliebige Zwischenwerte y(x) in der Ebene und z(x, y) im Raum zu berechnen. Hier wird im Wesentlichen die ebene Interpolation behandelt.
36.1 Nichtperiodische Interpolation Besonders geeignet sind Polynome und gebrochen rationale Funktionen.
36 Interpolation
y = Pn (x) = ci xi ,
i = 0 bis n (Ebene) .
z = Pnx ny (x, y) = ci j xi y j , i = 0 bis n x , j = 0 bis ny , (n x + 1)(ny + 1) = n + 1 Gesucht:
(36-1)
(Raum) .
a 0 + a 1 x + . . . + a k xk , 1 + b 1 x + . . . + b m xm k+1+m = n+1.
c = [c0 . . . cn ] ,
n
lk = i=0 ik
(36-2)
k=0
(x − xi ) , siehe Kap. (22), Gl. (4). (xk − xi )
Pn = c0 + (x− x0 )c1 + (x − x0 )(x − x1 )c2 n−1 9 +. . . + (x − xi ) cn . i=0
Padé
Bézier
an2
..
. . . . . . . . . . ann
y = [y0 . . . yn ] , T
k−1
Name/Typ Berechnung der Koeffizienten Lagrange Explizite Darstellung n Pn (x) = yk lk (x),
Splines
a22 .. . . . . a j2 . . . a j j
(36-3) T
Tabelle 36-1. Typische Interpolationen in der Ebene. Insgesamt n + 1 Paare (xk , yk ), (xk , yk ), (xk , yk ) usw. sind gegeben
Hermite
o
⎤ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ c = y . ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎦
Gebrochen rationale Funktionen. y = Pkm =
Newton
⎡ ⎢⎢⎢ 1 ⎢⎢⎢⎢ 1 a ⎢⎢⎢ 11 ⎢⎢⎢ 1 a ⎢⎢⎢ 21 ⎢⎢⎢ .. .. ⎢⎢⎢ . . ⎢⎢ Pn (x j ) = y j: ⎢⎢⎢⎢ 1 a j1 ⎢⎢⎢ .. ⎢⎢⎢ .. . ⎢⎢⎢⎣ . Pn (xn ) = yn: 1 an1
Pn (x0 ) = y0: Pn (x1 ) = y1: Pn (x2 ) = y2: .. .
Gegeben: n + 1 Punkte Pk (xk , yk , zk ) . Gesucht: Polynome .
Die letzte Stützstelle xn erscheint nicht explizit in Pn (x). Rekursive Berechnung nach (3) aus den Paaren (x0 , y0 ) bis (xn , yn ). Rekursive Berechnung aus den Werten yk , yk , yk usw. an verschiedenen Stützstellen xk . Implizite Berechnung aus Paaren (xk , yk ) mit intern erzwungener Stetigkeit in Neigung y und „Krümmung“ y . Implizite Berechnung in der Regel aus Paaren (xk , yk ) mittels einer gebrochen rationalen Darstellung (2). Interpolation der Ortsvektoren rk in parametrischer Form.
Newton-Interpolation. Mit dem Ansatz in Tabelle 36-1 ergeben sich die Koeffizienten ck als Lösungen eines gestaffelten Gleichungssystems. Bei Hinzunahme eines (n + 2)-ten Stützpunktes kann die vorhergegangene Rechnung vollständig eingebracht werden.
a jk = (x j − x0 )(x j − x1 ) . . . (x j − xk−1 ) =
(x j − xi ) i=0
j = 1 bis n , k j , z. B. a22 = (x2 − x0 )(x2 − x1 ) . Die Berechnung der Funktion y(x) an einer Zwischenstelle x xk beginnt mit der inneren Klammer in (36-4) und dringt nach außen vor, ein Verfahren, das dem von Horner (34.2, (34-13)) entspricht. Horner-ähnliche Berechnung eines Zwischenwertes Pn (x) , x xk , für n = 4 . P4 (x) = c0 + (x − x0 ) × [c1 + (x − x1 ) [c2 + (x − x2 ) [c3 + (x − x3 )c4 ] ] ] . 1 2 3 321 Start mit Hilfsgröße b4 = c4 : b3 = c3 + (x − x3 )b4 , b1 = c1 + (x − x1 )b2 ,
(36-4)
b2 = c2 + (x − x2 )b3 , b0 = c0 + (x − x0 )b1 .
P4 (x) = b0 . Hermite-Interpolation. Stehen an einer Stützstelle xk Funktionswert yk und Ableitungen yk , yk bis yk(v) zur Verfügung, ist die Differenz x − xk im NewtonAnsatz bis zur (v + 1)-ten Potenz einzubringen. Das letzte Paar (xr , y(α) r ) geht nicht explizit in den Ansatz ein; also ist (x − xr )α die höchste Potenz mit xr . Beispiel: Hermite-Interpolation der 4 Paare (xk , yk ), (xk , yk ), k = 0, 1. P3 (x) = c0 + (x − x0 )[c1 + (x − x0 )[c2 + (x − x1 )c3 ] ] . 1 2 21 P3 (x) = c0 + (x − x0 )c1 + (x − x0 )2 c2 + (x − x0 )2 (x − x1 )c3 , P3 (x) = c1 + 2(x − x0 )c2 + (x − x0 )[2(x − x1 ) + (x − x0 )]c3 .
A133
A134
A Mathematik und Statistik / Mathematik
Berechnung der ck -Werte aus Pk (xk ) = yk , Pk (xk ) = yk . ⎤⎡ ⎤ ⎡ ⎤ ⎡ 0 0 0 ⎥⎥⎥ ⎢⎢⎢ c0 ⎥⎥⎥ ⎢⎢⎢ y0 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 1 0 0 ⎥⎥⎥ ⎢⎢⎢ c1 ⎥⎥⎥ ⎢⎢⎢ y0 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ = ⎢⎢⎢ y ⎥⎥⎥ . ⎢⎢⎢ 2 0 ⎥⎥⎦ ⎢⎢⎣ c2 ⎥⎥⎦ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎣ 1 (x1 − x0 ) (x1 − x0 ) ⎣ ⎦ y1 0 1 2(x1 − x0 ) (x1 − x0 )2 c3
– aus Stetigkeiten in jedem Innenpunkt:
Splines. Eine Menge von n+1 Stützpunkten Pk (xk , yk ) in der Ebene wird in jedem Teilintervall [xi , x j ], j = i + 1, durch ein Polynom si j (x) ungerader Ordnung p = 3, 5, . . . approximiert. Durch Stetigkeitsforderungen ⎫ ⎪ si j (x j ) = sjk (x j ) ⎪ ⎪ ⎪ ⎪ ⎬ stetig für x = x j , .. (36-5) ⎪ . ⎪ ⎪ j = 1 bis n − 1 , ⎪ ⎪ (p−1) (p−1) ⎭ si j (x j ) = s jk (x j )
Abhilfe: y0 , yn vorgeben oder y0 , yn vorgeben .
in den Intervallübergängen wird die Interpolation insgesamt nur durch die yk -Werte bestimmt. Besonders bewährt haben sich kubische Polynome s(x) in jedem Intervall [xi , x j ], j = i + 1 . Stetigkeit in s und s . si j (x) = ai j (x − xi )3 + bi j (x − xi )2 + ci j (x − xi ) + di j .
(36-6)
Bilanz der Bestimmungsgleichungen: Unbekannt sind n Quadrupel (ai j , bi j , ci j , di j ), also 4n Parameter. Gleichungen folgen – aus der Interpolation in jedem Intervall: si j (xi ) = y(xi ) = yi si j (x j ) = y(x j ) = y j (Insgesamt 2n Gleichungen.) ⎡ ⎢⎢⎢ 2(h01 + h12 ) ⎢⎢⎢⎢ h12 ⎢⎢⎢ ⎢⎢⎢ ⎢⎣
si j (x j ) = sjk (x j ) si j (x j ) = sjk (x j ) . (Insgesamt 2(n − 1) Gleichungen.) Insgesamt 4n − 2 Gleichungen für 4n Unbekannte. (36-7)
In der konkreten Rechnung formuliert man pro Intervall die Randgrößen si j (xi ) si j (x j ) si j (xi ) si j (x j ) si j (xi ) si j (x j )
= = = = = =
yi : yj : yi : yj : yi : yj
⎡ ⎢⎢⎢ 0 ⎢⎢⎢ 3 ⎢⎢⎢ hi j ⎢⎢⎢ ⎢⎢⎢ 0 ⎢⎢⎢ ⎢⎢⎢ 6hi j ⎢⎢⎢ 0 ⎢⎢⎣ 3h2i j
0 h2i j 2 2 0 2hi j
0 hi j 0 0 1 1
⎤ ⎡ ⎤ 1 ⎥⎥ y ⎥⎥⎥ ⎡ ⎤ ⎢⎢⎢⎢⎢ i ⎥⎥⎥⎥⎥ 1 ⎥⎥⎥ ⎢⎢ ai j ⎥⎥ ⎢⎢⎢ y j ⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ bi j ⎥⎥⎥⎥ ⎢⎢⎢⎢ yi ⎥⎥⎥⎥ ⎥⎥ ⎢⎢ ⎥⎥ = ⎢⎢ ⎥⎥ 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ ci j ⎥⎥⎥⎥ ⎢⎢⎢⎢ yj ⎥⎥⎥⎥ ⎥ ⎣ ⎦ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ yi ⎥⎥⎥ 0 ⎥⎥⎥⎥⎥ di j ⎦ ⎣ ⎦ yj 0
h i j = x j − xi .
(36-8)
Elimination der ai j bis di j durch yi , y j , yi , yj mittels der ersten 4 Gleichungen aus (36-8). ⎤⎡ ⎤ ⎤ ⎡ ⎡ 1 ⎥⎥⎥ ⎢⎢⎢ yi ⎥⎥⎥ ⎢⎢⎢ 6hi j ai j ⎥⎥⎥ ⎢⎢⎢ 0 0 −1 ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎢⎢⎢ 1 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ y j ⎥⎥⎥⎥⎥ ⎢⎢⎢ 2bi j ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 0 ⎥ ⎢⎢ ⎥⎥ . (36-9) ⎥ = ⎢⎢ ⎢⎢⎢ 2 2 ⎥ ⎢⎢⎣ 6hi j ci j ⎥⎥⎥⎥⎦ ⎢⎢⎢⎢ −6 6 −2hi j −hi j ⎥⎥⎥⎥ ⎢⎢⎢⎢ yi ⎥⎥⎥⎥ ⎦ ⎣ ⎦ ⎣ yj di j 1 0 0 0 Die Stetigkeitsforderungen in den Stützpunkten bestimmen schließlich ein Gleichungssystem mit tridiagonaler symmetrischer und diagonal dominanter Koeffizientenmatrix. Die allgemeine Struktur ergibt sich offensichtlich aus dem Sonderfall n = 5, also bei 4 inneren Stützpunkten. n = 5. y0 , yn = y5
vorgegeben.
⎤ ⎡ ⎤ ⎥⎥⎥ ⎢⎢⎢ y1 ⎥⎥⎥ ⎥⎥⎥⎥ ⎢⎢⎢⎢ y ⎥⎥⎥⎥ h23 ⎥⎥⎥ ⎢⎢⎢ 2 ⎥⎥⎥ = r , ⎥⎥⎥ ⎢⎢⎢ y ⎥⎥⎥ 2(h23 + h34 ) h34 ⎥⎦ ⎢⎣ 3 ⎥⎦ h34 2(h34 + h45 ) y4 ⎤ ⎡ ⎢⎢⎢ −( y1 − y0 )/h01 + ( y2 − y1 )/h12 − h01 y0 /6 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢ −( y2 − y1 )/h12 + ( y3 − y2 )/h23 r = 6 ⎢⎢⎢⎢ ⎥⎥⎥ . ⎢⎢⎢ −( y3 − y2 )/h23 + ( y4 − y3 )/h34 ⎥⎥⎦ ⎣ −( y4 − y3 )/h34 + ( y5 − y4 )/h45 − h45 y5 /6 (36-10) h12 2(h12 + h23 ) h23
36 Interpolation
n = 4. y0 , yn = y4 vorgegeben. ⎡ ⎤ ⎡ ⎤ h01 ⎢⎢⎢ 2h01 ⎥⎥⎥ ⎢⎢⎢ y0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ h12 ⎢⎢⎢ h01 2( h01 + h12 ) ⎥⎥⎥ ⎢⎢⎢ y1 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢⎢ h 2( h + h ) h 12 12 23 23 ⎥⎥⎥ ⎢⎢⎢ y2 ⎥⎥⎥ = r , ⎢⎢⎢ ⎥⎥ ⎢⎢⎢ y ⎥⎥⎥ ⎢⎢⎢ h 2( h + h ) h 23 23 34 34 ⎥ ⎥⎥⎦ ⎢⎢⎣ 3 ⎥⎥⎦ ⎢⎣ h34 2h34 y4 ⎤ ⎡ ⎥⎥ ⎢⎢⎢ ( y1 − y0 )/h01 −y0 ⎢⎢⎢⎢ ( y − y )/h −( y − y )/h ⎥⎥⎥⎥⎥ 1 12 1 0 01 ⎥ ⎢⎢⎢ 2 ⎥⎥ r = 6 ⎢⎢⎢⎢ ( y3 − y2 )/h23 −( y2 − y1 )/h12 ⎥⎥⎥⎥ . ⎥⎥ ⎢⎢⎢ ⎢⎢⎢⎣ ( y4 − y3 )/h34 −( y3 − y2 )/h23 ⎥⎥⎥⎥⎦ y4 −(y4 − y3 )/h34 Padé-Interpolation. Eine gebrochen rationale Interpolation ist besonders dann empfehlenswert, wenn die zu interpolierenden Stützpunkte einen Pol anstreben oder eine Asymptote aufweisen. Beispiel. 3 Punkte (0, 10), (2, 1) und (10, −4) sind durch eine Funktion a0 + a1 x P= 1 + b1 x
(36-11)
Mit Koeffizientenspalten k bi j anstelle von k ai j nach der Vorschrift k k r bi j = ai j (36-14) r=0
transformiert sich die Interpolation (36-12).
zu interpolieren .
ri j = 0 bi j (1 − t)3 + 3 1 bi j (1 − t)2 t
Aus (1 + b1 xk )yk = a0 + a1 xk oder a0 + a1 xk − b1 xk yk = yk für k = 1, 2, 3 folgt: ⎤⎡ ⎤ ⎡ ⎤ ⎡ ⎤ ⎢⎢⎢ 0 0 ⎥⎥⎥ ⎢⎢⎢ a0 ⎥⎥⎥ ⎢⎢⎢ 10 ⎥⎥⎥ 10 ⎥⎥⎥ ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ 2 −2 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ a1 ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢⎢ 1 ⎥⎥⎥⎥⎥ , a = ⎢⎢⎢⎢⎢ −3,88 ⎥⎥⎥⎥⎥ . ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 10 40 b1 −4 0,62 a1 = −6,258 . Grenzwert lim P = x→∞ b1 ⎡ ⎢⎢⎢ 1 ⎢⎢⎢⎢ 1 ⎢⎢⎣ 1
Bézier-Interpolation. Eine Menge von Stützpunkten Pk (xk , yk ) in der Ebene mit Ortsvektoren rk wird in jedem Teilintervall [ri , r j ], j = i + 1, in Parameterform (Parameter t) interpoliert.
+ 3 2 bi j (1 − t)t2 + 3 bi j t3 .
(36-15)
Die geometrische Bedeutung der „Bézier-Punkte“ k bi j folgt aus der Ableitung dri j /dt = ri j . ri j (t = 0) = −3 0 bi j + 3 1 bi j = 3 1 ai j , ri j (t = 1) = −3 2 bi j + 3 3 bi j = 3 3 ai j .
(36-16)
Die Bézier-Interpolation mittels der Ortsvektoren bi j gewährleistet demnach a priori Stetigkeit in ri j (t = 0), ri j (t = 0), ri j (t = 1), ri j (t = 1) in jedem Intervall [ri , r j ], siehe Bild 36-1.
Kubische Bézier-Splines in jedem Intervall [ri , r j ]. ri j = f0 (t)0 ai j + f1 (t)1 ai j + f2 (t)2 ai j + f3 (t)3 ai j . 3 3 l−1 l fk (t) = (−1)l+k t . l l−k l=k ri j = 0 ai j + (3t − 3t2 + t3 ) 1 ai j + (3t2 − 2t3 ) 2ai j + t3 3ai j .
(36-12)
!
ri j (t = 0) = 0ai j = ri . !
ri j (t = 1) = 0ai j + 1ai j + 2ai j + 3ai j = r j .
Bild 36-1. Vektoren k bi j zu den Bézier-Punkten kBi j des In-
(36-13)
tervalls [ri , r j ]. 1 ai j Tangente in 0 Bi j , 3 ai j Tangente in 3 Bi j
A135
A136
A Mathematik und Statistik / Mathematik
36.2 Periodische Interpolation
Tabelle 36-2. Sukzessive Summen/Differenzbildung für
Für eine Menge von 2N + 1 äquidistanten Stützpunkten Pk (xk , yk ), die sich entweder 2π-periodisch wiederholt oder die man sich 2π-periodisch fortgesetzt denkt, eignet sich eine Fourier-Interpolation F(x) nach dem Leitgedanken, die Summe der Differenzen zwischen yk und Fk = F(xk ), jeweils an den Stützstellen genommen, zum Minimum zu machen: Gegeben: 2N + 1 Stützpunkte (xk , yk ), 2π , äquidistant xk = k 2N k = 0, 1, 2, . . . , 2N ,
(36-17)
2π-Periodizität: y0 = y2N .
(36-18)
2N = 12
s j , d j : Summen, Differenzen der Ordinaten yk . S j , D j : Summen, Differenzen der Summen sk . S¯ j , D¯ j . Summen, Differenzen der Differenzen dk – y12 s0 – s0 s6
y1 y11 s1 d1 s1 s5
y2 y10 s2 d2 s2 s4
y3 y9 s3 d3 s3 –
y4 y8 s4 d4
Sj
S0
S1
S2
S3
Dj
D0
D1
D2
–
S¯ j D¯ j
sj dj
y5 y7 s5 d5 d1 d5 S¯ 1
y6 – s6 – d2 d4 S¯ 2
d3 – S¯ 3
D¯ 1
D¯ 2
–
Gesucht: Koeffizienten ai , bi der Fourier-Interpolation
Die Brauchbarkeit der Fourier-Interpolation steht und fällt mit der Ökonomie der numerischen Auswertung, was zur Konzeption der Schnellen N−1 1 1 (a j cos jx + b j sin jx) + aN cos N x Fourier-Transformation (Fast Fourier Transform, F(x) = a0 + 2 2 FFT) geführt hat. j=1 (36-19) Für N = 6 führt die harmonische Analyse nach Runge über eine Kette von Summen und Differenzen in Tabelle 36-2 zu den Koeffizienten in (36-23). √ 1 1 a0 a1 a2 b1 b2 S 0 + S 2 D0 + D2 /2 S 0 − S 2 /2 S¯ 1 /2 + S¯ 3 3 D¯ 2 /2 1 √ √ √ =A , A = . a6 a5 a4 b5 b4 S1 + S3 3 D1 /2 S 1 /2 − S 3 3 S¯ 2 /2 3 D¯ 2 /2 6 1 −1 (36-23) 6a3 = D0 − D2 , 6b3 = S¯ 1 − S¯ 3 . aus der Forderung 2N d= (Fi − yi )2 → Minimum , Fi = F(xi ) . (36-20) i=1
Durch 2N partielle Ableitungen ∂d/∂a j ( j = 0 bis N) und ∂d/∂b j ( j = 1 bis N − 1) erhält man die Koeffizienten y j , Nan = (−1) j y j , Na0 = Nak = y j cos kx j , Nbk = y j sin kx j , Summation jeweils von j = 1 bis N ,
k = 1 bis N − 1 .
(36-21)
Sonderfälle: Punktmenge (xk , yk ) symmetrisch zur y-Achse −→ alle bk = 0 . Punktmenge (xk , yk ) punktsymmetrisch zum Nullpunkt −→ alle ak = 0 .
(36-22)
Das System (36-23) ist so zu verstehen, dass die 1. Spalte links gleich ist der 1. Spalte rechts linksmultipliziert mit der Matrix A.
36.3 Integration durch Interpolation Die Interpolation dient nicht nur zur Verstetigung diskreter Punktmengen, sondern auch zur Abbildung komplizierter Intergranden f (x) auf einfach zu integrierende Ersatzfunktionen, vorzugsweise Polynome, nach Tabelle 36-3. Man spricht auch von „interpolatorischer Quadratur“. Alle numerischen Integrationsverfahren basieren auf einer linearen Entwicklung des Integranden in den Funktionswerten fk = f (xk ) ,
fk, i = f,i (xk ) ,
f,i = ∂ f /∂xi
usw . (36-24)
an gewissen Stützstellen xk , die entweder vorgegeben werden oder aus gewissen Optimalitätsgesichtspunkten folgen.
36 Interpolation
Tabelle 36-3. Integration durch Lagrange’sche Interpolationspolynome mit n + 1 Paaren (xk , fk ), k = 0 bis n, an äquidistanten Stützstellen xk , h = xi+1 − xi , gibt die NewtonCotes-Formeln. .b Q Näherung für I = f (x) dx, hn = b − a a
Name
Qn
Trapezregel
Q1 =
Simpson-Regel
Q2
3/8-Regel von Newton
Q3
4/90-Regel
Q4
–
Q5
I=
Gesucht
.
h ( fo + f1 ) 2 h = ( f0 + 4 f1 + f2 ) 3 3h ( f0 + 3 f1 + 3 f2 + f3 ) = 8 2h (7 f0 +32 f1 +12 f2 +32 f3 +7 f4 ) = 45 5h (19 f0 + 75 f1 + 50 f2 + 50 f3 = 288 +75 f4 + 19 f5 )
f (x) dG ,
G
Annäherung durch " % & Q= fk , i pki (x) dG fk pk (x) + G
=
fk wk0 +
integriert wird. Die Bestimmungsgleichungen sind linear in den wk und nichtlinear in den xk . Der Quadraturfehler En+1 = I − Qn+1 bei n + 1 Stützstellen ist explizit angebbar: En+1 =
22n+3 [(n + 1)!]4 h2n+3 f (2n+2) (ξ) , (2n + 3)[(2n + 2)!]3 −h ξ h . (36-26)
h5 (4) f (ξ) , 135 h7 f (6) (ξ) . (36-27) n = 2 : E3 = 15 750 Hermite-Quadraturformeln entstehen durch Einbeziehung der Ableitungen fk = f (xk ), fk usw. an den Stützstellen xk , k = 0 bis n. Mehrdimensionale Integrationsgebiete in Quaderoder Rechteckform werden auf Einheitskantenlängen transformiert und durch mehrdimensionale Aufweitung der eindimensionalen Quadraturformeln behandelt, siehe auch [2],[3]. Beispiel: Simpson-Integration im Quadrat nach Bild 36-2a für "1 "1 I= f (x, y) dx dy . (36-28) n = 1 : E2 =
−1 −1
fk,i wki .
(36-25)
Die Gewichtsfaktoren wk0 der Ordinaten fk und wki der partiellen Ableitungen ergeben sich aus der analytischen Integration der Interpolationspolynome pk (x) und pki (x). Zunächst folgen einige Formeln für gewöhnliche Integrale mit einer Integrationsvariablen. Durch Aufteilung des Integrationsgebietes in ganzzahlige Vielfache von n gelangt man zu den summierten Newton-Cotes-Formeln. Tschebyscheff’sche Quadraturformeln sind so konzipiert, dass die Gewichtsfaktoren wk in (36-25) allesamt gleichgesetzt werden. Die dazu passenden Stützstellen xk , k = 0 bis n folgen aus der Forderung, dass Polynome bis zum Grad n + 1 exakt integriert werden. Weitere Werte in [1, Tabelle 25-5] Gauß-Quadraturformeln basieren auf der Einbeziehung von n + 1 Gewichtsfaktoren wk und n + 1 Stützstellen xk , k = 0 bis n, in die numerische Integration derart, dass ein Polynom bis zum Grad 2n + 1 exakt
Bild 36-2. Simpson-Integration, a im Quadrat und b im
Würfel
A137
A138
A Mathematik und Statistik / Mathematik
Tabelle 36-4. Quadraturfehler En = I − Qn im Intervall [a, b] für Newton-Cotes Formeln. ξ bezeichnet die Stelle x mit dem Extremum von f (v)
n
1 −
En
2 3
h f (ξ) 12
−
3 5
h (4) f (ξ) 90
−
4 3 5 (4) h f (ξ) 80
Tabelle 36-5. Tschebyscheff-Integration
I=
.h
f (x)dx ,
−h
n 1 2 3 4
n 2h Qn = fk , n + 1 k=0
fk = f (xk )
xk /h √ ± 3/3 √ ± 2/2; 0 ±0,794654; ±0,187592 ±0,832498; ±0,374541; 0
−
I=
f (x) dx,
Qn =
−h
n 0 1 2 3 4
5
xk /h 0 √ ± 3/3 √ ± 0,6 0 ±0,86113631 ±0,33998104 ±0,90617985 ±0,53846931 0 ±0,93246951 ±0,66120939 ±0,23861919
n
k=0
wk f (xk )
wk /h 2 1 5/9 8/9 0,34785485 0,65214515 0,23692689 0,47862867 128/225 0,17132449 0,36076157 0,46791393
8 7 (6) h f (ξ) 945
−
275 7 (6) h f (ξ) 12 096
Tabelle 36-7. Hermite-Integration Q ≈ I =
.
f (x)dx
0
n
xk /h
2
0, 1, 2
1
0, 1
1
0, 1
Tabelle 36-6. Gauß-Integration
.h
5
Q=
Q h (7 f0 + 16 f1 + 7 f2 ) 15 h2 + ( f0 − f2 ) 15 h ( f0 + f1 ) 2 h2 + ( f0 − f1 ) 12 h ( f0 + f1 ) 2 h2 + ( f0 − f1 ) 10 h2 + ( f − f1 ) 120 0
Fehler E 16 h7 (6) · f (ξ) 15 7!
h5 (4) f (ξ) 750
−
h7 f (6) (ξ) 100 800
8 20 26 1 4 16 64 f27 . fi + fj + fk + 27 i=1 27 j=9 27 k=21 27 (36-29)
Singuläre Integranden, wie sie typisch sind für die Randelementmethoden (REM oder BEM), können numerisch regularisiert werden durch eine Aufweitung der singulären Stelle, die zum Beispiel im Nullpunkt des Einheitsdreiecks im Bild 36-3 liegen möge. Durch die Aufweitungstransformation x = (1 − ξ)x0 + ξ(1 − η)x1 + ξηx2 , y = (1 − ξ)y0 + ξ(1 − η)y1 + ξηy2 ,
Näherung Q: 1 ( f1 + f2 + f3 + f4 ) 9 4 16 + ( f5 + f6 + f7 + f8 ) + f9 . 9 9 Simpson-Integration im Würfel nach Bild 36-2b für Q=
"1 "1 "1 I=
f (x, y, z) dx dy dz , −1 −1 −1
Näherung Q:
Bild 36-3. Aufweitungstransformation bei Singularität im
Punkt P0
37 Numerische Integration von Differenzialgleichungen
Tabelle 36-8. Gauß-Integration in Dreiecken.
I=
.1 1−L . 1 0
Tabelle 36-9. Gauß-Integration in Tetraedern
f (L1 )dL2 dL3
0
wird die Singularität im Punkt (x = 0, y = 0) um den Grad 1 vermindert. "" "" I= f (x, y) dx dy = F(ξ, η)J dξ dη . Dreieck
Quadrat
(36-30)
37 Numerische Integration von Differenzialgleichungen mit der Jacobi-Determinante x,ξ x,η J = =ξ. y,ξ y,η
37.1 Anfangswertprobleme Anfangswertprobleme, kurz AWP, werden beschrieben durch gewöhnliche Differenzialgleichungen r-ter
A139
A140
A Mathematik und Statistik / Mathematik
Ordnung mit r vorgegebenen Anfangswerten im Anfangspunkt x0 . y(r) = f (x, y, . . . , y(r−1) ) , y(r) = dr y/dxr , ⎫ ⎪ y(r−1) (x0 ) = y(r−1) ⎪ ⎪ 0 ⎪ ⎪ ⎬ .. .. (37-1) r Anfangswerte . ⎪ . . ⎪ ⎪ ⎪ ⎪ ⎭ y (x ) = y 0
0
Durch die Einführung von r−1 zusätzlichen Zustandsgrößen lässt sich (37-1) auch stets als System von r Dgln. jeweils 1. Ordnung formulieren, sodass dem Sonderfall r = 1, y = f (x, y) ,
y = y(x) ,
y = dy/dx ,
y(x0 ) = y0 vorgegeben ,
(37-2)
eine besondere Bedeutung zukommt. Von x0 und y(x0 ) = y0 ausgehend, liefert z. B. eine abgebrochene Taylor-Entwicklung mit der Schrittweite h einen Näherungswert Y1 für y1 = y(x0 + h). h h2 h p (p) y0 + y0 + . . . + y0 , 1! 2! p! y0 = f (x0 , y0 ) , y0 = y (x0 ) = f (x0 , y0 ), . . . , (37-3)
Y1 = y0 +
y = f, x + f,y y = f, x + f,y f =: f2 , f, x = ∂ f /∂x , y
= f, xx +2 f f, xy + f 2 f,yy + f2 f,y ,
h p+1 p+1 y (x0 + ξh) , 0 ξ 1 . (p + 1)! Die Näherung (37-3) besitzt die lokale Fehlerordnung p für einen Fehler d der Größenordnung (O) von h p+1 , kurz d1 = y1 − Y1 =
yk+1 − yk =
f (x, y) dx . xk
fi = f (xk + ξi h, Yi ) , Yi = Y(xk + ξi h) , (37-5) 0 ξi 1 . m Stufenzahl . Die Stützstelle ξi im Intervall [0,1] und die Gewichtsfaktoren wi werden für eine konkrete Stufenzahl m so berechnet, dass die lokale Fehlerordnung p möglichst hoch wird. Explizite RKV.
Die Zwischenwerte Yi = Y(xk + ξi h) werden sukzessive beim Fortschreiten von ξ1 = 0 bis ξm eliminiert. Implizite RKV.
Alle Werte Yi eines Intervalls [xk , xk+1 ] sind miteinander gekoppelt. Bei nichtlinearen Dgln. führt dies auf ein nichtlineares algebraisches Gleichungssystem. Die klassischen RK-Formeln ersetzen die Zwischenwerte Yi durch Steigungen ki : Explizite RK-Schemata, Stufenzahl m. Gegeben: y = f (x, y), y(x0 ) = y0 . Gesucht: Extrapolation von einem Näherungswert Yk für y(xk ) auf einen Wert Yk+1 für y(xk + h), sog. Einschrittverfahren: Yk+1 = Yk + h
m
γi ki .
(37-6)
i=1
k1 = f (xk + ξ1 h, Yk ) , k2 = f (xk + ξ2 h, Y2 ) ,
ξ1 = 0 , Y2 = Yk + hβ21 k1 ,
k3 = f (xk + ξ3 h, Y3 ) , .. .
Y3 = yk + h(β31 k1 + β32 k2 ) ,
km = f (xk + ξm h, Ym ) ,
Ym = Yk + h
m
βmi ki .
i=1
(37-4)
Runge-Kutta-Verfahren, kurz RKV, gehen in ihrer Fehlerabschätzung auf die Taylor-Entwicklung zurück, lassen sich jedoch kompakter herleiten über eine (2) zugeordnete Integraldarstellung im Intervall [xk , xk+1 ] der Länge h. xk +h "
Yk+1 = Yk + h(w1 f1 + . . . + wm fm ) ,
usw.
Aus der Differenz d1 zwischen dem berechneten Näherungswert Y1 und dem in der Regel unbekannt bleibenden exakten Wert y1 ergibt sich die lokale Fehlerordnung p.
dk = yk − Yk = O(h p+1 ) .
Näherung durch numerische Integration:
Die Koeffizienten ξi , βi j und γi ordnet man platzsparend in einem Schema an. ξ1 = 0 ξ2 ξ3 .. . ξm
β21 β31 β32 .. .. . . βm1 βm2 . . . βm, m−1 γ1 γ2 . . . γm−1 γm
(37-7)
37 Numerische Integration von Differenzialgleichungen
Tabelle 37-1. Explizites Runge-Kutta-Verfahren mit m1 = 4, p1 = 4 und m2 = 6, p2 = 5. Lokaler Fehler
d=
h (−42k1 − 224k3 − 21k4 + 162k5 + 125k6 ) + O(h6 ) 336
0 1 2 1 2
1 2 1 4
1 4
1
0
−1
2 3 1 5
7 27 28 625
10 27 1 − 5
γi für m1 = 4
1 6 14 336
γi für m2 = 6
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ m1 = 4 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
2 1 27 54 625
0 546 625
0
4 6
0
0
−
1 6 35 336
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ m2 = 6 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
378 625
162 336
125 336
Tabelle 37-2. Explizites Runge-Kutta-Verfahren mit m1 = 6, p1 = 5 und m2 = 8, p2 = 6. Lokaler Fehler
d≈
5h (k8 + k7 − k6 − k1 ) 66
0 1 6 4 15 2 3 4 5 1 0 1 γi für m1 = 6 γi für m2 = 8
1 6 4 75 5 6 8 − 5 361 320 11 640 93 640
−
31 384 7 1408
16 75 8 − 3 114 25 18 − 5 0 − 0 0
18 5
5 2 −4 407 128
16 25 11 − 80
55 128
11 256 803 256
−
11 160 11 − 160
11 256 99 256
1125 2816 1125 2816
9 32 9 32
125 768 125 768
1
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ m2 = 8 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
5 66
5 66
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ m1 = 6 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ 0 0 5 66 0
A141
A142
A Mathematik und Statistik / Mathematik
Konsistenzbedingungen: m
γi = 1 ,
j−1
ξj =
i=1
β j, i
für
p1.
(37-8)
i=1
Interessant für die Schrittweitensteuerung sind Algorithmen, die aus einem Vergleich von 2 Verfahren mit verschiedenen Stufenzahlen m1 und m2 auf den lokalen Fehler schließen lassen, wobei die Auswertungen für m1 vollständig für die Stufe m2 zu verwerten sind; siehe Tabellen 37-1, 37-2. Bei impliziten RKV folgen die Werte ki , i = 1 bis m, aus einem nichtlinearen algebraischen System, z. B. für m = 2: k1 = f (xk + ξ1 h, Y1 ) ,
Y1 = Yk + h(β11 k1 + β12 k2 ) ,
k2 = f (xk + ξ2 h, Y2 ) , Y2 = Yk + h(β21 k1 + β22 k2 ) . (37-9) Yk+1 = Yk + h(γ1 k1 + γ2 k2 ) . Der große numerische Aufwand kommt einer hohen Fehlerordnung p zugute und ist in Anbetracht einer numerisch stabilen Integration sog. steifer Dgln. unumgänglich. Besonders günstige p-Werte relativ zu der Stufenzahl m erzeugen Gaußpunkte ξi ; siehe Tabelle 37-3. Steife Differenzialgleichungen sind erklärt an linearen Systemen über die Realteile der charakteristischen Exponenten λ. y (x) = Ay(x) ,
A = const ,
Lösungsansatz
y(x) = eλx y0
führt auf
Gegeben: y + y = 0 mit y(x = 0) = y0 . Analytische Lösung: y(x) = y0 e−x , (37-12) Numerische Lösung: s-Schritt-Verfahren a s Yk+s + . . . + a1 Yk+1 = a0 Yk . 1-Schritt-Verfahren a1 Yk+1 = a0 Yk , ai = ai (h) . (37-13) Die Differenzengleichungen (37-13) lassen sich wiederum analytisch lösen, wobei die Eigenwerte λ über die numerische Stabilität entscheiden. Ansatz für (37-13): Yk = λk y0 . s beliebig : a s λ s + . . . + a1 λ = a0 ,
(37-14)
s = 1 : a1 λ = a0 . Stabilitätscharakter. Falls alle |λ j | < 1für beliebige Schrittweite h : (37-15) Absolute Stabilität. Falls alle |λ j | < 1 für eine spezielle maximal zulässige Schrittweite hmax : Bedingte Stabilität . Für steife Dgln. eignen sich nur absolut stabile Verfahren.
( A − λI)y0 = 0 → λ1 bis λn . Steifheit S = |Re(λ j )|max /|Re(λ j )|min .
Bei großer Steifheit S sind in der Regel nur implizite Verfahren brauchbar, da ansonsten die Rechnung zur Divergenz neigt, oder die Zeitschritte irrelevant klein werden. Das Phänomen der numerischen Stabilität dokumentiert sich in folgender Testaufgabe für Stabilität.
(37-10)
Bei nichtlinearen Dgln. linearisiert man im aktuellen Punkt xk . Gegeben ⎡ ⎤ ⎡ ⎤ ⎢⎢⎢ y1 ⎥⎥⎥ ⎢⎢⎢ f1 (x, y) ⎥⎥⎥ ⎢⎢⎢⎢ . ⎥⎥⎥⎥ ⎢⎢⎢⎢ . ⎥⎥⎥⎥ ⎢⎢⎢ .. ⎥⎥⎥ = ⎢⎢⎢ .. ⎥⎥⎥ = f . ⎢⎣ ⎥⎦ ⎢⎣ ⎥⎦ yn fn (x, y) Linearisierung im Punkt (xk , yk ); y = yk + z , z = J(xk , yk )z + f k + (x − xk ) f k , () = d()/dx , ⎤ ⎡ ⎢⎢⎢ f1,1 . . . f1,n ⎥⎥⎥ ⎢⎢⎢ . .. ⎥⎥⎥⎥ (37-11) J = ⎢⎢⎢⎢ .. . ⎥⎥⎥⎥ , fi, j = ∂ fi /∂y j . ⎢⎣ ⎦ fn,1 . . . fn,n
Padé-Approximation. Gebrochen rationale Polynomapproximationen Pmn nach Padé in Tabelle 22-1 speziell für die e-Funktion sind offensichtlich besonders geeignete Stabilitätsgaranten, falls nur für den Fall der Dgl. (27-12) n m gewählt wird. Beispiel: Die harmonische Schwingung y + y = 0 mit y0 = y(x0 ), y0 = y (x0 ) ist grenzstabil; das heißt, die quadratische Form y2 + y2 = Q bleibt zeitunveränderlich konstant. Die Rechnung geht aus von einem System y = Ay 1. Ordnung mit y = v: y 0 1 y= , A= . y1 = exp( Ah)y0 . v −1 0 Eine matrizielle P22 -Entwicklung nach Tabelle 22-1 mit
37 Numerische Integration von Differenzialgleichungen
Tabelle 37-3. Implizite Runge-Kutta-Gauß-Verfahren
m = 2, p = 4 √ (3 − 3)/6 √ (3 + 3)/6 m = 3, p = 6 √ (5 − 15)/10 1/2 √ (5 + 15)/10
1/4 √ (3 + 2 3)/12 1/2
√ (3 − 2 3)/12 1/4 1/2 √ (10 − 3 15)/45 2/9 √ (10 + 3 15)/45 4/9
5/36 √ (10 + 3 15)/72 √ (25 + 6 15)/180 5/18
y1 = P22 y0 , y2 = P22 y1 usw. −1 h h I+ A und P22 = I − A 2 2 ⎡ 2 ⎢ ⎢⎢⎢ 1 − h h 2 −1 ⎢ ⎢ h ⎢⎢⎢ 4 = 1+ ⎢⎢ ⎢ 4 ⎢⎢⎢ h2 ⎣ −h 1− 4
⎤ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎦
garantiert in der Tat mit Q1 = yT1 y1 = yT0 PT22 P22 y0 = yT0 Iy0 die Erhaltung des Anfangswertes Q0 unabhängig vom Zeitschritt h. Die P22 -Approximation des obigen Beispiels hat als stabile Variante des sog. Newmark-Verfahrens eine große Bedeutung in der Strukturdynamik.
37.2 Randwertprobleme Randwertprobleme, kurz RWP, werden beschrieben durch gewöhnliche oder partielle Dgln. mit einem Differenzialoperator DG im abgeschlossenen Definitionsgebiet G und zusätzlichen Vorgaben DR [y]+rR = 0 in allen Randpunkten. ' Gebiet G : DG [y(x)] + rG = 0 RWP [y, r] = 0 . Rand R : DR [y(x)] + rR = 0 (37-16) Gewöhnliches Dgl.-System: Spalte x enthält nur eine unabhängige Veränderliche. Alle Verfahren zur Approximation der in aller Regel unbekannt bleibenden exakten Lösung y(x) basieren auf einer Interpolation mit gegebenen linear unabhän-
√ (25 − 6 15)/180 √ (10 − 3 15)/72 5/36 5/18
gigen Ansatzfunktionen f1 (x) bis fn (x), deren Linear kombination Y(x) = ci fi (x) mit vorerst unbestimmten Koeffizienten ci so einzurichten ist, dass der Defekt (auch Residuum genannt) d(x) = RWP[Y, r]
(37-17)
oder ein zugeordnetes Funktional minimal wird. Die physikalisch begründeten Aufgaben in den Ingenieurwissenschaften erfordern gewichtete Defektanteile mit identischen Dimensionen. Beispiel: Die Längsverschiebung u(x) und die Längskraft L = EA du/dx eines Stabes mit Dehnsteifigkeit EA nach Bild 37-1 werden ganz allgemein Tabelle 37-4. Gebräuchliche Defektfunktionen.
n-Ansatzordnung, G Definitionsgebiet, DG Differenzialoperator des RWP in G, R Rand des RWP Typ Diskrete Defektquadrate Integrales Defektquadrat Gewichtete Residuen (GalerkinVerfahren)
Darstellung m k=1
.
d2 (xk ) → Minimum,
m>n.
d2 (x)(dG + dR) → Minimum .
G+R
.
gk d(x)(dG + dR) = 0, k = 1 bis n .
G+R
gk Linear unabhängige Gewichtsoder Projektionsfunktionen gk ≡ fk Klassisches Ritz-Verfahren (FEM) DG [gk ] = 0 Trefftz-Ansatz DG [gk ] = δk Randelementmethode (REM) Kollokation dk = d(xk ) = 0 , k = 1 bis n.
A143
A144
A Mathematik und Statistik / Mathematik
Bild 37-1. Dehnstab mit Längsbelastung p(x)
durch Gebiets- und Randgleichungen bestimmt. (•) = d(•)/dξ = hd(•)/dx, x = hξ.
Verfügung. Der Randterm [. . .]R verschwinded damit identisch, die Integralmatrix H11 = f f T dξ findet man in (37-20), die Integration des Belastungsterms ist noch durchzuführen. EA 1 p1 h 2 4 −1 u0 = o. − 4 u1 A 30 −1 60 −3 Lösung:
Gebiet G: [−EAu /h2 − p]G = 0 ;
hier p = p1 x/h .
Rand R0 mit vorgegebener Verschiebung u¯ : [u − u¯ ]R0 = 0 ;
hier R0 = R und u¯ = 0 .
Rand R1 mit vorgegebener Längskraft L¯ = EA¯u /h: [EAu /h − EA¯u /h]R1 = 0 ;
hier kein Rand R1 . . Das gewichtete Gebietsresiduum g[. . .]G dx mit dimensionsloser Gewichtsfunktion g und Länge dx = h dξ hat die Dimension einer Kraft. Der R1 -Anteil wird ebenfalls mit g bewertet (korrespondierend mit der Verschiebung u), der R0 -Anteil hingegen mit EA dg/dx (korrespondierend mit der Längskraft L). ' " EA 2 g [u¯ − u] g[−EAu /h − p]hdξ + h R0 G ' g [EAu − EA¯u ] + =0. h R1 Bei spezieller Wahl identischer Ansatz- und Gewichtsfunktionen ( f = g) ist eine partielle Integration für die numerische Auswertung günstig. Für die Sondersituation im Bild 37-1 mit ausschließlichem Randtyp R0 und u¯ = 0 gilt " EA EA g u − phg dξ − (g u + gu ) =0. h h R0 =R
In der numerischen Praxis bevorzugt man Lagrange’sche Interpolationspolynome sowohl für die Approximation der Zustandsgrößen y(x) als auch für die Transformation eines krummlinig berandeten auf ein geradlinig begrenztes Gebiet. Bei gleicher Ordnung der Transformation und der Approximation spricht man vom isoparametrischen Konzept. Für eindimensionale Aufgaben sind auch Hermite-Interpolationen mit Randwerten y0 = y(ξ = 0), y0, y0 , sowie y1 = y(ξ = 1), y1 , y1 verbreitet. Für Schreibtischtests sehr nützlich sind Integralmatrizen der Hermite-Polynome. Ansatzpolynome Yk , k = Polynomgrad +1. nk Spalte der Hermite-Polynome, pk Spalte der Knotenparameter. Yk = [nT (ξ) p]k = [ pT n(ξ)]k . "1
"1 Y Y dξ = p Hrr p , (r) (r)
T
Hrr =
0
[n(r) ][n(r) ]T dξ . 0
"1
"1 Ydξ = pT h ,
h=
0
n dξ .
(37-18)
0
Y2 = (1 − ξ)y0 + ξy1 , nT2 = [(1 − ξ) ξ] , pT2 = [y0 y1 ] , 1 2 1 1 −1 = , , H11 = −1 1 6 1 2 (37-19) 1 1 = . 2 1
k = 2: H00
G
Ansatzfunktionen ci fi (ξ) für u(ξ) mit verschwindenden Randwerten u0 = u1 = 0 und identische Gewichtsfunktionen stehen zum Beispiel mit kubischen Hermite-Polynomen in Tabelle 22-2 zur
EA u0 p1 h 1 L0 = = . L1 h u1 6 −2
h
k = 4 : Y4 siehe Tabelle 22-2 für n = m = 1 , pT = [y0 y0 y1 y1 ],
() = d()/dξ ,
37 Numerische Integration von Differenzialgleichungen
H22
H11
H00
⎡ ⎡ ⎤ ⎤ 3 −6 3 ⎥⎥ ⎢⎢⎢ 6 ⎢⎢⎢ 6 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥ ⎥ 1 3 2 −3 1 ⎢ ⎥⎥⎥ ⎢⎢⎢⎢ 1 ⎥⎥⎥⎥ , = 2 ⎢⎢⎢⎢ , h = ⎥ ⎥ ⎢⎢⎢ −6 −3 6 −3 ⎥⎥⎥ 12 ⎢⎢⎢⎢ 6 ⎥⎥⎥⎥ ⎣ ⎣ ⎦ ⎦ 3 1 −3 2 −1 ⎡ ⎤ 3 −36 3 ⎥⎥ ⎢⎢⎢ 36 ⎥⎥ ⎢ 1 ⎢⎢⎢⎢ 3 4 −3 −1 ⎥⎥⎥⎥ ⎢⎢ ⎥⎥ , = (37-20) 36 −3 ⎥⎥⎥⎥ 30 ⎢⎢⎢⎢ −36 −3 ⎣ ⎦ 3 −1 −3 4 ⎡ ⎤ 54 −13 ⎥⎥ ⎢⎢⎢ 156 22 ⎥⎥ ⎢ 1 ⎢⎢⎢⎢ 22 4 13 −3 ⎥⎥⎥⎥ ⎢⎢ ⎥⎥ . = 420 ⎢⎢⎢⎢ 54 13 156 −22 ⎥⎥⎥⎥ ⎣ ⎦ −13 −3 −22 4
37.3 Mehrgitterverfahren (Multigrid method)
∧
∧
ν1 = ν0 + α1 k1 ,
AF = ATF
(37-22)
Bild 37-2. Diskretisierungen beim 2-Gitterverfahren
...
ν j = ν j−1 + α j k j . (37-23)
Der Parameter α j wird über das Minimum der dem Gleichungssystem (37-22) zugeordneten quadratischen Form QF bestimmt: 1 T ν AF ν − νT rF → Minimum , 2 ∂QF 1 = 0 → αj = r j − νTj−1 a j . ∂α j ajj QF =
a j j = kTj AF k j ,
Technische Systeme werden häufig durch Differenzialgleichungen beschrieben. Die numerische Lösung hingegen erfolgt in der Regel anhand zugeordneter diskreter Formulierungen. Ersetzt man zum Beispiel in der Gleichgewichtsgleichung −M = q des geraden Balkens mit Schnittmoment M und Streckenlast q den Differenzialquotienten d2 M/dx2 durch finite Differenzen zwischen den Zustandsgrößen M j−1 , M j , M j+1 , in den Knoten j − 1, j, j + 1 eines eindimensionalen Gitters, so erhält man durch Kollokation im Mittelknoten j die zugeordnete Differenzengleichung 1 (−M j−1 + 2M j − M j+1 ) = q j . (37-21) h2 Die Idee der Mehrgittermethode besteht darin, die Lösung entsprechend Bild 37-2 für ein feines Gitter darzustellen, den Hauptteil des numerischen Aufwandes dabei jedoch auf ein zugeordnetes grobes Gitter zu verlegen. Auf dem feinen Gitter mit dem System AF xF = rF , x = M, r = q ,
der zusammengefassten Differenzengleichungen (37-21) wird lediglich eine Startlösung ν0 für xF sukzessive in den Koordinatenrichtungen k j verbessert.
a j = AF k j ,
(37-24)
r j = kTj rF .
Einen vollständigen Zyklus von j = 1 bis j = n bezeichnet man als eine Tour. Diese Methode – unter den Namen Koordinatenrelaxation und GaußSeidel-Verfahren wohlbekannt – konvergiert sehr schleppend. Zur Beschleunigung nimmt man den aktuellen Defekt dFj = AF ν j − rF des Gleichungsystems, um den Fehler eFj = xF − ν j der Näherung ν j zu berechnen. AF eFj + ν j = rF → AF eFj = −dFj ; dFj = AF ν j − rF . (37-25) Dieser Fehler eFj wird nun allerdings nicht auf dem feinen, sondern auf dem groben Gitter berechnet. Das ist der Kern des Mehrgitterverfahrens. Das folgende Beispiel nach Bild 37-2 zeigt den Ablauf der Rechnung für nur 2 Gitter. Gleichungssystem AG xG = rG des groben Gitters: ⎡ ⎤ ⎤⎡ ⎡ ⎤ ⎢ 2 −1 ⎢⎢⎢ 0 ⎥⎥⎥ 0 ⎥⎥⎥ ⎢⎢⎢ M2 ⎥⎥⎥ 1 ⎢⎢⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢ ⎥ 2 −1 ⎥⎥⎥ ⎢⎢⎢ M4 ⎥⎥⎥ = q ⎢⎢⎢⎢⎢ 1 ⎥⎥⎥⎥⎥ . ⎢⎢⎢ −1 2 4h ⎣ ⎦ ⎦⎣ ⎣ ⎦ 0 −1 2 M6 1 Gleichungssystem AF xF = rF des feinen Gitters: ⎡ ⎤ ⎡ ⎤ ⎤⎡ ⎢⎢⎢ 2 −1 0 0 0 0 0 ⎥⎥⎥ ⎢⎢⎢ M1 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎢ ⎢⎢⎢ −1 2 −1 0 0 0 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ M2 ⎥⎥⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢ 0 −1 2 −1 0 0 0 ⎥⎥⎥ ⎢⎢⎢ M3 ⎥⎥⎥ ⎢⎢ 0 ⎥⎥ 1 ⎢⎢⎢⎢ ⎥ ⎥ ⎢ ⎥⎥⎥ ⎢⎢⎢ M4 ⎥⎥⎥ = q ⎢⎢⎢⎢⎢ 1 ⎥⎥⎥⎥⎥ . ⎢ 0 0 −1 2 −1 0 0 ⎢ ⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥ ⎢⎢ h2 ⎢⎢⎢⎢ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎢ 0 0 0 −1 2 −1 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ M5 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎢ 0 0 0 0 −1 2 −1 ⎥⎥⎥ ⎢⎢⎢ M6 ⎥⎥⎥ ⎢⎣ ⎥⎦ ⎣ ⎦ ⎦⎣ 0 0 0 0 0 −1 2 M7 1
A145
A146
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Die Startlösung für das feine Gitter wird von der exakten Lösung auf dem groben Gitter geliefert. ⎡ ⎤ ⎢⎢⎢ 3 ⎥⎥⎥ ⎢ ⎥ AG xG = rG → xG = qh2 ⎢⎢⎢⎢⎢ 6 ⎥⎥⎥⎥⎥ . ⎣ ⎦ 5 Diese Werte xG werden auf das feine Gitter interpoliert; dort bilden sie lediglich eine Näherung ν0 . Diesen Prozess nennt man Prolongation.
ν0 = PxG ,
⎡ ⎢⎢⎢ 1 ⎢⎢⎢ ⎢⎢⎢ 2 ⎢⎢⎢ ⎢1 1 ⎢⎢⎢⎢ P = ⎢⎢⎢ 0 2 ⎢⎢⎢ ⎢⎢⎢⎢ 0 ⎢⎢⎢ 0 ⎢⎢⎣ 0
0 0 1 2 1 0 0
⎤ 0 ⎥⎥⎥ ⎥ 0 ⎥⎥⎥⎥⎥ ⎥ 0 ⎥⎥⎥⎥ ⎥⎥ 0 ⎥⎥⎥⎥ , ⎥ 1 ⎥⎥⎥⎥⎥ ⎥ 2 ⎥⎥⎥⎥⎥ ⎦ 1
⎡ ⎤ ⎢⎢⎢ 3 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 6 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢ 9⎥ qh2 ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢ 12 ⎥⎥ . ν0 = 2 ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢⎢⎢ 11 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 10 ⎥⎥⎥⎥ ⎢⎣ ⎥⎦ 5
Diese Startlösung ν0 für das feine Gitter wird einigen Touren auf dem feinen Gitter unterworfen; hier zwei Touren: ⎡ ⎤ ⎢⎢⎢ 24 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 48 ⎥⎥⎥ ⎢⎢⎢ 72 ⎥⎥⎥⎥ 2 ⎢ ⎢⎢⎢ ⎥⎥⎥ qh ⎢⎢⎢ 88 ⎥⎥⎥ , nach der 1. Tour , ν(1) = 16 ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢⎢⎢ 92 ⎥⎥⎥⎥ ⎢⎢⎢ 74 ⎥⎥⎥ ⎢⎢⎣ ⎥⎥⎦ 45
ν
(2)
⎡ ⎤ ⎢⎢⎢ 48 ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 96 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢ 136 ⎥⎥⎥⎥⎥ qh2 ⎢⎢⎢⎢ ⎥ = ⎢⎢⎢⎢ 176 ⎥⎥⎥⎥⎥ , 32 ⎢⎢ ⎢⎢⎢ 178 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ 150 ⎥⎥⎥⎥⎥ ⎣ ⎦ 91
Der Defekt auf dem feinen Gitter nach 2 Touren dF = AF ν(2) − rF , q [0 8 0 6 − 2 − 1 0] (dF )T = 32 wird auf das grobe Gitter reduziert, (dabei empfiehlt sich 12 PT als Reduktionsmatrix) dG =
1 T P 2
⎡ ⎤ ⎢ 16 ⎥ q ⎢⎢⎢⎢⎢ ⎥⎥⎥⎥⎥ dF = ⎢ 10 ⎥ , 128 ⎢⎢⎣ ⎥⎥⎦ −4
um den Fehler eG auf dem groben Gitter zu berechnen ⎡ ⎡ ⎤ ⎤ ⎢⎢⎢ −16 ⎥⎥⎥ ⎢⎢⎢ 2 −1 0 ⎥⎥⎥ 1 ⎢⎢⎢ q ⎢⎢⎢ ⎥ ⎥ 2 −1 ⎥⎥⎥⎥⎥ eG = ⎢ −10 ⎥⎥⎥⎥⎥ ⎢ −1 128 ⎢⎢⎣ 4h2 ⎢⎢⎣ ⎦ ⎦ 4 0 −1 2 ⎡ ⎤ 8⎥ 2 ⎢ qh ⎢⎢⎢⎢⎢ ⎥⎥⎥⎥⎥ → eG = − ⎢⎢⎢ 8 ⎥⎥⎥ 16 ⎣ ⎦ 3 und diesen ausschließend auf das feine Gitter zu prolongieren: qh2 [8 16 16 16 11 6 3] , eF = PeG → (eF )T = − 32 νTF : = (ν(2) + eF )T 2 qh = [40 80 120 160 167 144 88] . 32 Dieses Ergebnis νF wird einem weiteren Rechenzyklus als Startwert zugeführt. Das exakte Ergebnis
nach der 2. Tour .
xTF =
qh2 [40 80 120 160 168 144 88] . 32
wird in wenigen Schritten erreicht. Erweiterungen des Verfahrens auf mehrere Diskretisierungsgitter liegen auf der Hand.
38 Wahrscheinlichkeitsrechnung
Wahrscheinlichkeitsrechnung und Statistik M. Wermuth 38 Wahrscheinlichkeitsrechnung 38.1 Zufallsexperiment und Zufallsereignis Die Wahrscheinlichkeitsrechnung beschreibt die Gesetzmäßigkeiten zufälliger Ereignisse. Ein Zufallsereignis ist das Ergebnis eines Zufallsexperiments, d. h. eines unter gleichen Bedingungen im Prinzip beliebig oft wiederholbaren Vorganges mit unbestimmtem Ergebnis. Jedes mögliche, nicht weiter zerlegbare Einzelergebnis eines Zufallsexperiments heißt Elementarereignis, die Menge aller Elementarereignisse Ergebnismenge E. Jede Teilmenge der Ergebnismenge E definiert ein zufälliges Ereignis, die Menge aller möglichen Ereignisse heißt Ereignisraum G. Zum Ereignisraum G gehören somit neben allen Elementarereignissen auch alle Vereinigungsmengen von Elementarereignissen (zusammengesetzte Ereignisse) sowie die beiden unechten Teilmengen von E, nämlich die leere Menge ∅ und die Ergebnismenge E selbst. Beispiel 1: In einer Urne befinden sich drei Lose mit den Nummern 1, 2 und 3. Es wird jeweils ein Los gezogen und wieder zurückgelegt. Zufallsexperiment: Ziehen eines Loses. Elementarereignisse: Ziehen der Losnummern {1}, {2}, {3}. Ergebnismenge: E = {1, 2, 3}. Ereignisse: Zum Beispiel Ziehen der Losnummer {3}, Ziehen einer ungeraden Losnummer {1, 3}, Ziehen einer Losnummer kleiner 3 {1, 2}. Ereignisraum: G = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}. Zufallsereignisse werden mit Großbuchstaben A, B, . . . bezeichnet. Durch Anwendung der bekannten Mengenoperationen entstehen neue Zufallsereignisse: Vereinigung der Ereignisse A und B: das Ereignis A ∪ B tritt ein, wenn das Ereignis A oder das Ereignis B eintritt (Bild 38-1a). Durchschnitt der Ereignisse A und B: Das Ereignis A ∩ B tritt ein, wenn die Ereignisse A und B eintreten (Bild 38-1b).
Bild 38-1. Venn-Diagramme
Sicheres Ereignis E: Das sichere Ereignis ist das Ereignis, das immer eintritt, d. h. die Ergebnismenge E. Unmögliches Ereignis ∅: Das unmögliche Ereignis ist das Ereignis, das nie eintritt, d. h. die leere Menge ∅. ¯ Das zum Ereignis A Komplementärereignis A: (bezüglich E) komplementäre Ereignis A¯ tritt ein, wenn A nicht eintritt. Es gilt A¯ = E\A, und demzufolge A ∪ A¯ = E, A ∩ A¯ = ∅ (Bild 38-1c). Disjunkte (unvereinbare) Ereignisse: Zwei Ereignisse A und B heißen disjunkt (unvereinbar), wenn ihr Durchschnitt die leere Menge ist: A ∩ B = ∅. Disjunkte Ereignisse enthalten keine gemeinsamen Elementarereignisse. Elementarereignisse sind disjunkte Ereignisse (Bild 38-1d). Beispiel 2: Für das Zufallsexperiment von Beispiel 1 gilt: Für die Ereignisse A = {1, 2} und B = {2, 3} ist die Vereinigung A ∪ B = {1, 2, 3}, der Durchschnitt A ∩ B = {2} und die Komplementärereignisse sind A¯ = {3} und B¯ = {1}. Die Ereignisse A¯ und B¯ sind disjunkt, da A¯ ∩ B¯ = ∅.
38.2 Kombinatorik Permutationen Unter der Anzahl der Permutationen einer endlichen Zahl n von Elementen versteht man die Anzahl der möglichen verschiedenen Anordnungen, in denen jeweils sämtliche Elemente genau einmal vorkommen. Die Anzahl Pn der Permutationen von n verschiedenen Elementen ist Pn = n! = 1 · 2 · . . . · (n − 1) · n , von n-Elementen, von denen n1 , n2 , . . . , nm jeweils gleich sind (n1 + n2 + . . . + nm ≤ n), ist n! Pn; n1 , n2 , ..., nm = . n1 ! n2 ! · . . . · nm !
A147
A148
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Beispiel 3:
K4; 2
– Die Permutationen der Elemente A, B, C sind die Anordnungen ABC, ACB, BAC, BCA, CAB, CBA. Ihre Anzahl ist P3 = 1 · 2 · 3 = 6 . – Die Permutationen der Elemente A, A, B, B sind die Anordnungen AABB, ABAB, ABBA, BAAB, BABA, BBAA. Ihre Anzahl ist P4; 2, 2 =
4! =6. 2! · 2!
Beispiel 4: Wie viele fünfzifferige Zahlen lassen sich aus den Ziffern 0, 0, 1, 1, 2 bilden? Die gesuchte Zahl ist die Anzahl der Permutationen der 5 Ziffern abzüglich der Anzahl der Permutationen mit einer führenden Null, d. h., P5; 2, 2 − P4; 2
4! 5! − = 30 − 12 = 18 . = 2! · 2! 2!
Kombinationen Die Anzahl der Kombinationen k-ter Klasse von n-Elementen ist die Anzahl aller möglichen Gruppen von k-Elementen (k < n), die sich aus den n-Elementen bilden lassen, wobei die Anordnung der Elemente innerhalb der Gruppen unberücksichtigt bleibt. Man unterscheidet Kombinationen ohne Wiederholung und Kombinationen mit Wiederholung, je nachdem, ob die k-Elemente einer Kombination voneinander verschieden sein müssen oder nicht. Die Anzahl Kn; k der Kombinationen ohne Wiederholung ist n! n , Kn; k = = k k!(n − k)!
3·4 4! 4 = =6. = = 2 2! 2! 1 · 2
– Die Anzahl der Kombinationen 2. Klasse mit Wiederholung ist um die 4 Gruppen AA, BB, CC, DD größer, ihre Anzahl somit 5! 4·5 5 K4; 2 = = = 10 . 2 2! 3! 2 · 1 Beispiel 6: Wie viele verschiedene Möglichkeiten gibt es beim Zahlenlotto „6 aus 49“ 6 Zahlen anzukreuzen? Die Zahl der Möglichkeiten ist die Anzahl der Kombinationen 6-ter Klasse von 49 Elementen ohne Wiederholung, d. h., 49! 49 = 13 983 816 . = K49; 6 = 6 6! 43! Variationen Die Anzahl der Variationen k-ter Klasse von n-Elementen ist die Anzahl aller Gruppen zu kElementen (k < n) und deren Permutationen, die sich aus n-Elementen bilden lassen. Man unterscheidet Variationen ohne Wiederholung und Variationen mit Wiederholung, je nachdem, ob die k-Elemente einer Variation voneinander verschieden sein müssen oder nicht. Die Anzahl Vn; k der Variationen ohne Wiederholung ist Vn; k = n · (n − 1) · (n − 2) . . . (n − k + 1) =
n! (n − k)!
die Anzahl Vn; k der Variationen mit Wiederholung Vn; k = nk . Beispiel 7:
die Anzahl Kn; k der Kombinationen mit Wiederholung (n + k − 1)! n+k−1 . Kn; k = = k k!(n − 1)!
– Die Variationen 2. Klasse ohne Wiederholung der 4 Elemente A, B, C, D sind AB, BA, AC, CA, AD, DA, BC, CB, BD, DB, CD, DC. Ihre Anzahl ist
Beispiel 5:
– Die Anzahl der Variationen 2. Klasse mit Wiederholung ist um die 4 Variationen AA, BB, CC, DD größer als V4; 2 :
– Die möglichen Kombinationen 2. Klasse ohne Wiederholung der 4 Elemente A, B, C, D sind AB, AC, AD, BC, CD. Ihre Anzahl ist
V4; 2 =
4! 2 · 3 · 4 = = 12 . 2! 2
V4; 2 = 42 = 16 .
38 Wahrscheinlichkeitsrechnung
38.3 Wahrscheinlichkeit von Zufallsereignissen Jedem Zufallsereignis A kann ein Zahlenwert zugeordnet werden, der Wahrscheinlichkeit des Zufallsereignisses A genannt und mit P(A) bezeichnet wird (vgl. engl. probability). Es gibt keine gleichzeitig anschauliche wie umfassende und exakte Definition der Wahrscheinlichkeit. Im Folgenden sind drei Definitionen mit unterschiedlichen Anwendungsvorteilen in der Reihenfolge ihrer historischen Entstehung angegeben. Klassische Definition (P. S. DE L APLACE, 1812). Die Wahrscheinlichkeit für das Eintreten des Ereignisses A ist gleich dem Verhältnis aus der Zahl m der für das Eintreten des Ereignisses A günstigen Fälle zur Zahl n der möglichen Fälle: P(A) =
Zahl der günstigen Fälle m = . n Zahl der möglichen Fälle
(38-1)
Diese Definition ist zwar anschaulich, aber nicht umfassend, da sie von der Annahme ausgeht, dass alle Elementarereignisse (alle möglichen Fälle) gleich wahrscheinlich sind. Die Gleichwahrscheinlichkeit setzt zugleich eine endliche Anzahl von Elementarereignissen voraus. Diese Voraussetzung ist bei vielen Problemen in der Praxis nicht erfüllt. Die Definition von Laplace ist jedoch bei den Problemen von Nutzen, für welche die Zahlen der günstigen bzw. möglichen Fälle als die Zahlen von gleichwahrscheinlichen Kombinationen berechnet werden können. Beispiel 8: Gemäß Beispiel 6 gibt es beim Zahlenlotto „6 aus 49“ 13 983 816 verschiedene Kombinationen mit 6 Zahlen. Da von diesen nur eine die 6 Treffer enthält, ist die Wahrscheinlichkeit hierfür 1/13 983 816. Statistische Definition (R. v. M ISES, 1919). Bei einem Zufallsexperiment ist die Wahrscheinlichkeit P(A) eines Ereignisses gleich dem Grenzwert der relativen Häufigkeit hn (A) des Auftretens des Ereignisses A, wenn die Zahl n der Versuche gegen unendlich geht. Es ist m , (38-2) P(A) = lim hn (A) = lim n→∞ n→∞ n wenn n die Anzahl aller Versuche bezeichnet und m die Zahl derjenigen, bei denen das Ereignis A eintritt.
Diese Wahrscheinlichkeitsdefinition ist zwar anschaulich, jedoch formal nicht exakt, da die Existenz des angegebenen Grenzwertes sich analytisch nicht beweisen lässt. Die Definition von v. Mises hat dennoch große praktische Bedeutung, da man in der Realität oft nur relative Häufigkeiten kennt, die man als Wahrscheinlichkeiten interpretiert. Axiomatische Definition (A. N. KOLMOGOROFF, 1933). Zur axiomatischen Definition der Wahrscheinlichkeit wird für den Ereignisraum die Struktur einer σ-Algebra vorausgesetzt, die dadurch definiert ist, dass sie bezüglich der Komplementbildung und der Bildung von abzählbar unendlich vielen Vereinigungen und Durchschnitten ein geschlossenes Mengensystem darstellt. Unter dieser Voraussetzung wird jedem Zufallsereignis A aus dem Ereignisraum G eine reelle Zahl P(A) mit folgenden Eigenschaften zugeordnet: Axiom 1 (Nichtnegativität): Für jedes Zufallsereignis gilt: P(A) 0. Axiom 2 (Normiertheit): Für das sichere Ereignis E gilt: P(E) = 1. Axiom 3 (σ-Additivität): Für abzählbar unendlich viele paarweise disjunkte Ereignisse Ai gilt: P(A1 ∪ A2 ∪ . . .) = P(A1 ) + P(A2 ) + . . . Die Eigenschaft der σ-Additivität umfasst auch die endliche Additivität bei n disjunkten Ereignissen. Für den Fall n = 2 gilt für die disjunkten Ereignisse A und B : P(A ∪ B) = P(A) + P(B). Nur das Axiomensystem von Kolmogoroff erlaubt eine exakte und umfassende Definition der Wahrscheinlichkeit.
38.4 Bedingte Wahrscheinlichkeit Unter der bedingten Wahrscheinlichkeit P(B|A) (in Worten: Wahrscheinlichkeit für B unter der Bedingung A) versteht man die Wahrscheinlichkeit für das Eintreten des Ereignisses B unter der Voraussetzung, dass das Ereignis A bereits eingetreten ist. Sie ist für P(A) > 0 definiert als P(B|A) =
P(A ∩ B) . P(A)
(38-3)
Bei gleichwahrscheinlichen Elementarereignissen ist die bedingte Wahrscheinlichkeit P(B|A) also der relative Anteil der Elementarereignisse, die sowohl zum
A149
A150
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Ereignis A als auch zum Ereignis B gehören, an allen Elementarereignissen des Ereignisses A. Beispiel 9: Drei Maschinen eines Betriebs stellen 100 Werkstücke her, und zwar die erste 50, die zweite 30 und die dritte 20. Davon sind bei der ersten Maschine 4, bei der zweiten und dritten jeweils 3 Stücke Ausschuss. Greift man zufällig ein Werkstück heraus und betrachtet man die Ereignisse Ai : Das Werkstück wurde von der i-ten Maschine produziert (i = 1, 2, 3) und B: das Werkstück ist Ausschuss, so sind deren Wahrscheinlichkeiten: P(A1 ) = 50/100 = 0,5 , P(A2 ) = 30/100 = 0,3 , P(A3 ) = 20/100 = 0,2 und P(B) = (4 + 3 + 3)/100 = 0,1 .
P(B|A2) = 3/30 = 0,10 ,
Die bedingten Wahrscheinlichkeiten, dass das Werkstück von der ersten, zweiten bzw. dritten Maschine stammt, unter der Voraussetzung, Ausschuss zu sein, berechnen sich zu P(A1 |B) = 4/10 = 0,4 , P(A2 |B) = 1/30 = 0,3 , P(A3 |B) = 3/10 = 0,3 .
38.5 Unabhängigkeit von Ereignissen
P(A) = P(A|B) .
(38-4)
Dann gilt auch: P(A ∩ B) = P(A) · P(B) Zur Prüfung der Unabhängigkeit reicht die Prüfung einer der beiden Bedingungen (38-4) aus. Beispiel 10: Im Beispiel 9 ist P(B) = 0,10 P(B|A1) = 0,08 .
P(A1 ∩ A3 ) = P(A1 ) · P(A3 ) und P(A2 ∩ A3 ) = P(A2 ) · P(A3 ) , auch gilt P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 ) · P(A3 ) .
38.6 Rechenregeln für Wahrscheinlichkeiten Zufallsereignis A. Es gilt 0 P(A) 1. Unmögliches Ereignis ∅. Es gilt P(∅) = 0. ¯ Es gilt P(A) ¯ = 1 − P(A). Komplementäres Ereignis A. Additionssatz. Für die Vereinigung von paarweise disjunkten Ereignissen A1 , . . . , An (d. h., Ai ∩ A j = ∅ für i j) gilt gemäß Axiom 3: P(A1 ∪ . . . ∪ An ) = P(A1 ) + . . . + P(An ) .
(38-6)
Für zwei nicht disjunkte Ereignisse A1 und A2 gilt:
Zwei Zufallsereignisse A und B heißen stochastisch unabhängig, wenn gilt P(B) = P(B|A) oder
P(Ai1 ∩ Ai2 ∩ . . . ∩ Aik ) = P(Ai1 ) · P(Ai2 ) · . . . · P(Aik ) . (38-5) Bei drei Ereignissen ist die (vollständige) Unabhängigkeit erst dann gegeben, wenn neben den Bedingungen der paarweisen Unabhängigkeit P(A1 ∩ A2 ) = P(A1 ) · P(A2 ) ,
Die bedingten Wahrscheinlichkeiten, dass das Werkstück fehlerhaft ist unter der Voraussetzung, von der ersten, zweiten bzw. dritten Maschine zu stammen, betragen: P(B|A1) = 4/50 = 0,08 , P(B|A3) = 3/20 = 0,15 .
Demzufolge ist das Ereignis B („Werkstück ist Ausschuss“) nicht unabhängig von Ereignis A1 („Produzierende Maschine ist Maschine 1“). Bei mehr als zwei Ereignissen impliziert die Unabhängigkeit von jeweils zwei Ereignissen noch nicht die (vollständige) Unabhängigkeit aller Ereignisse. Die (vollständige) Unabhängigkeit von n > 2 Ereignissen A1 , A2 , . . . , An liegt vor, wenn für jede Indexkombination i1 , i2 , . . . , ik mit k n aus der Indexmenge 1, 2, . . . , n gilt:
P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 ) . (38-7) Die Verallgemeinerung auf n > 2 nicht disjunkte Ereignisse liefert die Formel P(A1 ∪ . . . ∪ An ) =
n i=1
+
P(Ai ) −
n−1 n
P(Ai ∩ A j )
i=1 j=i+1
n−2 n−1 n
P(Ai ∩ A j ∩ Ak )
i=1 j=i+1 k= j+1
− + . . . + (−1)n−1 P(A1 ∩ . . . ∩ An ) .
(38-8)
38 Wahrscheinlichkeitsrechnung
Beispiel 11: Beim Werfen eines homogenen Würfels seien folgende Ereignisse definiert: A: Die Augenzahl ist ungerade; B: Die Augenzahl ist kleiner als 2; C: Die Augenzahl ist größer als 4. Die Wahrscheinlichkeit, dass die Augenzahl bei einem bestimmten Wurf ungerade oder kleiner als 2 oder größer als 4 ist, beträgt dann gemäß (38-8) P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C) = 1/2 + 1/6 + 1/3 − 1/6 − 1/6 − 0 + 0 = 2/3 . Multiplikationssatz. Aus der Definition (38-3) der bedingten Wahrscheinlichkeit eines Ereignisses B unter der Bedingung A folgt für die Wahrscheinlichkeit des Durchschnitts zweier beliebiger Ereignisse A und B P(A ∩ B) = P(A) · P(B|A) .
(38-9)
Dabei sind die Ereignisse Ai jeweils abhängig von den Ereignissen A1 , A2 , . . . , Ai−1 . Beispiel 13: In einer Urne befinden sich 6 Lose mit 3 Treffen und 3 Nieten. Wie groß ist die Wahrscheinlichkeit bei dreimaligem Ziehen jedes Mal einen Treffer zu haben, wenn (a) die gezogenen Lose nicht zurückgelegt werden bzw. (b) wenn das gezogene Los jedes Mal zurückgelegt wird? Es sei Ai das Ereignis, beim i-ten Ziehen einen Treffer zu haben. Dann gilt (a) für den Fall „ohne Zurücklegen“: P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A1 ∩ A2 ) = 3/6 · 2/5 · 1/4 = 1/20 , da z. B. die Wahrscheinlichkeit für das Eintreten des Ereignisses A2 vom Ergebnis der ersten Ziehung abhängt: Sie ist 2/5, wenn A1 eingetreten ist, aber 3/5, wenn A1 nicht eingetreten ist; (b) für den Fall „mit Zurücklegen“ gilt P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 ) · P(A3 ) = 3/6 · 3/6 · 3/6 = 1/8 ,
Die Verallgemeinerung, die mittels vollständiger Induktion bewiesen werden kann, liefert den Multiplikationssatz für n beliebige Ereignisse:
da hierbei bei allen drei Ziehungen dieselben Gegebenheiten vorliegen, unabhängig vom Ausgang der vorausgegangenen Ziehungen.
P(A1 ∩ . . . ∩ An ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A1 ∩ A2 ) · . . . · P(An |A1 ∩ . . . ∩ An−1 ) .
(38-10)
Für unabhängige Ereignisse A und B gilt P(A ∩ B) = P(A) · P(B) ,
(38-11)
Totale Wahrscheinlichkeit. Die Ereignisse A1 , A2 , . . . , An seien eine vollständige Ereignismenge, d. h. A1 ∪ . . . ∪ An = E und Ai ∩ A j = ∅(i j). B sei ein beliebiges Ereignis. Wegen B = B ∩ E = B ∩ (A1 ∪ . . . ∪ An ) = (B ∩ A1 ) ∪ (B ∩ A2 ) ∪ . . . ∪ (B ∩ An )
ebenso für vollständig unabhängige Ereignisse A1 , . . . , An P(A1 ∩ . . . ∩ An ) = P(A1 ) · . . . · P(An ) .
(38-12)
Beispiel 12: Beim Zahlenlotto „6 aus 49“ sei das Ereignis, mit dem i-ten Kreuz einen Treffern zu haben, mit Ai bezeichnet. Dann ist die Wahrscheinlichkeit für 6 Treffer in einem Spiel: P(A1 ∩ . . . ∩ A6 ) = P(A1 ) · P(A2 |A1 ) · . . . · P(A6 |A1 ∩ . . . ∩ A5 ) = 6/49 · 5/48 · . . . · 1/44 = 1/13 983 816 .
gilt P(B) =
n i=1
P(B ∩ Ai ) =
n
P(Ai ) · P(B|Ai) . (38-13)
i=1
Bayes’sche Formel. Für die umgekehrte Fragestellung, nämlich die nach der Wahrscheinlichkeit für das Eintreten von Ai aus einer vollständigen Ereignismenge unter der Bedingung, dass Ereignis B eingetreten ist, gilt für alle i = 1, . . . , n : P(Ai |B) =
P(Ai ) · P(B|Ai) P(Ai ∩ B) = n . (38-14) P(B) P(Ai ) · P(B|Ai) i=1
A151
A152
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Beispiel 14: Im Beispiel 9 bilden die Ereignisse A1 , A2 , A3 eine vollständige Ereignismenge. Die totale Wahrscheinlichkeit für B ist gemäß (38-13) P(B) = 0,5 · 0,08 + 0,3 · 0,10 + 0,2 · 0,15 = 0,10 und mit (38-14) gilt P(A1 |B) = 0,5 · 0,08/0,10 = 0,4 P(A2 |B) = 0,3 · 0,10/0,10 = 0,3 P(A3 |B) = 0,2 · 0,15/0,10 = 0,3 . Diese Ergebnisse stimmen mit den entsprechenden von Beispiel 9 überein.
39 Zufallsvariable und Wahrscheinlichkeitsverteilung 39.1 Zufallsvariablen In der Praxis ist häufig das Elementarereignis als Ergebnis eines Zufallsexperiments (z. B. Zufallsauswahl eines Bolzens aus einer Produktionsmenge) von geringerem Interesse als vielmehr ein dadurch bestimmter reeller Zahlenwert (z. B. Bolzendurchmesser 32,7 mm). Eine eindeutige Abbildung der Elementarereignisse Ei in die Menge der reellen Zahlen, R, X : Ei → X(Ei ) ∈ R
(39-1)
definiert eine Zufallsgröße X. Die Zufallsgröße wird mit einem Großbuchstaben (z. B. X), ihre Zahlenwerte (Realisationen) werden mit kleinen Buchstaben (z. B. x1 , x2 , . . .) bezeichnet. Eine Zufallsgröße heißt diskret, wenn sie endlich viele Werte x1 , x2 , . . . , xn oder abzählbar unendlich viele Werte xi (i ∈ N) annehmen kann. Eine Zufallsgröße heißt stetig, wenn sie alle Werte eines gegebenen endlichen oder unendlichen Intervalls der rellen Zahlenachse annehmen kann. Beispiel 1: Beim Würfeln ist die Augenzahl eine diskrete Zufallsgröße, die nur die Zahlen 1, 2, . . . , 6 annehmen kann. Der Durchmesser von Bolzen kann theoretisch, d. h. beliebige Messgenauigkeit vorausgesetzt, beliebig viele Werte annehmen und ist somit eine stetige Zufallsgröße.
39.2 Wahrscheinlichkeitsund Verteilungsfunktion einer diskreten Zufallsvariablen Durch die Abbildung (39-1), welche die Zufallsvariable definiert, kann verschiedenen Elementarereignissen derselbe reelle Zahlenwert xi zugeordnet werden. Bezeichnet Ai die Menge aller Elementarereignisse E j , für die X(E j ) = xi gilt, so ist auf diese Weise die gesamte Ergebnismenge E in disjunkte Teilmengen Ai zerlegt. Da durch ein auf der Ergebnismenge E definiertes Wahrscheinlichkeitsmaß P den Elementarereignissen E j Wahrscheinlichkeiten P(E j ) zugeordnet sind, ist damit auch die Wahrscheinlichkeit bestimmt, mit der die Zufallsgröße X einen Wert xi annimmt. Unter der Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße X versteht man eine Abbildung ⎛ ⎞ ⎜⎜⎜ : ⎟⎟⎟ ⎜ E j ⎟⎟⎟⎟⎠ = P(E j ) f : xi → P(Ai ) = P ⎜⎜⎜⎝ E j ∈Ai
= P(X = xi )
E j ∈Ai
(39-2)
die den Realisationen xi der diskreten Zufallsgröße X Wahrscheinlichkeiten zuordnet. Es gilt somit für die Wahrscheinlichkeitsfunktion f (x) einer diskreten Zufallsgröße X: f (xi ) = P(X = xi ) für x = xi (39-3) f (x) = 0 sonst . Da die Teilmengen Ai disjunkt sind und ihre Vereinigung den Ergebnisraum E darstellt, gilt f (xi ) = 1 . i
Die Verteilungsfunktion F(x) einer Zufallsgröße X gibt die Wahrscheinlichkeit dafür an, dass die Zufallsgröße Werte annimmt, die kleiner oder gleich dem Wert x sind. Für eine diskrete Zufallsgröße gilt: f (xi ) . (39-4) F(x) = P(X x) = xi x
Die Verteilungsfunktion ist eine nicht fallende monotone Funktion. Beispiel 2: Beim Werfen von jeweils zwei Würfeln wird jedem der 36 gleichwahrscheinlichen Zahlenpaare ( j, k) als Elementarereignisse ( j, k = 1, . . . , 6)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
Es gilt "∞ f (t)dt .
F(x) = P(X x) =
(39-5)
−∞
Die Funktion f (x) heißt Wahrscheinlichkeitsdichte oder Dichtefunktion. Im Gegensatz zur diskreten Zufallsgröße, die als Verteilungsfunktion eine Treppenfunktion mit abzählbar vielen Sprungstellen besitzt, ist die Verteilungsfunktion einer stetigen Zufallsgröße eine stetige Funktion. Da F(x) eine nicht fallende monotone Funktion ist, folgt für die Ableitung f (x) 0. Die Tabelle 39-2 enthält wichtige stetige Wahrscheinlichkeitsverteilungen, Tabelle 39-3 sog. Prüfverteilungen, die für die Prüf- und Schätzstatistik (siehe Kapitel 41 bis 44) von großer Bedeutung sind.
39.4 Kenngrößen von Wahrscheinlichkeitsverteilungen Bild 39-1. Wahrscheinlichkeits- und Verteilungsfunktion
der diskreten Zufallsgröße „Augensumme zweier Würfel“
die Augensumme X(( j, k)) = j + k zugeordnet und damit eine Zufallsgröße definiert. Die möglichen Realisationen xi der Zufallsgröße „Augensumme“ X die entsprechenden Teilmengen Ai , die Werte f (xi ) und F(xi ) zeigt Bild 39-1. Die Tabelle 39-1 enthält wichtige diskrete Wahrscheinlichkeitsverteilungen.
39.3 Wahrscheinlichkeitsdichteund Verteilungsfunktion einer stetigen Zufallsvariablen Die Anzahl der möglichen Realisationen einer stetigen Zufallsvariablen ist nicht abzählbar. Es kann daher einem bestimmten Wert x keine von null verschiedene Wahrscheinlichkeit P(X = x) zugeordnet werden, sondern nur einem Intervall I(x, x + Δx). Das Intervall kann dabei abgeschlossen, halboffen oder offen sein. Die Verteilungsfunktion F(x) einer stetigen Zufallsgröße X besitzt eine im Intervall −∞ < x < ∞ bis auf höchstens endlich viele Punkte überall stetige Ableitung dF = f (x) . dx
Zu Wahrscheinlichkeitsverteilungen gibt es charakteristische Kennzahlen, von denen in der Praxis meist wenige zur Beschreibung der jeweiligen Verteilung ausreichen. Sie sind zum größten Teil Erwartungswerte bestimmter Funktionen der Zufallsvariablen X. 39.4.1 α-Quantil
Als α-Quantil bezeichnet man den Wert xα , der Zufallsvariablen X, für den P(X ≤ xα ) ≥ α und P(X ≥ xα ) ≤ 1 − α gilt. Besitzt eine Zufallsgröße X eine stetige Verteilung, so gilt für das α-Quantil xα F(xα ) = P(X ≤ xα ) = α . Ist die Verteilung von X dagegen diskret, so gilt für das α-Quantil xα F(xα ) ≥ α . und für jedes x < xα F(x) < α . 39.4.2 Erwartungswert einer Funktion einer Zufallsgröße
Der Erwartungswert E(g(X)) einer Funktion g(X) einer diskreten oder stetigen Zufallsgröße X ist definiert als
A153
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Tabelle 39-1. Wichtige diskrete Wahrscheinlichkeitsverteilungen
A154
Tabelle 39-1. (Fortsetzung)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
A155
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Tabelle 39-2. Wichtige stetige Wahrscheinlichkeitsverteilungen
A156
Tabelle 39-2. (Fortsetzung)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
A157
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Tabelle 39-2. (Fortsetzung)
A158
Tabelle 39-2. (Fortsetzung)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
A159
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Tabelle 39-3. Wichtige Prüfverteilungen
A160
Tabelle 39-3. (Fortsetzung)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
A161
A162
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
E(aX + b) = aE(X) + b
(39-9)
E(aX + bY) = aE(X) + bE(Y) .
(39-10)
Für stochastisch unabhängige Zufallsgrößen gilt zudem (vgl. 39.5): E(X · Y) = E(X) · E(Y) .
(39-11)
Median. Als Median x0,5 wird das 0,5 Quantil bezeichnet. Es stellt bei einer stetigen Zufallsgröße den Wert dar, auf dessen linker und rechter Seite die Flächen unter der Verteilungsdichte f (x) genau gleich sind, d. h. F(x0,5 ) = 0,5, und bei einer diskreten Verteilung die kleinste aller Realisationen xi , für die gilt F(xi ) 0,5. Modalwert. Der Modalwert xD ist bei diskreten Zufallsgrößen der Wert mit der größten Wahrscheinlichkeit und bei stetigen Zufallsgrößen der Wert mit der maximalen Verteilungsdichte, d. h., f (xD ) f (x) für alle x xD . Bild 39-2. Wahrscheinlichkeitsdichte und Verteilungsfunk-
tion einer stetigen Zufallsgröße
E(g(X)) =
g(xi ) f (xi ) bzw.
i
"∞ g(x) f (x) dx ,
=−
(39-6)
−∞
39.4.4 Streuungsparameter einer Verteilung
Varianz und Standardabweichung. Die Varianz σ2 = Var(X) der diskreten bzw. stetigen Zufallsgröße X ist der Erwartungswert des Quadrates der Abweichung vom Mittelwert μ, also der Funktion g(X) = (X − μ)2 , und berechnet sich gemäß (39-6) zu σ2 = Var(X) = E[(X − μ)2 ] = (xi − μ)2 f (xi ) = x2i f (xi ) − μ2 bzw.
wenn die Summe bzw. das Integral absolut konvergieren.
i
i
"∞
"∞ (x − μ)2 f (x)dx =
= 39.4.3 Lageparameter einer Verteilung
−∞
Erwartungswert. Der Erwartungswert μ = E(X) einer diskreten oder stetigen Zufallsgröße X selbst lautet mit g(X) = X gemäß (39-6) xi f (xi ) bzw. (39-7) μ = E(x) = i
(39-12)
Die Quadratwurzel √ aus der Varianz heißt Standardabweichung σ = Var(X). Es gelten folgende Rechenregeln für Varianzen (a, b Konstanten): Var(X) = E[(X − a) ] − (μ − a) 2
x f (x) dx .
(39-13) 2
Var(aX + b) = a Var(X) . 2
−∞
Es gelten folgende Rechenregeln für Erwartungswerte (a, b Konstante): E(a) = a
−∞
Var(X) = E(X 2 ) − μ2
"∞ =
x2 f (x)dx − μ2 .
(39-8)
(39-14) (39-15)
Für stochastisch unabhängige Zufallsgrößen X und Y gilt: Var(aX + bY) = a2 Var(X) + b2 Var(Y) .
(39-16)
39 Zufallsvariable und Wahrscheinlichkeitsverteilung
Tabelle 39-4. Werte der Verteilungsfunktion Φ(z) der Standardnormalverteilung
Variationskoeffizient. Zum Vergleich der Standardabweichungen von Zufallsgrößen mit unterschiedlichen Mittelwerten eignet sich der Variationskoeffizient v=
σ . μ
(39-17)
39.5 Stochastische Unabhängigkeit von Zufallsgrößen Analog zur Unabhängigkeit von Ereignissen in 38.4 lässt sich auch die Unabhängigkeit von Zufallsgrö-
ßen definieren. Dazu betrachtet man zuden Zufallsgrößen X1 , X2 , . . . , Xn die Ereignisse Xi xi (i = 1, 2, . . . , n). Gemäß dem Multiplikationssatz für unabhängige Ereignisse (vgl. 38.5) gilt für stochastisch unabhängige Zufallsgrößen X1 , X2 , . . . , Xn mit den Verteilungsfunktionen Fi (xi ) = P(Xi xi ) und mit der gemeinsamen Verteilungsfunktion F(x1 , . . . , x) F(x1 , . . . , xn ) = P[(X1 x1 ) ∩ . . . ∩ (Xn xn )] = P(X1 x1 ) · . . . · P(Xn xn ) (39-18) = F1 (x1 ) · . . . · Fn (xn ) .
A163
A164
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Tabelle 39-5. Quantile der χ2 -Verteilung
Sind die Zufallsgrößen X1 , . . . , Xn stochastisch unabhängig, so gilt für ihre Dichtefunktionen fi (xi ) und die gemeinsame Dichtefunktion f (x1 , . . . , xn ) f (x1 , . . . , xn ) = f1 (x1 ) · . . . · fn (xn ) .
(39-19)
Umgekehrt folgt aus (39-18) oder (39-19) die Unabhängigkeit der n-Zufallsgrößen. Aus der Unabhängigkeit der n-Zufallsgrößen folgt auch die Unabhängigkeit von k(k < n) beliebig ausgewählten Zufallsgrößen; diese Aussage gilt jedoch nicht umgekehrt.
39.6 Korrelation von Zufallsgrößen Ein Maß für den Grad des linearen Zusammenhangs zwischen zwei Zufallsgrößen X und Y liefert die Korrelationsrechnung. Die Kovarianz der Zufallsgrößen X und Y ist definiert als Cov(X, Y) = σXY = E[(X − E(X))(Y − E(Y))] . (39-20) Die normierte Kovarianz heißt Korrelationskoeffizient
40 Deskriptive Statistik
Tabelle 39-6. Quantile der t-Verteilung
σXY Cov(X, Y) =
(X, Y) = √ . (39-21) Var(X) · Var(Y) σX · σY Es gilt stets: −1 (X, Y) 1. Zwei Zufallsgrößen, deren Korrelationskoeffizient = 0 ist, heißen unkorreliert. Da für stochastisch unabhängige Zufallsgrößen X und Y gilt Cov(X, Y) = E[(X − E(X))] · E[(Y − E(Y))] = 0 , sind unabhängige Zufallsgrößen unkorreliert. Die Umkehrung dieser Aussage gilt nicht immer.
40 Deskriptive Statistik 40.1 Aufgaben der Statistik Drei wichtige Aufgaben des Ingenieurs sind: (1) die Ermittlung bestimmter Eigenschaften einer begrenzten Zahl von Untersuchungseinheiten in einer Stichprobe, (2) die Beschreibung von Zusammenhängen zwischen verschiedenen Eigenschaften und (3) die
A165
m2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
1 161,44 18,51 10,13 7,71 6,61 5,99 5,59 5,52 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4,00 3,92 3,84
2 199,50 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,15 3,09 3,00
3 215,69 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,76 2,68 2,60
4 224,57 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 3,70 2,69 2,61 2,53 2,45 2,37
5 230,16 19,30 9,01 6,20 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 3,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,37 2,29 2,21
6 233,98 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,25 2,18 2,10
7 236,78 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,25 2,17 2,09 2,01
α = 0,05 m1 8 9 238,89 240,55 19,37 19,39 8,85 8,81 6,04 6,00 4,82 4,77 4,15 4,10 3,73 3,68 3,44 3,39 3,23 3,18 3,07 3,02 2,95 2,90 2,85 2,80 2,77 2,71 2,70 2,65 2,64 2,59 2,59 2,54 2,55 2,49 2,51 2,46 2,48 2,42 2,45 2,30 2,42 2,37 2,40 2,34 2,37 2,32 2,36 2,30 2,34 2,28 2,32 2,27 2,31 2,25 2,29 2,24 2,28 2,22 2,27 2,21 2,18 2,12 2,10 2,04 2,02 1,96 1,94 1,88 10 241,89 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 1,99 1,91 1,83
12 243,91 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,92 1,83 1,75
Tabelle 39-7. 95%-Quantile Fm1 , m2; 0,95 der F-Verteilung (m1 Freiheitsgrade der größeren Varianz)
15 245,97 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,84 1,75 1,67
20 248,02 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,84 1,75 1,66 1,57
24 249,04 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2,05 2,03 2,01 1,98 1,96 1,95 1,93 1,91 1,90 1,89 1,79 1,70 1,61 1,52
30 250,07 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,65 1,55 1,46
40 251,13 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,81 1,79 1,69 1,59 1,50 1,39
60 252,18 19,48 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,79 1,77 1,75 1,74 1,64 1,53 1,43 1,32
120 253,27 19,49 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,58 1,47 1,35 1,22
∞ 254,31 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,39 1,25 1,00
A166 A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
40 Deskriptive Statistik
Verallgemeinerung der Ergebnisse aus der Stichprobe auf die Grundgesamtheit. Die deskriptive (beschreibende) Statistik stellt Methoden für die ersten beiden Tätigkeiten bereit, mit deren Hilfe Beobachtungsdaten möglichst effektiv charakterisiert und zusammenfassend beschrieben werden können. Sie ist eine Vorstufe der induktiven (schließenden) Statistik, deren Methoden sich auf den dritten Tätigkeitsbereich beziehen, d. h. auf die Fragen der Auswahl von Untersuchungseinheiten (Stichprobentheorie) und auf die Generalisierung der Ergebnisse.
40.2 Grundbegriffe Untersuchungseinheit. Die Untersuchungseinheit oder statistische Einheit ist das Einzelobjekt der statistischen Untersuchung. Untersuchungseinheiten können z. B. Personen oder Gegenstände sein, über die man Informationen gewinnen will. Grundgesamtheit und Stichprobe. Die Grundgesamtheit (Population) ist die Menge aller Untersuchungseinheiten. Eine Stichprobe ist eine Teilmenge der Grundgesamtheit. Merkmale und Ausprägungen. Die interessierenden Daten werden durch die Datenerhebung, d. h. durch eine statistische Untersuchung der Stichprobenelemente gewonnen. Die Datenerhebung kann in Form von Befragungen, Zählungen, Messungen oder Beobachtungen erfolgen. Die Eigenschaften, auf die sich die Erhebungen beziehen, heißen (Untersuchungs-) Merkmale. Bei der Datenerhebung – allgemein auch „Messen“ genannt – stellt man die Merkmalsausprägungen der Untersuchungseinheiten auf der Basis einer zugrundegelegten Skala fest. Merkmale können in quantitative und qualitative Merkmale eingeteilt werden, je nachdem ob sich die Ausprägungen einer metrischen Skala (Ratio- oder Intervallskala) oder einer Nominal- oder Ordinalskala zuordnen lassen. Wie Zufallsgrößen (vgl. 39.1) können quantitative (auch: messbare, metrisch skalierbare, metrische) Merkmale stetig oder diskret sein, je nachdem, ob sie beliebige Werte in einem Intervall der reellen Zahlenachse oder nur endlich oder abzählbar unendlich viele Werte annehmen können. Die Ausprägungen qualitativer Merkmale unterscheiden sich entweder nur durch ihre Bezeichnung (nominal skalierbare,
nominale Merkmale) oder durch eine Rangstufe (ordinal skalierbare, ordinale Merkmale). Beispiel 1: Das qualitative Merkmal „Geschlecht“ mit den Ausprägungen „männlich“ und „weiblich“ ist ein nominales, das Merkmal „schuliche Leistung“ nach Zensurnoten ein ordinales Merkmal. Das quantitative Merkmal „Kinderzahl“ ist ein diskretes, das Merkmal „Körpergröße“ ein stetiges Merkmal. Quantitative Merkmale werden auch als Größen (oder Variablen) bezeichnet. Wenn den Ausprägungen eines qualitativen Merkmals Zahlen zugeordnet werden (z. B. 1=männlich, 2=weiblich), so liegt auch hier eine Größe vor, wenngleich ihre Zahlenwerte nur eine willkürlich vereinbarte Bedeutung haben. Der Begriff „Zufallsvariable“ wird auf diese Weise auch auf qualitative Merkmale ausgedehnt.
40.3 Häufigkeit und Häufigkeitsverteilung Urliste. Die aus einer Erhebung gewonnenen Daten xi (i = 1, 2, . . . , n) über ein bestimmtes Untersuchungsmerkmal liegen zunächst ungeordnet in der sog. Urliste vor. Die xi können – i. Allg. mit Zahlen bezeichnete – Ausprägungen qualitativer Merkmale sein oder Messwerte (diskreter oder stetiger) quantitativer Variablen. Beispiel 2: Druckfestigkeit von Beton. Bei einer Materialprüfung wurde die Druckfestigkeit von 25 Betonwürfeln untersucht. Die 25 Druckfestigkeitswerte in der Urliste lagen in einem Bereich von 29,8 bis 47,9 N/mm2 (Tabelle 40-1). Klasseneinteilung. Bei größeren Datenmengen ist es zur Verbesserung der Übersichtlichkeit notwendig, die in der Urliste enthaltenen Daten in Klassen einzuteilen und deren Besetzungszahlen durch Tabellen oder Diagramme zu veranschaulichen. Die Klassen müssen den gesamten Bereich der vorliegenden Tabelle 40-1. Urliste der Messwerte xi (i = 1, 2, . . . , 25):
Druckfestigkeiten in N/mm2 40,7 36,6 38,9 32,1 41,2
39,6 43,5 47,9 39,8 39,6
29,8 37,5 43,8 42,1 40,0
38,7 46,3 41,1 33,4 36,9
43,6 38,1 33,1 46,7 39,8
A167
A168
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Ausprägungen überdecken und es sollte keine Klasse unbesetzt sein. Bei quantitativen Merkmalen sollten die Klassen möglichst gleich breit sein. Als Anhalt für die zu wählende Klassenanzahl k kann in Abhängigkeit vom Datenumfang n√folgende Faustregel dienen: k = 5 für n 25, k ≈ n für 25 n 100 und k ≈ 1 + 4,5 lg n für n > 100. Absolute und relative Häufigkeit. x˜ j ( j = 1, 2, . . . , k) bezeichnen bei qualitativen und diskreten Merkmalen die möglichen Ausprägungen, bei einem stetigen Merkmal die Klassenmitten, d. h. in jeder Klasse das arithmetische Mittel von Ober- und Untergrenze. Die Besetzungszahl h( x˜ j ) der Beobachtungswerte aus der Urliste, die in die Klasse j fallen, heißt absolute Häufigkeit der Merkmalsausprägung x˜ j , ihr relativer Anteil f ( x˜ j ) an der Gesamtzahl n der erhobenen Werte relative Häufigkeit. Es gilt: f ( x˜ j ) = h( x˜ j )/n mit
k
Bild 40-1. Histogramm und Summenhäufigkeitskurve (ste-
h( x˜ j ) = n und
tiges Merkmal)
j=1 k
f ( x˜ j ) = 1 .
(40-1)
die absolute Summenhäufigkeit gilt:
j=1
Häufigkeitsverteilung. Die geordneten Merkmalsklassen mit den zugehörenden (absoluten oder relativen) Häufigkeiten definieren die Häufigkeitsverteilung des Merkmals. Die tabellarische oder graphische Darstellung einer Häufigkeitsverteilung heißt Häufigkeitstabelle (vgl. Beispiel 2, Tabelle 40-2) bzw. Histogramm (vgl. Bild 40-1a). Summenhäufigkeit. Die einer Merkmalsausprägung x˜ j eines ordinalen oder diskreten Merkmals zugeordnete Häufigkeit aller Beobachtungswerte aus der Urliste, die diese Merkmalsausprägung bzw. Klassengrenze nicht überschreiten, heißt Summenhäufigkeit. Für
H( x˜ j ) =
h( x˜i ) =
x˜i x˜ j
j
h( x˜i ) ,
(40-2)
i=1
und für die relative Summenhäufigkeit F( x˜ j ) =
j H( x˜ j ) = f ( x˜i ) = f ( x˜i ) . n x˜ x˜ i=1 i
(40-3)
j
Bei einem stetigen Merkmal kennzeichnet hierbei x˜ j die Obergrenze der betreffenden Klasse j. Summenhäufigkeitsverteilung. Die geordneten Merkmalsausprägungen mit den zugehörenden Summen-
Tabelle 40-2. Häufigkeits- und Summenhäufigkeitstabelle
Klasse j
Klassengrenzen
Klassenmitte
Absolute Häufigkeit
Relative Häufigkeit
1 2 3 4 5
28,1 − 32,0 32,1 − 36,0 36,1 − 40,0 40,1 − 44,0 44,1 − 48,0
30 34 38 42 46
1 3 10 7 4
0,04 0,12 0,40 0,28 0,16
Relative Summenhäufigkeit 0,04 0,16 0,56 0,84 1,00
40 Deskriptive Statistik
häufigkeiten definieren die Summenhäufigkeitsverteilung. Die tabellarische oder graphische Darstellung einer Summenhäufigkeitsverteilung heißt Summenhäufigkeitstabelle, vgl. Beispiel 2, Tabelle 40-2, bzw. Summenhäufigkeitskurve. Bei diskreten Merkmalen ist die Darstellung der Summenhäufigkeit eine (linksseitig stetige) Treppenkurve, bei stetigen Merkmalen eine stückweise lineare Kurve (Polygonzug), deren Knickpunkte an den Klassenobergrenzen liegen (Bild 40-1b).
40.4 Kenngrößen empirischer Verteilungen Wie bei den Wahrscheinlichkeitsverteilungen gibt es auch für empirische Häufigkeitsverteilungen Kenngrößen ihrer Lage und Streuung. 40.4.1 Lageparameter
1 1 xi ≈ x˜ j h( x˜ j ) = x˜ j f ( x˜ j ) n i=1 n j=1 j=1 n
k
k
(40-4)
definieren. Der arithmetische Mittelwert besitzt folgende wichtige Eigenschaften: Die Summe der Abweichungen vom arithmetischen Mittelwert ist Null n
(xi − x¯) =
i=1
n
xi − n x¯ = 0 .
(40-5)
i=1
Die quadratische Abweichung ist kleiner als jede auf einen von x¯ verschiedenen Wert x¯ bezogene quadratische Abweichung: n
(xi − x¯)2
μ0 . – einseitige Nullhypothesen (Bereichshypothesen): Hier ist die Nullhypothese eine Ungleichung, z. B. H0 : μ μ0 d. h., die Alternativhypothese H1 : μ > μ0 ist ebenfalls eine Ungleichung, beschreibt also nur einen Bereich μ > μ0 . Der jeweils zugehörige Test wird als zweiseitiger bzw. einseitiger Test bezeichnet.
2. Festlegung des Signifikanzniveaus α: Die zulässige Irrtumswahrscheinlichkeit α wird i. Allg. zwischen 0,001 und höchstens 0,10 – je nach erforderlicher Sicherheit der Testentscheidung – festgelegt. 3. Bildung der Prüfgröße: Zur Testentscheidung wird eine geeignete Stichprobenfunktion U (Prüfgröße, auch: Testgröße) gebildet, die selbst eine Zufallsgröße ist, da sie von dem Stichprobenergebnis abhängt. Auch bei zutreffender Nullhypothese unterliegt die Prüfgröße daher zufallsbedingten Schwankungen, d. h. einer bestimmten Wahrscheinlichkeitsverteilung. Im Allgemeinen versucht man eine Prüfgröße zu finden, deren Verteilung bekannt ist und in Tabellenform vorliegt (z. B. Standardnormalverteilung, t-, F-, χ2 -Verteilung). Die Festlegung der Prüfgröße U und Bestimmung ihrer Verteilung erfolgen unter der Annahme, die Nullhypothese H0 sei richtig (bei zweiseitiger Nullhypothese) bzw. „gerade noch“ richtig (bei einseitiger Nullhypothese). Beispiel: H0 : μ μ0 ist für μ = μ0 „gerade noch“ richtig. 4. Bestimmung des kritischen Bereiches: Man bestimmt dann ein Intervall (Annahmebereich), in dem die Realisationen der Prüfgröße – bei richtiger Nullhypothese – mit der Wahrscheinlichkeit 1 − α liegen. Das bedeutet – bei zweiseitiger Nullhypothese H0 : Bestimmung einer unteren Annahmegrenze cu und einer oberen Annahmegrenze c0 , sodass gilt P(cu U co ) = 1 − α (Bild 43-1a) . (43-1) – bei einseitiger Nullhypothese H0 : Bestimmung einer unteren Annahmegrenze cu bzw. einer oberen Annahmegrenze co , sodass gilt a) P(U co ) = 1 − α (Bild 43-1b) , (43-2) b) P(U cu ) = 1 − α (Bild 43-1c) . (43-3) Der Bereich außerhalb des Annahmebereiches wird als kritischer Bereich bezeichnet. 5. Ermittlung des Prüfwertes: Mit den Werten einer Stichprobe wird dann eine Realisation der Prüfgröße U, der Prüfwert u, berechnet.
A173
A174
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
höchstens gleich der vorgegebenen Irrtumswahrscheinlichkeit α. Fall 2: Der Prüfwert u liegt nicht im kritischen Bereich: In diesem Fall ist nicht mit „hinreichender“ Sicherheit auszuschließen, dass die Abweichung des Prüfwertes von dem – bei richtiger Nullhypothese – zu erwartenden Wert nur durch die Zufälligkeit der Stichprobenziehung bedingt ist. Die Abweichung ist dann nicht signifikant bei dem gegebenen Signifikanzniveau α. Die Nullhypothese wird daher nicht abgelehnt, womit ihre Richtigkeit jedoch nicht bewiesen ist! Die Wahrscheinlichkeit einer Fehlentscheidung (Fehler 2. Art, β-Fehler) ist in diesem Falle nicht ohne Weiteres zu bestimmen.
Bild 43-1. Annahme- und kritische Bereiche für ein- und zweiseitige Tests des Erwartungswertes mit standartnormalverteilter Prüfgröße.
6. Testentscheidung: Für die Testentscheidung sind zwei Fälle möglich: Fall 1: Der Prüfwert u liegt im kritischen Bereich: Die Zufälligkeit der Stichprobenziehung wird in diesem Fall nicht mehr als einziger Grund der Abweichung des Prüfwertes von dem – bei richtiger Nullhypothese – erwarteten Wert akzeptiert. Die Abweichung heißt dann auch signifikant (deutlich) bei dem gegebenen Signifikanzniveau α. Folglich lehnt man die Nullhypothese zugunsten des logischen Gegenteils (Alternativhypothese H1 ) ab. Die Wahrscheinlichkeit einer Fehlentscheidung (Fehler 1. Art, α-Fehler) ist dann
Bei Parametertests wird daher i. Allg. die Nullhypothese als Gegenteil der zu prüfenden Annahme bzw. der Vermutung, die man logisch bestätigen („beweisen“) möchte, formuliert. Da α i. Allg. sehr klein gewählt wird (α = 0,05 oder α = 0,01), entspricht die Ablehnung der Nullhypothese dann dem statistischen Nachweis der Alternativhypothese H1 mit der hohen statistischen Sicherheit 1 − α. Die folgenden Abschnitte behandeln Beispiele für Tests verschiedener Hypothesen. In allen Beispielen gilt die Testentscheidung: Die Nullhypothese H0 wird abgelehnt, wenn der jeweilige Prüfwert im kritischen Bereich liegt, anderenfalls wird sie nicht abgelehnt (ohne jedoch damit bewiesen zu sein).
43.2 Test der Gleichheit des Erwartungswerts μ eines quantitativen Merkmals mit einem gegebenen Wert μ0 (Parametertest) Grundgesamtheit: Erwartungswert μ, Varianz σ2 , Umfang N. Stichprobe: x1 , . . . , xn (Stichprobenumfang: n) Arithmetischer Mittelwert: x¯. Voraussetzung: n > 30 oder Zufallsgröße X normalverteilt. Es werden zwei Fälle unterschieden: Fall 1: Die Varianz σ2 ist bekannt:
43 Statistische Prüfverfahren (Tests)
und S 2 aus Gl.(42-1) in 42.2.
– Zweiseitiger Test: Nullhypothese H0 : μ = μ0 X¯ − μ0 Prüfgröße: U = ∼ N(0,1) σX¯ mit
⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ σX¯ = ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩
σ √ n
(43-4)
bei Stichprobe mit Zurücklegen oder n/N < 0,05 (z. B. bei „sehr großer“ Grundgesamtheit)
σ N−n √ · n N−1
bei Stichprobe ohne Zurücklegen und n/N 0,05
|u| tn−1; 1−α/2 Kritischer Bereich : |u| > tn−1; 1−α/2 . x¯ − μ0 Prüfwert: u = . σX¯
(43-8) (43-9)
– Einseitiger Test: Nullhypothese H0 : μ μ0 H0 : μ μ0
oder
Annahmebereich:
Prüfgröße und Prüfwert: Wie bei zwei-
(cu = zα/2 = −z1−α/2 , co = z1−α/2 ) :
seitigem Test
|u| z1−α/2 Kritischer Bereich : |u| > z1−α/2
(Bild 43-1a) x¯ − μ0 Prüfwert: u = σX¯ – Einseitiger Test: Nullhypothese H0 : μ μ0 H0 : μ μ0
(43-5) (43-6)
oder
Prüfgröße und Prüfwert: Wie bei zweiseitigem Test Kritischer Bereich : u > z1−α (Bild 43-1b) bzw. u < Zα (Bild 43-1c) . Fall 2: Die Varianz σ2 ist unbekannt: – Zweiseitiger Test: Nullhypothese H0 : μ = μ0 X¯ − μ0 Prüfgröße: U = ∼ tn−1 S X¯
(43-7)
Kritischer Bereich : u > tn−1; 1−α bzw. u < tn−1; α = −tn−1; 1−α
43.3 Test der Gleichheit des Anteilswerts p eines qualitativen Merkmals mit einem gegebenen Wert p0 (Parametertest) Grundgesamtheit: N Elemente, jeweils mit der Ausprägung A oder A¯ des qualitativen Merkmals. p Anteil der Elemente mit der Ausprägung A. Stichprobe: n Anzahl der zufällig entnommenen Elemente; wenn n/N 0,05, muss jedes entnommene Element vor Entnahme des nächsten wieder in die Grundgesamtheit zurückgelegt werden. x Anzahl der Elemente mit Ausprägung A. x h= relative Häufigkeit der Elemente mit Auspräh gung A. Voraussetzung: np0 (1 − p0 ) > 9
mit
⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ S X¯ = ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩
Annahmebereich: (cu = tn−1; α/2 ; co = tn−1; 1−α/2 ) :
S √ n S N−n √ · n N−1
bei Stichprobe mit Zurücklegen oder n/N < 0,05 (z. B. bei „sehr großer“ Grundgesamtheit) bei Stichprobe ohne Zurücklegen und n/N 0,05
– Zweiseitiger Test: Nullhypothese H0 : p = p0 Prüfgröße: U=
H − p0 p0 (1 − p0 )
√ n ∼ N(0,1)
(43-10)
A175
A176
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
mit hb j
Annahmebereich: (cu = zα/2 ,
co = z1−α/2 ) : |u| z1−α/2
Kritischer Bereich:
|u| > z1−α/2
(43-11)
Prüfwert: u=
√
p − p0 p0 (1 − p0 )
n.
(43-12)
– Einseitiger Test: Nullhypothese H0 : p p0 oder H0 : p p0 Prüfgröße und Prüfwert: Wie bei zweiseitigem Test. Kritischer Bereich: u > z1−α bzw. u < zα = −z1−α .
43.4 Test der Gleichheit einer empirischen mit einer theoretischen Verteilung (Anpassungstest) Die Stichprobenwerte x1 , . . . , xn werden als Realisierungen einer Zufallsgröße X mit einer unbekannten Verteilungsfunktion F(x) angesehen. Es wird geprüft, ob sich diese Verteilungsfunktion F(x) von einer vorgegebenen (theoretischen) Verteilungsfunktion F0 (x) unterscheidet bzw. wie gut die empirische Verteilung der Stichprobe an F0 (x) „angepasst“ ist. Ein für diese Problemstellung gebräuchlicher Test ist der sog. χ2 -Anpassungstest: Voraussetzung: n 50 . Nullhypothese H0 : F(x) = F0 (x) . Vorbereitung: Unterteilung des Wertebereichs der Stichprobe in k Klassen gleicher Breite, sodass für jede Klasse j = 1, . . . , k gilt: np j 5 . p j ist die Wahrscheinlichkeit, dass bei richtiger Nullhypothese die Zufallsgröße X einen Wert der Klasse j annimmt, d. h., falls X stetig und x ju , x jo die Unterbzw. Obergrenze der Klasse j bezeichnen: p j = F0 (x jo ) − F0 (x ju ) .
Prüfgröße:
U=
k (hb j − he j )2 j=1
he j
∼ χ2m
beobachtete Häufigkeit der Stichprobenwerte in Klasse j
he j
erwartete Häufigkeit in Klasse j bei richtiger Nullhypothese : he j = np j m=k−q−1.
q ist die Anzahl der aus der Stichprobe geschätzten Parameter der Verteilungsfunktion F0 (x), z. B. q = 2 für die Parameter μ und σ2 einer Normalverteilung. Annahmebereich: co = χ2m; 1−α : u χ2m; 1−α Kritischer Bereich : u > χ2m; 1−α Prüfwert: u =
k j=1
(hb j − he j ) he j
(43-14)
2
(43-15)
43.5 Prüfen der Unabhängigkeit zweier Zufallsgrößen (Korrelationskoeffizient) Gleichung (43-11) in 40.5 liefert einen Schätzwert r für den Korrelationskoeffizienten zweier Zufallsgrößen X und Y (siehe 39.6). Die Unabhängigkeit von X und Y kann als Nullhypothese H0 : = 0 gegen die Alternativhypothese H1 : 0 geprüft werden anhand des Wertes √ √ t = r n − 2/ 1 − r2 , der eine Realisation einer t-verteilten Zufallsgröße T als Prüffunktion mit n − 2 Freiheitsgraden ist. Die Nullhypothese wird demzufolge bei einem Signifikanzniveau von α abgelehnt, wenn t im kritischen Bereich liegt: (43-16) |t| > tn−2; 1−α/2 . Beispiel: Die Untersuchung des Zusammenhangs zwischen der oberen Streckgrenze und der Zugfestigkeit einer Stahlsorte lieferte an 18 Proben einen empirischen Korrelationskoeffizienten r = 0,69. Bei einem Signifikanzniveau von α = 0,05 ist √ t = 0,69 18 − 2/ 1 − 0,692 = 3,81 > t16; 0,975 = 2,12
(43-13)
und somit die Nullhypothese abzulehnen, d. h. der Zusammenhang ist bei einer Irrtumswahrscheinlichkeit von 0,05 als gegeben nachgewiesen.
44 Regression
44.1 Grundlagen Eine Vielzahl praktischer Probleme bezieht sich auf die Frage nach der Abhängigkeit einer Zufallsgröße Y von einer praktisch fehlerfrei messbaren Zufallsgröße X, wobei anders als bei der Korrelation Y eindeutig als die abhängige Variable feststeht. Zu jedem festen X = x weist die abhängige Zufallsgröße Y eine Wahrscheinlichkeitsverteilung auf mit einem von x abhängigen Erwartungswert μ(x) = E(Y|X = x). Der von x abhängige Erwartungswert μ(x) heißt Regressionsfunktion des Merkmals Y bezüglich des Merkmals X. Eine lineare Regressionsfunktion heißt Regressionsgerade μ(x) = α + βx ,
yi
x2i −
Da die Regressionsgerade y(x) durch den Schwerpunkt mit den Koordinaten x¯ und y¯ geht, gilt auch y(x) = y¯ + b(x − x¯) .
(44-2)
und Y ist N(μ(x), σ2 )-verteilt.
i
(44-8) wobei mit (44-8) in 40.4.2 gilt S 2x = (n − 1)s2x = (xi − x¯)2 = x2i − n x¯2 i
44.2 Schätzwerte für α, β und σ2 Anhand einer Stichprobe von n Messwertepaaren (xi , yi ) lassen sich für die Parameter α, β und σ2 erwartungstreue Schätzwerte a, b bzw. s2 durch Minimierung der Summe der Abweichungsquadrate Q(a, b) = [ yi − y(xi )]2 =
S y2
= (n −
1)s2y
=
( yi − a − bxi ) = Min 2
(44-3)
i
der Messwerte yi von den entsprechenden Werten y(xi ) der empirischen Regressionsfunktion y(x) = a + bx
(44-4)
an den Stellen xi ermitteln. Nullsetzen der partiellen Ableitung ∂Q/∂a und ∂Q/∂b liefert die Schätzwerte
i
( yi − y¯ ) = 2
i
(44-9)
y2i
− n¯y . 2
i
(44-10)
Mit (44-5) folgt B=
i
(44-7)
Ein normiertes Maß für die Güte der Anpassung der empirischen Regressionsfunktion y(x) an die Beobachtungswerte liefert das Bestimmtheitsmaß [ y(xi ) − y¯]2 b2 · (xi − x¯)2 2 i i 2Sx = = b , B= [ yi − y¯ ]2 ( yi − y¯ )2 S y2 i
Y = α + βx + Z = μ(x) + Z
(44-5)
mit den Schätzwerten s xy für die Kovarianz von X und Y sowie s2x für die Varianz von X gemäß (40-10) in 40.5 bzw. (40-8) in 40.4.2. Daraus erhält man als Schätzwert für die Varianz σ2 1 s2 = ( yi − a − bxi )2 . (44-6) n−2 i
(44-1)
die Steigung β der Geraden Regressionskoeffizient. Wenn die zufällige Abweichung Z des Merkmals Y vom entsprechenden Erwartungswert μ(x) als stochastisch unabhängig von X und Y und als normalverteilt mit konstanter Varianz σ2 angesehen werden kann, d. h. wenn gilt Z ∼ N(0, σ2 ), so ist die abhängige Zufallsgröße Y darstellbar als
xi xi yi a= n x2i − ( xi )2 s xy n xi yi − xi yi b= 2 2 = 2 sx n xi − ( xi )
44 Regression
s2xy s2x s2y
= r2
(44-11)
und somit auch 0 B 1, wobei B = 1 nur dann möglich ist, wenn alle Stichprobenwerte auf der Regressionsgeraden liegen.
44.3 Konfidenzintervalle für die Parameter β, σ2 und μ(χ) Als Konfidenzintervalle ergeben sich
A177
A178
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
8 (xi − x¯)2 /s t = |b − β0 |
(a) für den Regressionskoeffizienten β Konf(b − tn−2; 1−α/2 · s/S x β b + tn−2; 1−α/2 · s/s x ) = 1 − α
i
mit s aus (44-6) und S x aus (44-9) , (b) für die Varianz σ2 ⎤ ⎡ ⎢⎢⎢ (n − 2)s2 (n − 2)s2 ⎥⎥⎥⎥ 2 ⎢ Konf ⎢⎣ 2 σ 2 ⎥=1−α , χn−2; 1−α/2 χn−2; α/2 ⎦ (44-13) (c) für den Funktionswert μ(x) = α + βx an der Stelle x Konf y(x) − tn−2; 1−α/2 s g(x) μ(x) y(x) + tn−2; 1−α/2 s g(x) = 1 − α (44-14) mit g(x) =
= |b − β0 |S x /s > tn−2; 1−α
(44-12)
(x − x¯)2 1 1 (x − x¯)2 + + = . n (xi − x¯)2 n S 2x i
Dabei kennzeichnen tn−2; 1−α/2 , χ2n−2; 1−α/2 und χ2n−2; α/2 die entsprechenden Quantile der t- bzw. χ2 -Verteilung mit n − 2 Freiheitsgraden (vgl. Tabelle 39-5 bzw. 39-4). Da die Funktion g(x) mit zunehmendem Abstand von x¯ zunimmt, stellt sich das Konfidenzintervall als ein nach beiden Seiten vom Schwerpunkt breiter werdender Konfidenzstreifen dar.
44.4 Prüfen einer Hypothese über den Regressionskoeffizienten Eine Hypothese über den Regressionskoeffizienten β kann mithilfe einer t-verteilten Prüffunktion geprüft werden. Man erhält bei einem Signifikanzniveau von α als kritischen Bereich für die Prüfgröße t bezüglich der Nullhypothese H0 : β = β0 (H1 : β β0 ): 8 (xi − x¯)2 /s t = |b − β0 |
jeweils mit S x aus (44-9) und s aus (44-6).
44.5 Beispiel zur Regressionsrechnung Zur Untersuchung der Abhängigkeit des Elastizitätsmoduls von der Prismenfestigkeit βP bei Beton wurden 8 Messwertepaare ermittelt vgl. Tab. 44-1. Mit Hilfe der Rechentabelle in Tab. 44-1 lassen sich folgende Berechnungen durchführen: Schätzwerte für α, β und σ2 : 255,5 · 9291,29 − 262,1 · 8624,05 8 · 9291,29 − (262,1)2 = 20,16 kN/mm2 8 · 8624,05 − 262,1 · 255,5 b= = 0,3596 8 · 9291,29 − (262,1)2 s2 = 13,6613/(8 − 2) = 2,2769 kN2 /mm4 s = 1,509 kN/mm2 . a=
Empirische Regressionsgerade: y(x) = 20,16 + 0,3596 x . Bestimmtheitsmaß und Korrelationskoeffizient: S 2x = 9291,29 − (262,1)2 /8 = 704,239 S y2 = 8264,75 − (255,5)2 /8 = 104,719 B = 0,35962 · 704,24/104,719 = 0,8696 r = 0,8696 = 0,9325 . Konfidenzintervalle für β, σ2 und μ(x) Für α = 0,05 sind die Intervallgrenzen nach (44-12) βu = 0,3596 − 2,447 · 1,509/26,54 = 0,221 βo = 0,3596 + 2,447 · 1,509/26,54 = 0,499 und somit Konf(0,221 β 0,499) = 0,95 .
i
= |b − β0 |S x /s > tn−2; 1−α/2 ,
(44-15)
bezüglich der Nullhypothesen H0 : β β0 (H1 : β > β0 ) bzw. H0 : β β0 (H1 : β < β0 ):
(44-16)
Analog berechnet sich nach (44-13) σ2u = (8 − 2) · 2,2769/14,45 = 0,945 σ2o = (8 − 2) · 2,2769/1,24 = 11,017
Formelzeichen der Wahrscheinlichkeitsrechnung und Statistik
Tabelle 44-1. Messwerte und Rechentabelle
Messwertpaare xi in N/mm2 yi in kN/mm2 Rechentabelle i xi 1 22,0 2 28,0 3 36,8 4 28,5 5 42,5 6 23,0 7 30,2 8 51,0 Σ 262,1
22,0 27,0 yi 27,0 31,5 35,0 31,5 34,0 26,5 32,0 38,0 255,5
28,0 31,5 x2i 484,00 784,00 1354,24 812,25 1814,76 529,00 912,04 2601,00 9291,29
36,8 35,0
28,5 31,5
y2i 729,00 992,25 1225,00 992,25 1156,00 702,25 1024,00 1444,00 8264,75
42,6 34,0 xi yi 594,00 882,00 1288,00 897,75 1448,40 609,50 966,40 1938,00 8624,05
23,0 26,5
30,2 32,0
y(xi ) = a + bxi 28,07 30,23 33,39 30,41 35,48 28,43 31,02 38,50
51,0 38,0 [ yi − y(xi )]2 1,1404 1,6243 2,5921 1,1983 2,1776 3,7153 0,9670 0,2463 13,6613
größer als der Tabellenwert t6; 0,975 = 2,447. Somit ist die Nullhypothese abzulehnen d. h. β signifikant größer als null, und eine Abhängigkeit des Elastizitätsmoduls von der Prismenfestigkeit bei einer statistischen Sicherheit von 0,95 als nachgewiesen anzusehen.
Formelzeichen der Wahrscheinlichkeitsrechnung und Statistik Bild 44-1. Empirische Regressionsgerade und Konfidenz-
streifen
und somit Konf(0,945 σ2 11,017) = 0,95 . Für die Regressionsfunktion μ(x) gilt nach (14), siehe Bild 44-1: Konf[26,08 μ(22) 30,06] = 0,95 Konf[30,35 μ(32) 32,97] = 0,95 Konf[33,43 μ(42) 37,09] = 0,95 Konf[35,88 μ(52) 41,84] = 0,95 . Prüfen der Nullhypothese H0 : β = 0. Bei einem Signifikanzniveau von α = 0,05 ist nach (44-15) t = |0,3596 − 0| · 26,537/1,509 = 6,32
A, B, . . . P(A) ∪ ∩ X, Y, . . . xi , yi , . . . f (x)
Zufallsereignisse Wahrscheinlichkeit von A Vereinigung Durchschnitt Zufallsvariablen Realisationen von Zufallsvariablen Wahrscheinlichkeits(dichte)funktion, relative Häufigkeit F(x) Verteilungsfunktion, relative Summenhäufigkeit E(X) Erwartungswert der Zufallsgröße X μ arithmetischer Mittelwert einer Grundgesamtheit Median einer Zufallsgröße x0,5 XD Modalwert einer Zufallsgröße σ2 , Var(X) Varianz der Zufallsgröße X σ Standardabweichung v Variationskoeffizient
A179
A180
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
σXY , Cov(X, Y) Kovarianz zwischen X und Y
(X, Y) Korrelationskoeffizient zwischen X und Y h absolute Häufigkeit H absolute Summenhäufigkeit x¯ arithmetischer Mittelwert einer Stichprobe Median einer Stichprobe x¯0,5 (empirischer Median) Modalwert einer Stichprobe x¯D (empirischer Modalwert) (empirische) Varianz s2 (empirische) Standardabweichung s, s x , sy (empirische) Kovarianz s xy (empirischer) Korrelations r xy koeffizient ˆn Schätzfunktion Θ Realisation der Schätzfunktion ϑˆ n T Testfunktion B Bestimmtheitsmaß X∼Y „X unterliegt der Y-Verteilung“ H(n, NA , N) Hypergeometrische Verteilung B(n, p) Binominalverteilung NB(r, p) Negative Binominalverteilung NB(1, p) Geometrische Verteilung Ps(λ) Poisson-Verteilung U(a, b) Gleichverteilung (auch: Rechteckverteilung) Normalverteilung N( μ, σ2 ) N(0, 1) Standardnormalverteilung Lognormalverteilung LN( μ, σ2 ) Ex(λ) Exponentialverteilung ER(λ, n) Erlang-n-Verteilung G(λ, k) Gammaverteilung W(λ, α) Weibull-Verteilung BT(α, β, a, b) Betaverteilung χ2 -Verteilung χ2m t-Verteilung tm F-Verteilung Fm1, m2 Φ(z) Verteilungsfunktion der Standardnormalverteilung ϕ(z) Dichtefunktion der Standardnormalverteilung Z standardnormalverteilte Zufallsgröße
zα tm; α χ2m; α F m1 , m2 ; α
α-Quantil der Standardnormalverteilung α-Quantil der t-Verteilung mit Freiheitsgrad m α-Quantil der χ2 -Verteilung mit Freiheitsgrad m α-Quantil der F-Verteilung mit Freiheitsgraden m1 und m2
Literatur Allgemeine Literatur Handbücher, Formelsammlungen Bartsch, H.-J.: Taschenbuch mathematischer Formeln. 19. Aufl. Leipzig: Fachbuchverl. 2001 Bosch, K.: Mathematik Taschenbuch. 5. Aufl. Oldenbourg 1998 Bronstein, I.N.; Semendjajew, K.A.: Taschenbuch der Mathematik. 2. Aufl. Leipzig: Teubner 2003 Joos, G.; Richter, E.: Höhere Mathematik. 13. Aufl. Frankfurt: Deutsch 1994 Netz, H.: Formeln der Mathematik. 7. Aufl. München: Hanser 1992 Råde, L.; Westergren, B.; Vachenauer, P.: Springers mathematische Formeln. Taschenbuch für Ingenieure, Naturwissenschaftler, Wirtschaftswissenschaftler. 3. Aufl. Berlin: Springer 2000 Rottmann, K.: Mathematische Formelsammlung. 4. korr. Aufl. Mannheim: BI-Wiss.-Verl. 1993 Spiegel, M.R.: Einführung in die höhere Mathematik. Hamburg: McGraw-Hill 1999 Wörle, H.; Rumpf, H.: Taschenbuch der Mathematik. 12. Aufl. München: Oldenbourg 1994
Umfassende Darstellungen Baule, B.: Die Mathematik des Naturforschers und Ingenieurs. 2 Bde. Frankfurt: Deutsch 1979 Brauch; Dreyer; Haacke: Mathematik für Ingenieure. 10. Aufl. Stuttgart: Teubner 2003 Böhme, G.: Anwendungsorientierte Mathematik. 4 Bde. Berlin: Springer 1992, 1990, 1991, 1989 Burg, K.; Haf, H.; Wille, F.: Höhere Mathematik für Ingenieure. 5 Bde. Stuttgart: Teubner 1992–1997 Mangoldt, H. von; Knopp, K.; Höhere Mathematik. Rev. von Lösch, F. 4 Bde. Stuttgart: Hirzel 1990 Meyberg, K.; Vachenauer, P.: Höhere Mathematik. Bd. 1 und 2. 6. und 4. Aufl. Berlin: Springer 2001, 2002
Literatur
Papula, L.: Mathematik für Ingenieure und Naturwissenschaftler. Bde. 1 bis 3. 10., 10. und 4. Aufl. Wiesbaden: Vieweg 2001, 2001, 2001 Sauer, R.; Szabo, I.: Mathematische Hilfsmittel des Ingenieurs. Teile I–IV. Berlin: Springer 1967, 1969, 1968, 1970 Smirnow, W.I.: Lehrgang der höheren Mathematik. 5 Teile. Berlin: Dt. Verl. d. Wiss. 1990, 1990, 1995, 1995, 1991
Peschl, E.: Analytische Geometrie und lineare Algebra. Mannheim: Bibliogr. Inst. 1982
Kapitel 5 Rehbock, F.: Darstellende Geometrie. Berlin: Springer 1969 Wunderlich, W.: Darstellende Geometrie. Mannheim: Bibliogr. Inst. 1966, 1967
Kapitel 1
Kapitel 8
Asser, G.: Einführung in die mathematische Logik. 3 Teile. Frankfurt: Deutsch 1983, 1976, 1981 Klaua, D.: Allgemeine Mengenlehre. Teil 1. Berlin: Akademie-Verlag 1968 Schorn, G.: Mengen und algebraische Strukturen. München: Oldenbourg 1985
Abramowitz, M.; Stegun, I.A.: Handbook of mathematical functions. New York: Dover 1993 Erdélyi, A.; Magnus, W.; Oberhettinger, F.; Tricomi, F.: Higher transcendental functions. 3 Bde. New York: McGraw-Hill 1981 Gradstein, I.S.; Ryshik, I.W: Summen-, Produkt- und Integraltafeln. 5. Aufl. Frankfurt: Deutsch 1981 Jahnke, E.; Emde, F.; Lösch, F.: Tafeln höherer Funktionen. 7. Aufl. Stuttgart: Teubner 1966 Lighthill, M.J.: Einführung in die Theorie der FourierAnalysis und der verallgemeinerten Funktionen. Mannheim: Bibliogr. Inst. 1985 Walter, W.: Einführung in die Theorie der Distributionen. 3. Aufl. Mannheim: BI-Wiss.-Verl. 1994
Kapitel 2 Böhme, G.: Anwendungsorientierte Mathematik. Bde. 1 und 2. 6. Aufl. Berlin: Springer 1990, 1991 Mangoldt, H. von; Knopp, K.: Höhere Mathematik. Bd. 1. 17. Aufl. Rev. von Lösch, F. Stuttgart: Hirzel 1990 Smirnow, W.I.: Lehrgang der höheren Mathematik. Teil 1. 16. Aufl. Berlin: Dt. Verl. d. Wiss. 1990
Kapitel 3 Aitken, A.C.: Determinanten und Matrizen. Mannheim: Bibliogr. Inst. 1969 Dietrich, G.; Stahl, H.: Matrizen und Determinanten. 5. Aufl. Frankfurt: Deutsch 1978 Duschek, A.; Hochrainer, A.: Grundzüge der Tensorrechnung in analytischer Darstellung. Bd. 1–3. Wien: Springer 1965, 1968, 1970 Gantmacher, F.R.: Matrizentheorie. Berlin: Springer 1986 Gerlich, G.: Vektor- und Tensorrechnung für die Physik. Braunschweig: Vieweg 1977 Jänich, K.: Lineare Algebra. 7. Aufl. Berlin: Springer 2003 Klingbeil, E.: Tensorrechnung für Ingenieure. 2. Aufl. Berlin: Springer 1995 Maess, G.: Vorlesungen über numerische Mathematik I. Basel: Birkhäuser 1985 Zurmühl, R.; Falk, S.: Matrizen und ihre Anwendungen. Bd. 1. 7. Aufl., Bd. 2. 5. Aufl. Berlin: Springer 1997, 1986
Kapitel 4 Andrie; Meier: Lineare Algebra & Geometrie für Ingenieure. 3. Aufl. Berlin: Springer 1996 Baule, B.: Die Mathematik des Naturforschers und Ingenieurs. Frankfurt: Deutsch 1979 Mangoldt, H. von; Knopp, K.: Höhere Mathematik. Bd. 1. 17. Aufl. Rev. von Lösch, F. Stuttgart: Hirzel 1990
Kapitel 9 bis 12 Andrie; Meier: Analysis für Ingenieure. 3. Aufl. Berlin: Springer 1996 Courant, R.: Vorlesungen über Differential- und Integralrechnung. 2 Bde. 4. Aufl. Berlin: Springer 1971; 1972 Fichtenholz, G.M.: Differential- und Integralrechnung. 3 Bde. Berlin: Dt. Verl. d. Wiss. 1997, 1990, 1992 Jänich, K.: Analysis für Physiker und Ingenieure. 4. Aufl. Berlin: Springer 2001 Meyer zur Capellen, W.: Integraltafeln. Sammlung unbestimmter Integrale elementarer Funktionen. Berlin: Springer 1950
Kapitel 13 bis 17 Basar, Y.; Krätzig, W.B.: Mechanik der Flächentragwerke. Braunschweig: Vieweg 1985 Behnke, H.; Holmann, H.: Vorlesungen über Differentialgeometrie. 7. Aufl. Münster: Aschaffendorf 1966 Grauert, H.; Lieb, I.: Differential- und Integralrechnung III: Integrationstheorie. Kurven- und Flächenintegrale. Vektoranalysis. 2. Aufl. Berlin: Springer 1977 Klingbeil, E.: Tensorrechnung für Ingenieure. Berlin: Springer 1995 Laugwitz, D.: Differentialgeometrie. 3. Aufl. Stuttgart: Teubner 1977
A181
A182
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Kapitel 18 bis 19 Betz, A.: Konforme Abbildung. 2. Aufl. Berlin: Springer 1964 Bieberbach, L.: Einführung in die konforme Abbildung. 6. Aufl. Berlin: de Gruyter 1967 Gaier, D.: Konstruktive Methoden der konformen Abbildung. Berlin: Springer 1964 Heinhold, J.; Gaede, K.W.: Einführung in die höhere Mathematik. Teil 4. München: Hanser 1980 Knopp, K.: Elemente der Funktionentheorie. 9. Aufl. Berlin: de Gruyter 1978 Knopp, K.: Funktionentheorie. 2 Bde. 13. Aufl. Berlin: de Gruyter 1987, 1981 Koppenfels, W.; Stallmann, F.: Praxis der konformen Abbildung. Berlin: Springer 1959 Peschl, E.: Funktionentheorie. 2. Aufl. Mannheim: Bibliogr. Inst. 1983
Kapitel 20 (Siehe auch Literatur zu Kap. 8) Zurmühl, R.: Praktische Mathematik für Ingenieure und Physiker. Nachdr. d. 5. Aufl. Berlin: Springer 1991
Kapitel 23 Ameling, W.: Laplace-Transformationen. 3. Aufl. Braunschweig: Vieweg 1984 Doetsch, G.: Anleitung zum praktischen Gebrauch der Laplace-Transformation und der Z-Transformation. 6. Aufl. München: Oldenbourg 1989 Föllinger, O.: Laplace- und Fourier-Transformation. Heidelberg: Hüthig 1993 Weber, H.: Laplace-Transformation für Ingenieure der Elektrotechnik. 6. Aufl. Stuttgart: Teubner 1990
Kapitel 24 bis 28 Arnold, V.I.: Gewöhnliche Differentialgleichungen. 2. Aufl. Berlin: Dt. Verl. d. Wiss. 2001 Collatz, L.: Differentialgleichungen. 7. Aufl. Stuttgart: Teubner 1990 Collatz, L.: Eigenwertaufgaben mit technischen Anwendungen. 2. Aufl. Leipzig: Akad. Verlagsges. 1968 Courant, R.; Hilbert, D.: Methoden der mathematischen Physik. 2 Bde. 4. Aufl. Berlin: Springer 1993 Duschek, A.: Vorlesungen über höhere Mathematik. Bd. III. 2. Aufl. Wien: Springer 1960 Frank, P.; Mises, R.: Die Differential- und Integralgleichungen der Mechanik und Physik. 2 Bde. Nachdruck der 2. Aufl. Braunschweig: Vieweg 1961 Grauert, Lieb, Fischer: Differential- und Integralrechnung. Bd. II. 3. Aufl. Berlin: Springer 1978
Gröbner, W.: Differentialgleichungen. Bd. I. Mannheim: Bibliogr. Inst. 1977 Jänich, K.: Analysis für Physiker und Ingenieure. 4. Aufl. Berlin: Springer 2001 Kamke, E.: Differentialgleichungen. Bd. 1. 10. Aufl. Stuttgart: Teubner 1983 Knobloch, H.W.; Kappel, F.: Gewöhnliche Differentialgleichungen. Stuttgart: Teubner 1974 Walter, W.: Gewöhnliche Differentialgleichungen. 7. Aufl. Berlin: Springer 2000
Kapitel 29 bis 31 (Siehe auch Literatur zu Kap. 24 bis 28) Gröbner. W.: Partielle Differentialgleichungen. Mannheim: Bibliogr. Inst. 1977 Hackbusch, W.: Theorie und Numerik elliptischer Differentialgleichungen. 2. Aufl. Stuttgart: Teubner 1997 Hellwig, G.: Partielle Differentialgleichungen. Stuttgart: Teubner 1960 Leis, R.: Vorlesungen über partielle Differentialgleichungen zweiter Ordnung. Mannheim: Bibliogr. Inst. 1967 Michlin, S.G.: Partielle Differentialgleichungen in der mathematischen Physik. Frankfurt: Deutsch 1978 Petrovskij, G.I.: Vorlesungen über partielle Differentialgleichungen. Leipzig: Teubner 1955 Sommerfeld, A.: Partielle Differentialgleichungen der Physik. Frankfurt: Harri Deutsch/BRO 1997 Wloka, J.: Partielle Differentialgleichungen, Sobolevräume und Randwertaufgaben. Stuttgart: Teubner 1982
Kapitel 32 Courant, R.; Hilbert, D.: Methoden der Mathematischen Physik. 4. Aufl. Berlin: Springer 1993 Elsgolc, L.E.: Variationsrechnung. Mannheim: Bibliogr. Inst. 1984 Funk, P.: Variationsrechnung und ihre Anwendung in Physik und Technik. 2. Aufl. Berlin: Springer 1970 Klingbeil, E.: Variationsrechnung. 2. Aufl. Mannheim: BIWiss.-Verl. 1988 Lawrynowicz, J.: Variationsrechnung und Anwendungen. Berlin: Springer 1986 Michlin, S.G.: Variationsmethoden der Mathematischen Physik. Berlin: Dt. Verl. d. Wiss. 1962 Pontrjagin, L.S.; Boltjanskij, V. G.; Gamkrelidze, R. V.: Mathematische Theorie optimaler Prozesse. 2. Aufl. München: Oldenbourg 1967 Schwarz, H.: Optimale Regelung linearer Systeme. Mannheim: Bibliogr. Inst. 1976 Tolle, H.: Optimierungsverfahren für Variationsaufgaben mit gewöhnlichen Differentialgleichungen als Nebenbedingungen. Berlin: Springer 1971
Literatur
Velte, W.: Direkte Methoden der Variationsrechnung. Stuttgart: Teubner 1976
Kapitel 33 bis 37 Bathe, K.J.: Finite-Element-Methoden. 2. Aufl. Berlin: Springer 2001 Böhmer, K.: Spline-Funktionen. Stuttgart: Teubner 1974 Collatz, L.: Eigenwertaufgaben mit technischen Anwendungen. 2. Aufl. Leipzig: Akad. Verlagsges. 1968 Davis, P.J.; Rabinokwitz, P.: Method of numerical integration. 2. Aufl. New York: Academic Press 1984 Deuflhard; Hohmann: Numerische Mathematik. Bd. 1. und Bd. 2. Berlin: de Gruyter 2002, 2002 Engeln-Müllges. G.; Reuter, F.: Numerische Mathematik für Ingenieure. Berlin: Springer 2003 Faddejew, D.K.; Faddejewa, W.N.: Numerische Methoden der linearen Algebra. München: Oldenbourg 1984 Forsythe, G.E.; Malcolm, M.A.; Moler, C.B.: Computer Methods for mathematical computations. Englewood Cliffs: Prentice-Hall 1977 Golub, G.H.; Van Loan, Ch. F: Matrix computations. 2. Ed. Baltimore: The John Hopkins University Press 1989 Hairer, E.; Nørsett, S.P.; Wanner, G.: Solving ordinary differential equations, I: Nonstiff problems. Berlin: Springer 1987 Hairer, E.; Wanner, G.: Solving ordinary differential equations, II: Stiff and differential-algebraic problems. Berlin: Springer 1991 Hämmerlin, G.; Hoffmann, K.-H.: Numerische Mathematik. Berlin: Springer 1989 Heitzinger, W.; Troch, I.; Valentin, G.: Praxis nichtlinearer Gleichungen. München: Hanser 1984 Jennings, A.: Matrix computation for engineers and scientists. New York: John Wiley 1977 Kielbasinski, A.; Schwetlick, H.: Numerische lineare Algebra. Thun/Frankfurt a. M.: Harri Deutsch 1988 Maess, G.: Vorlesungen über numerische Mathematik I. Basel: Birkhäuser 1985 Meis, Th.; Marcowitz, U.: Numerische Behandlung partieller Differentialgleichungen. Berlin: Springer 1978 Parlett, B. N.: The symmetric eigenvalue problem. Englewood Cliffs: Prentice-Hall 1980 Rutishauser, H.: Vorlesungen über numerische Mathematik. Basel: Birkhäuser 1998 Schwarz, H.R.: Numerische Mathematik. 4. Aufl. Stuttgart: Teubner 1997 Schwarz, H.R.: Methode der finiten Elemente. 3. Aufl. Stuttgart: Teubner 1991 Shampine, L.F.; Gordon, M.K.: Computer-Lösungen gewöhnlicher Differentialgleichungen. Das Anfangswertproblem. Braunschweig: Vieweg 1984
Stiefel, E.: Einführung in die numerische Mathematik. 5. Aufl. Stuttgart: Teubner 1976 Stoer, J.: Numerische Mathematik 1. 8. Aufl. Berlin: Springer 1999 Stoer, J., Bulirsch, R.: Numerische Mathematik 2. 3. Aufl. Berlin: Springer 1990 Törnig, W.; Spellucci, P.: Numerische Mathematik für Ingenieure und Physiker. Bd. 1: Numerische Methoden der Algebra, 2. Aufl. Berlin: Springer 1988 Törnig, W.; Spellucci, P.: Numerische Mathematik für Ingenieure und Physiker. Bd. 2: Numerische Methoden der Analysis, 2. Aufl. Berlin: Springer 1990 Varga, R.S.: Matrix iterative analysis. 3. Ed. Berlin: Springer 1999 Young, D.M.; Gregory, R.T.: A survey of numerical mathematics. Vols. I + II. Reading: Addison-Wesley 1973 Zienkiewicz, O.C.: Methode der finiten Elemente. 2. Aufl. München: Hanser 1984 Zurmühl, R.: Praktische Mathematik. Nachdr. d. 5. Aufl. Berlin: Springer 1984 Zurmühl, R.; Falk, S.: Matrizen und ihre Anwendungen. Bd. 1. 7. Aufl., Bd. 2. 5. Aufl. Berlin: Springer 1997, 1986
Literatur zur Wahrscheinlichkeitsrechnung und Statistik (Kapitel 38 bis 44) Graf, U.; Henning, H.-J.; u.a.: Formeln und Tabellen der angewandten mathematischen Statistik. 3. Aufl. Berlin: Springer 1987 Hartung, J.: Statistik. 11. Aufl. München: Oldenbourg 1998 Heinhold, J.; Gaede, K.W.: Ingenieurstatistik. 4. Aufl. München: Oldenbourg 1979 Herz, R.; Schlichter, H.G.; Siegener, W.: Angewandte Statistik für Verkehrs- und Regionalplaner. 2. Aufl. Düsseldorf: Werner 1992 Sachs, L.: Angewandte Statistik. 8. Aufl. Berlin: Springer 1997 Weber, H.: Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure. 3. Aufl. Stuttgart: Teubner 1992
Kapitel 38 Fisz, M.: Wahrscheinlichkeitsrechnung und mathematische Statistik. 11. Aufl. Berlin: Deutscher Verl. d. Wiss. 1989 Rosanow, J.A.: Wahrscheinlichkeitstheorie. Braunschweig: Vieweg 1970 Weber, H.: Einführung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure. 3. Aufl. Stuttgart: Teubner 1992
A183
A184
A Mathematik und Statistik / Wahrscheinlichkeitsrechnung und Statistik
Kapitel 39 Graf, U.; Henning, H.-J.; u.a.: Formeln und Tabellen der angewandten mathematischen Statistik. 3. Aufl. Berlin: Springer 1987
Kapitel 40 Benninghaus, H.: Deskriptive Statistik. 8. Aufl. Stuttgart: Teubner 1998
Kapitel 41 Cochran, W.G.: Stichprobenverfahren. Berlin: de Gruyter 1972 Sachs, L.: Statistische Methoden. 7. Aufl. Berlin: Springer 1993 Sahner, H.: Schließende Statistik (Statistik für Soziologen, 2). 4. Aufl. Stuttgart: Teubner 1997 Stenger, H.: Stichproben. Heidelberg: Physica-Verl. 1986
Spezielle Literatur Kapitel 1 1. Böhme, G.: Algebra. Anwendungsorientierte Mathematik. 7. Aufl. Berlin: Springer 1996 2. Klir, G.J.; Folger, T.A.: Fuzzy sets. Englewood Cliffs, N.J.: Prentice Hall 1988 3. Kruse, R.; Gebhardt, J.; Klawonn, F.: Fuzzy-Systeme. 2. Aufl. Braunschweig: Teubner 1995
Kapitel 9 1. Oldham, K.B.; Spanier, J.: The fractional calculus. San Diego, Calif.: Academic Press 1974 2. Oustaloup, A.: La derivation non entiere. Paris: Hermes 1995 3. Miller, K.S.; Ross, B.: An introduction to the fractional calculus and fractional differential equations. New York: Wiley 1993
Kapitel 33 1. Zielke, G.: Testmatrizen mit maximaler Konditionszahl. Computing 13 (1974) 33–54
Kapitel 35 1. Zurmühl, R.; Falk, S.: Matrizen und ihre Anwendungen. Bd. 1. 7. Aufl., Bd. 2. 5. Aufl. Berlin: Springer 1997, 1986
Kapitel 36 1. Abramowitz, M.; Stegun, I.A.: Handbook of mathematical functions. New York: Wiley 1993 2. Stroud, A.H.: Approximate calculation of multiple integrals. Englewood Cliffs: Prentice-Hall 1981 3. Hammer, P.C.; Marlowe, O.P.; Stroud, A.H.: Numerical integration over simplexes and cones. Math. Tables Aids Comp. 10 (1956) 130–137
B1
0 Übersicht Die Grundlagen der Physik wurden traditionell ungefähr entsprechend der historischen Entwicklung der einzelnen Teilgebiete dargestellt, also etwa in der Reihenfolge: – – – – – – – – – –
Mechanik Schwingungen und Wellen Akustik Wärmelehre Elektrizitätslehre Optik Elektromagnetische Strahlung Atomphysik Kerne und Elementarteilchen Relativitätsprinzip.
In dieser Abfolge von Teilgebieten werden übergeordnete Prinzipien der Physik, wie z. B. das Feldkonzept, die vier grundlegenden Wechselwirkungsarten, oder die Wellenausbreitung, nicht sehr deutlich. Deshalb wurde in der vorliegenden Darstellung der Physik eine andere Systematik gewählt, die – ähnlich wie in den Feynman Lectures und in den Büchern von Alonso und Finn oder von Stroppe, vgl. den Abschnitt Literatur – von nur wenigen Grundkonzepten ausgeht, und hier zu einer Gliederung in drei Teile führt: ∗ Teil I: Teilchen und Teilchensysteme – Kinematik – Kraft und Impuls – Dynamik starrer Körper – Statistische Mechanik – Thermodynamik – Transporterscheinungen – Hydro- und Aerodynamik ∗ Teil II: Wechselwirkungen und Felder – Gravitationswechselwirkung – Elektrische Wechselwirkung – Magnetische Wechselwirkung – Zeitveränderliche elektromagnetische Felder
– Elektrische Stromkreise – Transport elektrischer Ladung: Leitungsmechanismen – Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen ∗ Teil III: Wellen und Quanten – Wellenausbreitung – Elektromagnetische Wellen – Wechselwirkung elektromagnetischer Strahlung mit Materie – Reflexion und Brechung, Polarisation – Geometrische Optik – Interferenz und Beugung – Wellenaspekte bei der optischen Abbildung – Materiewellen. Hier können die systematischen Zusammenhänge in den verschiedenen Bereichen der Physik leichter als in der traditionellen Darstellung deutlich gemacht werden. Beispielsweise werden bei der Mechanik des Massenpunktes und der Teilchensysteme in Teil I die Relativitätsprinzipen (Galilei- und LorentzTransformation) bereits mitbehandelt, ebenso die Schwingungen. Starre Körper, Fluide und Gase werden als Teilchensysteme aufgefasst, und die Thermodynamik wird mithilfe der kinetischen Gastheorie als statistische Mechanik dargestellt. Die Transporterscheinungen (Diffusion, Wärmeleitung, Viskosität) werden als Nichtgleichgewichtsvorgänge im Anschluss an die thermodynamischen Gleichgewichtsprozesse (Kreisprozesse) behandelt. In Teil II werden die vier bekannten fundamentalen Wechselwirkungsarten (Gravitations-, elektromagnetische, starke und schwache Wechselwirkung) mit ihren Kraftfeldern im Zusammenhang besprochen, wobei das Schwergewicht naturgemäß bei der Elektrodynamik liegt. Die Atomstruktur wird einführend bei den elektrischen Leitungsmechanismen erläutert. Kernstruktur, -zerfall und -energiegewinnung finden
B
Physik
B
Physik
H. Niedrig, M. Sternberg
B2
B Physik
sich unter dem Stichwort Starke Wechselwirkung. Die Elementarteilchensystematik wird einschließlich des Standardmodells unter dem Stichwort Schwache Wechselwirkung behandelt. Teil III geht zunächst von der allgemeinen Beschreibung von Wellenbewegungen und der daraus resultierenden Wellengleichung aus, um dann elastische Wellen, akustische Wellen (inklusive Doppler-Prinzip) und vor allem elektromagnetische Wellen zu behandeln. Es schließen sich die Wechselwirkung elektromagnetischer Strahlung mit Materie, die Strahlungsgesetze, das Quantenkonzept des Lichtes und die Spektroskopie an bis hin zur induzierten Emission und dem Laser. Die Optik wird zunächst im Grenzfall der (unendlich) kleinen Wellenlänge betrachtet (Strahlenoptik, geometrische Optik). Der entgegengesetzte Fall führt zur Interferenz und Beugung (Huygens, Fresnel, Fraunhofer), zur Abbe’schen Mikroskoptheorie und zur Holografie. Als letzter Aspekt werden Elektronen als Materiewellen (de Broglie) betrachtet: Schrödinger-Gleichung, Elektronenbeugung und Elektronenoptik. Dem Ganzen vorgeschaltet ist ein Abschnitt über physikalische Größen und Einheiten und das Internationale Einheitensystem, das hier durchgängig verwendet wird.
1 Physikalische Größen und Einheiten Physik ist die Wissenschaft von den Eigenschaften, der Struktur und der Bewegung der (unbelebten) Materie, und von den Kräften oder Wechselwirkungen, die diese Eigenschaften, Strukturen und Bewegungen hervorrufen. Aufgabe der Physik ist es, solche physikalischen Vorgänge in Raum und Zeit zu verfolgen (zu beobachten) und in logische Beziehungen zueinander zu setzen. Die Sprache, in der das geschieht, ist die der Mathematik. Die Beobachtungsergebnisse müssen daher in messbaren, d. h. zahlenmäßig erfassbaren Werten (Vielfachen oder Teilen von festgelegten Einheiten) ausgedrückt werden, um physikalische Gesetzmäßigkeiten erkennen zu können. Der Vergleich mit der Einheit stellt einen Messvorgang dar. Er ist stets mit einem Messfehler verknüpft, der die Genauigkeit der Messung begrenzt.
1.1 Physikalische Größen Physikalische Gesetzmäßigkeiten sind mathematische Zusammenhänge zwischen physikalischen Größen. Physikalische Größen G kennzeichnen (im Prinzip) messbare Eigenschaften und Zustände von physikalischen Objekten oder Vorgängen. Sie werden ihrer Qualität nach bestimmten Größenarten (z. B. Länge, Zeit, Kraft, Ladung usw.) zugeordnet. Der Wert einer physikalischen Größe ist das Produkt aus einem Zahlenwert {G} (früher: Maßzahl) und einer Einheit [G] (früher: Maßeinheit): G = {G}[G] .
(1-1)
Außerdem haben Größen und Einheiten eine Dimension, z. B. haben Kreisumfang und die Einheit Femtometer beide die Dimension Länge. Formal kann man einen Ausdruck für die Dimension aus der SI-Einheit ableiten, indem man im Potenzprodukt der Basiseinheiten diese durch die entsprechenden Basisdimensionen ersetzt.
1.2 Basisgrößen und -einheiten Man unterscheidet heute zwischen Basisgrößenarten und abgeleiteten Größenarten. Letztere können als Potenzprodukte mit ganzzahligen Exponenten der Basisgrößenarten dargestellt werden (z. B. Geschwindigkeit = Länge · Zeit−1 ). Welche Größenarten als Basisgrößenarten gewählt werden, ist in gewissem Maße willkürlich und geschieht nach Gesichtspunkten der Zweckmäßigkeit. In den verschiedenen Gebieten der Physik kommt man mit unterschiedlich vielen Basisgrößenarten aus (Tabelle 1-1).
1.3 Das Internationale Einheitensystem, Konstanten und Einheiten Die neben den SI-Einheiten üblichen und zugelassenen Einheiten sind heute definitorisch sämtlich an das SI (Système International d’Unités) angeschlossen. Die sieben Basisgrößen und -einheiten des SI sind in Tabelle 1-2 aufgeführt. Alle anderen physikalischen Größen lassen sich als Potenzprodukte der Basisgrößen darstellen (abgeleitete Größen). Bei wichtigen abgeleiteten Größen werden die zugehörigen Po-
1 Physikalische Größen und Einheiten
Tabelle 1-1. Schema der Basisgrößenarten, auf denen das SI basiert
Teilgebiete der Physik Geometrie: Länge l Kinematik: l, Zeit t Dynamik: l, t, Masse m Elektrodynamik: Phänomenologische Thermodynamik: l, t, m, Ladung Q l, t, m, Temperatur T Elektrothermik: Statistische Physik: l, t, m, Q, T l, t, m, T , ν Physik der Materie: l, t, m, Q, T, ν
tenzprodukte der Basiseinheiten durch weitere Einheitennamen abgekürzt, z. B. für die elektrische Spannung: kg · m2 · A−1 · s−3 = V (Volt). Anstelle der sich als Basisgröße natürlich anbietenden elektrischen Ladung wird die besser messbare elektrische Stromstärke verwendet. Definitionen der Basiseinheiten (in Klammern die Größenordnung der relativen Unsicherheiten der Realisierungen): – 1 Meter (m) ist die Länge der Strecke, die Licht im Vakuum während der Dauer von 1/299 792 458 Sekunden durchläuft (10−14 ). – 1 Sekunde (s) ist das 9 192 631 770-fache der Periodendauer der dem Übergang zwischen den beiden Hyperfeinstrukturniveaus des Grundzustands von Atomen des Nuklids 133 Cs entsprechenden Strahlung (10−14 ). – 1 Kilogramm (kg) ist die Masse des internationalen Kilogrammprototyps (10−9 ). – 1 Ampere (A) ist die Stärke eines zeitlich unveränderlichen Stroms, der, durch zwei im Vakuum parTabelle 1-2. Basisgrößen und Basiseinheiten des SI
Basisgröße Länge Zeit Masse elektr. Stromstärke Temperatur Stoffmenge Lichtstärke
Basiseinheit Name Meter Sekunde Kilogramm Ampere Kelvin Mol Candela
Zeichen m s kg A K mol cd
Atomistik: l, t, m, Stoffmenge ν Elektrische Transportphänomene: l, t, m, Q, ν
Anzahl der Basisgrößen 1 2 3 4 5 6
allel im Abstand von 1 Meter angeordnete, geradlinige, unendlich lange Leiter von vernachlässigbar kleinem kreisförmigem Querschnitt fließend, zwischen diesen Leitern je 1 Meter Leiterlänge die Kraft 2 · 10−7 Newton hervorruft (10−6 ). – 1 Kelvin (K) ist der 273,16-te Teil der thermodynamischen Temperatur des Tripelpunktes des Wassers (10−6 ). – 1 Mol (mol) ist die Stoffmenge eines Systems, das aus ebenso viel Teilchen besteht, wie Atome in 0,012 Kilogramm des Kohlenstoff-Nuklids 12 C enthalten sind (10−6). – 1 Candela (cd) ist die Lichtstärke in einer bestimmten Richtung einer Strahlungsquelle, die monochromatische Strahlung der Frequenz 540 THz aussendet und deren Strahlstärke in dieser Richtung 1/683 W/sr beträgt (5 · 10−3 ). Aufgrund der Fortschritte in der Messgenauigkeit insbesondere der Zeitmessung wurde auf der XVII. Generalkonferenz für Maß und Gewicht am 20. 10. 1983 der Zahlenwert der Vakuumlichtgeschwindigkeit als Naturkonstante genau festgelegt: c0 = 299 792 458 m/s .
(1-2)
Damit ist das Meter seit dieser Festlegung metrologisch von der Sekunde abhängig geworden. Es ist Aufgabe der staatlichen Mess- und Eichlaboratorien, in der Bundesrepublik Deutschland der Physikalisch-Technischen Bundesanstalt, für die experimentelle Realisierung der Basiseinheiten in Normalen mit größtmöglicher Genauigkeit zu sorgen, da hiervon die Messgenauigkeiten physikalischer
B3
B4
B Physik
Tabelle 1-3. Vorsätze zur Bildung dezimaler Vielfacher und
Teile von Einheiten Faktor Vorsatz Vorsatzzeichen 1024 Yotta Y 1021 Zetta Z 1018 Exa E 1015 Peta P 1012 Tera T 109 Gigaa G 106 Megaa M 103 Kiloa k 102 Hektob h 101 Dekab da 10−1 Dezib d 10−2 Zentib c 10−3 Milli m 10−6 Mikro μ 10−9 Nano n 10−12 Piko p 10−15 Femto f 10−18 Atto a 10−21 Zepto z 10−24 Yocto y a Die Vorsätze Kilo (K), Mega (M) und Giga (G) sind in der Informatik abweichend wie folgt definiert: K = 210 = 1024, M = 220 = 1 048 576, 30 G = 2 = 1 073 741 824. b Die Vorsätze c, d, da und h werden heute im Wesentlichen nur noch in folgenden 9 Einheiten angewandt: cm, dm; ha; cl, dl, hl; dt, hPa sowie (in Österreich) dag.
Beobachtungen und die Herstellungsgenauigkeiten technischer Geräte abhängen. Zur Vervielfachung bzw. Unterteilung der Einheiten sind international vereinbarte Vorsätze und Vorsatzzeichen zu verwenden (Tabelle 1-3). Aus der theoretischen Beschreibung der physikalischen Gesetzmäßigkeiten, d. h. der mathematischen Zusammenhänge zwischen den physikalischen Größen, ergeben sich universelle Proportionalitätskonstanten, die sog. Naturkonstanten, die entsprechend den Fortschritten der physikalischen Messtechnik von der CODATA Task Group on Fundamental Constants als konsistenter Satz von Naturkonstanten empfohlen und hier verwendet werden (P.J. Mohr, B.N. Taylor: CODATA Recommended Values of the Fundamental Physical Constants: 2002, http://www.physicstoday.org/guide/fundconst.pdf; Reviewed 2005 by P.J. Mohr and B.N. Taylor, Rev. Mod. Phys. 77, 1, 2005). In der älteren Literatur sind verschiedene andere Einheitensysteme verwendet, aus denen man manche Einheiten noch antrifft. Tabelle 1-4 enthält daher einige Umrechnungen heute ungültiger und sonstiger Einheiten. International vereinbarte Normwerte von Kenngrößen der Erde sowie von Luft, Wasser und Sonnenstrahlung enthält Tabelle 1-5.
Tabelle 1-4. Einheiten außerhalb des SI
Einheit Einheitenzeichen, Definition, Umrechnung in das SI Gesetzliche Einheiten Gon gon = (π/200) rad ◦ Grad = (π/180) rad Minute = (1/60)◦ Sekunde = (1/60) Liter l = L = 1 dm3 = 10−3 m3 Minute min = 60 s Stunde h = 60 min Tag d = 24 h Tonne t = 103 kg Bar bar ( = 106 dyn/cm2 ) = 105 Pa – mit beschränktem Anwendungsbereich Dioptrie dpt = 1/m Ar a = 100 m2 [1 ha = 100 a] Barn b = 10−28 m2 = 100 fm2
Anwendung ebener Winkel ebener Winkel ebener Winkel ebener Winkel Volumen Zeit Zeit Zeit Masse Druck Brechwert opt. Systeme Fläche von Grundstücken Wirkungsquerschnitt in der Kernphysik
1 Physikalische Größen und Einheiten
Tabelle 1-4. Fortsetzung
Einheit atomare Masseneinheit
Einheitenzeichen, Definition, Umrechnung in das SI u = kg/(103 · NA · mol) = 1,66053886 ·10−27 kg metrisches Karat (Kt = ct) = 0,2 g mm Quecksilbersäule mmHg = 133,322 Pa Elektronenvolt eV = e · (1 V) = 1,60217653 · 10−19 J Englische und US-amerikanische Einheiten mit verbreiteter Anwendung inch (vereinheitl.) in = 0,0254 m — imperial inch (U.K.) imp. in = 25,399978 mm — US inch = (1/39,37) m = 25,4000508 mm foot ft = 12 in = 0,3048 m yard yd = 3 ft = 0,9144 m mile mile = 1760 yd = 1609,344 m gallon (U.K.) imp. gallon = 277,42 in3 = 4,54609 l gallon (US) gal = 231 in3 (US) = 3,7854345 l petroleum gallon (US) ptr. gal = 230,665 in3 (US) = 3,779949 l petroleum barrel (US) ptr. bbl = 42 ptr. gal = 158,7579 l pound (vereinheitl.) lb = 0,45359237 kg ounce oz = (1/16) lb = 28,349523 g troy ounce ozt = oztr = (480/7000) lb = 31,1034768 kg pound-force (U.K.) lbf = lb ·gn = 4,4482216 N horse-power (U.K.) h.p. = 550 ft · lbf/s = 745,700 W International übliche SI-fremde Einheiten für besondere Gebiete internationale Seemeile sm = 1852 m international nautical air mile NM = NAM = 1 sm ¯ Knoten kn = sm/h = 1,852 km/h = 0,5144m/s ¯ Knoten kt = NM/h = 0,5144 m/s astronom. Einheit AE = 149,597870 · 109 m Lichtjahr ly = c0 · atr (atr = 365,24219878 d) = 9,460528 · 1015 m Parsec pc = AE/ sin 1 = 30,856776 · 1015 m Nicht mehr gesetzliche abgeleitete CGS-Einheiten mit besonderem Namen und verwandte Dyn dyn = g · cm/s2 = 10−5 N Erg erg = dyn · cm = 10−7 J Poise P = g/(cm · s) = 10−1 Pa · s Stokes St = cm2 /s = 10−4 m2 /s Gal Gal = cm/s2 = 10−2 m/s2 Stilb sb = cd/cm2 = 104 cd/m2 Phot ph = cd · sr/cm2 = 104 lx (lux) Oersted Oe = (10/4π)A/cm = (1000/4π)A/m Gauß G = 10−4 T (Tesla) Maxwell M = G · m2 = 10−8 Wb (Weber) Sonstige nicht mehr gesetzliche Einheiten Kilopond kp = kg · gn = 9,80665 N Kalorie cal = cH2 O · K · g = 4,1868 J
Anwendung Masse in der Atomphysik Masse von Edelsteinen Blutdruck in der Medizin Energie in der Atomphysik Länge Länge Länge Länge Länge Länge Volumen (Hohlmaß) Volumen (Hohlmaß) f. Flüss. Volumen von Erdöl Volumen von Erdöl Masse Masse Masse von Edelmetallen Kraft Leistung Länge in der Seefahrt Länge in der Luftfahrt Geschw. in der Seefahrt Geschw. in der Luftfahrt Länge in der Astronomie Länge in der Astronomie Länge in der Astronomie Kraft Energie dynamische Viskosität kinematische Viskosität Fallbeschleunigung Leuchtdichte Beleuchtungsstärke magnetische Feldstärke magnetische Flussdichte magnetischer Fluss Kraft Wärmemenge, (Energie)
B5
B6
B Physik
Tabelle 1-4. Fortsetzung
Einheit Pferdestärke Apostilb Röntgen Rad Rem Curie Ångstrom
Einheitenzeichen, Definition, Umrechnung in das SI PS = 75 m · kp/s = 735,49875 W asb = (10−4 /π) sb = 1/π cd/m2 R = 2,58 · 10−4 C/kg rd = 10−2 J/kg = 10−2 Gy (Gray) rem = 10−2 J/kg = 10−2 Sv (Sievert) Ci = 3,7 · 1010 s−1 = 37 · 109 Bq (Becquerel) Å = 10−10 m
X-Einheit
XE = (1,00202 ± 3 · 10−5 ) · 10−13 m
Anwendung Leistung Leuchtdichte Ionendosis Energiedosis Äquivalentdosis Aktivität eines Radionuklids Länge in der Spektroskopie und Elektronenmikroskopie Länge in der Röntgenspektr.
Tabelle 1-5. Genormte Werte von physikalischen Umweltdaten
Größe (Quelle) Sonnenstrahlung Solarkonstante (DIN 5031-8) Erde (Geodätisches Referenzsystem, 1980) Äquatorradius Polradius mittlerer Erdradius (der volumengleichen Kugel) Oberfläche Volumen Masse Normfallbeschleunigung Breitenabhängigkeit der Fallbeschleunigung auf NN
Formelzeichen
Wert
Ee0
1,37 kW/m2
a b RE = (a2 · b)1/3 SE VE = (4π/3)a2 b ME gn g(ϕ)
6 378 137 m 6 356 752 m 6 371 000 m 510,0656 · 106 km2 1083,207 ·109 km3 5,9742 · 1024 kg 9,80665 m/s2 9,780327(1 + 0,00530244 sin2 ϕ − 0,00000582 sin2 2ϕ) Luft im Normzustand (DIN ISO 2533, basiert auf älteren Werten der Fundamentalkonstanten) Normdruck pn 101 325 Pa Normtemperatur (anders DIN 1343!) Tn 228,15 K = 15◦ C Dichte der trockenen Luft
n 1,225 kg/m3 molare Masse der trockenen Luft ML = n RT n /pn 28,964420 kg/kmol spezifische Gaskonstante der trockenen Luft RL = R/ML = pn /( n T n ) 287,05287 J/(kg · K) Schallgeschwindigkeit an = ca.n = (1,4pn / n ) 340,294 m/s Druckskalenhöhe H pn = pn /(gn n ) 8434,5 m mittlere freie Weglänge der Luftteilchen ln 66,328 nm Teilchendichte nn ≈ n0 T 0 /T n 25,471 · 1024 m−3 mittlere Teilchengeschwindigkeit v¯ n 458,94 m/s Wärmeleitfähigkeit λn 25,383 mW/(m · K) dynamische Viskosität μn 17,894 μPa · s Brechzahl (DIN 5030-1) im sichtb. Spektralber. n(λ) 1,00021 . . . 1,00029 Wasser Dichte bei 4 ◦ C und pn (DIN 1306)
999,972 kg/m3 Eispunkttemperatur bei pn T0 273,15 K =ˆ 0 ◦ C ◦ dyn. Viskosität bei 20 C (DIN 51 550) η 1,002 mPa · s Verdampfungsenthalpie bei 25 ◦ C, spezifische −, r(= h1g ) 2442,5 kJ/kg molare rm 44,002 kJ/mol
2 Kinematik
I. Teilchen und Teilchensysteme In den folgenden Abschnitten 2 bis 7 werden die physikalischen Grundlagen der Mechanik dargestellt, die später in der Technischen Mechanik E im Hinblick auf technische Anwendungen spezieller behandelt werden.
2 Kinematik
Bild 2-1. Ortsvektor eines Massenpunktes P
Die Kinematik (Bewegungslehre) behandelt die Gesetzmäßigkeiten, die die Bewegungen von Körpern rein geometrisch beschreiben, ohne Rücksicht auf die Ursachen der Bewegung. Die die Bewegung erzeugenden bzw. dabei auftretenden Kräfte werden erst in der Dynamik behandelt. Es wird zunächst die Kinematik des Massenpunktes besprochen. Definition des Massenpunktes: Der Massenpunkt ist ein idealisierter Körper, dessen gesamte Masse in einem mathematischen Punkt vereinigt ist. Jeder reelle Körper, dessen Größe und Form bei dem betrachteten physikalischen Problem ohne Einfluss bleiben, kann als Massenpunkt behandelt werden (Beispiele: Planetenbewegung, Satellitenbahnen, H-Atom). Die Lage oder der Ort eines Massenpunktes zur Zeit t in einem vorgegebenen Bezugssystem (Bild 2-1) kann durch einen (bei Bewegung des Massenpunktes zeitabhängigen) Ortsvektor r(t) = (x(t), y(t), z(t))
2.1 Geradlinige Bewegung Die die geradlinige Bewegung eines Massenpunktes beschreibenden Größen sind der Weg s, die Zeit t, die Geschwindigkeit v, die Beschleunigung a. Definitionen der Geschwindigkeit: Δs Δr = , Δt Δt Δs ds Momentanv = lim = = s˙ Δt→0 Δt geschwindigkeit dt dr = = r˙ . dt SI-Einheit: [v] = m/s .
mittlere Geschwindigkeit v¯ =
r(t) = |r(t)| =
v = const Ist zum Zeitpunkt t0 der Ort des Massenpunktes s0 (Bild 2-2), so ergibt sich sein Ort s zu einem späteren Zeitpunkt t durch Integration von ds = vdt aus (2-3): "t ds =
x2 (t) + y2 (t) + z2 (t)
(2-1)
oder durch die entsprechenden Ortskoordinaten x(t), y(t), z(t) beschrieben werden. Kinematische Operationen: Hierunter wird die Durchführung bestimmter Bewegungsoperationen verstanden, die zu einer Veränderung der Lage ausgedehnter Körper im Raum führen (Translation, Rotation, Spiegelung). Die Lageveränderung einzelner Massenpunkte wird allein durch die Translation ausreichend beschrieben.
(2-3)
Für die gleichförmig geradlinige Bewegung gilt:
"s
mit
(2-2)
s0
vdt , t0
s = s0 + v(t − t0 ) .
(2-4)
Bild 2-2. Geradlinige Bewegung eines Massenpunktes
B7
B8
B Physik
Definitionen der Beschleunigung: mittlere Beschleunigung a¯ = Momentanbeschleunigung
a = lim
Δt→0
=
Δv , Δt
(2-5)
Δv dv = = v˙ Δt dt
2
2
d r d s = s¨ = 2 = r¨ . dt2 dt
(2-6)
Verzögerung liegt vor, wenn a < 0 ist, d. h. der Betrag der Geschwindigkeit mit t abnimmt. Verzögerung ist also negative Beschleunigung. Bemerkung: Für die geradlinige Bewegung ist eine skalare Schreibweise ausreichend. In der hier gewählten vektoriellen Schreibweise sind die Definitionen (2-3) und (2-6) auch für krummlinige Bewegungen gültig. In diesem Fall ist die Geschwindigkeitsänderung dv und damit die Beschleunigung a i. Allg. nicht parallel zu v (Bild 2-3). Sonderfälle: a) Ändert sich nur der Geschwindigkeitsbetrag, nicht aber die Richtung, so handelt es sich um eine geradlinige Bewegung mit a v: Bahnbeschleunigung. b) Ändert sich nur die Geschwindigkeitsrichtung, nicht aber der Betrag, so handelt es sich um eine krummlinige Bewegung mit a ⊥ v: Normalbeschleunigung. Für die gleichmäßig beschleunigte, geradlinige Bewegung gilt a = const , Anfangsgeschwindigkeit v0 a . Ist zum Zeitpunkt t0 der Ort des Massenpunktes s0 und seine Geschwindigkeit v0 (Anfangsgeschwindigkeit), so ergibt sich für einen späteren Zeitpunkt t durch Integration von dv = a dt aus (2-6) "t dv = v0
und durch Integration von ds = vdt aus (2-3) "s "t "t ds = vdt = [v0 + a(t − t0 )]dt s0
SI-Einheit: [a] = m/s2 .
"v
Bild 2-3. Änderung von Geschwindigkeitsbetrag und -richtung bei krummliniger Bewegung
adt t0
v = v0 + a(t − t0 ) ,
(2-7)
t0
t0
(2-8) a s = s0 + v0 (t − t0 ) + (t − t0 )2 . 2 Für die Anfangswerte s0 = 0 und t0 = 0 folgt aus (2-7) und (2-8) (2-9) v = v0 + at a 2 s = v0 t + t (2-10) 2 und durch Elimination von t aus (2-9) und (2-10)
v = v20 + 2 as . (2-11)
Freier Fall: Im Schwerefeld der Erde unterliegen Massen der Fallbeschleunigung g, deren Betrag in der Nähe der Erdoberfläche näherungsweise konstant etwa mit dem Wert g = 9,81 m/s2 angesetzt werden kann (vgl. 3.2.1). Für die Fallhöhe h (= s) und a = g folgt aus (2-9) bis (2-11) v = v0 + gt , g h = v0 t + t2 , 2
2 v = v0 + 2gh ,
(2-12) (2-13) (2-14)
wobei v0 die Fallgeschwindigkeit zur Zeit t = 0 ist. Dieselben Gleichungen gelten auch für den senkrechten Wurf nach unten mit der Anfangsgeschwindigkeit v0 . Der senkrechte Wurf nach oben ist in der Steigphase (bis zur maximalen Steighöhe hmax ) eine gleichmäßig verzögerte Bewegung mit der Anfangsgeschwindigkeit v0 und der Beschleunigung a = −g. Aus (2-9) bis (2-11) folgt dann: v = v0 − gt g h = v0 t − t2 2
2 v = v0 − 2gh .
(2-15) (2-16) (2-17)
2 Kinematik
Bild 2-5. Gleichförmige Kreisbewegung
Bild 2-4. Schräger Wurf unter dem Winkel α
w = v20
Aus (2-17) ergibt sich die maximale Steighöhe hmax für v = 0: hmax =
v20 . 2g
(2-18)
v0 . g
wmax = (2-19)
Schräger Wurf im Erdfeld: Die Bahnkurve r(t) beim schrägen Wurf unter dem Winkel α zur Horizontalen (Bild 2-4) ergibt sich analog zu (2-8) oder (2-10) aus der Vektorgleichung r = v0 t +
g 2 t , 2
(2-20)
lässt sich also interpretieren als zusammengesetzt aus zwei geradlinigen Bewegungen: 1. einer gleichförmigen Translation in Richtung der Anfangsgeschwindigkeit v0 , 2. dem freien Fall in senkrechter Richtung; siehe Bild 2-4. Aus (2-20) folgen die Koordinaten des Massenpunktes zur Zeit t: x = v0 t cos α g z = v0 t sin α − t2 . 2
(2-21)
Durch Elimination von t ergibt sich als Bahnkurve eine Parabel: g z = x tan α − 2 (2-22) x2 . 2v0 cos2 α Die Wurfweite w lässt sich aus der Koordinate des zweiten Schnittpunktes der Bahnkurve mit der Horizontalen berechnen:
(2-23)
Die maximale Wurfweite ergibt sich für sin 2α = 1, d. h. für α = 45◦ , und beträgt
Aus (2-15) folgt für v = 0 die Steigzeit tm =
sin 2α . g
v20 . g
(2-24)
2.2 Kreisbewegung Die die Kreisbewegung eines beschreibenden Größen sind:
Massenpunktes
– der Drehwinkel ϕ, die Zeit t, die Winkelgeschwindigkeit ω, die Winkelbeschleunigung α. Diese Größen beschreiben die Kreisbewegung in analoger Weise wie die Größen Weg, Zeit, Geschwindigkeit und Beschleunigung die geradlinige Bewegung. Der Drehwinkel ϕ und die Winkelgeschwindigkeit ω sind axiale Vektoren, die senkrecht auf der Ebene der Kreisbewegung stehen und deren Richtung sich aus der Rechtsschraubenregel in Bezug auf den Drehsinn der Bewegung ergeben (Bild 2-5). Winkelbeträge können in der Einheit Grad (◦ ) oder im Bogenmaß (Einheit: rad) angegeben werden. Der Winkel im Bogenmaß ist definiert als die Länge des von den Winkelschenkeln eingeschlossenen Kreisbogens im Einheitskreis. Der Zusammenhang zwischen Winkel ϕ im Bogenmaß, zugehöriger Bogenlänge b auf einem Kreis und dessen Radius r ist dann (Bild 2-5) ϕ=
b rad . r
Umrechnungen: ϕ/rad π , 1 rad = 57,29 . . .◦ , = ϕ/◦ 180 1◦ = 0,01745 . . . rad = 17,45 . . . mrad .
B9
B10
B Physik
Definitionen:
trag der Zentripetalbeschleunigung folgt aus (2-29) und (2-30)
dϕ Winkel= ϕ˙ , ω= geschwindigkeit dt
(2-25)
a = ωv = ω2 r =
d ϕ dω Winkel=ω ˙ = 2 = ϕ¨ . α= beschleunigung dt dt (2-26) 2
SI-Einheiten : [ω] = rad/s = 1/s, [α] = rad/s2 = 1/s2 .
at = α × r
Ist zum Zeitpunkt t0 die Lage des Massenpunktes auf der Kreisbahn durch den Winkel ϕ0 gegeben, so ergibt sich seine Lage ϕ zu einem späteren Zeitpunkt t durch Integration von dϕ = ω dt aus (2-25) zu (2-27)
Nennen wir die Dauer eines vollständigen Umlaufs T (Umlaufzeit, Periodendauer) und die auf die Zeit bezogene Zahl der Umläufe Drehzahl (Umdrehungsfrequenz) n, so gelten die Zusammenhänge 1 T
und ω = 2πn =
2π . T
(2-28)
Die Winkelgeschwindigkeit ω bei der Kreisbewegung wird auch Drehgeschwindigkeit genannt. Zwischen den Vektoren ω, v und r bei der Kreisbewegung (Ursprung von r auf der Drehachse, Bild 2-5, jedoch nicht notwendig in der Kreisebene) besteht der Zusammenhang v=ω×r.
(2-29)
Durch Einsetzen in (2-6) und Ausführen der Differenziation unter Beachtung von ω = const ergibt sich für die Beschleunigung bei der gleichförmigen Kreisbewegung a = ω × v = ω × (ω × r) .
(2-32)
mit der Tangentialbeschleunigung
ω = const .
ϕ = ϕ0 + ω(t − t0 ) .
(2-31)
Wenn ω zeitabhängig ist, also eine Tangentialbeschleunigung auftritt, so ergibt sich aus (2-6), (2-26) und (2-29) für die Kreisbewegung die Gesamtbeschleunigung a=α×r+ω×v
Für die gleichförmige Kreisbewegung gilt
n=
v2 . r
(2-30)
Demnach ist a − r (Bild 2-5), also eine reine Normalbeschleunigung (a ⊥ v), bei der Kreisbewegung auch Zentripetalbeschleunigung genannt. Für den Be-
(2-33)
und der Normalbeschleunigung an = ω × v .
(2-34)
2.3 Gleichförmig translatorische Relativbewegung Die Angaben der kinematischen Größen einer Bewegung gelten stets für ein vorgegebenes Bezugssystem. Soll die Bewegung in einem anderen Bezugssystem beschrieben werden, so müssen die kinematischen Größen umgerechnet (transformiert) werden. Ruhen beide Bezugssysteme relativ zueinander, so sind lediglich die Ortskoordinaten zu transformieren, während die zurückgelegten Wege, die Geschwindigkeiten und Beschleunigungen in beiden Systemen gleich bleiben. Das wird anders, wenn sich beide Bezugssysteme gegeneinander bewegen. Nicht beschleunigte, relativ zueinander mit konstanter Geschwindigkeit sich bewegende Bezugssysteme werden Inertialsysteme genannt. Ist die Relativgeschwindigkeit v der beiden Inertialsysteme klein, so kann die Galilei-Transformation verwendet werden. Bei großer Relativgeschwindigkeit ist die Lorentz-Transformation zu benutzen. 2.3.1 Galilei-Transformation
Die Galilei-Transformation drückt das Relativitätsprinzip der klassischen Mechanik aus. Sie ist gültig, wenn für die Relativgeschwindigkeit v = (v x , vy , vz ) der beiden Bezugssysteme S und S gilt: v c0 (c0 Vakuumlichtgeschwindigkeit).
2 Kinematik
Die Koordinaten eines betrachteten Massenpunktes P (Bild 2-6) seien durch die Ortsvektoren
u = u − v
r = (x, y, z) im System S und r = (x , y , z ) im System S gegeben .
Das System S bewege sich nur in x-Richtung gegenüber dem System S (v = v x ). Zur Zeit t = 0 mögen sich die Ursprünge 0 und 0 der beiden Systeme decken. Aus Bild 2-6 lässt sich die Transformation der Ortskoordinaten ablesen: x = x − vt , y = y , z = z .
oder zusammengefasst und allgemeiner (GalileiTransformation für Geschwindigkeiten)
(2-35)
(2-36)
Zusammengefasst lautet die Galilei-Transformation für Koordinaten:
t =t.
(2-37)
Die Geschwindigkeit des Massenpunktes P sei
a = (a x , ay , az ) im System S und a = ax , ay , az im System S .
Bei Übergang von S nach S transformieren sich die Geschwindigkeiten im Falle der Relativgeschwindigkeit mit alleiniger x-Komponente (Bild 2-6) gemäß ux = u x − v x uz
ax = a x , ay = ay , az = az
(2-38)
= uz ,
(2-40)
oder zusammengefasst (Galilei-Transformation für Beschleunigungen) a = a .
(2-41)
Die Umkehrungen der Galilei-Transformation (Transformation von S nach S) lauten r = r + vt ,
u = (u x , uy , uz ) im System S und u = ux , uy , uz im System S .
uy = uy
(2-39)
Durch Differenziation nach der Zeit folgt aus (2-38) bzw. (2-39)
t = t .
r = r − vt ,
u = u + v ,
wie sich durch zeitliche Differenziation von (2-35) bzw. (2-37) ergibt. In der klassischen Galilei-Transformation verhalten sich also Geschwindigkeiten additiv. Sie können sich nach Betrag und Richtung ändern. Die Beschleunigung des Massenpunktes P sei
Für die Zeitkoordinate wird in der klassischen Mechanik angenommen, dass in beiden Inertialsystemen die Zeit in gleicher Weise abläuft:
bzw.
u = u + v ,
a = a .
(2-42)
Bei kleinen Relativgeschwindigkeiten ändern sich demnach die Beschleunigungen nicht, wenn von einem Inertialsystem zu einem anderen übergegangen wird. Sie sind invariant gegen die GalileiTransformation, ebenso wie allgemein die Gesetze der klassischen Mechanik, denen das die Beschleunigung enthaltende 2. Newton’sche Axiom (vgl. 3.2) zugrundeliegt. 2.3.2 Lorentz-Transformation
Die Anwendung der Galilei-Transformation auf die Lichtausbreitung parallel und senkrecht zur Richtung der Relativgeschwindigkeit zweier Inertialsysteme ergibt unterschiedliche Vakuumlichtgeschwindigkeiten im gegenüber dem System S mit v = v x bewegten System S :
Bild 2-6. Zwei Inertialsysteme, die sich gegeneinander mit der Relativgeschwindigkeit v bewegen
c0 − v bzw. c0 + v
c20 − v2
für
c0 v bzw. c0 − v und
für
c0 ⊥ v .
B11
B12
B Physik
Michelson (1881) und später Morley und Miller versuchten diesen sich aus der Galilei-Transformation ergebenden Unterschied experimentell mit einem Interferometer nachzuweisen (Bild 2-7). Das Licht einer monochromatischen Lichtquelle wird durch einen halbdurchlässigen Spiegel (gestrichelt in Bild 2-7) aufgespalten und über die Wege s1 oder s2 geleitet. Die Teilstrahlen werden wieder zusammengeführt und interferieren im Detektor B, d. h., je nach Phasendifferenz der beiden Teilwellen verstärken bzw. schwächen diese sich. Die Phasendifferenz durch Wegunterschiede s2 − s1 ist konstant. Eine weitere Phasendifferenz könnte durch Laufzeitunterschiede infolge unterschiedlicher Ausbreitungsgeschwindigkeit des Lichtes längs s1 und s2 auftreten (s. o.), wenn das Interferometer z. B. in Richtung von s2 bewegt wird (Bild 2-7a). Als bewegtes System hoher Geschwindigkeit benutzten sie die Erde selbst, die sich mit v ≈ 30 km/s um die Sonne bewegt. Während einer Drehung des Interferometers um 90◦ müsste dann die Interferenzintensität sich ändern, da s1 und s2 gegenüber vErde ihre Rollen vertauschen (Bild 2-7b). Das Michelson-Morley-Experiment ergab jedoch trotz ausreichender Messempfindlichkeit, dass die Lichtge-
schwindigkeit in jeder Richtung des bewegten Systems Erde im Rahmen der Messgenauigkeit gleich ist. Diese Erfahrung führte zur Annahme des Prinzips von der Konstanz der Lichtgeschwindigkeit: Der Betrag der Vakuumlichtgeschwindigkeit ist in allen Inertialsystemen unabhängig von der Richtung gleich groß. Dieses Prinzip und die daraus folgende LorentzTransformation sind die Grundlage der speziellen Relativitätstheorie (Einstein). Im Folgenden werden die gleichen Bezeichnungen wie in 2.3.1 verwendet, vgl. auch Bild 2-6. Lorentz-Transformation für Koordinaten und ihre Umkehrung: x − vt , x = 1 − β2 y = y , z = z , v t− 2x c t = 0 , 1 − β2 v mit β = und c0
x + vt x= ; 1 − β2 y = y ; z = z ; v t + 2 x c t= 0 1 − β2 v = vx .
(2-43)
(2-44) (2-45)
Für v c0 , d. h. β 1 geht die LorentzTransformation (2-43) und (2-44) über in die Galilei-Transformation (2-35) und (2-36). Die klassische Mechanik erweist sich damit als Grenzfall der relativistischen Mechanik für kleine Geschwindigkeiten. Es erweist sich ferner, dass die Grundgesetze der Elektrodynamik, die Maxwell-Gleichungen (siehe 14.5), invariant gegen die Lorentz-Transformation, nicht aber gegen die Galilei-Transformation sind. Das Relativitätsprinzip der speziellen Relativitätstheorie: In Bezugssystemen, die sich gegeneinander gleichförmig geradlinig bewegen (Inertialsysteme), sind die physikalischen Zusammenhänge dieselben, d. h., alle physikalischen Gesetze sind invariant gegen die Lorentz-Transformation. Wesentliches Merkmal ist, dass nach (2-44) t t ist, d. h., dass jedes System seine Eigenzeit hat. 2.3.3 Relativistische Kinematik
Bild 2-7. Das Michelson-Morley-Experiment
Nach der klassischen Galilei-Transformation bleiben Längen Δx = x2 − x1 und Zeiträume Δt = t2 − t1 beim Übergang vom System S zum System S gleich.
2 Kinematik
Nach der Lorentz-Transformation ändern sich jedoch Längen und Zeiträume beim Übergang S → S : Längenkontraktion und Zeitdilatation. Längenkontraktion:
Eine Länge l = x2 − x1 im System S erscheint im System S verändert. Aus der Lorentz-Transformation (2-43) folgt für die Koordinaten x2 und x1 zur Zeit t x2 = x2
1 − β2 − vt ,
x1 = x1
1 − β2 − vt .
Für die Länge l im System S ergibt sich damit in Koordinaten des Systems S
(2-46) l = (x2 − x1 ) 1 − β2 . Umgekehrt ergibt sich für eine Länge l im System S in Koordinaten des Systems S in entsprechender Weise
6 7 l = x2 − x1 1 − β2 . (2-47) Das heißt, in jedem System erscheinen die in Bewegungsrichtung liegenden Abmessungen eines sich dagegen bewegenden Körpers (zweites System) verkürzt. Seine Abmessungen senkrecht zur Bewegungsrichtung erscheinen unverändert. Zeitdilatation:
Eine Zeitspanne Δt = t2 − t1 , die durch zwei Ereignisse am gleichen Ort im System S definiert wird, erscheint im System S als Zeitspanne Δt = t2 − t1 , für die sich aus (2-44) ergibt Δt =
Δt 1 − β2
Δt .
(2-48)
Eine Zeitspanne Δt im System S erscheint andererseits im System S als Zeitspanne Δt, für den sich entsprechend ergibt Δt =
Δt 1 − β2
Δt .
Geschwindigkeitstransformation:
Die Geschwindigkeit eines Massenpunktes P sei dx dy dz u = (u x , uy , uz ) = , , dt dt dt im System S und dx dy dz u = u x , uy , uz = , , dt dt dt im System S (Bild 2-8). Durch Differenziation der Koordinatentransformation (2-43) nach t und Verwendung von dt/dt aus (2-44) folgt für die Geschwindigkeitskomponenten im System S ux − v ux = , βu x 1− c0 uy 1 − β2 uy = , βu x (2-50) 1− c0 uz 1 − β2 uz = βu x 1− c0 mit v = v x . Für die Umkehrung ergibt sich in analoger Weise u + v ux = x , βu 1+ x c0 uy 1 − β2 , uy = (2-51) βux 1+ c0 uz 1 − β2 uz = . βu 1+ x c0
(2-49)
Das heißt, in jedem System erscheinen Zeitspannen eines anderen Inertialsystems gedehnt: Eine gegenüber dem Beobachter bewegte Uhr scheint langsamer zu gehen. Der mitbewegte Beobachter merkt nichts davon. Dies gilt auch umgekehrt: Uhrenparadoxon.
Bild 2-8. Zur relativistischen Geschwindigkeitstransforma-
tion
B13
B14
B Physik
Dies ist die Lorentz-Transformation für Geschwindigkeiten. Im Gegensatz zur Galilei-Transformation sind hier auch Geschwindigkeiten senkrecht zur Relativgeschwindigkeit der beiden Systeme S und S nicht invariant gegenüber einer LorentzTransformation. Für u, v c0 , also β 1 geht auch die Lorentz-Transformation für Geschwindigkeiten (2-50) u. (2-51) über in die entsprechende Galilei-Transformation (2-38). Sonderfall: Ist in einem der Systeme die betrachtete Geschwindigkeit gleich der Lichtgeschwindigkeit c0 , so hat der Vorgang auch im zweiten System die Geschwindigkeit c0 : In jedem Inertialsystem ist die Vakuumlichtgeschwindigkeit gleich groß, unabhängig von der Richtung. Daraus folgt, dass sie auch unabhängig von der Bewegung der Lichtquelle ist. Aus (2-50) oder (2-51) lässt sich diese Aussage leicht für u x = c0 (uy = uz = 0) oder ux = c0 (uy = uz = 0) verifizieren. Für z. B. uy = c0 (u x = uz = 0) ist dagegen zu beachten, dass die Bewegungsrichtung im System S nicht mehr genau in y -Richtung erfolgt, sondern auch eine x -Komponente auftritt. Auf die relativistische Dynamik wird in den Kapiteln 3 und 4 eingegangen.
2.4 Geradlinig beschleunigte Relativbewegung Es werden zwei gegeneinander konstant beschleunigte Bezugssysteme betrachtet, bei denen die Relativgeschwindigkeit jederzeit so klein bleibt, dass die Galilei-Transformation anstelle der LorentzTransformation angewendet werden kann: v(t) c0 (β 1). Wegen des Bezuges zum freien Fall wählen wir für die betrachteten Beschleunigungen hier die zRichtung (Bild 2-9). Das System S werde gegenüber
dem System S mit ar = (0, 0, −ar) beschleunigt. Für t = 0 mögen die Ursprünge 0 und 0 zusammenfallen und die Anfangs-Relativgeschwindigkeit gleich null sein (o. B. d. A.). Ein Massenpunkt P werde im ruhenden System S mit a = (0, 0, az), z. B. mit der Fallbeschleunigung a = g = (0, 0, −g) nach unten beschleunigt. Die Beschleunigung a des Massenpunktes P im selbst mit ar beschleunigten System S errechnet sich durch zeitliche Differenziation der Ortskoordinaten (Bild 2-9): ar z = z − t2 , 2 Mit a = d2 z/dt2 , a = d2 z /dt2 und ar = (0, 0, −ar) folgt daraus a = a + ar ,
a = a − ar ,
bzw. mit a = g :
a = g − ar .
(2-52) (2-53)
Das heißt, die Beschleunigung, der ein Körper in einem ruhenden (oder gleichförmig bewegten) System S unterliegt, ändert sich beim Übergang zu einem beschleunigten System S um dessen Beschleunigung. Entsprechendes gilt für die mit der Beschleunigung des Körpers verbundenen Kräfte (siehe 3), es treten Trägheitskräfte auf, die in ruhenden oder gleichförmig bewegten Systemen nicht vorhanden sind. Ist insbesondere die Beschleunigung ar des Systems S gleich der des beschleunigten Körpers a im System S, so verschwindet dessen Beschleunigung im System S : a = 0 für
ar = a .
In einem Labor, das z. B. im Erdfeld frei fällt (ar = g), herrscht demzufolge „Schwerelosigkeit“, was nur bedeutet, dass der Körper gegenüber seiner Umgebung keine Beschleunigung erfährt.
2.5 Rotatorische Relativbewegung
Bild 2-9. Vertikal beschleunigtes System
In zueinander gleichförmig translatorisch bewegten Bezugssystemen treten keine durch die Systembewegung bedingten Beschleunigungen auf. Ein Beobachter in einem geschlossenen, gleichförmig geradlinig bewegten Labor könnte die Bewegung nicht feststellen. Anders bei beschleunigten Systemen: Hier treten Trägheitsbeschleunigungen und -kräfte sowohl bei
3 Kraft und Impuls
geradlinig beschleunigten (vgl. 2.4) als auch bei rotierenden Systemen auf, die durch die Systembewegung bedingt sind. Bei gleichförmig rotierenden Systemen tritt einerseits die Zentripetalbeschleunigung azp = ω × (ω × r) auf (2-30), die einen Massenpunkt auf der Kreisbahn mit dem Radius r hält. Ein Beobachter im rotierenden System S registriert die entsprechende Trägheitsbeschleunigung (Bild 2-10), die radial gerichtete Zentrifugalbeschleunigung azf = −ω × (ω × r) .
(2-54)
Im rotierenden System Erde ist die Zentrifugalbeschleunigung neben der (ebenfalls durch die Zentrifugalbeschleunigung bzw. -kraft bedingten) Abplattung der Erde für die Abhängigkeit der effektiven Erdbeschleunigung vom geografischen Breitengrad verantwortlich. Die lokale Fallbeschleunigung variiert von etwa 9,78 m/s2 am Äquator bis 9,83 m/s2 an den Polen. Eine weitere Trägheitsbeschleunigung in rotierenden Systemen tritt auf, wenn ein Massenpunkt sich mit einer Geschwindigkeit v bewegt: CoriolisBeschleunigung (Bild 2-11). Ein im ruhenden System S sich mit konstanter Geschwindigkeit v bewegender Massenpunkt P sei zur Zeit t = 0 im rotierenden System S z. B. gerade im Drehpunkt (r = 0). Der Beobachter im System S stellt dann eine mit t zunehmende Abweichung von der geraden Bahn fest, die offenbar von einer senkrecht zu v (und zu ω) wirkenden Beschleunigung aC , der Coriolis-Beschleunigung, herrührt. Hat der Massenpunkt nach der Zeit t den radialen Weg r = vt zurückgelegt, so ist die Abweichung von der geraden Bahn im rotierenden System S das Bogenstück
Bild 2-11. Zur Coriolis-Beschleunigung
s = rωt = vωt2 , das wegen s ∼ t2 offensichtlich beschleunigt zurückgelegt wurde. Für die gleichmäßig beschleunigte Bewegung gilt andererseits nach (2-10) s = at2 /2, sodass aus dem Vergleich aC = 2vω folgt, oder in vektorieller Schreibweise für die CoriolisBeschleunigung: aC = 2v × ω .
(2-55)
Die experimentelle Bestimmung der CoriolisBeschleunigung auf der Erdoberfläche ermöglicht die Berechnung der Winkelgeschwindigkeit der Erde unabhängig von der Beobachtung des Sternenhimmels: Die Drehung der Schwingungsebene des Foucault-Pendels durch die Coriolis-Beschleunigung ist ein Nachweis für die Drehung der Erde um ihre Achse (Foucault, 1851). Die Komponente des Winkelgeschwindigkeitsvektors der Erdrotation senkrecht zur Erdoberfläche liegt auf der Nordhalbkugel in positiver z-Richtung, auf der Südhalbkugel in negativer z-Richtung. Die Coriolis-Beschleunigung führt daher auf der Nordhalbkugel zu einer Rechtsabweichung von der Bewegungsrichtung, auf der Südhalbkugel zu einer Linksabweichung. Tiefdruckzyklone, bei denen die Luftbewegung zum Zentrum gerichtet ist, zeigen als Folge der Coriolis-Beschleunigung in der nördlichen Hemisphäre einen Drehsinn entgegengesetzt zum Uhrzeigersinn, in der südlichen Hemisphäre einen Drehsinn im Uhrzeigersinn.
3 Kraft und Impuls
Bild 2-10. Zentrifugalbeschleunigung im rotierenden Labor
Kräfte (allgemeiner: Wechselwirkungen) als Ursache der Bewegung von Körpern werden in der Dynamik behandelt. Zunächst wird (in 3 bis 5) die Dynamik des Massenpunktes, später (in 6) die Dynamik
B15
B16
B Physik
von Teilchensystemen und schließlich (in 7) die Dynamik starrer Körper behandelt. Dabei werden vorerst nur die Folgen des Wirkens von Kräften auf die Bewegung betrachtet, ohne auf die Natur der unterschiedlichen Kräfte einzugehen (hierzu siehe Einleitung von Teil B II, Übersicht über die fundamentalen Wechselwirkungen). Grundlage dafür sind die Newton’schen Axiome (1686): Trägheitsgesetz, Kraftgesetz und Reaktionsgesetz. Außerdem gehört hierzu das Superpositionsprinzip (Überlagerungsprinzip) für Kräfte.
3.1 Trägheitsgesetz Erstes Newton’sches Axiom: Jeder Körper mit konstanter Masse m verharrt im Zustand der Ruhe oder der gleichförmig geradlinigen Bewegung, falls er nicht durch äußere Kräfte F gezwungen wird, diesen Zustand zu ändern: v = const für m = const und
F = 0 . (3-1)
2. Das Verhältnis zwischen wirkender Kraft und erzielter Beschleunigung ist für jeden Körper eine konstante Größe: seine Masse m = F/a. Das heißt, jeder Körper setzt seiner Beschleunigung Widerstand entgegen durch seine träge Masse. Zusammengefasst ergibt sich daraus das Newton’sche Kraftgesetz: F = ma = m
dv . dt
(3-4)
Bei sich während der Bewegung ändernder Masse (z. B. bei einer Rakete, oder bei relativistischen Geschwindigkeiten) ist stattdessen die allgemeinere Formulierung des Kraftgesetzes anzuwenden: Zweites Newton’sches Axiom: Die zeitliche Änderung des Impulses ist der bewegenden Kraft proportional und erfolgt in Richtung der Kraft: F=
d dp (mv) = . dt dt
(3-5)
Für m = const geht (3-5) in (3-4) über. Diese Eigenschaft aller Körper wird Trägheit oder Beharrungsvermögen genannt. Die Trägheit eines Körpers ist mit seiner Masse m verknüpft. Ein Maß für die Trägheitswirkung ist der Impuls oder die Bewegungsgröße p = mv .
(3-2)
SI-Einheit: [ p] = kg · m/s . Aus (3-1) folgt damit p = mv = const für
F=0.
SI-Einheit: [F] = kg · m/s2 = N (Newton) . Überlagerungsgesetz: Eine Kraft, die an einem Punkt P angreift, verhält sich wie ein ortsgebundener Vektor F, der nur entlang der Wirkungslinie der Kraft verschoben werden darf. Greifen mehrere Kräfte Fi in einem Punkt P an, so addieren sich die Kräfte wie Vektoren zu einer Gesamtkraft (Bild 3-1)
(3-3)
Dies ist die einfachste Form des Impulserhaltungssatzes (für einen Massenpunkt oder Teilchen), siehe auch 3.3 und 6.1.
3.2 Kraftgesetz Die experimentelle Untersuchung der Beziehungen zwischen der wirkenden Kraft und der daraus sich ergebenden Änderung des Bewegungszustandes (Beschleunigung) einer Masse m zeigt:
FΣ =
Fi .
(3-6)
i=1
3.2.1 Gewichtskraft Die Gewichtskraft FG eines Körpers (früher: Gewicht) ist die im Schwerefeld eines Himmelskörpers auf den Körper wirkende Schwerkraft.
1. Die Beschleunigung ist der wirkenden Kraft proportional und erfolgt in Richtung der Kraft: F∼a.
n
Bild 3-1. Kräfteaddition
3 Kraft und Impuls
Kann der Körper der Kraft folgen, so ruft sie eine Beschleunigung g hervor, die Fallbeschleunigung oder Schwerebeschleunigung genannt wird, im Fall der Erde auch Erdbeschleunigung (vgl. 2.1). Entsprechend (3-4) gilt FG = mg .
(3-7)
Für die Erde gilt: Die Normfallbeschleunigung gn = 9,80665 m/s2 beruht auf ungenauen älteren Messungen für 45◦ nördl. Br. auf Meereshöhe. Die internationale Formel in Tabelle 1-5 ergibt für 45◦ 9,80620 m/s2 , den Normwert aber für die Breite 45,497◦ , am Äquator 9,78033 m/s2 und an den Polen 9,83219 m/s2 . Für den Mond gilt: gMond ≈ 0,167 gErde ≈ 1,64 m/s2 . Kräfte lassen sich wie Vektoren auch in Komponenten zerlegen. Bild 3-2 zeigt dies am Beispiel der Gewichtskraft eines Körpers auf einer geneigten (schiefen) Ebene, die sich in eine Hangabtriebskraft Ft tangential zur geneigten Ebene und in eine Normalkraft Fn , die auf die Bahnebene drückt, zerlegen lässt: Ft = FG sin α ,
Fn = FG cos α .
(3-8)
3.2.2 Federkraft
Kräfte können neben Beschleunigungen eines Körpers auch Formänderungen des Körpers hervorrufen, wenn der Körper an der Bewegung gehindert wird. Zum Beispiel können einseitig befestigte Schraubenfedern durch einwirkende Kräfte gedrückt oder gedehnt werden (Bild 3-3). Bei im Vergleich zur Federlänge kleinen Längenänderungen s sind Kraft und Dehnung proportional (Hooke’sches Gesetz, vgl. D 9.2.1), der Proportionalitätsfaktor c = F/s wird Federsteife, Richtgröße oder Federkonstante genannt. Die um die Strecke s gedehnte Feder erzeugt eine rücktreibende Kraft der Größe
Bild 3-2. Zerlegung der Gewichtskraft auf einer geneigten
Ebene
Bild 3-3. Rücktreibende Kraft einer gedehnten Feder
Ff = −cs
(3-9)
Federanordnungen gemäß Bild 3-3 sind als Kraftmesser geeignet. 3.2.3 Reibungskräfte
Reibungskräfte treten auf, wenn sich berührende Körper (Festkörper, Flüssigkeiten, Gase) relativ zueinander bewegt werden. Reibungskräfte wirken der bewegenden Kraft entgegen und müssen stets auf das betreffende Reibungssystem (allg. tribologisches System, siehe D 10.6) bezogen interpretiert werden. Festkörperreibung
Die Reibungskraft FR ist unabhängig von der Größe der Berührungsfläche und in erster Näherung von der Normalkraft auf die Berührungsfläche (Bild 3-4) sowie von der Reibungszahl μ abhängig: FR = μFn .
(3-10)
Es muss zwischen Haftreibung (Ruhereibung) und Bewegungsreibung, z. B. Gleitreibung, unterschieden werden: Haftreibung tritt zwischen gegeneinander ruhenden Körpern auf, die zueinander in Bewegung gesetzt werden sollen. Bei kleinen Tangentialkräften F ist die Reibungskraft zunächst entgegengesetzt gleich F, sodass der Körper weiterhin ruht. Die Reibungskraft steigt mit der Tangentialkraft F an bis zu einem Maximalwert, bei dem der Körper
Bild 3-4. Reibung zwischen festen Körpern
B17
B18
B Physik
anfängt zu gleiten. Für diesen Punkt gilt (3-10) mit μ = μ0 : Haftreibungszahl. Dabei muss die Haftung (Adhäsion) an den Berührungsstellen der Grenzflächen (bei Metallen häufig kaltverschweißt) aufgebrochen werden. Danach, d. h. bei bereits bestehender Gleitbewegung, wirkt die i. Allg. niedrigere Gleitreibung μ ( 0 : → aperiodischer Fall. Als Anfangsbedingungen nehmen wir wie in 5.2.2 an, dass der gedämpfte Oszillator bei t = 0 mit der Auslenkung x(0) = x0 freigegeben wird, ohne ihm gleichzeitig eine Geschwindigkeit zu erteilen, d. h. v(0) = x˙(0) = 0. Für die Integrationskonstanten folgt dann ⎛ ⎞ ⎜⎜ ⎟⎟⎟⎟ x0 ⎜⎜⎜⎜ δ ⎟⎟⎟ (5-43) c1,2 = ⎜⎜⎜⎜1 ∓ ⎟⎟⎟ . 2 ⎝ 2 2 δ − ω0 ⎠
Bild 5-9. Zeitliches Abklingen einer gedämpften Schwin-
gung (Schwingfall)
B35
B36
B Physik
Nach der Anfangsauslenkung „kriecht“ das Schwingungssystem exponentiell mit der Zeit in die Ruhelage zurück. Da δ hier im Nenner des Exponenten steht, geht dieser Vorgang umso langsamer vor sich, je größer die Dämpfungskonstante r bzw. der Abklingkoeffizient δ ist (Bild 5-11). 5.3.4 Abklingzeit Bild 5-10. Zeitliches Abklingen im aperiodischen Grenzfall
5.3.2 Aperiodischer Grenzfall
Dieser Fall liegt bei mittlerer Dämpfung dann vor, wenn die Wurzel in (5-42) und (5-43) verschwindet: δ2 = ω20 . Die Lösung für die vorgegebenen Anfangsbedingungen ergibt sich aus (5-44) durch Grenzübergang ω → 0 zu x = x0 e−δt (δt + 1) .
(5-49)
Es findet kein periodischer Nulldurchgang mehr statt (Bild 5-10), das Schwingungssystem reagiert nach der Anfangsauslenkung mit der schnellstmöglichen Annäherung an die Ruhelage.
Als Maß für die Zeit, die ein Schwingungssystem benötigt, um sich der Endlage zu nähern, wird die Abklingzeit T ∗ als diejenige Zeit eingeführt, in der die Amplitude xˆ = x0 e−δt (im Schwingfall) bzw. die Auslenkung x (im Kriechfall) von x0 auf den Wert x0 /e gesunken ist. Aus (5-46) und mit (5-37) folgt bei sehr kleiner Dämpfung für den Schwingfall: T∗ =
1 2m 1 = ∼ . δ r r
(5-54)
Aus (5-53) und mit (5-37) und (5-38) folgt bei sehr großer Dämpfung für den Kriechfall: T∗ =
2δ r = ∼r. 2 ω0 c
(5-55)
5.3.3 Aperiodischer Fall (Kriechfall)
Dieser Fall liegt bei großer Dämpfung vor: δ2 > ω20 . Mit den gleichen Anfangsbedingungen wie in 5.3.1 ergibt sich unter Beachtung der Exponentialdarstellung der hyperbolischen Funktionen aus (5-41) bis (5-43) oder unter Verwendung der Beziehungen zwischen trigonometrischen und hyperbolischen Funktionen aus (5-44) und (5-45) δ x = x0 e−δt sinh βt + cosh βt (5-50) β
mit β = δ2 − ω20 . (5-51)
Bild 5-11. Zeitliches Abklingen im Kriechfall
Für sehr große Dämpfung, d. h. δ ω0 , wird ω2 β≈δ− 0 (5-52) 2δ und damit aus (5-50)
⎛ 2 ⎞ ⎜⎜ ω ⎟⎟ x ≈ x0 exp ⎜⎜⎝− 0 t⎟⎟⎠ . 2δ
(5-53)
Bild 5-12. Abklingzeit eines Schwingungssystems als
Funktion der Dämpfung
5 Schwingungen
Mit steigender Dämpfung r nimmt die Abklingzeit T ∗ zunächst im Schwingfall ab und nimmt dann im Kriechfall wieder zu (Bild 5-12). Das Minimum der Abklingzeit liegt etwa im aperiodischen Grenzfall vor, der deshalb für viele technische Systeme von Bedeutung ist, bei denen einerseits Schwingungen, andererseits zu große Abklingzeiten vermieden werden sollen. Er kann nach 5.3.2 durch Einstellung der Dämpfung auf δ = ω0 bzw. gemäß (5-37) und (5-38) auf √ (5-56) r = 2 mc
Für den stationären Fall ist ein geeigneter Lösungsansatz x = xˆ sin (ωt + ϕ) .
Einsetzen in die Differenzialgleichung (5-59) und Anwendung der Additionstheoreme trigonometrischer Funktionen für Argumentsummen liefert ω2 − ω20 sin ϕ − 2δω cos ϕ xˆ cos ωt + ω2 − ω20 cos ϕ + 2δω sin ϕ xˆ sin ωt
erreicht werden.
=−
5.4 Erzwungene Schwingungen, Resonanz Wirkt auf das schwingungsfähige System von außen über eine Kopplung eine periodisch veränderliche Kraft ein, z. B. F(t) = Fˆ sin ωt ,
(5-57)
so wird das System zum Mitschwingen gezwungen: erzwungene Schwingungen. Wählen wir als Beispiel wieder das Federpendel (mit Dämpfung), so ist dessen Kraftgleichung (5-36) nun durch die periodische Kraft (5-57) zu ergänzen: m
dx d2 x + r + cx = F(t) = Fˆ sin ωt . dt dt2
(5-58)
Durch Einführung der generalisierten Koeffizienten δ = r/2m und ω20 = c/m aus (5-37) und (5-38) folgt daraus die Differenzialgleichung der erzwungenen Schwingung: dx Fˆ d2 x + 2δ + ω20 x = sin ωt . 2 dt m dt
(5-59)
Die allgemeine Lösung dieser inhomogenen Differenzialgleichung ergibt sich als Summe zweier Anteile: 1. der Lösung der homogenen Differenzialgleichung (Fˆ = 0), die der freien gedämpften Schwingung entspricht und durch (5-41) und (5-42) gegeben ist. Sie beschreibt den zeitlich abklingenden Einschwingvorgang. 2. der stationären Lösung der inhomogenen Gleichung (5-59) für den eingeschwungenen Zustand (t 1/δ).
(5-60)
Fˆ sin ωt . m
Diese Gleichung ist nur dann für alle t gültig, wenn die Koeffizienten der linear unabhängigen Zeitfunktionen sin ωt und cos ωt auf beiden Seiten der Gleichung übereinstimmen, das heißt unter anderem, dass der Koeffizient von cos ωt verschwinden muss. Aus diesen beiden Bedingungen ergibt sich für die stationäre Amplitude der erzwungenen Schwingung mit der Kreisfrequenz ω der anregenden periodischen Kraft F = Fˆ sin ωt xˆ =
Fˆ ,
2 2 2 2 2 m ω − ω0 + 4δ ω
(5-61)
und für die Phasendifferenz ϕ zwischen der Phase der Auslenkung und der Phase der periodischen äußeren Kraft tan ϕ =
2δω . − ω20
ω2
(5-62)
Anders als bei der freien Schwingung (vgl. 5.2.2 und 5.3) sind Amplitude und Phasenwinkel der erzwungenen Schwingung nicht mehr von den Anfangsbedingungen abhängig, sondern von der Frequenz bzw. Kreisfrequenz ω und der Amplitude Fˆ der erregenden äußeren Kraft sowie von der Dämpfung (Abklingkoeffizient δ) des Schwingungssystems. 5.4.1 Resonanz
Die Amplitude der erzwungenen Schwingung zeigt aufgrund der Differenz (ω2 − ω20 ) im Nenner von (5-61) eine ausgeprägte Frequenzabhängigkeit.
B37
B38
B Physik
Bei konstanter, zeitunabhängiger (ω = 0) ist die statische Auslenkung xˆst =
Erregerkraft
Fˆ Fˆ = . 2 c mω0
(5-63)
Mit steigender Erregerfrequenz ω und niedriger Dämpfung δ erreicht die Amplitude besonders hohe Werte bei ω ≈ ω0 : Resonanz (Bild 5-13). Die Lage des Resonanzmaximums xˆr = xˆ(ωr ) (ωr Resonanzkreisfrequenz) ergibt sich aus (5-61) durch Bildung von d xˆ/dω = 0:
(5-64) ωr = ω20 − 2δ2 < ω0 Die Resonanzamplitude xˆr ergibt sich damit aus (5-61) zu xˆr =
Fˆ .
2mδ ω20 − δ2
(5-65)
Sie ist stets etwas größer als die Amplitude xˆ0 bei ω = ω0 : xˆ0 =
Fˆ . 2mδω0
(5-66)
Für kleine Dämpfungen (δ ω0 ) gilt ωr ≈ ω0 und xˆr ≈ xˆ0 . Das Verhältnis von Resonanzamplitude xˆr zur statischen Auslenkung xˆst wird als Resonanzüberhöhung oder Güte Q bezeichnet. Mit (5-63) und (5-65) bzw. (5-66) folgt Q=
xˆr = xˆst
ω20 xˆ0 ω0 ≈ =
xˆst 2δ 2δ ω20 − δ2
(5-67)
für δ ω0 .
Bild 5-13. Resonanzkurven bei verschiedenen Güten Q
Mit steigender Dämpfung, d. h. sinkender Güte Q, wird ωr < ω0 , die Resonanzamplitude sinkt, bis √ schließlich ωr = 0 wird bei√δ = ω0 / 2 (Bild 5-13). Für Dämpfungen δ > ω0 / 2 verschwindet das Resonanzverhalten völlig, die stationäre Schwingungsamplitude xˆ ist dann bei allen Frequenzen kleiner als die statische Auslenkung xˆst . Umgekehrt wird mit verschwindender Dämpfung (δ → 0) die Resonanzamplitude beliebig groß. Da fast jedes mechanisches System (z. B. Brücken, Gebäudedecken, rotierende Maschinen) durch periodische Kräfte zu Schwingungen erregt werden kann, können im Resonanzfalle die Schwingungsamplituden größer werden als es die Festigkeitsbedingungen erlauben, sodass das System zerstört wird: Resonanzkatastrophe. Dies muss vermieden werden durch hohe Dämpfung, Umgehung periodischer Kräfte oder große Differenz zwischen Erreger- und Resonanzfrequenz. Als Maß für den Frequenzbereich, in dem sich die Resonanzerscheinung bei geringer Dämpfung (δ ω0 , ωr ≈ ω0 ) besonders stark auswirkt, kann die Halbwertsbreite 2Δω benutzt werden (Bild 5-14). Werden die Kreisfrequenzen, bei denen die Amplitude auf den halben Wert der Resonanzamplitude gefallen ist, mit ω−1/2 bzw. ω+1/2 bezeichnet, sowie Δω = ω+1/2 − ω0 ≈ ω0 − ω−1/2
(5-68)
eingeführt, so kann Δω gemäß der Bedingung xˆ0 xˆ(ω1/2 ) = 2 aus (5-61) und (5-66) näherungsweise berechnet werden: Δω ≈ 2δ = 2/T ∗ .
Bild 5-14. Halbwertsbreite der Resonanzkurve
(5-69)
5 Schwingungen
Erregerkraft und Geschwindigkeit sind also im Resonanzfall phasengleich: die Kraft wirkt während der gesamten Periode in die gleiche Richtung wie die Geschwindigkeit, d. h. stets beschleunigend. Bei anderen Frequenzen ist das nicht der Fall. Daraus folgt die hohe Amplitude bei Resonanz. 5.4.2 Leistungsaufnahme des Oszillators Bild 5-15. Phasenkurven der Auslenkung erzwungener
Schwingungen bei verschiedenen Güten Q
T ∗ ist die Abklingzeit des freien, gedämpften Schwingungssystems, vgl. 5.3.4. Daraus folgt die generell für Schwingungssysteme gültige Beziehung Δω/δ = ΔωT ∗ = const .
(5-70)
Mit (5-69) folgt für die Güte aus (5-67) Q=
ω0 . Δω
2δω . 2 ω − ω20
(5-72)
Für verschwindende Dämpfung (δ = 0) ist das eine Sprungfunktion, die unterhalb der Resonanz (ω < ω0 ) den Wert ϕ = 0, oberhalb (ω > 0) den Wert ϕ = −π annimmt (Bild 5-15). Mit zunehmender Dämpfung (abnehmende Güte) wird der Übergang stetig und zunehmend breiter, wobei ϕ(ω0 ) = −π/2 ist. Das heißt, bei tiefen Erregerfrequenzen schwingt das System nahezu in gleicher Phase mit der Erregerkraft, bei hohen Erregerfrequenzen dagegen gegenphasig. Im Resonanzfall (ω = ω0 ) läuft die Phase der Auslenkung der der Erregerkraft um π/2 nach. Die Zeitfunktionen sind dann: Auslenkung
δ2 ω2 Fˆ2 · . P¯ = mδ ω2 − ω2 2 + 4δ2 ω2 0
(5-73)
Einführung der Güte Q = ω0 /2δ nach (5-67) und einer normierten Frequenz Ω = ω/ω0
(5-74)
Fˆ 2 QΩ2 · 2 2 . 2mω0 Q (Ω − 1)2 + Ω2
(5-75)
(5-71)
Der Phasenwinkel zwischen einander entsprechenden Phasen der Auslenkung und der Erregerkraft beträgt nach (5-62) ϕ = arctan
Die Leistung, die von der Erregerkraft auf den Oszillator übertragen wird, ergibt sich aus (4-6) zu P = F x˙ = Fˆ sin (ωt) ω xˆ cos (ωt + ϕ). Zeitliche Mittelung über eine ganze Periode und Einsetzen von (5-61) und (5-62) liefert
ergibt weiter P¯ =
Im Gegensatz zur Amplitudenresonanzkurve hat die Leistungsresonanzkurve ihr Maximum exakt bei ω = ω0 (Ω = 1), unabhängig von der Dämpfung bzw. Güte (Bild 5-16). Analog zu (5-68) kann hier eine Leistungshalbwertsbreite definiert werden, die sich als halb so groß wie die Amplitudenhalbwertsbreite erweist: (Δω)P ≈ δ ≈ Δω/2 .
(5-76)
x(ω0 ) = xˆ sin (ω0 t − π/2) ,
Geschwindigkeit x˙(ω0 ) = ω0 xˆ cos (ω0 t − π/2) = ω0 xˆ sin ω0 t , Erregerkraft F(ω0 ) = Fˆ 0 sin ω0 t .
Bild 5-16. Leistungsresonanzkurven bei verschiedener Güte
Q
B39
B40
B Physik
Die Halbwertsbreite Δω entspricht also der vollen Breite der Leistungsresonanzkurve bei halber Leistung.
5.5 Überlagerung von harmonischen Schwingungen Oszillatoren können zu mehreren, gleichzeitigen Schwingungen angeregt werden, die sich zu einer resultierenden Schwingung überlagern. Solange die resultierenden Amplituden die Grenze des linearen Verhaltens (z. B. (3-9)) nicht überschreiten, gilt das Prinzip der ungestörten Superposition: Wird ein Körper zu mehreren Schwingungen angeregt, so überlagern (addieren) sich deren Auslenkungen ohne gegenseitige Störung. 5.5.1 Schwingungen gleicher Frequenz
Zwei Schwingungen gleicher Richtung und gleicher Frequenz x1 = xˆ1 sin (ωt + ϕ1 ) und x2 = xˆ2 sin (ωt + ϕ2 ) überlagern sich zu einer resultierenden harmonischen Schwingung derselben Frequenz x = x1 + x2 = xˆ sin (ωt + ϕ) .
(5-77)
Anwendung der Additionstheoreme auf (5-77) und Vergleich der Koeffizienten von sin ωt und cos ωt liefert Amplitude und Anfangsphase der resultierenden Schwingung:
(5-78) xˆ = xˆ21 + xˆ22 + 2 xˆ1 xˆ2 cos (ϕ1 − ϕ2 ) , tan ϕ =
xˆ1 sin ϕ1 + xˆ2 sin ϕ2 . xˆ1 cos ϕ1 + xˆ2 cos ϕ2
(5-79)
Bei gleichen Amplituden xˆ1 = xˆ2 und gleichen Anfangsphasen ϕ1 = ϕ2 überlagern sich beide Schwingungen zur doppelten resultierenden Amplitude (gegenseitige maximale Verstärkung beider Schwingungen); bei der Anfangsphasendifferenz ϕ1 − ϕ2 = π heben sich beide Schwingungen auf (gegenseitige Auslöschung beider Schwingungen). Diese Sonderfälle spielen bei der Interferenz zweier Schwingungen eine wichtige Rolle.
Bild 5-17. Bahnkurve der resultierenden Schwingung aus
zwei zueinander senkrechten linearen Schwingungen gleicher Frequenz
Die Auslenkungen zweier Schwingungen, die zueinander senkrecht bei Kreisfrequenzen ω x und ωy erfolgen, z. B. x = xˆ sin (ω x t + ϕ x ) und y = yˆ sin (ωy t + ϕy ) , müssen vektoriell addiert werden (Bild 5-17). Die Polarkoordinaten der resultierenden Auslenkung zur Zeit t sind
y r = x2 + y2 und tan ε = . (5-80) x Im Falle gleicher Frequenzen ω x = ωy ergeben sich als Bahnkurven der resultierenden Auslenkung Ellipsen (Bild 5-17), deren Exzentrizität und Lage von den Amplituden und Anfangsphasen der Einzelschwingungen abhängen. Bei ungleichen Frequenzen ergeben sich kompliziertere Bahnkurven, sog. LissajousFiguren. 5.5.2 Schwingungen verschiedener Frequenz
Die Überlagerung von linearen harmonischen Schwingungen mit gleicher Schwingungsrichtung, aber verschiedener Frequenz ergibt eine nichtharmonische oder anharmonische Schwingung. Wir betrachten einige wichtige Sonderfälle: Schwebungen
Schwebungen treten bei Überlagerung zweier Schwingungen mit geringem Frequenzunterschied auf. Im einfachen Fall gleicher Amplituden beider
5 Schwingungen
Schwingungen folgt für eine beliebige Auslenkungskoordinate ξ ξ = ξ1 + ξ2 = ξˆ sin 2πν1 t + ξˆ sin 2πν2 t mit ν1 − ν2 = Δν ν1,2 . Δν ist die Differenzfrequenz. Die Anwendung der Additionstheoreme ergibt daraus ξ = 2ξˆ cos 2π
Δν t sin 2πνt 2
(5-81)
mit der Mittenfrequenz ν1 + ν2 =ν. 2 Es ergibt sich also eine Schwingung mit der Mittenfrequenz ν, deren Amplitude periodisch zwischen 2ξˆ und 0 schwankt: die Schwingung ist „moduliert“ mit einer Frequenz νmod = Δν/2 = 1/T mod (Bild 5-18). Die langsam zeitveränderliche Funktion 2ξˆ cos (2πΔνt/2) stellt die Amplitudenhüllkurve dar. Als Schwebungsdauer T s wird der zeitliche Abstand zweier benachbarter Amplitudenmaxima oder Nullstellen der Amplitude bezeichnet. Sie ist gleich der halben Modulationsperiodendauer T mod und damit 1 . (5-82) Δν Die Erscheinung der Schwebung wird häufig zum Frequenzvergleich ausgenutzt: Die Schwebungsdauer wird ∞, wenn ν2 = ν1 ist. Ts =
Bild 5-18. Überlagerung zweier Schwingungen mit geringem Frequenzunterschied: Schwebung
Amplitudenmodulation
Wird die Amplitude einer Schwingung der hohen Frequenz Ω periodisch mit einer niedrigeren Modulationsfrequenz ωmod verändert, so spricht man von Amplitudenmodulation. Die Schwebung stellt bereits einen Spezialfall der Amplitudenmodulation dar. Deren allgemeine Beschreibung (Bild 5-19) lautet ξ = ξˆ (1 + m cos ωmod t) sin Ωt
mit m 1 , (5-83)
m wird Modulationsgrad genannt. Nach Anwendung der Additionstheoreme lässt sich (5-83) auch in folgender Form schreiben: 4 ξ = ξˆ sin Ωt 5 m + (sin(Ω − ωmod )t + sin(Ω + ωmod )t) . (5-84) 2 Die Amplitudenmodulation einer Schwingung der Frequenz Ω mit einer Modulationsfrequenz ωmod ist also gleichbedeutend mit einer Überlagerung dreier Schwingungen konstanter Amplitude und den Frequenzen Ω (sog. Trägerfrequenz), (Ω − ωmod ) und (Ω + ωmod ), den unteren und oberen sog. Seitenfrequenzen, vgl. Frequenzspektrum Bild 5-19b, ein für die Nachrichtenübertragung mit modulierten elektrischen Schwingungen äußerst wichtiger Befund, vergleiche Nachrichtentechnik G 22.3.
Bild 5-19. Amplitudenmodulierte Schwingung und deren
Frequenzspektrum
B41
B42
B Physik
Anharmonische Schwingungen, Fourier-Darstellung
Die Schwebung und die amplitudenmodulierte Schwingung sind bereits Beispiele für anharmonische Schwingungen, die als Überlagerung harmonischer Schwingungen mit konstanter Amplitude und unterschiedlichen Frequenzen dargestellt werden konnten. Zwei weitere Beispiele zeigt Bild 5-20. Allgemein lassen sich beliebige anharmonische periodische Vorgänge als Überlagerung von (im Grenzfall unendlich vielen) harmonischen Schwingungen auffassen und als Fourier-Reihe darstellen: ξ(t) = ξ0 +
∞
ξn sin (nω1 t + δn ) .
(5-85)
n=1
Dabei legt die Periode T 1 = 2π/ω1 der anharmonischen Schwingung die Grundfrequenz ω1 fest, während die Feinstruktur der anharmonischen Schwingung durch die Amplituden ξn und die Anfangsphasen δn der Oberschwingungen nω1 bestimmt wird. Bei akustischen Schwingungen („Klängen“) entsprechen dem der „Grundton“ und die „Obertöne“, wobei die Frequenz des Grundtones die Klanghöhe bestimmt und die Amplituden- und Phasenverteilung der Obertöne die Klangfarbe festlegt. Die
Bild 5-21. Dreieckschwingung und zugehöriges Frequenz-
spektrum
Bestimmung der Koeffizienten ξn der einzelnen Teilschwingungen, aus denen sich eine vorgegebene anharmonische Schwingung zusammensetzt, auf mathematischem Wege wird Fourier-Analyse genannt (siehe A 21.1). Experimentell kann sie durch einen Satz Frequenzfilter mit unterschiedlichen Durchlassfrequenzen erfolgen. Beispiele für anharmonische Schwingungen: Dreieckschwingung (Bild 5-21), vgl. auch Bild 5-20a: 1 8 ξ = ξˆ 2 sin ω1 t − 2 sin 3ω1 t π 3 1 + 2 sin 5ω1 t − + . . . . (5-86) 5 Rechteckschwingung (Bild 5-22), vgl. Bild 5-20b: 1 4 ˆ ξ = ξ sin ω1 t + sin 3ω1 t π 3 1 + sin 5ω1 t + . . . . (5-87) 5 Nichtperiodische Vorgänge
Bild 5-20. Entstehung anharmonischer Schwingungen durch Überlagerung harmonischer Schwingungen (jeweils die ersten drei Terme von (5-86) und (5-87))
Vorgänge, denen keine Periode zugeordnet werden kann (in der Akustik z. B. Zischlaute, Knalle, oder auch begrenzte, nicht unendlich lange harmonische Wellenzüge), lassen sich nicht durch eine FourierReihe mit diskreten Frequenzen nω darstellen.
5 Schwingungen
Bestimmung der Amplitudenfunktion ξA (ω). Als Beispiel sei eine Sinusschwingung der begrenzten zeitlichen Länge 2τ betrachtet (Bild 5-23a). Als Teilschwingungen kommen dann nur Sinusschwingungen mit der Anfangsphase 0 in Frage. Das Fourier-Integral lautet für diesen Fall: "∞ ξ(t) =
ξA (ω) sin ωt dω 0
=
sin ω0 t für − τ < t < +τ 0 sonst
(5-89)
Die Amplitudenfunktion ξA (ω) ergibt sich dann (vgl. A 21) zu Bild 5-22. Rechteckschwingung und zugehöriges Frequenz-
spektrum
Stattdessen ist dies möglich durch Überlagerung unendlich vieler, kontinuierlich verteilter Frequenzen. Die Summe über ein diskretes Frequenzspektrum bei der Fourier-Reihe (5-85) ist dann durch das FourierIntegral über ein kontinuierliches Frequenzspektrum zu ersetzen: "∞ ξA (ω) sin [ωt + δ(ω)]dω .
ξ(t) =
(5-88)
0
Aufgabe der Fourier-Analyse (siehe A 21) ist hier die
1 ξA (ω) = π 1 = π ξA (ω) =
"+∞ ξ(t ) sin ωt dt −∞
"+τ
sin ω0 t sin ωt dt
−τ
sin (ω0 − ω)τ sin(ω0 + ω)τ − . π(ω0 − ω) π(ω0 + ω)
(5-90)
Diese Amplitudenfunktion hat, wie anschaulich zu erwarten, ihr Maximum bei ω = ω0 (Bild 5-23b) und eine Halbwertsbreite 2Δω ≈
3,8 . τ
(5-91)
Je größer die Dauer 2τ der Sinusschwingung ist, desto mehr engt sich das Frequenzspektrum auf ω0 ein. Es liegt ein ganz ähnliches Verhalten vor wie bei der Resonanz, vgl. (5-69).
5.6 Gekoppelte Oszillatoren
Bild 5-23. Zeitlich begrenzte Sinusschwingung und zugehöriges Frequenzspektrum
Oszillatoren werden dann als gekoppelt bezeichnet, wenn sie über eine Kopplung Energie austauschen können. Bei mechanischen Schwingern kann der Kopplungsmechanismus z. B. auf elastischer Deformation des Kopplungselementes (Feder zwischen zwei Pendeln), auf Reibung zwischen zwei Schwingern oder auf Trägheit beruhen (Aufhängung eines Fadenpendels an der Masse eines zweiten).
B43
B44
B Physik
5.6.1 Gekoppelte Pendel
Als Beispiel zweier linearer, gekoppelter Oszillatoren werde ein System aus zwei identischen Pendeln mit starren Pendelstangen von vernachlässigbarer Masse betrachtet, die über eine Kopplungsfeder verbunden sind (Bild 5-24). Wird eines der Pendel angestoßen und ihm damit Schwingungsenergie übertragen, so regt es über die Kopplungsfeder das zweite Pendel zu erzwungenen Schwingungen an (mit π/2 Phasenverzögerung, vgl. Bild 5-25), bis der Energievorrat des ersten Pendels erschöpft, d. h. vollständig an das zweite Pendel übertragen worden ist. Dann übernimmt dieses die Rolle des Erregers für das erste Pendel und so fort. Die Oszillatoren führen Schwebungen durch, die zeitlich um eine halbe Schwebungsdauer T s gegeneinander versetzt sind. Die Schwingungsenergie pendelt dabei periodisch zwischen den beiden Oszillatoren hin und her (Bild 5-25). Die Eigenkreisfrequenz der isolierten Pendel (ohne Kopplung) ist durch (5-10) und (5-8) gegeben: ω0 =
c m
mg mit c = . l
(5-92)
Mit Kopplung wird die (hier durch die Schwerkraft bedingte) Richtgröße c der Pendel durch die Richtgröße cK der Kopplungsfeder verändert, sodass sich gemäß Bild 5-24 folgende Kraftgleichungen für die beiden Pendel ergeben: d 2 x1 Pendel 1 : m 2 = −cx1 + cK (x2 − x1 ) , dt d 2 x2 Pendel 2 : m 2 = −cx2 − cK (x2 − x1 ) , dt
(5-93)
Bild 5-25. Schwebungen gekoppelter Pendel
Daraus folgen die Differenzialgleichungen der gekoppelten Schwingungen d 2 x1 + ω20 x1 + K(x1 − x2 ) = 0 , dt2 d 2 x2 + ω20 x2 − K(x1 − x2 ) = 0 dt2 mit dem Kopplungsparameter K=
cK . m
(5-95)
Es handelt sich um zwei gekoppelte Differenzialgleichungen mit x1 und x2 als gekoppelte, zeitabhängige Variable. Durch Addition und Subtraktion der beiden Gleichungen und Einführung von Normalkoordinaten q 1 = x1 + x2 ,
q 2 = x1 − x2
(5-96)
lassen sich (5-94) zu normalen Schwingungsgleichungen eines harmonischen Oszillators (vgl. (5-21)) entkoppeln: d2 q1 + Ω21 q1 = 0 , dt2 d2 q2 + Ω22 q2 = 0 . dt2
Bild 5-24. Gekoppelte Pendel
(5-94)
(5-97)
Die Frequenzen dieser Normalschwingungen (auch Fundamentalschwingungen oder Fundamentalmoden genannt) sind, wie sich bei der Herleitung von (5-97) zeigt,
Ω1 = ω0 und Ω2 = ω20 + 2K . (5-98)
5 Schwingungen
Bild 5-26. Normalschwingungen gekoppelter Pendel
Die allgemeinen Lösungen von (5-97) lassen sich aus (5-22) übernehmen, woraus sich mit (5-96) die allgemeinen Lösungen von (5-94) bzw. (5-93) ergeben. Sie setzen sich aus einer Linearkombination von Normalschwingungen zusammen: x1 (t) = xˆ1 sin (Ω1 t + ϕ01 ) + xˆ2 sin (Ω2 t + ϕ02 )
x2 = x1 bzw. x2 = −x1 entkoppelt und können auch direkt gelöst werden. Aus (5-101) und (5-103) folgt, dass die Frequenzaufspaltung, d. h. der Abstand der beiden Normalfrequenzen, mit steigender Kopplung zunimmt (Bild 5-27). Für K = 0 (cK = 0: keine Kopplung) fallen die Frequenzen der Normalschwingungen zusammen („Entartung“): Ω1 = Ω2 = ω0
1. Normalschwingung: Die Anfangsbedingungen x1 (0) = x2 (0) = xˆ, x˙1 (0) = x˙2 (0) = 0 liefern eine gleichsinnige Schwingung (Bild 5-26a): x2 (t) = x1 (t) = xˆ cos Ω1 t .
(5-100)
(5-101)
2. Normalschwingung: Die Anfangsbedingungen x1 (0) = −x2 (0) = − xˆ, x˙1 (0) = x˙2 (0) = 0 liefern eine gegensinnige Schwingung (Bild 5-26b): x2 (t) = −x1 (t) = xˆ cos Ω2 t .
(5-104)
xˆ (cos Ω1 t − cos Ω2 t) 2 xˆ x2 (t) = (cos Ω1 t + cos Ω2 t) . 2
(5-105)
1 (Ω1 + Ω2 ) 2
(5-106)
x1 (t) =
Mit Ω=
und ΔΩ = Ω2 − Ω1
folgt durch Anwendung der Additionstheoreme auf (5-105) die Beschreibung der eingangs erwähnten Schwebungen (Bild 5-25, vgl. auch 5.5.2) ΔΩ t sin Ωt , 2 ΔΩ t cos Ωt , x2 (t) = xˆ cos 2
Hierbei wird die Kopplung überhaupt nicht beansprucht, die Pendel schwingen mit ihrer Eigenfrequenz Ω1 = ω0 .
K=0.
Schwebung: Die Anfangsbedingungen x2 (0) = xˆ, x˙2 (0) = x1 (0) = x˙1 (0) = 0 als Beispiel liefern
x2 (t) = xˆ1 sin (Ω1 t + ϕ01 ) − xˆ2 sin (Ω2 t + ϕ02 ) (5-99) Die Konstanten xˆi und ϕ0i sind aus den Anfangsbedingungen zu bestimmen. So ist z. B. die isolierte Anregung der Normalschwingungen durch folgende Wahl der Anfangsbedingungen möglich:
für
x1 (t) = xˆ sin
(5-107)
sofern die Frequenzaufspaltung ΔΩ Ω, d. h. die Kopplung schwach (K ω20 ) ist.
(5-102)
Hierbei wird die Kopplung maximal beansprucht, die Pendel schwingen symmetrisch zur Ruhelage und wegen der um cK erhöhten Richtgröße mit der gemäß (5-98) erhöhten Eigenfrequenz 8 K cK . (5-103) Ω2 = ω0 1 + 2 2 = ω0 1 + 2 c ω0 Für die beiden Normalschwingungen Ω1 und Ω2 sind die beiden Differenzialgleichungen (5-93) wegen
Bild 5-27. Normalfrequenzaufspaltung als Funktion der
Kopplung
B45
B46
B Physik
Bild 5-28. Fundamentalmoden einer Federkette
5.6.2 Mehrere gekoppelte Oszillatoren
Ein System von N gekoppelten eindimensionalen Oszillatoren besitzt im Allgemeinen N Freiheitsgrade der Bewegung (d. h., es sind N voneinander unabhängige Koordinaten zur Beschreibung der einzelnen Auslenkungen notwendig). Analog dem Beispiel für N = 2 im vorigen Abschnitt wird es durch ein System von N gekoppelten Differenzialgleichungen beschrieben: d2 xi (t) = Ai j x j (t) mit i, j = 1, 2, . . . , N . dt2 j (5-108)
Durch eine lineare Variablentransformation und Einführung der Normalkoordinaten q1 , q2 , . . . , qN kann eine Entkopplung der N Differenzialgleichungen (5-108) erreicht werden: Man erhält N kopplungsfreie Systeme mit je einem Freiheitsgrad: d2 qi (t) = −Ω2i qi (t) mit i = 1, 2, . . . , N , (5-109) dt2 worin die Ωi die Eigenfrequenzen der Fundamentalmoden sind. Eine solche Entkopplung lässt sich in jedem System gekoppelter Oszillatoren durchführen, solange die Kräfte linear oder näherungsweise linear von den Auslenkungen abhängen. Die tatsächlichen Schwingungen des gekoppelten Schwingungssystems lassen sich stets als lineare Überlagerung der so gewonnenen Fundamentalschwingungen darstellen. Kann der einzelne Oszillator in allen drei Raumrichtungen schwingen, so erhalten wir 3N Fundamentalschwingungen. Dies gilt z. B. für elastische Atomschwingungen im Kristallgitter des Festkörpers. Auch eine Federkette mit z. B. 3 Massen (Bild 5-28) hat demnach 3 × 3 = 9 Fundamentalmoden.
Die Anregung einzelner Fundamentalschwingungen lässt sich durch geeignete Wahl der Anfangsbedingungen erreichen (siehe 5.6.1). Die 9 Fundamentalmoden einer Federkette mit 3 Massen sind in Bild (5-28) angedeutet. Ähnliche Fundamentalschwingungen treten bei Molekülen auf, jedoch fallen wegen der fehlenden Einspannung hier u. a. diejenigen mit gleichsinniger Schwingungsrichtung aller Atommassen aus.
5.7 Nichtlineare Oszillatoren. Chaotisches Schwingungsverhalten Bei der mathematischen Beschreibung der in 5.2 bis 5.4 behandelten Oszillatoren werden Näherungen (kleine Federdehnungen, kleine Winkelauslenkungen) benutzt, sodass die rücktreibenden Größen proportional zur Auslenkung angesetzt werden konnten. Die die Schwingungssysteme beschreibenden Differenzialgleichungen sind dadurch linear bezüglich der Auslenkungsvariablen ξ und leicht lösbar. Tatsächlich sind physikalische Systeme i. Allg. nichtlinear. Für nichtlineare Gleichungen gibt es aber kaum allgemeine analytische Lösungsverfahren, sodass die Approximation nichtlinearer Vorgänge durch lineare Gesetze in den meisten Fällen ein notwendiger Kompromiss bei der mathematischen Beschreibung ist. Bei den Schwingungssystemen kommt hinzu, dass im Gültigkeitsbereich der linearen Näherung das für die Anwendungen besonders wichtige harmonische Schwingungsverhalten vorliegt. Wenn die Schwingung jedoch den Gültigkeitsbereich der linearen Näherung verlässt, so muss man auch für die in 5.2 bis 5.4 behandelten Oszillatoren die genaueren nichtlinearen Differenzialgleichungen heranziehen.
5 Schwingungen
Bild 5-29. Nichtlineare Oszillatoren: a periodisch zu größeren Amplituden angeregtes Stabpendel, b periodisch angeregtes
Drehpendel mit Unwucht
So erhält man für das periodisch angeregte Stabpendel (Bild 5-29a) unter Berücksichtigung einer Dämpfung rv die Kraftgleichung (vgl. 5.2.1 und 5.4) d2 s s ds + r + mg sin = Fˆ sin ωt , (5-110) 2 dt dt l die durch den Sinusterm in s nichtlinear ist. Eine ähnliche Differenzialgleichung erhält man für die Drehmomente beim periodisch angeregten Drehpendel in Bild 5-29b, bei dem eine Unwuchtmasse mu angebracht ist. Dadurch tritt bei Auslenkung aus der ursprünglichen Ruhelage ein zusätzliches, auslenkendes Drehmoment r ×(mu g) auf, das erst bei größerer Auslenkung ϑ durch das von der Spiralfeder ausgeübte rücktreibende Drehmoment −Dϑ kompensiert wird: m
J
d2 ϑ dϑ ˆ sin ωt . + Dϑ − mu g| r | sin ϑ = M +d 2 dt dt (5-111)
Die Unwuchtmasse mu bewirkt zwei Gleichgewichtslagen ϑ und ϑ links bzw. rechts von der ursprünglichen Ruhelage ϑ = 0 des Drehpendels ohne Unwuchtmasse. Die Potenzialkurve des Drehpendels (ursprünglich eine Parabel, siehe Bild 5-7) hat nun zwei Minima (Bild 5-30a). Solche Systeme neigen bei bestimmten Parametern zu völlig unregelmäßigen (nichtperiodischen) chaotischen Schwingungen, deren Ablauf nicht ohne Weiteres vorhersehbar ist (Bild 5-30b).
Charakteristisch für solche chaotischen Vorgänge ist, dass kleinste Veränderungen der Anfangsbedingungen ein völlig anderes Schwingungsverhalten zur Folge haben können. Hier ist das sonst meist geltende Prinzip außer Kraft, dass kleine stetige Änderungen der Anfangsbedingungen auch stetige Änderungen der Reaktion eines Systems zur Folge haben. Seitdem leistungsfähige Rechner zur Verfügung stehen, mit denen Differenzialgleichungen wie (5-110) und (5-111) numerisch gelöst werden können, kann man Vorgänge wie in Bild 5-30 auch berechnen, und zwar für genau definierte Anfangsbedingungen, wie sie experimentell gar nicht einzuhalten wären. Dabei erhält man tatsächlich bei nur minimal veränderten Bedingungen völlig andere Kurven ϑ(t), bei exakt gleichen Bedingungen aber natürlich immer dieselben Kurven. Die scheinbar regellose Bewegung ist also in der Theorie wohl determiniert, man spricht deshalb auch von deterministischem Chaos. Ein weiteres Beispiel für ein System, das chaotisches Verhalten zeigen kann, ist ein Planet in einem Doppelsternsystem (Dreikörperproblem). Während ein Planet eines einzelnen Zentralsterns Kepler-Ellipsen durchläuft (siehe 11.2), also eine periodische Bewegung ausführt, durchläuft ein Planet in einem Doppelsternsystem i. Allg. sehr komplizierte Bahnen, die sich zeitweise um das eine, zeitweise um das andere Kraftzentrum bewegen, in gewisser Analogie zum Drehpendel mit Unwucht
B47
B48
B Physik
Bild 5-30. a Potenzialkurve des Drehpendels mit Unwucht (Bild 5-29b); b Chaotische Schwingung des Drehpendels mit Unwuchtmasse, die teilweise um die beiden Ruhelagen ϑ bzw. ϑ erfolgt (nach P. Bergé, Phys. Bl. 46 (1990) 209)
(Bilder 5-29b und 5-30). Auch hier gilt, dass eine minimale Änderung der Anfangsbedingungen u. U. zu völlig veränderten Bahnkurven führen kann. Die Theorie des deterministischen Chaos (kurz: Chaostheorie) ist gegenwärtig Gegenstand einer intensiven Forschung, wie sie erst durch die heutigen Rechner möglich geworden ist. Man versucht beispielsweise, das turbulente Strömungsverhalten (siehe 9.4 und 10.2) und viele andere Phänomene mithilfe der Chaostheorie zu verstehen.
6 Teilchensysteme Reale Materie kann stets als Vielteilchensystem aufgefasst werden, dessen Bestandteile (die Teilchen des Systems) z. B. die Atome oder Moleküle der betrachteten Materiemenge sind, oder auch fiktive „Massenelemente“, d. h. differenziell kleine Bruchteile dm der gesamten Masse m des Vielteilchensystems. Materiemengen können in unterschiedlichen Aggregatzuständen auftreten, die charakteristische Eigenschaften als Vielteilchensysteme aufweisen: 1. Gase: Die Teilchen (Atome, Moleküle) haben beliebige, stochastisch wechselnde Abstände (Brown’sche Bewegung). Zwischen ihnen gibt es weder Fern- noch Nahordnung. Gase füllen jedes verfügbare Volumen aus. Der mittlere Teilchenabstand und damit die Dichte hängen von äußeren Kräften (Druck) ab (hohe Kompressibilität). 2. Flüssigkeiten: Die Teilchen einer Flüssigkeit haben ebenfalls zeitlich variierende Abstände (Brown’sche Bewegung), jedoch eine ausgeprägte Nahordnung
(keine Fernordnung). Angreifende Kräfte und Drehmomente verformen eine Flüssigkeit ohne dauerhafte Rückstellkräfte zu erzeugen. Der mittlere Teilchenabstand (∼ Dichte−1/3 ) hängt kaum von äußeren Kräften (Druck) ab (geringe Kompressibilität), Flüssigkeiten haben ein definiertes Volumen. 3. Festkörper: Die Teilchen besitzen feste Abstände untereinander, es besteht eine feste Nah- und Fernordnung (Kristallstruktur). Unter Einwirkung äußerer Kräfte und Drehmomente können sich Festkörper unter Ausbildung von Rückstellkräften elastisch verformen. Unterhalb bestimmter Grenzwerte sind die Deformationen bei Entlastung reversibel, die Festkörper nehmen dann ihre vorherige Form wieder an. Oberhalb dieser Grenzwerte verhalten sich Festkörper plastisch oder brechen. Die Kompressibilität ist noch geringer als bei Flüssigkeiten. Als weiterer Aggregatzustand der Materie wird nach Langmuir der Plasmazustand (siehe 16.6.3) angesehen: 4. Plasmen: Kollektive aus neutralen und einer großen Anzahl elektrisch geladener Teilchen, die quasineutral sind (gleich viele positiv und negativ geladene Teilchen), und deren Verhalten durch kollektive Phänomene aufgrund der starken elektromagnetischen Wechselwirkung zwischen den geladenen Teilchen bestimmt ist. Die geladenen Teilchen können z. B. positive oder negative lonen und freie Elektronen (oder Löcher beim Halbleiter) sein. Plasmen können hochionisierte Gase, elektrolytische Flüssigkeiten oder elektrisch leitende Festkörper sein. Viele Eigenschaften solcher Vielteilchensysteme lassen sich durch idealisierte Modelle beschreiben, wo-
6 Teilchensysteme
von in den folgenden Abschnitten mehrfach Gebrauch gemacht wird, z. B.: Gase: Modell des idealen Gases (Teilchen punktförmig, keine Wechselwirkungen usw.), siehe 8 (Statistische Mechanik). Flüssigkeiten: Modell der idealen Flüssigkeit (Inkompressibilität, keine innere Reibung), siehe 10 (Hydround Aerodynamik). Festkörper: Modell des starren Körpers. In diesem Modell bleiben die Abstände aller Elemente des Körpers untereinander konstant, auch wenn äußere Kräfte oder Drehmomente angreifen (siehe 7). In mancher Hinsicht kann ein Teilchensystem wie ein Massenpunkt behandelt werden, dessen Masse gleich der Summe der Massen aller Teilchen im System ist, in anderer Hinsicht nicht. Die Massen der Teilchen in den betrachteten Teilchensystemen werden als konstant angenommen.
6.1 Schwerpunkt (Massenzentrum), Impuls und Drehimpuls von Teilchensystemen Wir betrachten ein System von Teilchen der Masse mi (Gesamtmasse m = mi ) bei den Ortskoordinaten ri in einem Kraftfeld mit konstanter Beschleunigung a (z. B. Erdfeld: a = g), sodass auf jedes Teilchen eine Kraft Fi = mi a wirkt (Bild 6-1a). Bezüglich des vorgegebenen Bezugssystems treten dann Drehmomente Mi = ri × Fi = ri × mi a auf. Das Gesamtdrehmoment M = Mi lässt sich nun darstellen als Vektorprodukt zwischen einer Schwerpunktskoordinate rS und der resultierenden Gesamtkraft F = Fi = mi a: ri × mi a = rS × mi a , M= i
Für kontinuierliche Massenverteilungen (starre Körper) müssen die Summierungen durch Integration ersetzt werden (vgl. 7). Beispiel: System aus zwei Massen. Aus (6-2) folgt rS =
m1 r1 + m2 r2 m1 + m2
(6-3)
und weiter m1 (rS − r1 ) = m2 (r2 − rS ). Dies bedeutet, dass (rS − r1 ) (r2 − rS ) ist und der Schwerpunkt auf der Verbindungslinie der beiden Massen liegt (Bild 6-1b). Wegen |rS − r1 | m2 = |r2 − rS | m1
(6-4)
teilt der Schwerpunkt die Verbindungslinie im umgekehrten Verhältnis der Massen. Die Schwerpunktskoordinate rS ist nach (6-2) eine mittlere Koordinate der mit den Massen mi gewichteten Teilchenkoordinaten ri . Der dadurch definierte Schwerpunkt S wird daher auch als Massenzentrum bezeichnet. In einem Bezugssystem mit S als Ursprung (Schwerpunktsystem) verschwindet nach (6-1) das resultierende Drehmoment, weil hierin rS = 0 wird. Für den Gesamtimpuls eines Teilchensystems, in dem die einzelnen Teilchen i Geschwindigkeiten vi = dri /dt haben, folgt p=
pi =
mi
d dri = mi r i , dt dt
und daraus mit (6-2) p=
drS d (mrS ) = m . dt dt
i
⎞ ⎞ ⎛ ⎛ ⎟⎟⎟ ⎜⎜⎜ ⎜⎜⎜ ⎟⎟⎟ ri mi ⎟⎟⎠ × a = ⎜⎜⎝ rS mi ⎟⎟⎠ × a . ⎜⎜⎝ i
(6-1)
i
Aus der Gleichheit der Klammerterme folgt für die Schwerpunktskoordinate in dem betrachteten Bezugssystem (meist als Laborsystem bezeichnet) 1 mi r i rS = = mi ri . (6-2) m i mi
Bild 6-1. a Zur Definition des Schwerpunktes eines Teilchensystems, b Schwerpunkt eines Systems aus zwei Massen
B49
B50
B Physik
drS /dt = vS ist die Geschwindigkeit des Schwerpunktes (Systemgeschwindigkeit), sodass sich für den Gesamtimpuls des Teilchensystems im Laborsystem p = mvS
(6-5)
ergibt. Gleichung (6-5) entspricht der Impulsdefinition (3-2) für einen einzelnen Massenpunkt. Hinsichtlich des Impulses verhält sich also das Teilchensystem so, als ob die gesamte Masse des Systems im Massenzentrum (Schwerpunkt) vereinigt ist und sich mit dessen Geschwindigkeit bewegt. Im Schwerpunktsystem verschwindet p = pint wegen vS = 0: pint = pint, i = 0 . (6-6) i
pint, i ist hierin der Impuls des i-ten Teilchens, pint der Gesamtimpuls des Teilchensystems, beide gemessen im Schwerpunktsystem. Im Folgenden muss zwischen „inneren“ („internen“) und „äußeren“ („externen“) Kräften unterschieden werden: Innere Kräfte Fint : Kräfte zwischen den Teilen eines betrachteten Systems. Äußere Kräfte Fext : Kräfte, die zwischen dem System oder Teilen davon und der Umgebung wirken. 6.1.1 Schwerpunktbewegung ohne äußere Kräfte
Ohne äußere Kräfte bleibt der Gesamtimpuls eines Teilchensystems erhalten. p = mvS = const und damit vS = const für Fext = 0 .
dieselbe geradlinige Bahn, wenn z. B. durch Federkraft eine Raumsonde ausgestoßen wird (Bild 6-2). Das Raumfahrzeug selbst weicht dann von der Bahn des gemeinsamen Massenzentrums S ab! 6.1.2 Schwerpunktbewegung bei Einwirkung äußerer Kräfte
Unterliegen die Teilchen des betrachteten Systems äußeren Kräften Fext, i , so gilt nach (3-5) z. B. für das i-te Teilchen Fext, i =
d pi . dt
Für die resultierende Gesamtkraft auf das System er gibt sich damit wegen pi = p Fext =
Fext,i =
i
dp
i
i
dt
=
d dp , pi = dt i dt
und mit (6-5) Fext =
dp d(mvS ) = . dt dt
(6-8)
Gleichung (6-8) entspricht wiederum dem Kraftgesetz (3-5) für einen einzelnen Massenpunkt. Die Bahn des Schwerpunktes (Massenzentrum) eines Teilchensystems verläuft also so, als ob die resultierende äußere Kraft Fext auf die im Massenzentrum vereinigte Gesamtmasse m des Teilchensystems wirkt. Voraussetzung ist nach 6.1 ein äußeres Kraftfeld mit konstanter Beschleunigung a. Beispiel: Stößt eine Raumfähre, die sich im Schwerefeld der Erde auf einer Kreisbahn bewegt, durch Federkraft einen schweren Satelliten oder eine Raumstation aus, so bewegt sich das gemeinsame
(6-7)
Der Schwerpunkt (das Massenzentrum) des Teilchensystems beschreibt also eine geradlinige Bahn. Eventuell auftretende innere Kräfte ändern daran nichts: Wegen „actio = reactio“ (vgl. 3.3.2) ändern sich Impulse von Teilchen, zwischen denen innere Kräfte wirken, um entgegengesetzt gleiche Werte, sodass der Gesamtimpuls nicht beeinflusst wird. Beispiel: Das Massenzentrum eines Raumfahrzeugs, das sich fern von Gravitationseinwirkungen ohne Antrieb geradlinig bewegt, beschreibt auch dann weiter
Bild 6-2. Geradlinige Bahn des gemeinsamen Massenzentrums eines Raumfahrzeuges und einer von ihm ausgestoßenen Raumsonde bei fehlender Gravitation
6 Teilchensysteme
Massenzentrum beider Raumkörper weiterhin auf der ursprünglichen Bahn, solange die Schwerebeschleunigung noch als konstant betrachtet werden kann (Bild 6-3). Die Raumfähre weicht danach von der ursprünglichen Kreisbahn ab. (Wegen der tatsächlichen Ortsabhängigkeit der Schwerebeschleunigung im Radialfeld gilt die Aussage über die Schwerpunktbahn für den weiteren Flugverlauf nicht mehr). 6.1.3 Drehimpuls eines Teilchensystems
Der Drehimpuls eines einzelnen Teilchens mit der Ortskoordinate r, der Masse m und der Geschwindigkeit v, d. h. mit dem Impuls p = mv, ist in (3-25) definiert als L = r × p = r × mv .
Durch Einwirkung einer Kraft F, die gemäß (3-21) ein Drehmoment M = r × F erzeugt, wird nach (3-29) eine zeitliche Änderung des Drehimpulses L bewirkt: dL = M= r×F. dt
(6-10)
Bei Teilchensystemen kompensieren sich Drehmomente, die durch innere Kräfte zwischen den Teilchen des Systems hervorgerufen werden, zu null (Bild 6-4): Da wegen „actio = reactio“ (vgl. 3.3) innere Kräfte zwischen zwei Teilchen 1 und 2 entgegengesetzt gleich groß sind, d. h. F21 = −F12 , gilt für die dadurch bewirkten Drehmomente Mint Mint, 12 = Mint,1 + Mint, 2 = r1 × F21 + r2 × F12 = (r2 − r1 ) × F12 = 0 ,
(6-9)
weil die beiden Faktoren parallele Vektoren sind (Bild 6-4). Dabei ist vorausgesetzt, dass die inneren Kräfte F12 und F21 längs der Verbindungslinie r2 − r1 wirken. Verallgemeinert auf viele Teilchen ergibt sich dann Mint, i j = 0 . (6-11) i, j
Der Gesamtdrehimpuls eines Teilchensystems L = Li wird daher durch innere Kräfte und die dadurch erzeugten Drehmomente nicht verändert. Fehlen ferner äußere Kräfte Fext, i und dadurch hervorgerufene äußere Drehmomente Mext, i , so gilt Li = const für Mext = 0 . (6-12) L= i
Bild 6-3. Die Bahnkurve des gemeinsamen Massenzen-
trums einer Raumfähre und eines von ihr ausgestoßenen Satelliten ist anfänglich mit der ursprünglichen Kreisbahn identisch
Bild 6-4. Zur Berechnung von Drehmomenten durch innere
Kräfte
Dies ist die allgemeine Form des Drehimpulserhaltungssatzes (vgl. 3.8): Wirken keine äußeren Drehmomente, so bleibt der Gesamtdrehimpuls eines Teilchensystems zeitlich konstant. Unterliegen die Teilchen des betrachteten Systems jedoch äußeren Kräften Fext,i und dadurch hervorgerufenen äußeren Drehmomenten Mext,i = ri × Fext,i , so gilt für den Gesamtdrehimpuls L des Teilchensystems im selben Bezugssystem, in dem auch die Drehmomente definiert sind, unter Beachtung von (6-10) dLi d dL = = Li = Mi . dt dt i dt i i
B51
B52
B Physik
In der letzten Summe können die Drehmomentanteile, die durch innere Kräfte bedingt sind, wegen (6-11) weggelassen werden: Mi = Mext, i + Mint, i j i
i
=
i, j
Mext, i = Mext .
(6-13)
i
Damit ergibt sich für die zeitliche Änderung des Gesamtdrehimpulses eines Teilchensystems unter Einwirkung eines äußeren Gesamtdrehmomentes Mext ganz entsprechend wie beim einzelnen Massenpunkt, vgl. (3-29), dL = Mext . dt
(6-14)
Drehimpuls und Drehmoment hängen von der Wahl des Bezugssystems ab. Um von dieser Willkürlichkeit wegzukommen, kann als Bezugssystem das Schwerpunktsystem gewählt werden. Der Gesamtdrehimpuls des Teilchensystems bezogen auf das Massenzentrum werde innerer Drehimpuls Lint genannt: Lint = rint, i × pint, i . (6-15) i
Im Falle von Elementarteilchen wird der innere Drehimpuls auch Spin S genannt. Bezüglich eines anderen Bezugssystems kann ferner ein Bahndrehimpuls LBahn definiert werden: LBahn = rS × p = rS × mvS ,
(6-16)
worin p der Gesamtimpuls und m die Gesamtmasse des Teilchensystems sind, und rS die Koordinate des Massenzentrums und vS seine Geschwindigkeit. Der Gesamtdrehimpuls des Teilchensystems kann als Summe beider dargestellt werden (ohne Ableitung): L = LBahn + Lint .
Die Geschwindigkeit vi des Teilchens i eines Teilchensystems in einem beliebigen Bezugssystem (Laborsystem) lässt sich zerlegen in die Geschwindigkeit vS des Massenzentrums und in die Geschwindigkeit vint, i des i-ten Teilchens im Schwerpunktsystem (Bild 6-5): vi = vS + vint, i ; v2i = v2S + v2int, i + 2vS vint, i . (6-18) Für die gesamte kinetische Energie eines Teilchensystems folgt mit (6-18) 1 1 mi v2i = mi v2S Ek = 2 2 i i 1 mi v2int, i + + mi vS vint, i 2 i i 1 = mv2S + Ek, int + vS pint, i . (6-19) 2 i In (6-19) bedeutet der erste Term die kinetische Energie der im Massenzentrum vereinigten Gesamtmasse im Laborsystem, der zweite Term stellt die kinetische Energie im Schwerpunktsystem dar, während der dritte Term verschwindet, weil pint, i = pint = 0 im Schwerpunktsystem, vgl. (6-6). Damit gilt für die kinetische Energie eines Teilchensystems in einem beliebigen Laborsystem 1 1 mi v2i = mv2S + Ek, int . (6-20) Ek = 2 2 i Bei Stoßvorgängen (siehe 6.3) interessieren beide Terme, während z. B. in der statistischen Mechanik (siehe 8) die Schwerpunktsbewegung und damit der erste Term in (6-20) meist ohne Interesse ist. Die potenzielle Energie aufgrund innerer konservativer Kräfte (innere potenzielle Energie des
(6-17)
6.2 Energieinhalt von Teilchensystemen Die folgenden Betrachtungen enthalten vor allem für Zweiteilchensysteme (z. B. Stöße, siehe 6.3) und für die statistische Mechanik (Gase als Vielteilchensysteme: Thermostatik bzw. -dynamik, siehe 8) benötigte Festlegungen und Folgerungen.
Bild 6-5. Teilchengeschwindigkeit im Laborsystem und im Schwerpunktsystem
6 Teilchensysteme
Teilchensystems) lässt sich als Summe der potenziellen Energien Ep, i j der nichtgeordneten Teilchenpaare {i, j} aufgrund der Kräfte zwischen den Teilchen i und j (unabhängig vom Bezugssystem, Paare (i, j) und (j, i) nur einfach gezählt) darstellen: Ep, i j . (6-21) Ep, int =
Bild 6-6. Energieflussdiagramm zur Leistung äußerer Arbeit an einem Teilchensystem
{i, j}
Ek und Ep, int hängen nicht von äußeren Kräften ab (obwohl sich Ek durch äußere Kräfte zeitlich ändern kann). Als Eigenenergie des Teilchensystems sei daher definiert U = Ek + Ep, int =
1 2 mv + Ek, int + Ep, int . 2 S
(6-23)
Damit ergibt sich für die Eigenenergie im Laborsystem 1 (6-24) U = Uint + mv2S . 2 6.2.1 Energieerhaltungssatz in Teilchensystemen
Wenn an einem Teilchensystem keine äußere Arbeit W durch äußere Kräfte geleistet wird, oder äußere Kräfte überhaupt fehlen, so bleibt die Eigenenergie des Systems nach dem Energieerhaltungssatz zeitlich konstant: U = Ek + Ep, int = const für W = 0 .
(6-25)
Dabei können sich durch innere Kräfte Ek und Ep, int durchaus ändern, ihre Summe bleibt dennoch erhalten. Wenn dagegen dem Teilchensystem durch äußere Kräfte äußere Arbeit W12 zugeführt wird (ohne dass sonstige Energien zwischen dem System und der Umgebung ausgetauscht werden, vgl. 8.5), so erhöht sich dessen Eigenenergie um W12 von U1 auf U2 (Energieflussdiagramm Bild 6-6): U2 − U1 = W12 .
W12 = Ep, ext, 1 − Ep, ext, 2 .
(6-27)
Gleichsetzung von (6-26) und (6-27) liefert (6-22)
Im Schwerpunktsystem fällt der erste Term weg und man erhält die sogenannte innere Energie Uint = Ek, int + Ep, int .
auch eine äußere potenzielle Energie, und es gilt entsprechend (4-13)
(6-26)
Wird die äußere Arbeit durch eine äußere Kraft geleistet, die ebenfalls konservativ ist, so existiert zusätzlich zur inneren potenziellen Energie
U2 + Ep, ext, 2 = U1 + Ep, ext, 1 .
(6-28)
Daraus folgt, dass die Gesamtenergie E des Teilchensystems sich nicht ändert. Der Energieerhaltungssatz für Teilchensysteme lautet demnach bei konservativen äußeren Kräften analog zu (4-23) E = U + Ep, ext = const .
(6-29)
6.2.2 Bindungsenergie eines Teilchensystems
Es werde ein Teilchensystem (der Einfachheit halber im Schwerpunktsystem) betrachtet, dessen Teilchen zunächst ∞ weit voneinander entfernt ruhen. Die innere Energie des Systems werde für diesen Fall auf U∞ = 0 normiert, was wegen der beliebigen Normierbarkeit von Ep, int immer möglich ist (vgl. 4.2). Werden die Teilchen nun durch irgendeinen Mechanismus zusammengebracht, so hat das Teilchensystem die innere Energie Uint = Ek, int + Ep, int .
(6-30)
Ek ist immer positiv. Ep, int kann positiv oder negativ sein, je nachdem, ob beim Zusammenbringen Arbeit zugeführt werden muss (abstoßende Kräfte: dEp > 0) oder frei wird (anziehende Kräfte: dEp < 0). Uint kann daher positiv oder negativ sein. Nach (6-26) gilt für den Vorgang des Zusammenbringens der Teilchen Uint − U∞ = Uint = W .
(6-31)
Ist die innere Energie des Teilchensystems nach dem Zusammenbringen positiv (Uint > 0), so musste hierfür äußere Arbeit aufgebracht werden (W > 0). Es herrschen abstoßende Kräfte, die Teilchen trennen
B53
B54
B Physik
Bild 6-8. Stoß zwischen zwei Teilchen Bild 6-7. Energietermschema eines ungebundenen und eines gebundenen Systems
sich wieder. Das System ist nicht stabil (ungebunden). Beispiel: Streuung eines positiv geladenen αTeilchens an einem positiv geladenen Atomkern. Ist dagegen die innere Energie nach dem Zusammenbringen negativ (Uint < 0), so ist bei der Formierung des Systems Energie (Arbeit) nach außen abgegeben worden (W < 0), das System hat weniger Energie als die getrennten Teilchen. Um das System wieder aufzulösen, muss der Energiebetrag −Uint wieder von außen zugeführt werden. Ein System mit negativer innerer Energie ist daher stabil oder „gebunden“. Beispiel: Planetensystem der Sonne. −Uint ist die Bindungsenergie des Systems: −Uint = Eb .
(6-32)
Bild 6-7 zeigt die beiden Fälle in einer Energieskala als sog. Termschemata.
6.3 Stöße Es sei als einfachstes Vielteilchensystem ein solches mit zwei Teilchen betrachtet, die sich mit in großer Entfernung voneinander vorgegebenen Impulsen einander nähern, dabei Kräfte aufeinander ausüben und infolgedessen ihren Bewegungszustand ändern („Stoß“), und schließlich mit geänderten Impulsen wieder auseinander fliegen. Definierte Stoßexperimente sind in der Physik besonders wichtig, weil aus deren Ergebnissen (z. B. Häufigkeit einer bestimmten Ablenkung oder Energieänderungen der Stoßpartner) auf die Art der Wechselwirkung zwischen den stoßenden Teilchen geschlossen werden kann (Kraftfeld der Teilchen, innere Energiezustände). Bei atomaren und elementaren Teilchen sind Stoßversuche oft die einzige Möglichkeit zur Untersuchung dieser Größen. Hier sollen nur die ein-
fachen dynamischen Grundlagen des Stoßvorganges betrachtet werden. Aus dem Kraftgesetz (3-5) folgt für eine während der Stoßzeit Δt = t2 −t1 wirkende Kraft F(t), dass sie eine Impulsänderung Δp = p2 − p1 hervorruft: "t2 Δp = p2 − p1 =
F(t)dt .
(6-33)
t1
Das Integral über den Zeitverlauf der Kraft wird Kraftstoß genannt. Gleichung (6-33) zeigt, dass es für die Impulsänderung nicht auf den zeitlichen Verlauf der Kraft im Einzelnen ankommt, sondern nur auf das Zeitintegral, den Kraftstoß. Wir zerlegen nun den Stoßvorgang in drei Phasen (Bild 6-8): 1. die Phase vor dem Stoß mit vernachlässigbaren Wechselwirkungen zwischen den Teilchen, 2. die Stoßphase mit Wechselwirkungskräften zwischen den stoßenden Teilchen im Stoßbereich, und 3. die Phase nach dem Stoß mit wieder vernachlässigbaren Wechselwirkungen. Der experimentellen Messung am einfachsten zugänglich sind die Phasen vor und nach dem Stoß. Ohne den Ablauf im Stoßbereich genauer zu kennen, folgt allein daraus, dass nur innere Kräfte beim Stoß wirken, bereits, dass sowohl der Gesamtimpuls als auch die Gesamtenergie erhalten bleiben (die gestrichenen Größen gelten für die Phase nach dem Stoß, die ungestrichenen für die Phase vor dem Stoß): Impulserhaltung für den Gesamtimpuls beider Teilchen: p1 + p2 = p1 + p2 , m1 v1 + m2 v2 = m1 v1 + m2 v2 .
(6-34)
Ist Ek bzw. Ek die Summe der kinetischen Energien vor bzw. nach dem Stoß und Uint bzw. Uint die Summe der inneren Energien vor bzw. nach dem Stoß, so
6 Teilchensysteme
fordert die Energieerhaltung für die Gesamtenergie beider Teilchen: Ek + Uint = Ek + Uint .
(6-35)
Ändert sich beim Stoß die innere Energie der Teilchen (z. B. bei Atomen als Stoßpartner durch Anregung höherer Energiezustände, oder beim Stoß bereits vorher angeregter Atome durch Übergang zu niedrigeren Energiezuständen) um die sog. Reaktionsenergie , Q = Uint − Uint
(6-36)
so muss sich nach (6-35) auch die kinetische Energie ändern: 1 2 1 2 Q = Ek − Ek = m1 v1 + m2 v2 2 2 1 1 − m1 v21 + m2 v22 . (6-37) 2 2 Aus Stoßversuchen, bei denen die kinetischen Energien der Stoßpartner vor und nach dem Stoß gemessen werden, lassen sich daher nach (6-37) die Reaktionsenergien berechnen und z. B. bei Atomen oder Molekülen als Stoßpartner deren Anregungsenergien bestimmen. Das ist das Prinzip der Teilchenspektroskopie bzw. Energieverlustspektroskopie (siehe 20.4). Fallunterscheidung: Q 0: unelastischer Stoß, siehe oben. Q = 0: elastischer Stoß, keine Änderung der inneren Energien: Die gesamte kinetische Energie bleibt nach (6-37) erhalten.
erhalten (Ferner wird angenommen, dass die Teilchenmassen sich nicht ändern.). Die Erhaltungssätze liefern für diesen eindimensionalen Stoßvorgang: Impulserhaltung: m1 v1 + m2 v2 = m1 v1 + m2 v2 ,
(6-38)
Energieerhaltung: 2 m1 v21 + m2 v22 = m1 v2 1 + m2 v2 .
(6-39)
Wegen des eindimensionalen Vorganges können die Geschwindigkeitsvektoren vi in (6-38) durch ihre Beträge vi ersetzt werden. Ohne Beschränkung der Allgemeingültigkeit kann ferner durch geeignete Wahl des Koordinatensystems v2 = 0 gesetzt werden (Ursprung vor dem Stoß in m2 ). Dann folgt aus (6-38) und (6-39) 2m1 v1 , m1 + m2 m1 − m2 v1 = v1 für v2 = 0 . m1 + m2
v2 =
(6-40)
Aus (6-40) ergeben sich folgende Sonderfälle (Bild 6-10): m1 1. m1 m2 : v1 ≈ − v1 , v2 ≈ 2 v1 v1 : m2 Impulsumkehr des stoßenden Teilchens, nur geringe Energieabgabe. 2. m1 = m2 : v1 = 0, v2 = v1 : Vollständige Impuls- und Energieübertragung. 3. m1 m2 : v1 ≈ v1 , v2 ≈ 2v1 : Impuls des stoßenden Teilchens fast ungeändert, nur geringe Energieabgabe.
6.3.1 Zentraler elastischer Stoß
Der zentrale elastische Stoß ist der einfachste Stoßvorgang. Die Stoßpartner bewegen sich vor und nach dem Stoß auf einer gemeinsamen Geraden (Bild 6-9), und die gesamte kinetische Energie bleibt
Bild 6-9. Zentraler elastischer Stoß
Bild 6-10. Sonderfälle des zentralen elastischen Stoßes. Gestrichelt: Massen und Geschwindigkeiten nach dem Stoß
B55
B56
B Physik
Bild 6-11. Relativer Bruchteil der beim zentralen elastischen Stoß übertragenen Energie als Funktion des Massenverhältnisses der Stoßpartner
Für den betrachteten Fall v2 = 0 ist die Energie des gestoßenen Teilchens nach dem Stoß E2 gleich der vom stoßenden Teilchen übertragenen Energie ΔE, seinem Energieverlust, mit (6-40) demnach: ΔE = E2 =
2m21 m2 2 1 m2 v2 2 = v . 2 (m1 + m2 )2 1
(6-41)
Bezogen auf die Energie des stoßenden Teilchens vor dem Stoß E1 = m1 v21 /2 ergibt sich daraus der Anteil der beim Stoß übertragenen Energie (relativer Energieverlust des stoßenden Teilchens): ΔE 4m1 m2 4m1 /m2 = = . 2 E1 (m1 + m2 ) (1 + m1 /m2 )2
(6-42)
In Abhängigkeit vom Massenverhältnis m1 /m2 zeigt der relative Energieverlust ein Maximum bei m1 /m2 = 1, d. h. für m1 = m2 (Bild 6-11). Die Abbremsung von schnellen Teilchen durch Stoß mit anderen Teilchen ist daher am wirkungsvollsten mit Stoßpartnern von etwa gleicher Masse. Anwendung: Abbremsung schneller Neutronen im Kernreaktor durch Neutronenmoderator. Da Neutronen die Massenzahl 1 haben, werden als Moderatorsubstanzen solche mit möglichst niedrigen Massenzahlen ihrer Atome verwendet, z. B. schwerer Wasserstoff oder Grafit. Zu beachtende Nebenbedingung: Moderatoratome dürfen Neutronen nicht absorbieren (unelastischer Stoß). Als Beispiel für den elastischen Stoß werde die Impulsübertragung von aus einem Rohr des Querschnitts A mit hoher Geschwindigkeit v strömenden Teilchen der Masse m betrachtet, die an einer Wand elastisch reflektiert werden (Bild 6-12a). Die Teilchengeschwindigkeit lässt sich in eine Normalkomponente vn und eine Tangentialkomponente
Bild 6-12. Elastische Reflexion a eines Teilchenstroms b eines einzelnen Teilchens an einer Wand
vt zerlegen. Der Stoßvorgang ist dann darstellbar als zentraler Stoß der kleinen Masse m mit der Geschwindigkeit vn gegen die sehr große Wandmasse mw , wobei eine Tangentialgeschwindigkeit vt überlagert ist, die durch den Stoß nicht beeinflusst wird. Die Normalkomponente des Teilchenimpulses wird dabei entsprechend dem oben beschriebenen Sonderfall 1 in der Richtung umgekehrt, sodass der pro Teilchen an die Wand übertragene Impulsbetrag Δp = |mvn − (−mvn )| = 2mvn = 2mv cos ϑ (6-43) ist (Bild 6-12b). In einer Zeit Δt treffen alle im Strahlvolumen V = Al der Länge l = vΔt befindlichen Teilchen auf die Wand. Ist die Teilchenzahldichte im Teilchenstrahl n, so sind dies Z = nV = nAvΔt
(6-44)
Teilchen. In der Zeit Δt wird daher insgesamt der Impuls Δptot = ZΔp = 2nmv2 A Δt cos ϑ
(6-45)
an die Wand übertragen. Nach dem 2. Newton’schen Axiom (3-5) entspricht dem eine zeitlich gemittelte Normalkraft auf die Wand Fn =
Δptot = 2nmv2 A cos ϑ . Δt
(6-46)
Der Quotient aus Normalkraft Fn und beaufschlagter Wandfläche Aw wird als Druck p bezeichnet: Fn (6-47) Aw SI-Einheit : [p] = N/m2 = Pa (Pascal) . p=
(Weitere Druckeinheiten siehe 8.1.)
6 Teilchensysteme
Der Druck p darf nicht mit dem Impuls p, insbesondere nicht mit dessen Betrag p verwechselt werden. Die vom Teilchenstrom getroffene Wandfläche ist Aw = A/ cos ϑ. Mit v cos ϑ = vn folgt aus (6-46) und (6-47) für den durch den gerichteten Teilchenstrom auf die Wand ausgeübten Druck p = 2nmv2n .
(6-48)
Dieses Ergebnis wird später für die Berechnung des Gasdruckes (siehe 8.1) sowie des Strahlungsdruckes elektromagnetischer Strahlung (siehe 20.3) benötigt. 6.3.2 Nichtzentraler elastischer Stoß
Der zentrale Stoß, bei dem stoßendes und gestoßenes Teilchen auf derselben Bahngeraden bleiben, ist der einfachste Fall des Stoßes zwischen zwei Teilchen. Im Allgemeinen stoßen die Teilchen nicht zentral aufeinander, es existiert ein Stoßparameter b, der den Abstand des (hier wieder als ruhend angenommenen) gestoßenen Teilchens m2 von der Bahn des stoßenden Teilchens m1 angibt (Bild 6-13a). Dann bilden die Bahnen der Teilchen m1 und m2 nach dem Stoß Winkel ϑ1 und ϑ2 mit der Bahn des stoßenden Teilchens m1 vor dem Stoß, die von der Größe des Stoßparameters und vom Massenverhältnis m1 /m2 abhängen. In Impulsvektoren ausgedrückt lauten Impuls- und Energieerhaltungssatz (5-38) und (5-39) für v2 = 0
Aus dem Impulsdiagramm Bild 6-13b folgt für die Quadrate der Impulse nach dem Stoß p2 2 = p2x 2 + p2y 2 2 p1 2 = p1 − p2x + p2y 2 ,
(6-51) (6-52)
worin p2x und p2y die x- bzw. y-Komponente des Impulses des gestoßenen Teilchens nach dem Stoß sind. Durch Einsetzen in den Energiesatz (6-50) folgt nach einiger Umrechnung
p2x − μv1
2
+ p2y 2 = (μv1 )2
mit der reduzierten Masse m1 m2 . μ= m1 + m2
(6-53)
Dies ist die Gleichung eines Kreises in den Impulskoordinaten p2x und p2y , des sog. Stoßkreises
2 2 p2x − R + p2 2y = R .
Er ist um den Stoßkreisradius m1 m2 p1 v1 = R = μv1 = m1 + m2 1 + m1 /m2
(6-54)
(6-55)
(6-50)
in positiver x-Richtung verschoben (Bild 6-14). Bei vorgegebenen Werten m1 , m2 , v1 (v2 = 0) ist der Stoßkreis der geometrische Ort der Spitzen aller möglicher Impulsvektoren des gestoßenen Teilchens nach dem Stoß, vgl. (6-51) und Bild 6-14. Aus Bild 6-14 folgt, dass das gestoßene Teilchen nur Impulse p2 in Richtungen des Winkelbereichs ϑ2 = (0. . . ± 90)◦ erhalten kann. Der Winkelbereich
Bild 6-13. Nichtzentraler elastischer Stoß und zugehöriges Vektordiagramm
Bild 6-14. Stoßkreis und Lage der möglichen Impulsvektoren für m2 < m1
p1 = p1 + p2 p21 p2 p2 = 1 + 2 . 2m1 2m1 2m2
(6-49)
B57
B58
B Physik
Tabelle 6-1. Charakteristische Fälle elastischer Stöße
Massenverhältnis
Stoßkreisradius
Streuwinkelbereich |ϑ1 |
Bemerkungen
1. m1 /m2 < 1
p1 < R < p1 2 p1 R= 2
0◦ . . .180◦
Vor- oder Rückwärtsstreuung von m1
0◦ . . .90◦
Nach dem Stoß fliegen beide Teilchen unter 90◦ auseinander
0◦ . . . < 90◦
Nur Vorwärtsstreuung von m1
2. m1 /m2 = 1 3. m1 /m2 > 1
m2 v1 < R
V1 . Bei diesem Vorgang bleibt die Enthalpie H = U + pV (vgl. F, C 8.2; U innere Energie, siehe 8.5) konstant. Bei idealen Gasen sind innere Energie U nach (8-30) und pV aufgrund der Gasgleichung (8-26) allein von der Temperatur abhängig, damit auch die Enthalpie. Bei idealen Gasen ändert sich daher die Temperatur für H = const nicht. Bei realen Gasen ist dagegen die innere Energie volumen- bzw. druckabhängig. Bei der gedrosselten Entspannung (Δp < 0) ist wegen der damit verbundenen Abstandsvergrößerung zwischen den Molekülen Arbeit gegen die zwischenmolekularen Kräfte bzw. gegen den Binnendruck zu verrichten: die mittlere kinetische Energie sinkt. Die eintretende Temperaturerniedrigung ΔT < 0 (Joule-ThomsonEffekt) beträgt für kleine Druckunterschiede Δp in erster Näherung 2a 1 ΔT ≈ −b . (8-61) Δp Cmp RT
Bild 8-13. Schema des Joule-Thomson-Prozesses: Gedros-
Cmp ist die molare Wärmekapazität bei konstantem Druck (vgl. 8.6.1). Bei Temperaturen oberhalb der aus
selte Entspannung
B77
B78
B Physik
(8-61) folgenden Inversionstemperatur, für die sich mit (8-57) ergibt T inv =
2a 27 = T k = 6,75 T k , Rb 4
(8-62)
überwiegt in (8-61) der Einfluss des Covolumens b, d. h., abstoßende Kräfte dominieren. Dann steigt die innere Energie bei der gedrosselten Entspannung, die Temperatur wird höher. Unterhalb der Inversionstemperatur ist der Joule-Thomson-Effekt positiv, es tritt Abkühlung auf. Linde’sches Gegenstromverfahren zur Luftverflüssigung: Wird hochkomprimierte Luft (z. B. p = 200 bar = 20 MPa) durch ein Drosselventil entspannt (auf z. B. 20 bar), und die durch den JouleThomson-Effekt abgekühlte Luft (ΔT = −45 K) zur Vorkühlung der Hochdruckluft verwendet (Gegenstromkühlung), so führt dies bei fortgesetztem Kreislauf zu einer sukzessiven Absenkung der Temperatur bis zur Verflüssigung (Bild 8-14). Die rückströmende, entspannte Luft wird jeweils erneut komprimiert und muss wegen der dabei auftretenden Erwärmung vorgekühlt werden. Tabelle 8-5 enthält die Siedetemperaturen einiger für die Tieftemperaturtechnik (Kryotechnik) wichtiger Gase. Tiefere Temperaturen lassen sich durch Verflüssigung z. B. von Helium erreichen (4 He: T lg = 4,2 K, vgl. Tabelle 8-5). Wegen der niedrigen Inversionstemperatur von 4 He von 47 K reicht jedoch die Vorkühlung des komprimierten Gases selbst mit flüssigem Stickstoff (T lg = 77,4 K) nicht aus. Es muss daher durch
Tabelle 8-5. Siedetemperatur kryogener Flüssigkeiten bei Normdruck pn = 101 325 Pa 4
Helium ( He) Wasserstoff Neon Stickstoff Sauerstoff Luft
ϑlg in ◦ C − 268,9279 − 252,87 − 246,08 − 195,80 − 182,962 − 194,48
T lg in K 4,2221 20,28 27,07 77,35 90,188 78,67
adiabatische Expansion des vorgekühlten Gases unter Arbeitsleistung (siehe 8.7) in einer Expansionsmaschine eine weitere Abkühlung bewirkt werden, ehe die Joule-Thomson-Entspannung nach Gegenstromvorkühlung gemäß Bild 8-14 zur Verflüssigung führt. Weitere Ausführungen und Daten über reale Gase finden sich in C 5.2 und F 2.1.3.
8.5 Energieaustausch bei Vielteilchensystemen In 6.2.1 ist der Energieerhaltungssatz für den Fall formuliert, dass ein Vielteilchensystem Energie mit der Umgebung austauscht, z. B. durch äußere Arbeit W. Dabei ändert sich die Eigenenergie gemäß (6-26) um ΔU = U2 − U1 = W ,
(8-63)
wenn sonst kein weiterer Energieaustausch (z. B. als Wärme, siehe 8.5.2) stattfindet. Die Schwerpunktbewegung des Teilchensystems möge vernachlässigbar sein. Die Eigenenergie U ist dann identisch mit der inneren Energie Uint . Für U wird daher im Weiteren die üblichere Bezeichnung innere Energie benutzt. Vorzeichenfestlegung: Dem Teilchensystem zugeführte Energien (z. B. Arbeit und Wärme) werden positiv gerechnet. 8.5.1 Volumenarbeit
Bild 8-14. Linde’sches Gegenstromverfahren zur Luftver-
flüssigung
Die von einem Vielteilchensystem, z. B. einer Gasmenge, geleistete (d. h. nach außen abgegebene) Arbeit setzt sich zusammen aus den individuellen Arbeiten aller Einzelteilchen. Bei einer Gasmenge, die in einem Zylinder mit beweglichem Kolben eingeschlossen ist (Bild 8-15), üben die Moleküle durch impulsübertragende Stöße auf die Kolbenfläche
8 Statistische Mechanik —Thermodynamik
chung des idealen Gases (8-26) folgt aus (8-65) −W12 = νRT ln
V2 . V1
(8-67)
Volumenarbeit bei adiabatischer Expansion: Bei einem adiabatischen Prozess wird außer Arbeit keine andere Energieform mit der Umgebung ausgetauscht (insbesondere keine Wärme, siehe 8.5.2). Für diesen Fall gilt der Energiesatz in der Form (8-63), und mit der inneren Energie (8-30) des idealen (einatomigen) Gases folgt Bild 8-15. Volumenarbeit bei Expansion einer Gasmenge
A eine mittlere Normalkraft F = pA aus (p Druck). Folgt der Kolben der Kraft (dazu muss die durch den Außendruck bedingte Gegenkraft nur differenziell kleiner sein), so lässt sich die dabei abgegebene Arbeit −dW aus der Kolbenversetzung dx berechnen (Bild 8-15):
−W12 = −ΔU = U1 − U2 =
3 νR(T 1 − T 2 ) . (8-68) 2
Für mehratomige Gase muss der Faktor 3R/2 nach 8.6.1 durch die dann geltende molare Wärmekapazität CmV ersetzt werden: −W12 = νCmV (T 1 − T 2 ) .
(8-69)
−dW = F dx = pA dx = p dV , −dW = p dV differenzielle Volumenarbeit . (8-64)
Bemerkung: Gleichung (8-68) lässt sich auch durch direkte Berechnung des Arbeitsintegrals (8-65) mithilfe der Funktion p = p(V) für die adiabatische Zustandsänderung (Bild 8-16)
Erfolgt die Expansion von einem Anfangsvolumen V1 auf das Endvolumen V2 , so beträgt die dabei nach außen geleistete Volumenarbeit
(8-70) pV γ = const mit γ = Cmp /CmV : Adiabatenexponent
"V2 −W12 =
p dV .
(8-65)
(Adiabatengleichung, siehe 8.7) gewinnen. Cmp , CmV : Molare Wärmekapazität bei konstantem Druck bzw. bei konstantem Volumen (vgl. 8.6.1).
V1
Sie entspricht im p,V -Diagramm (Bild 8-15) der Fläche unter der Kurve p = p(V), deren Verlauf von der Prozessführung abhängt und zur Berechnung des Integrals in (8-65) bekannt sein muss. Volumenarbeiten bei der Expansion einer Stoffmenge ν eines idealen Gases für verschiedene Prozessführungen: Volumenarbeit bei isobarer Expansion: Ein isobarer Prozess erfolgt bei konstantem Druck p = const (Bild 8-16). Aus (8-65) folgt dann −W12 = p(V2 − V1 ) = pΔV .
(8-66)
Volumenarbeit bei isothermer Expansion: Ein isothermer Prozess erfolgt bei konstanter Temperatur T = const (Bild 8-16). Mit der Zustandsglei-
Bild 8-16. Isobare, isotherme und adiabatische Expansion im p,V -Diagramm
B79
B80
B Physik
Bei der isobaren und bei der isothermen Expansion gilt der Energiesatz in der Form (8-63) nicht, da bei diesen Prozessführungen auch Wärme ausgetauscht werden muss (vgl. 8.7). 8.5.2 Wärme
Ein Energieaustausch zwischen einem Vielteilchensystem und seiner Umgebung, etwa zwischen einer Gasmenge und der einschließenden Zylinderwand (Bild 8-15), kann auch dann stattfinden, wenn z. B. das Verschieben eines beweglichen Kolbens und dadurch geleistete Volumenarbeit nicht möglich sind: So können z. B. Stöße von Gasmolekülen auf die Wand Schwingungen von Wandatomen anregen, wobei die Gasmoleküle kinetische Energie (d. h. innere Energie) verlieren. Umgekehrt können Gasmoleküle bei der Reflexion an der Wand von schwingenden Wandatomen auch kinetische Energie aufnehmen, wobei die Schwingungsenergie der Wandatome abnimmt. Es findet daher ein Energieaustausch in beiden Richtungen durch die Systemgrenzfläche statt. Da die Temperatur eines Gases durch dessen innere Energie, d. h. durch die kinetische Energie der statistisch ungeordneten Bewegung der Gasmoleküle, bestimmt ist (siehe 8.2), und Entsprechendes für die Schwingungsenergie der Festkörperatome gilt (siehe 8.3 u. 8.6), ändern sich die Temperaturen von Teilchensystem und Umgebung, wenn die mittleren Energieströme in beiden Richtungen verschieden sind. Bei gleicher Temperatur von System und Umgebung sind die Energieströme in beiden Richtungen gleich und der resultierende Energiefluss verschwindet: thermisches Gleichgewicht. Zur phänomenologischen Erfassung des resultierenden Energieflusses wird der Begriff der Wärme Q eingeführt: Die Wärme Q ist der mittlere Wert der Summe der mikroskopischen, individuellen Teilchenarbeiten bzw. der dadurch übertragenen Energien zwischen dem System und seiner Umgebung. Die Wärme ist also eine Energieform und wird in Energieeinheiten gemessen. SI-Einheit: [Q] = J (Joule). Für die Wärme wurde früher als besondere Einheit die Kalorie (cal) verwendet (Definition siehe 8.6). Der
Zusammenhang mit dem Joule 1 cal = 4,1868 J
(8-71)
wurde experimentell bestimmt und je nach Erzeugung der Wärmemenge aus mechanischer oder elektrischer Energie das mechanische oder elektrische Wärmeäquivalent genannt. Bei Verwendung der Kalorie als Energieeinheit nimmt die universelle Gaskonstante (vgl. (8-25)) einen besonders einfachen Zahlenwert an: R = 8,314472 J/(mol · K) = 1,99 cal/(mol · K) ≈ 2 cal/(mol · K) .
(8-72)
8.5.3 Energieerhaltungssatz für Vielteilchensysteme
Der Energieaustausch eines Vielteilchensystems mit seiner Umgebung kann nach 8.5.1 und 8.5.2 u. a. durch (am oder vom System verrichtete) Arbeit (z. B. Volumenarbeit) und durch (Aufnahme oder Abgabe von) Wärme geschehen. Beide Energieformen führen beim Austausch zu einer Änderung der inneren Energie des Systems und müssen bei der Formulierung des Energieerhaltungssatzes berücksichtigt werden. Gleichung (6-26) bzw. (8-63) muss daher ergänzt werden: Zufuhr von Arbeit W oder Wärme Q führen zu einer Erhöhung der inneren Energie des Systems um ΔU = U2 − U1 (Bild 8-17). Das ist der Inhalt des 1. Hauptsatzes der Thermodynamik ΔU = Q + W .
(8-73)
Ein abgeschlossenes thermodynamisches System enthält eine bestimmte, zeitlich unveränderliche innere Energie U, die den thermodynamischen Zustand des Systems eindeutig kennzeichnet. U ändert sich nur dann, wenn dem System von außen Energie in Form von Wärme Q oder Arbeit W zugeführt wird. Zur inneren Energie tragen im allgemeinen Falle noch weitere Energieformen bei, die einem thermodynamischen System zugeführt werden können, so die elektrische, die magnetische, die chemische und sonstige Energieformen. Differenzielle Form des 1. Hauptsatzes: dU = δQ + δW .
(8-74)
8 Statistische Mechanik —Thermodynamik
Hierin ist c die spezifische Wärmekapazität c=
1 δQ · . m dT
(8-76)
SI-Einheit: [c] = J/(kg · K) .
Bild 8-17. Zum 1. Hauptsatz der Thermodynamik: a Vorzeichenvereinbarung und b Energieflussdiagramm
Bemerkung: Q und W sind keine Zustandsgrößen des Systems, die differenziellen Größen δQ und δW für sich genommen sind daher keine totalen Differenziale. Deshalb wird statt des gewöhnlichen Differenzialzeichens das Zeichen δ verwendet. Wenn man beachtet, dass z. B. gemäß (8-30) die innere Energie eines abgeschlossenen Systems beschränkt ist, kann der 1. Hauptsatz auch als Unmöglichkeitsaussage formuliert werden: Es ist unmöglich, ein Perpetuum mobile erster Art, d. h. eine periodisch arbeitende Maschine, die ohne Energiezufuhr permanent Arbeit verrichtet, zu konstruieren.
8.6 Wärmemengen bei thermodynamischen Prozessen Thermodynamische Prozesse (Zustandsänderungen) sind mit dem Austausch von Wärme zwischen dem betrachteten System und seiner Umgebung verbunden (außer beim adiabatischen Prozess, siehe 8.7). Hier sollen Wärmemengen betrachtet werden, die zur Änderung der Temperatur eines betrachteten Systems erforderlich sind (Wärmekapazitäten), oder zur Änderung des Aggregatzustandes oder auch des kristallinen Ordnungszustandes bei Festkörpern (Umwandlungswärmen oder auch Umwandlungsenthalpien). 8.6.1 Spezifische und molare Wärmekapazitäten
Die zur Erhöhung der Temperatur eines Körpers zuzuführende Wärme Q ist proportional zu dessen Masse m und zu der zu erzielenden Temperaturdifferenz ΔT : Q = cm ΔT
bzw. δQ = cm dT .
(8-75)
Die bis 1977 für die Wärmemenge zugelassene Einheit Kalorie (cal) war dadurch definiert, dass für Wasser von ϑ = 15 ◦ C die spezifische Wärmekapazität c = 1 cal/(g · K) = 1 kcal/(kg · K) gesetzt wurde. Umrechnung siehe (8-71). Die auf das Mol einer Substanz bezogene Wärmekapazität ist die molare Wärmekapazität Cm =
1 δQ · . ν dT
(8-77)
SI-Einheit: [Cm ] = J/(mol · K) . Der Zusammenhang zwischen beiden Wärmekapazitäten ergibt sich aus (8-76) und (8-77) zu Cm =
m c. ν
(8-78)
Wärmemischung: Werden zwei Körper von verschiedener Temperatur in Berührung gebracht, so erfolgt ein Wärmeaustausch, wobei die Temperaturdifferenz verschwindet und sich eine gemeinsame Mischungstemperatur T x einstellt. Für die abgegebene bzw. aufgenommene Wärmemenge gilt die Richmann’sche Mischungsregel c1 m1 (T 1 − T x ) = c2 m2 (T x − T 2 ) ,
(8-79)
bzw. für n Körper n i=1
c i mi T i = T x
n
c i mi .
(8-80)
i=1
Diese Mischungsregeln können zur Bestimmung unbekannter spezifischer Wärmekapazitäten von Körpern mithilfe von Kalorimetern angewendet werden. Als zweite Substanz von bekannter spezifischer Wärmekapazität wird meist Wasser verwendet. Bei Festkörpern und Flüssigkeiten sind die spezifischen und die molaren Wärmekapazitäten (Tabelle 8-6) nur wenig von den Zustandsgrößen Volumen, Druck und Temperatur abhängig. Allgemein gilt das nicht, da nach dem 1. Hauptsatz (8-74) die für
B81
B82
B Physik
eine bestimmte Temperaturerhöhung erforderliche Wärmemenge von der Prozessführung abhängt: δQ dU δW = − . dT dT dT
(8-81)
Der Wert von δQ/dT bzw. von c und Cm (8-76) und (8-77) hängt also davon ab, ob bei der Erwärmung Arbeit nach außen abgegeben wird, z. B. durch Volumenausdehnung (Volumenarbeit (8-64)). Bei Festkörpern und Flüssigkeiten ist diese gering. Molare Wärmekapazitäten von Gasen: Die Erwärmung eines Gases bei konstantem Volumen (isochorer Prozess, siehe 8.7) erfolgt wegen dV = 0 ohne Volumenarbeit, sodass der 1. Hauptsatz (8-74) sich zu δQ = dU reduziert. Aus (8-77) folgt daher für die molare Wärmekapazität bei konstantem Volumen 1 δQ 1 dU . = · (8-82) CmV = ν dT V ν dT Mit (8-45) folgt daraus bei f angeregten Freiheitsgraden CmV
R = f . 2
(8-83)
Nach Tabelle 8-3 sind für einatomige Gase f = 3 Freiheitsgrade der Translation angeregt, d. h. theoretisch, CmV = 3 R/2 = 12,47. . . J/(mol · K). Für zweiatomige Gase sind bei Zimmertemperatur zwei Freiheitsgrade der Rotation zusätzlich angeregt, sodass hier f = 5 und theoretisch CmV = 5R/2 = 20,78 . . . J/(mol · K) sind (vgl. Tabelle 8.7). Bei Wasserstoff (H2 ) zum Beispiel werden die Rotationsfreiheitsgrade nach (8-48) oberhalb T rot ≈ 163 K angeregt, die beiden Schwingungsfreiheitsgrade
Bild 8-18. Temperaturabhängigkeit der molaren Wärmeka-
pazität CmV von Wasserstoff
nach (8-51) erst oberhalb T vib ≈3500 K. Daraus ergibt sich der Verlauf der molaren Wärmekapazität mit der Temperatur in Bild 8-18. Die Erwärmung eines idealen Gases bei konstantem Druck (isobarer Prozess, siehe 8.5) erfolgt nach dem Gasgesetz (8-26) mit einer Volumenvergrößerung dV = νR dT/p, es wird also eine Volumenarbeit −dW = p dV = νR dT geleistet, die durch erhöhte Wärmezufuhr aufgebracht werden muss. Der 1. Hauptsatz (8-74) lautet damit dQ = dU + νR dT
für
p = const .
(8-84)
Aus (8-77) folgt dann mit (8-82) die molare Wärmekapazität bei konstantem Druck 1 δQ Cmp = = CmV + R (8-85) ν dT p und Cmp − CmV = R .
(8-86)
Mit (8-83) ergibt sich für f angeregte Freiheitsgrade Cmp = ( f + 2)
R . 2
(8-87)
Für einatomige Gase ( f =3) ist demnach Cmp = 5R/2 = 20,78 . . . J/(mol · K) und für zweiatomige Gase ( f = 5) der Wert Cmp = 7R/2 = 29,1 . . . J/(mol · K) (vgl. Tabelle 8-7). Das Verhältnis Cmp /CmV wird Adiabatenexponent genannt (vgl. 8.7): Cmp =γ. CmV
(8-88)
Molare Wärmekapazitäten von Festkörpern: Bei Festkörpern kann sich die Temperaturbewegung nicht als Translations- oder Rotationsbewegung, sondern nur in Form von Schwingungen der gebundenen Atome äußern. Nach 8.3 (Tabelle 8-3) ergeben sich für die drei linear unabhängigen Schwingungsrichtungen f = 6 Schwingungsfreiheitsgrade. Da sich Festkörper bei Erwärmung nur wenig ausdehnen, gilt ferner Cmp ≈ CmV = Cm . Aus (8-83) folgt daher für die molare Wärmekapazität einatomiger Festkörper (Atomwärme) die experimentell gefundene Regel von Dulong-Petit: Cm ≈ 3 R = 24,94 J/(mol · K) ≈ 6 cal/(mol · K) ,
(8-89)
8 Statistische Mechanik —Thermodynamik
Tabelle 8-6. Spezifische Wärmekapazität c und molare Wärmekapazität Cm einiger fester und flüssiger Stoffe bei 20 ◦ C
Stoff
Feste Stoffe: Aluminium Beryllium Beton Blei Diamant Graphit Eis (0 ◦ C) Eisen Fette Glas, FlintGlas, KronGold Grauguss Kupfer Marmor Messing Natriumchlorid Nickel Platin Sand (trocken) Schwefel Silber Silicium Stahl(X5CrNi1810) Teflon (PTFE) Wolfram Zink Zinn Flüssigkeiten: Aceton Benzol Brom Ethanol Glyzerin Methanol Nitrobenzol Olivenöl Petroleum Quecksilber Silikonöl
c
Cm
kJ kg · K
J mol · K
0,897 1,825 0,84 0,129 0,502 0,708 2,1 0,449 2 0,481 0,666 0,129 0,540 0,385 ≈ 0,80 0,385 0,867 0,444 0,133 0,84 0,73 0,235 0,703 0,50 1,0 0,139 0,388 0,228 2,18 1,74 0,46 2,44 2,38 2,53 1,51 1,97 2,14 0,139 1,45
24,4 16,5 26,85 6,03 8,50 37,7 25,15
25,4 24,3
50,7 26,3 26,0 22,8 25,4 20,0
24,3 25,5 26,9
134,7 36,8
80,0
27,7
Tabelle 8-6. Forsetzung
Stoff
c
Cm J mol · K
Terpentinöl Tetrachlorkohlenstoff Toluol Trichlorethylen Wasser
kJ kg · K 1,80 0,861 1,70 0,95 4,1818
75,3
Tabelle 8-7. Molare Wärmekapazitäten und Adiabatenex-
ponent von Gasen Gas
Ar He Ne Xe Cl2 CO O2 N2 H2 CO2 NH3 CH4 O3 SO2
Cmp J mol · K 20,9 20,9 20,8 20,9 52,8 29,2 29,3 29,1 28,9 36,9 34,9 35,6 38,2 41,0
CmV J mol · K 12,7 12,7 12,7 12,6 39,2 20,9 21,0 20,8 20,5 28,6 26,6 27,2 27,3 32,2
Cmp /CmV
1,65 1,63 1,64 1,67 1,35 1,40 1,40 1,40 1,41 1,29 1,32 1,31 1,40 1,27
Cmp − CmV J mol · K 8,2 8,2 8,1 8,3 13,6 8,3 8,3 8,3 8,4 8,3 8,3 8,4 10,9 8,8
die für viele Festkörper gut erfüllt ist (Tabelle 8-6). Abweichungen zeigen sich vor allem bei sehr harten Festkörpern (z. B. Be, Diamant, Si), bei denen die Schwingungsfrequenzen sehr hoch sind und nach (8-51) die Schwingungsfreiheitsgrade bei Zimmertemperatur noch nicht voll angeregt sind. Dies wird durch Messungen der Temperaturabhängigkeit der molaren Wärmekapazität bestätigt (Graphit in Bild 8-19). 8.6.2 Phasenumwandlungsenthalpien
Hierunter seien die Wärmemengen oder genauer Enthalpien ΔH verstanden, die bei den sogenannten Phasenübergängen 1. Art auftreten, z. B. beim Schmelzen bzw. Erstarren, Verdampfen bzw. Kondensieren und
B83
B84
B Physik
Tabelle 8-8. Thermische Kenngrößen einiger Stoffe. Molare Masse M, Schmelztemperatur ϑsl und molare Schmelzenthalpie ΔHsl sowie Verdampfungstemperatur ϑlg und molare Verdampfungsenthalpie ΔH1g . Die Verdampfungsgrößen gelten für den Normdruck pn = 101 325 Pa. In einigen Fällen ist anstatt der Schmelztemperatur die Tripelpunkttemperatur angegeben und durch tp gekennzeichnet. Temperaturen, die mit einem Sternchen bezeichnet sind, dienen als Fixpunkte der Internationalen Temperaturskala von 1990 (ITS-90)
Stoff Aluminium Ammoniak NH3 Argon Benzol C6 H6 Blei Brom Br2 Calcium Chlor Cl2 Eisen Ethanol C2 H5 OH Fluor F2 Gallium Germanium Gold Helium Indium Iod I2 Iridium Kalium Kohlendioxid CO2 Kohlenmonoxid CO Kohlenstoff, Diamant –, Graphit Krypton Kupfer Magnesium Methan CH4 Methanol CH3 OH Natrium Natriumchlorid NaCl Neon Nickel Ozon O3 Platin Quecksilber Sauerstoff O2 Schwefelkohlenstoff CS2 Schwefelwasserstoff H2 S Silber Silicium Stickstoff N2 Wasser H2 O Wasserstoff H2
M g/mol 26,982 17,031 39,948 78,112 207,2 159,808 40,078 70,905 55,845 46,068 37,997 69,723 72,61 196,967 4,0026 114,818 253,809 192,217 39,098 44,010 28,010 12,011 12,011 83,80 63,546 24,305 16,042 32,042 22,990 58,442 20,180 58,693 47,998 195,078 200,59 31,9988 76,143 34,082 107,868 28,086 28,013 18,015 2,016
ϑsl ◦ C 660,323∗ −77,73 −189,3442∗ tp 5,49 327,46 −7,2 842 −101,5 1538 −114,14 −219,66 29,76 938,25 1064,18∗
ΔHsl kJ/mol 10,71 5,66 1,18 9,87 4,77 10,57 8,54 6,40 13,81 4,931 0,51 5,59 36,94 12,55
156,60 113,7 2446 63,38 −56,56 tp −205,02 3550a 3825b −157,38 tp 1084,62∗ 650 −182,47 −97,53 97,80 800,7 −248,59 1455 −193 1768,4 −38,83 −218,7916∗ tp −112,1 −85,5 961,78∗ 1414 −210,0 0,00 −259,34
3,28 15,52 41,12 2,33 9,02 0,833
1,64 13,26 8,48 0,94 3,215 2,60 28,16 0,328 17,48 22,17 2,29 0,44 4,39 2,38 11,30 50,21 0,71 6,01 0,12
ϑlg ◦ C 2519 −33,33 −185,85 80,09 1749 58,8 1484 −34,04 2861 78,3 −188,12 2204 2833 2856 −268,93 2072 184,4 4428 759 −78,4 −191,5
ΔHlg kJ/mol 294 23,33 6,43 30,72 179,5 29,96 153 20,41 354 38,56 6,62 254 334 324 0,08 226,4 41,57 563,6 79,16 6,02 6,04
−153,22 2562 1090 −161,48 64,6 883 1465 −246,08 2913 −111,35 3825 356,73 −182,95 46,3 −59,55 2162 3265 −195,79 100,00 −252,87
9,08 304,6 131,8 8,19 35,21 89,1 170,75 1,71 381 15,17 469 59,11 6,82 26,74 18,67 254 394,6 5,57 40,65 0,90
8 Statistische Mechanik —Thermodynamik
Tabelle 8-8. Fortsetzung
Stoff Wismut Wolfram Wood’sches Metall Xenon Zink Zinn a Zersetzungstemperatur b Sublimationstemperatur
M g/mol 208,980 183,84 131,29 65,39 118,710
ϑsl ◦ C 271,40 3422 71,7 −111,79 tp 419,527∗ 231,928∗
ΔHsl kJ/mol 11,30 52,31
ϑlg ◦ C 1564 5555
ΔHlg kJ/mol 151 799
2,27 7,32 7,03
−108,11 907 2602
12,57 114,8 290,4
tp Tripelpunkttemperatur
Bild 8-19. Temperaturabhängigkeit der molaren Wärmekapazität von Festkörpern
Sublimieren, aber z. B. auch bei Änderungen der Kristallstruktur im festen Zustand (Strukturumwandlung). Bei diesen Phasenumwandlungen findet der Wärmeaustausch ohne Temperaturänderung statt, bis die Umwandlung vollständig ist. Beim Schmelzen und Verdampfen muss Arbeit gegen die anziehenden Bindungskräfte geleistet werden, sowie, wegen der Volumenausdehnung vor allem beim Verdampfen, außerdem Volumenarbeit gegen den äußeren Druck. Bei dT = 0 muss daher eine bestimmte massenbezogene Energie in Form von Schmelzenthalpie Δhsl bzw. Verdampfungsenthalpie Δhlg zugeführt werden. Die Verdampfungs- bzw. Schmelzenthalpien werden beim Kondensieren bzw. Erstarren wieder frei. Da die Volumenarbeit vom äußeren Druck abhängt, ist vor allem die Verdampfungsenthalpie etwas vom äußeren Druck abhängig. Einige spezifische Schmelzund Verdampfungsenthalpien sind in Tabelle 8-8 angegeben (Enthalpie siehe 8.4, C 8.2.1, F 1.2). Beim Erwärmen einer definierten Stoffmenge, ausgehend vom festen Zustand, steigt deren Temperatur entsprechend der zugeführten Wärmemenge
Bild 8-20. Erwärmungsverlauf für 1 kg H2 O: Haltepunkte bei Schmelz- und Siedetemperatur. s: fester, l: flüssiger und g: gasförmiger Zustand
nach Maßgabe der spezifischen Wärmekapazität (Bild 8-20). Die Schmelz- und die Siedetemperatur machen sich dabei als sogenannte Haltepunkte bemerkbar, bei denen die kontinuierlich zugeführte Wärme zunächst zur Phasenumwandlung dient, und erst nach vollständiger Umwandlung die Temperatur weiter erhöht (Bild 8-20). Das Beobachten von Haltepunkten bei Erwärmungsvorgängen wird daher zur experimentellen Bestimmung von Schmelztemperaturen benutzt, aber auch zur Entdeckung anderer Phasenumwandlungen wie etwa Kristallstrukturänderungen.
8.7 Zustandsänderungen bei idealen Gasen Der Zustand eines idealen Gases ist durch die drei Zustandsgrößen Druck p, Volumen V und Tempe-
B85
B86
B Physik
ratur T bestimmt (anstelle des Volumens V kann auch das spezifische Volumen v = V/m oder das molare (stoffmengenbezogene) Volumen Vm = V/ν als Zustandsgröße gewählt werden). Davon können zwei unabhängig gewählt werden, die dritte ergibt sich dann aus der Zustandsgleichung f (p, V, T ) = 0. Im Falle des idealen Gases ist dies die allgemeine Gasgleichung (8-26). Die einem Gas zugeführte Wärme Q und Arbeit W sind sog. Prozessgrößen, keine Zustandsgrößen, wohl aber die innere Energie U = U(T ), vgl. (8-30), und die Enthalpie H = U + pV, die beim idealen Gas wegen pV = νRT ebenfalls eine Funktion allein der Temperatur ist. Der Zustand eines thermodynamischen Systems heißt stationär, wenn er sich nicht mit der Zeit ändert. Ein stationärer Zustand wird Gleichgewichtszustand genannt, wenn er ohne äußere Eingriffe besteht. Jede thermodynamische Zustandsänderung wird Prozess genannt. Als Kreisprozess wird eine Zustandsänderung eines thermodynamischen Systems bezeichnet, in deren Verlauf das System wieder seinen Anfangszustand erreicht. Bei Zustandsänderungen, z. B. Volumenänderungen (Kompression, Expansion), muss grundsätzlich zwischen zwei Arten der Prozessführung unterschieden werden, die bei Vielteilchensystemen möglich sind: Reversible Zustandsänderungen: Prozesse, die sehr langsam, in infinitesimal kleinen Schritten durchgeführt werden, sodass das System jeweils nur sehr wenig aus dem statistischen Gleichgewicht gebracht wird. Im Grenzfall ist also jeder Zwischenzustand zwischen zwei betrachteten Endzuständen ein Gleichgewichtszustand. Nach Umkehrung des Prozesses und Wiedererreichung des Ausgangszustandes oder nach Ablauf eines Kreisprozesses sind keine Änderungen im System oder in seiner Umgebung zurückgeblieben. (Dieses Verhalten entspricht dem von Bewegungsvorgängen von Einzelteilchen in der Mechanik, z. B. lässt sich kinetische Energie vollständig in potenzielle Energie umwandeln und umgekehrt.) Irreversible Zustandsänderungen sind demnach solche, bei denen das thermodynamische System nicht in den Ausgangszustand zurückkehren kann, ohne dass in der Umgebung Änderungen eintreten. Reale Prozesse spielen sich mit endlicher Geschwindigkeit ab. Sie sind daher nicht im Gleichgewicht und wegen der
immer stattfindenden Ausgleichsvorgänge irreversibel. Im Folgenden werden nur reversible (also idealisierte) Zustandsänderungen betrachtet. Prozesse, bei deren Ablauf eine der Zustandsgrößen konstant bleibt (Tabelle 8-9): – – – – –
bei konstantem Volumen V: isochore Prozesse bei konstantem Druck p: isobare Prozesse bei konstanter Temperatur T: isotherme Prozesse bei konstanter Entropie S: isentropische Prozesse bei konstanter Enthalpie H: isenthalpische Prozesse
Tabelle 8-9. Zustandsänderungen idealer Gase
8 Statistische Mechanik —Thermodynamik
Prozesse, bei denen das System keine Wärme mit der Umgebung austauscht, werden adiabatische Prozesse genannt. Es werden diejenigen Zustandsänderungen der Stoffmenge ν eines idealen Gases betrachtet, die für die in 8.8 behandelten Kreisprozesse wichtig sind. Dabei interessieren die jeweils umgesetzten Energien (Wärme Q, Arbeit W, Änderung der inneren Energie ΔU), die sich aus dem 1. Hauptsatz der Thermodynamik, (8-73) oder (8-74), ergeben.
(vgl. 8.5.1) durch Zufuhr von Wärme aus einem Wärmereservoir der Temperatur T ausgeglichen werden, damit die Temperatur des Gases konstant gehalten werden kann (Bild 8-21). Nach (8-67) betragen die umgesetzten Energien
Isochore Zustandsänderung: Bei konstantem Volumen V wird keine Volumenarbeit geleistet, demnach ist W = 0. Der 1. Hauptsatz ergibt dann in Verbindung mit (8-82)
Adiabatische Zustandsänderung: Bei einem adiabatischen Prozess wird der Wärmeaustausch zwischen Arbeitsgas und Umgebung unterbunden, d. h. Q = 0 bzw. δQ = 0, z. B. durch Wärmeisolation des Arbeitszylinders und -kolbens (Bild 8-22). Der 1. Hauptsatz lautet dann
ΔU = Q = νCmV ΔT = νCmV (T 2 − T 1 ) .
(8-90)
Die zugeführte Wärme Q wird vollständig in innere Energie überführt, die um ΔU erhöht wird (Temperaturzunahme um ΔT ). Die Zustandsfunktion für die isochore Zustandsänderung folgt aus der Zustandsgleichung des idealen Gases (8-26) für V = const: p νR = cic mit cic = const = . (8-91) T V Isotherme Zustandsänderung: Bei konstanter Temperatur bleibt nach (8-30) die innere Energie konstant, also ΔU = 0. Dann folgt aus dem 1. Hauptsatz Q = −W .
(8-92)
Die zugeführte Wärme wird vollständig in abgegebene Arbeit umgewandelt und umgekehrt. Die Zustandsfunktion für die isotherme Zustandsänderung folgt aus der Zustandsgleichung des idealen Gases (8-26) für T = const:
−W12 = Q12 = νRT ln
V2 p1 = νRT ln . V1 p2
(8-94)
Der für diesen Prozess zu definierende Wirkungsgrad ist η = −W12 /Q12 = 1.
ΔU = W
bzw.
dU = dW = −pdV .
(8-95)
Mit (8-82) folgt weiter (vgl. (8-69)) − W12 = −ΔU = −νCmV ΔT = νCmV (T 1 − T 2 ) bzw. dU = νCmV dT = −p dV .
(8-96)
Arbeit kann wegen der Unterbindung des Wärmeaustausches nur unter entsprechender Verringerung der inneren Energie nach außen abgegeben werden, wobei die Temperatur abnimmt. Der hierfür zu definierende Wirkungsgrad ist η = (−W)/(−ΔU) = 1. Die Zustandsfunktion für die adiabatische Zustandsänderung ergibt sich mithilfe der Zustandsgleichung des idealen Gases (8-26) durch Integration von (8-96) zu T V γ−1 = cad,1 , T γ p1−γ = cad, 2 , pV γ = cad, 3 .
(8-97)
Bei einer isothermen Expansion eines idealen Gases muss die nach außen abgegebene Volumenarbeit W12
In diesen Adiabatengleichungen (auch Poisson’sche Gleichungen) bedeuten die cad,i Konstanten und γ = Cmp /CmV den Adiabatenexponenten (vgl. (8-88)). γ ist wegen (8-85) stets größer als 1, z. B. für ein-
Bild 8-21. Isotherme Expansion eines Gases
Bild 8-22. Adiabatische Expansion eines Gases
pV = cit
mit cit = const = νRT .
(8-93)
B87
B88
B Physik
atomige Gase 5/3 ≈ 1,67, für zweiatomige Gase 7/5 = 1,40, siehe 8.6.1. Im p,V-Diagramm verlaufen Adiabaten p(V)ad daher steiler als Isothermen p(V)it , vgl. Bild 8-16. Adiabatische Zustandsänderungen treten typisch bei Vorgängen auf, die einerseits so schnell verlaufen, dass kein Wärmeausgleich mit der Umgebung möglich ist, andererseits so langsam, dass innerhalb des Systems zu jedem Zeitpunkt die Einstellung des thermischen Gleichgewichts möglich ist. Beispiele: Schallausbreitung (adiabatische Kompression), Dieselmotor (Zündung durch adiabatische Kompression), Detonation (Explosionsausbreitung durch Stoßwelle mit adiabatischer Kompression).
8.8 Kreisprozesse Zur kontinuierlichen Umwandlung von Wärme in mechanische Arbeit sind periodisch arbeitende Maschinen notwendig, in denen Kreisprozesse (siehe 8.7) ablaufen. Beim Kreisprozess nach Carnot (1824) werden vier verschiedene, abwechselnd isotherme und adiabatische Prozesse zyklisch wiederholt (Bild 8-23). Die dazu benutzte Maschine besteht aus einem Zylinder mit Kolben gemäß Bild 8-21, der als Arbeitssubstanz eine konstante Menge (z. B. 1 mol) eines idealen Gases enthält. Durch Kontakt mit Wärmereservoirs sehr großer Wärmekapazität mit den Temperaturen T 1 und T 2 < T 1 kann das Arbeitsgas isotherm auf T 1 oder T 2 gehalten werden (Bild 8-23a). Der Carnot-Prozess ist ein idealisierter Kreisprozess, der reversibel geführt wird (vgl. 8.7) und demzufolge auch umkehrbar ist. Reibungs- und Wärmeleitungsverluste werden vernachlässigt. Er hat nur theoretische Bedeutung zur Berechnung des bestmöglichen Wirkungsgrades η bei der Umwandlung von Wärme in mechanische Arbeit. Eine technische Realisierung dieses Kreisprozesses existiert nicht. Nach 8.7 ergeben sich die in Tabelle 8-10 angegebenen Energieumsetzungen bei den Einzelprozessen der Carnot-Maschine. Die Volumenarbeiten der adiabatischen Teilprozesse heben sich gegenseitig auf. Aus der Anwendung von (8-97) auf die beiden Adiabaten in Bild 8-23b ergibt sich V2 /V1 = V3 /V4 . Damit folgt als resultierende Arbeit des Carnot-Prozesses aus der Summe der Teilarbeiten (Tabelle 8-10) V2 . (8-98) −W = −W12 − W34 = νR(T 1 − T 2 ) ln V1
Ferner wird während der isothermen Expansion die Wärme Q12 bei der Temperatur T 1 aufgenommen und die Wärme −Q34 bei der niedrigeren Temperatur T 2 abgegeben: Q12 = νRT 1 ln
V2 , V1
−Q34 = νRT 2 ln
V2 . (8-99) V1
Zur Berechnung des Wirkungsgrades muss die gewonnene (d. h. vom Prozess abgegebene) Arbeit −W nur zur aufgewendeten Wärme Q12 in Beziehung gesetzt werden, da die bei der Temperatur T 2 freiwerdende Wärme −Q34 für den Carnot-Prozess nicht nutzbar ist. Aus (8-98) und (8-99) folgt η=
−W T 1 − T 2 = . Q12 T1
(8-100)
Der Wirkungsgrad des Carnot-Kreisprozesses als Wärmekraftmaschine ist demnach immer kleiner als 1 und geht nur im Grenzfall T 2 → 0 gegen 1. Wie später mithilfe des 2. Hauptsatzes der Thermodynamik gezeigt wird, stellt (8-100) den maximal möglichen Wirkungsgrad einer periodisch arbeitenden Wärmekraftmaschine bei der Umwandlung von Wärme in Arbeit dar. Im Gegensatz zu allen anderen Energieformen lässt sich Wärme infolge ihrer statistisch
Bild 8-23. Der Carnot-Prozess
8 Statistische Mechanik —Thermodynamik
Tabelle 8-10. Energieumsetzungen beim Carnot-Prozess
Teilprozess
i→ j
T
V
−Wi j
Qi j
V2 νRT 1 ln V1 νCmV (T 1 − T 2 ) V3 −νRT 2 ln V4 −νCmV (T 1 − T 2 )
νRT 1 ln
isotherme Expansion
1→2
T1
V1 → V2
adiabatische Expansion
2→3
T1 → T2
V2 → V3
isotherme Kompression
3→4
T2
V3 → V4
adiabatische Kompression
4→1
T2 → T1
V4 → V1
Bild 8-24. Der Stirling-Prozess
ungeordneten Natur nicht vollständig in andere Energieformen überführen (außer theoretisch für T 2 → 0). Die von den stofflichen Eigenschaften einer Thermometersubstanz unabhängige thermodynamische Temperaturskala kann mithilfe der Carnot-Maschine definiert werden. Lässt man zwischen zwei Wärmereservoirs der Temperaturen T 1 und T 2 einen CarnotProzess ablaufen und bestimmt dessen Wirkungsgrad, so ergibt sich bei Festlegung eines Temperaturwertes, z. B. des Eispunktes des Wassers auf 273,15 K, aus dem gemessenen Wirkungsgrad mit (8-100) der zweite Temperaturwert. Im Gegensatz zum Carnot-Kreisprozess lässt sich der Stirling-Kreisprozess technisch ausnutzen
V2 V1
0 −νRT 2 ln
V3 V4
0
(Stirling-Motor). Beim Stirling-Prozess werden die adiabatischen Teilprozesse durch isochore Prozesse ersetzt (Bild 8-24). Deren Gesamteffekt ist nach Tabelle 8-11 zunächst die Überführung der Wärmemenge −Q23 = Q41 = νCmV (T 1 − T 2 ) von T 1 nach T 2 . Durch Zwischenspeicherung der bei der isochoren Abkühlung (2 → 3) freiwerdenden Wärme −Q23 (z. B. im Verdrängerkolben, Bild 8-25) und Wiederverwendung bei der isochoren Erwärmung (4 → 1) lässt sich jedoch dieser Verlust beliebig klein halten. Für die Bilanz verbleiben dann die isothermen Prozesse, für die sich dieselben Beziehungen (8-98) und (8-99) ergeben, wie für den originalen Carnot-Prozess. Daher ergibt sich derselbe Wirkungsgrad (8-100) auch für den Stirling-Prozess. Eine technische Form stellt der Heißluftmotor (Stirling-Motor, Bild 8-25) dar. Dabei wird das Arbeitsgas mithilfe eines Verdrängerkolbens, der auch als Wärmezwischenspeicher dient, zwischen einem geheizten und einem gekühlten Bereich des Arbeitszylinders bewegt. Eine über das Schwungrad gekoppelte, um 90◦ phasenverschobene Steuerung von Arbeits- und Verdrängerkolben bewirkt eine näherungsweise Realisierung der Teilprozesse des Stirling-Prozesses nach Bild 8-24. 8.8.1 Wärmekraftmaschine
Kreisprozesse wie der Carnot-Prozess oder der Stirling-Prozess können als Wärmekraftmaschinen genutzt werden. Die dabei auftretenden Energieflüsse lassen sich in einem vereinfachten Schema (Bild 8-26) darstellen, aus dem sich der Wirkungsgrad ablesen lässt. Die Wärmekraftmaschine (im Schema: Kreis) arbeitet zwischen einem Wärmereservoir höherer Temperatur T 1 (Beispiel: Dampfkessel) und einem weiteren Wärmereservoir
B89
B90
B Physik
Tabelle 8-11. Energieumsetzungen beim Stirling-Prozess
i→ j
Teilprozess
T
V
−Wi j
Qi j
V2 νRT 1 ln V1 0 V2 −νRT 2 ln V1 0
V2 V1 −νCmV (T 1 − T 2 ) V2 −νRT 2 ln V1 νCmV (T 1 − T 2 )
isotherme Expansion
1→2
T1
V1 → V2
isochore Abkühlung
2→3
T1 → T2
V2
isotherme Kompression
3→4
T2
V2 → V1
isochore Erwärmung
4→1
T2 → T1
V1
νRT 1 ln
Bild 8-26. Wärmekraftmaschine (Energiefluss)
Bild 8-25. Die vier Arbeitsphasen des Stirling-Motors
tieferer Temperatur T 2 (Beispiel: Kühlwasser), im Schema als Kästen dargestellt. Gemäß (8-98) bis (8-100) und mit Q12 = Q1 beträgt der Wirkungsgrad der Wärmekraftmaschine η=
−W T 1 − T 2 = , Q1 T1
(8-101)
d. h., es ist stets η < 1. Der ideale Wirkungsgrad hängt allein von den Arbeitstemperaturen ab. 8.8.2 Kältemaschine und Wärmepumpe
Die reversibel geführten Kreisprozesse können auch im entgegengesetzten Umlaufsinn durchlaufen
werden. Beim Stirling-Motor (Bild 8-25) lässt sich das durch eine Umkehrung der Drehrichtung des Schwungrades erreichen. Dann kehren sich die Energieflussrichtungen um (Bild 8-27), d. h., es muss Arbeit W zugeführt werden. Dabei wird die Wärme Q2 (= Q43 ) dem Wärmereservoir tieferer Temperatur entnommen und eine um W vergrößerte Wärme −Q1 (= −Q21 ) dem Wärmereservoir höherer Temperatur zugeführt. Beim Betrieb als Kältemaschine interessiert die dem kälteren Wärmereservoir entnommene Wärme Q2 . Für den dementsprechend gemäß Bild 8-27 definierten Wirkungsgrad ergibt sich mit (8-98) und (8-99) der Wirkungsgrad der Kältemaschine η=
Q2 T2 = 1, W T 1 − T 2
(8-102)
d. h., je nach der Temperaturdifferenz der Wärmereservoire (z. B. Kühlfach eines Kühlschrankes bei T 2 , Umgebung bei T 1 ) im Vergleich zur tieferen Temperatur T 2 kann hier der Wirkungsgrad auch größer als 1 sein. In der Technik werden Stirling-Maschinen (Bild 8-25) als Kältemaschinen zur Erzeugung flüssiger Luft eingesetzt.
8 Statistische Mechanik —Thermodynamik
Bild 8-27. Kältemaschine und Wärmepumpe (Energiefluss) Bild 8-28. Zum Theorem von Thomson
Beim Betrieb als Wärmepumpe interessiert dagegen die bei der höheren Temperatur T 1 abgegebene Wärme −Q1 , die etwa zur Raumheizung eingesetzt werden soll, während die bei tieferer Temperatur T 2 aufgenommene Wärme Q2 z. B. dem Erdboden, einem Fluss, oder der Umgebungsluft entnommen werden kann. Der dementsprechend gemäß Bild 8-27 definierte Wirkungsgrad der Wärmepumpe beträgt mit (8-98) und (8-99) η=
−Q1 T1 = >1, W T1 − T2
(8-103)
ist also immer größer als 1, wie auch aus dem Energieflussschema Bild 8-27 sofort entnommen werden kann. Beträgt die Temperaturdifferenz zwischen geheiztem Raum und Umgebung nicht mehr als 25 K, so ergeben sich theoretische Wirkungsgrade von mehr als 10! Im Gegensatz dazu beträgt der Wirkungsgrad einer elektrischen Heizung mittels Joule’scher Wärme lediglich 1.
8.9 Ablaufrichtung physikalischer Prozesse (Entropie) Reversibel geführte thermodynamische Prozesse sind umkehrbar, laufen jedoch nicht von allein ab, da sie voraussetzungsgemäß jederzeit im Gleichgewicht sind. Von selbst laufen hingegen Vorgänge ab, die einen endlichen Unterschied, z. B. der Dichte oder der Temperatur, ausgleichen (Diffusion, Wärmeleitung usw.). Solche Prozesse, bei denen Systemteile nicht im Gleichgewicht sind, laufen jedoch nur in der Richtung von selbst ab, in der die vorhandenen Unterschiede ausgeglichen werden, d. h. die Diffusion in Richtung der niedrigeren Teilchenkonzentration
oder die Wärmeleitung in Richtung der niedrigeren Temperatur usw.: irreversible Prozesse. Der umgekehrte Prozess, also etwa ein von selbst ablaufender Wärmetransport von einem Wärmespeicher tieferer Temperatur zu einem mit höherer Temperatur wird nicht beobachtet, obwohl er dem 1. Hauptsatz der Thermodynamik, der Energieerhaltung, nicht widersprechen würde. Er ist jedoch bei einem Vielteilchensystem (z. B. einer makroskopischen Gasmenge) extrem unwahrscheinlich. Diese Aussage ist der Inhalt des 2. Hauptsatzes der Thermodynamik: Wärme fließt nie von selbst von einem Körper tieferer Temperatur zu einem Körper höherer Temperatur (Theorem von Clausius, 1850). Eine andere Formulierung des 2. Hauptsatzes stammt von Carnot: Es gibt keine periodisch arbeitende Maschine, die nur einem Körper Wärme entzieht und in Arbeit umwandelt: Unmöglichkeit des perpetuum mobile zweiter Art (auch: Theorem von Thomson). Beide Theoreme sind äquivalent. Dies kann durch den Nachweis gezeigt werden, dass beide Theoreme gegenseitig auseinander folgen. So folgt das Theorem von Thomson aus dem von Clausius: Nimmt man zunächst an, das Theorem von Thomson gelte nicht, dann wäre eine Maschine möglich, die nur bei T 2 Wärme entzieht und dafür Arbeit abgibt (I in Bild 8-28). Die Kombination mit einer (in jedem Falle möglichen) Maschine II, die bei T 1 > T 2 die gleiche Arbeit in Wärme umwandelt (z. B. durch Reibung
B91
B92
B Physik
oder Joule’sche Wärme), ergibt eine Maschine, die ohne Zufuhr von Arbeit Wärme von T 2 nach T 1 > T 2 transportiert (I + II in Bild 8-28), und damit dem Theorem von Clausius widerspricht. Also war die Voraussetzung falsch, dass das Theorem von Thomson nicht gelte. In ähnlicher Weise lässt sich zeigen, dass das Theorem von Clausius aus dem von Thomson folgt. Der 2. Hauptsatz der Thermodynamik ist wie der 1. Hauptsatz eine reine Erfahrungstatsache. Mit seiner Hilfe lässt sich zeigen, dass der Carnot-Kreisprozess den größtmöglichen Wirkungsgrad besitzt. Dazu wird in einem Gedankenexperiment eine Wärmekraftmaschine (I) mit einer Wärmepumpe (II) gekoppelt. Beide sollen zwischen den gleichen Wärmereservoirs arbeiten (Bild 8-29). Die von der Wärmekraftmaschine (I) geleistete Arbeit −W1 werde vollständig dazu verwendet, die Wärmepumpe (II) zu betreiben, d. h., es sei −WI = WII = −W .
(8-104)
Zunächst seien beide Maschinen Carnot-Maschinen mit den Wirkungsgraden (8-101) bzw. (8-103): −WI T 1 − T 2 = Q1, I T1 −Q1, II T1 und ηC, II = = . WII T1 − T2 ηC, I =
(8-105)
Aus den beiden reziproken Wirkungsgraden (8-105) folgt Q1, I = −Q1, II und damit auch −Q2, I = Q2, II . Der Gesamteffekt der beiden gekoppelten CarnotMaschinen ist also null, da den beiden Wärmere-
servoirs die gleichen Wärmemengen entzogen und zugeführt werden. Nun werde angenommen, dass die Wärmekraftmaschine (I) bei gleicher Arbeit −WI einen größeren als den Carnot-Wirkungsgrad habe, also eine „Übercarnot-Maschine“ darstelle: ηÜC, I =
−WI −WI > ηC,1 = . QÜC1, I Q1, I
(8-106)
Damit wird die für die Erzeugung der Arbeit −WI aufgewendete Wärme QÜC1, I kleiner als die entsprechende Wärmemenge Q1, II . Wegen W = |QÜC1, I |−|QÜC2, I | (1. Hauptsatz) gilt dann auch |QÜC2, I | < |Q2, II |. Da nun die durch die Übercarnot-Maschine (I) von T 1 nach T 2 transportierten Wärmen kleiner sind als die durch die Carnot-Maschine (II) von T 2 nach T 1 > T 2 transportierten Wärmen, wäre der Gesamteffekt der beiden gekoppelten Maschinen nicht mehr null, sondern es würde periodisch ohne Arbeitsaufwand Wärme vom Wärmereservoir tieferer Temperatur zum Wärmereservoir höherer Temperatur transportiert werden. Das ist jedoch nach dem 2. Hauptsatz der Thermodynamik (Theorem von Clausius) nicht möglich. Die Voraussetzung, die Existenz einer „Übercarnot-Maschine“, trifft also nicht zu, der Carnot-Wirkungsgrad ist der größtmögliche. Daraus folgt ferner, dass der thermische Wirkungsgrad des Carnot-Prozesses (8-100) für jeden reversibel geführten Kreisprozess zwischen den gleichen Temperaturen gilt. Technische Kreisprozesse sind jedoch mehr oder weniger irreversibel und haben stets einen kleineren Wirkungsgrad als der Carnot-Prozess: ηirr < ηrev =
−W T1 − T2 = . Q1 T1
(8-107)
Für den reversibel geführten Carnot-Prozess gilt nach (8-98) und (8-99) die Energiebilanz −W = Q1 + Q2 mit Q2 < 0. Damit folgt aus (8-106) Q2 T2 =− Q1 T1
Bild 8-29. Effekt der Kopplung einer „ÜbercarnotMaschine“ mit einer Carnot-Maschine
bzw.
Q1 Q2 + =0. T1 T2
(8-108)
Danach sind die reversibel ausgetauschten Wärmen Qi den Temperaturen T i während des Austausches proportional. Die Betrachtung des Carnot-Prozesses hat gezeigt, dass Wärmeenergie bei höherer Temperatur besser nutzbar ist als bei tieferer
8 Statistische Mechanik —Thermodynamik
Temperatur. Ein (reziprokes) Maß für die „Nutzbarkeit“ ist die reduzierte Wärme Q/T . Nach (8-108) ist für reversible Kreisprozesse die Summe der reduzierten Wärmen gleich 0: 0 Qrev dQrev = 0 bzw. =0. (8-109) T T
änderung erfolgt. Das Integral der reduzierten Wärmen bei reversibler Zustandsänderung stellt daher eine Zustandsfunktion dar, die als Entropie S bezeichnet wird. Die differenzielle Entropieänderung dS und die Entropiedifferenz ΔS zwischen zwei Zuständen betragen dann dS =
Bei irreversiblen Kreisprozessen folgt dagegen aus (8-107) 0 Q dQ < 0 bzw. 0
oder S 2 > S 1 .
(8-115)
B93
B94
B Physik
Daraus folgt eine andere Formulierung des 2.Hauptsatzes der Thermodynamik: Entropiesatz: In einem endlichen, abgeschlossenen System nimmt die Entropie stets zu und strebt einem Maximalwert zu. Nur solche Prozesse, bei denen die Entropie wächst, laufen von selbst ab. Beispiele für Entropieänderungen: Entropie des idealen Gases: Besteht die bei einer reversiblen Expansion eines idealen Gases geleistete Arbeit aus Volumenarbeit −dW = p dV, so lautet der 1. Hauptsatz (8-74) dQrev = dU + p dV .
dU + p dV . T
(8-117)
Durch Einsetzen der Zustandsgleichung für die Stoffmenge ν eines idealen Gases (8-26) und von dU = νCmV dT (8-82) ergibt sich nach Integration für die Entropiedifferenz eines idealen Gases zwischen den Zuständen (V1 , T 1 ) und (V2 , T 2 ) ΔS = S2 − S1 = νCmV ln
T2 V2 + νR ln . T1 V1
(8-118)
Sonderfälle: Isochore Zustandsänderung: V2 = V1 = const, d. h., ΔS = νCmV ln
T2 . T1
(8-119)
Isotherme Zustandsänderung: T 2 = T 1 = const, d. h., ΔS = νR ln
V2 . V1
Wärmeleitung: Die Entropiezunahme beim Übergang einer Wärmemenge Q von einem wärmeren Körper der Temperatur T 1 auf einen kälteren Körper der Temperatur T 2 beträgt nach (8-112) ΔS = S2 − S1 =
(8-116)
Mit (8-111) folgt daraus für die Entropieänderung dS =
konstant bleibt (ΔHmu molare Umwandlungsenthalpie, siehe 8.6.2). Die Entropiezunahme (-abnahme) beträgt demnach " 2 1 ΔHmu ΔS = dQrev = ν . (8-121) Tu 1 Tu
(8-120)
Die Entropiezunahme (8-120) gilt auch für die irreversible Expansion eines idealen Gases in das Vakuum (Gay-Lussac-Versuch). Der hierbei ausbleibende Wärmeaustausch mit der Umgebung bedeutet nicht, dass die Entropie konstant bliebe. Phasenübergänge von Stoffen Beim Schmelzen (Erstarren) oder Verdampfen (Kondensieren) der Stoffmenge ν eines Stoffes muss die Umwandlungsenthalpie νΔHmu zugeführt (freigesetzt) werden, wobei die Umwandlungstemperatur T u
Q Q T1 − T2 − =Q . T2 T1 T1T2
(8-122)
Entropie und Wahrscheinlichkeit Wahrscheinlichkeitsbetrachtung: Ein Volumen V2 enthalte 1 mol eines idealen Gases (d. h. NA∗ = NA · (1 mol) = 6,022 . . . · 1023 Moleküle). Die Wahrscheinlichkeit W, dass sich davon ein bestimmtes Molekül in einem bestimmten, kleineren Teilvolumen V1 befinde, ist W1,1 = V1 /V2 . Die Wahrscheinlichkeit dafür, dass sich zwei Moleküle gleichzeitig in V1 befinden, ist W1,2 = (V1 /V2 )2 , usw., entsprechend für alle NA∗ Moleküle in V1 : W1, NA∗ = (V1 /V2 )NA∗ . Wegen der Größe der Avogadro-Konstante NA (siehe 8.1) ist diese Wahrscheinlichkeit sehr klein. Hingegen ist es gewiss, dass sich alle NA∗ Moleküle in V2 befinden: W2, NA∗ = 1. Das Verhältnis der Wahrscheinlichkeiten dafür, dass sich alle Moleküle in V2 bzw. in V1 befinden, ist demnach NA∗ W2, NA∗ V2 = . (8-123) W1, NA∗ V1
Wegen der großen Teilchenzahl NA∗ ist dieses Verhältnis sehr groß. Die Wahrscheinlichkeit dafür, dass sich das Gas gleichmäßig in dem Gesamtvolumen V2 verteilt, ist also außerordentlich viel größer als die Wahrscheinlichkeit, dass es sich in dem kleineren Teilvolumen V1 konzentriert, obwohl dies vom 1. Hauptsatz nicht ausgeschlossen wird. Nur wenn sehr wenige Teilchen vorhanden sind, ist die letztere Wahrscheinlichkeit merklich von null verschieden. Aus (8-123) folgt ln
W2 V2 = NA∗ ln , W1 V1
(8-124)
9 Transporterscheinungen
und weiter aus dem Vergleich mit der Entropieänderung (8-120) bei der Expansion V1 → V2 in das Vakuum und bei Beachtung von R/NA = k ΔS = k ln
W2 , W1
(8-125)
Die folgenden Betrachtungen insbesondere zur Wärmeleitung, Diffusion und Viskosität sind die Grundlage für die weitergehende Behandlung des Energie- und Stofftransports in Abschnitt F 4 und der reibungsbehafteten Strömungen in den Abschnitten E 8.3 und E 8.4.
oder allgemein die Boltzmann-Beziehung S = k ln W .
(8-126)
Die Entropie ist demnach ein Maß für die Wahrscheinlichkeit eines Zustandes. Die Entropie nimmt zu mit steigender Wahrscheinlichkeit des erreichten Zustandes. Prozesse, bei denen der Endzustand wahrscheinlicher ist als der Anfangszustand (ΔS > 0), laufen in abgeschlossenen Systemen von selbst ab (z. B. Diffusion, Wärmeleitung, vgl. 9 Transporterscheinungen). Vorgänge, bei denen ΔS < 0 ist, sind nur unter Energiezufuhr von außen möglich. Auch reversible Prozesse (z. B. Carnot-Prozess) laufen nicht von allein ab, da hier ΔS = 0 bzw. in jedem Stadium Gleichgewicht vorausgesetzt ist.
9 Transporterscheinungen Atome bzw. Moleküle in Gasen, Flüssigkeiten und Festkörpern oder auch elektrische Ladungsträger (Elektronen, Löcher bzw. Defektelektronen, Ionen) in Gasplasmen, Elektrolyten, Halbleitern und Metallen sind nach 8 in ständiger thermischer Bewegung. Ist außerdem ein räumliches Ungleichgewicht vorhanden, z. B. ein Teilchenkonzentrationsgefälle, ein Temperaturgefälle, ein Geschwindigkeitsgefälle oder (bei elektrischen Ladungsträgern) ein elektrisches Potenzialgefälle, so entstehen Ströme von Teilchen, Ladungen usw., die so gerichtet sind, dass das Gefälle (der Gradient) abgebaut wird. Es handelt sich also um irreversible Ausgleichsvorgänge in Vielteilchensystemen, die unter dem gemeinsamen Oberbegriff „Transporterscheinungen“ behandelt werden können. Insbesondere gehören dazu – Diffusion: Transport von Teilchen (Materie), – Wärmeleitung: Transport von Energie, – innere Reibung (Viskosität) bei Strömungen: Transport von Impuls, – elektrische Leitung: Transport von Ladung (siehe 16).
9.1 Stoßquerschnitt, mittlere freie Weglänge Eine wichtige Größe bei Transportvorgängen ist die „mittlere freie Weglänge“ lc , das ist der Weg, der im Mittel von einem Teilchen zwischen zwei Stößen mit anderen Teilchen zurückgelegt werden kann. Sie hängt vor allem vom „Stoßquerschnitt“ ab, der sich beim Modell der starren Kugeln mit endlichem Radius r für die Teilchen wie folgt berechnen lässt: Bewegt sich ein Strom von Teilchen (Radius r1 ) durch ein System von anderen Teilchen (Radius r2 ), so gilt mit R = r1 + r2 und dem Stoßparameter b als Abstand des Mittelpunktes des Teilchens 2 von der ungestörten Bahn des Mittelpunktes des Teilchens 1 (Bild 9-1): Es erfolgt ein Stoß, wenn b < R , kein Stoß, wenn b > R . Stöße erfolgen also dann, wenn innerhalb eines Zylinders vom Radius R = r1 + r2 um die Bewegungsrichtung des stoßenden Teilchens Mittelpunkte anderer Teilchen liegen (Bild 9-2). Die Querschnittsfläche σ dieses Zylinders heißt Stoßquerschnitt oder gaskinetischer Wirkungsquerschnitt: σ = πR2 = π(r1 + r2 )2 bzw. σ = 4πr2
für r1 = r2 = r .
(9-1)
Die mittlere Stoßzahl Z¯ während der Zeit t ergibt sich aus dem vom stoßenden Teilchen mit seinem Stoß-
Bild 9-1. Zum Stoßquerschnitt
B95
B96
B Physik
Bild 9-2. Zur Berechnung der Stoßzahl
querschnitt σ in der Zeit t im Mittel überstrichenen Zylindervolumen der Länge v¯ r t (Bild 9-2) sowie aus der Teilchenzahldichte n: Z¯ = σ¯vr tn ;
(9-2a)
mittlere Stoßfrequenz: νc =
Z¯ = σ¯vr n . t
da v1 · v2 = 0 . (9-3)
Vernachlässigt man den Unterschied zwischen v2 und v2 , so gilt, wenn beide Stoßpartner Teilchen gleicher Sorte sind (¯v1 = v¯ 2 = v¯ ), √ v¯ r ≈ v¯ 2 . (9-4) v¯ kann bei Gasmolekülen aus (8-4) oder näherungsweise aus (8-31) berechnet werden. Damit folgt für die mittlere Flugzeit zwischen zwei Stößen τc =
1 1 = √ νc 2 σ¯vn
bei der statistischen Molekularbewegung
aus den x-Komponenten s x,i der statistischen Einzelversetzungen zwischen jeweils zwei Stößen zusammensetzen (Bild 9-3), bei Z Stößen also:
(9-2b)
Hierin ist v¯ r die mittlere Relativgeschwindigkeit zwischen stoßendem und gestoßenen Teilchen. Da sich auch die gestoßenen Teilchen bewegen, ist v¯ r nicht gleich der mittleren Teilchengeschwindigkeit v¯ , sondern ergibt sich aus den Einzelgeschwindigkeiten v1 und v2 gemäß v2r = (v1 − v2 )2 = v21 + v22 ,
Bild 9-3. Bereich der mittleren quadratischen Verrückung
(9-5)
und für die mittlere freie Weglänge zwischen zwei Stößen 1 1 1 = √ = √ . (9-6) lc = v¯ τc = √ 2 σn 2πR2 n 4 2πr2 n Mittlere quadratische Verrückung: Die statistische thermische Bewegung der Moleküle führt zu einer Versetzung, die sich z. B. in x-Richtung
x=
Z
s x,i .
(9-7)
i=1
Im zeitlichen Mittel wird die Versetzung wegen der statistischen Unabhängigkeit der Einzelversetzungen verschwinden, jedoch wird die Schwankung (Streuung) von x mit der Zeit zunehmen. Für das mittlere Verrückungsquadrat folgt x2 = s2x,i = Zs2x , (9-8) i
da die gemischten Glieder ebenfalls wegen der statistischen Unabhängigkeit der Einzelversetzungen verschwinden. Mit s x = v x τc und mit (8-6) wird aus (9-8) Zs2x ≈ Zv2x τ2c =
1 2 2 v τZ, 3 c
(9-9)
worin τc die mittlere freie Flugdauer zwischen zwei Stößen ist. Wegen Zτc = t ergibt sich schließlich als mittlere quadratische Verrückung näherungsweise 1 2 v τc t . (9-10) 3 √ Der Schwankungsbereich Δx = x2 ∼ t wird also mit der Beobachtungszeit t größer. x2 ≈
9.2 Molekulardiffusion Der durch die thermische Bewegung bewirkte Transport von Atomen und Molekülen in Gasen,
9 Transporterscheinungen
nach (9-11) für die Diffusionsstromdichte j x der markierten Moleküle das Fick’sche Gesetz j x = −Ds
Bild 9-4. Zum Fick’schen Gesetz der Diffusion
Flüssigkeiten und Festkörpern wird Diffusion genannt. Bei der Diffusionsbewegung von Molekülen in einem Stoff, der aus Molekülen derselben Art besteht, spricht man von Eigen- oder Selbstdiffusion, im anderen Falle von Fremddiffusion. Ist ein räumliches Gefälle der Teilchenkonzentration n vorhanden, so führt die Diffusion zu einem gerichteten Massentransport, einem Teilchenstrom in Richtung der geringeren Teilchenkonzentration. Bei einem eindimensionalen Konzentrationsgefälle dn/dx in x-Richtung (Bild 9-4) gilt im stationären (zeitunabhängigen) Fall für die Teilchenstromdichte j das 1. Fick’sche Gesetz j≡
dn dN = −D , A dt dx
(9-11)
dN: effektive Teilchenzahl, die in der Zeit dt durch einen Querschnitt A geht (Bild 9-4). D Diffusionskoeffizient, temperaturabhängig. SI-Einheit:[D] = m2 /s . Selbstdiffusion in Gasen Trotz der hohen mittleren thermischen Geschwindigkeit v¯ (Bild 8-1 und 8-5) geht die Diffusion zweier Gase ineinander verhältnismäßig langsam vonstatten, wie bei farbigen Gasen, z. B. Bromdampf in Luft, leicht beobachtet werden kann. Das liegt an der ständigen Richtungsumlenkung der Moleküle durch Stöße (Bild 9-3) und wird vor allem durch die mittlere freie Weglänge bestimmt. Die Selbstdiffusion von Molekülen in einem Gas gleichartiger Moleküle kann experimentell nur durch Markierung einer Zahl von Molekülen, deren Diffusion verfolgt werden soll, untersucht werden. Die Markierung der Moleküle kann z. B. darin bestehen, dass ihre Atomkerne radioaktiv sind. Ihre Konzentration sei n1 und in x-Richtung ortsabhängig: n1 = n1 (x). Die Gesamtkonzentration n der Moleküle sei jedoch ortsunabhängig. Dann gilt
dn1 , dx
(9-12)
worin Ds der Selbstdiffusionskoeffizient ist. Er lässt sich durch eine Teilchenstrombilanz über die mittlere freie Weglänge berechnen. Im Mittel bewegen sich etwa 1/6 der markierten Moleküle in +x-Richtung und 1/6 in −x-Richtung. Durch eine Querschnittsfläche A an der Stelle x = const (Bild 9-4) bewegen sich in +xRichtung Moleküle, die im Durchschnitt in der Ebene x−lc = const den letzten Stoß erlitten haben und daher eine Teilchenkonzentration n1 (x−lc ) haben (kein Produkt!). Ihre Teilchenstromdichte ist also v¯ n1 (x − lc )/6. Entsprechendes gilt für die −x-Richtung. Die NettoTeilchenstromdichte beträgt daher 1 1 j x = v¯ n1 (x − lc ) − v¯ n1 (x + lc ) 6 6 ∂n1 1 = v¯ −2lc . 6 ∂x
(9-13)
Der Vergleich mit (9-12) liefert für den Selbstdiffusionskoeffizienten 1 (9-14) Ds = v¯ lc . 3 Mit (8-31) und (8-32) und (9-6) folgt daraus 1 kT (kT )3 1 1 1 Ds = √ · = √ · , (9-15) m m 6 nσ 6 pσ d. h., es gilt für T = const:
Ds ∼
1 1 ∼ , n p
(9-16a)
und für p = const:
Ds ∼ T 3/2 .
(9-16b)
Ferner diffundieren leichte Moleküle (z. B. He, H2 ) √ wegen Ds ∼ 1/ m schneller als schwere.
9.3 Wärmeleitung Thermische Energie wird durch Wärmeleitung, durch Konvektion und durch Wärmestrahlung transportiert. Die Wärmestrahlung (Transport von Energie durch
B97
B98
B Physik
elektromagnetische Strahlung) wird in 20.2 behandelt. Konvektion ist die durch unterschiedliche Massendichte als Folge von Temperaturunterschieden in Flüssigkeiten oder Gasen hervorgerufene Auftriebsströmung im Schwerefeld, die hier nicht weiter behandelt wird. Wärmeleitung bezeichnet den Wärmestrom in Materie, der im Gegensatz zur Konvektion nicht durch einen Massenstrom vermittelt wird, sondern durch Weitergabe der thermischen Energie, z. B. in Gasen durch Stoß von Molekül zu Molekül, in Festkörpern über elastische Wellen (Phononen), in Metallen zusätzlich durch Stöße zwischen den Elektronen des quasifreien Leitungselektronengases, in Richtung der niedrigeren Temperatur, d. h. der niedrigeren Energiekonzentration. Bei Vorhandensein eines Temperaturgefälles dT/dz in z-Richtung (Bild 9-5) gilt im stationären Fall für die Wärmestromdichte q analog zum Fick’schen Gesetz der Diffusion das Fourier’sche Gesetz q≡
dT dQ = −λ . A dt dz
(9-17)
(dQ Wärmemenge, die in der Zeit dt effektiv durch einen Querschnitt A geht (Bild 9-5), λ Wärmeleitfähigkeit), Werte für die Wärmeleitfähigkeit von Werkstoffen siehe Tabelle D 9-5. SI-Einheit: [λ] = J/(s · m · K) = W/(m · K) . Für einen homogenen Zylinder der Länge l folgt aus (9-17) für den Wärmestrom Φ bei einer Temperaturdifferenz ΔT = T 1 − T 2 (in Analogie zum Ohm’schen Gesetz des elektrischen Stromes, vgl. 12-6) das sog. Ohm’sche Gesetz der Wärmeleitung Φ=
dQ ΔT = dt Rth
Bild 9-5. Zum Fourier’schen Gesetz der Wärmeleitung
mit dem Wärmewiderstand Rth =
l . λA
(9-18)
Wärmeleitung in Gasen Die Wärmeleitfähigkeit von Gasen kann in ähnlicher Weise wie der Selbstdiffusionskoeffizient durch eine Wärmestrombilanz über die mittlere freie Weglänge berechnet werden. Im Mittel bewegen sich 1/6 der Moleküle in +z-Richtung und 1/6 in −z-Richtung. Durch eine Querschnittsfläche A an der Stelle z = const (Bild 9-5) bewegen sich in +z-Richtung Moleküle, die im Durchschnitt in der Ebene z − lc = const den letzten Stoß erlitten haben und daher eine mittlere thermische Energie ε(z ¯ − lc ) haben (kein Produkt!). Die zugehörige Wärmestromdichte ist also v¯ nε(z−l ¯ c )/6. Entsprechendes gilt für die −z-Richtung. Für die Netto-Wärmestromdichte folgt daher analog zu (9-13) ∂ε¯ ∂ε¯ ∂T 1 1 · . (9-19) qz = v¯ n −2lc = − v¯ nlc 6 ∂z 3 ∂T ∂z Der Vergleich mit (9-17) liefert für die Wärmeleitfähigkeit von Gasen 1 ∂ε¯ v¯ nlc . (9-20) 3 ∂T ∂ε/∂T ¯ ist die Wärmekapazität bei konstantem Volumen pro Molekül, siehe 8.6.1. Sie hängt von der Zahl der angeregten Freiheitsgrade ab. Für einatomige Gase ist gemäß (8-28) die mittlere thermische Energie pro Molekül ε¯ = 3 kT/2 und damit die Wärmeleitfähigkeit einatomiger Gase λ=
λ=
1 kv¯ nlc . 2
(9-21)
Da nach (9-6) die mittlere freie Weglänge lc ∼n−1 ∼p−1 ist, bleibt die Wärmeleitfähigkeit von Gasen unabhängig vom Druck p. Wenn jedoch bei niedrigen Drücken die mittlere freie Weglänge größer als die Dimension d des Vakuumgefäßes wird, in dem das Gas eingeschlossen ist, so ist in (9-20) und (9-21) lc durch d (= const) zu ersetzen. In diesem Druckbereich wird die Wärmeleitfähigkeit wegen des verbleibenden Faktors n proportional zum Druck (Anwendung im Pirani-Manometer). Sowohl v¯ als auch lc nehmen mit steigender Molekülmasse bzw. -größe ab. Daher ist die Wärmeleitfähigkeit für leichte Atome bzw. Moleküle größer als für
9 Transporterscheinungen
schwere. Dieser Effekt wird z. B. für Gasdetektoren zum Nachweis von Wasserstoff (im Stadtgas enthalten) ausgenutzt.
9.4 Innere Reibung: Viskosität Bei strömenden Flüssigkeiten und Gasen tritt neben dem Massentransport der Strömung noch ein weiteres Transportphänomen auf, bei dem die transportierte Größe nicht so deutlich zutage liegt: Die Viskosität (Zähigkeit) als Folge der inneren Reibung, die zu beobachten ist, wenn benachbarte Schichten des Mediums unterschiedliche Strömungsgeschwindigkeiten v haben, also ein Geschwindigkeitsgefälle vorhanden ist. Molekularkinetisch lässt sich die innere Reibung als Impulstransport quer zur Strömungsrichtung deuten. Durch die thermische Bewegung der Moleküle tauschen benachbarte, mit unterschiedlicher Geschwindigkeit strömende Flüssigkeitsschichten Moleküle aus (Bild 9-6). Dadurch gelangen aus der langsamer strömenden Schicht Moleküle mit entsprechend niedrigem Strömungsimpuls in die benachbarte, schneller strömende Schicht und erniedrigen damit dort die mittlere Strömungsgeschwindigkeit. In umgekehrter Richtung gelangen Moleküle mit höherem Strömungsimpuls aus der schneller strömenden in die langsamer strömende Schicht und erhöhen dort die mittlere Strömungsgeschwindigkeit. Um die ursprüngliche Geschwindigkeitsdifferenz aufrecht zu erhalten und die Wirkung des Impulsaustausches zu kompensieren, muss daher eine dementsprechende Schubspannung τ x angewendet werden. Die Impulsstromdichte j xz , d. h. der auf Fläche und Zeit bezogene, effektiv in z-Richtung transportierte Strömungsimpuls, ist nach dem Newton’schen Kraftgesetz (3-5) gleich der erzeugten Schub- oder
Bild 9-6. Impulstransport senkrecht zur Strömungsrichtung
bei viskoser Strömung
Scherspannung τ x : j xz ≡
dp x = τx . A dt
(9-22)
Andererseits ist die Impulsstromdichte analog zu den schon behandelten Transportvorgängen proportional zum Geschwindigkeitsgefälle dv x /dz anzusetzen: j xz ∼ −
dv x . dz
(9-23)
Aus (9-22) und (9-23) folgt das Newton’sche Reibungsgesetz der viskosen Strömung: τ x = −η
dv x . dz
(9-24)
η dynamische Viskosität (früher auch Zähigkeit) SI-Einheit : [η] = N · s/m2 = Pa · s . Bis 1977 gültige CGS-Einheit : 1 Poise = 1 P = 1 g/(cm · s) = 0,1 Pa · s . Üblich : 1 cP = 1 mPa · s . Gelegentlich wird auch die auf die Dichte bezogene kinematische Viskosität ν = η/ benutzt. Flüssigkeiten, für die der Ansatz (9-24) streng gilt, werden Newton’sche bzw. rein oder linear viskose Flüssigkeiten genannt (vgl. E 7.2). Die Viskosität ist stark temperaturabhängig (Motorenöle!). Bei manchen zähen Medien hängt die Viskosität auch von der Geschwindigkeit v ab: η steigt (Honig, spezielle Polymerkitte) oder sinkt mit v (Margarine, thixotrope Farben). Viskosität von Gasen
In analoger Weise wie bei der Selbstdiffusion und bei der Wärmeleitung von Gasen kann die Viskosität von Gasen mithilfe der obigen Vorstellung des thermischen Impulstransportes senkrecht zur Strömungsrichtung durch eine Impulsstrombilanz über die mittlere freie Weglänge berechnet werden. Im Mittel bewegen sich 1/6 der Moleküle thermisch in +z-Richtung und 1/6 in −z-Richtung. Durch eine Ebene z = const (Bild 9-6) bewegen sich in +z-Richtung Moleküle (Teilchenstromdichte n¯v/6; v¯ mittlere thermische Geschwindigkeit), die im Durchschnitt in der Ebene z − λc = const den letzten
B99
B100
B Physik
Stoß erlitten haben und daher einen Strömungsimpuls mv x (z − λc ) haben. Die mit diesem Teilchenstrom in +z-Richtung verbundene Impulsstromdichte ist also n¯vmv x (z − λc )/6. Entsprechendes gilt für die −zRichtung. Für die Netto-Impulsstromdichte senkrecht zur Strömungsrichtung folgt daher analog zu (9-13) und (9-19) ∂v x 1 (9-25) j xz = n¯vm −2lc . 6 ∂z Der Vergleich mit (9-24) ergibt für die dynamische Viskosität von Gasen 1 (9-26) η = n¯vmlc . 3 Da lc ∼n−1 ∼p−1 ist, ist die Viskosität von Gasen ebenso wie die Wärmeleitfähigkeit √unabhängig vom Druck p, steigt aber wegen v¯ ∼ T mit der Temperatur an. Auch hier gilt die Einschränkung, dass die Unabhängigkeit vom Druck nur so lange zutrifft, wie die mittlere freie Weglänge klein gegen die Abstände der begrenzenden Flächen ist. Für sehr kleine Gasdrücke geht dagegen die Viskosität nach null. Zum anderen gilt für alle drei Transportkoeffizienten für Gase, dass die obigen Herleitungen nur gelten, solange die mittlere freie Weglänge groß gegen den Molekülradius ist, sodass nur Zweiteilchenstöße eine Rolle spielen. Trifft dies nicht mehr zu, etwa bei Flüssigkeiten, so sind die oben abgeleiteten Ausdrücke für die Transportkoeffizienten nicht mehr richtig. Beispielsweise nimmt die Viskosität bei Flüssigkeiten mit steigender Temperatur nicht zu (wie bei Gasen), sondern ab. Für den Quotienten aus Wärmeleitfähigkeit und Viskosität von Gasen ergibt sich aus (9-21) und (9-26) nach Erweiterung mit der Avogadro-Konstanten NA und unter Berücksichtigung von (8-43), (8-83) sowie von kNA = R und mNA = M λ CmV = , (9-27) η M die experimentell näherungsweise bestätigt wird. Abweichungen ergeben sich vor allem bei der Wärmeleitfähigkeit dadurch, dass bei der Ableitung in 9.3 die Verteilung der Molekülgeschwindigkeiten nicht berücksichtigt wurde, obwohl die schnellen Moleküle in der Verteilung für die Wärmeleitung besonders wichtig sind.
Laminare Strömung viskoser Flüssigkeiten an festen Grenzflächen
Strömungen ohne Wirbelbildung, bei denen die einzelnen Flüssigkeitsschichten sich nebeneinander bewegen, und die vorwiegend durch die Viskosität der Flüssigkeit bestimmt sind, werden laminare oder schlichte Strömungen genannt. Bei viskosen Strömungen entlang festen Grenzflächen kann angenommen werden, dass die an die festen Flächen angrenzenden Flüssigkeitsschichten an diesen haften. Für eine Flüssigkeitsschicht der Dicke D zwischen zwei Platten mit Lineardimensionen L D bildet sich nach (9-24) ein lineares Geschwindigkeitsgefälle aus, wenn die eine Platte parallel zur anderen mit einer Geschwindigkeit v0 bewegt wird (Bild 9-7, siehe auch E 8.3.4). Aus (9-24) folgt für die zur Aufrechterhaltung der Geschwindigkeit v0 der oberen Platte gegen die Reibungskraft FR = −F notwendige Schubkraft F = τ x A F = ηA
v0 . D
(9-28)
Bei einer gemäß Bild 9-7 bewegten Platte der Fläche A mit Abmessungen L (z. B. Schleppkahn der Länge L), die vergleichbar oder kleiner als D sind, wird die Dicke der Schicht mit etwa linearem Geschwindigkeitsgefälle begrenzt sein. Die bewegte Platte schleppt dann eine Grenzschicht mit sich, deren Dicke δ sich nach Prandtl mit folgender Überlegung abschätzen lässt: Für eine vorwiegend durch Reibung kontrollierte Strömung lässt sich annehmen, dass die Reibungsarbeit WR größer als die kinetische Energie Ek der bewegten Flüssigkeit ist. Um eine Platte der Fläche A um ihre eigene Länge L zu verschieben, muss die Reibungsarbeit WR = ηA
v0 L δ
(9-29)
Bild 9-7. Lineares Geschwindigkeitsgefälle in einem fluiden Medium zwischen zwei gegeneinander bewegten Grenzflächen
9 Transporterscheinungen
aufgebracht werden. Die kinetische Energie der mitbewegten Flüssigkeitsmenge lässt sich durch Integration über alle schichtförmigen Massenelemente dm =
A dz mit der Geschwindigkeit v = v0 z/δ zwischen z = 0 und z = δ bestimmen zu Ek =
1 A δv20 . 6
Bild 9-8. Laminare Strömung durch ein Rohr
(9-30)
Aus der Bedingung WR > Ek folgt dann für die Dicke der Grenzschicht der laminaren Strömung 8 ηL . (9-31) δ< 6
v0 Außerhalb der Grenzschicht kann die Strömung in erster Näherung als ungestört (im betrachteten Falle also als ruhend) angenommen werden. Mit steigender Geschwindigkeit v0 nimmt die Dicke der Grenzschicht ab. Zur Abschätzung des Strömungswiderstandes eines Schiffes oder eines Flugzeuges der Länge L kann angenommen werden, dass der umströmte Körper von einer Grenzschicht der Dicke δ ≈ (ηL/ v0 )0,5 umgeben ist, innerhalb der die Strömungsgeschwindigkeit sich von v0 etwa linear auf 0 ändert (vgl E 8.3.6). Die Grenzschicht spielt eine wichtige Rolle bei realen Strömungen, wo sie die Bereiche angenähert idealer Strömung mit der Grenzbedingung der viskosen Strömung verknüpft, dass die unmittelbar an einem umströmten Körper angrenzende Flüssigkeit an diesem haftet (siehe 10.2). Auch Rohrströmungen lassen sich mithilfe des Newton’schen Reibungsgesetzes (9-24) berechnen (siehe auch E 8.3.4): Die durch die Viskosität bei an der Rohrwand haftender Flüssigkeit auftretende Reibungskraft muss im stationären Fall durch ein Druckgefälle Δp = p1 − p2 überwunden werden. Durch Integration von (9-24) ergibt sich ein parabelförmiges Strömungsgeschwindigkeitsprofil (Bild 9-8): v=
Δp 2 (R − r2 ) . 4ηl
die demnach halb so groß ist wie die sich aus (9-32) für r = 0 ergebende maximale Strömungsgeschwindigkeit. Daraus erhält man das in der Zeit t durch das Rohr strömende Flüssigkeitsvolumen, den Volumendurchsatz Q=
πΔpR4 V = , t 8ηl
(9-34)
das Gesetz von Hagen und Poiseuille , das durch den starken Anstieg mit der 4. Potenz des Rohrradius R gekennzeichenet ist. Aus der Druckdifferenz Δp in (9-33) lässt sich der Reibungswiderstand bestimmen: FR = −8πηl¯vRohr .
(9-35)
Der Druckabfall in einem Rohr mit konstantem Querschnitt ist daher proportional zur Länge, wie sich experimentell leicht mittels Steigrohrmanometern zeigen lässt (Bild 9-9). Bei der laminaren Umströmung einer Kugel durch eine viskose Flüssigkeit möge die Strömungsgeschwindigkeit im ungestörten Bereich v betragen. Die an die Kugeloberfläche angrenzende Flüssigkeitsschicht haftet an der Kugel, wodurch in einem Störungsbereich der Größenordnung r ein Geschwindigkeitsgefälle dv/dz ≈ v/r auftritt (Bild 9-10). An der Oberflä-
(9-32)
Die über die Querschnittsfläche des Rohres gemittelte Strömungsgeschwindigkeit ergibt sich aus (9-32) zu v¯ Rohr =
Δp 2 R , 8ηl
(9-33)
Bild 9-9. Linearer Druckabfall in einem Rohr mit konstantem Querschnitt
B101
B102
B Physik
Bild 9-10. Viskose Umströmung einer Kugel
che 4πr2 der Kugel greift also nach (9-28) eine Reibungskraft FR ≈ η4πr2
v = 4πηrv r
(9-36)
an, die durch eine entgegengesetzte äußere Kraft gleichen Betrages kompensiert werden muss, um die Kugel am Ort zu halten (Bild 9-10). Da die Kugel in ihrer Umgebung den Strömungsquerschnitt für die Flüssigkeit einengt, ist in der Realität die Strömungsgeschwindigkeit in der Nachbarschaft der Kugel größer (Kontinuitätsgleichung, siehe 10.1), d. h., direkt angrenzend an die Kugel ist das Geschwindigkeitsgefälle größer als für (9-36) angenommen wurde. Die exakte, aufwändigere Theorie liefert daher einen etwas größeren Wert (vgl. E 8.3.4): FR = 6πηrv
(9-37)
(Stokes’sches Widerstandsgesetz für die Kugel). Laminare und turbulente Rohrströmung
Anstelle der laminaren Hagen-Poiseuille-Strömung (9-32) kann in einem Rohr auch ein anderer Strömungszustand auftreten, der durch unregelmäßige makroskopische Geschwindigkeitsschwankungen quer zur Hauptströmungsrichtung gekennzeichnet ist: Turbulenz. Reynolds hat dies durch Anfärbung eines Stromfadens in einer Rohrströmung gezeigt (Bild 9-11, siehe auch E 8.3.5): Laminare Strömung: Bei niedrigen mittleren Strömungsgeschwindigkeiten v¯ Rohr strömt die Flüssigkeit in Schichten, die sich nicht vermischen. Turbulente Strömung: Wird bei steigender Strömungsgeschwindigkeit ein Grenzwert v¯ crit überschritten, so überlagern sich unregelmäßige Schwankungen, benachbarte Schichten verwirbeln sich, die Strömung wird stärker vermischt. Das Strömungs-
Bild 9-11. Reynolds’scher Strömungsversuch: a laminare und b turbulente Strömung
profil ändert sich von einem parabolischen bei der laminaren Strömung zu einem ausgeglicheneren bei der turbulenten Strömung, bei der nur in der Nähe der Wand die Strömungsgeschwindigkeit stark abfällt (Bild 9-11), siehe auch E 8.3.5. Der Umschlagpunkt zwischen laminarer und turbulenter Strömung hängt nicht nur von der Strömungsgeschwindigkeit v¯ Rohr , sondern auch vom Radius R und von der kinematischen Viskosität ν = η/ in der Weise ab, dass die dimensionslose Kombination dieser drei Größen ein Kriterium für den Strömungszustand darstellt (siehe auch E 8.3.2), die sog. ReynoldsZahl v¯ Rohr R ¯vRohr R Re ≡ = . (9-38) ν η Für andere Strömungsgeometrien muss der Rohrradius R durch eine andere charakteristische Länge L ersetzt werden. Damit lautet das Reynolds’sche Turbulenzkriterium: Re < Recrit : laminare Strömung ,
(9-39)
Re > Recrit : turbulente Strömung . Die kritische Reynolds-Zahl Recrit muss experimentell bestimmt werden. Für die Rohrströmung gilt Recrit ≈ 1200. Bei besonders sorgfältiger Vermeidung jeglicher Strömungsstörungen sind jedoch
10 Hydro- und Aerodynamik
auch wesentlich höhere kritische Reynolds-Zahlen möglich. Die Reynolds-Zahl Re bestimmt ferner das Ähnlichkeitsgesetz für Strömungen (siehe 10.2). Das Reynolds’sche Kriterium lässt sich anschaulich begründen aus dem Verhältnis zwischen Trägheitseinfluss (kinetische Energie ∼ v2 ) und Viskositätseinfluss (Reibungsarbeit ∼ ηv/R): Bei Störungen der laminaren Strömung treten Druckänderungen aufgrund des Trägheitseinflusses (Bernoulli-Gleichung, siehe 10.1) auf, die die Störung verstärken. Die allein trägheitsbestimmte Strömung ist daher instabil. Dem wirkt jedoch die Viskosität entgegen. Das Einsetzen der Turbulenz hängt danach vom Verhältnis der beiden Einflüsse ab, d. h. von
v2
Rv Trägheitseinfluss ∼ = = Re . Reibungseinfluss ηv/R η
(9-40)
Nach dem Umschlag zur Turbulenz wächst der Strömungswiderstand nicht mehr linear zur Strömungsgeschwindigkeit v an, wie bei der laminaren Strömung (z. B. (9-35) oder (9-37)) sondern mit v2 (siehe 10.2), also wesentlich stärker. Turbulente Strömung muss also dort vermieden werden, wo es auf minimalen Strömungswiderstand ankommt (Blutkreislauf, Pipelines). Bei Heizungs- oder Kühlröhren ist dagegen Turbulenz erwünscht wegen des besseren Wärmeaustausches zwischen Flüssigkeit und Wand.
10 Hydro- und Aerodynamik In der Hydro- bzw. Aerodynamik werden die Bewegungsgesetze von Flüssigkeiten und Gasen, d. h. der sogenannten Fluide behandelt, sowie die Wechselwirkung der strömenden Fluide mit umströmten festen Körpern oder mit berandenden festen Wänden. Die Fluide werden dabei als kontinuierliche Medien betrachtet, die den verfügbaren Raum erfüllen. Flüssigkeiten und Gase unterscheiden sich im Sinne der Hydrodynamik lediglich durch die Druckabhängigkeit ihrer Dichte: Flüssigkeiten sind praktisch inkompressibel (z. B. Wasser ca. 4% Volumenverringerung bei Druckerhöhung um 1000 bar), bei Gasen ist die Dichte eine Funktion des Druckes. Für jedes Massenelement gilt die Newton’sche Bewegungsgleichung (3-4) bzw. (3-5), wonach die Beschleunigung aus der Summe der angreifenden Kräfte resultiert. Dazu zählen
– Volumenkräfte, das sind äußere Kräfte, die dem Volumen (der Masse) des Flüssigkeitselementes proportional sind (z. B. Schwerkraft), – Druckkräfte, die auf ein Flüssigkeitselement durch benachbarte Elemente infolge eines Druckgefälles ausgeübt werden, und die senkrecht auf die Oberfläche des betrachteten Elementes wirken, – Reibungskräfte, die tangential zur Oberfläche des betrachteten Flüssigkeitselementes wirken (Schubbzw. Scherkräfte, siehe 9.4). Unter Berücksichtigung dieser Anteile erhält man aus der Newton’schen Bewegungsgleichung die NavierStokes’schen Gleichungen (vgl. E 8.3.1, E 8.3.3). Hier sollen nur einige Sonderfälle betrachtet werden, bei denen zum leichteren Verständnis der Grundphänomene und zur Vereinfachung bestimmte Vernachlässigungen vorgenommen werden: 1. Laminare Strömungen: Hier werden äußere Volumenkräfte und Massenträgheitskräfte vernachlässigt. Das Strömungsverhalten wird allein durch die Reibungskräfte bestimmt. Die stationäre viskose Strömung wurde bereits in 9.4 behandelt. 2. Turbulente Strömungen: Hier sind die Massenträgheitskräfte von größerem Einfluss als die Reibungskräfte, siehe 9.4, Reynolds-Kriterium. Über einzelne Aspekte der Wirbelbildung siehe 10.2. 3. Strömungen idealer Flüssigkeiten: Hier werden die Reibungskräfte vernachlässigt. Auf diesen Fall lassen sich viele Gesetze der Potenzialtheorie übertragen: Potenzialströmung = wirbel- und quellenfreie Strömung. Potenzialströmungen in inkompressiblen Medien lassen sich beliebig überlagern. Aus den Navier-Stokes’schen Gleichungen werden dann die Euler’schen Bewegungsgleichungen (siehe E 8.2.2). Durch Integration der Euler’schen Bewegungsgleichung längs einer Stromlinie erhält man die Bernoulli-Gleichung, die sich auch aus einfachen Grundannahmen herleiten lässt und viele Strömungsphänomene erklärt (10.1). Über die Änderungen, die durch die Viskosität bei der Beschreibung von Strömungen realer Flüssigkeiten bedingt sind, siehe 10.2. Das Strömungsfeld kann durch Stromlinien und durch Bahnlinien beschrieben werden. Die Tangenten der Stromlinien geben die Geometrie des Geschwindigkeitsfeldes wieder. Die Bahnlinien beschreiben den
B103
B104
B Physik
Bei einem im Schwerefeld geneigt stehenden Rohr muss außerdem die Änderung der potenziellen Energie mgz aufgebracht werden, wodurch als weiteres Glied in (10-4) der hydrostatische Druck gz auftritt. Die Druckbilanz für jeden Punkt einer Stromlinie lautet damit (Bernoulli-Gleichung) Bild 10-1. Zur Herleitung der Kontinuitätsgleichung und
der Bernoulli-Gleichung
Weg der einzelnen Flüssigkeitselemente. Für stationäre Strömungen sind Strom und Bahnlinien identisch (E 8.1.1). Sie können in Flüssigkeiten durch Anfärben oder in Gasen mittels Rauchinjektionen sichtbar gemacht werden.
10.1 Strömungen idealer Flüssigkeiten Um bestimmte Gesetzmäßigkeiten strömender Flüssigkeiten einfacher zu erkennen, werde zunächst von der Reibung, d. h. von der Viskosität ganz abgesehen und die stationäre Strömung einer idealen Flüssigkeit der Dichte durch ein Rohr mit örtlich variablem Querschnitt A betrachtet (Bild 10-1). Für den stationären Zustand fordert die Massenerhaltung, dass der Massendurchsatz für jeden Querschnitt (z. B. für A1 und A2 ) gleich ist, sofern zwischen A1 und A2 keine Quellen oder Senken vorhanden sind. Daraus folgt die Kontinuitätsgleichung
1 A1 v1 = 2 A2 v2
(10-1)
und für inkompressible Flüssigkeiten ( 1 = 2 = ) A1 v1 = A2 v2
bzw.
ΔV1 = ΔV2 = ΔV .
(10-2)
In engeren Querschnitten ist also die Strömungsgeschwindigkeit größer als in weiten Querschnitten. Zwischen A1 und A2 findet daher eine Beschleunigung, eine Erhöhung der kinetischen Energie Ek statt, die durch ein Druckgefälle mit p1 > p2 bewirkt werden muss. Die Arbeit ΔW, die dabei zur Beschleunigung aufgewandt werden muss, beträgt unter Berücksichtigung der Kontinuitätsgleichung (10-2) ΔW = F1 Δx1 − F2 Δx2 = (p1 − p2 )ΔV .
(10-3)
Der Energiesatz ΔW = Ek2 −Ek1 liefert dann mit (4-8) und (10-3) entlang einer Stromlinie: 1 1 p1 + v21 = p2 + v22 = const . 2 2
(10-4)
1 p + v2 + gz = const = ptot . 2
(10-5)
Entlang einer Stromlinie ist die Summe aus statischem Druck p, dynamischem Druck (Staudruck) pdyn = v2 /2 und Schweredruck
gz konstant und gleich dem Gesamtdruck ptot . (Die Koordinate z kann auch durch –h ersetzt werden, wenn h die Tiefe unter der Flüssigkeitsoberfläche darstellt.) Obwohl für inkompressible ideale Flüssigkeiten hergeleitet, gilt die Bernoulli-Gleichung näherungsweise auch für reale Flüssigkeiten, und in Grenzen auch für Gase, da deren Kompressibilität sich erst für Strömungsgeschwindigkeiten in der Nähe der Schallgeschwindigkeit erheblich bemerkbar macht. Längs einer Stromlinie gilt sie sowohl für wirbelfreie als auch für wirbelhafte Strömungen. Der Gesamtdruck ptot ist jedoch nur bei wirbelfreien Strömungen für alle Stromlinien gleich. Die Messung von Gesamtdruck ptot , statischem Druck p und dynamischem (Stau-)Druck pdyn = v2 /2 lässt sich z. B. mit U-Rohr-Manometern durchführen (vgl. E 8.1.3). Dabei wird der Gesamtdruck gemessen, wenn die Strömung senkrecht auf die Messöffnung trifft und v = 0 wird (Pitotrohr, Bild E 8.6c), der statische Druck, wenn die Messöffnung tangential an einer Stelle ungestörter Strömung liegt (Druckmesssonde, Bild E 8-6b). Die Differenz dieser beiden Drucke ergibt den dynamischen Druck und wird mit dem Prandtl’schen Staurohr gemessen (Bild E 8-6d, Anwendung: Geschwindigkeitsbestimmung). Einige Beispiele für die Anwendung der BernoulliGleichung (weitere in E 8.1.3): Ausfluss aus einem Druckgefäß
Die Ausflussgeschwindigkeit v aus einer engen Öffnung (Querschnitt A) eines Gefäßes, in dem durch einen Kolben (Querschnitt AK ) ein Überdruck Δp gegenüber dem Außendruck pa aufrechterhalten wird (Bild 10-2), lässt sich mithilfe des Energiesatzes oder
10 Hydro- und Aerodynamik
Bild 10-2. Ausströmung aus einem Druckgefäß
einfacher aus der Bernoulli-Gleichung berechnen. Aufgrund der Kontinuitätsgleichung (10-2) und wegen AK A kann die Strömungsgeschwindigkeit in Kolbennähe vernachlässigt werden. Für eine Stromlinie, die in Kolbennähe (1: statischer Druck p1 = pa + Δp) beginnt und durch die Ausflussöffnung (2: statischer Druck p2 = pa ) geht, gilt dann nach Bernoulli (10-4) 8 2Δp 1 2 . (10-6) pa + Δp = pa + v bzw. v = 2
Für zwei verschiedene Gase bei gleichem Druck und gleicher Temperatur folgt aus der allgemeinen Gasgleichung (8-26) und mit Vm = M/ , dass die molare Masse M ∼ ist. Aus (10-6) ergibt sich damit v1
2 M2 = = . (10-7) v2
1 M1 Anwendung: Effusiometer von Bunsen zur Molmassenbestimmung. Wird der Druck im Gefäß nicht durch einen Kolben erzeugt, sondern durch die Schwerkraft (Bild E 8-8), so muss Δp in (10-6) durch den hydrostatischen Druck g ersetzt werden: (10-8) v = 2gh , d. h., bei Vernachlässigung der Viskosität strömt die Flüssigkeit in der Tiefe h unter der Flüssigkeitsoberfläche aus einer Öffnung mit der gleichen Geschwindigkeit aus, als ob sie die Strecke h frei durchfallen hätte, vgl. (4-26): Torricelli’sches Ausströmgesetz, vgl. E 8.1.3.
durch Steigrohrmanometer zeigen (Bild 10-3), wobei bei realen Flüssigkeiten der lineare Druckabfall aufgrund der inneren Reibung überlagert ist (Bild 9-9). Sieht man in der unmittelbaren Nachbarschaft der Verengung vom Druckabfall durch die innere Reibung ab, so ergibt sich aus der Bernoulli’schen Gleichung (10-4) für die lokale Druckerniedrigung 1 Δp = p0 − pe = v2e − v20 ⎡ 22 ⎤ ⎥⎥ 1 2 ⎢⎢⎢⎢ A0 = v0 ⎢⎣ − 1⎥⎥⎥⎦ . 2 Ae Für Ae A0 folgt daraus 2 1 2 A0 pe ≈ p0 − v0 , 2 Ae
(10-10)
d. h., bei genügend großem Querschnittsverhältnis A0 /Ae kann der statische Druck pe in der Verengung auch kleiner als der Außendruck pa werden. Dann verschwindet die Flüssigkeitssäule über der Verengung (Bild 10-3) völlig und es entsteht ein Unterdruck, das Steigrohr saugt aus der Umgebung Gas oder Flüssigkeit an, es wirkt als Pumpe. Das ist das Prinzip der Wasser- und Dampfstrahlpumpen, der Zerstäuber und Spritzpistolen, des Bunsenbrenners usw. Eine Differenzmessung der statischen Drücke in und außerhalb der Verengung z. B. mit einem U-Rohrmanometer erlaubt mit (10-9) auch die Bestimmung der Strömungsgeschwindigkeit v0 im Rohr: Venturirohr (vgl. E 8.1.3, Bild E 8-7). Kavitation
Sinkt bei einer Strömung durch eine Rohrverengung (oder bei einem sehr schnell durch eine Flüssigkeit bewegten Körper) der statische Druck pe lokal unter den Dampfdruck der Flüssigkeit pd (siehe 8.4),
Strömung durch Querschnittsverengungen
In Querschnittseinschnürungen von Rohren (A0 → Ae ) erhöht sich nach der Kontinuitätsgleichung (10-2) die Strömungsgeschwindigkeit von v0 auf ve = v0 A0 /Ae . Infolgedessen ist nach der Bernoulli-Gleichung dort der statische Druck pe geringer als im Normalquerschnitt des Rohres (p0 ). Dies lässt sich experimentell
(10-9)
Bild 10-3. Druckerniedrigung in Rohrverengung
B105
B106
B Physik
so treten Dampfblasen auf, die in dahinterliegenden Strömungsbereichen mit höherem Druck implosionsartig wieder in sich zusammenfallen. Die entstehenden Druckstöße führen zu Zerstörungen angrenzender Oberflächen (Schiffsschrauben, Turbinen). Zur Vermeidung der Kavitation muss die Bedingung
pe = ptot − v2e > pd 2
(10-11)
eingehalten werden. Daraus ergibt sich als kritische Geschwindigkeit, oberhalb der Kavitation auftritt, 8 2(ptot − pd ) . (10-12) vcrit =
Wandkräfte in Strömungen Der statische Druck p0 in freien Strömungen ist etwa gleich dem Druck pa des umgebenden, ruhenden Mediums. Wird eine solche Strömung durch Wände eingeengt, so hat der dadurch dort verringerte statische Druck pe oft unerwartete Kräfte auf die strömungsbegrenzenden Wände zur Folge. Wird z. B. eine Strömung durch bewegliche, gewölbte Flächen eingeengt (Bild 10-4), so entsteht eine Druckdifferenz Δp zwischen dem verringerten statischen Druck pe und dem
Bild 10-4. Seitenkräfte auf strömungseinengende Flächen
Bild 10-5. Hydrodynamisches Paradoxon
äußeren Druck pa , wodurch die beiden Wände zusammengetrieben werden. Solche unerwarteten Seitenkräfte sind z. B. bei nebeneinander mit hoher Geschwindigkeit fahrenden Kraftfahrzeugen zu beachten. Ähnlich unerwartet ist der als hydrodynamisches Paradoxon bezeichnete Effekt: Ein Gas- oder Flüssigkeitsstrahl, der aus einem Rohr gegen eine quergestellte, bewegliche Platte strömt (Bild 10-5), drückt diese nicht weg, sondern zieht sie im Gegenteil sogar an, weil die im zentralen Bereich hohe Strömungsgeschwindigkeit einen kleineren statischen Druck pi erzeugt als die geringe Strömungsgeschwindigkeit am Rande, wo der dort höhere statische Druck p0 etwa dem Außendruck pa entspricht. Im zentralen Bereich entsteht daher eine Druckdifferenz Δp = pa − pi , die die bewegliche Platte auf die Rohröffnung zutreibt. Umströmte Körper in idealer Flüssigkeit
Bei der Umströmung eines Körpers, der symmetrisch zu einer Ebene parallel zu den ungestörten Stromlinien geformt ist (Kugel, Zylinder, Platte quer oder längs usw., Bilder 10-6 und 10-7), weichen die Stromlinien symmetrisch zu dieser Ebene aus. Die Stromlinie, die die Trennungslinie zwischen den beiden Strömungsbereichen darstellt, die den Körper auf entgegengesetzten Seiten umströmen, heißt Staulinie. Sie stößt auf der Anströmseite senkrecht auf die Körperoberfläche und startet auf der Rückseite ebenfalls senkrecht von der Körperoberfläche (Bild 10-6). An diesen Stellen, den Staupunkten, ist die Strömungsgeschwindigkeit v = 0, der dynamische Druck verschwindet demzufolge, und der statische Druck pstat wird gleich dem Gesamtdruck ptot : p = pstat = ptot . Am Äquator (Kugel, Bild 10-6) ist hingegen die Strömungsgeschwin-
Bild 10-6. Umströmung einer Kugel (ähnlich Zylinder)
10 Hydro- und Aerodynamik
Bild 10-7. Symmetrische und unsymmetrische Umströ-
mung einer Platte
digkeit maximal und der statische Druck päq ein Minimum, kleiner als der statische Druck p0 im ungestörten Strömungsbereich. Bei symmetrischer Umströmung liegen die Staupunkte gegenüber, ebenso die Stellen niedrigsten Druckes. Die Druck- und Kraftverteilung ist daher vollständig symmetrisch, die resultierende Kraft auf den umströmten Körper verschwindet. Das heißt, symmetrisch geformte und orientierte Körper erfahren in einer Strömung einer idealen Flüssigkeit keine resultierende Kraft, bzw. sie lassen sich widerstandslos durch eine ideale Flüssigkeit ziehen. Dieses im Widerspruch zur Erfahrung bei realen Flüssigkeiten stehende Ergebnis muss deshalb modifiziert werden (siehe 10.2). Bei unsymmetrisch geformten und/oder orientierten Körpern, z. B. einer schräg in der Strömung orientierten Platte (Bild 10-7), verschieben sich die Staupunkte gegeneinander. Die aus der Asymmetrie folgende Druckverteilung bewirkt das Auftreten eines resultierenden Kräftepaars und damit eines Drehmomentes, das den Körper soweit dreht, bis das Drehmoment verschwindet, d. h. die Platte senkrecht zur Strömung orientiert ist. Dieser Effekt lässt sich zur Bestimmung der Teilchengeschwindigkeit in Longitudinalwellen (Schallschnelle) durch Messen des Drehmomentes ausnutzen (RayleighScheibe). Wirbel in idealen Flüssigkeiten
Wirbel sind rotierende Flüssigkeitsbewegungen mit in sich geschlossenen Stromlinien. Sie bestehen aus einem Wirbelkern mit dem Radius r0 , in dem im Idealfall (Rankine-Wirbel) die Flüssigkeit wie ein fester Körper mit einheitlicher Winkelgeschwindigkeit ω rotiert. Er ist umgeben von einer sog. Zirkulationsströmung, in der die Geschwindigkeit nach außen abnimmt, z. B. umgekehrt proportional
Bild 10-8. Aufbau eines Wirbels
zum Abstand r von der Wirbelachse (Bild 10-8, siehe auch E 8.1.3): r < r0: v = ωr ,
Wirbelkern :
Zirkulationsströmung : r > r0: v =
(10-13)
k ωr02 = . r r (10-14)
Das Produkt aus Querschnittsfläche A = πr02 des Wirbelkerns und seiner Winkelgeschwindigkeit ω heißt Wirbelintensität :
J = Aω = πωr02 .
(10-15)
Eine Größe, die eine Aussage über Wirbelzustände in einer Strömung macht, ist die Zirkulation 0 v · ds . (10-16) Γ≡ C
Schließt der Integrationsweg auch Wirbelkerne oder Teile davon ein, so ist die Zirkulation Γ 0. Das trifft z. B. auch für viskose laminare Strömungen zu, etwa bei Bild 9-7. Solche Strömungen sind also wirbelbehaftet. Dagegen ist die Zirkulation in Strömungen idealer Flüssigkeiten außerhalb von Wirbelkernen null, wenn der Integrationsweg den Wirbelkern nicht umschließt, also auch in der Zirkulationsströmung, die den Wirbelkern umgibt. Die Aussage Γ = 0 ist gleichbedeutend mit der Aussage, dass die Rotation von v (vgl. A 17.3) verschwindet (rot v = 0). Eine solche Strömung wird daher als wirbelfrei oder rotationsfrei bezeichnet. Da man sie dann mit Methoden der Potenzialtheorie beschreiben kann, wird sie auch Potenzialströmung genannt. Wird die Zirkulation längs einer Linie gebildet, die den Wirbelkern vollständig umschließt, z. B. längs ei-
B107
B108
B Physik
nes Kreises mit r > r0 (Bild 10-8), so ergibt sich mit (10-15) die doppelte Wirbelintensität: 0 v · ds = 2Δωr02 = 2J . (10-17) Γ= C
Der Zirkulationsbegriff ist wichtig zur Beschreibung von Kräften auf umströmte Körper, die quer zur Strömungsrichtung wirken (Magnus-Effekt, Flugauftrieb usw., siehe E 8.2.4). Auf Helmholtz gehen die folgenden allgemeinen Aussagen über Wirbelströmungen in idealen Flüssigkeiten zurück (Helmholtz’sche Wirbelsätze): 1. Satz von der räumlichen Konstanz der Wirbelintensität: Die Zirkulation Γ ist für jeden Querschnitt A senkrecht zur Wirbelachse konstant. Im Innern der Flüssigkeit können daher keine Wirbel beginnen oder enden: Wirbelachsen enden stets an Grenzflächen der Flüssigkeit (Wände, freie Oberflächen) oder sind in sich geschlossen (Wirbelringe). 2. Eine Wirbelröhre besteht dauernd aus denselben Flüssigkeitsteilchen: Wirbel haften an der Materie. 3. Satz von der zeitlichen Konstanz der Wirbelintensität: Die Zirkulation einer Wirbelröhre bleibt zeitlich konstant. In idealer, reibungsfreier Flüssigkeit können daher Wirbel weder entstehen noch verschwinden. Die Wirbelsätze gelten angenähert auch für Fluide mit geringer Viskosität (z. B. für die Atmosphäre). Ändert sich der Wirbelquerschnitt A örtlich oder zeitlich, so ändert sich wegen der Konstanz der Wirbelintensität die Winkelgeschwindigkeit ω gemäß (10-15) und (10-17) umgekehrt proportional zu A. Die Einschnürung eines atmosphärischen Tiefdruckwirbels kann daher zu sehr hohen Windstärken führen.
Flüssigkeit an der Wand bzw. dem Körper haftet. Am Beispiel der umströmten Kugel zeigte sich im Falle der idealen Flüssigkeit (η = 0), dass am Kugeläquator die Strömungsgeschwindigkeit nach Bernoulli besonders hoch ist (10.1, Bild 10-6). Im Falle der viskosen Umströmung (siehe 9.4) ist hier dagegen wie an jedem anderen Oberflächenpunkt die Strömungsgeschwindigkeit 0! Dieser Widerspruch löst sich nach Prandtl durch Berücksichtigung der Viskosität innerhalb einer Grenzschicht (siehe 9.4), in der die lokale Strömungsgeschwindigkeit von null an der Wand bzw. am Körper mit steigendem Abstand anfangs etwa linear bis auf den Wert in der daran angrenzenden Potenzialströmung ansteigt (Bild 10-9). Die Dicke dieser Grenzschicht kann nach (9-31) abgeschätzt werden. Sie ist umso dünner, je kleiner die Viskosität und je größer die Strömungsgeschwindigkeit in der Potenzialströmung ist. Die Änderung der Strömungsverhältnisse beim Übergang von der reibungsfreien, idealen Strömung zur Strömung in einer realen (nicht zu zähen) Flüssigkeit sei am Beispiel der Zylinderumströmung betrachtet (Bild 10-10). Auf der Anströmseite entspricht das Strömungsbild qualitativ demjenigen der Potenzialströmung (ähnlich Bild 10-6), wobei zusätzlich die viskose Grenzschicht zwischen der Zylinderoberfläche und der Potenzialströmung anzunehmen ist. Ein Flüssigkeitselement, das dicht an der Staulinie entlangströmt und in die Grenzschicht gelangt, wird von dem Druckgefälle zwischen Staupunkt und dem Punkt maximaler Strömungsverdrängung beschleunigt. Aufgrund der Viskosität in der Grenzschicht erreicht es jedoch nicht die kinetische Energie, die erforderlich wäre, um das Flüssigkeitselement gegen den Druckanstieg
10.2 Strömungen realer Flüssigkeiten Strömungen realer Flüssigkeiten können näherungsweise umso besser durch die BernoulliGleichung (10-4) oder (10-5) als Strömung idealer Flüssigkeiten beschrieben werden, je kleiner die dynamische Viskosität η ist. Diese Näherung versagt jedoch in der unmittelbaren Nachbarschaft einer angrenzenden Wand oder eines umströmten Körpers wegen der Grenzbedingung der viskosen Strömung, wonach die unmittelbar angrenzende
Bild 10-9. Prandtl’sche Grenzschicht als Übergang zwi-
schen viskoser Wandhaftung und idealer Strömung
10 Hydro- und Aerodynamik
Bild 10-11. Widerstandsbeiwerte verschiedener Strömungs-
körper
Bild 10-10. Umströmung eines Zylinders in einer realen
Flüssigkeit
auf der Rückseite des Zylinders wieder bis in die Nähe des hinteren Staupunktes zu bringen, es kommt vielmehr schon vorher zur Ruhe bzw. wird von weiter außen liegenden Stromfäden mitgenommen: Grenzschichtablösung (siehe auch E 8.3.6). Die abgelösten Grenzschichten auf beiden Seiten umschließen das Totwassergebiet direkt hinter dem umströmten Körper, in dem die Bernoulli-Gleichung nicht angewandt werden kann. Zwischen Totwasser und äußerer Potenzialströmung bilden sich Wirbel aus, wobei mit zunehmender Reynolds-Zahl (9-38) sich zunächst zwei Wirbel entgegengesetzten Drehsinns (Drehimpulserhaltung) hinter dem Körper ausbilden. Bei höheren Reynolds-Zahlen werden diese Wirbel abwechselnd von der Strömung mitgenommen, es entsteht die Kármán’sche Wirbelstraße (Bild 10-10). Die Wirbel sorgen auch für einen Druckausgleich zwischen dem statischen Druck p0 der ungestörten Strömung und der hinteren, an das Totwasser angrenzenden Körperoberfläche. Auf der Anströmseite herrscht dagegen der Gesamtdruck Ptot der Potenzialströmung, sodass auf einen beliebigen umströmten Körper eine maximale Druckdifferenz 1 (10-18) Δp = ptot − p0 = v20 2 wirkt, die zu einer Widerstandskraft 1 FW = cW AΔp = cW A v20 (10-19) 2 führt (siehe auch E 8.4.2). Hierin ist A die der Strömung dargebotene Querschnittsfläche des Körpers und cW ein dimensionsloser Widerstandsbeiwert, der von der Form des umströmten Körpers abhängt (Bild 10-11). Er berücksichtigt einerseits, dass der statische Druck auf der Anströmseite nur am Staupunkt gleich dem Gesamtdruck ist, und anderer-
seits die von der Körperform abhängige Stärke der Wirbelbildung, deren Energie der Strömungsenergie entnommen werden muss und ebenfalls zu einem Strömungswiderstandsanteil führt. Bei gleichem Querschnitt A ist der Strömungswiderstand am kleinsten, wenn die Wirbelbildung unterdrückt wird. Dies kann dadurch geschehen, dass das Totwasserund Wirbelgebiet durch den Körper selbst ausgefüllt wird: „Stromlinienkörper“. Hierfür ist daher der Widerstandsbeiwert besonders klein (Bild 10-11; weitere Werte in Tabelle E 8-2). Im Gegensatz zur linearen Abhängigkeit des Strömungswiderstandes von der Geschwindigkeit bei der laminaren Strömung für kleine v0 , (9-28), (9-35) und (9-37), ist nach (10-19) bei der turbulenten Strömung für größere v0 der Strömungswiderstand proportional zum Quadrat der Strömungsgeschwindigkeit. Hydrodynamisch ähnliche Strömungen
Die exakte Berechnung des Strömungswiderstandes ist bereits bei einfachen Körpern mathematisch extrem aufwändig, sodass Strömungswiderstände im Allgemeinen experimentell bestimmt werden müssen. Bei extremen Abmessungen der zu untersuchenden Körper (Flugzeuge, Schiffe, Kühltürme) müssen solche Messungen an verkleinerten Modellen durchgeführt werden. Die geometrische Ähnlichkeit zwischen Original- und Modellkörper reicht jedoch hinsichtlich des Strömungsverhaltens noch nicht. Es müssen auch die auftretenden Energieformen (kinetische Energie, Reibungsarbeit) bei der Originalströmung und bei der Modellströmung im gleichen Verhältnis zueinander stehen. Dieses Verhältnis wird aber gerade durch die Reynolds-Zahl (9-38) gekennzeichnet. Daher gilt: Zwei Strömungsvorgänge sind hydrodynamisch ähnlich, wenn ihre Reynolds-Zahlen
Lv Re = (10-20) η gleich sind. L ist hierin eine charakteristische Länge der Strömungsgeometrie, etwa der Rohrradius bei der
B109
B110
B Physik
Strömung durch ein Rohr oder der Kugelradius bei der Kugelumströmung. Setzt man beispielsweise für die Reibungskraft bei der laminaren Kugelumströmung gemäß (9-37) formal die Beziehung (10-19) an, so erhält man aus dem Vergleich (L = r = Kugelradius) für den Widerstandsbeiwert der Kugel
12 η = . (10-21)
rv Re Da ähnliche Strömungen gleiche Reynolds-Zahlen haben, haben sie nach (10-21) auch gleiche Widerstandsbeiwerte. Das gilt nicht nur für die Kugel. Eine ausführlichere Behandlung der Strömungsmechanik findet sich in E 7-10. cW = 12
II. Wechselwirkungen und Felder Im Teil BI über Teilchen und Teilchensysteme wurden die Bewegungsgesetze von Teilchen und Teilchensystemen unter der Einwirkung von Kräften (allgemeiner: Wechselwirkungen) behandelt, ohne die Art dieser Kräfte und ihre Quellen genauer zu untersuchen. Das soll in diesem Teil II geschehen.
Übersicht über die fundamentalen Wechselwirkungen Nach dem Stand unseres Wissens lassen sich alle bekannten Kräfte auf vier fundamentale Wechselwirkungen zurückführen: Gravitationswechselwirkung: Sie wirkt zwischen Massen und manifestiert sich z. B. in der Planetenbewegung und in der Gewichtskraft (siehe 3.2.1). Obwohl die schwächste der bekannten Wechselwirkungen (Tabelle 11-0), ist sie als erste quantitativ untersucht worden (Fallgesetze, Kepler-Gesetze, Newton’sches Gravitationsgesetz). Das Kraftgesetz F ∼ r−2 (siehe 11.3) hat eine unendliche Reichweite zur Folge. Elektromagnetische Wechselwirkung: Sie wirkt zwischen elektrischen Ladungen und ist die heute am besten verstandene Wechselwirkung. Chemische und biologische Prozesse, die Struktur kondensierter Materie, der überwiegende Teil der Technik beruhen auf elektromagnetischen Wechselwirkungen zwischen Elektronen und Atomkernen und zwischen Atomen untereinander. Das Kraftgesetz (Coulomb-Gesetz, siehe 12.1) zeigt, wie bei der Gravitation, die Abstandsabhängigkeit F ∼ r−2 , die wiederum zu einer unendlichen Reichweite führt.
Starke Wechselwirkung oder Kernwechselwirkung: Sie ist verantwortlich für die Bindungskräfte zwischen den Teilchen im Atomkern (Protonen, Neutronen: Nukleonen, siehe 17). Sie ist die Grundlage der Kernenergie und damit auch Ursache der Strahlungsenergie der Sonne. Die Reichweite der Kernkräfte ist von der Größenordnung des Kernradius. Schwache Wechselwirkung: Leptonen (Elektronen, Positronen, siehe 17.5) zeigen keine starke Wechselwirkung, sondern eine um 14 Größenordnungen schwächere Wechselwirkung. Die schwache Wechselwirkung ist maßgebend bei Umwandlungen von Elementarteilchen, u. a. beim β-Zerfall, bei dem ein Neutron n ein Elektron e− und ein Antineutrino ν¯ e emittiert und sich in ein Proton p verwandelt, siehe (17-16). Der schwache Prozess (17-29), bei dem aus zwei Protonen ein Deuteron d (Deuteriumkern 2 D+ ), ein Positron e+ und ein Neutrino νe entstehen, steuert den Brennzyklus der Sonne, insbesondere deren gleichmäßiges und langsames Brennen. Die Reichweite der schwachen Wechselwirkung ist noch geringer als die der Kernkräfte. Bei der Gravitationswechselwirkung und bei der elektromagnetischen Wechselwirkung können sich wegen der bis ins Unendliche gehenden Reichweite die Kräfte vieler Teilchen zu makroskopisch messbaren Kräften überlagern. Bei der starken und bei der schwachen Wechselwirkung ist das nicht möglich, da diese kaum über das erzeugende Teilchen hinausreichen. Das Kraftgesetz kann hier nur durch Teilchensonden (Streuexperimente, siehe 16.1.1) erschlossen werden.
11 Gravitationswechselwirkung
Tabelle 11-0. Die fundamentalen Wechselwirkungen
Wechselwirkung Gravitationswechselwirkung
Reichweite ∞
relative Stärke 10−38
elektromagnetische Wechselwirkung
∞
10−2
starke Wechselwirkung
10−16 . . . 10−15 m
schwache Wechselwirkung
< 10−16 m
10−14
11 Gravitationswechselwirkung 11.1 Der Feldbegriff Die Kraftgesetze für die Gravitationswechselwirkung zwischen zwei Punktmassen (Newton’sches Gravitationsgesetz, 11.3) oder für die elektrische Wechselwirkung zwischen zwei Punktladungen (CoulombGesetz, 12.1) sind typische Fernwirkungsgesetze, die keine Aussagen über die Vermittlung der Kraft machen. Nach der Nahwirkungstheorie (Faraday) geschieht hingegen die Kraftvermittlung mithilfe des Feldbegriffes: Eine Punktmasse oder eine elektrische Ladung verändern den umgebenden Raum, indem sie ein (Gravitations- oder ein elektrisches) Feld erzeugen. Eine zweite Masse oder Ladung erfährt dann eine Kraft, die sich aus der lokalen Stärke des Feldes am Ort der zweiten Masse oder Ladung ergibt: Feldstärke. Im Falle der Gravitation ergibt sich die Kraft F in diesem Bild aus der Masse m und der Gravitationsfeldstärke A am Ort der Masse: F = mA .
(11-1)
Die räumliche Richtungsverteilung der Kraft bzw. der Feldstärke in einem solchen Vektorfeld lässt
Bild 11-1. Feldliniendarstellung eines Kraftfeldes, das von
einer Punktquelle ausgeht
1
Beispiel Kräfte zwischen Himmelskörpern, z. B. Planetenbewegung Kräfte zwischen Ladungen, z. B. im Atom, im Molekül, in Festkörpern Kräfte zwischen Nukleonen, z. B. im Atomkern Wechselwirkungen zwischen Elementarteilchen, z. B. beim Betazerfall
sich besonders anschaulich durch das Feldlinienbild beschreiben: Kraftlinien oder Feldlinien sind Raumkurven, deren Tangenten an jeder Stelle P mit der Richtung der Kraft F bzw. des Feldstärkevektors A an dieser Stelle übereinstimmt (Bild 11-1).
11.2 Planetenbewegung: Kepler-Gesetze Die Beobachtung der Gestirnbahnen und insbesondere der Planetenbahnen durch den Menschen favorisierte das geozentrische Weltsystem (Aristoteles, 384–322 v. Chr.), das die zentrale Stellung der Erde auch philosophisch festlegte. Eine einigermaßen genaue Beschreibung der Planetenbahnen war in diesem System allerdings nur durch komplizierte Epizykloiden möglich (Ptolemäus, um 100–160 n. Chr.). Eine einfachere Beschreibung der Planetenbahnen gelang Kopernikus (1473–1543) durch Einführung des heliozentrischen Weltsystems, dessen Ursprünge auf Heraklid (4. Jh. v. Chr.) und Aristarch von Samos (3. Jh. v. Chr.) zurückgehen. Danach ließen sich die Planetenbahnen näherungsweise auf Kreisbahnen um die Sonne zurückführen. Gestützt auf die astronomischen Beobachtungen von Kopernikus und vor allem auf die noch ohne Fernrohr durchgeführten, sehr sorgfältigen Messungen von Tycho Brahe (1546–1601) konnte Kepler (1571–1630) drei empirische Gesetzmäßigkeiten über die Bewegung der Planeten gewinnen, die Kepler’schen Gesetze: 1. Kepler’sches Gesetz (Astronomia nova, 1609): Die Planetenbahnen sind Ellipsen, in deren gemeinsamen Brennpunkt die Sonne steht (Bild 11-2a).
B111
B112
B Physik
Bild 11-3. Zum Flächensatz (2. Kepler-Gesetz)
Der Flächensatz ist daher eine Folge der Drehimpulserhaltung.
11.3 Newton’sches Gravitationsgesetz
Bild 11-2. Kepler-Gesetze: a 1. über die Planetenbahnen, b 2. über den Flächensatz, c 3. über die Umlaufzeiten
2. Kepler’sches Gesetz (Astronomia nova, 1609): Der Radiusvektor r des Planeten überstreicht in gleichen Zeiten Δt gleiche Flächen ΔS (Flächensatz) (Bild 11-2b): dS = const . dt
(11-2)
3. Kepler’sches Gesetz (Harmonices mundi, 1619): Die Quadrate der Umlaufzeiten T i der Planeten verhalten sich wie die Kuben ihrer großen Bahnhalbachsen ai (Bild 11-2c): T 12 T 22
=
a31 a32
oder T i2 = const · a3i ,
(11-3)
Kepler hatte bereits die Vorstellung einer Anziehungskraft zwischen Planeten und Sonne entwickelt, die die Planeten entgegen ihrer Trägheit auf Ellipsenbahnen hält, und den Namen Gravitation hierfür eingeführt. Für den Fall der kreisförmigen Planetenbahn lässt sich die Gravitationskraft leicht aus den Kepler’schen Gesetzen (siehe 11.2) herleiten: Wegen der Gültigkeit des Flächensatzes (2. Kepler’sches Gesetz), d. h. der Drehimpulserhaltung, handelt es sich um eine Zentralkraft (vgl. 3.8). Die Zentripetalkraft auf den Planeten der Masse m in der Kreisbahn (Sonderfall des 1. Kepler’schen Gesetzes) mit dem Radius r Fg = mω2 r =
4π2 mr T2
(11-5)
wird durch die Gravitationsanziehung ausgeübt (Bild 11-4). Mit dem 3. Kepler’schen Gesetz (11-3) und a = r folgt daraus Fg = const
m , r2
(11-6)
wobei die Konstante für alle Planeten einer Sonne der Masse M gleich ist (vgl. 11.2). Nach dem Reaktionsgesetz (3-11) ziehen sich die Massen M und m
wobei die Konstante für alle Planeten derselben Sonne gleich ist. Das vom Radiusvektor r in der Zeit dt überstrichenen Flächenelement ist dS = r × dr/2 (Bild 11-3). Der Drehimpuls L des Planeten der Masse m lässt sich damit ausdrücken durch die Flächengeschwindigkeit dS/dt: dS dr . (11-4) = 2m L = r × (mv) = m r × dt dt
Bild 11-4. Zur Herleitung des Newton’schen Gravitations-
gesetzes
11 Gravitationswechselwirkung
Gravitationsfeldstärke A (11-1) in jedem Punkt angeben. Der Vergleich von (11-1) mit dem Newton’schen Kraftgesetz (3-4) zeigt, dass im Falle der Gravitation die Feldstärke gleich der durch sie bewirkten Gravitationsbeschleunigung ag auf eine Punktmasse m ist: Fg = ag , m SI-Einheit: [A] = [ag ] = m/s2 . A≡
Bild 11-5. Gravitationsdrehwaage nach Cavendish. Die Massen M können in zwei symmetrische Positionen gebracht werden
gegenseitig an, sodass Fg auch ∼M sein muss. Aus (11-6) folgt dann in vektorieller Schreibweise das Newton’sche Gravitationsgesetz Fg = −G
Mm 0 r , r2
(11-7)
r0 Einsvektor in Richtung des Radiusvektor (Bild 11-4). G = (6,67428 ± 0,00067) · 10−11 N · m2 /kg2 Gravitationskonstante. Newton hat 1665 gezeigt, dass aus dem Kraftgesetz F ∼ r−2 (11-7) die elliptischen Umlaufbahnen des 1. Kepler’schen Gesetzes folgen, siehe 11.5 (Philosophiae naturalis principia mathematica, 1687). Die Gravitationskonstante G selbst ist nicht aus den Planetenbewegungen bestimmbar, sondern nur GM. Sie muss deshalb durch die direkte Messung der Anziehungskraft zwischen zwei bekannten Massen bestimmt werden. Obwohl die Gravitationsanziehung zwischen zwei wägbaren Massen außerordentlich klein ist, sodass sie normalerweise nicht bemerkt wird, kann sie mit der Drehwaage nach Cavendish (1798) gemessen werden (Bild 11-5). Im Prinzip wird dabei die Beschleunigung a einer kleinen Masse m infolge der Massenanziehung durch eine größere Masse M im Abstand r mithilfe eines langen Lichtzeigers gemessen und daraus die Gravitationskraft bestimmt.
11.4 Das Gravitationsfeld Die Geometrie eines Gravitationsfeldes lässt sich durch Feldlinien beschreiben, die die Richtung der
(11-8)
Aus dieser Definition von A und dem Gravitationsgesetz (11-7) folgt für die von einer Punktmasse M erzeugte Gravitationsfeldstärke A = ag = −G
M 0 r . r2
(11-9)
Dieselbe Gravitationsfeldstärke herrscht im Außenraum einer kugelsymmetrischen, ausgedehnten Masse M vom Radius R, die demnach für r > R dieselbe Gravitationsfeldstärke oder -beschleunigung erzeugt wie eine gleich große Punktmasse im Abstand r. Dies wird später im analogen Fall der homogen elektrisch geladenen Kugel gezeigt (12.2). Eine näherungsweise kugelsymmetrische Massenverteilung wie die Erde (Masse ME , Erdradius RE = 6371 km) zeigt daher an der Erdoberfläche eine Gravitationsbeschleunigung ag = A = −G
ME 0 r = g, R2E
(11-10)
die den Betrag der Fallbeschleunigung g ≈ 9,81 m/s2 hat. Aus (11-10) folgt dann sofort für die Masse der Erde (ohne Atmosphäre) die Abschätzung ME =
gR2E = 5,9675 · 1024 kg . G
(11-11)
(Als richtiger Wert gilt (IAU, 1984) ME = 5,9742 · 1024 kg). Aufgrund der Kenntnis der Gravitationskonstante G kann auch die Masse anderer Himmelskörper aus dem Abstand r und der Umlaufzeit T ihrer Satelliten bestimmt werden, z. B. im System Sonne – Planet oder Planet – Mond. Einige Daten unseres Sonnensystems zeigt Tabelle 11-1. Für Kreisbahnen folgt aus Fg = G
Mm 4π2 2 = mrω = mr r2 T2
(11-12)
B113
B114
B Physik
erforderlich. Längs eines geschlossenen Weges s1 + s2 (Bild 11-7) muss dagegen die Arbeit null sein, da anderenfalls beim Herumführen einer Masse auf einer geschlossenen Bahn ohne Zustandsänderung des Feldes Arbeit gewonnen werden könnte (Verstoß gegen den Energieerhaltungssatz), d. h., 0 (11-17) A · dr = 0 .
Bild 11-6. Gravitationsfeldstärke bzw. -beschleunigung in-
nerhalb und außerhalb der als homogen angenommenen Erdkugel
s1
für die Masse des Zentralkörpers (M m) 4π2 r3 . (11-13) M= GT 2 Aus (11-9) und (11-11) ergibt sich ferner für den Betrag der Gravitationsfeldstärke bzw. -beschleunigung in größerer Entfernung r vom Erdmittelpunkt R2E ME = g für r > RE . (11-14) r2 r2 Es lässt sich zeigen, dass Massen im Innern einer homogen mit Masse erfüllten Kugelschale keine Kraft erfahren, da sich die Gravitationswirkungen aller Massenelemente der Kugelschale im Inneren gegenseitig aufheben. Die Gravitationsfeldstärke an einer Stelle r im Innern einer Vollkugel (Bild 11-6), z. B. der Erde, ergibt sich daher allein aus der Gravitationswirkung der Masse m = 4πr3 /3 innerhalb des Radius r (konstante Dichte angenommen): Aa = a g = G
Ai = a g =
4 ME π Gr = G 3 r 3 RE
f u¨ r
Aus (11-17) folgt weiter, dass die Arbeit längs zweier verschiedener Wege s1 und −s2 zwischen 1 und 2 gleich ist, da " " A · dr = A · dr (11-18) −s2
d. h., die Arbeit im Gravitationsfeld ist unabhängig vom Wege: die Gravitationskraft ist eine konservative Kraft (vgl. 4.2). W12 hängt daher nur von r1 und r2 ab. Analog zu 4.2 lässt sich dann eine nur vom Ort abhängige potenzielle Energie Ep (r) so angeben, dass die für die Verschiebung aufzuwendende Arbeit als Differenz zweier potenzieller Energien darzustellen ist: W12 = Ep (r2 ) − Ep (r1 ) .
(11-19)
Da nach (11-16) die Größe der bewegten Masse m in die potenzielle Energie eingeht, ist es sinnvoll, die massenunabhängige Größe des Gravitationspotenzials Vg (r) einzuführen: Ep (r) (11-20) m 2 2 SI-Einheit: [Vg ] = J/kg = m /s .
Vg (r) ≡
r < RE . (11-15)
Gravitationspotenzial und potenzielle Energie Zur Bewegung einer Masse m in einem Gravitationsfeld A(r) von r1 nach r2 (Bild 11-7) gegen die Feldkraft Fg ist eine Arbeit "2 W12 = −
"2 Fg · dr = −m
1
A · dr 1
(11-16)
Bild 11-7. Zur Arbeit bei Verschiebung einer Masse im Gra-
vitationsfeld
11 Gravitationswechselwirkung
Die Arbeit W12 gemäß (11-16) für die Verschiebung der Masse m von r1 nach r2 lässt sich mit (11-20) auch durch eine Potenzialdifferenz ausdrücken: "2 W12 = −m
Für das Gravitationspotenzial der Erde ergibt sich aus (11-11), (11-14) und (11-22) nach Integration Vg (r) = −G
A · dr = m[Vg (r2 ) − Vg (r1 )] . (11-21) 1
Da es zur Berechnung der Arbeit oder der Feldstärke (bzw. der Kraft) stets nur auf Differenzen der potenziellen Energie (11-19) und (11-24) oder des Potenzials (11-21) und (11-23) ankommt, kann der Nullpunkt der potenziellen Energie bzw. des Potenzials frei gewählt werden. Bei Zentralfeldern ist es üblich, den Nullpunkt in die Entfernung r2 = ∞ zu legen, d. h., Ep (∞) = 0 und Vg (∞) = 0. Dann folgt aus (11-21) für das Gravitationspotenzial an der Stelle r W∞r =− Vg (r) = m
gR2 ME =− E , r r
(11-26)
und daraus an der Erdoberfläche, r = RE , Vg (RE ) = −gRE .
(11-27)
Die Arbeit im Gravitationsfeld der Erde ist nach (11-21) mit (11-26) 1 1 1 1 W12 = GME m − − = mgR2E . r1 r2 r1 r2 (11-28) Die Beziehungen (11-26) bis (11-28) gelten sinngemäß auch für andere Himmelskörper.
"r A · dr
(11-22)
∞
als auf die Masse bezogene Verschiebungsarbeit aus dem Unendlichen an die Stelle r bzw. als Wegintegral der Gravitationsfeldstärke. Die Umkehrung des Zusammenhanges (11-22) zwischen Gravitationspotenzial und -feldstärke lautet (vgl. 4.2) A = −grad Vg (r) .
(11-23)
Durch Multiplikation mit der Masse m folgt daraus mit (11-1) und (11-13) der bereits bekannte Zusammenhang (4-16) zwischen Kraft und potenzieller Energie (11-24) Fg = −grad Ep (r) . Aus dem differenziell geschriebenen Zusammenhang (11-22) (11-25) dVg (r) = −A · dr folgt, dass Flächen, die überall senkrecht zur Gravitationsfeldstärke sind, Flächen konstanten Gravitationspotenzials (Äquipotenzialflächen) darstellen, weil Wegelemente dr, die in solchen Flächen liegen, stets senkrecht zu A sind. Aus (11-25) folgt dann weiter dVg (r) = 0, d. h., Vg (r) = const: Äquipotenzialflächen stehen senkrecht auf Feldlinien. Potenzialflächen kugelsymmetrischer Massen sind demnach konzentrische Kugelflächen.
Fluchtgeschwindigkeit Wird einem Körper (z. B. einem Raumfahrzeug) in der Nähe der Erdoberfläche r ≈ RE eine kinetische Energie erteilt, die ausreicht, um die Arbeit (11-28) WR∞ = m[Vg (∞) − Vg (RE )] m = Ek (RE ) = v2f 2
(11-29)
gegen die Gravitationsanziehung zu leisten, so bewegt er sich ohne weiteren Antrieb bis r → ∞. Die dazu erforderliche Geschwindigkeit ergibt sich aus (11-27) und (11-29) unter Beachtung von Vg (∞) = 0 zu vf = 2gRE ≈ 11,2 km/s ≈ 40 200 km/h , (11-30) Fluchtgeschwindigkeit der Erde oder 2. astronautische Geschwindigkeit genannt (vgl. 11.5, (11-49)).
11.5 Satellitenbahnen im Zentralfeld Im Folgenden soll die Bahngleichung der Bewegung eines Körpers der Masse m im Feld einer ruhenden Zentralmasse M (m), d. h. unter Einwirkung einer Zentralkraft, berechnet werden. Übergang zu Polarkoordinaten ergibt für die Geschwindigkeit (Bild 11-8) v = ϕ˙ × r + r˙ r0 v = r˙ + r ϕ˙ . 2
2
2 2
und daraus (11-31)
B115
B116
B Physik
Bild 11-8. Zur Berechnung der Geschwindigkeit in Polar-
koordinaten
Bild 11-9. Zur Geometrie der Ellipse.
Der bei Zentralkräften geltende Drehimpulserhaltungssatz liefert L = mr2 ϕ˙ = const und daraus L dt . dϕ = mr2 Der Energieerhaltungssatz lautet mit und (11-32)
(11-32)
(11-31)
m L2 + Ep = const . (11-33) E = Ek + Ep = r˙2 + 2 2mr2 Durch Auflösen nach dt und Ersetzen durch dϕ aus (11-32) erhält man die allgemeine Bahngleichung in Polarkoordinaten für die Bewegung im Zentralfeld: " L/r2 ϕ(r) = dr + const .
2m(E − Ep ) − (L/r)2 (11-34) Im vorliegenden Fall einer Zentralkraft von der allgemeinen Form Γ (11-35) F = − 2 r0 , r wie sie bei der Gravitationskraft (Γ = GMm) oder bei der Coulomb-Kraft (Γ = −Qq/4πε0, siehe 11-12) zutrifft, hat entsprechend 11.4 die potenzielle Energie die Form Γ (11-36) Ep = − . r Nach Einsetzen von Ep in die allgemeine Bahngleichung (11-34) und Anwendung der Substitution 1/r = −w und dr = r2 dw lässt sich die Integration ausführen mit dem Ergebnis L2 1− ϕ(r) = arcsin mΓr + const . 2EL2 1+ mΓ 2 Durch Einführung der Abkürzungen
b halr+r = 2a Definition der Ellipse, a halbe Hauptachse, √ be Nebenachse, F1 , F2 Brennpunkte, e = a2 − b2 Brennweite, ε = e/a < 1 Exzentrizität, p = b2 /a Bahnparameter, Ra = p Hauptachsenscheitel-Krümmungsradius, Rb = a2 /b Nebenachsenscheitel-Krümmungsradius
(11-37)
L2 p= mΓ
und ε =
1+
2EL2 mΓ 2
(11-38)
und geeignete Wahl des Nullpunktes für ϕ ergibt sich schließlich aus (11-37) als Bahngleichung die Polarkoordinatendarstellung eines Kegelschnittes r=
p 1 − ε cos ϕ
(11-39)
mit der Exzentrizität ε und dem Bahnparameter p (Bild 11-9). Je nach Größe der Gesamtenergie E ergeben sich nach (11-38) unterschiedliche Bahnformen: E < 0 , ε < 1 : Ellipse E = 0 , ε = 1 : Parabel E > 0 , ε > 1 : Hyperbel . Eine geschlossene Bahn (gebundener Zustand) erhält man also nur für negative Gesamtenergie, d. h., wenn die kinetische Energie überall auf der Bahn kleiner ist als der Betrag der negativen potenziellen Energie. Bei positiver potenzieller Energie, d. h. bei abstoßender Zentralkraft (z. B. zwischen elektrischen Ladungen gleichen Vorzeichens, siehe 11-12), sind nur Hyperbelbahnen möglich (ungebundener Zustand), da bei E > 0 nach (11-38) die Exzentrizität ε > 1 ist.
Kreisbahngeschwindigkeit von Satelliten Für einen Satelliten auf einer Kreisbahn im Abstand r vom Erdmittelpunkt bzw. in der Höhe h über der Erdoberfläche (Bild 11-11) erhält man aus der
11 Gravitationswechselwirkung
Gleichsetzung des Ausdruckes für die Zentripetalkraft (3-19) mit der Gravitationskraft (11-7) unter Beachtung von (11-11) GME g g = RE = RE . (11-40) v = r r RE + h Die Kreisbahngeschwindigkeit hängt nicht von der Satellitenmasse, sondern allein von der Höhe h ab, wodurch antriebsfreie Gruppenflüge von Raumschiffen in der gleichen Bahn möglich sind. Satelliten in geringer Höhe (z. B. h = 100 km RE ≈ 6371 km) haben nach (11-40) eine Kreisbahngeschwindigkeit 1. astronautische Geschwindigkeit v (RE ) = gRE = 7,9 km/s ≈ 28 500 km/h (11-41) und benötigen daher knapp 1,5 h für eine Erdumkreisung. Synchronsatelliten haben die gleiche Winkelgeschwindigkeit wie die Erdrotation (ωE ). Wenn ihre Bahnebene in der Äquatorebene der Erde liegt, bewegen sie sich stationär über einem Punkt des Äquators (Fernsehsatelliten!). Mit der Bedingung v = ωE (RE + h) folgt für die Bahnhöhe der Synchronsatelliten aus (11-40) 8 2 3 gRE h= − RE ≈ 36 000 km . (11-42) ω2E
Bahnenergie Für die Diskussion der möglichen Bahnformen von Satellitenbahnen ist es zweckmäßig, die Gesamtenergie E zu betrachten. Aus (11-38) erhält man zusammen mit den Beziehungen zwischen den Ellipsenparametern (Bild 11-9) Γ (11-43) , 2a d. h., die Gesamtenergie ist durch die Länge der Ellipsen-Hauptachse 2a bestimmt. Im Fall der Gravitationsanziehung durch die Erde ist Γ = GME m > 0. Zu einer endlich langen, positiven halben Hauptachse a (Ellipse, ε < 1) gehört nach (11-43) eine negative Gesamtenergie (Bild 11-10) E=−
1 ME m E=− G , 2 a
(11-44)
Bild 11-10. Gesamtenergie bei Ellipsenbahnen als Funktion
der großen Bahnachse
d. h., die stets positive kinetische Energie bleibt in jedem Bahnpunkt kleiner als der Betrag der negativen potenziellen Energie (11-36) Ep = −G
gR2 m ME m =− E . r r
(11-45)
Im Fall der Kreisbahn wird a = r und ε = 0. Für die kinetische Energie ergibt sich dann mit (11-40) Ek =
1 m 2 1 ME m v = G = − Ep , 2 2 r 2
(11-46)
und die Gesamtenergie bei der Kreisbahn beträgt 1 ME m 1 E = Ek + Ep = − G = Ep . 2 r 2
(11-47)
Lässt man in (11-44) a → ∞ gehen, so wird E = 0 und die Ellipse geht in eine Parabel (ε = 1) über. In diesem Fall ist die kinetische Energie Ek = −Ep (d. h., Ek (∞) = 0), und für die Geschwindigkeit des Satelliten folgt mit (11-45) 2g v = RE (11-48) . r Im Scheitelpunkt der Parabel r = RE + h (Bild 11-11) ergibt sich daraus als notwendige Einschussgeschwindigkeit in die Parabelbahn und damit als Fluchtgeschwindigkeit für die Starthöhe h das √ 2 -fache der Kreisbahngeschwindigkeit (11-40) √ 2g vf = RE = v 2 . (11-49) RE + h Bei niedriger Starthöhe h RE folgt daraus der schon aus einer einfacheren Energiebetrachtung
B117
B118
B Physik
Bild 11-11. Satellitenbahntypen bei verschiedenen Bahneinschussgeschwindigkeiten v bzw. Gesamtenergien E
erhaltene Wert vf (RE ) = 2gRE = 11,2 km/s für die 2. astronautische Geschwindigkeit (11-30). Für die Sonne als Zentralkörper und die Erde als Startpunkt für eine Parabelbahn um die Sonne ergibt sich analog die 3. astronautische Geschwindigkeit v3 ≈ 16 km/s. Bei Einschussgeschwindigkeiten v > vf gemäß (11-47) wird E > 0, das entspricht formal einem negativen Wert der großen Bahnachse 2a in (11-43). Eine positive Gesamtenergie bedeutet nach (11-38) ε > 1, also Hyperbelbahnen (Bild 11-11). In diesem Fall hat die kinetische Energie selbst für r → ∞ einen nicht verschwindenden Wert. Drehimpuls bei Ellipsenbahnen
Während die Bahnenergie E nach (11-43) allein von der Länge der Hauptachse 2a der Bahnellipse abhängt, ist der Bahndrehimpuls L zusätzlich von der Länge der Nebenachse 2b abhängig. Aus (11-38) und (11-43) sowie p = b2 /a (Bild 11-9) folgt L=
√ b√ amΓ = b −2mE . a
(11-50)
Der Maximalwert des Drehimpulses liegt für die Kreisbahn b = a vor: √ b Lmax = amΓ : L = Lmax . (11-51) a Im Grenzfall der linearen Tauchbahn (b = 0) verschwindet der Drehimpuls. Ellipsenbahnen gleicher Bahnenergie können also verschiedene Drehimpulse haben. Dies ist ein wesentlicher Aspekt des Bohr-Sommerfeld’schen Atommodells (siehe 16.1.1). Bild 11-12 zeigt einige Beispiele.
Bild 11-12. Ellipsenbahnen gleicher Energie mit unter-
schiedlichen Drehimpulsen
12 Elektrische Wechselwirkung 12.1 Elektrische Ladung, Coulomb’sches Gesetz Materielle Körper lassen sich in einen „elektrisch geladenen“ Zustand versetzen (z. B. durch Reiben von manchen nichtmetallischen Stoffen), in dem sie Kräfte auf andere „elektrisch geladene“ Körper ausüben, die nicht auf Gravitationsanziehung zurückzuführen sind. Auf den gleichen Stoffen gleichartig erzeugte elektrische Ladungen stoßen sich ab. Es existieren jedoch zwei verschiedene Arten der elektrischen Ladung (du Fay, 1733), die sich gegenseitig anziehen: Positive und negative Ladungen. Die Definition der Vorzeichen ist willkürlich und ist historisch bedingt (Lichtenberg, 1777): Harze, z. B. Bernstein, mit Katzenfell gerieben: (+); Glas mit Leder gerieben: (–). Nach heutiger Auffassung ist die elektrische Ladung neben Ruhemasse und Spin eine grundlegende Eigenschaft der Elementarteilchen. In der uns umgebenden Materie sind die geladenen Elementarteilchen normalerweise die negativ geladenen Elektronen und die positiv geladenen Protonen (siehe 16.1). Das Kraftgesetz für die Abstoßung bzw. Anziehung zwischen zwei Ladungen Q und q gleichen bzw. entgegengesetzten Vorzeichens wurde experimentell von Coulomb (1785) mithilfe der von ihm erfundenen Torsionswaage gefunden. Das Prinzip der Torsionswaage wurde später auch von Cavendish für die Gravitationsdrehwaage (Bild 11-5) eingesetzt, wobei dort die elektrisch geladenen Körper durch elektrisch neutrale Massen ersetzt wurden. Das Kraftgesetz ent-
12 Elektrische Wechselwirkung
Tabelle 11-1. Daten unseres Sonnensystems. (Werte nach Gerthsen/Vogel, 20. Aufl.)
Körper
Masse
mittlerer siderische ÄquatorRotationsradius periodea M R Tr 1024 kg km d Sonne 1,989 · 106 696 000 27 Merkur 0,3302 2 440 58,65 Venus 4,869 6 052 −243 Erde 5,9742 6 378.137 0,99726968 Erdmond 0,07348 1 738 27,322 Mars 0,6419 3 397 1,026 Jupiter 1 898.8 71 492 0,4135 Saturn 568,5 60 268 0,4375 Uranus 86,62 25 559 −0,65 Neptun 102,8 24 764 0,678 Pluto 0,015 1 151 −6,387 a negative Werte kennzeichnen entgegengesetzten Rotationssinn.
spricht hinsichtlich Form und Abstandsverhalten völlig dem Gravitationsgesetz und heißt Coulomb’sches Gesetz: 1 Qq 0 · r . (12-1) FC = 4πε0 r2 Wie bei der Gravitationskraft handelt es sich um eine Zentralkraft, die längs der Verbindungslinie zwischen den beiden Ladungen wirkt (Bild 12-1). Die Einheit der Ladungsmenge Q ist das Coulomb und kann über das Coulomb-Gesetz festgelegt werden, wird jedoch aus Genauigkeitsgründen über die noch einzuführende Stromstärke I (12.6) definiert: SI-Einheit: [Q] = A · s = C (Coulomb). Die Proportionalitätskonstante wird aus praktischrechnerischen Gründen in der Form 1/4πε0 geschrieben und muss im Prinzip experimentell bestimmt werden. Mit der heute gültigen Definition der Vakuumlichtgeschwindigkeit c0 (siehe 1.3
Bild 12-1. Kraftwirkung zwischen zwei Ladungen Q und q gleichen bzw. verschiedenen Vorzeichens
große Bahnhalbachse
Exzentrizität
siderische Umlaufzeit
a 106 km − 57,91 108,21 149,598 0,3844 227,94 778,3 1 427 2 871 4 497 5 914
ε
T a = 365 d − 0,240 0,616 1,000702 0,075 1,88 11,86 29,46 84,02 164,79 247,69
− 0,206 0,007 0,016751 0,0549 0,093 0,048 0,056 0,046 0,010 0,249
und 19.1) und der magnetischen Feldkonstante μ0 = 4π · 10−7 Vs/Am (siehe 13.1) ergibt sich die elektrische Feldkonstante 1 = 8,854187817 . . . · 10−12 A · s/(V · m) . μ0 c20 (12-2) Die hier verwendete Einheit Volt (V) ist die Einheit des elektrischen Potenzials (12.3). Zur Messung elektrischer Ladungsmengen können Geräte verwendet werden, die die Abstoßungskräfte zwischen gleichartig geladenen Körpern anzeigen (Elektrometer). Empfindlicher sind Geräte, in denen durch periodische Bewegung der zu messenden Ladung eine periodische Potenzialänderung erzeugt wird, die als Wechselspannung verstärkt und gemessen werden kann (Schwingkondensator-Verstärker, siehe 12.3). ε0 =
12.2 Das elektrostatische Feld Das Coulomb-Gesetz (12-1) ist ein Fernwirkungsgesetz, das eine Kraft beschreibt, die von einer Ladung Q über eine Entfernung r auf eine zweite Ladung q ausgeübt wird. Im Sinne der Nahwirkungstheorie (Faraday, 1852) sind positive und negative elektrische Ladungen Quellen und Senken eines elektrischen Feldes, dessen Feldstärke durch die lokale
B119
B120
B Physik
Kraft auf eine Probeladung q definiert wird: F q→0 q SI-Einheit: [E] = N/C = V/m . E = lim
Bewegung von Ladungen im homogenen Feld (12-3)
a=
Der Betrag E der elektrischen Feldstärke darf nicht mit der Energie E verwechselt werden. Die Vorschrift q → 0 ist nur dann von Bedeutung, wenn durch die Kraftwirkung der Probeladung Verschiebungen der felderzeugenden Ladungen (z. B. auf elektrisch leitenden Körpern: Influenz, 12.7) auftreten können. Die Kraft auf die Probeladung folgt daraus zu F = qE ,
Nach (12-4) erfährt eine Ladung q im elektrischen Feld eine Beschleunigung
(12-4)
wobei die Richtung sich aus dem Vorzeichen der Ladung q ergibt (Bild 12-1). Wie beim Gravitationsfeld lässt sich die Geometrie des elektrischen Feldes durch Feldlinien beschreiben, die die Richtung der elektrischen Feldstärke (12-3) in jedem Punkt angeben. Das elektrostatische Feld wird durch ruhende elektrische Ladungen erzeugt. Das einfachste Feld ist das homogene Feld, in dem E überall gleich ist. Es ist in guter Näherung realisierbar durch parallele, verschieden geladene Platten, deren Ausdehnung groß gegen den Abstand ist (Bild 12-2a). (Anmerkung: ein homogenes Gravitationsfeld ist in entsprechender Weise nicht erzeugbar.)
q F = E. m m
(12-5)
Im homogenen Feld ist daher a = const, sodass frei bewegliche positive Ladungen eine Fallbewegung in, negative Ladungen entgegen der Richtung des elektrischen Feldvektors durchführen. Zur Beschreibung können die Beziehungen für die gleichmäßig beschleunigte Bewegung (2.1) zusammen mit (12-5) herangezogen werden. So folgt für eine senkrecht in ein elektrisches Feld mit der Anfangsgeschwindigkeit v0 eingeschossene negative Ladung –q (Bild 12-2b) als Bahnkurve aus (2-22) eine Parabel (α = 0) qE 2 x . (12-6) z= 2mv20 Der Ablenkwinkel ϑ nach Durchfliegen des Feldes der Länge l lässt sich nach Differenzieren aus der Steigung an der Stelle l gewinnen: tan ϑ =
ql E. mv20
(12-7)
Anwendung: Ablenkung des Elektronenstrahls in der Oszillographenröhre mittels Ablenkplatten. Felder von Punktladungen
Die Feldstärke einer einzelnen Punktladung ergibt sich durch Einsetzen der Coulomb-Kraft (12-1) in die Feldstärke-Definition (12-3): E=
Bild 12-2. Bewegung von Ladungen im homogenen elektrischen Feld. a Plattenkondensator, b Ablenkplatten
Q r0 . 4πε0 r2
(12-8)
Die zugehörigen Feldlinien haben also überall radiale Richtung (Bild 12-3). Feldlinienbilder mehrerer Punktladungen lassen sich durch vektorielle Addition der von den Einzelladungen am jeweiligen Ort erzeugten Feldstärken konstruieren. Während die Feldstärke des aus zwei entgegengesetzt gleichgroßen Ladungen bestehenden Dipols (Bild 12-4) mit der Entfernung schnell abnimmt, nähert sich das Feld zweier gleicher Ladungen Q (Bild 12-5) mit zunehmender Entfernung demjenigen
12 Elektrische Wechselwirkung
Bild 12-5. Feldlinienbild zweier gleicher Ladungen (gestriBild 12-3. Feldlinienbild einer Punktladung (gestrichelt:
chelt: Äquipotenziallinien)
Äquipotenziallinien)
Bild 12-6. Zur Berechnung der von einer kontinuierlichen
Raumladungsverteilung erzeugten elektrischen Feldstärke
Bild 12-4. Feldlinienbild zweier entgegengesetzt gleich-
großer Ladungen: Dipol (gestrichelt: Äquipotenziallinien)
einer Punktladung 2Q. An dem hier auftretenden Sattelpunkt des Potenzials in der Mitte zwischen beiden Ladungen, wo zwei Feldlinien frontal aufeinanderstoßen, zwei andere senkrecht dazu abgehen, ist die Feldstärke null. Dies gilt generell für Sattelpunkte des Potenzials. Im allgemeinen Fall von N Punktladungen an den Stellen ri erhält man die resultierende Feldstärke E(r) durch vektorielle Addition (lineare Superposition) aller Punktladungsfeldstärken Ei (ri ) aus (12-8): E(r) =
N i=1
Ei (r) =
N Qi r − ri · . 4πε |r − r i |3 0 i=1
(12-9)
Liegt statt diskreter Punktladungen eine kontinuierliche Ladungsverteilung im Volumen V vor mit der Raumladungsdichte
(r) =
dQ , dV
(12-10)
so erhält man die resultierende Feldstärke durch Integration über die von jedem Ladungselement dQ im Volumen V erzeugte Feldstärke dE (Bild 12-6): " 1 r − r E(r) =
(r ) dV . (12-11) 4πε0 |r − r |3 V
Experimentell lässt sich der Verlauf elektrischer Feldlinien mittels kleiner, länglicher Kristalle (Gips, Hydrochinon o. ä.) sichtbar machen, die – z. B. auf einer Glasplatte im Feld – sich durch Dipolkräfte (12.9) in Feldrichtung ausrichten. Elektrischer Fluss
Im elektrostatischen Feld beginnen und enden elektrische Feldlinien stets auf Ladungen: Die Gesamtheit der Feldlinien, die von einer Ladungsmenge ausgehen, oder besser: das von der Ladungsmenge Q erzeugte Feld ist daher auch ein Maß für die Ladung Q. Eine geeignete Größe zur Beschreibung eines allgemeinen Zusammenhangs zwischen Ladung Q und Feld E ist der elektrische Fluss Ψ . Die folgenden Betrachtungen gelten zunächst für das elektrostatische
B121
B122
B Physik
Feld im Vakuum und werden in 12.9 auf das mit nichtleitender Materie erfüllte Feld erweitert. In einem homogenen Feld ist der elektrische Fluss durch eine zur Feldrichtung senkrechte Fläche A (Bild 12-7a) definiert durch (12-12) Ψ = ε0 EA , und entsprechend die elektrische Flussdichte (im Vakuum) Ψ = ε0 E . (12-13) D0 = A D0 wird auch elektrische Verschiebungsdichte (im Vakuum) genannt und ist ein Vektor in Richtung der Feldstärke E: (12-14) D0 = ε0 E . In Verallgemeinerung von (12-12) ist der elektrische Fluss Ψ eines beliebigen (inhomogenen) Feldes durch eine beliebig orientierte Fläche A (Bild 12-7b) im Vakuum " " Ψ= ε0 E · d A = D0 · dA . (12-15) A
A
SI-Einheit: [Ψ ] = A · s = C , SI-Einheit: [D] = C/m2 . Der von einer Ladung Q insgesamt ausgehende elektrische Fluss ergibt sich durch Integration gemäß (12-15) über eine geschlossene Oberfläche S , z. B. über eine zu Q konzentrische Kugeloberfläche (Bild 12-8a): 0 D0 · d A = ε0 E4πr2 . (12-16) Ψ= S
Bild 12-8. Zum Gauß’schen Gesetz im elektrischen Feld
Mit der Feldstärke (12-8) für die Punktladung folgt daraus als eine der Feldgleichungen des elektrischen Feldes das allgemein gültige Gauß’sche Gesetz (im Vakuum): 0 0 D0 · d A = ε0 E · dA = Q , (12-17) Ψ= S
S
d. h., der gesamte elektrische Fluss Ψ durch eine geschlossene Oberfläche ist gleich der eingeschlossenen Ladung Q (Bild 12-8b). In (12-17) geht weder die Geometrie der geschlossenen Fläche S noch die Lage der Ladung Q ein. Q kann daher auch aus mehreren Punktladungen qi oder aus einer Ladungsverteilung der Ladungsdichte (r) bestehen: " Q= qi =
(r) dV , (12-18) V
wobei das Integrationsvolumen V innerhalb der geschlossenen Fläche S liegen muss. Enthält die geschlossene Fläche keine Ladung (Bild 12-8c), so ist der Gesamtfluss durch die Oberfläche null. Beispiele für die Anwendung des Gauß’schen Gesetzes: Homogen geladene Kugeloberfläche Bild 12-7. Zur Definition des elektrischen Flusses (im
Vakuum). a homogenes, b inhomogenes Feld
Eine z. B. metallische Kugel des Radius R trage eine Gesamtladung Q, die sich im statischen Fall
12 Elektrische Wechselwirkung
radial von der Linie weg. Zur Berechnung der Feldstärke benutzen wir eine Integrationsfläche S nach Bild 12-9b. Von der Zylinderoberfläche trägt nur die Mantelfläche AM = 2πrl zum Oberflächenintegral über die Feldstärke bei, da in den Stirnkreisflächen die Feldstärke senkrecht auf der Flächennormalen steht. Die von der Zylinderoberfläche eingeschlossene Ladung ist Q = qL l. Das Gauß’sche Gesetz (12-17) ergibt dann für den Betrag der elektrischen Feldstärke im Abstand r von der Linienladung (Rechnung siehe G 10.3) qL . E= (12-22) 2πε0 r Geladener Plattenkondensator Bild 12-9. Außenfeld a einer geladenen Kugel und b einer
Linienladung
gleichmäßig auf der Oberfläche A = 4πR2 verteilt (siehe 12.7), sodass die Flächenladungsdichte σ=
dQ dA
(12-19)
σ = Q/4πR2 beträgt. Wird als Integrationsfläche die Oberfläche der Metallkugel gewählt (Bild 12-9a), so folgt aus dem Gauß’schen Gesetz (12-17) wie in (12-16) für die Oberflächenfeldstärke ER =
Q σ = , 4πε0 R2 ε0
(12-20)
und entsprechend für einen Radius r > R im Außenraum der geladenen Kugel Q . E(r) = 4πε0 r2
(12-21)
Die Feldstärke im Außenraum der geladenen Kugel ist also identisch mit der Feldstärke einer gleichgroßen Punktladung im Zentrum der Kugel. Linienladung
Die Feldlinien im Außenraum einer homogen geladenen Linie (Draht, Linienladungsdichte qL ) verlaufen aus Symmetriegründen senkrecht und
Zwei parallele Metallplatten der Fläche A mögen die Ladungen +Q und −Q tragen (Bild 12-10). Sind die linearen Abmessungen der Platten groß gegen den Plattenabstand d, so ist das Feld zwischen den Platten homogen (Bild 12-2) und außen vernachlässigbar klein. Zur Berechnung der Feldstärke E im Innern werde eine Platte mit einer geschlossenen Fläche S umhüllt, von der das homogene Feld die Fläche A durchsetzt (Bild 12-10, gestrichelte Berandung). Zum Gauß’schen Gesetz (12-17) angewandt auf die Fläche S liefert dann nur der Fluss durch die Fläche A einen Beitrag " 0 D0 ·dA = ε0 E·dA = ε0 EA . (12-23) Ψ =Q= S
A
Daraus errechnet sich die Feldstärke im Plattenkondensator mit (12-19) zu E=
Q σ = . ε0 A ε0
(12-24)
E ist gleichzeitig die Oberflächenfeldstärke auf den Platten, für die sich demnach der gleiche Zusammenhang mit der Flächenladungsdichte σ ergibt wie für die geladene Kugel (12-20). Da die Geometrie der geladenen Körper hierbei nicht eingeht, gilt offenbar für geladene (leitende) Flächen generell der Zusammenhang (12-25) σ = ε0 E = D0 , der sich auch allgemein aus (12-17) und (12-19) herleiten lässt.
B123
B124
B Physik
proportional zur Ladung q ist. Wie in 11.4 ist es daher sinnvoll, eine dem Gravitationspotenzial (11-20) entsprechende, ladungsunabhängige Größe V(r) (auch ϕ(r)) einzuführen: das elektrische Potenzial V(r) =
Bild 12-10. Zur Berechnung der Feldstärke im Plattenkondensator mit dem Gauß’schen Gesetz
=−
"2 F(r) · dr = −q
1
SI-Einheit: [V] = J/C = V (Volt). Hieraus folgt die für die Umrechnung zwischen mechanischen und elektrischen Einheiten im SISystem wichtige Beziehung (12-28)
Die äußere Arbeit (12-26) zur Verschiebung von einem Punkt 1 nach einem Punkt 2 beträgt mit (12-27)
Eine Ladung q in einem elektrostatischen Feld der Feldstärke E erfährt eine Kraft F = qE und besitzt daher eine potenzielle Energie Ep , die z. B. in kinetische Energie umgewandelt wird, wenn die Ladung im Vakuum der Kraft ungebremst folgen kann. Die zur Verschiebung der im Bild 12-11 negativen Ladung q von r1 nach r2 mit einer Kraft −qE(r) gegen die Feldkraft in einem beliebigen elektrostatischen Feld (Bild 12-11) aufzuwendende äußere Arbeit ist nach dem Energiesatz "2
(12-27)
1J = 1V·A·s .
12.3 Elektrisches Potenzial, elektrische Spannung
a W12
Ep (r) . q
a W12 = Ep (r2 ) − Ep (r1 ) = q[V(r2 ) − V(r1 )] . (12-29)
Ebenso wie die potenzielle Energie ist auch das Potenzial nur bis auf eine willkürliche additive Konstante bestimmt, die bei der Berechnung der Arbeit aufgrund der Differenzbildung herausfällt. Häufig ist es zweckmäßig, die potenzielle Energie bzw. das Potenzial im Unendlichen null zu setzen: Ep (∞) = 0 ,
V(∞) = 0 .
Aus (12-26) folgt dann mit r1 −→ ∞ und r2 = r für das Potenzial
E(r) · dr 1
= Ep (r2 ) − Ep (r1 ) .
(12-30)
(12-26)
So wie beim Gravitationsfeld die potenzielle Energie proportional zur Masse ist, gilt für das elektrostatische Feld nach (12-26), dass die potenzielle Energie
a Ep (r) W∞, r = =− V(r) = q q
"r E · dr ,
(12-31)
∞
das also der Arbeit zur Verschiebung der Probeladung q aus dem Unendlichen an die Stelle r, dividiert durch die Probeladung, entspricht. Die Potenzialdifferenz zwischen zwei Punkten 1 und 2 wird die elektrische Spannung −U12 = V(r1 ) − V(r2 )
bzw.
U21 = V(r2 ) − V(r1 ) = −U12
(12-32)
genannt. Sie hat natürlich dieselbe Einheit Volt wie das elektrische Potenzial. Damit folgt aus (12-29) der Zusammenhang für die äußere Arbeit bei Bewegung der Ladung gegen die Feldkräfte von 1 nach 2: Bild 12-11. Zur Arbeit im elektrischen Feld
a W12 = q U21 = −q U12 ,
12 Elektrische Wechselwirkung
für die Arbeit durch die Feldkräfte bei Bewegung der Ladung q von 2 nach 1:
elektrischem Potenzial und Feldstärke lautet (vgl. 4.2 und 11.4, sowie G 10.2)
W12 = q U21 = −q U12 ,
E(r) = −grad V(r) .
allgemein:
Aus der differenziellen Formulierung von (12-31)
W = qU .
(12-33)
Für die auf die Ladung bezogene erforderliche äußere a Arbeit W12 zur Bewegung der Ladung q von 1 nach 2 längs des Weges s1 (Bild 12-11) folgt aus (12-26) mit (12-27) und (12-32) a W12 = V(r2 ) − V(r1 ) = U21 = − q
"2 E(r) · dr . 1
(12-34) Längs eines geschlossenen Weges C = s1 + s2 (Bild 12-11) ist im elektrostatischen Feld die Arbeit null, da andernfalls beim Herumführen einer Ladung auf dem geschlossenen Weg ohne Zustandsänderung des Feldes Arbeit gewonnen werden könnte (Verstoß gegen den Energieerhaltungssatz), d. h., 0 − E · dr = 0 im elektrostatischen Feld . (12-35)
dV(r) = −E(r) · dr
Dies ist neben (12-17) eine weitere Feldgleichung des elektrostatischen Feldes. Das geschlossene Linienintegral über die elektrische Feldstärke wird elektrische Umlaufspannung genannt. Sie verschwindet im statischen Fall. Aus (12-35) folgt weiter, dass die Arbeit längs zweier verschiedener Wege s1 und −s2 zwischen 1 und 2 (Bild 12-11) gleich ist, " " E(r) · dr = E(r) · dr , (12-36)
V = −Ex
(12-40)
und Ebenen x = const als Potenzialflächen (Bild 12-12). Die Feldstärke im Plattenkondensator ergibt sich daraus mit (12-32) zu U . d
(12-41)
Zusammen mit (12-24) erhält man aus (12-41) U=Q
d . ε0 A
(12-42)
Bei konstanter Ladung Q ist U ∼ d. Dies wird im Schwingkondensator-Verstärker zur empfindlichen Messung von Ladungsmengen ausgenutzt (siehe 12.1).
−s2
d. h., die Arbeit ist unabhängig vom Wege, das elektrostatische Feld ist ein konservatives Kraftfeld. Mit dem Stokes’schen Integralsatz (vgl. A 17.3; Gl. (17-29)) lässt sich zeigen, dass (12-35) auch bedeutet, dass (12-37) rot E(r) = 0 , d. h., das elektrostatische Feld ist wirbelfrei. Für das Coulomb-Feld lässt sich dies auch direkt durch Einsetzen von (12-8) zeigen. Die verschiedenen Formulierungen (12-35) bis (12-37) sind gleichwertig Die Umkehrung des Zusammenhangs (12-31) zwischen
(12-39)
folgt analog zu 11.4, dass Flächen, die überall senkrecht zur elektrischen Feldstärke sind, Flächen konstanten elektrischen Potenzials (Potenzialflächen) darstellen. Schnitte solcher Potenzialflächen (Potenziallinien) sind in Bild 12-3 bis 12-5 und 12-12 gestrichelt eingezeichnet. Für ein homogenes Feld in x-Richtung erhält man durch Integration von (12-39) eine lineare Ortsabhängigkeit des Potenzials (V = 0 bei x = 0 vereinbart)
E=
C
s1
(12-38)
Bild 12-12. Plattenkondensator
B125
B126
B Physik
Das Potenzial im Feld einer Punktladung ergibt sich durch Integration über die Feldstärke (12-8) gemäß (12-31) zu V(r) =
Q . 4πε0 r
(12-43)
Potenzialflächen bei der Punktladung sind demnach konzentrische Kugelflächen r = const (Bild 12-3). Auch das Potenzial im Außenfeld einer geladenen Kugel (vgl. 12.2, Bild 12-9) wird durch (12-43) beschrieben, da die Feldstärken (12-21) und (12-8) in beiden Fällen gleich sind. Mit (12-21) ergibt sich ein einfacher Zusammenhang zwischen Feldstärke und Potenzial im Zentralfeld: V(r) E(r) = . (12-44) r Entsprechend beträgt die Oberflächenfeldstärke einer auf das Potenzial V geladenen leitenden Kugel (Radius R, Bild 12-9) V (12-45) ER = . R
12.4 Quantisierung der elektrischen Ladung
Bild 12-13. Millikan-Versuch zur Bestimmung der Elemen-
tarladung
eine konstante Fallgeschwindigkeit v der Tröpfchen ein, die unter dem Mikroskop gemessen wird. Die Gleichsetzung von Gewichtskraft und Reibungskraft ergibt 4 (12-47) FG = mg = πr3 g = FR = 6πηrv . 3 Hieraus kann der Tröpfchenradius r und damit m berechnet werden (genaugenommen muss noch der Auftrieb des Öltröpfchens in Luft berücksichtigt werden). Aus vielen Einzelmessungen mit verschiedenen Öltröpfchen ergab sich, dass nur ganzzahlige Vielfache einer kleinsten Ladung e auftreten: q = ±ne (n = 0, 1, 2, . . .)
(12-48)
mit der Elementarladung Aus vielen experimentellen Untersuchungen hat sich gezeigt, dass die elektrische Ladung nicht in beliebigen Werten auftritt: Es gibt eine kleinste Ladungsmenge, die Elementarladung. Die absolute Messung des Betrages der Elementarladung erfolgte erstmals durch Vergleich der elektrischen Kraft auf geladene Teilchen mit ihrem Gewicht im Schwerefeld (Millikan-Versuch): Geladene feine Öltröpfchen werden unter mikroskopischer Beobachtung in einem Kondensatorfeld durch Einstellung der richtigen Feldstärke mittels der am Kondensator angelegten Spannung zum Schweben gebracht (Bild 12-13). Aus der Gleichsetzung von Gewichtskraft FG (3-7) und elektrischer Kraft Fe (12-4) folgt für die unbekannte Ladung q eines Öltröpfchens mg mgd = . (12-46) E U Die zunächst ebenfalls unbekannte Masse m des Öltröpfchens (Dichte ) wird aus einem Fallversuch bei ausgeschalteter Spannung (E = 0) bestimmt. Wegen der Stokes’schen Reibungskraft (9-37) der als kugelförmig angenommenen Öltröpfchen beim Fall in dem zähen Medium Luft (Viskosität η) stellt sich q=
e = (1,602176487 ± 40 · 10−9 ) · 10−19 C Die elektrische Ladung ist gequantelt in Einheiten der Elementarladung. Alle in der Natur beobachteten Ladungsmengen sind gleich oder ganzzahlige Vielfache der Elementarladung e. Die Beträge der positiven und negativen Elementarladungen sind exakt gleich. Die meisten Elementarteilchen sind Träger einer Elementarladung (Tabelle 12-1). Die nur gebunden als Bausteine der Hadronen (Mesonen und Baryonen, vgl. Tabelle 12-1) auftretenden Quarks haben jedoch die Ladung ±e/3 oder ±2e/3 (siehe 17.5). Bausteine der Atome der uns umgebenden Materie sind die positiv geladenen Protonen, die negativ geladenen Elektronen und die Neutronen, die keine Ladung tragen. Erhaltungssatz für die elektrische Ladung: Die gesamte elektrische Ladung – d. h. die algebraische Summe der positiven und negativen Ladungen – in einem elektrisch isolierten System ändert sich zeitlich nicht.
12 Elektrische Wechselwirkung
Beispiele: Ionisation neutraler Atome durch Photonen; Paarerzeugung; Elementarteilchenumwandlungen. Eine mathematische Formulierung des Erhaltungssatzes der elektrischen Ladung ist die Kontinuitätsgleichung für die elektrische Ladung (12-64).
12.5 Energieaufnahme im elektrischen Feld Ein Teilchen der Ladung q, der Masse m und der Geschwindigkeit v besitzt in einem elektrischen Feld am Ort r mit dem elektrischen Potenzial V(r) die Gesamtenergie 1 2 mv + qV . (12-49) 2 Kann das Teilchen zwischen den Orten 1 und 2 der elektrischen Feldstärke folgen, so folgt aus dem Energiesatz (12-29) E = Ek + Ep =
1 2 1 2 mv − mv = q(V1 − V2 ) = qU12 . 2 2 2 1
(12-50)
Ein Teilchen, das eine Spannung U durchläuft, erfährt also einen Zuwachs seiner kinetischen Energie um qU. Wenn q bekannt ist, dann ist auch die durchlaufene Spannung U ein Maß für die Energie. Dies trifft z. B. bei der Beschleunigung von geladenen Elementarteilchen zu, deren Ladung stets +e oder −e ist (Tabelle 12-1). Die Multiplikation der Spannung U mit dem Wert der Ladung in A · s = C kann dann unterbleiben, und die Energieänderung kann in Elektronenvolt (eV) angegeben werden. Umrechnung in die SI-Einheit: 1 eV = (1,60217653 ± 14 · 10−8 ) · 10−19 V · C = 1,602 . . . 10−19 J .
Aufgrund dieser geringen Masse wird die Geschwindigkeit von Elektronen im Vakuum schon bei Durchlaufen von nur mäßigen Spannungen sehr hoch: U = 1 V : ve ≈ 593 km/s . Die Anwendung von (12-52) auf Elektronen ist daher nur gültig, solange die Geschwindigkeit im nichtrelativistischen Bereich bleibt (4.5): 2eU ve = für U < (104 . . . 105 ) V . (12-53) me Für höhere Beschleunigungsspannungen U muss statt (12-50) der relativistische Energiesatz (4-43) angewendet werden. Mit (4-38) lautet dieser mc20 − me c20 = ΔEp = eU
(12-54)
mit me Ruhemasse des Elektrons. Mithilfe der Beziehung (4-35) für die geschwindigkeitsabhängige relativistische Masse folgt daraus anstelle von (12-53) für die Elektronengeschwindigkeit 8 eU 1+ 2 2m e c0 2eU ve = · . (12-55) eU me 1+ me c20 Für kleine U geht (12-55) in (12-53) über. Für U −→ ∞ wird dagegen ve −→ c0 , d. h., die Vakuumlichtgeschwindigkeit stellt auch hier die Grenzgeschwindigkeit dar. Gleichung (12-55) wird durch Messungen genauestens bestätigt (Bild 12-14). Elektronen und andere geladene Elementarteilchen können im Vakuum durch elektrische Felder
(12-51)
Ist die Anfangsgeschwindigkeit des geladenen Teilchens v1 = 0, so ergibt sich seine Endgeschwindigkeit v2 = v aus (12-50) zu 2qU . v= (12-52) m Die Masse von Elektronen lässt sich z. B. aus ihrer Ablenkung im Magnetfeld bestimmen (13.2) und beträgt für kleine Geschwindigkeiten me = (9,1093826 ± 16 · 10−7 ) · 10−31 kg .
Bild 12-14. Zunahme der Elektronenmasse mit steigender Geschwindigkeit: Theorie (12-55) und Messungen
B127
B128
B Physik
Tabelle 12-1. Eigenschaften von Elementarteilchen (nach Gerthsen/Vogel: Physik. 20. Aufl. Berlin: Springer 1999). me Elektronenmasse, e Elementarladung, = h/2π, Planck’sches Wirkungsquantum
Teilchenfamilie
Leptonen
Mesonen
Teilchenname
Photon Elektron-Neutrino My-Neutrino Tau-Neutrino Elektron/Positron Myon Tau-Lepton Pion (π-Meson) Kaon (K-Meson)
Baryonen
Proton Neutron Λ-Hyperon Σ-Hyperon
Ξ-Hyperon Ω-Hyperon
Symbol Teilchen γ νe νμ ντ e (e− ) μ− τ− π− π0 K− K0 p (p+ ) n Λ0 Σ+ Σ0 Σ− Ξ0 Ξ− Ω−
Antiteilchen γ ν¯ e ν¯ μ ν¯ τ e+ μ+ τ+ π+ π0 K+ K0 p¯ (p− ) n¯ Λ0 Σ+ Σ0 Σ− Ξ0 Ξ+ Ω+
Ruhemasse
Ladung Q
me 0 0?( C0 gestiegen, so-
B133
B134
B Physik
dass U = Q/C < U0 . Ursache hierfür ist die Polarisation des Dielektrikums (siehe 12.9). Bei vollständiger Ausfüllung des felderfüllten Volumens durch das Dielektrikum wird das Verhältnis U0 C = = r > 1 (12-77) C0 U Permittivitätszahl (Dielektrizitätszahl) r genannt. Sie ist eine charakteristische Größe des Dielektrikums (Tabelle 12-2). Für das Vakuum gilt εr = 1. Aus C = εrC0 folgt mit (12-76) für die Kapazität des Plattenkondensators mit Dielektrikum A (12-78) C = εr ε0 . d An die Stelle der elektrischen Feldkonstante ε0 des Vakuums tritt also die Permittivität (Dielektrizitätskonstante) (12-79) ε = εr ε0 des Dielektrikums im Feld. Das gilt generell für elektrische Felder in Dielektrika. Energieinhalt eines geladenen Kondensators
Die differenzielle Arbeit zur weiteren Aufladung eines Kondensators der Kapazität C um die Ladung dq bei der Spannung u ist nach (12-29) und mit (12-75) 1 q dq . (12-80) C Die gesamte Aufladearbeit W und damit die im Kondensator gespeicherte Energie EC erhält man daraus durch Integration (q = 0 bis Q, u = 0 bis U) und Umformung mit (12-75): dW = u dq =
2
1 1 1 Q · = QU = CU 2 (12-81) 2 C 2 2 (vgl. auch G 10.8). Die im Kondensator gespeicherte Energie manifestiert sich als Feldenergie des elektrostatischen Feldes zwischen den Elektroden des Kondensators. W = EC =
ren der Feldstärke E nach (12-41) ergibt sich für die Energiedichte 1 1 we = εE2 = D · E . (12-82) 2 2 D ist die elektrische Flussdichte gemäß (12-14), hier allerdings bereits für den allgemeinen Fall des Dielektrikums im Feld geschrieben (siehe 12.9). Gleichung (12-82) enthält keine kondensatorspezifischen Größen und gilt für beliebige elektrostatische Felder.
12.9 Nichtleitende Materie im elektrischen Feld, elektrische Polarisation Wird Materie in ein elektrisches Feld gebracht, so wird der elektrische Zustand der Materie infolge der elektrischen Kraft auf die in der Materie vorhandenen Ladungen verändert. Im bereits in 12.7 behandelten Falle elektrisch leitender Materie können sie der Kraft folgen, Ladungen entgegengesetzten Vorzeichens sammeln sich daher an gegenüberliegenden Oberflächen: Influenz (Bild 12-20). Bei einem Leiter im Feld bildet sich also eine makroskopische Ladungsverteilung aus, die qualitativ der eines elektrischen Dipols (Bild 12-4) entspricht. In Nichtleitern (Dielektrika) ist eine makroskopische Ladungsverschiebung nicht möglich. Dennoch bilden sich auch hier im Feld Dipolzustände aus, allerdings im molekularen Maßstab, die Materie wird polarisiert. Der elektrische Dipol
Der elektrische Dipol ist ein elektrisch neutrales Gebilde. Er besteht aus zwei gleich großen Punktladungen entgegengesetzten Vorzeichens (Bild 12-4), die im Abstand l auf dem Verbindungsvektor l sitzen (Bild 12-27).
Energiedichte des elektrostatischen Feldes
Die Dichte der elektrischen Feldenergie we lässt sich für den Fall des Plattenkondensators leicht aus dem Quotienten W/V berechnen, worin V = Ad das Volumen des homogenen Feldes zwischen den Kondensatorplatten ist (vgl. G 10.8). Durch Einsetzen der Kapazität des Plattenkondensators (12-78) und Einfüh-
Bild 12-27. Elektrischer Dipol
12 Elektrische Wechselwirkung
Seine Eigenschaften werden durch das elektrische Dipolmoment p beschrieben: p = ql . (12-83) SI-Einheit: [p] = C · m = A · s · m . Anmerkungen: In der Chemie wird das Vorzeichen des Dipolmoments meist entgegengesetzt definiert. p darf nicht mit dem Impuls verwechselt werden. Das Potenzial eines Dipols lässt sich durch Überlagerung der Potenziale zweier Punktladungen darstellen (Bild 12-27): q 1 q r2 − r1 q V(r) = − · . (12-84) = 4πε0 r1 r2 4πε0 r1 r2 Für Entfernungen r, die groß gegen die Dipollänge l sind, gilt r1 , r2 l :
r1 r2 = r2 . (12-85) Mit (12-83) und (12-84) folgt dann für das Potenzial einer Probeladung im Feld eines Dipols V(r) =
r2 − r1 = l cos ϑ ,
p · r0 p cos ϑ = . 4πε0 r2 4πε0 r2
(12-86)
Das Potenzial eines Dipols nimmt danach mit 1/r2 ab, während das Potenzial der einzelnen Punktladung nach (12-42) nur mit 1/r abnimmt. Der schnellere Abfall beim Dipol rührt daher, dass mit steigender Entfernung die beiden Ladungen sich in ihrer Wirkung immer mehr kompensieren. Die Feldgeometrie eines elektrischen Dipols zeigt Bild 12-4. Im homogenen elektrischen Feld wirkt ein Kräftepaar auf die beiden Ladungen des Dipols (Bild 12-28). Die resultierende Kraft auf den Dipol ist null. Das Kräftepaar bewirkt jedoch ein Drehmoment M, das sich nach (3-23) mit F = qE ergibt zu M = p× E
Bild 12-29. Resultierende Kraft auf einen elektrischen Di-
pol im inhomogenen elektrischen Feld
und den Dipol in Feldrichtung zu drehen versucht. Der Dipol im Feld besitzt daher eine potenzielle Energie, die sich aus den potenziellen Energien seiner Einzelladungen zusammensetzt: Ep, dp = qV+ + (−qV− ) ΔV = −pE cos ϑ . = −ql l
(12-88)
Daraus folgt für die potenzielle Energie eines elektrischen Dipols im elektrischen Feld Ep, dp = −p · E .
(12-89)
Sie ist minimal, wenn der Dipolvektor p in Feldrichtung zeigt, und maximal für die entgegengesetzte Richtung. Im inhomogenen Feld sind die Kräfte auf die beiden Ladungen eines Dipols vom Betrag verschieden, sodass neben dem Drehmoment auch eine resultierende Kraft auftritt. Für einen in Feldrichtung ausgerichteten Dipol mit differenziell kleiner Länge l = dx (Bild 12-29) ist die resultierende Kraft proportional zum Feldgradienten dE/dx: F=p
dE . dx
(12-90)
(12-87) Elektrische Polarisation eines Dielektrikums
Bild 12-28. Drehmoment auf einen elektrischen Dipol im
homogenen elektrischen Feld
Wie in Bild 12-26 betrachten wir einen Plattenkondensator mit Dielektrikum. Bei geladenem Kondensator bewirkt das elektrische Feld eine Polarisation des Dielektrikums: Durch Verschiebungspolarisation in den Atomen und bei polaren Molekülen durch Orientierungspolarisation (siehe unten) wird ein System elektrisch wirksamer Dipole (Bild 12-30) mit Dipolmomenten einer mittleren Größe p erzeugt. Als Pola-
B135
B136
B Physik
σε A = ε0 Eε A wirksam. Damit ist die in Bild 12-26 dargestellte Beobachtung erklärt. Für die Permittivitätszahl εr in (12-77) ergibt sich mit (12-94) für kleine Polarisationen εr =
≈1+
Bild 12-30. Polarisation eines Dielektrikums: Entstehung
von Polarisationsladungen an den Grenzflächen
risation P ist das auf das Volumen bezogene Dipolmoment definiert, also der Quotient aus dem Gesamtdipolmoment pΣ des Dielektrikums, das sich durch vektorielle Addition aller Einzeldipole p ergibt, und seinem Volumen V. Ist n die Dipolzahldichte, so folgt für die elektrische Polarisation p (12-91) P = Σ = np . V Als Folge der Polarisation entstehen Polarisationsladungen Qp = σp · A an den Grenzflächen A mit der Flächenladungsdichte σp (Bild 12-30). σp ist ein Vektor parallel zum Flächennormalenvektor A. Für das Gesamtdipolmoment ergibt sich hieraus pΣ = Qp d = σp Ad = σp V .
(12-92)
Mit (12-91) und (12-24) folgt weiter P = n p = σp = −ε0 Ep ,
(12-93)
worin Ep die durch die Polarisationsladungen erzeugte Polarisationsfeldstärke ist, die dem Polarisationsvektor P entgegengerichtet ist. Die resultierende Feldstärke Eε im dielektrikumerfüllten Feld ergibt sich aus der Überlagerung der Feldstärke E ohne Dielektrikum (bei vorgegebener Ladung Q auf den Kondensatorplatten) und der Polarisationsfeldstärke Ep des eingeschobenen Dielektrikums Eε = E + Ep = E −
P . ε0
(12-94)
Sie ist kleiner als die Vakuumfeldstärke, da die Ladungen Q auf den Platten durch die Polarisationsladungen Qp des Dielektrikums teilweise kompensiert werden. Es bleibt lediglich die Ladung Qε = Q−Qp =
U0 Q0 E = = = U Q E
E E−
P ε0
np P =1+ . ε0 E ε0 E
(12-95)
Die Abweichung von εr von 1 wird elektrische Suszeptibilität χe genannt und ist gleich dem Quotienten aus Polarisation P und elektrischer Vakuumflussdichte D0 = ε0 E: χe =
P np = , ε0 E ε0 E
P = χe ε0 E .
(12-96)
Suszeptibilität und Permittivitätszahl beschreiben die elektrischen Eigenschaften eines Dielektrikums gleichwertig und sind verknüpft durch εr = 1 + χe .
(12-97)
Multiplikation von (12-97) mit ε0 E = D0 führt mit (12-96) zu der Größe ε r ε0 E = D0 + P ,
(12-98)
die als dielektrische Verschiebung oder elektrische Flussdichte (in Materie) bezeichnet wird: D = εr ε0 E = εE ,
(12-99)
und sich aus der Flussdichte im Vakuum und der Polarisation der Materie zusammensetzt: D = D0 + P = (1 + χe )ε0 E .
(12-100)
In (12-99) und (12-100) ist E die Feldstärke, die sich beispielsweise aus der am Kondensator liegenden Spannung U und dem Plattenabstand d gemäß (12-41) ergibt. Der Name „dielektrische Verschiebung“ wurde in Hinblick auf den Vorgang der Verschiebungspolarisation gewählt (siehe unten). In isotropen Dielektrika sind εr und χe Skalare, in anisotropen Dielektrika (Kristallen) dagegen Tensoren, d. h., Verschiebungsvektor D und Feldstärkevektor E haben dann i. Allg. nicht dieselbe Richtung.
12 Elektrische Wechselwirkung
Wir wenden nun das Gauß’sche Gesetz in der Formulierung (12-17) ähnlich wie in Bild 12-10 auf eine geschlossene Fläche S an, die eine der Elektroden des mit Dielektrikum gefüllten Plattenkondensators umschließt (Bild 12-30). Das Volumen dieser Fläche enthält dann die wirksame Ladung Q . (12-101) Q = Q − Qp = εr Da außerhalb des Plattenkondensators die Feldstärke als vernachlässigbar klein angenommen werden kann, wenn die linearen Abmessungen der Plattenfläche A groß gegen den Plattenabstand d sind, trägt von der Gesamtfläche S nur der Flächenausschnitt A im Kondensatordielektrikum zum Gauß-Integral bei: " 0 Q ε0 E · d A = ε0 Eε · dA = Q = . (12-102) εr S
A
Wir bilden nun das entsprechende Integral über die elektrische Flussdichte in Materie (12-99), und erhalten analog " 0 εr ε0 E · d A = εr ε0 E · d A . (12-103) S
A
Das Integral der rechten Seite wird nur über den homogenen Feldbereich im Kondensator erstreckt, wo εr konstant ist und vor das Integral gezogen werden kann. Mit (12-99) und (12-102) folgt dann die allgemein gültige Form des Gauß’schen Gesetzes für das elektrische Feld in Materie: 0 0 D · dA = εr ε0 E · dA = Q , (12-104) S
S
Kräfte F = ±qE, sodass eine Verschiebung der Ladungsschwerpunkte gegeneinander erfolgt, bis die Coulombanziehungskraft der äußeren Kraft entgegengesetzt gleich ist: Es sind induzierte Dipole in Richtung des äußeren Feldes entstanden (Bild 12-31): Verschiebungspolarisation. Neben dieser elektronischen Verschiebungspolarisation, die bei allen Substanzen auftritt, gibt es z. B. in Ionenkristallen auch eine ionische Verschiebungspolarisation. Das pro Atom induzierte elektronische Dipolmoment p = Qδl = Zeδl kann für nicht zu große Feldstärken proportional zu E angesetzt werden, mit der Polarisierbarkeit α gemäß p = αE .
(12-105)
Um eine Größenordnung für α abzuschätzen, kann als Modell für die Verschiebungspolarisation eines kugelsymmetrischen Atoms eine leitende Kugel angenommen werden, deren Radius dem Atomradius r0 entspricht. Das äußere Feld E induziert in einer solchen Kugel Influenzladungen, deren Feld außerhalb der Kugel durch das Feld eines Dipols im Kugelzentrum mit dem Dipolmoment (ohne Ableitung) p = 4πr03 ε0 E
(12-106)
wiedergegeben wird. Ein Vergleich mit (12-105) liefert eine nach diesem Modell mit dem Atomvolumen V0 steigende Polarisierbarkeit 4 α = 3ε0 πr03 = 3ε0 V0 . (12-107) 3 Die Polarisation aufgrund der induzierten Dipole beträgt nach (12-91) und (12-105 ) P = n p = nαE .
(12-108)
Verschiebungspolarisation
Der Vergleich mit (12-96) liefert für Suszeptibilität und Permittivitätszahl nα nα χe = , εr = 1 + . (12-109) ε0 ε0
Makroskopische Materie ist aus Atomen aufgebaut. Diese bestehen aus der negativen Elektronenhülle und dem positiven Atomkern (siehe 16.1). Die Schwerpunkte der positiven und negativen Ladungsverteilungen im Atom fallen normalerweise zusammen. In einem äußeren elektrischen Feld E wirken jedoch auf die atomaren Ladungen verschiedenen Vorzeichens entgegengesetzt gerichtete
Bild 12-31. Induzierter atomarer Dipol im elektrischen Feld
worin Q die tatsächlich in das von der geschlossenen Fläche S berandete Volumen eingebrachte Ladung ist.
B137
B138
B Physik
Diese Beziehungen gelten für dünne Medien (Dipolzahldichte n klein), z. B. Gase, in denen die gegenseitige Wechselwirkung der Dipole noch keine Rolle spielt. In dichten Medien muss für die Polarisation eines induzierten Dipols das von der Polarisation des umgebenden Mediums erzeugte zusätzliche Feld (etwa die ausrichtende Wechselwirkung innerhalb einer Dipolkette) berücksichtigt werden. Das führt (ohne Ableitung) zu den Clausius-Mosotti-Formeln nα ε0 , χe = 1 nα 1− 3 ε0 nα ε0 εr = 1 + , 1 nα 1− 3 ε0
(12-110)
die die Beziehungen (12-109) als Grenzfall für kleine n enthalten. Sie gestatten die Berechnung der Dielektrizitätszahl einer dichten nichtpolaren Flüssigkeit aus den Daten ihres Gases. Orientierungspolarisation
Viele Moleküle besitzen auch bei Abwesenheit eines äußeren elektrischen Feldes bereits ein elektrisches Dipolmoment, sie stellen permanente elektrische Dipole dar. Dies trifft bei nahezu allen Molekülen zu, die nicht aus gleichen Atomen aufgebaut sind: polare Moleküle (z. B. HCl, H2 O, NH3 , Bild 12-32). Lediglich symmetrisch aufgebaute Moleküle, wie CO2 oder CH4 , haben kein permanentes Dipolmoment.
Eine Stoffportion aus polaren Molekülen (Molekülzahldichte n) zeigt ohne äußeres Feld kein resultierendes Dipolmoment, da die thermische Energie für eine statistische Gleichverteilung der Dipolorientierungen sorgt, d. h., je n/6 der molekularen Dipole sind in die 6 Raumrichtungen orientiert und heben sich daher in ihrer Wirkung gegenseitig auf. In einem äußeren elektrischen Feld erfahren die Dipole jedoch gemäß (12-84) Drehmomente, die für eine mit E zunehmende Ausrichtung in Feldrichtung gegen die Temperaturbewegung sorgen (Bild 12-33): Orientierungspolarisation. Anmerkung: Voraussetzung dafür ist eine gegenseitige Wechselwirkung der Moleküle, die einen Energieaustausch ermöglichen. Anderenfalls würde das äußere Feld allein zu Drehschwingungen der Moleküle Anlass geben, vgl. Bild 5-5. Im Feld sind daher mehr als n/6 Dipole in Feldrichtung orientiert (potenzielle Energie Ep+ ) und entsprechend weniger als n/6 entgegengesetzt der Feldrichtung (potenzielle Energie Ep− ). Die senkrecht zur Feldrichtung orientierten Dipole heben sich weiterhin in ihrer Wirkung auf. Die Polarisation ergibt sich aus der Differenz der n+ n/6 in und n− n/6 gegen die Feldrichtung orientierten Dipole. Sie lässt sich mithilfe des Boltzmann’schen e-Satzes aus der Differenz der potenziellen Energien (12-89) berechnen: ΔEp = Ep− − Ep+ = 2pE ,
(12-111)
E ist hierin die angelegte elektrische Feldstärke. Der Boltzmann’sche e-Satz (8-40) liefert dann 2pE − n− = e kT . n+
(12-112)
Für E = 0 und endliche Temperatur T > 0 ist demnach die Orientierung gleichverteilt, ebenso für
Bild 12-33. Ein System elektrischer Dipole unter dem EinBild 12-32. Beispiele für molekulare Dipole
fluss von Temperaturbewegung und äußerem elektrischen Feld
12 Elektrische Wechselwirkung
T → ∞. Für T → 0 und E > 0 sind dagegen alle Dipole in Feldrichtung ausgerichtet (Bild 12-33). Bei Zimmertemperatur ist 2pE kT und n− ≈ n+ ≈ n/6, sodass (12-112 ) entwickelt werden kann: 2pE n− . ≈1− n+ kT
(12-113)
Die resultierende Polarisation ergibt sich aus der Differenz der in und gegen die Feldrichtung ausgerichteten Dipole n− npE n 1− ≈ (12-114) nE = n+ − n− ≈ 6 n+ 3kT zu P = nE p =
np2 E . 3kT
(12-115)
Mit (12-96) folgt daraus die paraelektrische Suszeptibilität und Permittivitätszahl np2 , 3ε0 kT np2 . εr = 1 + 3ε0 kT
χe =
(12-116)
Das Temperaturverhalten χe ∼ 1/T wird entsprechend dem Curie-Gesetz der magnetischen Suszeptibilität (13.4) als Curie-Verhalten bezeichnet. Es tritt nur bei Vorhandensein permanenter Dipole, also polarer Moleküle auf. Allgemein lässt sich die elektrische Suszeptibilität unter Zusammenfassung von (12-109) und (12-110) und (12-116) darstellen durch χe = A +
B , T
(12-117)
worin A den temperaturunabhängigen Anteil der Verschiebungspolarisation und B den eventuell vorhandenen Anteil einer Orientierungspolarisation kennzeichnet. Ferroelektrizität
Kristalline Substanzen mit polarer Struktur können unterhalb einer kritischen Temperatur T C (CurieTemperatur) ohne angelegtes äußeres Feld eine spontane Polarisation zeigen. Solche Substanzen werden in Analogie zur entsprechenden Erscheinung bei Ferromagnetika (vgl. 13.4) Ferroelektrika
Tabelle 12-3. Curie-Temperatur einiger Ferroelektrika
Name Bariumtitanat KDP Kaliumniobat Seignettesalz
Formel BaTiO3 KH2 PO4 KNbO3 KNaC4 H4 O6 · 4 H2 O
T C /K 383 123 707 297a
C/K 1,8 · 105 3,3 · 103
a Seignettesalz hat ferner einen unteren Curie-Punkt bei 255 K und ist nur zwischen den beiden CurieTemperaturen ferroelektrisch.
genannt. Die Polarisation ist durch eine entgegengesetzte äußere elektrische Feldstärke E > Ec (= Koerzitivfeldstärke) umkehrbar. Es liegt eine Domänenstruktur vor, wobei eine Domäne einen Bereich mit paralleler Ausrichtung der Dipole darstellt und durch die Summation der Wirkung aller seiner Dipole ein gegenüber dem Einzeldipol sehr großes Dipolmoment hat. Das Drehmoment zur Umorientierung einer solchen Domäne erfordert daher nach (12-87) nur eine im Vergleich zu paraelektrischen Substanzen geringe äußere Feldstärke: Suszeptibilität χe und Permittivitätszahl εr sind sehr hoch (z. B. BaTiO3 , Tabelle 12-2). Sie sind außerdem von der Feldstärke und von der vorherigen Polarisation abhängig. Der Zusammenhang zwischen Polarisation und angelegtem elektrischem Feld ist bei einem Ferroelektrikum daher nicht linear, sondern folgt einer Hysteresekurve (vgl. 13.4). Die parallele Ausrichtung der Dipole innerhalb einer Domäne ist durch die Dipol-Dipol-Wechselwirkung bedingt. Diese Ordnung wird mit steigender Temperatur durch die Wärmebewegung gestört und bricht mit Erreichen der Curie-Temperatur T C völlig zusammen. Oberhalb der Curie-Temperatur T C verhalten sich manche Ferroelektrika (z. B. BaTiO3 ) paraelektrisch mit einem Temperaturverhalten gemäß χe =
C , T − TC
(12-118)
das dem Curie-Weiss’schen Gesetz (siehe 13.4) entspricht. Andere Ferroelektrika werden für T > T C piezoelektrisch (siehe unten), z. B. Seignettesalz (Kaliumnatriumtartrat KNaC4 H4 O6 · 4 H2 O) oder KDP (Kaliumdihydrogenphosphat KH2 PO4 ).
B139
B140
B Physik
Piezoelektrizität
Elektrische Polarisation kann bei manchen polaren Kristallen auch durch mechanischen Druck erzeugt werden, sofern sie kein Symmetriezentrum besitzen. Dabei werden die positiven und negativen Ionen so gegeneinander verschoben, dass ein elektrisches Dipolmoment entsteht. Beispiele sind Quarz, Seignettesalz, Bariumtitanat. Einen besonders hohen piezoelektrischen Effekt zeigen speziell entwickelte Piezokeramiken wie Bleizirkonattitanat. Der piezoelektrische Effekt ist umkehrbar: Die Anlegung einer elektrischen Spannung bewirkt eine Längenänderung. Anwendungen: Frequenznormale mit Schwingquarzen, Frequenzfilter für die Nachrichtentechnik, piezoelektrische Druckmesser und Stellglieder, Erzeugung von Ultraschall, Erzeugung von Hochspannungspulsen.
13 Magnetische Wechselwirkung 13.1 Das magnetostatische Feld, stationäre Magnetfelder Magnetische Wechselwirkungen sind seit dem Altertum bekannt, z. B. die Kraftwirkungen des als Erz vorkommenden Magneteisensteins Fe3 O4 auf Eisen. Der Name Magnetismus ist abgeleitet von der kleinasiatischen Stadt Magnesia, wo der Überlieferung nach das Phänomen erstmals beobachtet wurde. Die magnetische Wechselwirkung tritt im Gegensatz zur Gravitation nicht bei allen Körpern auf, und im Gegensatz zur elektrischen Wechselwirkung wirkt sie nicht auf normale Isolatoren. Bei natürlich vorkommenden oder künstlich erzeugten Magneten konzentriert sich die magnetische Wechselwirkung auf bestimmte Gebiete: Magnetpole. Jeder Magnet hat mindestens zwei Pole (magnetischer Dipol): Nordpol und Südpol. Magnetische Einzelpole (Monopole) sind bisher nicht beobachtet worden. Auch das Durchtrennen eines Dipols (z. B. Zerbrechen eines Stabmagneten) ergibt keine magnetischen Monopole, sondern erneut zwei Dipole. Gleichnamige Magnetpole stoßen sich ab, ungleichnamige ziehen sich an. Im Magnetfeld der Erde richten sich drehbar gelagerte Stabmagnete (Magnetnadeln) so aus, dass der Nordpol nach Norden zeigt. Der
Nordpol der Erde ist daher ein magnetischer Südpol (und umgekehrt). Die Geometrie des Feldes eines magnetischen Dipols lässt sich wie beim elektrischen Feld durch Feldlinien beschreiben, deren Verlauf durch die ausrichtende Wirkung des Magnetfeldes auf längliche magnetische Teilchen (z. B. Eisenfeilspäne) erkennbar gemacht werden kann (Bild 13-1). Sie entspricht der des elektrischen Dipols (Bild 12-4). Der positive Richtungssinn der magnetischen Feldlinien wurde von Nord nach Süd festgelegt. Magnetfelder können außer von Permanentmagneten (magnetostatische Felder) auch durch elektrische Ströme erzeugt werden (Ørsted, 1820). Zeitlich und örtlich konstante Ströme erzeugen stationäre Magnetfelder. Ursache sind die bewegten elektrischen Ladungen. Die magnetischen Feldlinien eines geraden, stromdurchflossenen Leiters sind konzentrische Kreise mit dem Leiter als Achse (Bild 13-2). Der Richtungssinn der magnetischen Feldlinien ergibt sich aus der Stromrichtung mithilfe der Rechtsschraubenregel und ist verträglich mit der Festlegung in Bild 13-1. Die Feldlinien geben die Richtung der magnetischen Feldstärke H an. Die magnetische Feldstärke wird üblicherweise durch das Feld im Innern einer langen, stromdurchflossenen
Bild 13-1. Feld eines magnetischen Dipols
Bild 13-2. Magnetisches Feld eines geraden, stromdurch-
flossenen Leiters
13 Magnetische Wechselwirkung
weges C übereinstimmt (Bild 13-3). Bei räumlich ausgedehnten Ladungsströmen berechnet sich die Durchflutung gemäß (12-58) aus der Stromdichte j durch A. Die Formulierung des Durchflutungssatzes (13-1) in differenzieller Form, die sich durch Anwendung des Stokes’schen Satzes (siehe A 17.3, (17-29)) gewinnen lässt, lautet rot H(r) = j .
Bild 13-3. Zum Begriff der Durchflutung
Zylinderspule definiert ((13-5), Bild 13-4). Wir wollen stattdessen vom allgemeineren Zusammenhang zwischen magnetischer Feldstärke H und felderzeugendem Strom I ausgehen, dem Ampère’schen Gesetz oder Durchflutungssatz: 0 " H · ds = Θ = j · dA . (13-1) C
A
Das Ampère’sche Gesetz ist eine der Feldgleichungen des stationären magnetischen Feldes. Das Linienintegral über die magnetische Feldstärke längs des geschlossenen Weges C wird magnetische Umlaufspannung genannt. Θ ist die gesamte elektrische Stromstärke, die durch die von C berandete Fläche A geht: Durchflutung. Bei mehreren Einzelströmen berechnet sich diese durch Summation unter Berücksichtigung der Vorzeichen. Ströme werden positiv gerechnet, wenn ihre Richtung mit der sich aus der Rechtsschraubenregel ergebenden Richtung gemäß dem gewählten Umlaufsinn des Integrations-
(13-2)
Im Gegensatz zum elektrostatischen Feld ist also das stationäre magnetische Feld nicht wirbelfrei. Für den geraden, stromdurchflossenen Leiter (Bild 13-2) liefert das Ampère’sche Gesetz bei Wahl einer kreisförmigen Feldlinie als Integrationsweg (Abstand r vom Leiter) den Betrag der magnetischen Feldstärke H=
I . 2πr
(13-3)
Das Feld einer Zylinderspule (Bild 13-4) ist im Innern weitgehend homogen, während das Feld im Außenraum dem eines Dipols (Bild 13-1) entspricht und klein gegen die Feldstärke im Innern ist, sofern die Länge l der Zylinderspule groß gegen den Spulendurchmesser ist. Die Feldstärke im homogenen Bereich lässt sich ebenfalls mit dem Ampère’schen Gesetz berechnen. Wird als Integrationsweg z. B. die Feldlinie C gewählt, so liefert nur der Weg der Länge l im Spuleninnern einen wesentlichen Beitrag zum Integral. Die Durchflutung ist andererseits NI (N Windungszahl der Spule, I Stromstärke): " 0 H · ds = H · ds = Hl = Θ = NI . (13-4) C
l
Für das homogene Feld der langen Zylinderspule gilt daher H=
Bild 13-4. Homogenes Magnetfeld im Inneren und Dipolfeld im Außenraum einer stromdurchflossenen Zylinderspule
IN . l
(13-5)
Mithilfe der Zylinderspule lässt sich leicht ein definiertes homogenes Magnetfeld erzeugen, dessen Feldstärke sich sehr einfach aus (13-5) berechnen lässt. Hieraus lässt sich auch die Einheit der magnetischen Feldstärke H ablesen: SI-Einheit: [H] = A/m .
B141
B142
B Physik
Zum Magnetfeld eines stromdurchflossenen Leiters tragen alle Elemente des Stromes bei. Jedes einzelne Element der Länge dl (Bild 13-5) erzeugt im Abstand r einen differenziellen Anteil dH der magnetischen Feldstärke (vgl. G 12.2) gemäß dem BiotSavart’schen Gesetz: I r × dl · , 4π r3 I dl · sin α . (13-6) Betrag : dH = 4π r2 Die gesamte magnetische Feldstärke H ergibt sich aus (13-6) durch Integration über den ganzen Stromfaden C: " r × dl I . (13-7) H= 4π r3 dH =
C
Diese Form des Biot-Savart’schen Gesetzes stellt eine spezielle Form des allgemeineren Durchflutungssatzes (13-1) dar. Je nach Geometrie der Anordnung ist (13-1) oder (13-7) zur Berechnung der Feldstärke besser geeignet. Die Anwendung von (13-7) auf das Magnetfeld eines geraden, stromdurchflossenen Leiters liefert dasselbe Ergebnis wie (13-3), jedoch ist hier die Berechnung über (13-1) einfacher. Für die Berechnung des Magnetfeldes einer Stromschleife (Bild 13-6) ist dagegen (13-7) zweckmäßiger. Für das Magnetfeld im Zentrum der kreisförmigen Stromschleife (Radius R) ergibt sich aus (13-7) nach Integration über den gesamten Kreisstrom H=
I . 2R
(13-8)
Bild 13-6. Das Magnetfeld einer Stromschleife (links
stromerzeugende Spannungsquelle U nicht eingezeichnet)
Ψ = Q, wobei der elektrische Fluss durch (12-12) bzw. (12-15) definiert wurde. Obwohl im magnetischen Feld magnetische Einzelladungen (Monopole) nicht existieren, lässt sich analog zu (12-12) bzw. (12-15) ein magnetischer Fluss Φ sowie analog zu (12-13) eine magnetische Flussdichte B definieren. Diese beiden Größen werden es gestatten, die Wirkungen des magnetischen Feldes auch in Materie zu beschreiben (vgl. 13.4). In einem homogenen Magnetfeld sei der magnetische Fluss durch eine zur Feldrichtung senkrechte Fläche A (Bild 13-7a) definiert durch Φ = μHA ,
(13-9)
und entsprechend der Betrag der magnetischen Flussdichte B=
Φ = μH . A
(13-10)
Hierin wird μ die Permeabilität des Stoffes genannt, in dem das Magnetfeld vorliegt. Wie die Permittivi-
Magnetischer Fluss
Nach dem Gauß’schen Gesetz des elektrischen Feldes (12-17) bzw. (12-104) ist der von einer elektrischen Ladung Q ausgehende elektrische Fluss
Bild 13-5. Zum Biot-Savart’schen Gesetz
Bild 13-7. Zur Definition des magnetischen Flusses. a ho-
mogenes, b inhomogenes Feld
13 Magnetische Wechselwirkung
tät ε = εr ε0 (12-79) wird auch die Permeabilität als Produkt μ = μr μ0
(13-11)
geschrieben, worin nach internationaler Vereinbarung (9. CGPM (1948), Definition des Ampere) μ0 = 4π · 10−7 V s/A m = 1,2566370614 . . . · 10−6 V s/A m
(13-12)
die magnetische Feldkonstante (Permeabilität des Vakuums) ist. μr = μ/μ0 wird Permeabilitätszahl des Stoffes genannt und ist dimensionslos. Für das Vakuum ist μr = 1. Weiteres zur Permeabilitätszahl siehe 13.4. Die magnetische Flussdichte B wird auch magnetische Induktion genannt und ist in magnetisch isotropen Stoffen ein Vektor in Richtung der magnetischen Feldstärke H: B = μ0 μr H = μH .
(13-13)
In Verallgemeinerung von (13-9) ist der magnetische Fluss Φ eines beliebigen (inhomogenen) Magnetfeldes durch eine beliebig orientierte Fläche A (Bild 13-7b) " " μH · dA = B · dA , (13-14) Φ= A
A
SI-Einheit: [Φ] = V s = Wb (Weber) , SI-Einheit: [B] = V s/m2 = Wb/m2 = T (Tesla) . Im elektrischen Feld ergibt das Flächenintegral der elektrischen Flussdichte über eine geschlossene Oberfläche nach (12-17) bzw. (12-104) gerade die eingeschlossene Ladung Q als Quellen des elektrischen Feldes und Ausgangspunkt elektrischer Feldlinien. Im magnetischen Feld gibt es dagegen keine magnetischen Einzelladungen als Quellen des magnetischen Feldes bzw. als Ausgangspunkt magnetischer Feldlinien. Magnetische Feldlinien sind daher stets geschlossene Linien, auch im Falle der Permanentmagnete (Bild 12-1), wo man sich die äußeren Feldlinien im Innern des Magneten geschlossen denken kann. Dies wird durch Zerbrechen des Magneten bestätigt, wobei zwei neue magnetische Dipole entstehen. Wegen der Nichtexistenz magnetischer Monopole muss das Flächenintegral der
Bild 13-8. Zum Gauß’schen Gesetz im magnetischen Feld; eindringende magnetische Feldlinien enden nicht im von S umschlossenen Volumen: Der gesamte magnetische Fluss durch eine geschlossene Oberfläche ist stets null
magnetischen Flussdichte über eine geschlossene Oberfläche S (Bild 13-8) null ergeben (Gauß’sches Gesetz des magnetischen Feldes): 0 B · dA = 0 .
(13-15)
S
Feldlinien, die in das von der Oberfläche eingeschlossene Volumen eintreten, müssen an anderer Stelle wieder austreten (Bild 13-8). Gleichung (13-15) stellt die zweite Feldgleichung des magnetischen Feldes dar und drückt die Quellenfreiheit des magnetischen Feldes aus.
13.2 Die magnetische Kraft auf bewegte Ladungen Teilchen, die eine elektrische Ladung q tragen und sich mit einer Geschwindigkeit v durch ein Magnetfeld B = μH bewegen (Bild 13-9), z. B. die Elektronen im Elektronenstrahl einer Fernsehbildröhre durch das Magnetfeld der Ablenkspulen, erfahren eine ablenkende Kraft Fm , die senkrecht zu v und zu B wirkt: Fm = qv × B = μqv × H .
(13-16)
Bild 13-9. Ablenkung von bewegten Ladungsträgern im
Magnetfeld
B143
B144
B Physik
Positiv und negativ geladene Teilchen erfahren ablenkende magnetische Kräfte in entgegengesetzten Richtungen (Bild 13-9). Die magnetische Kraft leistet keine Arbeit an der Ladung q, da die Kraft Fm stets senkrecht auf der Wegrichtung ds bzw. auf der Geschwindigkeit v steht, und das Wegintegral der Kraft daher verschwindet: " " W= Fm · ds = Fm · vdt = 0 . (13-17) Anders als im elektrischen Feld erfährt daher eine elektrische Ladung im Magnetfeld keine Änderung des Geschwindigkeitsbetrages. Liegt neben dem magnetischen Feld B auch ein elektrisches Feld E vor, so wirkt insgesamt auf die Ladung q die Lorentz-Kraft F = q(E + v × B) .
(13-18)
Hinweis: Oft wird der 2. Term in (13-18) allein als Lorentz-Kraft bezeichnet. Die magnetische Kraft als relativistische Korrektur der elektrischen Kraft
Die elektrostatische Kraft Fe = qE und die magnetische Kraft Fm = qv × B sind keine grundlegend verschiedenen Wechselwirkungen. Vielmehr lässt sich zeigen, dass die magnetische Kraft als relativistische Korrektur der elektrostatischen Kraft aufgefasst werden kann. Dies sei am Beispiel der Kraft auf eine Ladung gezeigt, die sich mit der Geschwindigkeit v parallel zu einem stromdurchflossenen Leiter bewegt (Bild 13-10). Der Strom I im Leiter erzeugt nach (13-3) im Abstand r ein Magnetfeld H = I/(2πr). Daraus ergibt sich nach (13-16) eine
Bild 13-10. Magnetische Kraft auf eine bewegte Ladung im
Feld eines Stromes: Beschreibung a im Laborsystem und b im Bezugssystem der bewegten Ladung q
magnetische Kraft auf die bewegte Ladung q (im Vakuum) vom Betrag Fm = μ0 qv
I . 2πr
(13-19)
Der Strom I im Leiter wird durch Elektronen der Driftgeschwindigkeit vdr (siehe 12.6) im Laborsystem erzeugt, während die im Leiter ortsfesten positiven Ionen im Laborsystem die Geschwindigkeit 0 besitzen (Bild 13-10a). Wir wollen nun die Verhältnisse im Bezugssystem der mit v bewegten Ladung q betrachten (Bild 13-10b). In diesem System hat q die Geschwindigkeit 0, erfährt also keine magnetische Kraft. Die real auf q wirkende Kraft (13-19) kann jedoch nicht von der Wahl des Koordinatensystems abhängen. Tatsächlich wird sie im mit v bewegten System in derselben Größe durch die CoulombKraft geliefert: Im bewegten System haben die positiven lonen die Geschwindigkeit |−v|, die Elektronen die größere Geschwindigkeit |−v | ≈ |−v + vdr | = v + vdr (vgl. (2-50) für β 1). Infolgedessen ist die unterschiedliche relativistische Längenkontraktion (Lorentz-Kontraktion, vgl. 2.3.3) zu berücksichtigen, wonach die Längen in Richtung der Bewegung
sich um den Lorentz-Faktor 1 − v2 /c20 für die Ionen
bzw. um 1 − (v + vdr )2 /c20 für die Elektronen verkürzen. Dadurch erhöhen sich die Ladungsträgerkonzentrationen n− und n+ unterschiedlich stark gegenüber n0 (bei v = 0). Die Gesamtladung ist daher nicht mehr null, der stromführende Leiter erscheint negativ geladen und übt eine elektrostatische Coulomb-Kraft auf die Ladung q aus. In der Näherung c0 v vdr ergibt sich ein Überschuss der Konzentration der negativen Ladungsträger n0 n0 Δn = − 2 1 − (v + vdr )2 /c0 1 − v2 /c20 n0 vvdr ≈ . (13-20) c20 Für die resultierende Linienladungsdichte qL = −AeΔn des stromdurchflossenen Leiters (Querschnitt A, Elektronenladung −e) erhält man aus (13-20) mit c20 = 1/ε0 μ0 (vgl. 12) und (19.1) und mit I = −n0 evdr A gemäß (12-59) qL = −ε0 μ0 vn0 evdr A = ε0 μ0 vI .
(13-21)
13 Magnetische Wechselwirkung
Daraus ergibt sich gemäß (12-22) eine elektrische Feldstärke E=
μ0 vI qL = 2πε0 r 2πr
(13-22)
und weiter eine anziehende elektrische Kraft Fe = qE auf die Ladung q, mit (13-8) Fe = μ0 qv
I = μ0 qvH , 2πr
(13-23)
die identisch mit der im Laborsystem berechneten magnetischen Kraft (13-19) ist. Je nach dem gewählten Bezugssystem kommt daher der magnetische oder der elektrische Term der Lorentz-Kraft zur Wirkung, beide sind Ausdruck derselben elektromagnetischen Kraft. In dem betrachteten Beispiel ist zwar wegen der geringen Driftgeschwindigkeit der Elektronen (Größenordnung mm/s, siehe 12.6) der aus der Lorentz-Kontraktion folgende relative Unterschied in den Ladungsträgerkonzentrationen der Gitterionen und der Leitungselektronen extrem klein. Das wird hinsichtlich der elektrostatischen Wirkung jedoch ausgeglichen durch die gewaltige Ladungsmenge, die sich durch den Leiter bewegt. Bewegung von Ladungsträgern im homogenen Magnetfeld
Elektrische Ladungen q, die sich senkrecht zu den Feldlinien eines homogenen Magnetfeldes B bewegen, z. B. der Elektronenstrahl, der mit einer Vakuumdiode (ähnlich Bild 12-15, mit durchbohrter Anode) im Magnetfeld erzeugt wird (Bild 13-11), erfahren nach (13-16) eine magnetische Kraft senkrecht zur Ladungsgeschwindigkeit v und zum Magnetfeld B. Ihr Betrag Fm = qvB
(13-24)
bleibt konstant, da – wie weiter oben bereits erläutert – der Betrag v der Geschwindigkeit der Ladungsträger sich durch eine stets senkrecht wirkende Kraft nicht ändert. Das führt zu einer Kreisbahn der Ladungsträger mit der Masse m. Die magnetische Kraft (13-24) wirkt hierbei als Zentralkraft (3-19) mv2 = qvB , r
(13-25)
Bild 13-11. Kreisbahn einer Ladung im homogenen Ma-
gnetfeld
woraus für den Kreisbahnradius folgt mv . r= qB
(13-26)
Die in Bild 13-9 gezeigte Ablenkung eines Elektrons, das ein begrenztes Magnetfeld der Länge l auf einem Kreisbogenstück durchläuft, lässt sich mit (13-26) berechnen zu eB l l für l r . (13-27) ϑ≈ ≈ r me v (Anwendung bei der magnetischen Ablenkung des Elektronenstrahls in der Fernsehbildröhre.) Mit v = ωr (2-29) folgt für die Winkelgeschwindigkeit der Ladung der Betrag ωc = qB/m, bzw. unter Berücksichtigung der Vektorrichtungen in Bild 13-11 die Zyklotronfrequenz q ωc = − B . (13-28) m Die Zyklotronfrequenz ist unabhängig von der Geschwindigkeit v der Ladung sowie vom Bahnradius r. Diese Eigenschaften ermöglichen den Bau von Kreisbeschleunigern nach dem Zyklotronprinzip. Ferner ermöglicht die Zyklotronresonanz die Messung der effektiven Massen m∗ = qB/ωc der Ladungsträger in Halbleitern (siehe 16.4). Bei Ladungsträgern, deren Geschwindigkeit v parallel zur magnetischen Flussdichte B gerichtet ist, tritt nach (13-16) keine magnetische Kraft auf, da das Vektorprodukt paralleler Vektoren verschwindet. In diesem Fall bewegt sich die Ladung geradlinig mit konstanter Geschwindigkeit. Bei schiefer Geschwindigkeitsrichtung der Ladungsträger im Magnetfeld erhält man eine Überlagerung von geradliniger Bewegung für die Parallelkomponente und Kreisbewegung für
B145
B146
B Physik
die Normalkomponente der Geschwindigkeit, sodass eine Schraubenbewegung resultiert. Diese verschiedenen Situationen treten auch beim Einfall geladener Teilchen von der Sonne („Sonnenwind“) auf die Magnetosphäre der Erde auf. Das magnetische Dipolfeld der Erde hat an den Polen eine Feldrichtung senkrecht zur Erdoberfläche, am Äquator parallel zur Erdoberfläche. Die Bahn von Sonnenwindteilchen, die in der Äquatorebene einfallen, wird durch die magnetische Kraft zu Schraubenbahnen aufgewickelt. Sie treffen daher meist nicht auf die Erdatmosphäre, haben aber eine erhöhte Aufenthaltsdauer in diesem Gebiet: VanAllen-Strahlungsgürtel. Anders an den Polen: Dort auftreffende Teilchen bewegen sich etwa parallel zu den Erdfeldlinien und gelangen daher nahezu ungehindert bis zur oberen Erdatmosphäre, wo sie u. a. durch Stoßanregung (siehe 20.4) Moleküle zum Leuchten anregen können: Polarlichter.
senkrecht zur Dosenebene von einem Magnetfeld B durchsetzt wird. Eine im Zentrum des Spaltes S angeordnete Ionenquelle (z. B. ein durch Elektronenstoß ionisierter Dampfstrahl) emittiert Ionen der Ladung q, die durch die zwischen den beiden Ds angelegte Spannung U in das eine D beschleunigt werden. Im Magnetfeld B laufen die Ionen mit einer Winkelgeschwindigkeit entsprechend der Zyklotronfrequenz (13-28) auf Kreisbahnen mit einem Radius nach (13-26) um. Wird die Spannung U während jedes halben Umlaufes umgepolt, so werden die Ionen bei jedem Passieren des Spaltes S entsprechend der Spannung U = U0 beschleunigt, und v und r nehmen entsprechend zu. Da die Winkelgeschwindigkeit nach (13-28) unabhängig von r ist, lässt sich die periodische Umpolung durch Anlegen einer Hochfrequenzwechselspannung
Kreisbeschleuniger
erreichen. Die Grenze der Beschleunigung ist bei r = R0 erreicht. Die Endenergie Ek, max = mv2 /2 beträgt dann mit (13-26)
Die Anwendung der magnetischen Kraft erlaubt es, die großen Längen der Linearbeschleuniger (12.5, Bild 12-16) zur Teilchenbeschleunigung zu vermeiden, indem durch ein Magnetfeld die Teilchenflugbahn zu Kreis- oder Spiralbahnen aufgewickelt wird. Dieses Prinzip wurde zuerst beim Zyklotron (E. O. Lawrence, 1930) angewendet. Es besteht aus einer flachen Metalldose, die zu zwei D-förmigen Drifträumen aufgeschnitten ist (Bild 13-12) und
U = U0 sin ωt
Ek, max =
mit ω = ωc =
q 2 B2 2 R < m0 c20 . 2m 0
q B m
(13-29)
(13-30)
Die Resonanzbedingung ω = ωc (13-29) ist beim Zyklotron nicht mehr erfüllt, wenn relativistische Geschwindigkeitsbereiche erreicht werden (siehe 4.5). Das ist der Fall, wenn die kinetische Energie vergleichbar oder größer als die Ruheenergie m0 c20 wird. Wegen der mit der Umlaufzahl steigenden Masse (Bild 12-14) sinkt dann die Zyklotronfrequenz, und die Resonanzbedingung bleibt nur erhalten, wenn mit der Umlaufzahl die Hochfrequenz ω gesenkt oder das Magnetfeld B erhöht wird: Synchrozyklotron. Wird das Magnetfeld mit zunehmender Umlaufzahl entsprechend der steigenden Teilchenenergie in der Weise erhöht, dass der Bahnradius (13-26) konstant bleibt (Sollkreis), so lassen sich sehr hohe Energien erreichen: Synchrotron. Massenspektrometer
Bild 13-12. Kreisbeschleuniger für geladene Teilchen:
Zyklotron
Die magnetische Kraft kann auch zur Bestimmung der Masse geladener Teilchen im magnetischen Massenspektrometer verwendet werden (Bild 13-13). Durch eine Spannung U beschleunigte Ionen werden
13 Magnetische Wechselwirkung
Ladungsträger (d. h. auf die Leitungselektronen bei Metallen) die Lorentz-Kraft (13-18). Der elektrische Anteil −eE bewirkt die Driftgeschwindigkeit vdr der Elektronen. Infolge der Driftgeschwindigkeit wirkt auf jedes einzelne Elektron die magnetische Kraft Fe = −evdr × B . Bild 13-13. Magnetisches Massenspektrometer
in ein Magnetfeld B eingeschossen. Der Kreisbahnradius berechnet sich aus (13-26) mit (12-53) zu m 1 2 U, (13-31) r= B q woraus die spezifische Ladung q/m bestimmt werden kann: 2U q = . m r 2 B2
(13-32)
(13-33)
Die Zahl N der Leitungselektronen (Ladungsträgerkonzentration n) im Leiterstück der Länge l und vom Querschnitt A beträgt N = nlA. Insgesamt wirkt auf das Leiterstück eine Kraft vom Betrage F = N Fe = −nlAevdr × B = nevdr Al × B , (13-34) wobei zu beachten ist, dass die Länge l in Richtung des Stromes I zeigt, d. h. bei Elektronen entgegengesetzt zur Driftgeschwindigkeit vdr . Der Faktor nevdr A ist nach (12-59) gleich der Stromstärke I, und somit F = Il × B , Betrag : F = IlB sin α .
(13-35)
Der Bahnradius r kann aus den Schwärzungsmarken auf der Fotoplatte bestimmt werden. Bei bekannter Ladung (meist ±e) ist daraus die Masse der Ionen zu berechnen.
Nach (13-35) wirkt auf einen stromdurchflossenen Draht als Folge der magnetischen Kraft auf die Ladungsträger eine Kraft senkrecht zur Drahtrichtung und zur magnetischen Feldrichtung. Dies ist die Grundlage der elektromechanischen Krafterzeugung, insbesondere des Elektromotors.
13.3 Die magnetische Kraft auf stromdurchflossene Leiter
Stromschleife im Magnetfeld, magnetischer Dipol
In einem stromdurchflossenen Draht im Magnetfeld (Bild 13-14) wirkt auf jeden den Strom bildenden
Bild 13-14. Kraft auf stromdurchflossene Leiter im Mag-
netfeld
Eine z. B. rechteckige, stromdurchflossene Leiterschleife, die in einem Magnetfeld drehbar angeordnet ist (Bild 13-15), erfährt bezüglich der einzelnen Schleifenstücke nach (13-35) unterschiedliche Kräfte. Auf die Stirnstücke (Länge b) wirken entgegengesetzt
Bild 13-15. Drehmoment einer stromdurchflossenen Leiterschleife im Magnetfeld
B147
B148
B Physik
gleichgroße Kräfte in Drehachsenrichtung, die sich kompensieren. Auf die beiden Längsseiten l wirkt ein Kräftepaar, das nach (3-23) ein Drehmoment (zur Unterscheidung von der Magnetisierung M in diesem Abschnitt mit dem Index d versehen) Md = b × F
(13-36)
in Drehachsenrichtung erzeugt. Mit (13-35) folgt daraus ein doppeltes Vektorprodukt, dessen Berechnung mittels des Entwicklungssatzes (siehe A 3.3.5) unter Verwendung des Flächennormalenvektors A der Stromschleife (Betrag A = bl) das Drehmoment Md = I A × B Betrag Md = IAB sin ϑ
(13-37)
ergibt. Die Richtung des Flächennormalenvektors A ist so festgelegt, dass sie sich aus der Stromflussrichtung mit der Rechtsschraubenregel ergibt. Eine stromdurchflossene Leiterschleife erfährt daher im homogenen Magnetfeld ein Drehmoment, das deren Flächennormale in Feldrichtung auszurichten sucht. Sie verhält sich also wie ein magnetischer Dipol (siehe 13.1) und analog zum elektrischen Dipol im homogenen elektrischen Feld (vgl. 12.9). Zur Beschreibung des Verhaltens eines magnetischen Dipols im Feld analog zum elektrischen Fall (12-87) führen wir durch Md = m × B
(13-38)
das magnetische Dipolmoment m ein (Anmerkung: Anders als bei der Einführung des elektrischen Dipolmoments p wird hier nicht die Feldstärke, sondern die Flussdichte B zur Berechnung des Drehmoments benutzt. Deshalb unterscheiden sich die weiter berechneten Ausdrücke für das Dipolmoment im elektrischen und im magnetischen Fall um die jeweilige Feldkonstante. Ferner ist wegen der Nichtexistenz magnetischer Ladungen (Monopole) die Einführung des magnetischen Dipolmomentes über eine Definitionsgleichung entsprechend (12-83) nicht sinnvoll). In entsprechender Weise können die Ausdrücke für die potenzielle Energie im homogenen Feld (12-89) und für die Kraft auf den Dipol im inhomogenen Feld (12-90) übernommen werden (Tabelle 13-1). SI-Einheit: [m] = A · m2 = J/T .
Durch Vergleich von (13-38) mit (13-37) erhält man das Dipolmoment einer Stromschleife als m = IA .
(13-39)
Schaltet man N Stromschleifen zu einer Zylinderoder Flachspule mit N Windungen zusammen, so ergibt sich für das magnetische Dipolmoment einer Spule mSp = NI A .
(13-40)
Wird eine drehbar gelagerte Spule im Magnetfeld nach Bild 13-15 z. B. durch eine Spiralfeder mit einem rücktreibenden Drehmoment versehen, so stellt sich bei Stromfluss im Drehmomentengleichgewicht ein Ausschlag Δϑ ein, der mit I ansteigt: Prinzip des Drehspulmessinstrumentes. Die gleiche Anordnung ohne rücktreibende Feder, aber mit einer Schleifkontakteinrichtung zur Umpolung der Stromrichtung bei ϑ = 0◦ und ϑ = 180◦ („Kommutator“) stellt die Grundanordnung eines elektrischen Gleichstrommotors dar. Das hierbei wirkende Drehmoment hat durch die Umpolung bei allen Drehwinkeln die gleiche Richtung. Tabelle 13-1. Vergleich: elektrischer Dipol – magnetischer
Dipol Drehmoment Potenzielle Energie
Kraft im inhomogenen Feld (Dipol Feld x)
elektridE Md = p × E Ep, dp = − p · E F = p scher dx Dipol magnetidB scher Md = m × B Ep, dp = −m · B F = m dx Dipol
Kräfte zwischen benachbarten Strömen
Zwei stromdurchflossene, parallele Drähte üben aufeinander Kräfte aus, da sich jeder der beiden Ströme im Magnetfeld des jeweils anderen befindet (Bild 13-16).
13 Magnetische Wechselwirkung
nomenologisch wird das nach (13-11) durch die Einführung der Permeabilitätszahl (relativen Permeabilität) μr im Zusammenhang (13-13) zwischen magnetischer Feldstärke H und magnetischer Flussdichte B beschrieben: B = μ0 μr H = μH . Bild 13-16. Kraftwirkung zwischen benachbarten Strömen
Die von I1 im Abstand r erzeugte magnetische Feldstärke beträgt nach (13-3) H1 =
I1 . 2πr
(13-41)
Dadurch erfährt der von I2 durchflossene Leiter auf der Länge l nach (13-35) eine Kraft F12 = μ0 I2 (l × H1 ) , l I1 I2 . Betrag F12 = μ0 2πr
(13-42)
Nach dem Reaktionsgesetz (3.3) wirkt auf I1 eine gleich große, entgegengesetzt gerichtete Kraft F21 . Aus (13-42) folgt, dass gleichgerichtete Ströme einander anziehen, während antiparallele Ströme einander abstoßen. Dieser Effekt wird zur Darstellung der Einheit der Stromstärke, des Ampere, ausgenutzt (siehe 1). Benachbarte Windungen in Spulen, die vom Strom gleichsinnig durchflossen werden, ziehen sich demnach an, während sich die gegenüberliegenden Teile einer Windung abstoßen. Eine stromdurchflossene Spule sucht sich daher zu verkürzen und gleichzeitig aufzuweiten. Solche Kräfte können ganz erhebliche Beträge annehmen und müssen bei der Konstruktion von Spulen berücksichtigt werden.
13.4 Materie im magnetischen Feld, magnetische Polarisation Wird Materie in ein magnetisches Feld gebracht, so bilden sich magnetische Dipolzustände aus: Die Materie erfährt eine magnetische Polarisation bzw. eine Magnetisierung; dabei bezeichnen diese beiden Ausdrücke sowohl den Vorgang der magnetischen Ausrichtung als auch zwei vektorielle Größen, die den resultierenden Zustand der Materie beschreiben. Phä-
(13-43)
Bei materieerfüllten Magnetfeldern wird also die magnetische Feldkonstante μ0 durch die Permeabilität μ = μ0 μr ersetzt. Analog zur Einführung der elektrischen Polarisation (12-100) kann die Änderung der magnetischen Flussdichte in Materie auch durch eine additive Größe zur Flussdichte B0 = μ0 H im Vakuum beschrieben werden, die magnetische Polarisation J gemäß B = B0 + J = μ0 H + J .
(13-44)
Anstelle der magnetischen Polarisation J kann auch eine zur Feldstärke H additive Größe, die Magnetisierung M zur Beschreibung der magnetischen Materieeigenschaften benutzt werden: B = μ0 (H + M) mit
M = J/μ0 .
(13-45) (13-46)
Die Magnetisierung hängt von der magnetischen Feldstärke H ab. In vielen Fällen (Diamagnetismus, Paramagnetismus) gilt die Proportionalität M = χm H ,
(13-47)
worin χm die sog. magnetische Suszeptibilität ist. Suszeptibilität und Permeabilitätszahl beschreiben gleichermaßen die magnetischen Eigenschaften eines Stoffes und sind verknüpft durch μr = 1 + χm ,
(13-48)
wie sich durch Einsetzen von (13-47) in (13-45) und Vergleich mit (13-43) zeigen lässt. Der Zusammenhang zwischen der Magnetisierung M eines zylindrischen Stabes und seinem magnetischen Moment mΣ in einem äußeren Magnetfeld H lässt sich durch Vergleich mit einer Zylinderspule gleicher Abmessungen herstellen, die so erregt wird, dass das durch sie erzeugte zusätzliche Magnetfeld Hz gerade der Magnetisierung M entspricht (Bild 13-17): Hz =
NI ≡M. l
(13-49)
B149
B150
B Physik
Tabelle 13-2. Magnetische Suszeptibilität einiger Stoffe
Stoff Diamagnetische Stoffe: Helium Wasserstoff Methan Stickstoff Argon Kohlendioxid Methanol Benzol Wasser Kupfer Glycerin Petroleum Aluminiumoxid Aceton Kochsalz Wismut Paramagnetische Stoffe: Sauerstoff Barium Magnesium Aluminium Platin Chrom Mangan flüssiger Sauerstoff Dysprosiumsulfat Ferromagnetische Stoffe: a Gusseisen Baustahl Übertragerblech Permalloy Ferrite
Bild 13-17. Zur Berechnung des magnetischen Moments ei-
nes magnetisierten Stabes
Das magnetische Moment mΣ des magnetisierten Stabes mit dem Volumen V = lA ist dann gleich dem der Spule gleichen Volumens und beträgt gemäß (13-40) mit (13-49) mΣ = NI A = MV .
(13-50)
Die Magnetisierung M = J/μ0 ist demnach gleich dem auf das Volumen bezogenen magnetischen Moment und ist damit der elektrischen Polarisation (12-91) analog: J mΣ M= . = (13-51) μ0 V Für das magnetische Moment mΣ eines magnetisierten Körpers gilt nach (13-50) mit (13-47) mΣ ∼ χm H. Je nach Vorzeichen von χm (Tabelle 13-2) erfährt daher ein magnetisierter Körper in einem inhomogenen Magnetfeld eine Kraft (Tabelle 13-1), die ihn in den Bereich größerer Feldstärke (für χm > 0) oder kleinerer Feldstärke (für χm < 0) treibt, d. h. in das Magnetfeld hineinzieht oder aus ihm herausdrängt (Bild 13-18). Je nach Wert der magnetischen Suszeptibilität χm werden die folgenden Fälle unterschieden: χm < 0, μr < 1 : Diamagnetismus χm > 0, μr > 1 : Paramagnetismus χm 0, μr 1 : Ferro-, Ferri- und Antiferromagnetismus. a
χm = μr − 1 −1,05 · 10−9 −2,25 · 10−9 −6,88 · 10−9 −8,60 · 10−9 −1,09 · 10−8 −1,19 · 10−8 −6,97 · 10−6 −7,82 · 10−6 −9,03 · 10−6 −9,65 · 10−6 −9,84 · 10−6 −1,09 · 10−5 −1,37 · 10−5 −1,37 · 10−5 −1,39 · 10−5 −1,57 · 10−4 1,86 · 10−6 6,94 · 10−6 1,74 · 10−5 2,08 · 10−5 2,57 · 10−4 2,78 · 10−4 8,71 · 10−4 3,62 · 10−3 6,32 · 10−1 50 . . . 500 100 . . . 2000 500 . . . 10 000 6000 . . . 70 000 10 . . . 1000
Maximalwerte aus größter Steigung der Hysteresekurve
Atomistische Deutung der magnetischen Eigenschaften von Materie
Bild 13-18. Kraftwirkung auf dia- und paramagnetische Körper im inhomogenen Magnetfeld eines Elektromagneten
Die magnetischen Eigenschaften von Materie sind durch die Wechselwirkung des Magnetfeldes in erster Linie mit den Elektronen der Atomhülle und deren magnetischen Momenten bedingt. Die Eigenschaften atomarer magnetischer Momente sind quantenmechanischer Natur. Eine anschauliche Behandlung ist problematisch. Dennoch können bestimmte magnetische
13 Magnetische Wechselwirkung
Nach Bohr hat der Bahndrehimpuls für die HauptQuantenzahl n = 1 den Wert L = (siehe 16.1.1; = h/2π Drehimpulsquantum, h Planck-Konstante). Damit folgt für das magnetische Moment der 1. Bohr’schen Bahn, das Bohr-Magneton: μB = Bild 13-19. Drehimpuls und magnetisches Moment eines kreisenden Atomelektrons
Eigenschaften gemäß dem Rutherford-Bohr’schen Atommodell (siehe 16.1, Behandlung der Atomelektronen als Kreisstrom mit dem positiven Atomkern im Zentrum) anschaulich gemacht und teils richtig, teils nur qualitativ zutreffend berechnet werden. Im Bohr’schen Bild ist der Bahnmagnetismus eines um den Atomkern kreisenden Elektrons leicht richtig zu berechnen (Bild 13-19). In Bezug auf den Atomkern hat das kreisende Elektron einen Bahndrehimpuls (3-28) L = me r × v = me ωr2 .
(13-52)
Das rotierende Elektron mit der Umlauffrequenz ν = ω/2π stellt ferner einen Kreisstrom dar: dQ ωe I= = −νe = − . dt 2π
(13-53)
Nach (13-39) ist damit ein magnetisches Moment μL = IA verknüpft, für das sich mit (13-52) und (13-53) ergibt μL = −
e L. 2me
(13-54)
(Bei atomaren Teilchen werden magnetische Momente mit μ anstatt mit m bezeichnet.) Dass atomare Drehimpulse mit magnetischen Momenten μL = −γL
(13-55)
verknüpft sind, wird als magnetomechanischer Parallelismus bezeichnet und wurde durch den Einsteinde-Haas-Effekt makroskopisch nachgewiesen. γ heißt gyromagnetisches Verhältnis und hat demnach für den Bahnmagnetismus des Elektrons den Wert γ=
e . 2me
(13-56)
e = (9,27400899 ± 37 · 10−8 ) · 10−24 J/T . 2me (13-57)
Neben dem Bahndrehimpuls und dem damit verbundenen magnetischen Moment besitzt das Elektron außerdem einen Eigendrehimpuls oder Spin S vom Betrage S = /2. Auch der Spin ist mit einem magnetischen Moment verknüpft, dessen Betrag ebenfalls durch das Bohr’sche Magneton gegeben ist. Je nach Aufbau der atomaren Elektronenhülle und der chemischen Bindungsstruktur in Molekülen und Festkörpern und der daraus resultierenden Gesamtwirkung der mit den Bahn- und Eigendrehimpulsen verknüpften magnetischen Momente ergeben sich unterschiedliche magnetische Eigenschaften, deren Grundzüge kurz besprochen werden sollen. Diamagnetismus
Die meisten anorganischen und fast alle organischen Verbindungen sind diamagnetisch, d. h., sie schwächen das äußere Feld: χm < 0, μr < 1. Ursache des Diamagnetismus sind die durch das Einschalten des äußeren Magnetfeldes in den Atomen (Molekülen, Ionen) des Stoffes induzierten magnetischen Momente. Diamagnetika sind daher magnetische Analoga zu den unpolaren Dielektrika (siehe 12.9, Verschiebungspolarisation). Es werde zunächst eine einzelne Elektronenkreisbahn um den Atomkern betrachtet (z. B. die des i-ten Elektrons der Elektronenhülle), deren Flächennormalenvektor senkrecht zum äußeren Magnetfeld H stehen möge (Bild 13-20). Das magnetische Moment μL erfährt dadurch nach (13-38) ein Drehmoment Md = μL × B. Wegen des nach (13-54) mit μL gekoppelten Bahndrehimpulses L wirkt Md auch auf L und erzeugt eine Kreiselpräzession mit der Präzessionskreisfrequenz ωL = Md /L (vgl. 7.4). Mit (13-54) folgt daraus die Larmor-Frequenz ωL = μ0
e e H= B. 2me 2me
(13-58)
B151
B152
B Physik
der mittlere quadratische Abstand aller Z Elektronen von der Präzessionsdrehachse ist, wenn diese mit der z-Achse zusammenfällt. Unter der Annahme, dass die Z Elektronen kugelsymmetrisch um den Atomkern verteilt sind, gilt für den mittleren Kernabstand r¯ der Elektronen 2 1 2 1 2 r¯ ≈ r = x2 = y2 = z2 und ¯ 2 ≈ r¯2 . (13-63) 3 3 3
Bild 13-20. Präzessionswirkung eines äußeren Magnetfeldes auf atomare Elektronenbahnen
Die Präzession der Elektronenbahn mit der Frequenz νL um die Feldrichtung B bedeutet einen zusätzlichen Kreisstrom I senkrecht zur Elektronenkreisbahn, für den sich mit (13-58) ergibt: I = −νL e = −
e2 B. 4πme
(13-59)
Daraus folgt ein durch das Einschalten des äußeren Feldes B induziertes magnetisches Moment, das sich nach (13-39) mit A = π ¯ 2i berechnen lässt. Die Präzession ist langsam gegen die Umlaufzeit des Elektrons i auf seiner Kreisbahn. Für die Fläche A des Präzessionskreisstromes I muss daher ein mittlerer Abstand ¯ i von der Präzessionsdrehachse angesetzt werden. Mit m = IA (13-39) und (13-59) folgt für das induzierte magnetische Moment des i-ten Elektrons mi = −
e2 ¯ 2i B, 4me
(13-60)
das dem äußeren Feld B entgegengerichtet ist, dieses also schwächt. Ein Atom der Ordnungszahl Z (siehe 16.1) enthält Z Elektronen in der Hülle. Bei Einschalten des Magnetfeldes liefert jedes Elektron einen Beitrag mi . Das gesamte induzierte magnetische Moment eines Atoms beträgt daher m=
Z
Ze2 ¯ 2 B, 4me
(13-61)
¯ 2 ≈ 2 = x2 + y2
(13-62)
i=1
mi = −
worin
Damit folgt für das induzierte magnetische Moment eines Atoms aus (13-61) m=−
Ze2 r¯2 B, 6me
(13-64)
und bei einer Atomzahldichte n für die Magnetisierung diamagnetischer Stoffe (13-47) M = nm = −n
Ze2 r¯2 μ0 H = χdia H , 6me
(13-65)
die dem äußeren Magnetfeld proportional ist. Die magnetische Suszeptibilität für Diamagnetika beträgt daher χdia = −μ0
Ze2 r¯2 n T C .
(13-69)
14 Zeitveränderliche elektromagnetische Felder Statische, d. h. zeitunabhängige, elektrische und magnetische Felder folgen teilweise sehr ähnlichen Gesetzen (vgl. 13 u. 14). Eine Verknüpfung beider Felder geschah bisher jedoch allein über das dem ØrstedVersuch zugrunde liegende Phänomen der Erzeugung eines statischen Magnetfeldes durch einen stationären elektrischen Strom (13.1), das durch das Ampère’sche Gesetz (Durchflutungssatz (13-1) beschrieben wird. Ferner wirkt auf bewegte elektrische Ladungen und auf elektrische Ströme die magnetische Kraft (13-16) bzw. (13-35), die in 13.2 bereits als relativistische Ergänzung der elektrostatischen Kraft erkannt wurde. Der innere Zusammenhang beider Felder wird jedoch erst bei der Betrachtung zeitveränderlicher magnetischer und elektrischer Felder deutlich.
14.1 Zeitveränderliche magnetische Felder: Induktion Die elektromagnetische Induktion (Faraday, 1831; Henry, 1832) ist das Arbeitsprinzip des Generators, des Transformators und vieler anderer Einrichtungen, auf denen die heutige Elektrotechnik beruht, siehe Kap. G.
Bild 14-1. Induktion durch zeitliche Änderung des magne-
tischen Flusses
Induktion durch zeitveränderliche Magnetfelder
Wird z. B. durch eine stromdurchflossene Spule (Bild 14-1) oder mittels eines Permanentmagneten ein magnetisches Feld erzeugt, das gleichzeitig mit einem Fluss Φ eine Leiterschleife durchsetzt, so wird mit einem an die Leiterschleife angeschlossenen Spannungsmessinstrument (z. B. Drehspulmessinstrument, siehe 13.3) dann eine induzierte Spannung beobachtet, wenn der durch die Leiterschleife gehende magnetische Fluss Φ sich zeitlich ändert, etwa durch Änderung des Stromes in der felderzeugenden Spule, oder durch Abstandsänderung des Permanentmagneten, oder durch Kippung des induzierenden Feldes gegen die Schleifenfläche: Induktion. Experimentell ergibt sich das Induktionsgesetz ui = −N
dΦ , dt
(14-1)
worin N die Zahl der Windungen der Leiterschleife ist, in Bild 14-1a also N = 1. Das Minuszeichen kennzeichnet, dass die Richtung des induzierten elektrischen Feldes bzw. der induzierten Spannung sich aus der Feldänderungsrichtung entgegengesetzt dem Rechtsschraubensinn ergibt. Ein zeitlich veränderliches Magnetfeld erzeugt also offenbar ein elektrisches Feld, das den magnetischen Fluss umschließt (Bild 14-1b). Es ist nicht an einen vorhandenen Leiter geknüpft, sondern auch im Vakuum vorhanden (wie z. B. die Anwendung zur Elektronenbeschleunigung im Betatron nachweist). Induktion in bewegten Leitern im Magnetfeld
In einem zeitlich konstanten Magnetfeld lassen sich induzierte Spannungen dadurch erzeugen, dass die
14 Zeitveränderliche elektromagnetische Felder
Leiterschleife oder Teile davon im Magnetfeld bewegt werden. In diesem Fall lässt sich die induzierte Spannung mithilfe der magnetischen Kraft auf die Leitungselektronen berechnen. Dazu werde die in Bild 14-2 dargestellte, besonders einfache Geometrie betrachtet, wobei nur das Leiterstück der Länge l senkrecht zum homogenen Magnetfeld B mit einer Geschwindigkeit v bewegt wird. Auf die Elektronen im bewegten Leiter wirkt die magnetische Kraft (13-16). Das entspricht einer durch die Bewegung induzierten elektrischen Feldstärke Fm =v×B. (14-2) −e Die im bewegten Leiterstück l induzierte Spannung ui = Ei · l ist daher Ei =
ui = (v × B) · l = Blv .
(14-3)
Dies ist die gesamte in der Leiterschleife induzierte Spannung, da die anderen Leiterschleifenteile ruhen. Auch bei dieser Induktionsanordnung ändert sich durch die Vergrößerung der Schleifenfläche A dA ldx = = lv dt dt
(14-4)
der magnetische Fluss Φ = B · A = BA in der Leiterschleife (Flächennormalenvektor AB), obwohl B = const ist: dA dΦ d(B · A) = =B = Blv . dt dt dt
(14-5)
Mit (14-3) ergibt sich daraus wiederum das Induktionsgesetz (14-1) für N = 1, wenn mit einem negativen Vorzeichen der in Bild 14-2 eingezeichnete Richtungssinn für ui im Hinblick auf die positive Flussänderung und den Rechtsschraubensinn berücksichtigt wird: ui = −
dΦ . dt
Dieser Zusammenhang gilt also offenbar unabhängig davon, auf welche Weise der magnetische Fluss in der Leiterschleife geändert wird, ob durch Änderung des Magnetfeldes B bei stationärer Leiterschleife, oder durch Änderung der Schleifenfläche A bei konstantem Magnetfeld. Im ersten Fall werden die Elektronen im Leiter durch die induzierte elektrische Kraft −eE, im zweiten Fall durch die geschwindigkeitsinduzierte magnetische Kraft −ev × B in Bewegung gesetzt. Auch hierdurch wird deutlich, dass die Kraft auf Ladungen q in voller Allgemeinheit durch die Lorentz-Kraft (13–18) F = q(E + v × B)
(14-7)
gegeben ist. Wählen wir die Schleifenkurve C als Integrationsweg (Bild 14-1), so folgt aus (14-6) mit 0 E · ds (14-8) ui = C
und mit der Definition (13-14) des magnetischen Flusses für eine beliebige, von C berandete Fläche A die allgemeinere Formulierung des Induktionsgesetzes (Faraday-Henry-Gesetzes): 0 " d E · ds = − B · dA . (14-9) dt C
A
Dies ist die allgemein gültige Form einer der beiden Feldgleichungen des elektrischen Feldes, die sich vom elektrostatischen Fall (12-35) dadurch unterscheidet, dass die rechte Seite nicht verschwindet. Weitere Induktionseffekte
Ist das die Leiterschleife mit dem Flächennormalenvektor A durchsetzende Magnetfeld B homogen, so lässt sich (14-1) mit Φ = B · A auch schreiben
(14-6)
ui = −N
d(B · A) . dt
(14-10)
Wird eine Leiterschleife gemäß Bild 13-15 mit einer Winkelgeschwindigkeit ω = ϑ/t im homogenen Magnetfeld gedreht, so wird darin nach (14-10) eine Spannung Bild 14-2. Induktion in einem bewegten Leiter im Magnet-
feld
ui = −N
d(BA cos ϑ) = NABω sin ωt = uˆ sin ωt dt (14-11)
B157
B158
B Physik
Bild 14-4. Hall-Effekt an einem Bandleiter im Magnetfeld
Bild 14-3. a Induktion in einem ausgedehnten bewegten
Leiter und b Prinzip des magnetohydrodynamischen Generators
erzeugt: Prinzip des Wechselstromgenerators. Die Spannung ändert mit t periodisch ihr Vorzeichen, d. h. ihre Richtung: Wechselspannung. Der Maximalwert (Amplitude) ist uˆ = NABω. Der bewegte Leiter im Induktionsversuch Bild 14-2 muss nicht die Form eines Drahtes haben: Ein bewegter Metallstreifen zwischen Schleifkontakten (Bild 14-3a) zeigt aufgrund der auftretenden magnetischen Kraft den gleichen Induktionseffekt. Benutzt man anstelle des Metallstreifens einen ionisierten Gasstrom (Plasma; Bild 14-3b), so erhält man das Grundprinzip des magnetohydrodynamischen Generators (sog. MHD-Generator), dessen prinzipieller Vorteil darin besteht, keine bewegten Bauteile zu besitzen. Das Plasma wird in einer Brennkammer erzeugt. Da beim MHD-Generator die Umwandlung von thermischer in elektrische Energie direkt erfolgt, kommt der Wirkungsgrad näher an den thermodynamischen Wirkungsgrad (8-100) heran als bei herkömmlichen Verfahren der Energiewandlung. Die induzierte Spannung Ui0 (im Leerlauf) ergibt sich aus (14-3).
abgedrängt (Bild 14-4), sodass eine Seite des Leiters einen Elektronenüberschuss, also eine negative Ladung erhält, während die gegenüberliegende Seite infolge Elektronendefizits eine positive Ladung durch die ortsfesten Gitterionen erhält. Der Wirkung der magnetischen Kraft Fm = −e(vdr × B) = −eEi entspricht eine induzierte Feldstärke Ei = vdr × B = −EH .
Wird die Bewegung von Ladungsträgern in einem Magnetfeld B nicht durch die Bewegung eines Leiters infolge einer äußeren Kraft erzwungen, sondern durch einen elektrischen Strom in einem ruhenden Leiter, so wirkt auch in diesem Falle die magnetische Kraft (13-16) senkrecht zur Ladungsträgergeschwindigkeit vdr und zu B. Im Falle eines metallischen Bandleiters werden die Leitungselektronen seitlich
(14-13)
Die dadurch bewirkte Ladungstrennung erzeugt eine entgegengerichtete Coulomb-Feldstärke, die HallFeldstärke EH . Mithilfe des Zusammenhangs (12-59) zwischen Stromstärke I und Driftgeschwindigkeit vdr folgt daraus (B senkrecht zum Bandleiter) EH = −
UH IB = , nebd b
(14-14)
(b, d Breite und Dicke des Bandleiters, Bild 14-4) und für die Hall-Spannung U H = AH
IB d
(14-15)
mit dem Hall-Koeffizienten für Elektronenleitung AH = −
Hall-Effekt
(14-12)
1 . ne
(14-16)
In Halbleitern (16.4) ist neben der Leitung durch Elektronen (N-Leitung) auch Leitung durch sog. Defektelektronen oder Löcher möglich. Bei einem Defektelektron oder Loch handelt es sich um eine durch ein fehlendes Elektron hervorgerufene positive Ladung des betreffenden Gitterions. Diese positive Ladung ist durch Platzwechsel benachbarter Elektronen in das Loch beweglich, verhält
14 Zeitveränderliche elektromagnetische Felder
sich also wie ein realer, beweglicher positiver Ladungsträger: P-Leitung. Bei reiner P-Leitung (Löcherkonzentration p) kehrt sich das Vorzeichen des Hall-Koeffizienten für Löcherleitung (14-16) um: AH =
1 pe
widerstand R ersetzt, sodass ein Strom I = Ui /R fließt (Bild 14-5), so erfährt der mit v bewegte Leiter nach (13-35) eine hemmende Kraft F = I(l × B) − v ,
(14-19)
(14-17)
und damit auch das Vorzeichen der Hall-Spannung. Aus Vorzeichen und Betrag der experimentell gewonnenen Hall-Koeffizienten eines Halbleiters lässt sich daher die Art und die Konzentration der vorhandenen Ladungsträger bestimmen, eine wichtige Messmethode zur Bestimmung von Halbleitereigenschaften. Bei gemischter Leitung (Elektronen und Löcher) erhält man 1 . (14-18) AH = e(p − n) Anmerkung: Die Ausdrücke für den HallKoeffizienten (14-16) bis (14-18) gelten korrekt nur bei starkem Magnetfeld B (bzw. μe B 1; μe Beweglichkeit, siehe 15.1). Bei schwachen Magnetfeldern μe B 1 muss die Streuung der Ladungsträger an Kristallfehlern berücksichtigt werden, was zu leicht veränderten Formeln für den Hall-Koeffizienten führt. Bei bekanntem Hall-Koeffizienten AH , Dicke d des Bandleiters und Stromstärke I kann aus der Messung der Hall-Spannung UH nach (14-15) die magnetische Flussdichte B bestimmt werden: Prinzip der Hall-Generatoren bzw. Hall-Sonden zur Ausmessung von Magnetfeldern. Wegen des größeren Hall-Effekts werden Hall-Sonden aus Halbleitern hergestellt: ihre gegenüber Metallen niedrigere Ladungsträgerkonzentration (vgl. 16.4) hat nach (14-16) und (14-17) einen größeren Hall-Koeffizienten zur Folge.
deren Betrag sich mit (14-3) zu F = IlB =
B2 l2 v R
(14-20)
ergibt. Es tritt also eine die Bewegung hemmende Kraft auf, die der Geschwindigkeit des Leiters proportional ist. Wird statt des Leiters ein leitendes Blech durch ein Magnetfeld bewegt (Bild 3-5), so führt die induzierte Spannung zu Strömen, die sich innerhalb des Bleches schließen: Wirbelströme. Auch diese erzeugen eine bremsende Kraft (Wirbelstrombremsung): FR ∼ −B2 v .
(14-21)
Die Lenz’sche Regel kann für diese Fälle so formuliert werden: Induzierte Ströme suchen die sie erzeugende Bewegung zu hemmen. Die Wirbelstrombremsung wird technisch angewandt. Dort, wo der Effekt störend ist, muss die Wirbelstrombildung innerhalb des Leiters durch Einschnitte oder Isolierschichten, die den Stromfluss verhindern, vermieden werden (Demonstrationsbeispiel: Waltenhofen’sches Pendel). Wirbelströme treten auch auf, wenn der leitende Körper ruht und das Magnetfeld dagegen bewegt wird. Es kommt nur auf die Relativbewegung an. In diesem Falle bewirken die Wirbelströme eine mitnehmende Kraft auf den Leiter, die die Relativgeschwindigkeit zwischen Leiter und Magnetfeld zu verringern
Lenz’sche Regel
Die Bedeutung des negativen Vorzeichens im Induktionsgesetz (14-1) bzw. (14-6) manifestiert sich in der Lenz’schen Regel: Induzierte Ströme sind stets so gerichtet, dass der Vorgang, durch den sie erzeugt werden, gehemmt wird. Beispiele für die Anwendung der Lenz’schen Regel: Wird in der Anordnung Bild 14-2 das Messgerät für die induzierte Spannung durch einen Belastungs-
Bild 14-5. Zur Lenz’schen Regel: Hemmende Kraft durch
induzierte Ströme bei Bewegung eines Leiters im Magnetfeld
B159
B160
B Physik
sucht (Demonstrationsbeispiel: Arago-Rad). Anwendung z. B. Wirbelstromtachometer, Drehstrommotor. Die in einer geschlossenen Leiterschleife oder in einem flächenhaft ausgedehnten Leiter (Blech) durch ein sich zeitlich änderndes Magnetfeld induzierten Ströme bzw. Wirbelströme sind ebenfalls so gerichtet, dass ihr Magnetfeld die Änderung des induzierenden Magnetfeldes zu verringern sucht: Steigt das induzierende Magnetfeld an, so ist das induzierte Magnetfeld entgegengesetzt gerichtet. Sinkt das induzierende Magnetfeld, so ist das induzierte Magnetfeld gleichgerichtet (Bild 14-6). Für solche Fälle kann die Lenz’sche Regel so formuliert werden: Induzierte Ströme suchen durch ihr Magnetfeld die Änderung des bestehenden Magnetfeldes zu hemmen. Demonstrationsbeispiel: Versuch von Elihu Thomson (Bild 14-7). Bei Einschalten des Stromes I und damit des von 0 ansteigenden Magnetfeldes B werden in dem Aluminiumring Ströme Ii so induziert, dass ihr Magnetfeld Bi dem ansteigenden Feld B entgegengerichtet ist. Als Folge treten Kräfte Fi auf, die den Ring nach oben beschleunigen. Der Effekt tritt in entsprechender Weise auch bei Wechselstrom auf, siehe 15.3.2 Transformator.
Bild 14-6. Zur Lenz’schen Regel: Feldänderungshemmende
14.2 Selbstinduktion Ein zeitlich veränderlicher Strom i in einer Leiterschleife oder einer Spule erzeugt ein zeitlich veränderliches Magnetfeld. Nach dem Induktionsgesetz (14-1) bzw. (14-6) hat das veränderliche Magnetfeld auch an der felderzeugenden Schleife oder Spule selbst eine induzierte Spannung ui zur Folge: Selbstinduktion. Die induzierte Spannung ui wirkt derart auf den zeitveränderlichen Strom i zurück, dass der ursprünglichen Strom- und Feldänderung entgegengewirkt wird (Lenz’sche Regel, siehe 14.1). Die Spule zeigt daher ein ähnlich träges Verhalten wie die Masse in der Mechanik. Beispiel: Lange Zylinderspule im Vakuum oder in Luft. Aus (13-9) und (13-5) folgt für den magnetischen Fluss in der Spule der Länge l NA i. (14-22) l Mit dem Induktionsgesetz (14-1) folgt daraus die durch Selbstinduktion entstehende Spannung in der Spule Φ = μ0
N 2 A di dΦ = −μ0 · . (14-23) dt l dt Die Spulenwerte werden zu einer Spuleneigenschaft, der Selbstinduktivität oder kurz Induktivität L, zusammengefasst, womit sich die für beliebige Spulen geltende Beziehung di ui = −L (14-24) dt ergibt. Für eine lange Zylinderspule ergibt sich durch Vergleich von (14-23) und (14-24) die Induktivität ui = −N
Wirkung induzierter Ströme
L = μ0
N2A . l
(14-25)
Allgemein beträgt die Induktivität einer Spule mit N Windungen nach (14-23) und (14-24) " Φ N L=N = B · dA . (14-26) I I A
SI-Einheit: [L] = V · s/A = Wb/A = H (Henry) . Bild 14-7. Lenz’sche Regel: Versuch von Elihu Thomson
Umfassen die verschiedenen Windungen einer Spule unterschiedliche Teilflüsse, so ist nach (G 13-5) und
14 Zeitveränderliche elektromagnetische Felder
(G 13-6) zu verfahren. Zur Berechnung der Induktivität anderer Spulengeometrien vgl. G 13.3.3. Das Selbstinduktionsgesetz (14-24) zeigt, dass die induzierte Spannung der Stromänderungsgeschwindigkeit di/dt proportional ist. Wird insbesondere ein Spulenstrom i ausgeschaltet, d. h. ein sehr schneller Stromabfall erzwungen, so kann bei großen Induktivitäten eine sehr hohe Induktionsspannung entstehen, die zu Überschlägen und zur Zerstörung der Spule führen kann. Hier ist durch Einschaltung von Vorwiderständen für ein kleines di/dt zu sorgen. Zu Ein- und Ausschaltvorgängen vgl. G 18.1.
14.3 Energieinhalt des Magnetfeldes Um das Magnetfeld einer Spule (Bild 14-8) aufzubauen, muss der Spulenstrom i von 0 auf den Endwert I gebracht werden. Der Strom i muss dabei durch eine äußere Spannung u gegen die selbstinduzierte Spannung ui (14-24) getrieben werden (Lenz’sche Regel): u = −ui = L
di . dt
(14-27)
Die in der Zeit dt dafür aufzubringende Arbeit dW beträgt nach (12-66) damit
Bei einer langen Zylinderspule ist das Außenfeld gegenüber dem Feld im Inneren der Spule näherungsweise vernachlässigbar. Für diesen Fall lässt sich die Energiedichte des magnetischen Feldes wm = EL /V der Spule leicht aus (14-29) und dem Spulenvolumen V = lA mithilfe der Feldstärke (13-5) und der Induktivität (14-25) der Zylinderspule berechnen zu 1 2 1 μH = B · H . (14-30) 2 2 Diese Beziehung ist nicht auf das Spulenfeld beschränkt, sondern allgemein für alle magnetischen Felder gültig (vgl. G 13-2). wm =
14.4 Wirkung zeitveränderlicher elektrischer Felder Ein zeitveränderliches magnetisches Feld B bzw. ein zeitveränderlicher magnetischer Fluss 1Φ erzeugt eine elektrische Umlaufspannung U = E · ds (BilC
der 14-1 und 14-6), die durch das Induktionsgesetz oder das Faraday-Henry-Gesetz (14-6) bzw. (14-9) beschrieben wird: 0 " d dΦ . E · ds = − B · dA = − (14-31) dt dt C
dW = ui dt = Li di .
(14-28)
Die Gesamtarbeit W ist nach dem Energiesatz gleich der im Magnetfeld gespeicherten Energie EL . Sie ergibt sich aus (14-28) durch Integration für i von 0 bis I zu 1 EL = LI 2 , 2
(14-29)
vgl. G 13.3.4.
C
A
durch einen Term zu ergänzen ist, der eine Analogie zum Induktionsgesetz darstellt. Damit lautet das Ampère-Maxwell’sche Gesetz: " " 0 d H · ds = j · dA + D · dA . (14-33) dt C
Bild 14-8. Zur Berechnung der magnetischen Feldenergie einer Spule
A
Maxwell erkannte 1864, dass der Durchflutungssatz oder das Ampère’sche Gesetz (13-1) " 0 H · ds = j · dA = Θ = iL (14-32)
A
A
Der zweite Term der rechten Seite von (14-33) heißt Maxwell’sche Ergänzung. In einem elektrisch nicht leitenden Gebiet, in dem keine freien elektrischen Ladungen und damit kein Leitungsstrom iL vorhanden sind, also die Stromdichte j = 0 ist, wird die Analogie zum Induktionsgesetz (14-31) vollständig: " 0 d dΨ = iV (f u¨ r j = 0) . H · ds = D · dA = dt dt C
A
(14-34)
B161
B162
B Physik
Bild 14-9. Elektrische und magnetische Umlaufspannung bei zeitveränderlichen magnetischen und elektrischen Feldern
Diese Gleichung sagt aus, dass ein zeitveränderliches elektrisches Feld E bzw. ein zeitveränderlicher elek1trischer Fluss Ψ eine magnetische Umlaufspannung H · ds erzeugt (Bild 14-9.), sich also genauso j · d A verhält, vgl. wie ein Leitungsstrom iL = (14-32). Der zeitliche Differenzialquotient des elektrischen Flusses bzw. der dielektrischen Verschiebung Ψ (siehe 12.2 und 12.9) wird daher Verschiebungsstrom iV genannt. Zeitveränderliche elektrische und magnetische Felder verhalten sich also ganz entsprechend (Bild 14-9). Der Ausdruck für die Maxwell’sche Ergänzung lässt sich plausibel machen durch die Betrachtung des Aufladevorganges eines Plattenkondensators (Bild 14-10). Der Ladestrom i bewirkt einen Anstieg der elektrischen Feldstärke E im Kondensator und
Bild 14-10. Magnetische Umlaufspannung um ein zeit-
veränderliches Kondensatorfeld und deren experimenteller Nachweis
damit eine zeitliche Änderung dΨ/dt des elektrischen Flusses Ψ . Aus der Definition der Kapazität C = Q/U gemäß (12-75) folgt durch zeitliche Differenziation unter Berücksichtigung der Stromdefinition (12-56) du dQ =i=C . (14-35) dt dt Daraus ergibt sich mit der Feldstärke (12-41) und der Kapazität (12-78) des Plattenkondensators folgender Zusammenhang zwischen Ladestrom i und zeitlicher Änderung des elektrischen Flusses im Kondensator: d dΨ dE = (AD) = . (14-36) dt dt dt i und dΨ/dt sind also korrespondierende Größen. Da dΨ/dt gewissermaßen die Fortsetzung des Ladestroms i innerhalb des Kondensators darstellt (Bild 14-10 oben), ist es aus Kontinuitätsgründen plausibel anzunehmen, dass die nach dem Durchflui bestehende tungssatz (14-32) um den Ladestrom 1 magnetische Umlaufspannung H · ds sich auch im Bereich des sich zeitlich ändernden elektrischen Flusses im Kondensator fortsetzt, d. h., dass dort 0 dΨ H · ds = (14-37) dt i = εA
s
ist, entsprechend der Maxwell’schen Ergänzung (14-34). Zum experimentellen Nachweis einer magnetischen Umlaufspannung um ein zeitveränderliches Kondensatorfeld lässt man dieses sich zeitlich periodisch ändern, indem als Ladestrom ein Wechselstrom (15.3) verwendet wird. Dann ist auch die entstehende magnetische Umlaufspannung zeitlich periodisch veränderlich. Mithilfe einer das Kondensatorfeld umschließenden Ringspule oder einem Ferritring mit Spule (Bild 14-10 unten) lässt sich dann das mit der magnetischen Umlaufspannung verknüpfte zeitperiodische magnetische Ringfeld durch Induktion nachweisen. Um dabei eine vernünftig messbare Induktionswechselspannung zu erhalten, muss eine möglichst hohe Wechselstromfrequenz verwendet und das Kondensatorfeld durch ein Dielektrikum mit hohem εr verstärkt werden.
14.5 Maxwell’sche Gleichungen Die bisher gefundenen Feldgleichungen (14-9), (14-33), (12-104) und (13-15) stellen das Axiomen-
15 Elektrische Stromkreise
system der phänomenologischen Elektrodynamik in integraler Form dar. Da in diesen vier Gleichungen fünf vektorielle Größen (E, H, D, B, j) und eine skalare Größe (q) als Unbekannte auftreten, werden zur Lösbarkeit des Gleichungssystems noch die sogenannten Materialgleichungen (12-99), (13-43) und das Ohm’sche Gesetz (12-67) benötigt. Das Ohm’sche Gesetz lässt sich in den lokalen Größen j und E ausdrücken (siehe 15.1): j = γE
(14-38)
mit γ elektrische Leitfähigkeit (Konduktivität) (15-5). Damit erhalten wir das folgende Gleichungssystem der phänomenologischen Elektrodynamik (Maxwell’sche Gleichungen): Faraday-Henry-Gesetz (Induktionsgesetz): " 0 d dΦ . E · ds = − B · dA = − (14-39) dt dt C
A
Die zeitliche Änderung des magnetischen Flusses durch eine Fläche A erzeugt in der Randkurve C der Fläche eine elektrische Umlaufspannung von gleichem Betrag und entgegengesetztem Vorzeichen. Ampère-Maxwell’sches Gesetz (Durchflutungssatz für dΨ/dt = 0): " 0 " d H · ds = j · dA + D · dA dt C
A
A
dΨ = iL + iV : (14-40) = iL + dt Der Gesamtstrom aus Leitungsstrom und Verschiebungsstrom (bzw. zeitlicher Änderung des elektrischen Flusses) durch eine Fläche A erzeugt in der Randkurve C der Fläche eine magnetische Umlaufspannung von gleicher Größe. Zusatzaxiome über die Quellen der Felder (Gauß’sche Gesetze), S ist eine beliebige geschlossene Oberfläche: 0 D · dA = Q: (14-41) S
Die elektrischen Ladungen Q sind Quellen der elektrischen Flussdichte D. 0 B · dA = 0: (14-42) S
Es gibt keine magnetischen Ladungen (magnetische Monopole) als Quellen der magnetischen Flussdichte B (und damit auch keinen dem elektrischen Leitungsstrom entsprechenden magnetischen Strom in (14-39)). Materialgleichungen: D = εr ε0 E ,
(14-43)
B = μr μ0 H , j = γE .
(14-44) (14-45)
Die Materialgleichungen beschreiben den Einfluss von Stoffen auf das elektrische bzw. das magnetische Feld sowie auf den Stromfluss im elektrischen Feld. Die Verknüpfung zwischen den elektrischen und magnetischen Feldgrößen und der Kraft auf elektrische Ladungen Q wird nach (12-5) geleistet durch die Lorentz-Kraft: F = Q(E + v × B) .
(14-46)
Mit diesem Gleichungssystem lassen sich die makroskopischen Eigenschaften von elektrischen Ladungen und elektrischen und magnetischen Feldern in voller Übereinstimmung mit der experimentellen Erfahrung beschreiben. Insbesondere aus der Verknüpfung der beiden Phänomene, die durch die Maxwell’schen Gleichungen (14-39) und (14-42) für j = 0 beschrieben werden, hatte Maxwell bereits erkannt, dass elektromagnetische Wellen möglich sind (siehe 14-19). Anmerkung: Für die Lösung mancher Probleme der Elektrodynamik ist die integrale Form der Maxwell’schen Gleichungen und der Zusatzaxiome (14-39) bis (14-42) weniger geeignet als die differenzielle Form, die in G 14.1 behandelt ist.
15 Elektrische Stromkreise Die Zusammenschaltung von elektrischen Stromquellen und Verbrauchern (z. B. Widerstände, Kondensatoren, Spulen, Gleichrichter, Transistoren) wird als Stromkreis bezeichnet. In einem geschlossenen Stromkreis ist ein Stromfluss möglich, in einem offenen Stromkreis ist der Stromfluss, z. B. durch einen nicht geschlossenen Schalter, unterbrochen. Stromkreise können mithilfe des Ohm’schen Ge-
B163
B164
B Physik
setzes und der Kirchhoff’schen Gesetze berechnet werden, vgl. auch Kap. G Elektrotechnik.
Tabelle 15-1. Spezifischer Widerstand 20 und Temperaturkoeffizient α20 von Leitermaterialien bei 20 ◦ C
Für elektrische Leiter gilt in den meisten Fällen in mehr oder weniger großen Bereichen der elektrischen Feldstärke E und bei konstanter Temperatur T als Erfahrungsgesetz eine lineare Beziehung zwischen Strom i und Spannung u (Ohm, 1825), das Ohm’sche Gesetz: i = Gu
bzw.
u = Ri ,
(15-1)
vgl. (12-67). Elektrischer Leitwert G und elektrischer Widerstand R sind definitionsgemäß einander reziprok: 1 . (15-2) R SI Einheiten: [G] = A/V = S (Siemens) , [R] = V/A = Ω (Ohm) .
G=
Für ein homogenes zylindrisches Leiterstück der Länge l und vom Querschnitt A (Bild 15-1) gilt der aus u = El sowie aus der Stromdefinition (12-56) plausible Zusammenhang
Aluminiumb Blei Eisen Gold Kupferb Nickel Platin Silber Wismut Wolfram Zink Zinn Graphit Kohle (Bürsten-) Quecksilber Chromnickel (80Ni, 20Cr) Konstantan Manganin Neusilber Resistin (vgl. auch Tabellen D 9-10 und G 1-1) a b
i=
A u,
l
1 n Ω · m = 1 Ω · mm2 /km Normwerte der Elektrotechnik (IEC)
(15-3)
aus dem sich durch Vergleich mit (15-1) für den elektrischen Widerstand des Leiterstücks ergibt:
l . R= A
20 α20 nΩ · ma 10−3 /K 28,264 4,03 208 4,2 100 6,1 22 3,9 17,241 3,93 87 6,5 107 3,9 16 3,8 1170 4,5 55 4,5 61 4,1 110 4,6 8000 −0,2 40 000 960 0,99 1120 0,2 500 0,03 430 0,02 300 0,4 510 0,008
Leitermaterial
15.1 Ohm’sches Gesetz
(15-4)
Der spezifische Widerstand (Resistivität) ist eine Materialeigenschaft (Tabelle 15-1), die ebenso gut
durch ihren Kehrwert, die elektrische Leitfähigkeit γ, beschrieben werden kann:
=R
A 1 ≡ . l γ
(15-5)
SI-Einheiten: [ ] = Ω · m , [γ] = S/m . Führt man R aus (15-4) in (15-1) ein, so folgt mit u = El und i = jA das in Feldgrößen ausgedrückte Ohm’sche Gesetz (14-38), vektoriell geschrieben: j = γE .
(15-6)
Bei Annahme von Elektronen als Ladungsträger des elektrischen Stromes lautet der Zusammenhang zwischen Stromdichte j und Driftgeschwindigkeit vdr nach (12-61) Bild 15-1. Zum Ohm’schen Gesetz: Widerstand eines zylindrischen Leiterstücks
j = −nevdr .
(15-7)
15 Elektrische Stromkreise
Für die Driftgeschwindigkeit folgt damit vdr = −
Fällen sind lineare Ansätze für die Temperaturabhängigkeit des Widerstandes ausreichend:
γ E = −μe E ne
(15-8)
mit der Beweglichkeit des Elektrons |vdr | , E SI-Einheit: [μe ] = m2 /(V · s) .
μe =
(15-9)
Die Beweglichkeit gibt die auf die Feldstärke bezogene Driftgeschwindigkeit der Elektronen an. Für die Beweglichkeit der Leitungselektronen gilt μe =
γ ne
und γ = neμe .
(15-10) −3
Beispiel: Für Kupfer ist μe ≈ 4,3 · 10 m /Vs, d. h., bei einer Feldstärke von 1 V/m beträgt die Driftgeschwindigkeit 4,3 mm/s (siehe auch 12.6). Ursache für die Bewegung der Ladungsträger ist die elektrische Kraft F = −eE (12-4). Gleichung (15-8) bedeutet demnach, dass die Kraft geschwindigkeitsproportional ist (vdr ∼ F), ein für Reibungskräfte typisches Verhalten (siehe 3.2.3). In Leitern wird dieses Reibungsverhalten durch unelastische Stöße mit Gitterstörungen verursacht (siehe 16.2), bei denen die Leitungselektronen die im elektrischen Feld aufgenommene Beschleunigungsenergie immer wieder per Stoß an das Kristallgitter abgeben und dieses damit aufheizen: Joule’sche Wärme. Nach dem Energiesatz ist die Joule’sche Wärme gleich der vom elektrischen Feld geleisteten Beschleunigungsarbeit (12-65), woraus sich mit dem Ohm’schen Gesetz (15-1) für die elektrische Arbeit zur Erzeugung Joule’scher Wärme im Widerstand ergibt: dW = ui dt =
u2 dt = i2 R dt . R
2
R = R0 [1 + α0 ϑ] bzw. R = R20 [1 + α20 (ϑ − 20 ◦ C)] . (15-12) Hierin ist ϑ die Celsius-Temperatur, α0 bzw. α20 der Temperaturkoeffizient des Widerstandes (Tabelle 15-1) und R0 bzw. R20 der Widerstandswert bei 0 bzw. 20 ◦ C.
15.2 Gleichstromkreise, Kirchhoff’sche Sätze Die Aufrechterhaltung eines elektrischen Stromes in einem Leiter erfordert eine Energiezufuhr durch eine Spannungsquelle (Bild 15-1). Die Spannungsquelle enthält die von ihr gelieferte elektrische Energie in Form chemischer Energie (Batterie, Akkumulator, Brennstoffzelle), oder sie wird ihr in Form von Strahlungsenergie (Fotozellen, Solarzellen) oder mechanischer Energie (magnetodynamische oder elektrostatische Generatoren) zugeführt. Wir betrachten zunächst einen geschlossenen Stromkreis wie in Bild 15-2, auch Masche genannt. Bei stationären, d. h. zeitlich konstanten Verhältnissen, bei denen die Potenziale in den verschiedenen Punkten des Stromkreises sich nicht ändern, folgt aus (12-35), dass die elektrische Umlaufspannung null ist. Legt man einen Umlaufsinn beliebig fest, und gibt man den Teilspannungen in der Masche dann ein positives Vorzeichen, wenn sie von + nach − durchlaufen werden (anderenfalls ein negatives Vorzeichen), so gilt z. B. für die Masche in Bild 15-2: −U0 + IRi + IR = 0 .
(15-13)
(15-11)
Für konstante Spannungen U und Ströme I folgt daraus W = UIt =
U2 t = I 2 Rt . R
Mit steigender Temperatur wird auch die Zahl der Gitterstörungen größer, an denen die Elektronen gestreut werden (unelastische Stöße erleiden). Daher ist es verständlich, dass der elektrische Widerstand temperaturabhängig ist (Näheres in 16.2). In den meisten
Bild 15-2. Zum 2. Kirchhoff’schen Satz: Stromkreis (Ma-
sche) aus Spannungsquelle U0 mit Innenwiderstand Ri und Verbraucherwiderstand R
B165
B166
B Physik
Im allgemeinen Fall von m Spannungsquellen und n Widerständen in einer einfachen Masche gilt sinngemäß der 2. Kirchhoff’sche Satz (Maschenregel): m
u0i +
i=1
n
iR j = 0 .
(15-14)
j=1
Im Falle der Masche Bild 15-2 ist der Spannungsabfall am Widerstand R nach dem Ohm’schen Gesetz (15-1) gegeben durch UK = IR. Spannungsquellen haben i. Allg. einen nicht vernachlässigbaren inneren Widerstand Ri . Die von der Spannungsquelle gelieferte sog. Leerlaufspannung U0 kann daher nur dann an den Anschlussklemmen gemessen werden, wenn der Strom I = 0 ist, d. h. kein Verbraucherwiderstand R angeschlossen ist (bzw. R → ∞). Anderenfalls tritt an den Anschlussklemmen die sog. Klemmenspannung UK auf, für die sich nach (15-13) ergibt: UK = U0 − IRi .
(15-15)
Die Klemmenspannung ist daher bei Belastung der Quelle (I 0) stets kleiner als die Leerlaufspannung. Die Spannungsquelle kann für R = 0 (UK = 0) den maximalen sog. Kurzschlussstrom Ik =
U0 Ri
(15-16)
liefern. Sowohl für R = 0 als auch für R = ∞ ist die im Verbraucher umgesetzte Leistung null. Die maximale Leistung im Verbraucher erhält man für R = Ri , sog. Leistungsanpassung. Bei komplizierteren Netzwerken mit Stromverzweigungen lassen sich stets so viele Maschen definieren, dass jeder Zweig des Netzes in mindestens einer Masche enthalten ist. Aus (15-14) erhält man dann entsprechend viele Maschengleichungen für die Spannungen. Bei Stromverzweigungen wird jedoch noch eine zusätzliche Bedingung benötigt, die sich aus der Kontinuitätsgleichung für die elektrische Ladung (12-64) ergibt. Bei stationären Verhältnissen ist die innerhalb einer geschlossenen Oberfläche S befindliche elektrische Ladung Q konstant, d. h., dQ/dt = 0, und damit 0 j · dA = 0 . S
(15-17)
Bild 15-3. Zum 1. Kirchhoff’schen Satz: Stromverzwei-
gung (Knoten)
Umschließt die Oberfläche S einen Stromverzweigungspunkt, auch Knotenpunkt genannt, von n Zweigen (Bild 15-3), so folgt daraus der 1. Kirchhoff’sche Satz (Knotenregel): n iz = 0 , (15-18) z=1
d. h., in einem Verzweigungspunkt oder Knoten ist die Summe der zufließend gerechneten Ströme gleich null. Ströme mit abfließender Bezugsrichtung müssen in (15-18) mit negativem Vorzeichen eingesetzt werden, vgl. Bild 15-3. Allgemein ist zu beachten: Man unterscheidet bei Netzwerkuntersuchungen den (willkürlichen) Bezugssinn von Strömen und Spannungen, der erforderlich ist, um die Beziehungen sinnvoll formulieren zu können und den (physikalischen) Richtungssinn, der sich aus Rechnung (und/oder Messung) ergibt und sich im Vorzeichen vom Bezugssinn unterscheiden kann. Mit den beiden Kirchhoff’schen Sätzen lassen sich auch Parallel- und Reihenschaltungen von Widerständen oder kompliziertere Netzwerke berechnen, vgl. G 3.1.
15.3 Wechselstromkreise Wechselstromgeneratoren erzeugen nach (14-11) Induktionsspannungen u = uˆ sin(ωt + α)
(15-19)
mit dem Spitzenwert uˆ , deren Vorzeichen zeitlich periodisch wechselt: Wechselspannung. Der Nullphasenwinkel α hängt von der Wahl des Zeitnullpunktes ab. Ein an einen solchen Generator angeschlossener Verbraucher wird dann von einem ebenfalls zeitperiodischen Wechselstrom durchflossen, der die gleiche Kreisfrequenz ω, aber – je nach Verbraucher (vgl.
15 Elektrische Stromkreise
15.3.3) – meist einen anderen Wert des Nullphasen-
winkels hat: i = ˆi sin(ωt + β) .
(15-20)
Zwischen den entsprechenden Phasen von u und i herrscht die Phasenverschiebung β−α=ϕ .
(15-21)
Obwohl Wechselströme zeitlich veränderliche Größen sind, lassen sich Gleichstrombeziehungen, wie die für die elektrische Arbeit oder die Kirchhoff’schen Sätze, auch auf Wechselstromkreise anwenden, wenn sie auf differenziell kleine Zeiten dt beschränkt werden, in denen sich Spannungen und Ströme nicht wesentlich ändern, d. h., wenn sie auf die Momentanwerte von Spannungen und Strömen bezogen werden.
Phasenverschiebungen ϕ zwischen Strom und Spannung (Bild 15-4) treten vor allem dann auf, wenn neben Ohm’schen Widerständen auch Induktivitäten (Spulen) und Kapazitäten (Kondensatoren) im Wechselstromkreis vorhanden sind. Zur Vereinfachung wird durch geeignete Wahl des Zeitnullpunktes α = 0 und gemäß (15-21) β = ϕ gesetzt: i = ˆi sin(ωt + ϕ) .
(15-22)
Die Arbeit dW in der Zeit dt beträgt nach (15-11) dW = ui dt ,
"T W=
uˆ sin ωt ˆi sin (ωt + ϕ) dt .
(15-23)
(15-24)
0
Nach Umformung des Integranden mittels der Produktenregel trigonometrischer Funktionen lässt sich das Integral lösen: W=
1 ˆ uˆ i T cos ϕ . 2
(15-25)
Für t nT (n = 1, 2, . . .) gilt (15-25) nicht exakt, da dann über eine Periode nur unvollständig integriert wird. Für t T ist dieser Fehler jedoch zu vernachlässigen, und es gilt W=
15.3.1 Wechselstromarbeit
u = uˆ sin ωt ,
worin u und i die Momentanwerte nach (15-22) sind. Die Stromarbeit während einer endlichen Zeit, z. B. einer Periodendauer T = 2π/ω = 1/ν, ergibt sich daraus durch Integration
1 ˆ uˆ i t cos ϕ . 2
(15-26)
Anstelle der Spitzenwerte uˆ und ˆi werden üblicherweise die Effektivwerte U (oder Ueff ) und I (oder Ieff ) verwendet. Diese sind als quadratische Mittelwerte ; < < < = "T 1 u2 dt , U= T 0 ; < < < = "T 1 I= i2 dt (15-27) T 0
definiert und ergeben im zeitlichen Mittel dieselbe Arbeit wie Gleichspannungen und -ströme gleichen Betrages. Für harmonisch zeitveränderliche u bzw. i ergeben sich aus (15-22) und (15-27) die Effektivwerte uˆ U= √ 2
und
ˆi I= √ . 2
(15-28)
Damit folgt aus (15-26) für die Arbeit im Wechselstromkreis W = UIt cos ϕ , Bild 15-4. Spannungs- und phasenverschobener Stromverlauf in einem Wechselstromkreis
(15-29)
d. h. formal dasselbe Ergebnis wie bei der Gleichstromarbeit (15-11), wenn ϕ = 0 ist, was bei
B167
B168
B Physik
Ohm’schen Verbrauchern der Fall ist (15.3.3). Entsprechend gilt für die Leistung im Wechselstromkreis, die Wirkleistung P = UI cos ϕ .
(15-30)
Wegen der weiteren Begriffe Blindleistung und Scheinleistung siehe G 5.2.1. 15.3.2 Transformator
Zwei oder mehr induktiv, z. B. über einen Eisenkern, gekoppelte Spulen stellen einen Transformator dar, mit dessen Hilfe Wechselspannungen und -ströme induktiv auf andere Spannungs- und Stromwerte übersetzt werden können (Bild 15-5). Hier wird nur der ideale Transformator behandelt (zum verlustbehafteten Transformator siehe G 6). Der ideale Transformator ist gekennzeichnet durch Verlustfreiheit, Streuungsfreiheit und ideale magnetische Eigenschaften: – Keine Stromwärmeverluste in den Spulenwicklungen, da deren elektrischer Widerstand verschwindet. – Keine Ummagnetisierungsverluste, da keine Hysterese vorhanden ist (Zweige der Hystereseschleifen, vgl. Bild 13-23a, fallen zusammen). – Keine Wirbelstromverluste, da die Leitfähigkeit des Kernmaterials verschwindet (bei Eisen angenähert durch Lamellierung und Isolierung). – Die Spulen sind magnetisch fest gekoppelt, d. h. der von einer Spule erzeugte magnetische Fluss geht vollständig durch die andere (kein Streufluss). – Bei sekundärem Leerlauf (i2 = 0) ist der Eingangsstrom i1 null, da die Permeabilität des Kernmaterials unendlich ist. – Die Beziehung Φ(i) ist (im betrachteten Betriebsbereich) linear, d. h. insbesondere, es tritt keine Sättigung der magnetischen Polarisation auf.
Bild 15-5. Prinzipaufbau eines Transformators
Wird an die Wicklung 1 eine Wechselspannung u1 = uˆ 1 sin ωt angelegt (Bild 15-5), so fließt ein Wechselstrom i1 , der im Eisenkern einen magnetischen Wechselfluss Φ∼ erzeugt. Nach dem 2. Kirchhoff’schen Satz (15-14) gilt für u1 und für die durch den Wechselfluss Φ∼ in der Wicklung 1 (Windungszahl N1 ) induzierte Spannung ui u1 + ui = 0 .
(15-31)
Mit dem Induktionsgesetz (14-1) folgt daraus: dΦ∼ . (15-32) dt Da derselbe magnetische Wechselfluss Φ∼ auch die Wicklung 2 (Windungszahl N2 ) durchsetzt, wird dort eine Induktionsspannung u2 erzeugt: u1 = N1
dΦ∼ . (15-33) dt Da das Vorzeichen von u2 auch vom Wicklungssinn abhängt, lassen wir es im Weiteren fort. Aus (15-32) und (15-33) folgt u2 = (−)N2
u1 U 1 N1 = = =n. u2 U 2 N2
(15-34)
n ist das Windungszahlverhältnis. Die Spannungen transformieren sich also entsprechend dem Windungszahlverhältnis. Anwendungen: Spannungswandlung, z. B. Hochspannungserzeugung für die Fernübertragung elektrischer Energie (Minimierung der Leitungsverluste), Niederspannungserzeugung für elektronische Anwendungen u. ä. Ist an die Sekundärwicklung ein Verbraucher angeschlossen, sodass ein Strom i2 (Effektivwert I2 ) fließt, so gilt beim idealen Transformator für die primär- und sekundärseitige Leistung P1 = U 1 I 1 = P2 = U 2 I 2 und damit für das Verhältnis der Ströme I2 U 1 = =n. I1 U 2
(15-35)
(15-36)
Ströme transformieren sich umgekehrt zum Windungszahlverhältnis. Bei n 1 lassen sich daher bei mäßigen Stromstärken im Primärkreis u. U. sehr hohe Stromstärken im Sekundärkreis erzielen. Anwendungen: Schweißtransformator, InduktionsSchmelzofen u. a.
15 Elektrische Stromkreise
Auch die Anordnung Bild 14-7 stellt einen Transformator dar, allerdings mit einem großen Streufluss, da der Eisenkern nicht geschlossen ist. Der Ring kann als Sekundärwicklung mit einer einzigen, kurzgeschlossenen Windung aufgefasst werden. Wird an die Primärwicklung eine Wechselspannung angeschlossen, so wird der Ring als Folge der Lenz’schen Regel wie beim Einschalten einer Gleichspannung nach oben beschleunigt, bzw. je nach Stärke des Primärstromes gegen die Schwerkraft in der Schwebe gehalten. Wird statt des Ringes über dem Eisenkern eine metallische Platte (nicht ferromagnetisch) angebracht, so werden auch darin Kurzschlussströme (Wirbelströme!) induziert, die ebenfalls abstoßende Kräfte bewirken: Prinzip der Magnet(schwebe)bahn. 15.3.3 Scheinwiderstand von R, L und C
uˆ U = ˆi I
für den Strom im Ohm’schen Widerstand (Bild 15-7a) uˆ uˆ u = sin ωt = ˆi sin ωt mit ˆi = (15-39) R R R und damit aus (15-37) der Scheinwiderstand des Ohm’schen Widerstandes i=
ZR = R ,
(15-40)
der mit seinem Gleichstromwiderstand identisch und frequenzunabhängig ist. Aus (15-38) und (15-39) folgt ferner, dass zwischen Spannung und Strom die Phasenverschiebung (15-21) ϕ = ϕR = 0 ist (Bild 15-7a). Damit folgt aus (15-30) die Wirkleistung im Ohm’schen Widerstand P = UI .
Neben dem Spannungsabfall an einem nach (15-4) zu berechnenden Ohm’schen Widerstand, der seine Ursache im Leitungsmechanismus des Leitermaterials hat (16.2), treten in Wechselstromkreisen auch Spannungsabfälle an Spulen (Induktivitäten L) und Kondensatoren (Kapazitäten C) auf. Induktivitäten und Kapazitäten stellen damit ähnlich wie der Ohm’sche Widerstand sog. Scheinwiderstände Z dar, die entsprechend dem Ohm’schen Gesetz (15-1) und mit (15-28) aus Z=
Ohm’scher Widerstand im Wechselstromkreis Aus dem Ohm’schen Gesetz (15-1) folgt mit (15-38)
(15-41)
Der Ohm’sche Widerstand ist ein sog. Wirkwiderstand (oder Resistanz). Das Umgekehrte gilt nicht: Es gibt (nichtlineare) Wirkwiderstände, die nicht Ohm’sch sind. Induktivität im Wechselstromkreis
Bei einer Spule mit der Induktivität L und vernachlässigbarem Ohm’schem Widerstand im Wechselstrom-
(15-37)
zu berechnen sind. Ferner gilt in einem Wechselstromkreis nach Bild 15-6 der 2. Kirchhoff’sche Satz (15-14) in der Form u − uZ = 0 bzw. uZ = u = uˆ sin ωt
(15-38)
für die Momentanwerte der Spannung.
Bild 15-6. Scheinwiderstand in einem einfachen Wechsel-
Bild 15-7. a Ohm’scher, b induktiver und c kapazitiver Wi-
stromkreis
derstand im Wechselstromkreis
B169
B170
B Physik
kreis (Bild 15-7b) muss die angelegte Spannung u = uL die nach der Lenz’schen Regel induzierte Gegenspannung ui überwinden. Aus (15-38) ergibt sich mit der Selbstinduktion nach (14-24) di . (15-42) dt Durch Integration folgt daraus für den Strom # # uˆ π$ ˆ π$ i= sin ωt − = i sin ωt − ωL 2 2 u ˆ (15-43) mit ˆi = ωL und mit (15-37) für den Scheinwiderstand einer Induktivität u = uˆ sin ωt = uL = −ui = L
ZL = ωL .
(15-44)
ZL steigt mit der Frequenz des Wechselstroms linear an. Der Strom i hat nach (15-43) bei der Induktivität eine Phasennacheilung, d. h. eine Phasenverschiebung von π ϕL = − (15-45) 2 gegenüber der Spannung u (Bild 15-7b). Im Lauf einer Periode T ist daher das Produkt ui genauso lange positiv wie negativ und verschwindet im zeitlichen Mittel. Deshalb ist für eine Induktivität die Wirkleistung nach (15-30) mit (15-45) null. Aus diesem Grunde zählt ZL zu den sog. Blindwiderständen (Reaktanzen). Kapazität im Wechselstromkreis
Bei einem Kondensator der Kapazität C im Wechselstromkreis (Bild 15-7c) lädt der infolge der angelegten Spannung u fließende Strom i den Kondensator gemäß (12-75) und (12-56) auf die Spannung " 1 q i dt u = uˆ sin ωt = uC = = (15-46) C C auf. Die Differenziation nach der Zeit liefert für den Strom # π$ ˆ # π$ i = ωC uˆ sin ωt + = i sin ωt + 2 2 (15-47) mit ˆi = ωC uˆ und daraus mit (15-37) für den Scheinwiderstand einer Kapazität ZC =
1 . ωC
(15-48)
ZC ändert sich umgekehrt proportional mit der Frequenz. Der Strom i hat nach (15-47) eine Phasenvoreilung von π (15-49) ϕC = 2 gegenüber der Spannung u (Bild 15-7c). Auch für die Kapazität ist daher die Wirkleistung zeitlich gemittelt nach (15-30) null und ZC stellt einen Blindwiderstand (Reaktanz) dar.
15.4 Elektromagnetische Schwingungen In Zusammenschaltungen von Induktivitäten, Kapazitäten und Ohm’schen Widerständen können freie und erzwungene elektromagnetische Schwingungen angeregt werden. Die zugehörigen Differenzialgleichungen können aus den Kirchhoff’schen Sätzen gewonnen werden und entsprechen denjenigen der mechanischen Schwingungssysteme (5.3, 5.4). Die Lösungen werden daher aus 5.3 und 5.4 übernommen, wobei lediglich die Variablen und Konstanten entsprechend umbenannt werden. Auf die zur Beschreibung derartiger Kombinationen von Schaltelementen ebenfalls sehr geeignete komplexe Schreibweise bzw. Zeigerdarstellung wird an dieser Stelle unter Hinweis auf Kap. G verzichtet. 15.4.1 Freie, gedämpfte elektromagnetische Schwingungen
Lässt man einen zuvor auf die Spannung U0 aufgeladenen Kondensator der Kapazität C sich über eine Spule der Induktivität L und einen Ohm’schen Widerstand R entladen (Reihenschaltung von R,L und C, Bild 15-8), so wird durch den über L fließenden Entladungsstrom i während des Zerfalls des elektrischen Feldes des Kondensators ein Magnetfeld in der Spule aufgebaut. Nach Absinken der Kondensatorspannung uC auf null wird jedoch der Strom i durch die Spule durch Selbstinduktion weitergetrieben (Lenz’sche Regel), was zu einem erneuten Aufbau des elektrischen Feldes im Kondensator in umgekehrter Richtung führt, bis das magnetische Feld in der Spule abgeklungen ist. Nun beginnt der beschriebene Vorgang erneut, jedoch in entgegengesetzter Richtung. Die Energie des Systems pendelt also zwischen elektrischer und magnetischer Feldenergie hin und
15 Elektrische Stromkreise
Die Einführung von allgemeinen Kenngrößen entsprechend (5-37) und (5-38) R = δ : Abklingkoeffizient der Amplitude (15-55) 2L 1 Kreisfrequenz ω0 = ω20 : (15-56) des ungedämpften Oszillators LC führt zu der (5-39) entsprechenden Form der Schwingungsgleichung
Bild 15-8. Anregung gedämpfter elektromagnetischer Schwingungen in einer Reihenschaltung von R, L und C
her. Bei kleinem Widerstand R führt das zu gedämpften elektromagnetischen Schwingungen, wobei die Dämpfung durch den Energieverlust im Ohm’schen Widerstand bedingt ist (Joule’sche Wärme). Zur Berechnung des Systems werde von der Energie ausgegangen. Zu einem beliebigen Zeitpunkt t ist die Feldenergie im Kondensator nach (12-81) 1 2 1 q2 Cu = · , (15-50) 2 C 2 C und in der Spule nach (14-29) 1 (15-51) EL = Li2 . 2 Die Gesamtenergie E = EC + EL bleibt zeitlich nicht konstant, sondern wird durch den Strom i im Widerstand R allmählich in Joule’sche Wärme umgesetzt. Die zeitliche Abnahme der Energie E ergibt sich aus der umgesetzten Leistung: dE = −uR i = −Ri2 . (15-52) dt Durch Einsetzen von (15-50) und (15-51) und Beachtung der Stromdefinition (12-56) folgt daraus die Spannungsbilanz entsprechend dem 2. Kirchhoff’schen Satz: q di L + Ri + = uL + uR + uC = 0 . (15-53) dt C Mit i = dq/dt (12-56) ergibt sich schließlich eine Differenzialgleichung vom Typ der Schwingungsgleichung (5-36) für die Ladung q: EC =
L
dq 1 d2 q +R + q=0. 2 dt C dt
(15-54)
d2 q dq + 2δ + ω20 q = 0 . dt dt2
(15-57)
√ Für geringe Dämpfung δ ω0 , d. h. R 2 L/C, lautet die Lösung entsprechend (5-46) bei den An˙ = i(0) = 0: fangsbedingungen q(0) = q0 und q(0) q ≈ q0 e−δt cos ωt .
(15-58)
Es ergibt sich also eine gedämpfte Schwingung der Ladung q mit der Kreisfrequenz (5-45)
1 ω = ω20 − δ2 ≈ ω0 = √ (15-59) LC und damit auch z. B. der Spannung uC = q/C am Kondensator (Bild 15-8): uC ≈ U0 e−δt cos ωt
mit U0 =
q0 . C
(15-60)
Durch√ Variation der Dämpfung δ ω0 , also R 2 L/C, lassen sich hier in gleicher Weise wie beim mechanischen Schwingungssystem (5.3) neben dem gedämpften Schwingfall auch der aperiodische Grenzfall und der Kriechfall einstellen. Der RLC-Kreis stellt daher ein schwingungsfähiges elektromagnetisches System dar: Schwingkreis. 15.4.2 Erzwungene elektromagnetische Schwingungen, Resonanzkreise Reihenschwingkreis
Ein elektromagnetischer Schwingkreis, z. B. aus einer Reihenschaltung von Induktivität L, Widerstand R und Kapazität C wie in Bild 15-8, kann durch periodische Anregung, etwa durch Einspeisung einer Wechselspannung u = uˆ sin ωt (Bild 15-9), zu erzwungenen Schwingungen veranlasst werden.
B171
B172
B Physik
für das mechanische Schwingungssystem gewinnen. Dabei entsprechen sich folgende mechanische und elektrische Größen: m =ˆ L , r =ˆ R , c =ˆ 1/C , Fˆ =ˆ uˆ , x =ˆ q , v =ˆ i , a =ˆ di/dt , ϕ =ˆ ϑ .
Bild 15-9. Reihenschwingkreis mit Wechselspannungsanre-
gung
Die Spannungsbilanz (15-53) ist hierfür um die Spannungsquelle u zu ergänzen: L
q di + Ri + = uL + uR + uC dt C = u = uˆ sin ωt .
L
Mit i = dq/dt (12-56) und den Kenngrößen δ und ω0 (15-55) bzw. (15-56) folgt daraus die Differenzialgleichung der erzwungenen Schwingung für die Ladung q dq uˆ d2 q + 2δ + ω20 q = sin ωt , dt L dt2
(15-62)
die vollständig analog zur Differenzialgleichung des entsprechenden mechanischen Schwingungssystems (5-59) ist. Als Lösung für den stationären Fall (nach Abklingen von Einschwingvorgängen, siehe 5.4) kann wie in (5-60) angesetzt werden: # π$ q = qˆ sin(ωt + ϑ) = qˆ sin ωt + ϕ − (15-63) 2 π mit ϕ = ϑ + . 2 Für den Strom i folgt daraus durch Differenzieren nach der Zeit i = ˆi sin (ωt + ϕ)
mit ˆi = ωqˆ .
Anmerkung: Der hier über (15-63) eingeführte Phasenwinkel ϕ entspricht also nicht dem gleichbenannten Phasenwinkel beim mechanischen Schwingungssystem, sondern ϑ. Durch Vergleich mit (5-61) und (5-62) erhalten wir nun für die Frequenzabhängigkeit der Ladungsamplitude q(ω) ˆ =
(15-61)
(15-64)
ϑ und ϕ sind die zunächst willkürlich angesetzten Phasenverschiebungen (Phasenwinkel) zwischen der Ladung q(t) bzw. dem Strom i(t) und der Spannung u(t). Sowohl die Amplituden qˆ und ˆi als auch die Phasenwinkel ϑ und ϕ sind Funktionen der anregenden Kreisfrequenz ω. Die mathematische Form dieser funktionalen Abhängigkeit lässt sich durch den Vergleich mit den Beziehungen (5-60) bis (5-62)
(15-65)
uˆ ω2
−
ω20
2
(15-66)
+
4Δ2 ω2
und für die Frequenzabhängigkeit des Phasenwinkels ϑ tan ϑ =
2Δω . − ω20
(15-67)
ω2
Mit ˆi = ωqˆ nach (15-64) und durch Ersatz der Kenngrößen δ und ω0 nach (15-55) bzw. (15-56) folgt aus (15-66) für die Frequenzabhängigkeit des Stromes das sog. Ohm’sche Gesetz des Wechselstromkreises ˆi(ω) = 8
uˆ
1 R2 + ωL − ωC
2
,
(15-68)
wobei anstelle der Spitzenwerte uˆ und ˆi ebenso gut die Effektivwerte gemäß (15-37) geschrieben werden können. Gleichung (15-68) hat die Form des Ohm’schen Gesetzes, worin der Wurzelterm den Scheinwiderstand Z der Reihenschaltung der Blindwiderstände von L und C und des Ohm’schen Widerstandes R darstellt: 8 2 1 . (15-69) Z(ω) = R2 + ωL − ωC Für die Resonanzfrequenz gilt die Thomson’sche Schwingungsformel 1 , ω0 = √ LC
(15-70)
15 Elektrische Stromkreise
ω0 und δ wurden aus (15-56) bzw. (15-55) eingesetzt. Im Resonanzfall erhält man mit (15-72) sowie mit (15-44) und (15-48) für die Spannungen an der Spule bzw. am Kondensator ω0 L uˆ = Qˆu , R 1 uˆ = Qˆu . uˆ C (ω0 ) = ˆi(ω0 )ZC = ω0 CR uˆ L (ω0 ) = ˆi(ω0 )ZL =
Bild 15-10. a Frequenzabhängigkeit des Scheinwiderstandes und b Resonanzverhalten des Stromes beim Reihenresonanzkreis aus R, L und C
für ω = ω0 hat Z den kleinsten, rein Ohm’schen Wert (Bild 15-10) Z(ω0 ) = R
(15-71)
und der Strom nach (15-68) den maximalen Wert (Stromresonanz, Bild 15-10): ˆi(ω0 ) = uˆ . (15-72) R Dabei ist vorausgesetzt, dass u von einer Konstantspannungsquelle geliefert wird, deren Klemmenspannung sich durch die erhöhte Strombelastung bei Resonanz nicht ändert. Es liegen also (nach der mathematischen Struktur der Differenzialgleichung (15-62) zwangsläufig) ganz analoge Resonanzmaxima vor (Bild 15-10) wie bei den erzwungenen Schwingungen der mechanischen Schwingungssysteme (5.4.1). In (5.4.1) wurde die Güte Q eines Schwingungssystems als Resonanzüberhöhung (5-67) der Auslenkungsamplitude xˆ definiert. Entsprechend können wir hier die Resonanzüberhöhung der Ladungsamplitude qˆ als Güte Q einführen (die Güte Q ist nicht zu verwechseln mit der Ladung Q) und erhalten aus (15-66): Q=
q(ω ˆ 0 ) ω0 ω0 L 1 = = = . q(0) ˆ 2δ R ω0CR
(15-74) (15-75)
Die Spitzenspannungen an Spule und Kondensator sind daher im Resonanzfall gleich groß und übersteigen die insgesamt an die Reihenschaltung angelegte Spannungsamplitude uˆ um den Gütefaktor Q. Dass die Gesamtspannung u im Resonanzfall dennoch nur dem Spannungsabfall uR am Ohm’schen Widerstand entspricht, liegt daran, dass uL und uC gegenüber dem gemeinsamen Strom i nach (15-45) und (15-49) um π/2 bzw. −π/2, also gegeneinander um π phasenverschoben sind, sich also gegenseitig kompensieren. Den Phasenwinkel ϕ zwischen Strom i und Gesamtspannung u erhalten wir aus (15-67), indem wir beachten, dass wegen (15-63) tan ϕ = −1/ tan ϑ ist. Nach Einsetzen von δ und ω0 aus (15-55) bzw. (15-56) folgt 1 − ωL . ϕ = arctan ωC R
(15-76)
Der Phasenverlauf als Funktion der Frequenz (Bild 15-11) zeigt, dass bei niedrigen Frequenzen (ω ω0 ) ϕ ≈ π/2 ist, der Reihenschwingkreis sich also nach (15-49) kapazitiv verhält. Bei hohen Frequenzen (ω ω0 ) wird ϕ ≈ −π/2, der Reihenschwingkreis wirkt nach (15-45) wie eine Induktivität. Bei Resonanz (ω = ω0 ) liegt rein Ohm’sches Verhalten vor (ϕ = 0).
(15-73)
Die Güte bestimmt gleichzeitig nach (5-71) die Halbwertsbreite der Resonanzkurve. Die Konstanten
Bild 15-11. Phasenverschiebung zwischen Strom und Span-
nung im Reihenresonanzkreis
B173
B174
B Physik
Die Leistung im Resonanzkreis ist bei Resonanz ein Maximum, da u und i dann phasengleich sind und das Produkt ui wegen der Stromresonanz maximal wird. Parallelschwingkreis
Auch eine Parallelschaltung von Kapazität C, Widerstand R und Induktivität L (Parallelschwingkreis, Bild 15-12), z. B. mit einer amplitudenkonstanten Einströmung i = ˆi sin ωt zeigt Resonanzverhalten. Ausgehend von der Strombilanz z. B. im oberen Knotenpunkt (1. Kirchhoff’scher Satz (15-18)) " du 1 1 C + u+ u dt = iC + iR + iL dt R L = ˆi sin ωt (15-77) gelangt man zu einer Differenzialgleichung für den . Spulenfluss Φ = u dt C
d2 Φ 1 dΦ 1 + Φ = ˆi sin ωt , + · R dt L dt2
(15-78)
die wiederum die Differenzialgleichung der erzwungenen Schwingung darstellt. Analog dem Vorgehen beim Reihenschwingkreis wird als Lösung für den stationären (eingeschwungenen) Fall angesetzt $ # ˆ sin ωt + ϕ − π , (15-79) Φ=Φ 2 woraus durch Differenzieren nach der Zeit folgt u = uˆ sin (ωt + ϕ)
ˆ . mit uˆ = ωΦ
(15-80)
Für die Frequenzabhängigkeit der Spannungsamplitude ergibt sich analog zu (15-68) uˆ = 8
ˆi 2 1 1 + ωC − R2 ωL
,
worin der Wurzelterm den Scheinleitwert Y (auch: Betrag der Admittanz) der Parallelschaltung von L, R und C darstellt: 8 2 1 1 + ωC − . (15-82) Y= ωL R2 Hieraus folgt, dass der Parallelschwingkreis bei gleichen L und C dieselbe, durch die Thomson’sche Schwingungsformel gegebene Resonanzfrequenz 1 ω0 = √ LC
(15-83)
wie der Reihenschwingkreis (15-70) hat. Bei Resonanz hat der Scheinleitwert einen rein Ohm’schen Minimalwert Y(ω0 ) = Ymin =
1 , R
(15-84)
die Spannungsamplitude uˆ demzufolge ein Maximum (Spannungsresonanz) uˆ (ω0 ) = ˆiR .
(15-85)
Für den Phasenwinkel ϕ zwischen Spannung u und Gesamtstrom i ergibt sich analog zu (15-76) 1 − ωC . (15-86) ϕ = arctan R ωL Die Einzelströme iC und iL sind bei Resonanz aufgrund der Spannungsresonanz maximal und um den Gütefaktor höher als der Gesamtstrom i, jedoch gegenphasig. Der Gütefaktor Q beim Parallelkreis ergibt sich als Resonanzüberhöhung aus der Frequenzabhängigkeit des Flusses Φ (hier nicht behandelt) zu
(15-81)
Q=
ˆ 0) R Φ(ω = Rω0 C . = ˆ ω0 L Φ(0)
(15-87)
Anders als beim Reihenschwingkreis (15-73) steigt also beim Parallelschwingkreis die Güte mit dem Widerstand R. 15.4.3 Selbsterregung elektromagnetischer Schwingungen durch Rückkopplung Bild 15-12. Parallelschwingkreis mit Wechseleinströmung
Reale Schwingungssysteme sind stets gedämpft. Eine angestoßene Schwingung klingt daher mit dem
16 Transport elektrischer Ladung: Leitungsmechanismen
durch die Dämpfung bestimmten Abklingkoeffizienten δ zeitlich ab (5-46) oder (15-60). Ungedämpfte Schwingungen eines Schwingungssystems lassen sich dadurch erreichen, dass die Dämpfungsverluste durch periodische Energiezufuhr ausgeglichen werden. Das kann durch eine äußere periodische Anregung geschehen (Fremderregung) und führt zu erzwungenen Schwingungen (vgl. 5.4 und 15.4.2). Eine andere Möglichkeit besteht darin, die periodische Anregung durch das Schwingungssystem selbst zu steuern. Das kann mithilfe des Rückkopplungsprinzips erreicht werden und führt zur Selbsterregung von Schwingungen. Im Falle der elektromagnetischen Schwingungen wird dazu ein Verstärker benötigt, an dessen Ausgang ein Schwingkreis geschaltet ist (Bild 15-13). Ferner ist ein Rückkopplungsweg erforderlich, mit dessen Hilfe ein Bruchteil der Schwingungsenergie des Schwingkreises auf den Eingang des Verstärkers zurückgekoppelt werden kann. Dies kann durch direkten Abgriff von der Schwingkreisspule geschehen (Dreipunktschaltung), oder durch induktive Rückkopplung (Bild 15-13). Wird nun der Schwingkreis etwa durch den Einschaltstromstoß der Stromversorgung des Verstärkers zu einer gedämpften Schwingung der √ Eigenfrequenz ω0 = 1/ LC angeregt, so wird in der Rückkopplungsspule eine Spannung gleicher Frequenz induziert, die verstärkt wieder auf den Schwingkreis am Verstärkerausgang gelangt. Die Phasenlage der rückgekoppelten Spannung muss dabei so sein, dass der Schwingungsvorgang unterstützt wird (Mitkopplung). Ist die Phase dagegen um π verschoben, so wird die Schwingung unterdrückt (Gegenkopplung). Zur Vereinfachung wird angenommen, dass die Phasenverschiebung zwischen Schwingkreisspannung Us und der Rückkopplungsspannung Ur null ist, und dass ferner die Phasenverschiebung zwischen Eingangs-
spannung Ue des Verstärkers und seiner Ausgangsspannung Ua ebenfalls null ist (oder beide Phasenverschiebungen π betragen). Dann lassen sich die Verhältnisse folgendermaßen quantitativ beschreiben: Verstärkungsfaktor: V =
Ua Ue
Rückkopplungsfaktor: Rv =
Ur Us
(15-88)
Da der Schwingkreis am Verstärkerausgang liegt, ist Us = Ua . Ist nun die Rückkopplungsspannung Ur gerade gleich der Verstärkereingangsspannung Ue , die verstärkt gleich der ungeänderten Schwingkreisspannung Us ist, so ist offensichtlich ein stationärer Zustand erreicht, bei dem die Schwingkreisverluste durch Rückkopplung und Verstärkung ausgeglichen werden. Für diesen gilt VRv =
Ua Ur =1. Ue Us
(15-89)
Für die Selbsterregungsbedingung VRv > 1
(15-90)
führt jede Störung (Stromschwankung) zur Aufschaukelung √ von Schwingungen der Frequenz ω = ω0 = 1/ LC. Im Allgemeinen ist sowohl die Rückkopplung als auch die Verstärkung mit Phasenverschiebungen verbunden, die in der Selbsterregungsbedingung berücksichtigt werden müssen. Der erste Rückkopplungsgenerator als Oszillator für elektromagnetische Schwingungen wurde von Alexander Meißner 1913 mithilfe einer verstärkenden Elektronenröhre aufgebaut. Heute werden hierfür allgemein Halbleiterverstärker verwendet.
16 Transport elektrischer Ladung: Leitungsmechanismen 16.1 Elektrische Struktur der Materie 16.1.1 Atomstruktur
Bild 15-13. Rückkopplungsgenerator zur Erzeugung elek-
tromagnetischer Schwingungen
Das Phänomen der elektrolytischen Abscheidung z. B. von Metallen durch Stromfluss in wässrigen Metallsalzlösungen oder in Metallsalzschmelzen
B175
B176
B Physik
(siehe 16.5 und C 9.8 oder der Ionisierbarkeit von Gasen (vgl. 16.6) zeigt, dass die Bestandteile der Materie, die Atome, unter geeigneten Bedingungen elektrisch geladen sein, d. h. „Ionen“ bilden können. Aus dem Vergleich chemischer Bindungsenergien (Größenordnung 10 eV) mit der elektrostatischen potenziellen Energie zweier Elementarladungen im Abstand von Atomen in kompakter Materie (aus Beugungsuntersuchungen, siehe 23: Größenordnung 10−10 m) lässt sich folgern, dass die strukturbestimmenden Kräfte in kompakter Materie, im Molekül und vermutlich auch im Atom elektrostatischer Natur sein dürften. Da ferner die Materie im Allgemeinen elektrisch neutral ist, müssen pro Atom im Normalfall gleich viele positive und negative Elementarladungen vorhanden sein. Die relativ leicht abstreifbaren Elektronen (z. B. durch Reiben von Kunststoffen) besitzen nicht genügende Masse, um die Masse der Atome zu erklären. Der Hauptteil der Atommasse muss deshalb durch schwerere Teilchen, z. B. positiv geladene Protonen und ungeladene Neutronen gebildet sein. Die Größe der atomaren Bestandteile lässt sich durch Streuversuche mit Teilchensonden bestimmen. Lenard (1903) hatte aus der Durchdringungsfähigkeit von Elektronenstrahlen bei dünnen Metallfolien geschlossen, dass das Atominnere weitgehend materiefreier, leerer Raum ist. Rutherford, Geiger und Marsden (1911–1913) haben Streuexperimente mit α-Teilchen (17.3) an dünnen Folien durchgeführt, bei denen aus der Winkelverteilung der gestreuten α-Teilchen auf das Kraftgesetz zwischen diesen und den streuenden Atomen geschlossen werden kann. Dabei ergab sich die Coulomb-Kraft als maßgebende Wechselwirkung: Rutherford-Streuung. Aus Abweichungen vom so gefundenen Streugesetz bei höheren Energien ließ sich schließlich der Radius der streuenden, massereichen positiven Teilchen des Atoms zu etwa 10−15 m (= 1 fm) ermitteln. Solche Beobachtungen und die Tatsache, dass die Coulomb-Kraft (12-1) dieselbe Abstandabhängigkeit (11-35) wie die Gravitationskraft (11-7) hat, legten ein Planetenmodell für den Atomaufbau nahe: Protonen (und die erst 1932 durch Chadwick entdeckten Neutronen) bilden den positiv geladenen, massereichen Atomkern (Ladung +Ze), um den die Z Elektronen auf Bahnen der Größenordnung 10−10 m kreisen.
Rutherford-Streuung
Als Messmethode zur Untersuchung atomarer Dimensionen sind Streuexperimente in der Atom- und Kernphysik außerordentlich wichtig. Als Beispiel werde die von Rutherford behandelte Streuung am Coulomb-Potenzial betrachtet. Wird ein Strom von leichten Teilchen der Masse m und der Ladung Z1 e (α-Teilchen: Z1 = 2) auf ein ruhendes, schweres Teilchen der Masse M m und der Ladung Ze geschossen, so findet aufgrund der Coulomb-Kraft (12-1) eine Ablenkung statt, deren Winkel ϑ vom Stoßparameter b (siehe 6.3.2 und Bild 16-1a) abhängt. Die Primärenergie der gestreuten Teilchen sei E0 = mv20 /2 > 0. Da die Coulomb-Kraft (12-1) eine Zentralkraft der Form F ∼ r−2 (vgl. (11-35)) darstellt, sind die Bahnkurven für E > 0 Hyperbeln (siehe 11.5), deren Asymptoten den Streuwinkel ϑ einschließen. Aus dem Zusammenhang zwischen Coulomb-Kraft und Impulsänderung des gestreuten Teilchens folgt unter Berücksichtigung der Drehimpulserhaltung nach Integration über die Bahnkurve die Beziehung cot
ϑ 2b = 2 r0
mit r0 =
Z1 Ze2 . 4πε0 E0
(16-1)
Die Konstante r0 ist der Minimalabstand (Umkehrpunkt, Bild 16-1b) für den zentralen Stoß (ϑ = 180◦, b = 0), bei dem die gesamte kinetische Energie E0 des gestreuten Teilchens in potenzielle Energie im
Bild 16-1. Streuung am Coulomb-Feld eines schweren geladenen Teilchens
16 Transport elektrischer Ladung: Leitungsmechanismen
Coulomb-Feld des streuenden Teilchens umgesetzt ist, wie sich durch Vergleich mit (12-43) erkennen lässt. Gleichung (16-1) lässt sich experimentell nicht im Einzelfall prüfen, da in atomaren Dimensionen der zu einem bestimmten Streuwinkel gehörende Stoßparameter b nicht gemessen werden kann. Deshalb wird bei Streuversuchen ein statistisches Konzept angewendet: Durch einen im Vergleich zu den Atomdimensionen breiten, gleichmäßigen Teilchenstrahl wird dafür gesorgt, dass alle Stoßparameter (< Strahlradius) gleichmäßig vorkommen (Bild 16-1b). In diesem Fall ist die Winkelverteilung, d. h. die Zahl der in ein Raumwinkelelement dΩ = 2π sin ϑ dϑ (mittlerer Streuwinkel ϑ, Bild 16-2) gestreuten Teilchen, eine eindeutige und messbare Funktion des streuenden Potenzials. In einen Streuwinkelbereich dϑ bei einem mittleren Streuwinkel ϑ werden offensichtlich alle diejenigen Teilchen des primären Strahls gestreut, die ein ringförmiges Flächenstück dσ = 2πbdb des Strahlquerschnitts durchsetzen (Bild 16-2). Diese Fläche dσ wird differenzieller Streuquerschnitt genannt. Aus b(ϑ) gemäß (16-1) erhält man durch Differenzieren nach ϑ den differenziellen Rutherford-Streuquerschnitt 2 Z1 Ze2 dΩ dΩ 2 = . dσ(ϑ) = r0 ϑ ϑ 4πε E 0 0 16 sin4 16 sin4 2 2 (16-2) Gleichung (16-2) ist hier in klassischer Rechnung für das reine, punktsymmetrische Coulomb-Potenzial
Bild 16-2. Zum Begriff des Streuquerschnitts
des Atomkerns gewonnen worden. Dasselbe Ergebnis liefert die erste Näherung der quantenmechanischen Rechnung („1. Born’sche Näherung“), die hier nicht dargestellt wird. Eine Einschränkung der Gültigkeit besteht ferner darin, dass die Abschirmung des Coulomb-Potenzials des streuenden Atomkerns durch die Elektronenhülle nicht berücksichtigt ist. Diese macht sich vor allem in den Randbereichen des Atoms bemerkbar, also bei großen Stoßparametern b, d. h. nach (16-1) bei kleinen Streuwinkeln ϑ. Bei Streuversuchen wird meistens nicht an einzelnen Atomen gestreut, sondern z. B. an dünnen Schichten mit einer Flächendichte ns der Atome in der Schicht. Wegen der im Vergleich zur Atomgröße sehr geringen Kerngröße überdecken sich die Streuquerschnitte der Atomkerne in dünnen Schichten nur sehr selten. In großer Entfernung von der streuenden Schicht summieren sich dann die Streuintensitäten entsprechend der Zahl der streuenden Atomkerne. Ist N die Zahl der auf die streuende Schicht fallenden Streuteilchen, so ergibt sich aus (16-2) für die Zahl der in den Raumwinkel dΩ gestreuten Teilchen dN die Rutherford’sche Streuformel 2 Z1 Ze2 dN 1 = Nns . (16-3) ϑ dΩ 4πε0 E0 16 sin4 2 Bei der Streuung von α-Teilchen an Folien aus verschiedenen Metallen fanden Geiger und Marsden die Rutherford-Streuformel für nicht zu kleine Streuwinkel ϑ gut bestätigt. Bei hohen Energien können die Streuteilchen dem Atomkern sehr nahe und in den Bereich der Kernkräf-
B177
B178
B Physik
te kommen. Dann wird das Kraftgesetz verändert und die Rutherford-Streuformel gilt nicht mehr. Der Kernradius kann daher mithilfe von (16-1) aus der Energie ermittelt werden, bei der bei Streuwinkeln ϑ ≈ 180◦ zuerst Abweichungen von (16-3) beobachtet werden. Zur Erläuterung des Rutherford’schen Planetenmodells des Atoms werde als einfachstes das Wasserstoffatom (Z = 1) betrachtet (Bild 16-3a). Der Kern des Wasserstoffatoms besteht aus einem einzelnen Proton der Masse mp = 1,67262171 · 10−27 kg (vgl. 17.1) und der Ladung +e. Die Elektronenhülle enthält ein Elektron (Ladung −e). Die elektrostatische Wechselwirkung zwischen Elektron und Kern ergibt mit (12-1) als Radius r der Kreisbahn des Elektrons mit der Geschwindigkeit v
Bild 11-10). Dies führt jedoch zu Widersprüchen hinsichtlich der beobachteten Existenz diskreter, stationärer Energiezustände (20.4), sowie hinsichtlich der Stabilität der Atome: Positiver Atomkern und umlaufendes Elektron bilden einen zeitveränderlichen elektrischen Dipol, der nach den Gesetzen der Elektrodynamik (siehe 16-19) elektromagnetische Wellen abstrahlt, damit dem Atom Energie entzieht und so zu einer stetigen Annäherung des Elektrons an den Kern führt. Die Durchrechnung ergibt einen „Zusammenbruch“ des Atoms in ca. 10−8 s. Das Rutherford’sche Atommodell ist daher nicht ausreichend.
e2 . (16-4) r= 4πε0 me v2 Die Gesamtenergie des Elektrons auf einer Kreisbahn ergibt sich aus der kinetischen Energie Ek des Elektrons und seiner potenziellen Energie Ep im Feld des Protons aus ((12-43): Q = e) in gleicher Weise wie bei der Gravitation (11-47) zu
Niels Bohr hat das Rutherford’sche Planetenmodell des Atoms weiter entwickelt und dessen Unzulänglichkeiten dadurch zu beseitigen versucht, dass er annahm, dass die oben genannten, zu Widersprüchen führenden Gesetze der klassischen Makrophysik für das Mikrosystem des Atoms nicht gelten. So postulierte er die Existenz diskreter, strahlungsfreier Bahnen im Atom, als1 deren Auswahlprinzip er für das Phasenintegral p dq die Quantenbedingung (1. Bohr’sches Postulat) 0 (16-6) p dq = nh mit n = 1, 2, . . .
e2 1 1 Ep = − · . (16-5) 2 2 4πε0 r Nach der klassischen Mechanik ist jeder Bahnradius (16-4) und damit jeder Wert EF d. h., unterhalb der Fermi-Kante sind alle Zustände mit Elektronen besetzt, oberhalb EF leer (Bild 16-8). Bei Temperaturen T > 0 können Elektronen in einem Bereich der Größenordnung kT (k BoltzmannKonstante, vgl. (8-29)) unterhalb der Fermi-Kante thermisch angeregt werden, d. h., ihre Energie erhöht
B183
B184
B Physik
sich um einen Betrag von der Größenordnung kT . Für energetisch tiefer liegende Elektronen ist dies nicht möglich, da sie keine freien Zustände vorfinden. Die Fermi-Kante wird daher mit steigender Temperatur weicher: Die Besetzungswahrscheinlichkeit dicht unterhalb der Fermi-Kante sinkt auf Werte 0 (Bild 16-8). Die Breite des Übergangsbereiches ist von der Größenordnung der thermischen Energie kT und bei normalen Temperaturen sehr klein im Vergleich zur Fermi-Energie. Dies ändert sich erst bei Temperaturen T in der Größenordnung der Fermi-Temperatur EF , (16-20) k (vgl. z. B. Bild 16-8 für T = 0,5T F ). Da die FermiTemperatur bei Metallen T F > 104 K beträgt (Tabelle 16-1), tritt dieser Fall bei Festkörpern nicht auf. Der höherenergetische Teil der Fermi-DiracVerteilung (16-18) geht in die Boltzmann-Verteilung über (vgl. (8-40)): TF =
fFD (E) → e−(E−EF )/kT = fB (E − EF ) (16-21) für (E − EF ) kT . Die Fermi-Dirac-Verteilung ist auch gültig für den Fall, dass zwischen besetztem und unbesetztem Bandbereich eine Energielücke auftritt (Bild 16-6). Die Fermi-Kante liegt dann in der Mitte der Energielücke zwischen Valenzband VB und Leitungsband LB.
Tabelle 16-1. Parameter des Fermi-Niveaus von Metallen
Metall Li Na K Cu Ag Au
n 1027 /m3 46 25 13,4 85,0 57,6 59,0
EF eV 4,7 3,1 2,1 7,0 5,5 5,5
TF 103 · K 54 36 24 81 64 64
16.2 Metallische Leitung Die elektrischen Leitungseigenschaften der Metalle lassen sich weitgehend durch das Modell des freien Elektronengases verstehen. Es beschreibt die Leitungselektronen ähnlich wie die frei beweglichen Moleküle eines Gases. Dabei wird die Wechselwirkung der Leitungselektronen mit den gitterperiodisch angeordneten Atomrümpfen vernachlässigt, es wird lediglich die Begrenzung des metallischen Körpers für die Bewegung der Elektronen berücksichtigt. Wird z. B. ein Würfel der Kantenlänge L (Volumen V = L3 ) betrachtet, so können im Sinne der Wellenmechanik (siehe 25) nur solche Wellenfunktionen für die Aufenthaltswahrscheinlichkeit der Elektronen im Würfel existieren, für die in jeder der drei Würfelkantenrichtungen eine ganzzahlige Anzahl von Materiewellenlängen hineinpasst. Zählt man die Möglichkeiten hierfür ab, so erhält man die Zahl der möglichen Elektronenzustände als Funktion der zugehörigen Energie. Die hier nicht dargestellte Rechnung ergibt für diese Zustandsdichte 3/2 √ 1 2me 1 dN = 2 E, (16-22) Z(E) = · 2 V dE 2π die nur von der Energie der Zustände, nicht aber von der gewählten Geometrie des Metallkörpers abhängt. Sind N Leitungselektronen im Volumen V enthalten, beträgt ihre Dichte also n = N/V, so ergibt sich (ohne Rechnung) als energetische Grenze der mit Elektronen besetzten Zustände, also für die Fermi-Energie (siehe 16.1) EF =
Bild 16-8. Fermi-Dirac-Verteilung der Besetzungswahrscheinlichkeit
2 (3π2 n)2/3 . 2me
(16-23)
Daraus berechnete Werte für die Fermi-Energie verschiedener Metalle zeigt Tabelle 16-1. Die Dichte
16 Transport elektrischer Ladung: Leitungsmechanismen
der besetzten Zustände im Bänderschema (Bild 16-7) ergibt sich nun aus dem Produkt der Zustandsdichte Z(E) nach (16-22) und der Fermi-Dirac-Verteilung fFD (E) nach (16-18) zu 3/2 √ 1 2me Z(E) fFD (E) = 2 E 2 2π 1 . (16-24) × exp[(E − EF )/kT ] + 1 Bei Zimmertemperatur ist demnach nur ein sehr geringer Anteil der Leitungselektronen thermisch angeregt (Bild 16-9). Das ist auch der Grund dafür, dass das freie Elektronengas im Metall praktisch nicht zu dessen Wärmekapazität beiträgt, obwohl dies vom Gleichverteilungssatz her eigentlich zu erwarten wäre (vgl. 8.6). Dass sich die Leitungselektronen im Metall etwa wie freie Teilchen verhalten, kann mit dem Tolman-Versuch gezeigt werden. Wird ein Metall beschleunigt oder abgebremst (Beschleunigung a), so zeigen freie Elektronen träges Verhalten, d. h., hinsichtlich des Metallkörpers als Bezugssystem tritt eine Beschleunigung der Elektronen der Größe −a auf. Der zugehörigen Trägheitskraft −me a entspricht eine elektrische Feldstärke E = me a/q bzw. eine spezifische Ladung q a = . m E
(16-25)
Tolman hat a und E bei Drehschwingungen eines Metallringes gemessen. Die elektrische Feldstärke E erzeugt dabei einen oszillierenden Ringstrom, dessen
magnetisches Wechselfeld induktiv gemessen werden kann. Er erhielt Werte für die spezifische Ladung der Leitungselektronen, die im Rahmen der Messgenauigkeit mit der spezifischen Ladung freier Elektronen e = (1,75882012 ± 15 · 10−8 ) · 1011 A s/kg , me (16-26) wie sie im Vakuum durch Versuchsanordnungen gemäß Bild 13-11 bestimmt werden kann, übereinstimmten. Damit ist nachgewiesen, dass die Ladungsträger des elektrischen Stromes in Metallen quasifreie Elektronen sind. Klassische Theorie des Elektronengases
Nach P. Drude und H. A. Lorentz wird die Bewegung der freien Elektronen im Metall wie die Bewegung der Moleküle eines Gases behandelt. Die Leitungselektronen bewegen sich statistisch ungeordnet, tauschen durch Stöße Energie und Impuls mit dem Kristallgitter aus und nehmen daher dessen Temperatur T an. Bei Anlegen eines elektrischen Feldes E erhalten sie eine Beschleunigung a = −eE/me , die ihnen in der Zeit τ zwischen zwei unelastischen Zusammenstößen mit dem Gitter eine Geschwindigkeit vE = aτ = −eτE/me in (negativer) Feldrichtung erteilt. Ferner sei angenommen, dass die Elektronen bei den unelastischen Stößen mit dem Gitter alle im Feld auf der mittleren freien Weglänge le = v¯ τ aufgenommene Energie als Gitterschwingungsenergie (Phononen), d. h. als Joule’sche Wärme, an das Gitter abgeben und nach jedem solcher Stöße erneut im Feld starten müssen. Dann ergibt sich als mittlere, durch die Feldstärke E verursachte Driftgeschwindigkeit der Leitungselektronen (vgl. 12.6) 1 e ele vdr = − τ E = − E. 2 me 2me v¯
(16-27)
Die Driftgeschwindigkeit vdr überlagert sich der viel höheren thermischen Geschwindigkeit v¯ , jedoch führt nur vdr zu einem resultierenden elektrischen Strom. Gleichung (16-27) hat die Form der Definitionsgleichung (15-8) bzw. (15-9) der Beweglichkeit. Durch Vergleich erhält man für die Beweglichkeit der Elektronen Bild 16-9. Dichte der mit Leitungselektronen besetzten Energiezustände in Kupfer bei T = 300 K
μe =
1 e ele τ . = 2 me 2me v¯
(16-28)
B185
B186
B Physik
Der Zusammenhang (15-7) zwischen Stromdichte j und Driftgeschwindigkeit liefert schließlich mit (16-27) j=
1 ne2 ne2 le E= τ E. 2 me 2me v¯
(16-29)
Für Metalle ist vdr v¯ (siehe 12.6), sodass v¯ bei konstanter Temperatur durch das Anlegen des Feldes praktisch nicht geändert wird. Auch die anderen Faktoren vor der Feldstärke sind von E unabhängig. Damit stellt (16-29) das aus dem Drude-Lorentz-Modell hergeleitete Ohm’sche Gesetz dar. Durch Vergleich mit (15-6) ergibt sich für die elektrische Leitfähigkeit γ=
1 ne2 ne2 le τ . = 2 me 2me v¯
(16-30)
Anmerkung: Bei der elektrischen Leitung in verdünnten ionisierten Gasen (16.6) kann vdr in die Größenordnung der mittleren thermischen Geschwindigkeit v¯ kommen, sodass diese durch E verändert wird. Dann treten Abweichungen vom Ohm’schen Gesetz auf. Es liegt nahe anzunehmen, dass die besonders große Wärmeleitfähigkeit der Metalle ebenfalls auf das freie Elektronengas zurückzuführen ist. Wir können dazu die Beziehung für die Wärmeleitfähigkeit einatomiger Gase (9-21) übernehmen: λ=
1 kv¯ nle . 2
(16-31)
Bilden wir nun den Quotienten λ/γ und setzen gemäß (8-42) m¯v2 ≈ 3 kT , so erhalten wir das von Wiedemann und Franz 1853 empirisch gefundene, von Lorenz 1872 ergänzte Gesetz (WiedemannFranz’sches Gesetz): λ = LT γ
mit
L=
3k2 . e2
(16-32)
Die korrektere Berechnung unter Berücksichtigung der Fermi-Dirac-Verteilung (16-18) bzw. (16-24) liefert für die Konstante L (Sommerfeld, 1928) den nur wenig abweichenden Wert für alle Metalle (und für Temperaturen weit oberhalb der Debye-Temperatur ΘD , die hier nicht erläutert werden kann) L=
π2 k 2 = 2,443 . . . · 10−8 V2 /K2 . 3e2
(16-33)
Experimentelle Werte liegen bei 2,2 bis 2,6 · 10−8 V2 /K2 für verschiedene reine Metalle (T 200 K). Die relativ gute Übereinstimmung der klassischen Rechnung mit (16-33) liegt mit daran, dass sowohl für die elektrische Leitung als auch für die Wärmeleitung vor allem die schnellen Elektronen maßgebend sind, deren Energieverteilung sich der klassischen Boltzmann-Verteilung annähert (16-21). Dagegen versagt die klassische Vorstellung bei der Berechnung der Wärmekapazität des Elektronengases. Hier muss die Fermi-Dirac-Verteilung beachtet werden, die bewirkt, dass bei normalen Temperaturen nur ein sehr geringer Anteil der Leitungselektronen thermisch angeregt ist. Temperaturabhängigkeit des elektrischen Widerstandes von Metallen Reine Metalle zeigen empirisch nach (15-12) und Ta-
belle 15-1 einen von der Temperatur abhängigen spezifischen Widerstand
= 0 (1 + αϑ) = 0 (1 − αT 0 + αT ) ,
(16-34)
worin ϑ = T − T 0 die Celsius-Temperatur und T 0 = 273,15 K bedeuten. Für reine Metalle ist nach Tabelle 15-1 in den meisten Fällen α ≈ 0,004 K−1 ≈ 1/T 0, sodass αT 0 ≈ 1 ist. Damit erhalten wir für reine Metalle aus (16-34) in grober Näherung das empirische Ergebnis
≈ 0 αT ≈
0 T, T0
(16-35)
das anhand des Modells des freien Elektronengases zu interpretieren ist. Aus (16-30) ergibt sich für den spezifischen Widerstand
=
2me v¯ . ne2 le
(16-36)
Als temperaturabhängige Größen kommen hierin die Leitungselektronendichte n, die mittlere Geschwindigkeit v¯ und die mittlere freie Weglänge le in Frage. n ist jedoch nach der Vorstellung vom freien Elektronengas in Metallen nicht temperaturabhängig. Für v¯ trifft aufgrund der Fermi-Dirac-Verteilung (Bild 16-9) praktisch das gleiche zu. Als einzige temperaturabhängige Größe bleibt le als mittlere freie Weglänge zwischen zwei unelastischen Stößen
16 Transport elektrischer Ladung: Leitungsmechanismen
Bild 16-10. Temperaturabhängigkeit des elektrischen Wi-
derstandes verschieden stark gestörter Metallkristalle
der Elektronen mit dem Gitter. Solche unelastischen Stöße treten an Störungen des periodischen Aufbaues des Kristallgitters auf, während das regelmäßige, periodische Gitter (aus wellenmechanischen Gründen) von den Leitungselektronen frei durchlaufen werden kann. Solche Störungen sind z. B. die thermischen Gitterschwingungen. Mit steigender Temperatur nimmt daher die freie Weglänge le ab, der Widerstand steigt mit T gemäß (16-35). Bei tiefen Temperaturen sind dagegen die temperaturunabhängigen Gitterstörungen (wie Fremdatome, Leerstellen, Korngrenzen zwischen verschiedenen Kristalliten usw.) maßgebend für le bzw. . Der temperaturproportionale Widerstand geht daher bei tiefen Temperaturen (T 10 K) in einen konstanten Restwiderstand über, dessen Wert ein Maß für die Reinheit und Ungestörtheit des Metallkristalls ist (Bild 16-10). Metallegierungen sind stark gestörte Kristalle, in denen le klein und damit groß ist und beide kaum von der Temperatur abhängen: Widerstandslegierungen (Tabelle 15-1).
16.3 Supraleitung Der elektrische Widerstand von Metallen nimmt nach 16.2 mit sinkender Temperatur ab, geht aber für T → 0 in den konstanten Restwiderstand über (Bild 16-10), der durch die Gitterstörungen bestimmt ist. Mit abnehmender Konzentration der Gitterstörungen nähert sich der Widerstand dem Wert 0, verschwindet jedoch nicht vollständig, da absolute Fehlerfreiheit und T = 0 nicht erreichbar sind. Einige Metalle, z. B. Quecksilber oder Blei, zeigen jedoch bei Unterschreiten einer materialabhängigen kritischen Temperatur T c von wenigen
Bild 16-11. Kritische Temperatur und Sprungkurve des spe-
zifischen Widerstandes von Supraleitern. a schematisch, b für Blei und Cadmium
Kelvin (Bild 16-11) einen unmessbar kleinen Widerstand: Supraleitung (Kamerlingh Onnes, 1911). Für Elementsupraleiter liegen die Sprungtemperaturen durchweg unter 10 K (Tabelle 16-2), bei Verbindungs- und Legierungssupraleitern bisher maximal bei 23 K. Für die Nutzung der idealen Leitfähigkeit von Supraleitern ist daher die Kühlung mit flüssigem Helium (Siedetemperatur 4,2 K, Tabelle 8-5) Voraussetzung. Erst 1986 wurden höhere Sprungtemperaturen entdeckt (Bednorz und Müller): Bestimmte keramische Stoffe mit Perowskit-Struktur zeigen Supraleitung bei 37 K, bei 93 K und sogar bei über 100 K (Tabelle 16-2): Hochtemperatur-Supraleiter. Für solche Supraleiter genügt die Kühlung mit flüssigem Stickstoff (Siedetemperatur 77,4 K, Tabelle 8-5), ein enormer technischer Vorteil. Die in Tabelle 16-2 angegebenen Sprungtemperaturen T c gelten für den Fall, dass keine äußere magnetische Feldstärke anliegt. Für eine äußere magnetische Flussdichte Ba > 0 wird dagegen die Sprungtemperatur kleiner, der supraleitende Zustand wird oberhalb einer kritischen äußeren magnetischen Flussdichte Bc zerstört. Der Zusammenhang zwischen der kritischen
B187
B188
B Physik
Tabelle 16-2. Sprungtemperatur T c und kritische Flussdichte Bc verschiedener Supraleiter, vgl. auch G 1-2
Stoff
Tc K
Supraleiter 1. Art: Al 1,18 Cd 0,52 Hg(α) 4,15 In 3,41 Pb 7,20 Sn 3,72 Supraleiter 2. Art: Nb 9,46 Ta 4,48 V 5,30 Zn 0,9 Supraleiter 3. Art: Nb3 Al 17,5 Nb3 Ge 23 Nb3 Sn 18 NbTi (50%) 10,5 NbZr (50%) 11 V3 Ga 16,8 V3 Si 17 Keramische Supraleiter (Hochtemperatursupraleiter): La1,85 Sr0,15 CuO4 37 YBa2 Cu3 O7 93 Bi2 Sr2 Ca2 Cu3 O10 110 Tl2 Ba2 Ca2 Cu3 O10 125 HgBa2 Ca2 Cu3 O8 133
Bc (T → 0) Bc2 (T → 0) mT T 9,9 5,3 41,2 29,3 80,3 30,9 0,198 0,108 0,132 0,0053
Bild 16-12. Kritische Flussdichte Bc als Funktion der Temperatur für einige Elementsupraleiter 1. Art
≈ 25 ≈ 14 ≈ 21 ≈ 23,5 Bild 16-13. Kritische Flussdichte Bc2 als Funktion der Temperatur für einige Supraleiter 3. Art (Hochfeldsupraleiter)
≈ 350 (Bc2)
Flussdichte Bc und der Temperatur T lässt sich in den meisten Fällen in guter Näherung durch die empirische Beziehung ⎡ 2 ⎤ ⎢⎢⎢ T ⎥⎥⎥⎥ ⎢ (16-37) Bc = Bc0 ⎢⎣1 − ⎥ Tc ⎦ darstellen. Die Bilder 16-12 und 16-13 zeigen diesen Zusammenhang für einige Supraleiter 1. Art und 3. Art. Diese Erscheinung hängt mit dem zweiten wichtigen Phänomen der Supraleitung neben der idealen Leitfähigkeit, dem Meißner-Ochsenfeld-Effekt (1933) zusammen. Danach wird ein Magnetfeld aus dem Inneren eines Supraleiters verdrängt, solange die Ener-
gie hierfür kleiner ist, als der Energiegewinn durch den Eintritt des supraleitenden Zustandes. Das erfolgt unabhängig davon, ob das Magnetfeld nach oder vor der Abkühlung unter T c eingeschaltet wird. Im ersten Fall könnte die ideale Leitfähigkeit allein zur Erklärung der Feldfreiheit des Supraleiters herangezogen werden (Induktion von Abschirmströmen nach der Lenz’schen Regel, siehe 14.1). Im zweiten Fall ist das nicht möglich. Ein Supraleiter, aus dem das äußere Magnetfeld Ba verdrängt wird (Bi = μr μ0 H = 0), zeigt damit einen idealen Diamagnetismus: μr = 0 für T < T c .
(16-38)
Derselbe Sachverhalt lässt sich auch durch die Magnetisierung M ausdrücken (13-45): Bi = Ba + μ0 M = 0. Die Magnetisierung eines Supraleiters mit vollständigem Meißner-Effekt ergibt sich daher aus −μ0 M = Ba
für T < T c .
(16-39)
16 Transport elektrischer Ladung: Leitungsmechanismen
Bild 16-14. Magnetisierungskurven von Supra-
leitern (lange Stäbe parallel zu Ba ). Supraleiter a 1. Art, b 2. Art, c 3. Art
Vollständigen Meißner-Effekt zeigen nur die Supraleiter 1. Art (Tabelle 16-2), deren Magnetisierungskurve (für einen langen Zylinder parallel zu Ba ) Bild 16-14a zeigt. Für Ba < Bc fließen dabei in einer dünnen Oberflächenschicht (Eindringtiefe λ ≈ (10−7 . . . 10−8 ) m, siehe unten) des supraleitenden Körpers Abschirmströme, deren Feld das äußere Feld (bis auf die Oberflächenschicht) exakt kompensiert. Für Ba Bc bricht die Supraleitung sprunghaft zusammen. Stromführende supraleitende Drähte erzeugen selbst ein Magnetfeld (13-3), das schließlich die Supraleitung zerstören kann. Die Stromtragfähigkeit ist daher begrenzt und umso geringer, je größer ein von außen angelegtes Feld ist. Phänomenologisch lassen sich die beiden Haupteigenschaften der Supraleiter durch die London’sche Theorie (F. und H. London, 1935) mit den London’schen Gleichungen beschreiben: (I) (II)
d (Λ js ) = E dt rot(Λ js ) = −B
(16-40)
js = −ns es vs ist die Suprastromdichte. Die I. London’sche Gleichung beschreibt daher einen idealen Leiter mit verschwindendem Ohm’schen Widerstand, in dem die Ladungen in einem elektrischen Feld beschleunigt werden, sodass v˙ s ∼ E (im Gegensatz zum Ohm’schen Gesetz mit v ∼ E). Ferner ist ms . (16-41) Λ= ns e2s ns , ms , es und vs sind Anzahldichte, Masse, Ladung und Geschwindigkeit der supraleitenden Ladungsträger. Die II. London’sche Gleichung liefert für das Magnetfeld an einer supraleitenden Oberfläche (Ebene x = 0, supraleitend für x > 0) Bz (x) = Bz (0)e−x/λ .
(16-42)
Das äußere Magnetfeld klingt also innerhalb des supraleitenden Bereiches exponentiell ab. Seine Eindringtiefe λ ist nach der London’schen Theorie (16-43) λ = Λ/μ0 . Damit beschreibt die II. London’sche Gleichung den idealen Diamagnetismus. Bei Supraleitern 2. Art (Ta-
B189
B190
B Physik
belle 16-2) gibt es bei niedrigem Außenfeld zunächst ebenfalls eine Meißner-Phase (Bild 16-14b). Bei einer ersten kritischen Flussdichte Bc1 beginnt das äußere Magnetfeld in Form von normalleitenden magnetischen Flussschläuchen in den Supraleiter einzudringen, sodass die Magnetisierung −M wieder kleiner wird (bei nach wie vor verschwindendem elektrischen Widerstand!), bis schließlich bei einer sehr viel höheren zweiten kritischen Flussdichte Bc2 die gesamte Probe normalleitend geworden ist. Für theoretische Betrachtungen kann eine fiktive kritische Flussdichte Bc,th definiert werden derart, dass die getönten Flächen in Bild 16-14b gleich sind. Die Magnetisierungskurve der Supraleiter 2. Art ist reversibel, sie kann in beiden Richtungen durchlaufen werden. Der supraleitende Zustand im Außenfeldbereich Bc1 < Ba < Bc2 heißt gemischter Zustand. Im gemischten Zustand von supraleitenden Proben aus reinen, ungestörten Kristallen bilden die normalleitenden magnetischen Flussschläuche reguläre trigonale oder rechteckige Flussliniengitter (je nach Orientierung der Kristallstruktur zum Magnetfeld). Die Flussliniengitter wurden erstmals 1966 von Essmann und Träuble durch Dekoration mittels eines Bitter-Verfahrens (siehe 13.4) sichtbar gemacht. Der gemischte Zustand kann durch die phänomenologische Ginsburg-Landau-Theorie (1950) beschrieben werden, indem für die Grenzfläche zwischen normalund supraleitendem Bereich eine Grenzflächenenergie eingeführt wird. Je nach deren Vorzeichen wird die Bildung solcher Grenzflächen energetisch begünstigt (Supraleiter 2. Art im gemischten Zustand) oder behindert (Supraleiter 1. Art). Anmerkung: Der gemischte Zustand ist vom Zwischenzustand zu unterscheiden, der in Supraleitern 1. und 2. Art bei solchen Probengeometrien auftritt, bei denen durch die Feldverdrängung lokal am Probenrand Bc (bzw. Bc1 ) überschritten wird, obwohl im entfernteren, ungestörten Außenfeld noch Ba < Bc (bzw. Ba < Bc1 ) gilt. Im Zwischenzustand ist die supraleitende Probe von makroskopischen, normalleitenden magnetischen Bereichen durchzogen. Die normalleitenden, magnetischen Flussschläuche sind vollständig von supraleitendem Material umschlossen. Für einen magnetischen Fluss Φ in einem zweifach zusammenhängenden, supraleitenden Gebiet gilt, wie die Wellenmechanik der Supraleitung
zeigt, eine Quantenbedingung Φ = nΦ0
(n = 0, 1, 2, . . .)
(16-44)
mit h = 2,067 . . . · 10−15 Wb 2e (magnetisches Flussquant) . Φ0 =
(16-45)
Die Flussquantisierung wurde 1961 von Doll und Näbauer sowie von Deaver und Fairbank (mittels sehr empfindlicher magnetischer Messmethoden) und später von Boersch und Lischke (mittels elektroneninterferometrischer Methoden) nachgewiesen. Das Auftreten der Ladung 2e im Nenner von (16-45) ist ein Hinweis auf die Existenz von Elektronenpaaren im Supraleiter, siehe unten. Im gemischten Zustand des Supraleiters 2. Art enthalten die Flussschläuche gerade ein Flussquant, also den kleinsten, von null verschiedenen Wert. Damit wird ein maximaler Wert der Grenzfläche zwischen supraleitender und normalleitender Phase geschaffen. Bei Supraleitern 2. Art ist dieser Zustand für Ba > Bc1 energetisch günstig, da hier die Grenzflächenenergie negativ ist. Bei Supraleitern 1. Art ist hingegen die Grenzflächenenergie positiv, weshalb ein gemischter Zustand dort nicht auftritt. Stark gestörte Supraleiter 2. Art werden Supraleiter 3. Art genannt (Tabelle 16-2). Die Kristallstörungen wirken als sogenannte Pinning-Zentren, an denen die Flussquanten haften bleiben. Das hat Hystereseeffekte zur Folge, wobei nach Durchlaufen der Magnetisierungskurve bis Ba > Bc2 bei verschwindendem Außenfeld eine Restmagnetisierung durch eingefrorene, haftende Flussquanten bestehen bleibt (Bild 16-14c). Die Pinning-Zentren sind für die Stromtragfähigkeit der Supraleiter von großer Bedeutung, da ein von außen aufgeprägter Strom gemäß (13-35) eine Kraft auf die Flussschläuche ausübt. Ohne Pinning-Zentren würde dies zum Wandern der Flussschläuche, das heißt, zum Auftreten einer Induktionsspannung und damit zu Ohm’schen Verlusten führen. Supraleiter 3. Art haben sehr hohe kritische Flussdichten (Tabelle 16-2) bei gleichzeitig großer Stromtragfähigkeit. Sie sind deshalb von technischer Bedeutung vor allem für die Erzeugung großer Magnetfelder im sogenannten Dauerstrombetrieb: In einer
16 Transport elektrischer Ladung: Leitungsmechanismen
supraleitend kurzgeschlossenen, supraleitenden Spule fließt der Strom zeitlich konstant beliebig lange ohne Spannungsquelle weiter, und das erzeugte Magnetfeld bleibt ohne weitere Energiezufuhr erhalten, wenn man von der Energie für die Kühlung gegen äußere Wärmezufuhr durch flüssiges Helium absieht. Während des Hochfahrens des Stromes durch die supraleitende Spule wird der eingebaute supraleitende Kurzschluss durch eine kleine Heizwicklung normalleitend gehalten (Bild 16-15). Nach Einstellung des erforderlichen Stromes wird die Heizung ausgeschaltet, die Spule arbeitet im Dauerstrombetrieb und die Stromzufuhr kann abgeschaltet werden. Die mikrophysikalische Begründung der Supraleitung erfolgte 1957 durch Bardeen, Cooper und Schrieffer (BCS-Theorie). Diese mathematisch sehr anspruchsvolle Theorie geht von folgenden Grundgedanken aus: Für T < T c besteht das Leitungselektronensystem des Supraleiters aus normalen freien Elektronen, die sich wie bei der metallischen Leitung (16.2) verhalten, und aus Elektronenpaaren mit antiparallelem Impuls und Spin (Cooper-Paare), die den reibungsfreien Suprastrom tragen. Die Kopplung zweier Elektronen zu einem Cooper-Paar erfolgt über die Wechselwirkung mit dem Gitter (Austausch von Phononen, Nachweis durch den Isotopeneffekt, d. h. die Abhängigkeit der Sprungtemperatur von der Masse der Gitterionen). Anschauliche Vorstellung: Ein sich durch das Metallgitter bewegendes Elektron polarisiert das Gitter in seiner Nähe, d. h., es zieht die positiven Ionen etwas an. Entfernt es sich schneller, als die Gitterionen zurückschwingen können, so wirkt diese lokale Gitterdeformation als positive Ladung
anziehend auf ein weiteres Elektron in der Nähe. Dieser dynamische Vorgang kann zu einer zeitweisen Bindung beider Elektronen zu einem Cooper-Paar führen, wobei die Reichweite (Kohärenzlänge) bis etwa 10−6 m betragen kann. Die Bindungsenergie liegt bei 10−3 eV. Dies führt für T < T c zur Bildung einer Energielücke 2Δ von der Breite der Bindungsenergie symmetrisch zur Fermi-Energie im Energieschema der Elektronen. Die thermische Energie muss klein gegen Δ sein, deshalb tritt Supraleitung vorwiegend bei sehr tiefen Temperaturen auf (Tabelle 16-2). Bei Hochtemperatursupraleitern scheint die CooperPaar-Bildung von Löchern (16.4) eine Rolle zu spielen. Wegen des antiparallelen Spins sind Cooper-Paare Quasiteilchen mit dem Spin 0. Sie unterliegen daher nicht der Fermi-Dirac-Statistik (16-18), sondern der hier nicht behandelten Bose-Einstein-Statistik, sie sind Bose-Teilchen. Diese unterliegen nicht dem Pauli-Verbot (siehe 16.1) und können daher alle in einen untersten Energiezustand übergehen. Alle Cooper-Paare können dann durch eine einzige Wellenfunktion beschrieben werden, sie sind zueinander kohärent. Dieser Zustand kann nur durch Zuführung einer Mindestenergie gestört werden (2Δ pro CooperPaar). Dadurch kommt es zum verlustlosen Fließen des Stromes bei Anlegen eines elektrischen Feldes.
16.4 Halbleiter Halbleiter unterscheiden sich insbesondere durch zwei Eigenschaften von metallischen Leitern: 1. Ihre Leitfähigkeit γ liegt in einem weiten Bereich zwischen etwa 10−7 S/m und 105 S/m, also zwischen der Leitfähigkeit von Metallen (107 bis 108 S/m) und derjenigen von Isolatoren (10−17 bis 10−10 S/m). 2. Die Temperaturabhängigkeit des Widerstandes von Halbleitern ist entgegengesetzt zu derjenigen von Metallen (Bild 16-16). 16.4.1 Eigenleitung
Bild 16-15. Magnetfelderzeugung durch Supraleitungsspulen: Kurzgeschlossene supraleitende Spule a im Lade- und b im Dauerstrombetrieb
Ein Halbleiter ist bei tiefen Temperaturen fast ein Isolator und wird erst bei höheren Temperaturen elektrisch leitend. Anders als bei Metallen gibt es bei tiefen Temperaturen kein quasifreies Elektronengas,
B191
B192
B Physik
Bild 16-16. Temperaturabhängigkeit des spezifischen Widerstandes von Metallen und Halbleitern (schematisch)
die Elektronen sind weitgehend gebunden. Die Bindungsenergie liegt unter 1 bis 2 eV. Die Verteilung der thermischen Energie reicht bei Zimmertemperatur aus, um einige Elektronen von ihren Atomen zu trennen, die sich nun im elektrischen Feld bewegen können. Die daraus resultierende elektrische Leitfähigkeit steigt mit der Temperatur aufgrund der zunehmenden Anzahldichte n der nicht mehr gebundenen Elektronen, vgl. (16-30). Dieser Temperatureffekt übersteigt bei weitem den auch bei Halbleitern vorhandenen Effekt der Verringerung der mittleren freien Weglänge lc bzw. der mittleren Stoßzeit τ (auch: Relaxationszeit) mit steigender Temperatur. Die Relaxationszeit τ und gemäß (16-28) die Beweglichkeit μ zeigen nach der (nicht dargestellten) Theorie aufgrund der Wechselwirkung mit den Gitterschwingungen in reinen Halbleitern eine Temperaturabhängigkeit μ(T ) = const · T −3/2 .
(16-46)
Im Bändermodell des Halbleiters (Bild 16-6, mit einer schmaleren Energielücke ΔE = Eg als beim Isolator, Tabelle 16-4) bedeutet die thermische Anregung der Elektronen, dass entsprechend der Besetzungswahrscheinlichkeit gemäß der FermiDirac-Verteilung (Bild 16-8) mit einer bei höheren Temperaturen stärker verrundeten Fermi-Kante einige Valenzelektronen in das Leitungsband gehoben werden, wo sie für die elektrische Leitung zur Verfügung stehen. Im Valenzband entstehen dadurch unbesetzte Zustände, die sich wegen des Ionenhintergrundes wie positive Ladungen verhalten. Sie werden Löcher oder Defektelektronen genannt. Durch Platzwechsel von benachbarten gebundenen Elektronen kann ein Loch an deren Ort wandern (Bild 16-17). Im elektrischen Feld bewegen sich
Bild 16-17. Elektron-Loch-Paar-Anregung im planaren Gittermodell und im Bänderschema (Eigenleitung)
Löcher wie positive Ladungen +e in Feldrichtung und tragen als solche zur Stromstärke bei. Wegen der paarweisen Anregung von Elektronen und Löchern in reinen Halbleitern, d. h. bei reiner Eigenleitung, sind die Anzahldichte n der Elektronen im Leitungsband und die Anzahldichte p der Löcher im Valenzband gleich der sog. Eigenleitungsträgerdichte (auch: intrinsische Trägerdichte): n = p = ni .
(16-47)
Die Leitfähigkeit beliebiger Halbleiter ergibt sich in Erweiterung von (15-10) zu γ = e(pμp + nμn ) ,
(16-48)
bzw. für Eigenleitung γ = eni (μp + μn ) ,
(16-49)
wobei μn und μp die Beweglichkeiten von Elektronen und Löchern sind (Tabelle 16-3). Die Zustandsdichten in der Nähe der Bandkanten Ec des Leitungsbandes und Ev des Valenzbandes (Bild 16-18) ergeben sich analog zu (16-22) für die Elektronenzustände Tabelle 16-3. Beweglichkeit von Elektronen und Löchern für einige wichtige Halbleiter (T = 300 K)
Halbleiter Ge Si GaAs
μn in cm2 /V s 3900 1350 8500
μp in cm2 /V s 1900 480 435
16 Transport elektrischer Ladung: Leitungsmechanismen
Ist die thermische Energie kT klein gegen die Breite der Energielücke ΔE = Ec − Ev = Eg , so liegt die Fermi-Energie EF in der Mitte der Energielücke, d. h., EF = Ec − Eg /2 = Ev + Eg /2. Ferner gilt dann für das Leitungsband E − EF kT , d. h., anstelle der Fermi-Dirac-Verteilung kann innerhalb des Bandes die Boltzmann-Näherung (16-21) verwendet werden. Die Gesamtdichte der Leitungselektronen im Leitungsband folgt aus "∞ Zn (E) fFD (E) dE .
n=
(16-54)
Ec
Gleichung (16-54) kann in der Näherung fFD (E) ≈ fMB (E) als bestimmtes Integral geschlossen angegeben werden und liefert Bild 16-18. Zustandsdichten Z(E), Besetzungswahrscheinlichkeit f (E) und Elektronendichte n(E) bzw. Löcherdichte p(E) im Valenz- und Leitungsband (berechnet für EF = 5 eV, Eg = 0,5 eV, T = 300 K)
Zn (E) =
∗ 3/2
1 2mn 2π2 2
E − Ec
(16-50)
2πm∗n k h2
3/2 .
p(T ) = ap T 3/2 e−Eg /2kT , (16-51)
(16-52)
und für die Löcher an der oberen Valenzbandkante p(E) = Zp (E)[1 − fFD (E)] .
(16-56)
Entsprechend ergibt sich wegen der Symmetrie der Zustandsdichten und der Fermi-Dirac-Verteilung für die Gesamtdichte der Löcher im Valenzband
im Valenzband. m∗n und m∗p sind die effektiven Massen der Leitungselektronen und Löcher in der Nähe der jeweiligen Bandkanten, die durch den Einfluss des Kristallpotenzials von der Masse der freien Elektronen abweichen können. Wie bei der metallischen Leitung (16.2) ergibt sich auch hier die Besetzungsdichte durch Multiplikation mit der Besetzungswahrscheinlichkeit, die durch die Fermi-Dirac-Verteilung fFD (E) nach (16-18) gegeben ist. Für die Elektronen nahe der unteren Leitungsbandkante folgt n(E) = Zn (E) fFD (E)
(16-55)
mit an = 2
im Leitungsband und für Löcherzustände ∗ 3/2 1 2mp Zp (E) = 2 Ev − E 2π 2
n(T ) = an T 3/2 e−Eg /2kT
(16-53)
(16-57)
worin ap sich wie (16-56) mit m∗n → m∗p berechnet. Das Produkt von freier Elektronen- und Löcherdichte beträgt nach (16-55) bis (16-57) und (16-47) n(T )p(T ) = n2i (T ) (16-58) 3 2πkT ∗ ∗ 3/2 −Eg /kT =4 m e . m n p h2 Für einen gegebenen Halbleiter ist np bei fester Temperatur eine Konstante, die sich auch bei Dotierung (16.4.2) nicht ändert. Aus (16-46), (16-48), (16-55) und (16-57) folgt für die Temperaturabhängigkeit des spezifischen Widerstandes von Halbleitern
(T ) = const · eEg /2kT .
(16-59)
Wegen der starken, exponentiellen Abhängigkeit besonders bei tiefen Temperaturen (Bild 16-16) sind
B193
B194
B Physik
Tabelle 16-4. Energielücke Eg zwischen Valenz- und Leitungsband in Halbleitern und Isolatoren (T = 300 K)
Kristall C (Diamant) Si Ge Te Se As (amorph)
Eg /eV 5,4 1,107 0,67 0,33 1,6 . . . 2,5 1,18
Kristall InSb InAs InP GaSb GaAs GaP BN SiC Al2 O3
Eg /eV 0,165 0,36 1,27 0,67 1,35 2,24 4,6 2,8 7,0
Halbleiterwiderstände (C, Ge) gut zur Messung tiefer Temperaturen geeignet. Die Breite der verbotenen Zone Eg (Energielücke, Tabelle 16-4) lässt sich aus der Frequenzabhängigkeit der Lichtabsorption bestimmen. Nach der Lichtquantenhypothese (20.3) beträgt die Energie eines Lichtquants E = hν. Von einem Halbleiter kann die Energie eines Lichtquants erst dann durch Erzeugung eines Elektron-Loch-Paares absorbiert werden, wenn E = hν Eg
(16-60)
(Fotoleitung). Bei angelegtem elektrischen Feld setzt dann ein Fotostrom bei Bestrahlung mit Licht der Frequenz ν νc = Eg /h ein. Für Licht unterhalb der Grenzfrequenz νc bleibt der Halbleiter durchsichtig und nichtleitend. Kristalle mit Energielücken Eg > 2 eV werden zu den Isolatoren gerechnet. Nach der Breite der Energielücke lassen sich damit die Leitungseigenschaften von Metallen, Halbleitern und Isolatoren gemäß Bild 16-19 charakterisieren:
Bild 16-19. Energielücke zwischen Valenz- und Leitungsband bei Metallen, Halbleitern und Isolatoren
Kristall CdO CdS CdSe CdTe PbS PbSe PbTe MgO BaO
Eg /eV 2,5 2,42 1,74 1,44 0,37 0,526 0,25 7,4 4,4
Kristall ZnO ZnS ZnSe ZnTe ZnSb Cu2 O CuO NaCl TiO2
Eg /eV 3,2 3,6 2,58 2,26 0,50 2,06 0,6 8,97 3,05
Metalle:
Energielücke zwischen besetztem und unbesetztem Bandbereich nicht vorhanden, elektrische Leitung ist immer möglich. Halbleiter: Kleine Energielücke zwischen Valenzund Leitungsband, elektrische Leitung ist erst nach Energiezufuhr (thermisch, Licht) durch Elektron-Loch-Paarbildung möglich. Isolatoren: Keine Leitung möglich, da Energielücke zwischen Valenz- und Leitungsband zu groß für thermische oder andere Anregung. 16.4.2 Störstellenleitung
Durch den Einbau von anderswertigen Fremdatomen (Dotierung) in den Halbleiterkristall kann die Leitfähigkeit etwa bei T = 300 K um Größenordnungen erhöht werden: Störstellenleitung. Werden z. B. 5-wertige Arsenatome in das 4-wertige Grundgitter (Ge, Si) eingebaut, so sind die überzähligen 5. Valenzelektronen nicht innerhalb von Elektronenpaaren an den nächsten Gitternachbar gebunden, sondern können durch geringe Energiezufuhr Ed (10−2 bis 10−1 eV) von ihren Atomen abgetrennt werden (Bild 16-20a). Solche höherwertigen Fremdatome, die Elektronen liefern, heißen Donatoren. Im Bänderschema befinden sich die Donatorniveaus energetisch dicht unterhalb der Leitungsbandkante (Bild 16-20b). Im ionisierten Zustand (d. h. bei abgetrenntem Elektron) sind die ortsfesten Donatoren positiv geladen. Bei Zimmertemperaturen (kT = 0,026 eV) haben die meisten Donatorniveaus ihre Elektronen durch
16 Transport elektrischer Ladung: Leitungsmechanismen
Bild 16-20. N-Leitung in Halbleitern mit Donatorstörstellen
thermische Anregung an das Leitungsband abgegeben. Die elektrische Leitung in solchen Halbleitern erfolgt daher fast ausschließlich durch Elektronen im Leitungsband: N-Leiter. Eigenleitung durch Elektronen-Loch-Paaranregung wird gegenüber der Störstellenleitung je nach Dotierungsdichte erst bei höheren Temperaturen merklich. Wird mit geringerwertigen Fremdatomen dotiert, z. B. mit 3-wertigen Boratomen im 4-wertigen Si-Gitter, so ist jeweils eine Elektronenpaarbindung nicht vollständig (Bild 16-21a). Unter geringem Energieaufwand Ea (10−2 bis 10−1 eV) können solche Fremdatome benachbarte Elektronen aus dem Valenzband aufnehmen (Akzeptoren) und damit dort Löcher erzeugen. Im Bänderschema befinden sich die Akzeptorniveaus energetisch dicht oberhalb der Valenzbandkante (Bild 16-21b).
Auch hier sind bei Zimmertemperatur die Störstellen weitgehend ionisiert, d. h., sie haben durch thermische Anregung Elektronen aus dem Valenzband aufgenommen. Die ortsfesten Akzeptoren sind dann negativ geladen. Die elektrische Leitung erfolgt fast ausschließlich durch die erzeugten Löcher im Valenzband: P-Leiter. Die Fermi-Kante liegt bei dotierten Halbleitern in der Mitte zwischen den Störstellenniveaus und der zugehörigen Bandkante. Für die Gesamtdichten n, p der Leitungselektronen bzw. Löcher ist nunmehr nicht mehr die Breite Eg der Energielücke zwischen Valenz- und Leitungsband maßgebend, sondern die Anregungsenergie Ed bzw. Ea . Demzufolge ergibt sich für die Temperaturabhängigkeit des spezifischen Widerstandes
(T ) ∼ [n(T )]−1 ∼ eEd /2kT
(16-61)
für N-Leitung und
(T ) ∼ [p(T )]−1 ∼ eEa /2kT
(16-62)
für P-Leitung. 16.4.3 Hall-Effekt in Halbleitern
Die experimentelle Feststellung, welche Art von Majoritätsladungsträgern vorliegt, kann mittels des HallEffekts erfolgen (14.1). Die Hall-Spannung UH senkrecht zum Strom I in einem Bandleiter im transversalen Magnetfeld B (Bild 14-4) ist nach (14-15) gegeben durch U H = AH
IB d
(16-63)
mit dem Hall-Koeffizienten (14-18) AH =
1 . e(p − n)
(16-64)
Für reine Löcherleitung (P-Leitung) bzw. reine Elektronenleitung (N-Leitung) folgt daraus AHP = Bild 16-21. P-Leitung in Halbleitern mit Akzeptorstörstel-
len
1 , ep
AHN = −
1 . en
(16-65)
N- und P-Leitung sind daher durch die entgegengesetzten Vorzeichen der Hall-Spannung zu erkennen.
B195
B196
B Physik
Aus der Größe der Hall-Spannung bzw. des HallKoeffizienten (16-65) können ferner die Ladungsträgerdichten n und p bestimmt werden. Aufgrund der formalen Ähnlichkeit von (16-63) mit dem Ohm’schen Gesetz U = RI wird AH B RH = (16-66) d Hall-Widerstand genannt. Der klassische HallWiderstand steigt linear mit der magnetischen Flussdichte B an. Die Hall-Spannung ergibt sich daraus zu U H = RH I .
(16-67)
In geeigneten Halbleiteranordnungen (SiliziumMetalloxid-Oberflächen-Feldeffekttransistor: MOSFET) lassen sich bei bestimmten Betriebsbedingungen nahezu zweidimensionale Leitergeometrien erzeugen (Dicke d = (5 . . . 10) nm). Das Elektronengas in einer solchen Anordnung kann in guter Näherung als zweidimensional behandelt werden, d. h., dass die Dicke d der leitenden Schicht keinen Einfluss mehr auf die Leitung hat. Der Hall-Widerstand RH wird dann unabhängig von der Geometrie gleich dem spezifischen Hall-Widerstand H . Der HallWiderstand im zweidimensionalen Elektronengas zeigt bei tiefen Temperaturen und hohen Magnetfeldern eine Quantisierung in ganzzahligen Bruchteilen eines größten Wertes RH0 (von Klitzing, 1980), den Quanten-Hall-Effekt (Klitzing-Effekt) RH = H =
RH0 i
(i = 1, 2, . . .)
(16-68)
mit dem allein durch Naturkonstanten bestimmten Wert des elementaren Quanten-Hall-Widerstandes RH0 =
h = 25 812,807557 Ω . e2
(16-69)
Der Hall-Widerstand steigt unter diesen Bedingungen nicht mehr linear, sondern stufenförmig mit dem Magnetfeld B an, wobei die Plateaus konstanten Hall-Widerstandes durch (16-68) gegeben sind (Bild 16-22). Die Lagen der Plateaus sind unabhängig vom Material und sehr genau (3,7 · 10−9 ) reproduzierbar. Sie eignen sich daher hervorragend als Widerstandnormal.
Bild 16-22. Abhängigkeit des Hall-Widerstandes eines
zweidimensionalen Elektronengases vom transversalen Magnetfeld: klassischer Verlauf und nach dem QuantenHall-Effekt (T = 0,008 K)
16.4.4 PN-Übergänge
Grenzt ein P-Halbleiter an einen N-Halbleiter (z. B. durch unterschiedliche Dotierung auf beiden Seiten einer Grenzfläche), so diffundieren im Bereich der Grenzfläche (Diffusionszone) Löcher und Elektronen in das jeweils andere Dotierungsgebiet und rekombinieren dort. Die ortsfesten positiven DonatorStörstellen und negativen Akzeptor-Störstellen bilden schließlich eine Raumladungs-Doppelschicht, deren Feldstärke eine weitere Diffusion unterbindet. Die Diffusionszone eines solchen PN-Überganges zeigt daher eine Ladungsträgerverarmung. Durch Anlegen einer elektrischen Spannung U zwischen N- und P-leitendem Bereich eines solchen Überganges kann die Feldstärke im Verarmungsbereich erhöht werden, die Verarmungszone wird breiter. Wegen der fehlenden Ladungsträger in dieser Sperrschicht fließt trotz angelegter Spannung kein Strom: Der PN-Übergang ist in Sperrrichtung gepolt. Wird die äußere Spannung in umgekehrter Richtung angelegt, so wird die Verarmungszone schmaler, bis sie mit steigender Spannung (ab 0,1 bis 0,5 V) ganz verschwindet und der Strom steil mit U ansteigt: Der PN-Übergang ist in Flussrichtung gepolt. Der PN-Übergang stellt daher einen Gleichrichter dar: Halbleiterdiode. Eine Anordnung aus sehr dicht (ca. 50 μm) benachbarten, gegeneinander geschalteten Übergängen (PNP oder NPN) kann zur Verstärkung elektrischer Signale benutzt werden: Transistor (Bardeen, Brattain, Shockley, 1948). Näheres zu den Schaltelementen Diode und Transistor siehe G 27 und auch G 25.
16 Transport elektrischer Ladung: Leitungsmechanismen
16.5 Elektrolytische Leitung Elektrolyte sind Stoffe, deren Lösung oder Schmelzen den elektrischen Strom leiten. Elektrolytische Leitung tritt bei Substanzen mit Ionenbindung (16.1 und C 4) auf, wenn diese durch thermische Anregung aufgebrochen wird (Dissoziation) und die Ionen beweglich sind. Das kann bei hohen Temperaturen in Salzschmelzen der Fall sein. Bei Zimmertemperatur reicht die thermische Energie kT ≈ 0,026 eV dazu i. Allg. nicht aus. Bei Lösung in einem Lösungsmittel wird jedoch die Coulomb-Kraft (12-1) zwischen den Ionen um den Faktor der Permittivitätszahl εr des Lösungsmittels reduziert (Wasser: εr = 81, siehe Tabelle 12-2). Die Dissoziationsarbeit (12-26) "∞ Wdiss = −
FC dr = r0
1 (ze)2 · εr 4πε0 r0
(16-70)
kann dann teilweise durch die thermische Energie aufgebracht werden (z Wertigkeit; r0 Bindungsabstand der Ionen). Beispiel: Kochsalzmolekül NaCl (r0 ≈ 0,2 nm) in Luft: Wdiss = 7,2 eV, in Wasser: Wdiss = 0,09 eV. Mit steigender Temperatur erhöht sich die Leitfähigkeit der Elektrolyte durch Zunahme der Ladungsträgerdichte und Abnahme der Viskosität. Ein Salz der Zusammensetzung MeA (Me Metall, A Säurerest) dissoziiert in Lösung in die Ionen +
−
MeA → Me(z ) + A(z ) , +
Beispiele : NaCl → Na + Cl
−
CuSO4 → Cu2+ + SO2− 4 . Beim Ladungstransport im angelegten elektrischen Feld wandern die positiven Ionen (Kationen) zur Kathode, die negativen Ionen (Anionen) zur Anode (Bild 16-23). Dort geben sie ihre Ladung ab und werden an den Elektroden abgeschieden (Elektrolyse, vgl. C 9.8) oder unterliegen chemischen Sekundärreaktionen. Im Gegensatz zu den Metallen und Halbleitern, die durch den elektrischen Ladungstransport nicht verändert werden, findet bei der elektrolytischen Leitung eine Zersetzung des Leiters statt. Reine Lösungsmittel haben in der Regel eine sehr geringe Leitfähigkeit. Für die Leitfähigkeit gilt
Bild 16-23. Elektrolytische Leitung durch Kationen und
Anionen
daher bei kleinen Konzentrationen cB eines gelösten Salzes B die Proportionalität γ ∼ cB , da mit zunehmender Konzentration die Ladungsträgerdichte erhöht wird. Bei hohen Konzentrationen tritt infolge Abschirmung des äußeren Feldes durch Anlagerung entgegengesetzt geladener Ionen eine Sättigung der Konzentrationsabhängigkeit der Leitfähigkeit ein (Debye-Hückel-Theorie). Geschwindigkeit des Ionentransports
Ähnlich wie bei den Halbleitern und anders als bei den Metallen übernehmen bei den Elektrolyten zwei Sorten von Ladungsträgern mit i. Allg. unterschiedlichen Beweglichkeiten μ+ (Kationen) und μ− (Anionen) den Stromtransport. Die Leitfähigkeit ist daher analog zu (16-48) γ = n+ zeμ+ + n− zeμ− = nze(μ+ + μ− ) .
(16-71)
Die Größenordnung der Ionenbeweglichkeit lässt sich abschätzen aus dem Gleichgewicht zwischen viskoser Reibungskraft einer Kugel gemäß (9-37) und der elektrischen Feldkraft auf die Ionen: 6πηri v = zeE .
(16-72)
η ist die dynamische Viskosität (9.4) des Lösungsmittels (z. B. von Wasser bei ϑ = 20 ◦ C: η = 1,002 mPa · s). Der Ionenradius ri beträgt etwa 100–200 pm. Daraus ergibt sich eine Ionenbeweglichkeit in Wasser μi =
ze |v| = ≈ 5 · 10−8 m2 /V s , E 6πηri
(16-73)
die damit um etwa 5 Größenordnungen kleiner als die der Elektronen in Metallen ist (vgl. 15.1 und Tabelle 16-5).
B197
B198
B Physik
Tabelle 16-5. Ionenbeweglichkeit (ϑ = 20 ◦ C)
(siehe 16.7.1), durch thermische Ionisierung (Flamme, Glühdraht) oder durch eine ionisierende Strahlung (Ultraviolett-, Röntgen-, radioaktive Strahlung). Bei der Ionisation werden Elektronen abgetrennt, sodass positive Ionen entstehen. Beide tragen zum Ladungstransport bei.
μi 10−8 m2 /V s 4,6 6,85 18,2 33
Ionensorte Na+ Cl− OH− H+
16.6.1 Unselbstständige Gasentladung
Elektrolytische Abscheidung
Die beim Ladungstransport durch einen Elektrolyten an den Elektroden abgeschiedene Masse m ist proportional zur transportierten Ladung Q: m = CQ = CIt
(1. Faraday-Gesetz)
(16-74)
C elektrochemisches Äquivalent , SI-Einheit: [C] = kg/As = kg/C . Die abgeschiedene Stoffmenge ν (in Mol, siehe 8.1) ist ferner durch die transportierte Ladung und die Ladung pro Mol gegeben: ν=
Q . zF
(16-75)
Hierin ist die Ladung pro Mol, die Faraday-Konstante F = NA e = (96 485,3399 ± 0,0024) C/mol (16-76) mit NA = 6,02214179 · 1023 /mol, Avogadro-Konstante (siehe 8.1). Die abgeschiedene Masse ergibt sich daraus mit der molaren Masse M zu (vgl. C 9.8) m = νM =
MIt zF
(2. Faraday-Gesetz) .
Wenn die Stromleitung nach Ende des ladungsträgerliefernden Vorganges (siehe oben) abbricht, so spricht man von einer unselbstständigen Gasentladung. Die Strom-Spannungs-Charakteristik (Kennlinie) einer unselbstständigen Gasentladung, wie man sie etwa mit einer Gasflamme als Ionisationsquelle zwischen zwei Metallplatten als Elektroden in Luft messen kann (Bild 16-24a), zeigt ein ausgeprägtes Plateau (Bild 16-24b). Im Bereich des Plateaus zwischen den Spannungen U1 und U2 werden alle je Zeiteinheit von der Ionisationsquelle erzeugten Ladungsträger abgesaugt. Bei steigender Spannung ist daher zunächst kein weiterer Stromanstieg möglich: Sättigung. Für U < U1 ist die Driftgeschwindigkeit der Ladungsträger so klein, dass die Wahrscheinlichkeit der Wiedervereinigung von Elektronen und Ionen zu neutralen Molekülen beachtlich wird: Rekombination. Sie fallen für den Stromtransport aus. Für U > U2 ist dagegen die Feldstärke E so groß, dass die Energieaufnahme der Elektronen zwischen zwei Stößen mit Gasmolekülen ausreicht, um die Gasmoleküle bei den Stößen zu ionisieren: Stoßionisation. Dadurch werden zusätzliche Ladungsträger erzeugt, und der Strom steigt oberhalb des Sättigungsbereiches wieder an. Ist le die mittlere
(16-77)
16.6 Stromleitung in Gasen Den elektrischen Stromtransport durch ein Gas nennt man Gasentladung. Luft und andere Gase sind bei nicht zu hohen Temperaturen Isolatoren. Eine Gasentladung kann daher nur entstehen, wenn Ladungsträger in das Gas injiziert oder in ihm durch Ionisation der Gasmoleküle erzeugt werden. Das kann z. B. geschehen durch Elektronenemission aus einer Glühkathode
Bild 16-24. Kennlinie einer unselbstständigen Gasentla-
dung
16 Transport elektrischer Ladung: Leitungsmechanismen
Uz = const · pd .
(16-80)
Die Zündspannung hängt danach nur vom Produkt aus Gasdruck und Elektrodenabstand ab: Uz = f (pd)
Bild 16-25. Entwicklung von Ladungsträgerlawinen bei
Stoßionisation durch Elektronen
freie Weglänge der Elektronen, so lautet die Ionisierungsbedingung für Elektronen eΔU = eEle Ei
(16-78)
mit Ei Ionisierungsenergie. Die entsprechende Bedingung für die Ionisation durch Ionen wird erst bei höheren Feldstärken erreicht, da die mittlere freie Weglänge der Ionen li kleiner als die der Elektronen ist. Die Stoßionisation durch Elektronen führt zu Ladungsträgerlawinen, die von jedem „Startelektron“ in Kathodennähe ausgelöst werden (Bild 16-25), bei Ankunft an den Elektroden aber wieder erlöschen. Die unselbstständige Gasentladung wird u. a. bei der Ionisationskammer zur Strahlungsmessung eingesetzt, da der Strom (in allen drei Bereichen) proportional zur Zahl und Energie von in den Feldraum eindringenden ionisierenden Teilchen ist. 16.6.2 Selbstständige Gasentladung
Bei weiterer Erhöhung der Spannung bzw. Feldstärke kann die Gasentladung in eine selbstständige Entladung umschlagen, die auch ohne Fremdionisation weiterläuft. Das tritt dann ein, wenn die Energieaufnahme auch der Ionen innerhalb ihrer freien Weglänge li so groß wird, dass durch Ionisation von Gasmolekülen neue Elektronen in Kathodennähe erzeugt werden: eΔU = eEli Ei .
(Paschen’sches Gesetz) .
(16-81)
In der Form (16-80) gilt das Paschen’sche Gesetz allerdings nur für große Werte von pd. Für niedrige Drücke oder kleine Abstände wird d < li , die Häufigkeit der Stoßionisation nimmt ab. Die Zündspannung erhöht sich, bis durch Ionenstoß an der Kathode hinreichend Sekundärelektronen (siehe 16.7.1) zur Aufrechterhaltung der Entladung ausgelöst werden. Die Theorie von Townsend ergibt für diesen Fall die Townsend’sche Zündbedingung Uz =
C1 pd , ln(pd) − C2
(16-82)
die das Paschen’sche Gesetz mit enthält und bei großen pd näherungsweise in (16-80) übergeht (Bild 16-26). Für jede Spannung oberhalb einer Minimumspannung gibt es danach bei konstantem Druck einen kleinen und einen großen Elektrodenabstand, für den bei vorgegebener Spannung die Entladungsstrecke zündet: Nah- und Weitdurchschlag. Anmerkung: Bei großen Schlagweiten (pd > 1000 Pa · m) wird der Zündmechanismus des Lawinenaufbaus abgelöst vom Kanalaufbau, bei dem sich ein Plasmaschlauch hoher Leitfähigkeit zwischen den Elektroden bildet. An dessen Aufbau ist die bei der Stoßanregung auftretende Lichtstrahlung wesentlich beteiligt.
(16-79)
Daraus lässt sich eine Beziehung für die Zündspannung Uz gewinnen. Die mittlere freie Weglänge li hängt nach (9-6) von der Molekülzahldichte und damit vom Druck p ab: li ∼ 1/p. Ferner gilt für die Feldstärke bei der Zündspannung E = Uz /d mit d Elektrodenabstand. Dann folgt aus (16-79)
Bild 16-26. Zündspannungen verschiedener Gase für ebene
Elektroden
B199
B200
B Physik
Selbstständig brennende Gasentladungen haben über weite Bereiche eine fallende Kennlinie, d. h., die Entladungsstromstärke kann aufgrund der Ladungsträgervermehrung durch Stoßionisation unter Absinken der Brennspannung sehr große Werte annehmen, die zur Zerstörung des Entladungsgefäßes führen können. Gasentladungen müssen daher immer mit einem strombegrenzenden Vorwiderstand (oder bei Wechselspannung auch mit einer Vorschaltdrossel) betrieben werden. Die vollständige Kennlinie einer Gasentladung zeigt Bild 16-27. Sie besteht aus dem Vorstrombereich der unselbstständigen Gasentladung, dem sich nach Erreichen der Zündspannung die fallende Kennlinie des selbstständigen Entladungsbereiches anschließt. Der obere Schnittpunkt der durch den Vorwiderstand R festgelegten Arbeitsgeraden I = (Uz − U)/R mit der Entladungskennlinie kennzeichnet den sich einstellenden Arbeitspunkt. Der untere Schnittpunkt ist nicht stabil. Leuchterscheinungen in Gasentladungen treten dadurch auf, dass neben der Stoßionisation auch Stoßanregung der Gasatome erfolgt. Die energetisch um ΔE angeregten Gasatome gehen meist nach sehr kurzer Zeit (≈ 10−8 s) unter Aussendung von Lichtquanten der Energie ΔE = hν wieder in den Grundzustand über (siehe 20.1). Die Leuchterscheinungen sind sehr verwickelt und von den Entladungsparametern abhängig, in der Farbe aber charakteristisch für das verwendete Gas. Bild 16-28a zeigt ein typisches Erscheinungsbild einer Gasentladung bei vermindertem Druck (ca. 100 Pa). Der Potenzial- und Feldstärkeverlauf wird durch die auftretenden Raumladungen gegenüber dem Verlauf ohne Entladung stark verändert
Bild 16-27. Vollständige Kennlinie einer selbstständigen Gasentladung
Bild 16-28. Leuchterscheinungen, Feldstärke-, Potenzial-
und Raumladungsverteilung in einer Gasentladung bei vermindertem Druck
(Bild 16-28b): Die Feldstärken sind besonders groß im Gebiet vor der Kathode (Kathodenfall) und (weniger groß) im Gebiet vor der Anode (Anodenfall). Im Bereich der positiven Säule mit konstanter Feldstärke sind Elektronen und positive Ionen in gleicher Dichte vorhanden: quasineutrales Plasma. Gasentladungslampen gemäß Bild 16-28a mit Edelgasfüllung werden als Glimmlampen mit kleinen Elektrodenabständen (positive Säule unterdrückt) für Anzeigezwecke, als sog. Neonröhren mit großen Elektrodenabständen für Reklamezwecke verwendet. Leuchtstoffröhren haben eine Quecksilberdampfatmosphäre, deren Emission im Ultravioletten durch den auf der Innenwand des Glasrohres aufgebrachten Leuchtstoff in sichtbares Licht umgewandelt wird. Bei großen Entladungsströmen werden die Elektroden durch die aufprallenden Elektronen (Anode) bzw. Ionen (Kathode) stark erwärmt und können dadurch Elektronen emittieren (Thermoemission, siehe 16.7.1). Die Folge ist eine erhebliche Verringerung der Brennspannung, da die Ionen nicht mehr zur Elektronenerzeugung durch Stoßionisation beitragen müssen: Bogenentladung (Lichtbogen). Beispiele: Quecksilberhochdrucklampe, Kohlelichtbogen. Bei letzterem wird die Anodenkohle besonders heiß (ca. 4200 K) und wird deshalb als Lichtquelle kleiner
16 Transport elektrischer Ladung: Leitungsmechanismen
Ausdehnung für Projektionszwecke verwendet. Weitere Anwendung: Lichtbogenschweißen. Funken sind rasch erlöschende Bogenentladungen in hochohmigen Stromkreisen, bei denen die Spannung an der Funkenstrecke durch den einsetzenden Entladungsstrom zusammenbricht. Bei gegebener Elektrodenform und Druck ist die Zündspannung Uz recht genau definiert: Anwendung als Kugelfunkenstrecke zur Hochspannungsbestimmung aus der Schlagweite. Zum Nachweis ionisierender Teilchen (radioaktive Strahlung, Höhenstrahlung) wird das Zählrohr (Geiger u. Müller) verwendet. Es besteht meist aus einem metallischen Zylinder und einem axial ausgespannten Draht als Elektroden in einer geeigneten Gasfüllung. Eine über einen sehr großen Vorwiderstand (108 bis 109 Ω) angelegte Spannung (500 bis 2000 V) sorgt für eine hohe Feldstärke in Drahtnähe. Eindringende ionisierende Teilchen lösen Ladungsträgerlawinen aus, die als Spannungsimpulse verstärkt und gemessen werden können. Bei niedrigerer Spannung (unselbstständige Entladung) arbeitet das Zählrohr im Proportionalbereich, d. h., die Höhe des Spannungsimpulses ist der Zahl der primär erzeugten Ionen proportional und gestattet damit eine Aussage über die Ionisationseigenschaften des einfallenden Teilchens. Bei höherer Spannung wird eine selbstständige Entladung ausgelöst (Auslösebereich), die jedoch durch den Zusammenbruch der Spannung am Zählrohr infolge des hohen Vorwiderstandes wieder gelöscht wird. Hiermit wird allein die Zahl der einfallenden Teilchen gemessen.
sich die Temperatur des Plasmas, ein wichtiger Effekt der Plasmaphysik, der bei Kernfusionsanlagen ausgenutzt wird (vgl. 17.4). Plasmen können auch zu elektrostatischen Schwingungen angeregt werden: Plasmaschwingungen (Rompe u. Steenbeck). Durch CoulombWechselwirkung mit eingeschossenen, schnellen geladenen Teilchen können lokale Ladungstrennungen des quasineutralen Plasmas herbeigeführt werden, oder auch spontan durch Schwankungserscheinungen entstehen. Dadurch ergibt sich bei einer Ladungsträgerdichte n lokal eine elektrische Polarisation (12-91) P = n p = −ner, bzw. nach (12-94) eine Polarisationsfeldstärke Ep = −ner/ε0 , was zu einer rücktreibenden Kraft
16.6.3 Der Plasmazustand
Bei einer Elektronendichte von ne ≈ 5 · 1018 /m3 ergibt sich eine Plasmafrequenz νpe = ωpe /2π = 20 · 109 Hz. Das freie Elektronengas in Metallen stellt unter Berücksichtigung des positiven GitterionenHintergrundes ebenfalls ein Plasma dar, in dem allerdings die Dichten ne wesentlich höher sind.
Der in Gasentladungen (insbesondere in der positiven Säule) auftretende Plasmazustand, in den auch ohne elektrisches Feld jedes Gas bei sehr hohen Temperaturen übergeht, unterscheidet sich durch das Auftreten frei beweglicher Ladungen (Elektronen und positive Ionen) grundsätzlich von den anderen Aggregatzuständen: vierter Aggregatzustand. Thermisches Gleichgewicht kann sich hier oftmals nur innerhalb der einzelnen Teilchensorten einstellen, sodass man zwischen Neutralteilchentemperatur, Ionentemperatur und Elektronentemperatur unterscheiden muss. Bei hohen Entladungsströmen wirkt das entstehende Magnetfeld komprimierend auf das Plasma: Pincheffekt. Durch die Einschnürung erhöht
eEp = −
ne2 r = m¨r ε0
(16-83)
führt. Gleichung (16-83) stellt eine Schwingungsgleichung dar. Durch Vergleich mit (5-21) ergeben sich als Eigenfrequenzen für Elektronen (Dichte ne , Masse me ) bzw. Ionen (Dichte ni , Masse mi ) die ElektronenPlasmakreisfrequenz 8 n e e2 (16-84) ωpe = ε0 me bzw. die Ionen-Plasmakreisfrequenz 8 n i e2 ωpi = . ε0 mi
(16-85)
Beispiel: Die Atomzahldichte von Aluminium ist nAl = 60,3 · 1027 /m3 . Drei Leitungselektronen je Atom ergeben eine Elektronendichte ne = 181 · 1027 /m3 und daraus eine Plasmafrequenz νpe = 3,82 · 1015 Hz. Den Plasmaschwingungen lassen sich Quasiteilchen (Plasmonen) der Energie Ep = hνp = 2,53 · 10−18 J = 15,8 eV zuordnen (Bohm u. Pines). Tatsächlich lassen sich beim Durchgang
B201
B202
B Physik
schneller Elektronen durch dünne Al-Schichten Energieverluste dieser Größe nachweisen, die durch Anregung solcher Plasmonen entstehen.
16.7 Elektrische Leitung im Hochvakuum Im Vakuum stehen keine potenziellen Ladungsträger zur Verfügung. Zur Stromleitung müssen daher Ladungsträger von außen in das Vakuum hineingebracht werden (Ladungsträgerinjektion). Dies kann z. B. durch Elektronenemission aus einer Metallelektrode erreicht werden. 16.7.1 Elektronenemission
Obwohl die Leitungselektronen innerhalb eines Metalls sich quasi frei bewegen können (freies Elektronengas, siehe 16.2), können sie unter normalen Bedingungen nicht aus dem Metall austreten. Dies ist nur möglich bei Aufwendung einer Austrittsarbeit Φ, die bei Metallen etwa zwischen 1 und 5 eV beträgt (Tabelle 16-6). Dem entspricht das Austrittspotenzial ϕ=
Φ , e
(16-86)
das die Höhe des Potenzialwalles an der Oberfläche des Metalls kennzeichnet, den die Leitungselektronen überwinden müssen, wenn sie aus dem Metall in das Unendliche gebracht werden sollen. Die Kraft, gegen die die Austrittsarbeit geleistet werden muss, hat zweierlei Ursachen: (1.) Bei Austritt eines Elektrons aus der Metalloberfläche wird die Ladungsneutralität gestört, es treten rücktreibende Coulomb-Kräfte auf, die durch die Bildkraft (siehe 12.7) beschrieben werden können. (2.) Durch die infolge der thermischen Bewegung austretenden, aber am Potenzialwall sofort wieder reflektierten Elektronen bildet sich eine dünne Ladungsdoppelschicht an der Oberfläche, die selbst zum Potenzialwall beiträgt und weitere Elektronen am Austritt hindert. Das Innere eines Metalls hat also ein niedrigeres Potenzial als das Vakuum, es stellt einen Potenzialtopf dar, an dessen Boden sich die Elektronen mit der Fermi-Energie befinden (FermiSee). Die energetische Darstellung zeigt Bild 16-29. Nur Elektronen mit der Energie E > EF +Φ im Metall können die Austrittsarbeit Φ aufbringen und in das Vakuum gelangen. Die notwendige Mindestenergie Φ kann z. B. aufgebracht werden durch
Tabelle 16-6. Austrittsarbeit Φ einiger Metalle, Halbleiter
und Oxide Material Aluminium Barium Caesium Eisen Germanium Gold Lithium Kohlenstoff Kupfer Natrium Molybdän Nickel Palladium Platin Selen Silber Silicium Thorium Wolfram Ba auf BaO Cs auf W Th auf W LaB6 WO
Φ in eV 4,20 2,52 1,95 4,67 5,02 5,47 2,93 ≈ 5,0 5,10 2,35 4,53 5,09 5,22 5,64 5,9 4,43 4,85 3,45 4,55 1,0 1,4 2,60 2,7 ≈ 10,4
Bild 16-29. Energieschema an der Oberfläche eines Metalls
(Potenzialtopfmodell)
1. Wärmeenergie: Thermoemission, 2. elektromagnetische Strahlungsenergie (Licht): Fotoemission, 3. elektrostatische Feldenergie: Feldemission, 4. kinetische Stoßenergie: Sekundäremission.
16 Transport elektrischer Ladung: Leitungsmechanismen
Thermoemission (Glühemission)
mit der universellen Richardson-Konstante
Bei T > 0 ist die Dichte der besetzten Zustände durch die Zustandsdichte Z(E) und die FermiDirac-Verteilung fFD (E) gegeben (siehe 16.2). Bei Zimmertemperatur und E > EF + Φ hat die FermiVerteilung extrem kleine Werte (Bild 16-9), sodass keine Elektronen emittiert werden. Bei höheren Temperaturen kann jedoch der Thermoemissionsstrom merkliche Werte annehmen und in folgender Weise berechnet werden. Bei einer Energie E = EF + Φ im Metall haben die Leitungselektronen nach Austritt durch die Metalloberfläche in das Vakuum die kinetische Energie 0. Ihre Zustandsdichte beträgt im Vakuum entsprechend (16-22) 3/2 1 2me Z0 (E) = 2 E − EF − Φ (16-87) 2 2π für E EF + Φ .
4πme ek2 = 1,2 · 106 A/(m2 · K2 ) . (16-92) h3 Die thermische Emissionsstromdichte hängt also exponentiell von der Temperatur und von der Austrittsarbeit ab. Bei T = 3000 K ergibt sich eine Emissionsstromdichte von js = 13,5 A/cm2 . Für AR werden experimentell Werte im Bereich (0,2 . . . 0,6) ·106 A/(m2 · K2 ) gefunden.
Die Elektronenkonzentration im Vakuum ergibt sich durch Integration über E gemäß "∞ n= Z0 (E) fFD (E) dE EF +Φ
(2πme kT )3/2 −Φ/kT e , (16-88) h3 wobei für E EF + Φ wie in 16.4 die Fermi-DiracVerteilung durch die Boltzmann-Näherung (16-21) ersetzt werden kann. Im thermischen Gleichgewicht ist die Stromdichte js der aus dem Metall austretenden Elektronen gleich der Stromdichte j x der aus dem Vakuum auf das Metall treffenden Elektronen 1 (16-89) js = j x = en|v x | . 2 Die mittlere absolute Geschwindigkeitskomponente senkrecht zur Metalloberfläche |v x | lässt sich durch Mittelung von |v x | gewichtet mit der eindimensionalen Boltzmann-Verteilung errechnen zu 2kT |v x | = . (16-90) πme =2
AR =
Fotoemission
Die Energie zur Aufbringung der Austrittsarbeit für Elektronen im Fermi-See eines Festkörpers kann auch durch äußere Einstrahlung von Energie in Form elektromagnetischer Strahlung (Licht, Röntgenstrahlung) zugeführt werden: Fotoeffekt (lichtelektrischer Effekt, H. Hertz 1887, Hallwachs 1888). Die experimentelle Untersuchung (Hallwachs, Lenard) ergab für den Fotoeffekt: 1. Die Fotoemissions-Stromdichte ist proportional zur eingestrahlten Lichtintensität. 2. Die maximale kinetische Energie der emittierten Elektronen Ek, max ist bei monochromatischer Lichteinstrahlung eine lineare Funktion der Frequenz ν des Lichtes, aber unabhängig von der Lichtintensität. Unterhalb einer Grenzfrequenz νc tritt keine Fotoemission auf (Bild 16-30b). 3. Die Fotoemission setzt auch bei geringster Bestrahlungsstärke ohne Verzögerung praktisch trägheitslos ein. Die Erklärung des Fotoeffektes erfolgte durch die Lichtquantenhypothese (Einstein, 1905): Die Fotoelektronenauslösung erfolgt durch Einzelprozesse zwischen je einem Lichtquant der Energie E = hν
(16-93)
Aus (16-88) bis (16-90) folgt schließlich für die thermische Elektronenemission bei der Temperatur T die Richardson-Dushman-Gleichung
und einem Leitungselektron. Dabei wird das Lichtquant absorbiert. Seine Energie gemäß (16-93) liefert die Austrittsarbeit, einen eventuellen Überschuss erhält das Fotoelektron als kinetische Energie Ek, max mit, von der ein Teil Ei, coll durch unelastische Stöße im Innern des Metalls verloren gehen kann. Die Energiebilanz lautet damit
js = AR T 2 e−Φ/kT
hν = Φ + Ei, coll + Ek .
(16-91)
(16-94)
B203
B204
B Physik
Die maximal mögliche kinetische Energie eines ausgelösten Fotoelektrons ergibt sich daraus nach der Lenard-Einstein’schen Gleichung zu Ek, max = hν − Φ ,
(16-95)
was dem experimentellen Befund entspricht (Bild 16-30b). Die Grenzfrequenz des Fotoeffekts ergibt sich daraus für Ek, max = 0 zu νc =
Φ h
(16-96)
und gestattet in einfacher Weise die Bestimmung der Austrittsarbeit Φ. Aus der Steigung der Geraden in Bild 16-30b kann ferner das Planck’sche Wirkungsquantum h bestimmt werden. Die maximale kinetische Energie Ek,max lässt sich mit der Anordnung Bild 16-30a messen: Die ausgelösten Fotoelektronen treffen auf die gegenüberliegende Elektrode und laden sie auf, bis das so aufgebaute, stromlos zu messende Gegenpotenzial Umax = Ek, max /e eine weitere Aufladung verhindert. Die Einstein’sche Erklärung des Fotoeffektes führte die Quantisierung des elektromagnetischen Strahlungsfeldes ein, wobei die Quanten (Lichtquanten, Photonen) als räumlich begrenzte elektromagnetische Wellenzüge (Wellenpakete, siehe 18.1) zu denken sind, mit einer durch (16-93) gegebenen Energie. Schottky-Effekt und Feldemission
Wird an eine Metallkathode ein starkes elektrisches Feld angelegt, so wird die Potenzialschwelle Φ auf eine effektive Austrittsarbeit Φ = Φ − ΔΦ erniedrigt, die sich durch die Überlagerung des durch die äußere Feldstärke E bedingten Abfalls der potenziellen Energie (E0 − e|E|x) mit der durch die Bildkraft
verrundeten Potenzialschwelle der Austrittsarbeit ergibt (Bild 16-31). Für den Korrekturterm ΔΦ erhält man 8 e3 |E| . (16-97) ΔΦ = 4πε0 Diese Absenkung der Austrittsarbeit kann, da sie in den Exponenten der Richardson-Gleichung (16-91) eingeht, eine erhebliche Erhöhung der Thermoemission zur Folge haben: Schottky-Effekt (Thermofeldemission). Nicht thermisch angeregte Elektronen im Fermi-See des Metalls (Bild 16-31) können die auch bei großer Feldstärke E noch vorhandene Potenzialschwelle der Höhe Φ und der Breite Δx nach den Gesetzen der klassischen Physik nicht überwinden. Die Wellenmechanik zeigt jedoch, dass die Wellenfunktionen der Elektronen, wenn auch stark gedämpft, in die Potenzialschwelle eindringen. Wenn die Schwellenbreite Δx sehr klein ist (einige nm bei Feldstärken |E| = 109 V/m = 1 V/nm), ist die Amplitude der Wellenfunktionen auf der Vakuumseite der Potenzialschwelle noch merklich, d. h., die Metallelektronen haben auch außerhalb der Austrittspotenzialschwelle noch eine gewisse Aufenthaltswahrscheinlichkeit. Die Elektronen können demnach mit einer gewissen Wahrscheinlichkeit den Potenzialberg wie durch einen Tunnel durchlaufen: quantenmechanischer Tunneleffekt. Die Durchtrittswahrscheinlichkeit D für ein Elektron der Energie Ee durch einen Potenzialberg E(x) der Höhe ΔE = Emax − Ee und der Breite
Bild 16-31. Absenkung der Austrittsarbeit durch den
Bild 16-30. Fotoeffekt: Emission von Elektronen bei Lichteinstrahlung
Schottky-Effekt bei Anlegung eines äußeren elektrischen Feldes E, und dadurch bedingte Umformung der Austrittsenergiestufe Φ in eine Potenzialschwelle endlicher Breite Δx
16 Transport elektrischer Ladung: Leitungsmechanismen
Δx = x2 − x1 ergibt sich näherungsweise zu ⎧ ⎫ ⎪ ⎪ "x2 ⎪ ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎨ ⎬ D ≈ exp ⎪ 2m (E(x) − E ) dx − ⎪ e e ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ ⎭
Der Sekundärelektronen-Emissionskoeffizient für Elektronen jsec (16-102) δ= j0
x1
' αΔx 2me ΔE ≈ exp −
(16-98)
mit α ≈ (1 . . . 2) je nach der Form des Potenzialberges. Die Energie E ist hier nicht mit dem Betrag der Feldstärke |E| zu verwechseln. Der Tunneleffekt ermöglicht eine Elektronenemission auch bei kalter Kathode allein durch hohe Feldstärken |E| 109 V/m. Bei einem homogenen Feld nach Bild 16-31 ergibt die Rechnung, die ähnlich wie für die Thermoemission verläuft (unter Berücksichtigung der Durchlasswahrscheinlichkeit (16-98)), für die Feldemissionsstromdichte bei nicht zu hohen Temperaturen (Fowler-Nordheim-Gleichung) jF = AF
|E|2 −βΦ3/2 /|E| e Φ
(16-99)
mit AF = und
e3 = 2,5 · 10−25 A2 · s/V 8πh
( jsec Emissionsstromdichte der Sekundärelektronen; j0 Stromdichte der auffallenden Primärelektronen) hängt von der Energie der Primärelektronen ab (Bild 16-32) und hat bei Metallen Werte um 1, bei Halbleitern und Isolatoren bis über 10. Dieser Unterschied hängt damit zusammen, dass aus Impulserhaltungsgründen (vgl. 6.3.2) beim Stoß äußerer Primärelektronen auf freie Leitungselektronen eine Rückwärtsstreuung sehr viel unwahrscheinlicher ist als beim Stoß auf gebundene Elektronen in Halbleitern oder Isolatoren. Die Energie der ausgelösten Sekundärelektronen beträgt 20 eV. Mit steigender Primärelektronenenergie nimmt δ zunächst zu, um nach Durchlaufen eines maximalen Wertes (Ep max ≈ (500 . . . 1500) eV) wieder abzusinken, da wegen der steigenden Eindringtiefe der Primärelektronen die Auslösung in so großen Tiefen erfolgt, dass die Austrittswahrscheinlichkeit der Sekundärelektronen abnimmt (siehe Tabelle 16-7).
(16-100)
√ 4 2me β= = 1,06 · 1038 kg0,5 /(V · A2 · s3 ) . 3e (16-101)
Die Abhängigkeit der Feldemissions-Stromdichte von der Feldstärke entspricht genau der Abhängigkeit der Thermoemissions-Stromdichte von der Temperatur (16-91). Ausreichend hohe elektrische Feldstärken lassen sich nach (12-70) besonders leicht an feinen Spitzen mit Krümmungsradien von 0,1 bis 1 μm erzeugen. Anwendungen: Feldemissions-Elektronenmikroskop (Bild 12-23), Raster-Tunnelmikroskop (Bild 25-9).
Tabelle 16-7. Maximaler Sekundärelektronen-Emissions-
koeffizient δmax und zugehörige Energie Ep max für einige Festkörper Stoff
δmax
Eisen
1,3
Ep max /eV 400
Germanium
1,15
500
Graphit
1,0
300
Kupfer
1,3
600
Molybdän
1,25
375
Nickel
1,3
550
Platin
1,8
700
Silber
1,5
800
Wolfram
1,4
650
NaCl
6
600
Sekundärelektronenemission
BaO
6
Die Austrittsarbeit kann schließlich auch durch die kinetische Energie primärer Teilchen (Elektronen, Ionen), die auf die Festkörperoberfläche fallen, aufgebracht werden. Die so ausgelösten Elektronen werden Sekundärelektronen genannt.
MgO
2,4
1500
Al2 O3
4,8
1300
Glimmer
2,4
350
Ag-Cs2 O-Cs
8,8
550
400
B205
B206
B Physik
Bild 16-32. Sekundärelektronen-Emissionskoeffizient als
Funktion der Energie der Primärelektronen (schematisch)
Bild 16-33. Zur Herleitung der Potenzialgleichung
Im Energiebereich zwischen E1 und E2 (Bild 16-32), wo δ vor allem bei mit Caesium (sehr kleine Austrittsarbeit, Tabelle 16-6) versetzten Materialien Werte 1 annehmen kann, ist demnach die Zahl der Sekundärelektronen u. U. erheblich höher als die Zahl der auslösenden Primärelektronen. Dieser Effekt wird u. a. bei den Sekundärelektronenvervielfachern und Kanalmultipliern ausgenutzt. Die material- und winkelabhängige Sekundärelektronenemission wird ferner als Bildsignal im Rasterelektronenmikroskop verwendet (vgl. 25.5). Auch Ionen können Sekundärelektronen auslösen, z. B. 1 bis 5 Elektronen pro auftreffendes Ion. Beginnend bei einer Ionenenergie von etwa 2 keV steigt die Ausbeute etwa linear an. Ein Maximum der Ausbeute wie bei Elektronen gibt es bei Ionen bis 20 keV nicht. Die Auslösung von Elektronen durch Ionen spielt eine wichtige Rolle bei der selbstständigen Gasentladung (16.6.2).
vorgegebenen Feldstärken und Potenziale durch die Raumladung verändert, da von den Ladungen selbst ein elektrischer Fluss Ψ ausgeht. Für den Fall einer ebenen Geometrie ergibt sich nach dem Gauß’schen Gesetz (12-17) aus der Bilanz für den elektrischen Fluss durch die Oberfläche einer raumladungserfüllten, flachen Scheibe im Vakuum (Bild 16-33)
16.7.2 Bewegung freier Ladungsträger im Vakuum
Die Bewegung von freien Ladungsträgern q mit der Geschwindigkeit v im Vakuum, in dem nur elektrische und/oder magnetische Felder E bzw. B auftreten, wird durch die Lorentz-Kraft (13-18) F = q(E + v × B)
(16-103)
beschrieben. Die Bewegung einzelner geladener Teilchen in solchen Feldern wurde bereits früher besprochen: Beschleunigung und Ablenkung im elektrischen Längs- und Querfeld (12.2), Energieaufnahme im elektrischen Feld (12.5), Ablenkung im magnetischen Feld (13.2). Treten viele geladene Teilchen als Raumladung der Dichte (r) = n(r)q auf, so werden die von außen
dEx (x) = . dx ε0
(16-104)
Die Feldstärke ergibt sich aus der Änderung des Potenzials V(x) mit x gemäß (12-39), und somit
(x) d2 V(x) =− . ε0 dx2
(16-105)
Dies ist der eindimensionale Sonderfall der allgemein gültigen Potenzialgleichung ∂2 V ∂2 V ∂2 V
+ 2 + 2 =− , εr ε0 ∂x2 ∂y ∂z (Poisson-Gleichung) .
ΔV ≡
(16-106)
Vakuumdiode
Der Effekt der Raumladung soll anhand des von der Kathode in einer Vakuumdiode (Bild 16-34a) ausgehenden Thermoemissions-Elektronenstroms diskutiert werden. Die Kennlinie iA = f (uAK ) zeigt drei charakteristisch verschiedene Bereiche (Bild 16-34b): 1. uAK < 0: Die aus der Kathode entsprechend der Kathodentemperatur T K austretenden Elektronen (16-91) müssen gegen ein Anodenpotenzial −|uAK | anlaufen. Sie finden also eine gegenüber der Austrittsarbeit Φ um euAK erhöhte Energieschwelle vor, die nur von den Elektronen mit Ek > euAK überwunden wird.
16 Transport elektrischer Ladung: Leitungsmechanismen
Bild 16-34. a Vakuumdiode und b deren Kennlinien für ver-
wird und iA entsprechend der Schottky-LangmuirGleichung ansteigt. 3. uAK 0: Eine Grenze für das Ansteigen des Anodenstromes mit uAK ist durch die RichardsonGleichung (16-91) gegeben. Bei hinreichend großer Anodenspannung verschwindet die Raumladungsbegrenzung, und alle von der Kathodenoberfläche A emittierten Elektronen werden abgesaugt. Für das Sättigungsstromgebiet gilt dann is = A · AR T K2 e−Φ/kT K ,
schiedene Kathodentemperaturen
Analog zur Richardson-Gleichung (16-91) ergibt sich daher für den Anodenstrom im Anlaufstromgebiet iA = iA0 e−e|uAK |/kT K ,
(16-107)
worin T K die Kathodentemperatur ist. 2. uAK > 0: Die Elektronen werden zur Anode beschleunigt. Der Anodenstrom iA steigt dennoch nicht sofort auf den durch die Richardson-Gleichung (16-91) gegebenen Wert, da bei niedrigen Spannungen die durch den Anodenstrom iA = −nevA hervorgerufene negative Raumladung = −ne = iA /vA in Kathodennähe besonders groß ist (v klein), und die Elektronen geringerer kinetischer Energie von der Raumladung zur Kathode reflektiert werden: Raumladungsgebiet. Die Potenzialgleichung (16-105) lautet für diesen Fall
(x) iA d2 V(x) . =− =− (16-108) 2 ε0 ε0 vA dx Die Integration ergibt mit (12-53) 2 2 1 dV 1 dV 2iA me √ − = V . (16-109) 2 dx 2 dx x=0 ε0 A 2e Wir nehmen nun an, dass die Elektronenemission aus der Kathode raumladungsbegrenzt sei, d. h., dass durch die negative Raumladung vor der Kathode die Feldstärke dort fast 0 sei (tatsächlich ist sie etwas negativ). Dann ist (dV/dx) x=0 ≈ 0 und (16-109) kann weiter integriert werden (x = (0 . . . d), V = (0 . . . uAK )) mit dem Ergebnis 3/2 2e uAK 4 iA = ε0 A · 2 , (16-110) 9 me d (Schottky-Langmuir’sche Raumladungsgleichung) , dem sog. U 3/2 -Gesetz. Mit steigender Anodenspannung steigt auch die Geschwindigkeit v der Elektronen, sodass die Raumladung = ne ∼ 1/v abgebaut
(16-111)
wonach der Sättigungsstrom nur von der Kathodentemperatur T K abhängt. Aus der Kennlinie (Bild 16-34b) folgt, dass die Vakuumdiode den elektrischen Strom praktisch nur für positive Anodenspannung leitet. (Anwendung zur Gleichrichtung von Wechselströmen.) Triode
Im Raumladungsgebiet der Vakuumdiode bestimmt die Größe der Raumladung vor der Kathode den Anodenstrom iA . Durch Einführung eines negativ vorgespannten Steuergitters G zwischen Kathode und Anode erhält man eine künstliche, regelbare Raumladung mit der Möglichkeit, durch kleine Steuergitterspannungsänderungen ΔuGK entsprechende Anodenstromänderungen ΔiA zu erzeugen (Bild 16-35). Für konstante Spannung uAK wird das Verhältnis ΔiA = S Steilheit (16-112) ΔuGK uAK genannt. Übliche Elektronenröhren haben Steilheiten S = (1 . . . 10) mA/V.
Bild 16-35. a Triode in Verstärkerschaltung und b zugehörige Kennlinien (schematisch)
B207
B208
B Physik
Bei Einschaltung eines Arbeitswiderstandes Ra in den Anodenstromkreis bewirkt ΔuGK eine Änderung des Spannungsabfalls an Ra von ΔuAK = Ra ΔiA ≈ S Ra ΔuGK . Daraus folgt ein Spannungsverstärkungsfaktor ΔuAK ≈ S Ra , ΔuGK
(16-113)
der erheblich größer als 1 sein kann. Da bei negativer Steuergitterspannung uGK praktisch kein Gitterstrom fließt, erfolgt die Spannungsverstärkung mit Elektronenröhren nahezu leistungslos.
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen Die Kern- und Elementarteilchenphysik wird in der Hauptsache durch die starke und die schwache Wechselwirkung bestimmt, vgl. Einleitung zum Teil B II Wechselwirkungen und Felder (vor 11). Die zugehörigen Kräfte haben eine extrem kurze Reichweite ≈10−15 m und spielen daher in der sonstigen Physik gegenüber den elektromagnetischen und Gravitationskräften mit ihrer langen Reichweite keine Rolle. Im Bereich der Atomkerne und Elementarteilchen sind sie jedoch die bestimmenden Kräfte: Die starke Wechselwirkung bewirkt den Zusammenhalt der Atomkerne, indem die anziehenden Kernkräfte zwischen unmittelbar benachbarten Nukleonen die abstoßenden Coulomb-Kräfte übersteigen. Dagegen nehmen die Leptonen (Tabelle 12-1) nicht an der starken Wechselwirkung teil. Bei der Streuung schneller Elektronen an Atomkernen beispielsweise wird daher der Hauptteil des Streuquerschnittes (vgl. 16.1.1) durch die Coulomb-Wechselwirkung mit den positiven Ladungen der Protonen (Tabelle 12-1) im Atomkern verursacht. Zerfälle bzw. Umwandlungen von Elementarteilchen schließlich werden durch die schwache Wechselwirkung geregelt.
17.1 Atomkerne Aus den Streuversuchen von Rutherford, Geiger und Marsden mit α-Teilchen 16.1.1) zeigte sich, dass der
Atomkern so viel positive Elementarladungen enthält, wie die Ordnungszahl Z des Atoms im Periodensystem der Elemente (C 1.5–C 2.1) angibt. Massenspektrometrische Untersuchungen (Bild 13-13) ermöglichen ferner die Bestimmung der Massen der verschiedenen Elemente. Dabei zeigt sich, dass die Protonen, die positiv geladenen Kerne der Wasserstoffatome als leichtestem aller Elemente, zur Erklärung der Atomkernmassen nicht ausreichen, sondern dass dazu elektrisch neutrale Teilchen, die Neutronen hinzugenommen werden müssen (Chadwick, 1932). Bestandteile der Atomkerne sind demnach die Nukleonen Proton (p) mit der Ladung +e und der Ruhemasse mp = (1,672621637 ± 83 · 10−9 ) · 10−27 kg und Neutron (n) mit der Ladung 0 und der Ruhemasse mn = (1,674927211 ± 84 · 10−9 ) · 10−27 kg . Die Ruhemasse der Nukleonen ist damit etwa 1840-mal größer als die Ruhemasse des Elektrons, siehe 12.4. Ein beliebiger Atomkern enthält A Nukleonen, davon Z Protonen und N Neutronen: A=Z+N (Nukleonenzahl oder Massenzahl) .
(17-1)
Die Massenzahl A ist gleich der auf ganze Zahlen gerundeten relativen Atommasse Ar . Z heißt Protonenzahl oder Kernladungszahl und ist mit der Ordnungszahl im Periodensystem identisch. Schreibweise zur Kennzeichnung eines Atomkerns eines chemischen Elementes X: A ZX
,
z. B.
1 4 235 1 H, 2 He, 92 U, . . .
Der Index Z (Protonenzahl) wird häufig auch weggelassen, da diese durch das chemische Symbol X eindeutig bestimmt ist. Atomkernarten werden auch Nuklide genannt. Unterschiedliche Nuklide unterscheiden sich in mindestens zwei der Zahlen A, Z, N. Die relative Atommasse Ar ist das Verhältnis der Atommasse ma zur sog. vereinheitlichten Atommassenkonstante mu : Ar =
ma . mu
(17-2)
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen
Entsprechend wird die relative Molekülmasse Mr (siehe 8.1) eines Moleküls der Masse mm definiert: Mr =
mm . mu
(17-3)
Die vereinheitlichte Atommassenkonstante mu ist definiert als 1/12 der Masse eines Kohlenstoffnuklids der Massenzahl 12 und beträgt 1 m (12 C) 12 = (1,66053886 ± 28 · 10−8 ) · 10−27 kg .
mu =
Die Masse dieses Betrages wird als sog. atomare Masseneinheit verwendet und dann mit u bezeichnet. Aus Streuversuchen mit α-Teilchen hinreichend hoher Energie (16.1.1) erhält man auch Aussagen über den Kernradius, für den sich die empirische Beziehung √3 (17-4) R ≈ r0 A mit r0 ≈ 1,2 fm ergibt. r0 entspricht dem Radius eines Nukleons. Gleichung (17-4) bedeutet, dass das Kernvolumen (∼R3 ) proportional zur Nukleonenzahl A ansteigt, die Dichte der Kernsubstanz also etwa konstant ist für alle Kerne:
N ≈
Amp mp ≈ ≈ 2 · 1017 kg/m3 . 4π 3 4π 3 R r 3 3 0
(17-5)
Die Kerndichte ist also etwa um den Faktor 1014 größer als die Dichte von Festkörpern! Atome gleicher Ordnungszahl Z, aber verschiedener Neutronenzahl N und damit auch verschiedener Massenzahl A werden Isotope des chemischen Elements mit der Ordnungszahl Z genannt. Die meisten in der Natur vorkommenden Elemente sind Mischungen aus mehreren Isotopen. Dadurch erklärt sich, dass die relativen Atommassen Ar oft von der Ganzzahligkeit relativ stark abweichen. Sowohl Protonen als auch Neutronen haben wie die Elektronen (16.1) einen Eigendrehimpuls oder Spin der Größe /2. Ferner muss angenommen werden, dass Nukleonen Bahnbewegungen im Atomkern durchführen, die zu einem Bahndrehimpuls führen. Der resultierende Drehimpuls eines Atomkerns, der Kernspin J, ist wie der Drehimpuls der Elektronenhülle gequantelt, wobei die zugehörige Quantenzahl J
√ den Betrag des Kernspins J(J + 1) kennzeichnet. Auch hier gilt eine Richtungsquantelung (vgl. 16.1). Kerne mit geraden Zahlen von Protonen und Neutronen (gg-Kerne) haben eine Spinquantenzahl J = 0, d. h., die Spins der Nukleonen sind offenbar paarweise antiparallel angeordnet. Mit dem Kernspin ist schließlich auch ein magnetisches Dipolmoment verknüpft. Bei der Wechselwirkung zwischen zwei Protonen sind die Kernkräfte (starke Wechselwirkung) für Abstände r > 0,7 fm anziehend und übersteigen die abstoßende Coulomb-Kraft um einen Faktor >102 . Bereits bei r 2 fm sind die Kernkräfte abgeklungen. Für r < 0,7 fm wirken die Kernkräfte abstoßend, halten also die Nukleonen in entsprechenden Abständen. Das steht im Einklang mit der von der Nukleonenzahl unabhängigen, etwa konstanten Kerndichte. Aufgrund der Spinwechselwirkung gibt es ferner nichtzentrale Anteile der Kernkraft. Sieht man von solchen Kraftanteilen ab, so lässt sich qualitativ ein Verlauf des Kernpotenzials annehmen, wie er in Bild 17-1 dargestellt ist (Energie-Nullpunkt bei getrennten Nukleonen angenommen: Bei gebundenen Nukleonen ist die innere Energie Uint bzw. die potenzielle Energie Ep dann negativ, vgl. Bild 6-7). Für die Wechselwirkung zwischen zwei Neutronen oder zwischen einem Neutron und einem Proton ist dabei allein das Potenzial aufgrund der Kernkraft wirksam, für die Wechselwirkung zwischen zwei Protonen wird dieses noch vom Coulomb-Potenzial überlagert.
Bild 17-1. Potenzielle Energie von Nukleonen (schematisch, Coulomb-Wechselwirkung stark überhöht dargestellt): a p-n- und n-n-Wechselwirkung, b p-pWechselwirkung
B209
B210
B Physik
17.2 Massendefekt, Kernbindungsenergie Die zur Zerlegung eines Atomkerns gegen die anziehenden Kernkräfte aufzubringende Arbeit stellt die Kernbindungsenergie EB dar, die meist je Nukleon angegeben wird (Eb , Bild 17-2). Bei der Zusammenlagerung von mehreren Nukleonen zu einem Atomkern wird die entsprechende Energie frei. Aufgrund der Einstein’schen Masse-Energie-Beziehung (4-42) ist daher die Masse eines Atomkerns mN stets kleiner als die Masse aller beteiligten Nukleonen im ungebundenen Zustand (Zmp + Nmn ). Aus der experimentell bestimmbaren Differenz Δm = Zmp + Nmn − mN
(Massendefekt)
(17-6)
lässt sich die Bindungsenergie je Nukleon berechnen: Δmc20 . (17-7) A Einem Massendefekt von der Größe der atomaren Masseneinheit 1 u entspricht eine Bindungsenergie von 931,49 MeV. Für Atomkerne mit Nukleonenzahlen A > 20 beträgt die Bindungsenergie je Nukleon ungefähr 8 MeV (Bild 17-2). Bei Atomkernen mit Nukleonenzahlen um 60 hat die Energie je Nukleon ein flaches Minimum (maximale Bindungsenergie). Die Abhängigkeit der Kernbindungsenergie je Nukleon von der Nukleonenzahl des Kerns lässt sich durch Kernmodelle deuten. Beim Tröpfchenmodell wird der Atomkern mit einem makroskopischen Flüssigkeitstropfen verglichen, Eb =
der ebenfalls eine konstante Dichte unabhängig von seiner Größe aufweist, sowie schnell mit der Entfernung abnehmende Bindungskräfte. So, wie beim Flüssigkeitstropfen die Oberflächenspannung für die kugelförmige Gestalt sorgt, muss auch beim Atomkern eine Oberflächenspannung angenommen werden, die eine etwa kugelförmige Gestalt des Kerns bewirkt. Die Bindung an der Oberfläche ist jedoch geringer als im Volumen. Die Zunahme der Bindungsenergie je Nukleon mit der Nukleonenzahl bei leichten Atomkernen rührt daher vom steigenden Verhältnis der Zahl der Nukleonen im Volumen zu derjenigen an der Oberfläche. Bei schweren Kernen bewirkt hingegen die Zunahme der elektrostatischen Abstoßung der Protonen untereinander aufgrund ihrer steigenden Anzahl eine Verringerung der Bindungsenergie je Nukleon. Die Folge ist eine Verschiebung des Energieminimums (Bindungsenergiemaximums) zugunsten eines Neutronenüberschusses. Andererseits scheint, wie sich bei leichten Kernen zeigt, ein energetischer Vorteil für symmetrische Kerne (Protonenzahl = Neutronenzahl) zu existieren. Beim Schalenmodell des Atomkerns wird davon ausgegangen, dass der Kern ähnlich wie die Elektronenhülle in Schalen unterteilt ist, innerhalb derer die Nukleonen gruppiert und diskreten Energiezuständen zugeordnet sind. Dabei sättigen sich die Drehimpulse je zweier Protonen oder zweier Neutronen gegenseitig ab. Kerne mit gerader Protonenzahl und gerader Neutronenzahl (gg-Kerne) enthalten nur gepaarte Protonen und Neutronen und sind deshalb stabiler als
Bild 17-2. Bindungsenergie je Nukleon als Funktion der Nukleonenzahl des Kerns (berechnet nach der WeizsäckerFormel (17-9) sowie (17-11))
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen
gu- oder ug-Kerne. Die Bindungsenergie je Nukleon ist bei gg-Kernen besonders hoch. Das Gegenteil ist bei uu-Kernen der Fall, die sowohl ein ungepaartes Proton als auch ein ungepaartes Neutron enthalten. Dieser Effekt wirkt sich besonders bei den leichten Atomkernen aus und erklärt die dort starken Schwankungen der Bindungsenergie je Nukleon (Bild 17-2). Kerne mit abgeschlossenen Schalen enthalten 2, 8, 20, (28), 50, 82 oder 128 Protonen oder Neutronen (magische Zahlen) und sind überdurchschnittlich stabil. 208 Beispiele sind 42 He, 168 O, 40 20 Ca und 82 Pb. Die verschiedenen Einflüsse auf die gesamte Kernbindungsenergie EB lassen sich in der WeizsäckerFormel zusammenfassen: Z2 A1/3 2 (A − 2Z) δ + ap 3/4 , − aas A A
EB = aV A − aO A2/3 − aC
(17-8)
mit aV = 15,75 MeV, aO = 17,8 MeV, aC = 0,71 MeV, aas = 23,7 MeV, ap = 34 MeV und ⎧ ⎪ ⎪ +1 für gg-Kerne ⎪ ⎪ ⎪ ⎨ δ=⎪ 0 für gu- und ug-Kerne ⎪ ⎪ ⎪ ⎪ ⎩ −1 für uu-Kerne . Der erste Term beschreibt die Zunahme der Bindungsenergie mit der Anzahl der Nukleonen (Volumenenergie). Der zweite Term berücksichtigt die geringere Bindung der Oberflächen-Nukleonen. Der dritte Term beschreibt die Coulomb-Abstoßung der Protonen ∼Z 2 /r. Der vierte Term stellt die bindungslockernde Asymmetrieenergie dar, die bei N = Z = A/2 verschwindet. Bei großen Nukleonenzahlen liegt jedoch wegen der Coulomb-Abstoßung der Protonen untereinander das Energieminimum (Bindungsenergiemaximum) bei N > Z. Der fünfte Term berücksichtigt die Paarenergie der NukleonenSpins, er hat bei gg-Kernen einen positiven, bei uu-Kernen einen negativen Wert. Die Kernbindungsenergie je Nukleon Eb ergibt sich daraus zu Eb =
1 Z2 EB = aV − aO 1/3 − aC 4/3 A A A (A − 2Z)2 δ − aas + ap 7/4 . 2 A A
(17-9)
Bild 17-3. Stabilitätslinie N(A) nach der Weizsäcker-
Formel
Für jede Massenzahl A zeigt die Energie des Kerns bei einer bestimmten Protonenzahl Z ein Minimum (Maximum der Kernbindungsenergie), dessen Lage sich aus (17-8) mit der Bedingung ∂EB =0 (17-10) ∂Z A=const berechnen lässt. Daraus ergibt sich eine Stabilitätslinie (Linie der β-Stabilität, siehe 17.3.2) Z=
A A < 2 2 + 0,015A2/3
bzw. N = A−
A A > , 2/3 2 2 + 0,015A
(17-11)
die bei schweren Kernen zunehmend von der Linie N = Z = A/2 der symmetrischen Atomkerne abweicht (Bild 17-3). Mit (17-11) folgt aus (17-9) der in Bild 17-2 dargestellte Verlauf der Bindungsenergiekurve. Die stabilen Elemente (siehe 17.3) liegen auf bzw. dicht an der Stabilitätslinie.
17.3 Radioaktiver Zerfall Atomkerne, die nicht dicht an der Stabilitätslinie (Bild 17-3) liegen, oder die große Massenzahlen A aufweisen, können Strahlung emittieren und dabei in einen stabileren Zustand übergehen. Solche instabilen Atomkerne heißen radioaktiv. Bei der zuerst an Uransalzen entdeckten (Becquerel, 1896), dann an Polonium, Radium, Aktinium, Thorium, Kalium, Rubidium, Samarium, Lutetium u. a. gefundenen und
B211
B212
B Physik
untersuchten natürlichen Radioaktivität (Marie und Pierre Curie ab 1898, u. a.) werden verschiedenartige Strahlungen beobachtet: 1. Die α-Strahlung besteht aus zweifach positiv geladenen Teilchen der Massenzahl 4, also He-Kernen. 2. Die β-Strahlung besteht aus schnellen Elektronen. 3. Die γ-Strahlung besteht aus energiereichen elektromagnetischen Strahlungsquanten. Die radioaktive Strahlung hängt nicht von äußeren Bedingungen wie Temperatur, Druck, chemische Bindung usw. ab. Bild 17-4. α-Zerfall: a Zu durchtunnelnde Energieschwel-
17.3.1 Alphazerfall
Bei der Emission eines α-Teilchens (He-Kern), das als gg-Kern mit abgeschlossenen Schalen eine besonders stabile Kernstruktur darstellt, aus einem schweren Atomkern X (der sich dabei in einen anderen Atomkern Y umwandelt) wird eine Reaktionsenergie Q = ΔE = (mX − mY − mα )c20 = Δmc20 > 0 (17-12) frei, sofern die Massenzahl AX des Ausgangskerns hinreichend groß ist, wie sich aus dem Verlauf der Bindungsenergie pro Nukleon (Bild 17-2) schließen lässt. α-Strahlung wird in erster Linie für AX > 208 beobachtet. Die Nukleonenzahl des Ausgangskerns reduziert sich beim α-Zerfall um 4, die Protonenzahl um 2, sodass ein anderes chemisches Element (im Periodensystem gegenüber dem Ausgangselement zwei Plätze zurück) entsteht: A ZX
→
A−4 Z−2 Y
le des Kernpotenzials, b diskretes Energiespektrum der αStrahlung
der Coulomb-Abstoßung zwischen Kern Y und dem α-Teilchen gebildet (Bild 17-4a). Das Energiespektrum der α-Strahlung einer Kernsorte mit diskreten Linien (Bild 17-4b) ist ein Hinweis auf die Existenz diskreter Quantenzustände im Kern mit entsprechenden Energieniveaus. Die Wahrscheinlichkeit des Zerfalls wird dann durch den quantenmechanischen Tunneleffekt (16-98) geregelt (Gamow, 1938), der auch die Feldemission von Elektronen aus Metallen bestimmt (16.7.1). Dementsprechend gibt es eine (zunächst empirisch gefundene) gleichsinnige Beziehung zwischen der Zerfallswahrscheinlichkeit und der Energie Eα des emittierten α-Teilchens: log λ = A + B log Eα , die Geiger-Nuttall’sche Regel ,
+42 He + ΔE ,
(17-14)
z. B.: 238 92 U
4,5·109 a
−−−−−−−−→
234 90 Th
+42
He .
(17-13)
Der Zerfall erfolgt bei den natürlich radioaktiven Elementen von selbst (spontan), allerdings sehr langsam, anderenfalls würden sie nicht mehr existieren. Bei der Emission des α-Teilchens muss daher offenbar eine Energieschwelle überwunden werden, die höher ist, als die bei der Emission verfügbare Energie ΔE, die sich wiederum gemäß Energie- und Impulssatz (Rückstoß, siehe 3.3.2) auf den neuen Kern Y und das α-Teilchen (Eα ) verteilt. Die Energieschwelle wird aus dem Potenzialtopf der Kernkräfte und
mit für alle α-Strahler annähernd gleichen Konstanten A und B. λ ist die Zerfallskonstante des Zerfallsgesetzes (17-20). Anmerkung: Üblicherweise wird die GeigerNuttall’sche Regel mithilfe der hier nicht eingeführten Reichweite R der α-Teilchen in Materie (z. B. in Luft) formuliert. Diese ist jedoch einer Potenz von Eα proportional, sodass sich nur die Konstante B ändert. 17.3.2 Betazerfall
Nuklide, die nicht dicht an der Linie der β-Stabilität (Bild 17-3) liegen, können durch Emission eines
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen
Elektrons oder eines Positrons (eines positiv geladenen Elektrons) dieser Linie der minimalen Energie näherkommen. Dabei bleibt die Nukleonenzahl A ungeändert, jedoch ändern sich Neutronenzahl N und Protonenzahl Z gegensinnig um je 1. Der β− -Zerfall tritt bei Nukliden mit Neutronenüberschuss oberhalb der Stabilitätslinie (Bild 17-3) auf. Es entsteht ein Element mit einer um 1 höheren Ordnungszahl: A ZX
→ Z+1A Y + −10 e + ΔE ,
z. B.: 234 90 Th
24,1 d
− −−−−−−→ 234 91 Pa + e .
(17-15)
Zugrunde liegt diesem Prozess die Umwandlung eines Neutrons in ein Proton und ein Elektron. Im Gegensatz zur α-Strahlung ist das Energiespektrum der β-Strahlung jedoch nicht diskret (linienhaft), sondern kontinuierlich zwischen 0 und einer maximalen Energie Eβ verteilt (Bild 17-5). Ferner ergibt sich aus Nebelkammer- oder Blasenkammer-Aufnahmen des β-Zerfalls, dass scheinbar der Impulserhaltungssatz meist nicht erfüllt ist: Der Fall entgegengesetzter Impulse von Rückstoßkern und emittiertem Elektron (Fall a in Bild 17-5) tritt nur selten auf. Viel häufiger ist der Fall b, bei dem scheinbar die Impulssumme nicht verschwindet. Außerdem ist scheinbar auch der Drehimpulserhaltungssatz verletzt: Beim β-Zerfall wird der Kernspin (ganz- oder halbzahlig) nicht geändert, dennoch nimmt das Elektron einen Spin /2 mit. All diese Widersprüche ließen sich durch die Annahme eines weiteren Elementarteilchens, des Elektron-Neutrinos νe (hier genauer des Antiteilchens ν¯ e wegen der Erhaltung der Leptonenzahl, siehe 17.5) beseitigen (Pauli, 1931). Die Neutrinos besitzen keine elektrische Ladung (ionisieren daher nicht), eine nur sehr kleine Ruhemasse (80% von den Spaltprodukten einschließlich der Spaltneutronen als kinetische Energie übernommen. Das Auftreten der Spaltneutronen erklärt sich aus dem relativen Neutronenüberschuss, der bei schweren Kernen höher ist als bei mittelschweren (Bild 17-3), und der daher bei der Spaltung abgebaut wird. Die Spaltneutronen ermöglichen den Vorgang der Kettenreaktion, da sie in einer nächsten Generation wiederum Spaltreaktionen hervorrufen können. Die Zahl Ni+1 der Spaltreaktionen der (i + 1)-ten Generation ergibt sich aus der Zahl Ni der Spaltreaktionen der i-ten Generation entsprechend dem Multiplikationsfaktor Ni+1 k= (i = 1, 2, . . .) . (17-27) Ni Für k < 1 nimmt die Zahl der Spaltreaktionen je Generation ab, und die Kettenreaktion bricht schließlich ab. Kann dagegen für eine gewisse Zeit k > 1 aufrechterhalten werden, so nimmt die Zahl der Kernspaltungen zeitlich exponentiell zu. Bei kurzer Generationsdauer und großem k (bei stark angereichertem oder reinem 235 U und überkritischer Masse, siehe unten) kommt es zur Kernexplosion: Atombombe. Kernreaktor
Für eine zeitlich konstante Kernspaltungsrate muss k = 1 gehalten werden: Kontrollierte Kettenreakti-
on im Kernreaktor (Fermi, 1942). (Die präzisere Benennung „Kernspaltungsreaktor“ ist nicht üblich.) Für die Kernenergiegewinnung mittels Kernreaktoren ist daher die Regelung des Multiplikationsfaktors k von entscheidender Bedeutung. Sie wird dadurch erleichtert, dass bei der Spaltung von 235 U etwa 1% der Spaltneutronen aus dem β-Zerfall von Spaltprodukten stammen mit einer Halbwertszeit von der Größenordnung einer Sekunde (verzögerte Neutronen, siehe oben). Wird die Vermehrungsrate der prompten Neutronen bei 0,99 gehalten und der Multiplikationsfaktor durch die verzögerten Neutronen zu 1 ergänzt, so bleibt im Falle einer Abweichung genügend Zeit zur Nachregelung. Im Uranreaktor treten aufgrund mehrerer möglicher Kernspaltungsreaktionen ähnlich (17-25) im Mittel 2,43 Spaltneutronen je 235 U-Kern mit einer kinetischen Energie von 1 bis 2 MeV auf. Bei geringer Größe des Uranvolumens gehen jedoch die meisten Spaltneutronen durch die Oberfläche verloren. Das Verhältnis Volumen zu Oberfläche muss daher hinreichend groß gemacht werden, damit mindestens ein Neutron je Spaltreaktion eine weitere Spaltung hervorruft, das führt auf den Begriff der kritischen Masse des Spaltmaterials. Die kritische Masse hängt stark von der Anreicherung des Isotops 235 U ab, da natürliches Uran im Wesentlichen das neutronenabsorbierende Isotop 238 U enthält und nur zu 0,7% das spaltbare 235 U. Die schnellen Spaltneutronen haben nur eine geringe Wahrscheinlichkeit, im 235 U-Kern angelagert zu werden und eine Spaltung zu bewirken, sie werden vorwiegend gestreut. Eine hohe Spaltwahrscheinlichkeit tritt erst bei thermischen Geschwindigkeiten auf. Die Neutronen müssen daher abgebremst werden, z. B. durch elastische Stöße mit Kernen vergleichbarer Masse (vgl. (6-42) und Bild 6-11). Hierzu werden Moderatorsubstanzen verwendet, das sind Substanzen mit Kernen möglichst niedriger Massenzahl, die jedoch Neutronen nur schwach absorbieren dürfen, z. B. Deuterium (im schweren Wasser) oder Graphit. Zur Regelung des Multiplikationsfaktors werden hingegen Substanzen mit hohem Neutroneneinfangquerschnitt verwendet, z. B. Cadmiumstäbe, die mehr oder weniger in den Reaktorkern eingefahren werden (Bild 17-9). Die Spaltprodukte geben ihre kinetische Energie durch Stöße an die umgebenden Atome des Kern-
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen
Bild 17-9. Prinzipieller Aufbau eines Kernspaltungsreak-
tors
brennstoffs und des Moderatormaterials in Form von Wärme ab, die durch ein zirkulierendes Kühlmittel, z. B. Wasser oder flüssiges Natrium aus dem Kernreaktor abgeführt und z. B. zur Erzeugung elektrischer Energie ausgenutzt wird. Das im Uran-Kernbrennstoff enthaltene Isotop 238 U wandelt sich unter Beschuss mit schnellen Neutronen über zwei Zwischenstufen in Plutonium um: 238 92 U
+10 n →
239 92 U
→
239 93 Np
239 92 U
239 93 Np
→
+e
239 94 Pu
+γ −
(17-28)
+ e− .
Im Uranreaktor entsteht daher auch das ebenfalls spaltbare Plutonium: Brutprozess. Problematisch ist beim Kernspaltungsreaktor das Entstehen zahlreicher radioaktiver Spaltprodukte. Kernfusion
Wie die Bindungsenergiekurve Bild 17-2 ausweist, wird auch beim Aufbau mittelschwerer Kerne aus sehr leichten Kernen bis zu Massenzahlen um 20 Bindungsenergie frei: Kernfusion. Energetisch besonders ergiebig sind Kernverschmelzungen, die als Endprodukt 42 He-Kerne mit ihrer großen Bindungsenergie (Bild 17-2) ergeben. Solche Fusionsreaktionen liefern die Energie der Sterne und auch der Sonne. Auf der Erde konnte eine Energiefreisetzung auf dieser Basis bisher nur in Form der unkontrollierten Kernfusion in der Wasserstoffbombe realisiert werden. Der Grund dafür sind die hohen Schwellenenergien dieser Prozesse: Die Fusion setzt voraus, dass sich
zwei Kerne gegen die Coulomb-Abstoßung einander soweit nähern, dass die kurzreichweitige Kernkraft die Oberhand gewinnt. Für zwei Protonen beispielsweise ist dafür nach (17-26) eine kinetische Energie der Größenordnung 1 MeV erforderlich. Sie sind zwar durch Beschleuniger leicht zu erreichen, jedoch sind so nur vereinzelt Fusionen zu erzielen, da die Reaktionsquerschnitte gegenüber den Streuquerschnitten sehr klein sind. Zur Energiegewinnung muss eine große Anzahl von Kernen eine hinreichend hohe thermische Energie besitzen, damit trotz des kleinen Reaktionsquerschnittes hinreichend viele Fusionsprozesse erfolgen. Im Sonneninnern werden Temperaturen von 107 bis 108 K angenommen. Die daraus gemäß (8-18) zu berechnende mittlere thermische Energie beträgt 1 bis 10 keV, reicht also nicht aus, um den MeV-Wall zu übersteigen. Da es sich jedoch sowohl um eine Verteilung (Bild 8-1) mit auch höherenergetischen Kernen handelt, als auch der Potenzialwall (Bild 16-31 und 17-4) dann bereits aufgrund des Tunneleffekts (16-98) durchdrungen werden kann, setzt die Kernfusion bereits bei diesen Temperaturen ein. Bei der Wasserstoffbombe wird eine Uranbombe als Zünder zur Erzeugung der erforderlichen Temperaturen benutzt. Die Sonne und ähnliche Sterne beziehen ihre Energie vorwiegend aus dem sog. Deuterium-Zyklus (Bethe, 1939): 1 1p 2 1D 3 2 He
+ 11 p → 21 D + e+ + νe + 1,4 MeV (langsam) + 11 p → 32 He + γ
+ 5,5 MeV (schnell)
+
+ 12,9 MeV (schnell) . (17-29)
3 2 He
→
4 2 He
+
2 11 p
Darin bestimmt der erste Prozess als langsamster die Brenngeschwindigkeit der Sonne. Der Bruttoprozess dieser drei Reaktionen lautet: 4 11 p → 42 He + 2 e+ + 2νe + 2γ + 26,7 MeV . (17-30) Etwa 7% der insgesamt freiwerdenden Energie (≈1,9 MeV) geht auf die Neutrinos über und wird mit diesen nicht ausnutzbar weggeführt. Bei Sternen mit etwas höheren Temperaturen läuft bevorzugt ein weiterer Zyklus ab, der ebenfalls zur Fusion von 4 Protonen zu einem He-Kern führt, der BetheWeizsäcker-Zyklus oder CN-Zyklus:
B217
B218
B Physik
12 6C 13 7N 13 6C 14 7N 15 8O 15 7N
+ → + + → +
1 1p 13 6C 1 1p 1 1p 15 7N 1 1p
→
13 7N +
+γ
+ 1,95 MeV ,
+ e
+ νe
+ 2,22 MeV ,
→
14 7N 15 8O +
+γ
+ 7,54 MeV ,
+γ
+ 7,35 MeV ,
+ e
+ νe
+ 2,71 MeV ,
→
12 6C
+
+ 4,96 MeV .
→
4 2 He
(17-31)
Die Bruttoreaktion ist identisch mit der des Deuterium-Zyklus (17-30). Die Menge des Kohlenstoffs, der quasi als Katalysator wirkt, ändert sich dabei nicht. Bei etwa 108 K geht das sog. Wasserstoffbrennen in das sog. Heliumbrennen über, z. B. nach dem Salpeter-Prozess, dessen Bruttoreaktion 3 42 He → 126 C + γ + 7,28 MeV
(17-32)
in der Verschmelzung von He-Kernen zu KohlenstoffKernen besteht. Die kontrollierte Kernfusion zur irdischen Fusionsenergiegewinnung ist bisher nicht gelungen. In Betracht gezogen werden z. B. die folgenden Fusionsreaktionen: 2 1D 2 1D 2 1D
Statt dessen wird versucht, z. B. kleine Mengen (Pellets) aus festem Deuterium oder Tritium durch Beschuss mit Hochleistungslasern (Laserfusion) oder Teilchenstrahlen schnell aufzuheizen und zu komprimieren, um bei hoher Dichte die Teilchen aufgrund ihrer Massenträgheit eine gewisse Zeit τ zusammenzuhalten (Trägheitseinschluss), damit durch Fusionsreaktionen ein Energieüberschuss gegenüber der Aufheizenergie erzielt werden kann. Eine andere Möglichkeit für Fusionsreaktoren stellt der magnetische Einschluss von Plasmen dar, z. B. durch den Pincheffekt (siehe 16.6.3), der in den im Pulsbetrieb arbeitenden Tokamaks ausgenutzt wird. Hierbei bildet ein Plasma-Ringstrom die Sekundärwindung eines Transformators. Die Stellaratoren arbeiten dagegen mit externen Magnetfeldern und können kontinuierliche Ringplasmen erzeugen. Neben der Temperatur ist daher der Einschlussparameter nτ wichtig. Die Fusion wird energetisch lohnend, wenn das sog. Lawson-Kriterium (1957) erfüllt ist, das z. B. für die Deuterium-Tritium-Reaktion eine Temperatur von 108 K und einen Einschlussparameter nτ > 1014 s/cm3 fordert (Bild 17-10).
+ 21 D → 32 He + 10 n + 3,2 MeV , + 21 D → 31 T + 11 p + 4,2 MeV , +
3 1T
→
4 2 He
+
1 0n
(17-33)
+ 17,6 MeV .
Die potenzielle Bedeutung der Fusionsenergie ist durch die praktische Unerschöpflichkeit des Brennstoffs Deuterium (zu 0,015% im Wasser enthalten) und durch die fehlende Radioaktivität der Fusionsprodukte bedingt. Allerdings tritt Neutronenstrahlung auf, die in einem Fusionsreaktor abgeschirmt werden müsste, sodass künstliche Radioaktivität aufgrund von Sekundärreaktionen nicht vollständig vermeidbar ist. Fusionsreaktor-Experimente
Wegen der erwähnten hohen Schwellenenergie von Fusionsreaktionen sind Temperaturen von 107 bis 108 K erforderlich. Der Fusionsbrennstoff wird dabei zum vollionisierten Plasma. Das Plasma muss bei diesen Temperaturen mit möglichst großer Teilchendichte n möglichst lange zusammengehalten werden (Energieeinschlusszeit τ). Das kann nicht mit materiellen Wänden geschehen.
Bild 17-10. Lawson-Diagramm mit bisherigen und pro-
jektierten Fusionsexperimenten. Graue Kreise: bisher erreichte Werte; schraffierte Flächen: erwartete Bereiche der laufenden Experimente. Stellarator-Anlage: Wendelstein (Garching). Tokamak-Anlagen: ASDEX (Axial Symmetric Divertor Experiment, Garching), Nachfolger: ASDEX Upgrade; PLT (Princeton Large Torus); ALCATOR (MIT, Cambridge); TFTR (Tokamak Fusion Test Reactor); JET (Joint European Torus, Culham)
17 Starke und schwache Wechselwirkung: Atomkerne und Elementarteilchen
Bisher konnte der Brennbereich für zwei Sekunden bei einer Fusionsleistung von 1,8 MW (JET, 1991) und für knapp eine Sekunde bei einer Fusionsleistung von 6,4 MW (TFTR, 1993) bzw. 12 MW (JET, 1997) erreicht werden. Mit dem geplanten International Thermonuclear Experimental Reactor ITER soll zum ersten Mal ein brennendes und für längere Zeit energielieferndes Plasma erzeugt werden.
17.5 Elementarteilchen Die Untersuchung des Aufbaus der stofflichen Materie führt auf die Frage nach den Elementarbausteinen, aus denen sich alle bekannten Teilchen, Atomkerne, Atome und Moleküle als Grundbausteine der chemischen Elemente und Verbindungen zusammensetzen. Einige solcher Elementarteilchen wurden bereits in Tabelle 12-1 aufgezählt. Entsprechend ihren Massen werden die Elementarteilchen in drei Familien eingeteilt, in der Reihenfolge steigender Massen: Leptonen, Mesonen und Baryonen. Baryonen und Mesonen unterliegen allen vier bekannten Wechselwirkungen (Tabelle 11-0) einschließlich der starken (Kern-)Wechselwirkung, während Leptonen der starken Wechselwirkung nicht unterliegen, sondern nur der schwachen, der elektromagnetischen und der Gravitationswechselwirkung. Mit hochenergetischen Elektronen (als Leptonen) oder Protonen (als Baryonen) werden daher bei Streuversuchen an Atomkernen ganz unterschiedliche Kerneigenschaften untersucht: im ersten Falle z. B. die Ladungsverteilung, im zweiten Falle zusätzlich die Verteilung der Kernkräfte. Die der starken Wechselwirkung unterliegenden Mesonen (ganzzahliger Spin, meist 0) und Baryonen (halbzahliger Spin) werden zusammen als Hadronen bezeichnet (Bild 17-11). Die Hadronen sind nach derzeitigen Erkenntnissen aus jeweils zwei oder drei Quarks (s. u.) zusammengesetzt, die jedoch offenbar nicht als isolierte, freie Teilchen existieren können. Zu jedem Teilchen existiert ein Antiteilchen mit entgegengesetzter elektrischer Ladung, entgegengesetztem magnetischen Moment und entgegengesetzten Werten aller ladungsartigen Quantenzahlen (z. B. Baryonenzahl B, Leptonenzahl L, Strangeness S , Charm C, Bottom B∗ , Isospinkomponente I3 , siehe unten). Teilchen und zugehörige Antiteilchen (z. B. Elektron und Positron) können sich beim
Bild 17-11. Teilchen und Antiteilchen mit mittleren Lebensdauern >10−16 s, angeordnet nach Ladung und Ruheenergie bzw. Ruhemasse. (Das γ-Quant ist kein Lepton)
Zusammentreffen gegenseitig vernichten, wobei die den Ruhemassen entsprechende Energie als γ-Strahlung in Erscheinung tritt: Paarvernichtung (Zerstrahlung, Annihilation). Aus Gründen der Impulserhaltung entstehen dabei gewöhnlich zwei γ-Quanten mit entgegengesetztem Impuls. Auch der umgekehrte Prozess wird beobachtet: Aus hinreichend energiereicher γ-Strahlung (γ-Quanten der Energie Eγ = hν > 2m0 c20 ) kann im Kernfeld ein Teilchenpaar, bestehend aus Teilchen und Antiteilchen gebildet werden: Paarbildung. Die Überschussenergie ΔE = hν − 2m0 c20 = Ek = 2 mc20 − m0 c20 (17-34) (mit (4-38)) wird von den entstandenen Teilchen als kinetische Energie übernommen (hier für beide Teilchen gleich angesetzt). Der Impulserhaltungssatz ist nicht auf diese Weise erfüllbar: Der Impuls eines γ-Quants ist nach (20.3) und mit dem Energiesatz (17-34) pγ =
hν = 2mc0 > 2mv = p+− , c0
(17-35)
d. h. immer größer als der Impuls p+− = 2mv des Teilchenpaars. Es muss daher stets ein drittes Teilchen (z. B. ein Atomkern) anwesend sein, das den überschüssigen Impuls übernehmen kann. Für die Erzeugung eines Elektron-Positron-Paars ist eine Ener-
B219
B220
B Physik
gie des γ-Quants von Eγ > 1,02 MeV, für die Erzeugung eines Proton-Antiproton- oder eines NeutronAntineutron-Paars eine Energie von Eγ > 1,9 GeV erforderlich. Dass bei der Paarbildung stets Teilchen mit entgegengesetzten Ladungen oder der Ladung 0 entstehen, folgt aus dem Erhaltungssatz für die elektrische Ladung (12.4), da das erzeugende γ-Quant keine Ladung trägt.
das leichteste ladungstragende Lepton, das Elektron, aufgrund der Erhaltung der elektrischen Ladung stabil sein. Neben den in Tabelle 12-1 und in Bild 17-11 aufgeführten Elementarteilchen wurde eine Vielzahl weiterer Teilchen gefunden, die meist extrem kurzlebig sind (10−22 bis 10−23 s) und die z. T. als Anregungszustände anderer Teilchen interpretiert werden.
Baryonenladung, Leptonenladung
Strangeness, Hyperladung
Neben den klassischen Erhaltungssätzen (Energie, Impuls, Drehimpuls, elektrische Ladung) gelten für die Elementarteilchen noch weitere Erhaltungssätze, z. B. für die Baryonenladung und die Leptonenladung, die beide nichts mit der elektrischen Ladung zu tun haben. Den Baryonen wird die Baryonenzahl B = +1 (Antiteilchen: B = −1), den Mesonen und Leptonen die Baryonenzahl B = 0 zugeordnet. Den Leptonen wird die Leptonenzahl L = +1 (Antiteilchen L = −1), den Hadronen die Leptonenzahl L = 0 zugeordnet.
Hyperonen und K-Mesonen, die stets gemeinsam entstehen, wie z. B. beim Zusammenstoß eines Pions mit einem Proton:
Bei Reaktionen zwischen Elementarteilchen bleibt die Summe der Baryonenladungen und die Summe der Leptonenladungen erhalten.
π− + p −→ Λ0 + K0 ,
haben eine im Vergleich zur theoretischen Erwartung bzw. zu ihrer Erzeugungsdauer (10−23 s) sehr lange mittlere Lebensdauer der Größenordnung 10−10 s. Zur Kennzeichnung dieses seltsamen Verhaltens wurde eine weitere Quantenzahl, die Strangeness (Seltsamkeit) S eingeführt. Für in diesem Sinne normale Teilchen ist S = 0, während für die seltsamen Teilchen gilt:
Beispielsweise lautet die Gleichung für die Erzeugung eines π+ -Mesons (Pion) p + p −→ p + n + π+ .
(17-36)
Die Baryonenladungsbilanz lautet hierfür 1 + 1 = 1 + 1 + 0, die Leptonenladung ist auf beiden Seiten 0, da kein Lepton beteiligt ist. Für den β− -Zerfall des Neutrons (17-16) lautet die Baryonenladungsbilanz 1 = 1 + 0 + 0 und die Leptonenladungsbilanz 0 = 0 + 1 − 1, d. h., das entstehende Elektron-Neutrino muss ein Antiteilchen sein. Zeitlich stabile Elementarteilchen gibt es nur sehr wenige (Tabelle 12-1): Elektron-Neutrino (es gibt auch andere Neutrinos, z. B. die beim Zerfall des Myons auftretenden μ-Neutrinos), Elektron, Proton, Neutron (dieses ist nur im Kernverband völlig stabil) und die dazugehörigen Antiteilchen. Alle anderen zerfallen mit einer Halbwertszeit 0 (normale Dispersion) : vg < vp , dλ dvp < 0 (anomale Dispersion) : vg > vp . dλ (18-28) Im Gruppenmaximum der Wellengruppe sind die Amplituden maximal, daher bilden die Gruppenmaxima den Sitz der Energie der Welle. Ferner kann eine Information (Signal) nur mit einem begrenzten Wellenzug bzw. einer Wellengruppe oder einer modulierten Welle übertragen werden. Damit gilt: Die Ausbreitung der Energie einer Welle erfolgt mit der Gruppengeschwindigkeit. Sie ist gleich der Signalgeschwindigkeit.
18.2 Elastische Wellen, Schallwellen Schallwellen sind elastische Wellen in deformierbaren Medien (Festkörpern, Flüssigkeiten, Gasen). Für den Menschen hörbarer Schall umfasst etwa den Frequenzbereich von 16 Hz bis 16 kHz. Wellen in deformierbaren Medien werden durch die elastischen Eigenschaften des Mediums (vgl. D 9.2.1, E 5.3) bestimmt, die durch die folgenden Beziehungen beschrieben werden: Festkörper: Relative Längenänderung oder Dehnung ε = ΔL/L eines Stabes mit der Länge L, dem Querschnitt A und dem Elastizitätsmodul E unter Einwirkung einer Zugspannung σ = F/A (Hooke’sches Gesetz): 1 F σ ΔL = · , d.h. , ε = . (18-29) L E A E Scherung γ eines quaderförmigen Volumens des Festkörpers mit dem Schubmodul G unter Einwirkung einer auf die Querschnittsfläche A tangential wirkenden Schub- oder Scherspannung τ = F/A: τ 1 F . (18-30) γ = · , d.h. , γ = G A G Kompression −ϑ = −ΔV/V eines Körpers des Volumens V mit dem Kompressionsmodul K unter allsei-
tigem Druck p bei der Druckänderung Δp: Δp −ΔV = , V K
d.h. ,
−ϑ=
Δp . K
(18-31)
Flüssigkeiten: Bei Flüssigkeiten ist anstelle des Kompressionsmoduls K dessen Kehrwert, die Kompressibilität κ gebräuchlicher: 1 ∂V −ΔV 1 1 =− · . ≈ (18-32) κ= K V ∂p T V Δp Für eine Flüssigkeitssäule der Länge L ergibt sich daraus bei konstantem Querschnitt A unter Einwirkung einer Drucksteigerung Δp = −F/A eine relative Längenänderung −
ΔV F 1 F ΔL =− = −ϑ = κΔp = κ = · . L V A K A (18-32a)
Der Vergleich von (18-29) mit (18-32a) zeigt, dass für den Fall der Flüssigkeitssäule der Kompressionsmodul K = 1/κ dem Elastizitätsmodul E von Festkörpern entspricht. Dies benötigen wir unten für die Berechnung der Schallgeschwindigkeit in Flüssigkeiten (18-44) und in Gasen (18-45) aus (18-42). Gase: Gleichung (18-31) gilt auch für Gase, wobei der Kompressionsmodul K mithilfe der allgemeinen Gasgleichung (8–26) berechnet werden kann. Für die schnellen Druckänderungen bei Schallwellen kann ein Wärmeausgleich nicht stattfinden, sodass K unter adiabatischen Bedingungen aus (18-31) berechnet werden muss. Mithilfe der Adiabatengleichung (8–97) erhält man dann Cmp RT 1 mit γ = . (18-33) K = = γp = γ κ Vm CmV Vm molares Volumen; Cmp , CmV molare Wärmekapazitäten bei konstantem Druck bzw. konstantem Volumen (vgl. 8.6.1). Ausbreitung transversaler Wellen auf gespannten Seilen und Saiten
Nach einer vorausgegangenen transversalen Auslenkung eines mit einer Kraft F0 bzw. der Zugspannung σ = F0 /A gespannten Seils bzw. einer Saite (Querschnitt A) wirkt auf jedes Saitenelement der Länge dx (Bild 18-7) eine rücktreibende Kraft Fξ = F0 sin(α + dα) − F0 sin α ≈ F0 dα .
(18-34)
B229
B230
B Physik
Aus α ≈ tan α = ∂ξ/∂x folgt dα ≈ dx(∂2 ξ/∂x2 ) und damit für die rücktreibende Kraft Fξ = F0 dx
∂2 ξ . ∂x2
(18-35)
Die Masse des Saitenelements dx beträgt dm = Adx ( Dichte). Damit lautet die Bewegungsgleichung für dm Fξ = dm
∂2 ξ . ∂t2
longitudinaler Wellen im Festkörper: (18-36)
Aus (18-35) und (18-36) folgt die Wellengleichung der transversalen Saitenwelle: ∂2 ξ ∂2 ξ − · =0. ∂x2 σ ∂t2
Bild 18-8. Ausbreitung einer Longitudinalstörung in einem
Stab
(18-37)
Durch Vergleich mit (18-7) ergibt sich die Phasengeschwindigkeit der transversalen Saitenwelle σ . vp = (18-38)
Ausbreitung longitudinaler Wellen in elastischen Medien
Die periodische longitudinale Auslenkung von Massenelementen in einem kontinuierlichen elastischen Medium bewirkt eine periodische Dichteverteilung: Longitudinale elastische Wellen sind Dichtewellen. Die zur Behandlung der transversalen Saitenwelle analoge Betrachtung eines Volumenelementes der Masse dm und der Länge dx in einem zylindrischen Stab (Massendichte , Querschnitt A), das durch eine vorausgegangene longitudinale Auslenkung ξ und die dadurch bedingte ortsabhängige Spannung σ = F/A um dξ gedehnt wird, liefert unter Zuhilfenahme des Hooke’schen Gesetzes (18-29) und der Bewegungsgleichung für dm die Wellengleichung
∂2 ξ ∂2 ξ − · =0, (18-39) ∂x2 E ∂t2 aus der sich durch Vergleich mit (18-7) die Phasengeschwindigkeit longitudinaler Wellen (18-42) ergibt. Sie ist auch für ausgedehnte Festkörper gültig. Die Berechnung der Phasengeschwindigkeit cl longitudinaler Wellen (und damit der Ausbreitungsgeschwindigkeit von Schall) kann auch auf direkterem Wege erfolgen. Dazu betrachten wir die Ausbreitung einer Störung (Verdichtungsstoß) in einem zylindrischen Stab der Dichte , die durch einen Stoß mit der Kraft F x während der Zeit dt auf das linke Stabende erzeugt wird (Bild 18-8). Dadurch wird das linke Ende des Stabes mit einer Geschwindigkeit v um dξ = vdt nach rechts verschoben. Die Kompressionsstörung läuft mit der Phasengeschwindigkeit cl nach rechts, die Teilchen im Kompressionsbereich erreichen in der Zeit dt nacheinander die Geschwindigkeit v. Das Massenelement dm =
Adx, das durch den Kompressionsbereich dx = cl dt definiert werde, erfährt damit eine Impulsänderung dp x = vdm als Folge der einwirkenden Kraft dp x Fx = = Avcl . (18-40) dt Durch die Kraft F x wird ferner das Massenelement dm der Länge dx um dξ = vdt komprimiert. Den Zusammenhang liefert das Hooke’sche Gesetz (18-29): v 1 dξ 1 Fx = = · = vcl . dx cl E A E
Bild 18-7. Zur Herleitung der Wellengleichung für transversale Saitenwellen
(18-41)
Daraus folgt für die Phasengeschwindigkeit longitudinaler Wellen (Schallgeschwindigkeit) in Festkörpern 8 E . cl = (18-42)
18 Wellenausbreitung
Festkörper können auch tangentiale Scherkräfte aufnehmen, wie sie bei Scherschwingungen auftreten. Deshalb können in Festkörpern auch transversale Wellen auftreten. Die elastische Deformation bei Scherung wird durch (18-30) beschrieben. Statt des Elastizitätsmoduls E tritt hier der Schubmodul G auf. Entsprechend ergibt sich für die Phasengeschwindigkeit von transversalen Scherwellen und von Torsionswellen (die auch auf Scherung beruhen) in Festkörpern 8 G . (18-43) ct =
Flüssigkeiten und Gase können keine statischen Tangentialkräfte (Scherkräfte) aufnehmen. Demzufolge können sich hier nur Longitudinalwellen über längere Strecken ausbreiten. Transversale Wellen können nur direkt angrenzend an transversal schwingende Erregerflächen auftreten und klingen mit wachsendem Abstand davon schnell exponentiell ab. Die Schallgeschwindigkeit in Flüssigkeiten, etwa in einer Flüssigkeitssäule, deren elastische Eigenschaften durch (18-32a) beschrieben werden, lässt sich analog zur Berechnung der Schallgeschwindigkeit im festen Stab bestimmen. Im Ergebnis (18-42) ist dazu der Elastizitätsmodul E durch den Kompressionsmodul K oder die Kompressibilität κ (18-32) zu ersetzen, um die Schallgeschwindigkeit in Flüssigkeiten zu erhalten: 8 8 K 1 = . (18-44) cl =
κ
Für Gase erhält man die Schallgeschwindigkeit unter Berücksichtigung der elastischen Eigenschaften bei adiabatischer Kompression. Mit (18-33) und der Molmasse M = Vm folgt dann aus (18-44) die Schallgeschwindigkeit in Gasen p RT . cl = γ = γ (18-45)
M In Gasen ist daher die Schallgeschwindigkeit stark temperaturabhängig. Sie ist am größten für die Gase mit der kleinsten molaren Masse, Wasserstoff und Helium (Tabelle 18-1). Physiologische Akustik
Schall führt in Gasen dazu, dass sich zu dem statischen Druck ein Schallwechseldruck addiert. Der
Tabelle 18-1. Longitudinale Schallgeschwindigkeit cl in verschiedenen Stoffen
Stoff Feste Stoffe (20 ◦ C): Aluminium Basalt Blei Eis (−4 ◦ C) Eisen Flintglas Granit Gummi Hartgummi Holz: Buche Eiche Tanne Kronglas Kupfer Marmor Messing Paraffin Porzellan Quarzglas Stahl Ziegel Zink Zinn Flüssigkeiten (20 ◦ C) Aceton Benzol Ethanol Glycerin Methanol Nitrobenzol Paraffinöl Petroleum Propanol Quecksilber Schwefelkohlenstoff Schweres Wasser Tetrachlorkohlenstoff Toluol Xylol Wasser (dest.) 0 ◦ C 20 ◦ C 40 ◦ C 60 ◦ C
cl in m/s 5110 ≈ 5080 1200 3200 5180 ≈ 4000 ≈ 4000 ≈ 54 ≈ 1570 ≈ 3300 ≈ 3800 ≈ 4500 ≈ 5300 3800 ≈ 3800 ≈ 3500 ≈ 1300 ≈ 4880 ≈ 5400 ≈ 5100 ≈ 3650 3800 2700 1190 1320 1170 1923 1123 1470 ≈ 1420 ≈ 1320 1220 1421 1158 1399 943 1308 1357 1403 1483 1529 1551
B231
B232
B Physik
Tabelle 18-1. Fortsetzung
Stoff 80 ◦ C 100 ◦ C
cl in m/s 1555 1543 1400. . .1650
Meerwassera Gase (0 ◦ C, 101 325 Pa): Acetylen 327 Ammoniak 415 Argon 308 Brom 135 Chlor 206 Helium 971 Kohlendioxid 258 Kohlenmonoxid 337 Luft, trocken −20 ◦ C 319 0 ◦C 332 +20 ◦ C 344 +40 ◦ C 355 Methan 430 Neon 433 Sauerstoff 315 Schwefeldioxid 212 Stadtgas ≈ 450 Stickstoff 334 Wasserstoff 1286 Xenon 170 a abhängig von Temperatur, Salzgehalt und Druck.
jenigen Zahlenwert fest, den ein 1 kHz Sinuston als Schalldruckpegel haben müsste, um die gleiche Lautstärkeempfindung hervorzurufen. Der Zusammenhang zwischen Schalldruckpegel und Lautstärke ist in DIN 45630 festgelegt. In der akustischen Messtechnik wird allerdings als Maß für das Lautheitsempfinden meist der bewertete Schalldruckpegel verwendet. Dabei wird das gesamte hörbare Frequenzspektrum in Terzintervalle (Frequenzver√3 hältnis zwischen Ober- und Untergrenze: 2) oder Oktavintervalle (Frequenzverhältnis zwischen Oberund Untergrenze: 2) aufgeteilt. Der im jeweiligen Frequenzintervall i gemessene Schalldruckpegel Li wird dann mit einem frequenzabhängigen Faktor Δ∗X,i bewertet. Den bewerteten Schalldruckpegel erhält man dann mit: ⎞ ⎛ n ⎜⎜⎜ Li +Δ∗X,i ⎟⎟⎟ ⎟⎟⎠ dB(X) . ⎜ 10 dB LX = 10 · lg ⎜⎝ 10 (18-45b) i=1
Das X steht für den Satz verwendeter Bewertungsfaktoren, z. B. A, B oder C, die in der akustischen Messtechnik durch in den Messsignalweg eingeschaltete standardisierte Bewertungsfilter realisiert werden. Überwiegend wird der Satz A nach DIN-IEC 651 verwendet, der für Lautstärken unter 90 phon den Verlauf der Schallempfindung näherungsweise wiedergibt.
18.3 Doppler-Effekt, Kopfwellen Effektivwert des Schallwechseldrucks pef f (der quadratische Mittelwert, siehe 15.3.1 (15-27)) liefert den Schalldruckpegel: pef f L p = 20 · lg (18-45a) , p0 wobei der Bezugsschalldruck nach DIN 45630 festgelegt ist als p0 = 2 · 10−5 Pa und etwa den für einen Menschen gerade noch wahrnehmbaren effektiven Schallwechseldruck angibt. Zur Kennzeichnung des Schalldruckpegels wird die Einheit Dezibel (dB) verwendet (0 dB ist bei 2 kHz gerade noch hörbar, ein Presslufthammer erzeugt in 1 m Entfernung 100 dB). Die Empfindlichkeit des menschlichen Ohres ist allerdings stark frequenzabhängig, so dass der Schalldruckpegel keine angemessene Größe für das Lautheitsempfinden ist. Als Lautstärke L s legt man daher mit der Einheit Phon (phon) den-
Bewegen sich Wellenerzeuger (Quelle Q mit der Frequenz νQ ) und Beobachter B relativ zueinander, so wird vom Beobachter eine andere Frequenz νB registriert, als im Fall ruhender Quelle und Beobachter (Doppler, 1842). Je nachdem, ob sich Quelle oder Beobachter relativ zum Übertragungsmedium der Welle (z. B. Luft bei Schallwellen, Wasseroberfläche bei Wasserwellen) bewegen, oder ob ein solches Medium nicht existiert (Lichtwellen im Vakuum), sind verschiedene Fälle zu unterscheiden.
Doppler-Effekt bei mediengetragenen Wellen: Bewegter Beobachter Die in ruhender Luft von einer ebenfalls ruhenden Schallquelle mit der Frequenz νQ = cs /λ erzeugten Schallwellen breiten sich in Form von Kugelwellen
18 Wellenausbreitung
mit der Schallgeschwindigkeit cs ausbreiten, gegenüber der bewegten Quelle jedoch dann eine (je nach Richtung) andere Geschwindigkeit haben. Auf den Beobachter bewegen sich die Wellen mit der Phasengeschwindigkeit cs zu, der aufgrund der geänderten Wellenlänge λ = (cs ∓ vQ )/νQ eine erhöhte (erniedrigte) Frequenz registriert: νB = Bild 18-9. Zum Doppler-Effekt bei bewegtem Beobachter
mit der Schallgeschwindigkeit cs aus, deren Wellenberge einen radialen Abstand λ (Wellenlänge) haben (Bild 18-9). Bewegt sich ein Beobachter B mit der Geschwindigkeit vB auf die Quelle Q zu (bzw. von ihr weg), so registriert der Beobachter eine Geschwindigkeit cs ± vB der auf ihn zukommenden Wellenberge und demzufolge gemäß (18-3) eine erhöhte (erniedrigte) Frequenz cs ± vB vB = νQ 1 ± (18-46) . νB = λ cs Doppler-Effekt bei mediengetragenen Wellen: Bewegte Quelle
Bewegt sich bei relativ zum Übertragungsmedium (Luft) ruhendem Beobachter die Schallquelle auf den Beobachter zu (bzw. weg), so verkürzen sich vor der Quelle die Wellenlängen, während sie sich hinter der Quelle verlängern (Bild 18-10). Ursache dafür ist, dass sich die von der Quelle mit der Frequenz νQ erzeugten Wellen nach wie vor im ruhenden Medium
Bild 18-10. Zum Doppler-Effekt bei bewegter Schallquelle
νQ cs = vQ . λ 1∓ cs
(18-47)
Bewegt sich die Schallquelle an einem Beobachter vorbei, so schlägt die Frequenz im Moment des Passierens von einem höheren auf einen niedrigeren Wert um. Der akustische Doppler-Effekt (18-46) bzw. (18-47) zeigt also bei bewegtem Beobachter ein etwas anderes Ergebnis als bei bewegter Quelle. Bewegen sich sowohl die Schallquelle als auch der Beobachter, so gilt νB = νQ
cs ± vB . cs ∓ vQ
(18-48)
Das jeweils obere Vorzeichen von vB bzw. vQ gilt für eine Bewegung in Richtung auf die Quelle bzw. auf den Beobachter zu, das jeweils untere Vorzeichen für eine Bewegung von der Quelle bzw. vom Beobachter weg. Doppler-Effekt elektromagnetischer Wellen (Licht)
Aus dem Prinzip der Konstanz der Vakuumlichtgeschwindigkeit c0 in zueinander bewegten Inertialsystemen (siehe 2.3.2) folgt, dass für die Lichtausbreitung kein Übertragungsmedium wie bei der Schallausbreitung existiert. Dann sollte der Doppler-Effekt allein von der Relativgeschwindigkeit vr zwischen Lichtquelle und Beobachter abhängen. Tatsächlich ergibt sich für den relativistischen Doppler-Effekt (ohne Ableitung) c0 ± vr . (18-49) νB = ν0 c0 ∓ vr Der relativistische Doppler-Effekt wird als Rotverschiebung der Spektrallinien von sich schnell entfernenden Sternen beobachtet (untere Vorzeichen), bei umeinander rotierenden Doppelsternen auch als periodisch abwechselnde Rot- und Blauverschiebung.
B233
B234
B Physik
Für vr c0 geht der relativistische Doppler-Effekt (18-49) in den klassischen Doppler-Effekt (18-48) über. Für diesen Fall ergibt sich die DopplerVerschiebung der Frequenz zu Δν vr ≈ νQ c
für vr c .
(18-50)
Anwendung: Geschwindigkeitsmessung an Licht oder Radiowellen emittierenden Sternen oder Satelliten; Radar-Geschwindigkeitsmessung durch Reflexion an bewegten Körpern. Kopfwellen, Mach-Kegel
Nähert sich die Geschwindigkeit vQ einer Schallquelle (z. B. ein Flugzeug) der Schallgeschwindigkeit cs , so überlagern sich alle bereits emittierten Wellenberge in Vorwärtsrichtung direkt an der Schallquelle (Bild 18-11a) und erzeugen sehr hohe Druckamplituden und -gradienten. Nach Durchstoßen dieser sog. Schallmauer fliegt die Quelle mit Überschallgeschwindigkeit vQ > cs und erzeugt ein Wellenfeld gemäß Bild 18-11b: Die nacheinander ausgelösten Kugelwellenberge durchdringen einander und überlagern sich zu einer kegelförmigen Kopfwelle (Schockwelle, Mach-Kegel), in deren Spitze sich die Schallquelle bewegt. Die Quelle muss dazu gar keine Schallwellen in üblicher Weise aussenden. Die durch die Bewegung des Körpers in Luft erzeugte Druckstörung breitet sich ebenfalls in der beschriebenen Weise aus und ist dann an der Erdoberfläche als Überschallknall zu hören. Der Öffnungswinkel α des Mach-Kegels (Bild 18-11b) wird durch das Verhältnis von Schallzu Quellengeschwindigkeit bestimmt: sin α =
1 cs . = vQ Ma
(18-51)
Das Größenverhältnis Ma = vQ /cs wird als MachZahl bezeichnet. Sie hängt nicht nur von der Quellengeschwindigkeit vQ , sondern wegen (18-45) auch von der Temperatur der Luft ab. Kopfwellen können auch bei elektromagnetischen Wellen erzeugt werden. Schnell bewegte, elektrisch geladene Teilchen strahlen elektromagnetische Wellen ab. In Substanzen mit der optischen Brechzahl n > 1 (siehe 21.1) ist die Phasengeschwindigkeit des Lichtes cn = c0 /n < c0 . Geladene Teilchen, die
Bild 18-11. Wellenfelder einer bewegten Schallquelle, a bei vQ ≈ cs , b bei vQ > cs
mit Geschwindigkeiten v > cn in solche Substanzen geschossen werden, erzeugen dann elektromagneˇ tische Kopfwellen: Cerenkov-Strahlung. Für den Öffnungswinkel folgt aus (18-51) sin α =
c0 . nv
(18-52)
Durch Messung von α kann die Teilchengeschwindigˇ keit bestimmt werden: Cerenkov-Detektoren.
19 Elektromagnetische Wellen Zeitveränderliche elektrische und magnetische Felder sind untrennbar miteinander verknüpft, sie erzeugen einander gegenseitig (Bild 14-9): Ein zeitveränderliches elektrisches Feld erzeugt ein magnetisches Feld (Maxwell’sches Gesetz (14-34)), und ein zeitveränderliches magnetisches Feld erzeugt ein elektrisches Feld (Faraday-Henry-Gesetz bzw. Induktionsgesetz (14-31)). Die Kombination beider Prinzipien legt daher die Existenz elektromagnetischer Wellen nahe (Maxwell, 1865): Die zeitperiodische Änderung eines lokalen elektrischen (oder magnetischen) Feldes erzeugt ein ebenfalls zeitperiodisches, das erzeugende Feld umschlingendes magnetisches (bzw. elektri-
19 Elektromagnetische Wellen
Bild 19-1. Elektrische und magnetische Feldlinien um einen
schwingenden elektrischen Dipol
sches) Feld. Dieses wiederum induziert um sich herum ein weiteres zeitperiodisches elektrisches (bzw. magnetisches) Feld und so fort (Bild 19-1). Der periodische Vorgang breitet sich daher wellenartig im Raum aus und stellt eine elektromagnetische Welle dar. Die experimentelle Bestätigung erfolgte 1888 durch H. Hertz.
19.1 Erzeugung und Ausbreitung elektromagnetischer Wellen Ein zeitperiodisches elektrisches Feld (Wechselfeld) als Quelle einer sich frei ausbreitenden elektromagnetischen Welle kann z. B. durch eine Dipolantenne erzeugt werden, in die eine hochfrequente Wechselspannung eingespeist wird (Bild 19-1 u. 19-2). Die Dipolantenne stellt dann einen elektrischen Dipol mit periodisch wechselnder Richtung und Betrag des Dipolmoments (12-83) dar. Die erzeugte elektromagnetische Welle ist linear polarisiert, wobei (in der Äquatorebene) die elektrische Feldstärke E parallel zur Dipolachse orientiert ist und die magnetische Feldstär-
ke senkrecht zu E und zur Ausbreitungsrichtung c (Bild 19-2a). Der Nachweis kann wiederum mit einer Dipolantenne erfolgen, an die ein Messinstrument (oder im Laborexperiment eine Glühlampe) angeschlossen ist. Die Lampe leuchtet maximal, wenn der Empfangsdipol parallel zum Sendedipol und damit parallel zum elektrischen Feldstärkevektor ausgerichtet ist (Nachweis der Polarisation). Ein magnetischer Empfangsdipol muss dagegen senkrecht dazu, d. h. parallel zum magnetischen Feldstärkevektor, orientiert werden (Bild 19-2b). Aus diesen Beobachtungen folgt: Bei elektromagnetischen Wellen stehen elektrischer und magnetischer Feldstärkevektor senkrecht aufeinander und auf der Ausbreitungsrichtung: Elektromagnetische Wellen sind Transversalwellen. Eine Dipolantenne erzeugt elektromagnetische Kugelwellen, bei denen in unmittelbarer Dipolnähe (Nahfeld : l r λ) ein Gangunterschied von λ/4 (Phasendifferenz π/2) zwischen elektrischem und magnetischem Feld besteht, wie es für die quasistationäre elektrische Schwingung im Dipol anschaulich zu erwarten ist (hier macht sich die endliche Ausbreitungsgeschwindigkeit der Welle noch nicht bemerkbar). Im Fernfeld (r λ) schwingen dagegen elektrisches und magnetisches Feld gleichphasig. In sehr großer Entfernung r kann die Kugelwelle näherungsweise als ebene Welle betrachtet werden (Bild 19-3). Wellengleichung elektromagnetischer Wellen
Einen Ausschnitt der Feldverteilung in einer elektromagnetischen Welle (Bild 19-3) zeigt Bild 19-4.
Bild 19-2. a Abstrahlung polarisierter elektromagnetischer Wellen durch einen elektrischen Sendedipol. b Nachweis durch einen elektrischen oder magnetischen Empfangsdipol mit Glühlampe. Der elektrische Dipol muss parallel zum elektrischen Feldstärkevektor, der magnetische Dipol parallel zum magnetischen Feldstärkevektor ausgerichtet sein
B235
B236
B Physik
Bild 19-3. Linear polarisierte elektromagnetische Welle, die
sich in x-Richtung ausbreitet
Im nichtleitenden freien Raum ist die Stromdichte j = 0. Die Anwendung des Faraday-Henry-Gesetzes (Induktionsgesetz (14-31)) 0 " d E · ds = − (19-1) B · dA dt c1 auf einen geschlossenen Weg c1 in der x,y-Ebene mit den Abmessungen dx und dy (Fläche dA = dx dy) liefert mit B = μH (14-45) ∂Ey ∂Hz = −μ . ∂x ∂t
(19-2)
c2
auf einen geschlossenen Weg c2 in der x, z-Ebene mit den Abmessungen dx und dz (Fläche dA = dx dz) und mit D = εE (14-44) (19-4)
Partielle Differenziation von (19-2) nach x und von (19-4) nach t und Eliminierung von ∂2 Hz /∂x ∂t ergibt ∂2 E y ∂2 E y − εμ =0. ∂x2 ∂t2
(19-5)
Entsprechend ergibt die partielle Differenziation von (19-2) nach t und von (19-4) nach x und Eliminierung von ∂2 Ey /∂x ∂t ∂ 2 Hz ∂ 2 Hz − εμ =0. ∂x2 ∂t2
Gleichung (19-5) und (19-6) stellen eindimensionale Wellengleichungen für in x-Richtung sich ausbreitende elektromagnetische Wellen dar. Die Verallgemeinerung auf den dreidimensionalen Fall (18-11) und auf Wellen mit beliebiger Polarisationsrichtung lautet ΔE −
Entsprechend liefert die Anwendung des Maxwell’schen Gesetzes (14-34) 0 " d H · ds = (19-3) D · dA dt
∂Ey ∂Hz = −ε . ∂x ∂t
Bild 19-4. Zur Herleitung der Wellengleichung elektromagnetischer Wellen
(19-6)
1 ∂2 E · =0, c2 ∂t2
1 ∂2 H · =0. (19-7) c2 ∂t2 Hierin ist c die Phasengeschwindigkeit der elektromagnetischen Wellen, für die sich aus dem Vergleich mit (19-5) und (19-6) ergibt: ΔH −
1 1 c= √ = √ . εμ εr μr ε0 μ0
(19-8)
Im Vakuum ist εr = μr = 1. Mit experimentellen Werten von ε0 und μ0 folgt daraus für die Phasengeschwindigkeit elektromagnetischer Wellen im Vakuum: 1 cvac = √ = 3,00 · 108 m/s , (19-9) ε0 μ0 unabhängig von der Frequenz bzw. der Wellenlänge (d. h.: keine Dispersion). Der Wert von cvac ist identisch mit der Vakuumlichtgeschwindigkeit c0 , die heute auf den Wert c0 = 299 792 458 m/s festgelegt ist (siehe (1.2)). Daher liegt die Annahme nahe, die von Maxwell in seiner elektromagnetischen Lichttheorie aufgestellt wurde: Licht ist eine elektromagnetische Welle. Diese Annahme wurde bestätigt durch zahlreiche Experimente (z. T. bereits von Heinrich Hertz durchgeführt), die für elektromagnetische Wellen dieselben
19 Elektromagnetische Wellen
Eigenschaften ergeben, wie sie für Licht aus der Optik bekannt sind, insbesondere: Reflexion an Metallflächen; stehende elektromagnetische Wellen im Raum vor der reflektierenden Fläche; Bündelung durch metallische Hohlspiegel. Brechung an großen Prismen (Abmessungen λ) aus dielektrischem Material [Pech (Heinrich Hertz), Paraffin]; Fokussierung durch Paraffin-Linsen (vgl. 21.1). Lineare Polarisation und Transversalität der von Dipolen abgestrahlten elektromagnetischen Wellen: Nachweis durch „Polarisationsfilter“ (vgl. 21.2), hier aus Metallstab-Gittern mit Stababständen λ, die für elektromagnetische Wellen undurchlässig sind, wenn die Gitterstäbe parallel zum Feldstärkevektor E orientiert sind (Kurzschluss des elektrischen Feldes durch leitende Stäbe), und durchlässig bei senkrechter Orientierung (Gitterstäbe ohne leitende Verbindung miteinander). Beugung elektromagnetischer Wellen an Doppel- und Mehrfachspalten in Metallschirmen (siehe 23). Die ebene elektromagnetische Welle im Fernfeld eines Dipols (Bild 19-3) lässt sich beschreiben durch Ey = Eˆ sin (kr − ωt + ϕ0 ) , Hz = Hˆ sin (kr − ωt + ϕ0 ) ,
(19-10)
Hierin hat ZF die Dimension eines elektrischen Widerstandes und heißt der Feldwellenwiderstand: μ . (19-12) ZF = ε
(19-13)
= μ0 c0 ≈ 4π · 10−7 Vs/Am · 3 · 108 m/s = 120 π Ω .
E = ZF H
(Fernfeld) .
(19-14)
Energiestromdichte, Strahlungscharakteristik
Die Energiedichte des elektromagnetischen Wellenfeldes w setzt sich aus der Energiedichte we des elektrischen Feldes (12-82) und der Energiedichte wm des magnetischen Feldes (14-30) zusammen: 1 2 1 2 εE + μH . (19-15) 2 2 Wegen der Kopplung (19-12) und (19-14) zwischen E- und H-Feld bei der elektromagnetischen Welle sind die Energiedichten we und wm gleich und damit w = we + wm =
EH . (19-16) c Die Energiestromdichte oder Strahlungsintensität einer elektromagnetischen Welle ergibt sich analog (18–15) aus Energiedichte w und Ausbreitungsgeschwindigkeit c zu w = εE 2 = μH 2 =
S = wc = EH
wobei die Amplituden Eˆ und Hˆ eine gegenseitige Abhängigkeit zeigen, die sich aus der Kopplung zwischen E- und H-Feld gemäß (19-2) und (19-4) ergibt. Einsetzen von Ey und Hz liefert mit (19-8) den Zusammenhang μ ˆ (19-11) H = ZF Hˆ . Eˆ = ε
Der Feldwellenwiderstand des Vakuums ist μ0 Z0 = = 376,73 . . . Ω ε0
Wegen der Gleichphasigkeit von E und H im Fernfeld gilt (19-11) auch für jeden Augenblickswert der Feldstärken
(19-17)
oder vektoriell geschrieben als sog. Poynting-Vektor: S = wc = E × H
(19-18)
SI-Einheit: [S] = W/m . 2
Der Poynting-Vektor gibt Betrag und Richtung der elektromagnetischen Feldenergie an, die 1 m2 Fläche in 1 s senkrecht durchströmt. Betrachtet man eine geschlossene Oberfläche A, die einen Raumbereich V umschließt, so lässt sich der Energieerhaltungssatz in elektromagnetischen Feldern in folgender Weise formulieren: " 0 " ∂ wdV = ϕ dV + S · dA . (19-19) − ∂t V
V
A
ϕ ist die räumliche Dichte der Joule’schen Leistung. Satz von Poynting: Die zeitliche Abnahme der Gesamtenergie eines elektromagnetischen Feldes ist gleich der pro Zeiteinheit im Volumen erzeugten Joule’schen Wärme und der durch die Oberfläche abgestrahlten Strahlungsleistung.
B237
B238
B Physik
Anmerkung: Der Poynting-Vektor ist für sich genommen nicht eindeutig hinsichtlich der Energieströmung, da z. B. auch gekreuzte statische E- und H-Felder einen Beitrag zu S liefern, aber natürlich keine Energieströmung bedeuten. Erst die Betrachtung des geschlossenen Oberflächenintegrals in (19-19) liefert bei statischen Feldern als eindeutige Aussage die Gesamtausstrahlung 0, da die geschlossenen Magnetfeldlinien gleich 1 große Beiträge entgegengesetzten Vorzeichens zu S · d A ergeben. Die Hertz’sche Theorie ergibt für die Strahlungsintensität eines kurzen Dipols (l λ, Hertz’scher Oszillator) mit dem maximalen Dipolmoment pˆ die Dipolcharakteristik S =
sin2 ϑ pˆ 2 ω4 · . r2 32π2 ε0 c30
(19-20)
ϑ ist der Winkel zur Dipolachse. Maximale Intensität wird demnach in der Äquatorebene abgestrahlt, in Richtung der Dipolachse ist hingegen die Intensität null (Bild 19-5). Die Gesamtausstrahlung Φ des Hertz’schen Dipols (Strahlungsleistung) erhält man aus (19-20) durch Integration über eine den Dipol einschließende geschlossene Oberfläche zu Φ=
pˆ 2 ω4 . 12πε0 c30
(19-21)
Mit der effektiven Ladung q(t) an den Enden des Dipols der Länge l beträgt das Dipolmoment des periodisch erregten Dipols nach (12-83) p = q(t)l = pˆ sin ωt und daraus der im Dipol fließende Strom dq 1 dp ω pˆ = · = cos ωt , dt l dt l bzw. der Effektivwert des Stromes (15-28) i=
ω pˆ I= √ . 2l
(19-22)
(19-23)
Dem Antennenstromkreis geht Energie in Form der abgestrahlten elektromagnetischen Wellen verloren. Die Strahlungsleistung Φ der Antenne (19-21) ist gleich der durch die Abstrahlung bedingten elektrischen Verlustleistung P der Antenne, die durch die eingespeiste effektive Stromstärke I wie bei den Wechselstromkreisen (siehe 15.3) ausgedrückt
Bild 19-5. Schnitt durch die Strahlungsintensitätscharakteristik eines Hertz’schen Dipols (rotationssymmetrisch um die Dipolachse)
werden kann: Φ = P = Rrd I 2 .
(19-24)
Rrd wird Strahlungswiderstand der Antenne genannt und hat die Dimension eines Ohm’schen Widerstandes. Einsetzen von (19-9), (19-13), (19-21) und (19-23) in (19-24) ergibt für den Strahlungswiderstand eines Hertz’schen Dipols 2 2 l 2π μ0 l 2π Rrd = Z0 = 3 ε0 λ 3 λ 2 l ≈ 789 Ω für l λ . (19-25) λ Der Strahlungswiderstand einer auf leitender Erde stehenden (halben) Dipolantenne ist doppelt so groß, da nur das halbe Wellenfeld (Erdoberfläche wirkt als Spiegelebene) und damit die halbe Energie ausgestrahlt wird. Bei technischen Wechselstromfrequenzen ist λ l und demzufolge Rrd gegenüber dem Ohm’schen Leitungswiderstand R zu vernachlässigen. Die Abstrahlung steigt jedoch mit steigender Frequenz ν (sinkender Wellenlänge λ) stark an (19-21). Der Strahlungswiderstand erreicht ein Maximum bei l = λ/2 (Standardform der Antenne) und beträgt Rrd ≈ 70 Ω für den λ/2-Dipol ((19-25) ist dann nicht mehr gültig). Abstrahlung elektromagnetischer Wellen durch beschleunigte Ladungen
Das Dipolmoment des schwingenden Hertz’schen Dipols p(t) = pˆ sin ωt wurde bei konstanter Dipollänge l durch eine zeitperiodische Ladung q(t) gebildet, die vom eingespeisten, hochfrequenten Wechselstrom erzeugt wurde. Derselbe Sachverhalt kann auch dargestellt werden durch eine schwingende konstante Ladung q mit zeitperiodisch veränderlicher Dipollänge
19 Elektromagnetische Wellen
l = lˆ sin ωt: p(t) = ql(t) = qlˆ sin ωt .
(19-26)
Zweifache zeitliche Ableitung ergibt einen Zusammenhang zwischen dem Dipolmoment p und der Beschleunigung a = l¨ der Ladung, für die Maximalwerte geschrieben: pˆ 2 ω4 = q2 aˆ 2 .
(19-27)
Wird dies in (19-20) und (19-21) eingeführt unter Verwendung des quadratischen Mittelwertes der Beschleunigung a2 = aˆ 2 /2, so erhalten wir für die Strahlungscharakteristik einer beschleunigten Ladung q S =
sin2 ϑ q2 a2 · , 3 r2 16π2 ε0 c0
(19-28)
wobei ϑ der Winkel zwischen dem Poynting-Vektor S und der Beschleunigung a ist. Für die Gesamtausstrahlung einer beschleunigten Ladung q folgt entsprechend die Larmor’sche Formel Φ=
q2 a2 . 6πε0 c30
(19-29)
Gleichungen (19-28) und (19-29) gelten nicht nur für den betrachteten Fall der schwingenden Ladung, sondern generell für eine mit a beschleunigte Ladung: Eine beschleunigte Ladung strahlt elektromagnetische Energie ab. Die Strahlungscharakteristik entspricht (im nichtrelativistischen Fall) derjenigen eines Dipols (19-28) mit der Achse in Beschleunigungsrichtung. Die beschleunigte Ladung strahlt also vorwiegend senkrecht zur Beschleunigungsrichtung. Leitungsgeführte elektromagnetische Wellen
Bei Frequenzen ν 100 MHz (UKW- und Fernsehfrequenzen) wird die Wellenlänge elektromagnetischer Wellen λ 3 m. Für Leitungslängen dieser Größenordnung kann daher die endliche Ausbreitungsgeschwindigkeit elektromagnetischer Wellen nicht mehr vernachlässigt werden. Es werde eine Doppelleitung (Lecher-System) betrachtet, die keine Ohm’schen Leitungsverluste habe (ideale Doppelleitung). Dann wird das elektromagnetische Verhalten
Bild 19-6. Doppelleitung (Lecher-System) mit Ersatzschalt-
bild für die Länge dx
durch die längenbezogene Induktivität, den Induktivitätsbelag L der Doppelleitung und durch die längenbezogene Kapazität, den Kapazitätsbelag C zwischen den Leitern bestimmt (Bild 19-6). Hinsichtlich der verlustbehafteten Doppelleitung siehe G 9. Beträgt der Abstand der beiden Leiter d und der Drahtradius r, so erhält man für Induktivitäts- und Kapazitätsbelag näherungsweise (ohne Ableitung) πε . (19-30) d ln r Für einen differenziell kleinen Leitungsabschnitt der Länge dx ist eine quasistatische Betrachtung möglich, und die Kirchhoff’schen Sätze (15-14) und (15-18) sind auf die Momentanwerte von Strömen und Spannung anwendbar. Die in einem Ersatzschaltbild (Bild 19-6) zu berücksichtigenden Induktivitäten und Kapazitäten betragen dL = L dx, dC = C dx. Die Anwendung der Kirchhoff’schen Sätze auf das Ersatzschaltbild liefert L =
μ d ln , π r
∂i ∂u + L = 0 , ∂x ∂t
C =
∂i ∂u + C =0. ∂x ∂t
(19-31)
Durch partielle Differenziation nach x bzw. t und Eliminierung des jeweiligen gemischten Differenzialquotienten ergibt sich die Wellengleichung für Leitungswellen 2 ∂2 i ∂ i − L C =0, ∂x2 ∂t2 2 ∂2 u ∂ u − L C =0. ∂x2 ∂t2
(19-32)
Für die Phasengeschwindigkeit cL der Leitungswellen erhält man durch Vergleich mit (19-7) sowie nach Einsetzen von (19-30) cL = √
1
1 = √ =c, εμ L C
(19-33)
B239
B240
B Physik
wobei die Kopplung zwischen u und i durch (19-31) ϕu = ϕi erzwingt. Mit (19-33) folgt der Wellenwiderstand der Doppelleitung L U uˆ . ZL = = = (19-35) ˆi C I
Bild 19-7. Stehende und laufende Wellen auf der Doppelleitung (Lecher-System)
die sich damit als identisch erweist mit der Phasengeschwindigkeit freier elektromagnetischer Wellen. Elektromagnetische Wellen breiten sich daher auf Leitungen ähnlich aus wie elastische Wellen auf Seilen, Drähten oder Stäben. Insbesondere werden sie an den Enden der Leitung reflektiert und bilden stehende Wellen (vgl. 18.1). Bei offenem Ende der Doppelleitung wird die Spannungswelle ohne Phasensprung reflektiert, d. h., am Leitungsende liegt ein Spannungsbauch und ein Stromknoten, da hier ständig i = 0 sein muss (Bild 19-7a). Bei kurzgeschlossenem Ende der Doppelleitung wird die Spannungswelle mit einem Phasensprung von π reflektiert, da durch den Kurzschluss ein Spannungsknoten erzwungen wird. Die Stromwelle zeigt einen Strombauch (Bild 19-7b). In beiden Fällen besteht zwischen Spannungsbäuchen und Strombäuchen eine Phasendifferenz von π/2 (Wegdifferenz λ/4). Dies lässt sich durch einen elektrischen (für Spannungsbäuche) oder magnetischen Nachweisdipol (für Strombäuche) zeigen. Spannung und Strom einer in +x-Richtung laufenden Welle auf der idealen Doppelleitung sind darstellbar durch u = uˆ sin (kx − ωt + ϕu ) , i = ˆi sin (kx − ωt + ϕi ) ,
(19-34)
Wird diese Bedingung, die auch für unsymmetrische Doppelleitungen (z. B. Koaxialkabel) gilt, auch am Leitungsende eingehalten durch Abschluss mit einem Ohm’schen Widerstand R von der Größe des Wellenwiderstandes (Bild 19-7c), so wird die Welle vollständig vom Abschlusswiderstand absorbiert und nicht reflektiert (wichtig u. a. bei Antennenleitungen). Mit (19-30) folgt für die symmetrische Doppelleitung näherungsweise d 1 μ , (19-36) ZL = ln π r ε d im Vakuum ZL0 ≈ 120 ln Ω. r
19.2 Elektromagnetisches Spektrum Nach (19-29) werden elektromagnetische Wellen bei allen Vorgängen erzeugt, bei denen elektrische Ladungen beschleunigt (oder abgebremst) werden. Der elektrische Feldstärkevektor schwingt dabei wie bei der Dipolcharakteristik in der durch die Ausbreitungsrichtung k und den Beschleunigungsvektor a definierten Ebene senkrecht zum Wellenvektor k. Beispiele für die Erzeugung kurzwelliger elektromagnetischer Strahlung durch beschleunigte oder abgebremste elektrische Ladungen sind: Wärmestrahlung
Die Wärmebewegung in Materie bedeutet, dass die Bestandteile der Atome, die Elektronen und Ionen, mit einer Vielzahl von Frequenzen schwingen (vgl. 5.6.2 Mehrere gekoppelte Oszillatoren), d. h. periodisch beschleunigt werden, und damit elektromagnetische Wellen ausstrahlen, die wir als Wärmestrahlung (Ultrarot- oder Infrarotstrahlung) registrieren. Bei hohen Temperaturen treten höhere Frequenzen auf, die Materie „glüht“, d. h., das Spektrum der erzeugten elektromagnetischen Strahlung reicht bis in das Gebiet der sichtbaren Lichtstrahlung, bei sehr hohen Temperaturen (Lichtbogen,
19 Elektromagnetische Wellen
Bild 19-8. Röntgenröhre
Sonnenoberfläche) darüber hinaus in den Bereich der Ultraviolettstrahlung. Da die Beschleunigungsrichtungen bei der Wärmebewegung statistisch verteilt sind, ist die Wärmestrahlung unpolarisiert (siehe auch 20.2). Röntgenbremsstrahlung
Schnelle geladene Teilchen, etwa Elektronen, die in einem elektrischen Feld auf eine Energie von z. B. 10 keV beschleunigt wurden, haben nach (12-53) eine Geschwindigkeit von v ≈ 60 000 km/s. Treffen sie dann auf einen Festkörper, wie die Anode einer Röntgenröhre (Bild 19-8), so werden sie innerhalb einer Strecke von 10 bis 100 nm auf die Driftgeschwindigkeit von Leitungselektronen ((12-61), ca. 1 mm/s) abgebremst. Der weit überwiegende Teil der Teilchenenergie wird dabei in Wärmeenergie des Festkörpers umgewandelt. Ein kleiner Teil der Energie geht jedoch in eine elektromagnetische Strahlung über: Röntgenbremsstrahlung (Röntgen, 1895). Diese Strahlung, deren Wellencharakter erst später durch Interferenzexperimente an Kristallen nachgewiesen wurde (v. Laue, 1912), ist sehr durchdringend (Anwendung: Röntgendurchleuchtung). Da es sich bei der Teilchenabbremsung nicht um periodische, sondern um pulsartige Vorgänge handelt, ist das Frequenzspektrum der Röntgenbremsstrah-
Bild 19-9. a Frequenz- und b Wellenlängenspektrum der Röntgenbremsstrahlung
lung nicht diskret, sondern zeigt nach dem FourierTheorem (siehe 5.5.2) eine breite, kontinuierliche Verteilung (Bild 19-9). Die Spektren zeigen eine von der Beschleunigungsspannung U abhängige obere Grenzfrequenz νc bzw. eine untere Grenzwellenlänge λc (Bild 19-9). Die Erklärung hierfür ergibt sich aus der schon u. a. bei der Fotoleitung (16.4) und bei der Fotoemission (16.7.1) verwendeten Lichtquantenhypothese (20.3). Hiernach tritt auch die Röntgenbremsstrahlung in Form von Lichtquanten oder Photonen der Energie E = hν (16-93) auf, hier auch Röntgenquanten genannt, die durch Einzelprozesse bei der Abbremsung eines Elektrons entstehen. Die höchste Quantenenergie, die auf diese Weise entstehen kann, ergibt sich bei vollständiger Umwandlung der Elektronenenergie eU in ein einziges Röntgenquant: eU = hνc .
(19-37)
Der im Grunde zu berücksichtigende Energiegewinn der Austrittsarbeit von einigen eV durch die in das Anodenmetall eindringenden Elektronen (Tabelle 16-6) kann gegenüber der Beschleunigungsenergie der Elektronen vernachlässigt werden. Für die Grenzfrequenz des Röntgenspektrums folgt aus (19-37) e νc = U . (19-38) h Mit ν = c/λ folgt weiter das Duane-Hunt’sche Gesetz hc = const . (19-39) e Dem kontinuierlichen Spektrum der Röntgenbremsstrahlung überlagert tritt eine linienhafte Röntgenstrahlung auf, die aufgrund von Übergängen zwischen diskreten Energieniveaus der Anodenatome Uλc =
Bild 19-10. Synchrotronstrahlung bei Kreisbeschleunigern
B241
B242
B Physik
Bild 19-11. Spektrum der elektromagnetischen Strahlung
emittiert wird und spezifisch für jede Ordnungszahl Z ist: charakteristische Röntgenstrahlung (siehe 20.4). Synchrotronstrahlung
Geladene Teilchen, die sich auf gekrümmten Bahnen bewegen (z. B. infolge von einwirkenden Magnetfeldern B), unterliegen einer Normalbeschleunigung a. Dies ist u. a. bei Hochenergie-Kreisbeschleunigern (z. B. Synchrotrons) der Fall und führt dort ebenfalls zur Emission von elektromagnetischer Strahlung: Synchrotronstrahlung (Bild 19-10). Die Synchrotronstrahlung ist eine Dipolstrahlung, bei der allerdings die Strahlungscharakteristik des Dipols (Bild 19-5) durch relativistische Effekte zu einer schmalen, intensiven Strahlungskeule in Vorwärtsrichtung deformiert ist. In Richtung der Beschleunigung a wird wie beim Dipol keine Strahlung emittiert. Die Synchrotronstrahlung ist wie die Dipolstrahlung polarisiert (Richtung der Feldvektoren Es und Hs , vgl. Bild 19-10) und hat ein kontinuierliches Frequenzspektrum, das je nach Beschleunigungsenergie im Ultravioletten und im weichen oder harten Röntgengebiet liegen kann.
Eine Übersicht über das gesamte Spektrum der elektromagnetischen Strahlung mit Hinweisen auf weitere Erzeugungsmechanismen zeigt Bild 19-11. Das sichtbare Licht nimmt darin nur einen sehr schmalen Frequenzbereich ein.
20 Wechselwirkung elektromagnetischer Strahlung mit Materie 20.1 Ausbreitung elektromagnetischer Wellen in Materie, Dispersion Für die Phasengeschwindigkeit elektromagnetischer Wellen in Materie folgt aus (19-8) und (19-9) c0 c= √ < c0 . εr μr
(20-1)
Da sowohl die Permittivitätszahl εr als auch die Permeabilitätszahl μr bis auf ganz spezielle Fälle stets 1 sind, ist die Phasengeschwindigkeit elektromagnetischer Wellen in Materie kleiner als die Vakuum-
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
lichtgeschwindigkeit. So erweist sich z. B. bei gleicher Frequenz ν die Wellenlänge λ stehender Wellen auf einem Lecher-System (Bild 19-7), das in Wasser getaucht ist, um einen Faktor 9 kleiner als in Luft oder Vakuum, d. h., cH2 O ≈ c0 /9. Das Verhältnis c0 /cn > 1 wird als Brechzahl n des Ausbreitungsmediums bezeichnet, wobei cn die Phasengeschwindigkeit im Medium der Brechzahl n sei. Aus (20-1) folgt dann die Maxwell’sche Relation n=
c0 √ = εr μr . cn
(20-2)
Für nichtferromagnetische Stoffe ist μr ≈ 1, sodass sich (20-2) vereinfacht zu √ n ≈ εr . (20-3) Die Maxwell’sche Relation wurde experimentell an vielen Stoffen, z. B. an Gasen, bestätigt. Auch für Wasser mit der aufgrund des permanenten Dipolmoments seiner Moleküle (Bild 12-32) hohen Permittivitätszahl εr = 81 (Tabelle 12-2) ergibt sich n = √ 81 = 9 für elektromagnetische Wellen nicht zu hoher Frequenz (siehe oben). Bei Frequenzen des sichtbaren Lichtes allerdings ist die Brechzahl des Wassers n = 1,33 (vgl. Tabelle 21-1). Hier liegt offenbar eine Abhängigkeit von der Frequenz bzw. Wellenlänge vor: n = n(λ), die Dispersion genannt wird. Die Dispersion von Materie für elektromagnetische Wellen lässt sich als Resonanzerscheinung deuten. Die positiven und negativen Ladungen q im Atom können bei kleinen Auslenkungen als quasielastisch gebunden angesehen werden. Eine äußere elektrische Feldstärke E in x-Richtung induziert ein elektrisches Dipolmoment p = qx = αE: Verschiebungspolarisation (α Polarisierbarkeit, siehe 12.9). Eine elektromagnetische Welle regt die Ladungen q zu periodischen Schwingungen an und erzeugt damit periodisch schwingende Dipole. Wird die Dämpfung (z. B. durch Abstrahlung sekundärer elektromagnetischer Wellen, vgl. 19.1, oder durch Absorption) zunächst vernachlässigt, so folgt aus der für erzwungene Schwingungen berechneten Amplitudenresonanzkurve der Auslenkung x (5-61) bis auf einen Phasenfaktor für die Polarisierbarkeit α=
q2 . m ω20 − ω2
(20-4)
ω0 ist die Resonanzfrequenz der Ladungen q. Für Materie geringer Dichte, z. B. für Gase, gilt nach (12-109) mit der Ladungsträgerdichte nq n 2 = εr = 1 +
nq nq q2 α=1+ · . (20-5) ε0 ε0 m ω2 − ω2 0
Im Allgemeinen gibt es mehrere Sorten j unterschiedlich stark gebundener Ladungen mit entsprechenden Resonanzfrequenzen ω j im Atom (Elektronen in verschiedenen Schalen, bei Ionenkristallen müssen auch die positiven lonen berücksichtigt werden). Mit nq = n j und der Einführung von Oszillatorenstärken f j = n j /N (N Atomzahldichte, anstelle von n zur Vermeidung von Konfusion mit der Brechzahl) erhalten wir die Dispersionsformel n2 = 1 +
f j q2j N . ε0 j m j ω2 − ω2 j
(20-6)
Gleichung (20-6) wurde ohne Berücksichtigung von Dämpfung (Absorption) hergeleitet, gilt daher nur außerhalb der Resonanzbereiche (gestrichelt in Bild 20-1). Für dichtere Materie als Gas ist n deutlich größer als 1. Hier ist entsprechend den ClausiusMosotti-Formeln (12-110) (n2 − 1) zu ersetzen durch 3 (n2 − 1)/(n2 + 2). Für die Elektronenresonanzen ist q = e. Bei durchsichtigen Stoffen kommt man meist mit der Annahme von zwei Resonanzstellen aus, von denen eine im Ultravioletten liegt (Elektronen), die andere im Ultraroten (Ionen). Für sehr hohe Frequenzen jenseits der höchsten Eigenfrequenz ω j wird nach (20-6) jedenfalls n < 1. Das führt dazu, dass Röntgenstrahlen bei sehr streifendem Einfall totalreflektiert werden (vgl. 21.1). Die Quantenmechanik liefert eine entsprechende Dispersionsformel, bei der lediglich ω j durch die Übergangsfrequenz ω ji = (E j − Ei )/ für den Übergang vom Grundzustand der Energie Ei zum angeregten Zustand E j und f j durch f ji zu ersetzen ist. Die Dämpfung lässt sich am einfachsten durch Verwendung der komplexen Schreibweise in der Theorie der Ausbreitung elektromagnetischer Wellen in absorbierenden bzw. leitenden Medien beschreiben, die hier nicht im Einzelnen dargestellt wird. Dabei wird die Brechzahl komplex angesetzt (j imaginäre Einheit, j2 = −1): n˜ = n(1 + jκ) .
(20-7)
B243
B244
B Physik
√ Als Folge muss, wenn n = εr weitergelten soll, auch die Permittivitätszahl komplex angesetzt werden: ε˜ r = n˜ 2 = n2 (1 + jκ)2 = n2 (1 − x2 ) + j 2n2 κ . (20-7a) Weiterhin erhält man mit E(r, t) = E(r) exp(−jωt) aus der Differenzialgleichung für die durch die einfallende Welle erzwungene, gedämpfte Polarisationsschwingung (nicht dargestellt) anstelle von (20-6) n˜ 2 = ε˜ r = 1 +
2 N f jq j 1 · . 2 2 ε0 j m j ω j − ω − j 2δω (20-8)
δ ist der Abklingkoeffizient (vgl. 5.3). Trennung von Real- und Imaginärteil und Vergleich mit (20-7a) liefert schließlich den Brechzahlverlauf und den durch die Dämpfung bewirkten Absorptionsverlauf (20-9) Re ε˜ r = n2 (1 − κ2 ) 2 2 2 ωj − ω N f jq j =1+ · , 2 ε0 j m j ω2j − ω2 + 4δ2 ω2
Im ε˜ r = 2n2 κ 2 2δω N f jq j · . (20-9a) = 2 ε0 j m j ω2j − ω2 + 4δ2 ω2 Die Größe κ bestimmt den Amplitudenabfall beim Eindringen der elektromagnetischen Welle in das dämpfende Medium. Bild 20-1 zeigt, dass zwischen
den Resonanzstellen der Brechzahlverlauf durch die absorptionsfreie Dispersionsformel (20-6) recht gut wiedergegeben wird. Hier ist dn/dω > 0, d. h., es liegt normale Dispersion vor (vgl. auch (18-28)). Im Absorptionsgebiet ist dagegen dn/dω < 0: anomale Dispersion (Bild 20-1). Die Absorptionskurve n2 κ(ω) entspricht im Wesentlichen der Funktion für die Leistungsaufnahme des gedämpften Oszillators (5-73) und Bild 5-16. Die Ursache für die Beobachtung, dass in Materie cn < c0 ist, ist demnach die Anregung von Schwingungen der die Atome bildenden Ladungsträger durch die einfallende elektromagnetische Welle. Dadurch werden sekundäre Streuwellen gleicher Frequenz erzeugt, die sich den primären Wellen überlagern, aber gemäß den Eigenschaften der erzwungenen Schwingungen phasenverzögert sind (Bild 5-15). Da dies bei der weiteren Ausbreitung ständig und stetig erfolgt, resultiert eine Verringerung der Phasengeschwindigkeit gegenüber der Ausbreitung im Vakuum. Für frei bewegliche Elektronen, etwa im Plasma eines ionisierten Gases (siehe 16.6.3), fehlt die Rückstellkraft. Demzufolge ist hier ω0 = 0 zu setzen. Berücksichtigen wir nur diese Elektronen, so wird aus (20-6) die Dispersionsrelation im Plasma: n2 = 1 −
ω2p Ne2 = 1 − , ε0 me ω2 ω2
(20-10)
worin ωp die Plasmafrequenz nach (16-84) ist. Auch hier ist n < 1 mit der Möglichkeit der Totalreflexion (z. B. von Radiowellen an der Ionosphäre), vgl. die Bemerkung über Totalreflexion von streifend einfallender Röntgenstrahlung im Anschluss an (20-6). Spektralanalyse, Emissions- und Absorptionsspektren
Bild 20-1. Brechzahl- und Absorptionsverlauf in einem dispergierenden Medium mit zwei Resonanzfrequenzen
Atome unterschiedlicher Ordnungszahl Z haben wegen der unterschiedlichen Kernladungszahl verschiedene Eigenfrequenzen, die charakteristisch sind für die betreffende Atomsorte. Durch Stoßoder thermische Anregung können die Atome zu Resonanzschwingungen angeregt werden. Sie senden dann elektromagnetische Wellen der Resonanzfrequenz als Dipolstrahlung aus. Wird diese Strahlung durch einen Spektralapparat mit einem Dispersionselement (Prisma, siehe 21.1; Beugungsgitter, siehe 23.2) räumlich zerlegt (Spektrum), so erscheint
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
die Resonanzstrahlung als diskrete Emissionslinie im Spektrum. Das ergibt die Möglichkeit der Spektralanalyse, d. h. der chemischen Analyse von nach Anregung lichtemittierenden Substanzen durch Messung der Wellenlängen λ j der charakteristischen Linien im Emissionsspektrum, siehe auch 20.4. Dieselben Resonanzstellen absorbieren umgekehrt aus einem angebotenen kontinuierlichen Frequenzgemisch das Licht mit den Frequenzen der Resonanzstellen. Das Spektrum des verbleibenden Frequenzgemisches weist dann dunkle Linien auf: Absorptionsspektrum (siehe auch Bild 20-11). Fraunhofer hat 1814 solche Absorptionslinien zuerst im Sonnenspektrum gefunden: Analysemöglichkeit von Sternatmosphären. Die Behandlung von Atomen als Resonanzsysteme mit einer oder mehreren diskreten Resonanzfrequenzen ist geeignet für Materie geringer Dichte, z. B. für Gase. Bei hoher Materiedichte, z. B. in Festkörpern, sind die Resonanzsysteme der Atome stark gekoppelt mit der Folge der Aufspaltung der Atomfrequenzen entsprechend der Zahl der gekoppelten Atome (Größenordnung 1023 /mol; vgl. 5.6.2 und 16.1.2). Das diskrete Linienspektrum geht dann in ein kontinuierliches Spektrum über, das seine charakteristischen Eigenschaften weitgehend verliert: Glühende Körper hoher Temperatur emittieren weißes Licht, dessen Spektrum kontinuierlich verteilt ist (vgl. dazu aber 20.4, charakteristische Röntgenlinien), und dessen vom menschlichen Auge sichtbarer Bereich sich von Violett (λ = 380 nm, ν ≈ 790 THz) bis Rot (λ = 780 nm, ν ≈ 385 THz) erstreckt. Bei diesen Grenzwerten geht die Empfindlichkeit des menschlichen Auges gegen null, während sie ein Maximum im Grüngelben bei νmax = 540 THz und λmax ≈ 555 nm aufweist und damit dem Strahlungsmaximum der Sonne optimal angepasst ist, vgl. 20.2, Bild 20-5a.
20.2 Emission und Absorption des schwarzen Körpers, Planck’sches Strahlungsgesetz In jedem Körper der Temperatur T > 0 schwingen die Atome des Körpers bzw. deren elektrisch geladene Bestandteile (Elektronen, Ionen) mit statistisch verteilten Amplituden, Phasen und Richtungen (siehe 19-8). Nach 19.1 hat dies die Abstrahlung elektromagnetischer Wellen zur Folge: Temperaturstrah-
Bild 20-2. Zum Grundgesetz der Strahlungsübertragung
lung. Bei höheren Temperaturen als ungefähr T 0 ≈ 273 K wird sie als Wärmestrahlung empfunden. Bei sehr hohen Temperaturen T T 0 tritt dabei auch Lichtstrahlung auf: der Körper glüht. Zur Beschreibung des Strahlungsaustausches eines Körpers der Temperatur T („Strahler“) mit seiner Umgebung („Empfänger“) werden folgende Größen eingeführt (Strahlergrößen werden mit dem Index 1, Empfängergrößen mit dem Index 2 gekennzeichnet, Bild 20-2): Strahlungsleistung Φ: Quotient der emittierten Strahlungsenergie dQ durch die Zeitspanne dt dQ , dt SI-Einheit: [Φ] = W . Φ=
(20-11)
Strahlstärke I: Auf das Raumwinkelelement dΩ2 (Raumwinkel, unter dem eine Empfängerfläche dA2 von dA1 aus erscheint) entfallende Strahlungsleistung dΦ dΦ , dΩ2 SI-Einheit: [I] = W/sr . I=
(20-12)
Die Strahlstärke einer Strahlungsquelle ist i. Allg. von der Abstrahlungsrichtung bzw. deren Winkel ε1 zur Flächennormalenrichtung dA1 (Bild 20-2) abhängig. Besonders für den Fall der Gültigkeit des Lambert’schen Cosinusgesetzes (diffuse Emission bzw. Reflexion) ist es zweckmäßig, eine neue Größe L einzuführen durch dI = L cos ε1 dA1 .
(20-13)
L wird Strahldichte genannt: dI 1 · , cos ε1 dA1 SI-Einheit: [L] = W/(m2 · sr) . L=
(20-14)
B245
B246
B Physik
Im Falle der diffusen Emission bzw. Reflexion ist L konstant, unabhängig von der Abstrahlungsrichtung (Beispiel: Emission der Sonnenoberfläche). In allen anderen Fällen gilt L = L(ε1 ). Spezifische Ausstrahlung M: Auf ein Flächenelement dA1 des Strahlers bezogene abgestrahlte Strahlungsleistung dΦ dΦ , dA1 SI-Einheit: [M] = W/m2 . M=
(20-15)
Bei einem Lambert’schen Strahler ergibt sich für die spezifische Ausstrahlung in den Halbraum mit (20-12) bis (20-15) und Wahl des Polarkoordinatensystems mit d A1 als ϕ-Achse (ε1 = ϑ) " M = L cos ε1 dΩ2 Ω2
sin ϑ cos ϑ dϑ dϕ = πL . 0
dM , dν SI-Einheit: [Mν ] = W/(Hz · m2 ) . Mν =
(20-16)
E = cos ε2
dΦ . dA2
(20-18)
Die langjährig gemittelte extraterrestrische Sonnenbestrahlungsstärke der Erde heißt Solarkonstante Ee0 . In DIN 5031-8 (03.82) ist der Wert Ee0 = 1,37 kW/m2 angegeben. Bezieht man die Strahlungsgrößen auf einen Wellenlängenbereich dλ oder ein Frequenzintervall dν, so erhält man die entsprechenden spektralen Größen und kennzeichnet sie durch einen Index λ oder ν. Bezogen auf dλ erhält man die spezifische spektrale Ausstrahlung dM , dλ SI-Einheit: [Mλ ] = W/m3 , Mλ =
Φa 1, Φe
(20-21)
und der spektrale Absorptionsgrad
0
Aus (20-12) und (20-13) sowie mit dΩ2 = cos ε2 dA2 /R2 folgt ferner das Grundgesetz der Strahlungsübertragung im Vakuum cos ε1 cos ε2 d2 Φ = L dA1 dA2 , (20-17) R2 das auch für den Fall L = L(ε1 ) gilt. Bestrahlungsstärke E: Auf ein Flächenelement dA2 des Empfängers auftreffender Strahlungsfluss dΦ:
(20-20)
Entsprechendes gilt für die spektralen Strahldichten Lλ und Lν . Die Emission von Strahlung von der Oberfläche eines Körpers der Temperatur T kann durch die spektrale Strahldichte Lλ = Lλ (λ, T ) oder auch durch die spezifische spektrale Ausstrahlung in den Halbraum Mλ = Mλ (λ, T ) angegeben werden. Für diffuse Strahler gilt nach (20-16) Mλ = πLλ . Jeder Körper nimmt andererseits Strahlungsleistung Φe aus der Umgebung auf und absorbiert einen Anteil Φa . Der Absorptionsgrad α (integriert über alle Wellenlängen) ist α=
"2π "π/2 =L
und auf dν bezogen
α(λ) =
Φλ, a 1. Φλ, e
(20-22)
Sowohl α als auch α(λ) haben die Dimension eins. Schwarz gefärbte Körper haben einen Absorptionsgrad dicht bei 1, z. B. gilt für Ruß α ≈ 0,99. Ein ideal absorbierender Körper mit α = 1, der also sämtliche auftreffende Strahlung bei allen Wellenlängen und Temperaturen vollständig absorbiert, wird als schwarzer Körper bezeichnet. Der Absorptionsgrad des schwarzen Körpers ist α = (λ, T ) = αs = 1 .
(20-23)
Ein solcher schwarzer Körper kann näherungsweise als Hohlraum mit einer kleinen Öffnung realisiert werden (Bild 20-3). Durch die Öffnung einfallende
(20-19) Bild 20-3. Realisierung eines schwarzen Körpers als Hohlraumstrahler
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
Strahlung wird vielfach diffus reflektiert und dabei nahezu vollständig absorbiert, sodass durch die Öffnung keine reflektierte Strahlung wieder nach außen dringt. Die Öffnung erscheint (bei mäßigen Temperaturen) absolut schwarz. Die experimentelle Erfahrung zeigt, dass Körper mit hohem spektralen Absorptionsgrad α(λ) auch eine hohe Emission, d. h. eine hohe spezifische spektrale Ausstrahlung Mλ bzw. eine hohe spektrale Strahldichte Lλ , bei höheren Temperaturen aufweisen. Das Verhältnis beider Größen ist für alle Körper bei gegebener Wellenlänge und Temperatur konstant, bzw. allein eine Funktion von λ und T , vollkommen unabhängig von den individuellen Körpereigenschaften: Lλ (λ, T ) = const (λ, T ) α(λ, T )
(20-24)
(Kirchhoff 1860). Das gilt auch für den schwarzen Körper. Wegen (20-23) folgt daraus Lλ (λ, T ) = Lλs (λ, T ) α(λ, T )
(20-25)
(Kirchhoff’sches Strahlungsgesetz). Bei gegebener Wellenlänge und Temperatur ist daher die spektrale Strahldichte des schwarzen Körpers, die schwarze Strahlung oder Hohlraumstrahlung (z. B. aus einem Hohlraumstrahler gemäß Bild 20-3) die maximal mögliche. Sie hängt nicht von der Oberflächenbeschaffenheit und dem Material des strahlenden Hohlraums ab. Für die spektrale Strahldichte eines nichtschwarzen Körpers (α(λ) < 1) ergibt sich aus (20-25) Lλ (λ, T ) = α(λ, T ) · Lλs (λ, T )
zeigt aber Abweichungen bei großen λ. Die sog. Rayleigh-Jeans’sche Strahlungsformel wiederum gab die experimentellen Werte nur bei sehr großen Wellenlängen wieder, um bei kleinen λ über alle Grenzen zu wachsen (sog. Ultraviolettkatastrophe): Bild 20-4. Max Planck konnte eine zunächst noch nicht theoretisch begründete Interpolation beider Strahlungsformeln angeben (19.10. 1900), die mit den Messungen von Lummer und Pringsheim sehr genau übereinstimmte. Die theoretische Deutung seiner Interpolationsformel gelang Planck kurz danach (14.12. 1900) unter folgenden Annahmen: 1. Die Hohlraumstrahlung ist eine Oszillatorstrahlung von den Wänden des Hohlraums, die mit dem (durch die Maxwell’schen Gleichungen beschriebenen) Strahlungsfeld im Hohlraum im Gleichgewicht steht. 2. Die Energie der Oszillatoren ist gequantelt gemäß En = nhν = nω (n = 0,1, 2, . . .) .
(20-27)
3. Die Oszillatoren strahlen nur bei Änderung ihres Energiezustandes, z. B. für Δn = 1. Dabei wird die Energie in Quanten der Größe ΔE = hν
(20-28)
in das Strahlungsfeld emittiert oder aus dem Strahlungsfeld absorbiert.
(20-26)
Entsprechendes ergibt sich für die spezifische spektrale Ausstrahlung, d. h., wegen α(λ) < 1 ist die Ausstrahlung Mλ bzw. die Strahldichte Lλ von nichtschwarzen Körpern stets kleiner als die Ausstrahlung Mλs bzw. die Strahldichte Lλs des schwarzen Körpers bei gleicher Wellenlänge und Temperatur. Sehr genaue Messungen der Hohlraumstrahlung (Lummer, Pringsheim, 1899) zeigten, dass seinerzeit existierende theoretische Ansätze nicht bestätigt werden konnten: Die sog. Wien’sche Strahlungsformel (1896) erwies sich für kleine λ als richtig,
Bild 20-4. Spezifische spektrale Ausstrahlung eines schwar-
zen Körpers bei T = 3000 K nach Messungen von Lummer und Pringsheim, die sich mit der Planck’schen Strahlungsformel decken, sowie nach der Wien’schen und der Rayleigh-Jeans’schen Strahlungsformel
B247
B248
B Physik
dMλs /dλ = 0 das Wien’sche Verschiebungsgesetz λmax T = b
Bild 20-5. Strahlungsisothermen des schwarzen Körpers berechnet nach der Planck’schen Strahlungsformel
Die Annahmen 2 und 3 sind aus der klassischen Physik nicht begründbar: Beginn der Quantentheorie. Anmerkung: Nach der heutigen Quantenmechanik ergibt sich genauer (5-30) anstelle von (20-27). h ist das Planck’sche Wirkungsquantum (vgl. 5.2.2 u. 25.3). Für die zeit- und flächenbezogen von einem schwarzen Strahler im Wellenlängenintervall dλ unpolarisiert in den Halbraum 2π emittierte Energie (spezifische spektrale Ausstrahlung in den Halbraum) ergibt sich mithilfe der Planck’schen Annahmen (ohne Ableitung, Bild 20-5) das Planck’sche Strahlungsgesetz Mλs dλ = πLλs dλ
(20-29)
2hc2 dλ , = π 50 · exp (hc0 /λkT ) − 1 λ bzw. mit |dλ/dν| = c0 /ν2 Mνs dν = πLνs dν =π
dν 2hν3 . · c20 exp (hν/kT ) − 1 (20-30)
Das Wien’sche Strahlungsgesetz ergibt sich daraus als Grenzfall des Planck’schen Strahlungsgesetzes (20-29) bzw. (20-30) für kleine Wellenlängen, das Rayleigh-Jeans’sche Strahlungsgesetz als Grenzfall für große Wellenlängen (Bild 20-4). Bild 20-5 zeigt, dass das Maximum der spektralen Ausstrahlung eines schwarzen Strahlers sich mit steigender Temperatur zu kürzeren Wellenlängen verschiebt. Aus (20-29) folgt durch Bildung von
(20-31)
mit b = 2897,7685 μm·K: Wien-Konstante. Beispiel: Die Oberflächentemperatur der Sonne beträgt ca. 6000 K. Daraus folgt ein Strahlungsmaximum bei λmax ≈ 500 nm, dem die Empfindlichkeitskurve des menschlichen Auges optimal angepasst ist (siehe 20.1). Glühlampen haben dagegen Temperaturen T 3000 K, ihr Strahlungsmaximum demnach bei λmax ≈ 1 μm. Der größte Teil der elektrischen Energie zum Betreiben von Glühlampen geht daher als Infrarot-, d. h. als Wärmestrahlung verloren (Bild 20-5). Durch Integration des Planck’schen Strahlungsgesetzes (20-29) über alle Wellenlängen erhält man die spezifische Ausstrahlung des schwarzen Körpers in den Halbraum "∞ Ms = Mλs dλ = σT 4 . (20-32) 0
Das ist das Stefan-Boltzmann’sche Gesetz mit der Stefan-Boltzmann-Konstante σ=
2π5 k4 π2 k 4 = 15c20 h3 60c20 3
= 5,670400 · 10−8 W/ m2 · K4 .
(20-33)
Die insgesamt von der Fläche A1 eines schwarzen Strahlers der Temperatur T 1 abgegebene Ausstrahlung (Strahlungsleistung) beträgt mit (20-15) unter Berücksichtigung der Zustrahlung durch eine Umgebung der Temperatur T 2 ΔΦs = σA1 T 41 − T 42 . (20-34) Nichtschwarze Körper strahlen nach (20-26) geringer, da ihr Absorptionsgrad α < 1 ist: (20-35) ΔΦ = ασA1 T 41 − T 42 (Strahlungsleistung eines Körpers). Fotometrie
Zusätzlich zu den auf der Strahlungsenergie aufbauenden Größen wie der Strahlungsleistung, der Strahlstärke oder der Bestrahlungsstärke, werden für ingenieurwissenschaftliche Zwecke solche Größen
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
Lichtstroms Φv , der fotometrischen Größe, die der Strahlungsleistung Φe (11) entspricht, muss das Produkt aus der spektralen Strahlungsleistung und der Hellempfindlichkeitskurve über den sichtbaren Spektralbereich integriert werden: 780 " nm
Φv = Km
Φe,λ (λ) V
(λ) dλ ,
(20-35b)
380 nm
SI-Einheit: [Φv ] = cd · sr = lm (Lumen) . Bild 20-5 a. Spektrale Empfindlichkeit des helladaptierten
Auges (photopisches Sehen), gemittelt über viele Testpersonen (V(λ)-Kurve)
benötigt, die die Lichtwahrnehmung des menschlichen Auges berücksichtigen (fotometrische Größen). Evolutionsbedingt hat das menschliche Auge bei Tageslicht eine spektrale Empfindlichkeit entwickelt, dessen Maximum etwa bei einer Wellenlänge von 555 nm liegt und zu größeren und kleineren Wellenlängen hin stark abnimmt. Die auf empirischen Messungen an vielen Testpersonen basierende normierte Hellempfindlichkeitskurve V(λ) bei Tageslicht (photopischer Bereich) ist in DIN 5031 festgelegt (Bild 20-5a). Ebenso festgelegt sind Empfindlichkeiten für das Dämmerungs- und Nachtsehen: skotopisches Sehen. Die folgenden Ausführungen beziehen sich auf den photopischen Bereich. Die fotometrische SI-Basiseinheit (siehe 1.3) ist das Candela (cd) für die Lichtstärke, deren Definition gerade beim Maximum der Hellempfindlichkeitskurve erfolgt mit V(555 nm) = 1. (Eine haushaltsübliche Kerze hat eine Lichtstärke von etwa 1 cd, eine 60 W-Glühlampe von 70 cd.) Soll nun eine Strahlstärke Ie (12) in die entsprechende Lichtstärke Iv umgerechnet werden (der Index e kennzeichnet die energetischen Größen, v die visuellen bzw. fotometrischen), so muss das Produkt aus der spektralen Strahlstärke Ie,λ und der Hellempfindlichkeitskurve über den sichtbaren Spektralbereich integriert werden: 780 " nm
Iv = Km
Ie,λ (λ) V (λ) dλ .
(20-35a)
380 nm
Hierin ist Km = 683 cd · sr/W bzw. lm/W das fotometrische Strahlungsäquivalent. Zur Bestimmung des
(Ein Videoprojektor liefert z.B. einen Lichtstrom von 1000 lm, etwa vergleichbar mit dem einer 70 W-Glühlampe.) Die fotometrische Entsprechung der Strahldichte Le (14) ist die Leuchtdichte Lv , die die vom Menschen wahrgenommene Helligkeit einer strahlenden Fläche angibt. Ihre Einheit ist cd/m2 . Von technischer Bedeutung ist auch die Beleuchtungsstärke Ev , die fotometrische Entsprechung der Bestrahlungsstärke Ee (20-18). Während die Leuchtdichte eine strahlende Fläche beschreibt (Strahlergröße), dient die Bestrahlungsstärke der Charakterisierung einer bestrahlten Fläche (Empfängergröße). Wie bei (20-18) ergibt sich die Beleuchtungsstärke als Quotient aus dem Lichtstrom Φv und der bestrahlten Fläche unter Berücksichtigung des Winkels zur Flächennormalen. Die Einheit der Beleuchtungsstärke ist lx (Lux) mit lx = lm/m2 . (Sommerliches Sonnenlicht erzeugt eine Beleuchtungsstärke von etwa 70 · 103 lx, eine als angenehm empfundene Beleuchtungsstärke für Büroarbeitsplätze ist 500 lx.)
20.3 Quantisierung des Lichtes, Photonen Die Strahlungsverteilung des schwarzen Körpers (Hohlraumstrahlers) konnte nach Planck nur erklärt werden durch die Quantisierung der Energie der Hertz’schen Oszillatoren auf der Hohlraumwandung, sodass die Emission und Absorption von Licht nur in Energiemengen einer Mindestgröße ΔE = hν = ω erfolgen kann (vgl. 20.2). Das legt die Vermutung nahe, dass das Wellenfeld des von einer Lichtquelle ausgestrahlten Lichtes selbst im Ausbreitungsraum nicht kontinuierlich verteilt ist, sondern sich in diskreten „Portionen“, Quanten genannt, ausbreitet: Lichtquanten oder Photonen, die als räumlich begrenztes Wellenpaket, z. B. wie in Bild 18-6, darstellbar sind (18-26). Damit bekommt das elektromagnetische
B249
B250
B Physik
Wellenfeld auch Teilcheneigenschaften in Form der Lichtquanten, die räumlich begrenzt sind und denen Energie, Impuls und Drehimpuls zugeschrieben werden können (Einsteins Lichtquantentheorie, 1905).
lässt sich berechnen, indem dem Photon über die Einstein’sche Masse-Energie-Beziehung (4-42) eine Masse mγ zugeordnet wird: E = hν = mγ c20 . Mit ν = c0 /λ ergibt sich die Photonenmasse mγ =
Photonenenergie
Zur Erklärung des lichtelektrischen Effektes (Fotoeffekt, siehe 16.7) hatte Einstein angenommen, dass das Licht einen Strom von Lichtquanten (Photonen) der Energie E = hν = ω
(20-36)
darstellt (h = 6,626 . . . · 10−34 Js: Planck’sches Wirkungsquantum; = h/2π = 1,0545 . . . · 10−34 Js). Für die Frequenz ν bzw. ω kann dabei die Mittenfrequenz des Frequenzspektrums der Wellenpakete (Bild 18-5) angesetzt werden. Dieselbe Annahme lieferte auch die Erklärung für einige andere hier bereits behandelte Phänomene, wie z. B. für die Frequenzgrenze bei der Fotoleitung in Halbleitern (16-60), oder für die kurzwellige Grenze des Röntgen-Bremsspektrums (19-37, Bild 19-9). In Bild 20-6 sind die diesen Erscheinungen zu Grunde liegenden energetischen Effekte zusammengestellt. Photonenimpuls
Strahlungsquanten (Photonen) transportieren neben ihrer Energie E = hν auch einen Impuls pγ . Er
hν h . = 2 c0 λ c0
(20-37)
Daraus folgt der Impuls eines Photons durch Multiplikation mit der Ausbreitungsgeschwindigkeit c0 : h . (20-38) λ Da das Photon der Masse mγ sich mit Lichtgeschwindigkeit bewegt, ist die relativistische Massenbeziehung (4-35) anzuwenden. Mit (20-37) und υ = c0 erhält man dann für die Ruhemasse mγ0 des Photons 8 c2 hν mγ0 = 2 1 − 02 = 0 . (20-39) c0 c0 p γ = mγ c 0 =
Das Photon hat also die Ruhemasse null, es ist im Ruhezustand nicht existent. Mithilfe des Photonenimpulses pγ lässt sich der Strahlungsdruck des Lichtes prd sehr einfach berechnen. Dazu wenden wir die Beziehung (6-48) über den durch die elastische Reflexion eines gerichteten Teilchenstromes auf eine Wand ausgeübten Druck p = 2nmυ2 cos2 ϑ auf einen Photonenstrom der Teilchendichte n an, der an einer Spiegelfläche vollständig reflektiert wird. Mit (20-36), (20-37) und υ = c0 folgt prd = 2n
hν 2 c cos2 ϑ = 2nhν cos2 ϑ . c20 0
(20-40)
nhv ist jedoch gerade die räumliche Energiedichte des Photonenstromes, dem entspricht im klassischen Bild der elektromagnetischen Welle die Energiedichte w (19-16). Bei senkrechtem Einfall (ϑ = 0) beträgt daher der Lichtdruck auf eine vollständig reflektierende Fläche |S| (20-41) prd = 2w = 2 , c0 auf eine vollständig absorbierende Fläche dagegen Bild 20-6. Zur Deutung von Fotoeffekt, Fotoleitung und
Röntgen-Bremsstrahlung durch die Lichtquantenhypothese (Φ Austrittsarbeit; ΔE = Eg Energielücke zwischen Valenzband VB und Leitungsband LB eines Halbleiters)
prd = w =
|S| , c0
(20-42)
S: Poynting-Vektor (19-18). Bei einer vollständig absorbierenden Fläche wird nicht der doppelte, sondern
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
nur der einfache Photonenimpuls auf die Fläche übertragen, dadurch halbiert sich der Strahlungsdruck. Bei diffuser Beleuchtung gilt eine Betrachtung analog zu (8-6) und (8-7), die statt 2 und 1 die Faktoren 2/3 und 1/3 für reflektierende bzw. absorbierende Flächen ergibt. Das Photon, dem wir nun eine Energie E = hν und einen Impuls pγ = h/λ zuschreiben, also typische Teilcheneigenschaften, zeigt diese noch deutlicher beim Stoß mit klassischen Teilchen, z. B. freien Elektronen. Dabei gelten Energie- und Impulssatz in gleicher Weise wie beim Stoß zwischen klassischen Teilchen (vgl. 6.3.2, Bild 6-13): Compton-Effekt (1923). Lässt man monochromatische Röntgenstrahlung der Frequenz ν und der Wellenlänge λ an einem Körper streuen, der quasifreie Elektronen enthält (z. B. aus Graphit), so wird in der Streustrahlung neben einem Anteil mit derselben Frequenz ν ein weiterer Anteil mit niedrigerer Frequenz ν bzw. größerer Wellenlänge λ beobachtet (Bild 20-7). Während die Streustrahlung mit derselben Frequenz durch Dipolstrahlung der durch die einfallende Welle zu Schwingungen angeregten gebundenen Elektronen zustande kommt, lässt sich der frequenz- bzw. wellenlängenverschobene Anteil nur durch nichtzentralen, elastischen Stoß (siehe 6.3.2) zwischen den einfallenden Röntgenquanten und freien Elektronen quantitativ erklären, wenn für die Röntgenquanten Energie und Impuls gemäß (20-36) bzw. (20-38) angesetzt werden.
Unter der Annahme, dass das gestoßene Elektron ursprünglich in Ruhe ist, liefert der Energiesatz mit der relativistischen kinetischen Energie (4-38) und mit (20-36) hν = Ek + hν = (me − me0 ) c20 + hν .
(20-43)
Mit dem relativistischen Zusammenhang zwischen Gesamtenergie und Impuls eines Teilchens (4-45) erhält man durch Eliminierung von me c20 für den Impuls pe = me υ des Elektrons nach dem Stoß 1 p2e = 2 (hν − hν )2 + 2(hν − hν )me0 c20 . (20-44) c0 Der Impulssatz liefert für die beiden zueinander senkrechten Impulsanteile (Bild 20-7) hν hν = me v cos γ + cos ϑ , c0 c0 (20-45) hν y-Komponente: 0 = −me v sin γ + sin ϑ . c0 (20-46) x-Komponente:
Durch Eliminierung von γ folgt hieraus für den Impuls des Elektrons p2e =
1 2 2 [h ν + h2 ν2 − 2h2 νν cos ϑ] . c20
(20-47)
Gleichsetzung von (20-44) und (20-47) liefert schließlich für die Wellenlängenänderung bei Compton-Streuung in Übereinstimmung mit der experimentellen Beobachtung (Index 0 bei der Ruhemasse des Elektrons ab jetzt wieder weggelassen): λ − λ =
h (1 − cos ϑ) , me c 0
(20-48)
mit der Compton-Wellenlänge des Elektrons: λC, e =
Bild 20-7. a Compton-Streuung und b zugehöriges Impuls-
diagramm
h = 2,42631 . . . · 10−12 m . me c 0
(20-49)
Die Wellenlängenverschiebung ist danach am größten für 180◦ -Streuung und verschwindet für ϑ = 0◦ . Die Compton-Streuung ist ein wichtiger Energieverlustprozess von elektromagnetischer Strahlung höherer Energie in Materie. Anmerkungen: Der klassische Ausdruck für die kinetische Energie Ek = mv2 /2 in (20-43) liefert das Ergebnis (20-48) nur näherungsweise.
B251
B252
B Physik
Das zur Compton-Wellenlänge gehörige Lichtquant hat nach (20-37) gerade die Masse des ruhenden Elektrons. Ein weiterer Effekt des Impulses von elektromagnetischen Strahlungsquanten lässt sich bei der γ-Emission von Atomkernen (vgl. 17.3) beobachten. Ist Eγ = hν die Energie des emittierten γ-Quants, so beträgt nach (20-37) und (20-38) sein Impuls pγ = Eγ /c0 = −pN , worin pN der nach dem Impulssatz dem Kern übertragene Rückstoßimpuls ist. Das bedeutet einen Energieübertrag an den Kern, die Rückstoßenergie ΔEγ =
Eγ2 p2N = , 2mN 2mN c20
(20-50)
die der Energie des γ-Quants entnommen wird. Bei der 14,4-keV-γ-Linie des Eisennuklids 57 Fe beträgt die Rückstoßenergie ΔEγ ≈ 2·10−3 eV und die relative „Verstimmung“desγ-QuantsΔEγ/Eγ =Δν/ν ≈ 10−7 . Die Energieniveaus der Atomkerne haben jedoch eine außerordentliche Schärfe, in diesem Falle eine relative Breite von ΔE/Eγ = 3 · 10−13 ! Das bedeutet, dass die durch die abgegebene Rückstoßenergie „verstimmten“ γ-Quanten nicht mehr von anderen 57 Fe-Kernen absorbiert werden können. Baut man die 57 Fe-Atome jedoch in einen Kristall ein, so besteht eine gewisse Wahrscheinlichkeit dafür (besonders bei tiefen Temperaturen), dass der Rückstoß nicht vom emittierenden Atom, sondern vom ganzen Kristall aufgenommen wird (Mößbauer-Effekt, 1958). In (20-50) ist dann statt mN die um einen Faktor von ca. 1023 größere Kristallmasse einzusetzen, womit die Rückstoßenergie praktisch vernachlässigbar wird und das rückstoßfreie γ-Quant von anderen (ähnlich eingebauten) 57 Fe-Atomen nunmehr absorbiert werden kann: rückstoßfreie Resonanzabsorption. Wegen der außerordentlichen Resonanzschärfe rückstoßfreier γ-Quanten können mit dem MößbauerEffekt kleinste Energie- bzw. Frequenzänderungen gemessen werden, z. B. die Frequenzänderung durch den Doppler-Effekt (18-49) bei einer Relativgeschwindigkeit zwischen γ-Strahler und Absorber von nur wenigen mm/s. Auf diese Weise gelang es auch, die nach dem Einstein’schen Äquivalenzprinzip (allgemeines Relativitätsprinzip, siehe 3.4) zu erwartende, äußerst geringe Frequenzänderung von γ-Quanten durch den Energiegewinn oder -verlust beim Durchlaufen einer vertikalen Strecke im Erdfeld zu messen.
Photonendrehimpuls
Licht kann in verschiedener Weise polarisiert sein (siehe 21.2), z. B. linear (der elektrische Vektor schwingt in einer Ebene, Bild 19-3) oder zirkular (der elektrische Vektor rotiert um die Ausbreitungsrichtung, seine Spitze beschreibt eine Schraubenbahn). Zirkular polarisiertes Licht ist mit einem Drehimpuls verknüpft, der sich experimentell durch Absorption zirkular polarisierten Lichtes durch eine schwarze Scheibe nachweisen lässt, die in ihrem Schwerpunkt an einem Torsionsfaden drehbar aufgehängt ist: Die Scheibe übernimmt den Drehimpuls des absorbierten Lichtes (Beth, 1936). Statt der geschwärzten Scheibe kann auch ein Glimmerblättchen verwendet werden, das als λ/4-Blättchen wirkt und zirkular polarisiertes in linear polarisiertes Licht umwandelt. Die quantitative Messung ergibt die Größenordnung von für den Drehimpuls (Spin) des Photons. Der genaue Wert für den Photonendrehimpuls ergibt sich aus spektroskopischen Beobachtungen (siehe 20.4). Hier ist der Spin des emittierten oder absorbierten Photons zur Drehimpulserhaltung bei Übergängen zwischen zwei Energieniveaus eines Atoms zwingend notwendig, da sich bei solchen Übergängen i. Allg. der Drehimpuls des Atoms um ändert. Für die Orientierung des Spins der Photonen gilt: Rechtszirkular polarisiertes Licht: Photonenspin parallel zur Ausbreitungsrichtung, linkszirkular polarisiertes Licht: Photonenspin antiparallel zur Ausbreitungsrichtung. Linear polarisiertes Licht: Gleich viele Photonenspins in beiden Richtungen. Elektromagnetische Strahlungsquanten verhalten sich also wie Teilchen mit Energie, Impuls und Drehimpuls, wobei sich der Teilchencharakter der Photonen mit steigender Frequenz, d. h. mit steigender Energie zunehmend deutlicher bemerkbar macht.
20.4 Stationäre Energiezustände, Spektroskopie Die theoretische Beschreibung der Hohlraumstrahlung (Planck, 1900) erzwang die Annahme von quantisierten Oszillatoren, die nur diskrete (stationäre) Energiezustände annehmen und elektromagnetische Strahlung nur „portionsweise“ entsprechend den Energiedifferenzen der stationären Zustände emittieren oder absorbieren können (vgl. 20.2). Zur
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
Bild 20-9. Übergangsmechanismen zwischen Energieniveaus in Atomen (zur induzierten Emission vgl. 20.5)
Bild 20-8. Franck-Hertz-Versuch: Anregung eines diskre-
ten Energiezustandes in Quecksilberatomen durch Elektronenstoß
Erklärung des Fotoeffektes (siehe 16.7) wurde in Weiterführung dieser Vorstellung angenommen, dass das Licht selbst quantisiert ist: Lichtquantenhypothese (Einstein, 1905), später durch den Compton-Effekt (1923) untermauert (20.3). Zur Beschreibung der diskreten Emissions- und Absorptionslinien in den Spektren von Gasatomen wurde schließlich das Bohr’sche Atommodell formuliert (1913; siehe 16.1), dessen Kernstück die Annahme diskreter, nichtstrahlender Energiezustände im Atom ist. Mithilfe der Drehimpulsquantelung (16-7) ließen sich die Energiezustände des H-Atoms mit großer Genauigkeit berechnen (16-10). Ein sehr direkter Nachweis für die Existenz diskreter Energiezustände von Atomen ist der Franck-Hertz-Versuch (1914). Hierbei werden Elektronen zwischen einer Glühkathode und einer Gitterelektrode durch eine Spannung U beschleunigt und gelangen durch das Gitter hindurch auf eine Auffangelektrode. Im Vakuumgefäß dieser Elektrodenanordnung befindet sich Quecksilberdampf (Bild 20-8). Die Auffangelektrode wird schwach negativ gegen das positive Gitter vorgespannt. Mit steigender Spannung U steigt zunächst der Auffängerstrom I entsprechend der Kennlinie der Vakuumdiode (Bild 16-34b) an. Bei U = 4,9 V geht I jedoch sehr stark zurück, um bei weiterer Spannungserhöhung wieder anzusteigen. Dieselbe Erscheinung wiederholt sich bei 9,8 V, 14,7 V usw. ΔE = 4,9 eV
entspricht der Quantenenergie E = hν der ultravioletten Quecksilberlinie der Wellenlänge λ = 253,7 nm. Die Deutung erfolgt durch die Annahme zweier um ΔE = 4,9 eV differierender Energiezustände im Hg-Atom: Wenn die Energie der Elektronen diesen Wert erreicht hat, können sie die Hg-Atome anregen, verlieren durch diesen unelastischen Stoß die Anregungsenergie und können dann zunächst nicht mehr die Gegenspannung des Auffängers überwinden. Dasselbe wiederholt sich bei entsprechend höheren Beschleunigungsspannungen U nach zweifacher, dreifacher usw. Stoßanregung. Durch Stoßanregung wird also ein Übergang von einem niedrigen Energiezustand E1 zu einem höheren Zustand E2 bewirkt (Bild 20-9a). Dieselbe Anregung kann auch durch Absorption eines Lichtquants passender Energie E = hν = ΔE = E2 − E1 bewirkt werden (Bild 20-9b). Der angeregte Zustand E2 geht meist innerhalb sehr kurzer Zeit (ca. 10−8 s) wieder in den Grundzustand E1 über, wobei entsprechend der Bohr’schen Frequenzbedingung gewöhnlich ein Lichtquant der Energie E = hν = ΔE = E2 − E1
(20-51)
emittiert wird: Spontane Emission (Bild 20-9c; vgl. 16.1). Die Wechselwirkung zwischen dem elektromagnetischen Strahlungsfeld und einem Atom kann in folgender Weise zusammengefasst werden: Der Übergang zwischen zwei Energieniveaus E1 und E2 eines Atoms kann durch Absorption oder Emission eines Photons der Energie E = hν = ΔE = E2 − E1 erfolgen.
B253
B254
B Physik
In diesem Bild entsprechen die Frequenzen der Emissionslinien denjenigen der Absorptionslinien, da es sich jeweils um Übergänge zwischen den gleichen Energieniveaus handelt. Rückstoßeffekte brauchen bei den Übergangsenergien in der Elektronenhülle (anders als bei den Kernniveaus, vgl. 20.3) im Normalfall nicht berücksichtigt zu werden, da die Rückstoßenergien klein gegen die energetischen Linienbreiten sind. Insoweit kommt das Bohr’sche Bild zum gleichen Ergebnis wie die klassische Vorstellung des Atoms als Resonanzsystem (vgl. 20.1). Für das Wasserstoffatom erhält man aus den Energietermen (16-10) mit der Bohr’schen Frequenzbedingung (20-51) die Frequenzen des Wasserstoffspektrums: 1 Em − En 1 = Rν 2 − 2 ν= (20-52) h n m mit der Rydberg-Frequenz Rν =
me e 4 = 3,289842 · 1015 s−1 . 8ε20 h3
(20-53)
n und m sind die Haupt-Quantenzahlen (vgl. 16.1) des unteren und des oberen Energieniveaus, zwischen denen der Übergang stattfindet. Die Linien, die zu einer vorgegebenen unteren Quantenzahl n gehören, wobei m die Werte n + 1, . . . , ∞ durchlaufen kann, bilden Serien: Lyman- (n = 1), Balmer- (n = 2), Paschen(n = 3), Brackett- (n = 4), Pfund-Serie (n = 5) usw. (Bild 20-10). Jeder Differenz zweier Energieterme m, n entspricht demnach eine definierte Spektrallinie (Ritz’sches Kombinationsprinzip).
Bild 20-10. Termschema des Wasserstoff-Atoms mit einge-
zeichneten Serienübergängen
Bild 20-11. Verschiedene Arten der Spektroskopie
Bei Anregung mit Photonenenergien hν > E∞ − En = Ei (Ionisierungsenergie) findet Ionisierung (Fotoeffekt) statt, d. h., ein Elektron aus dem Niveau n wird völlig aus dem Atomverband gelöst. Die Überschussenergie Ek = hν − Ei nimmt das Elektron als kinetische Energie mit. Da Ek nicht quantisiert ist, schließt sich an die Seriengrenzen des Absorptionsspektrums jeweils ein Grenzkontinuum an. Die experimentelle Bestimmung der Übergangsenergien und damit die Bestimmung der relativen energetischen Lage der Energieniveaus der Atome erfolgt mittels verschiedener Formen der Spektroskopie (Bild 20-11), wobei für die jeweilige Strahlung geeignete Dispersionselemente (Spektrometer) die Strahlung nach der Wechselwirkung mit dem Untersuchungsobjekt (meist in Gasform) örtlich nach Frequenzen oder Energieverlusten zerlegen: Spektrum. Bei Atomen mittlerer und höherer Ordnungszahlen Z sind die Anregungsenergien innerer Elektronen bereits so groß, dass sie in das Röntgengebiet fallen. Charakteristische Röntgenstrahlung tritt daher neben der Bremsstrahlung (Bild 19-9) bei Anregung von Elektronen in inneren Schalen durch Stoß mit hochenergetischen Elektronen auf, wenn
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
Bild 20-12. Anregung charakteristischer Röntgenlinien durch Elektronenstoß. a Vorgänge im Termschema: 1: Eingeschossenes Elektron höherer Energie; 2: Stoßanregung eines Elektrons einer inneren Schale; 3: Auffüllung der entstandenen Lücke durch ein Elektron einer höheren Schale; dabei 4: Emission eines Röntgenquants; b Röntgenspektrum
der dadurch freigewordene Platz der inneren Schale durch ein Elektron aus einer weiter außen liegenden Schale aufgefüllt wird (Bild 20-12). Das dabei emittierte Röntgenquant ergibt eine scharfe, für das Material charakteristische Röntgenlinie, die dem Bremsspektrum überlagert ist (Bild 20-12). Die Röntgenlinien innerer Schalen sind auch bei Atomen im Festkörperverband scharfe Linien, da die Kopplung mit den Nachbaratomen wegen der Abschirmung durch die besetzten äußeren Schalen gering und die dementsprechende Niveauaufspaltung (vgl. Bild 16-5) klein ist. Charakteristische Röntgenlinien können zur Analyse chemischer Elemente genutzt werden: Röntgenspektroskopie. Die Anregung charakteristischer Röntgenlinien kann auch durch ein kontinuierliches Röntgenspektrum erfolgen: Röntgenfluoreszenzanalyse.
20.5 Induzierte Emission, Laser Als Übergangsmöglichkeiten zwischen zwei Energieniveaus E1 und E2 eines Atoms wurden bisher neben der Stoßanregung die Anregung des Atoms durch Absorption von Photonen aus einem elektromagnetischen Strahlungsfeld und der Übergang aus dem angeregten in den unteren Energiezustand durch spontane Emission von Photonen betrachtet (Bild 20-9a,b,c). Für eine einfache Herleitung des Planck’schen Strahlungsgesetzes (20-29) bzw. (20-30) hat Einstein (1917) einen weiteren Übergangsprozess
angenommen: Erzwungene oder stimulierte oder induzierte Emission. Diese stellt die Umkehrung der Absorption aus dem elektromagnetischen Strahlungsfeld dar: Ein angeregtes, d. h. im Zustand E2 befindliches Atom kann durch ein Strahlungsfeld aus Lichtquanten der Energie E = hν = ΔE zur induzierten Emission eines Lichtquants hν = ΔE zum Zeitpunkt der Wechselwirkung mit dem Strahlungsfeld veranlasst werden, wobei das Atom in den unteren Zustand E1 übergeht (Bild 20-9d). In einem System von N Atomen wird die Wahrscheinlichkeit der Übergänge der Zahl der Atome im jeweiligen Ausgangszustand (E1 oder E2 ) proportional sein. Außerdem wird die Übergangswahrscheinlichkeit bei der Absorption und der induzierten Emission der Energiedichte w des elektromagnetischen Feldes (19-16) proportional sein. Sind N1 Atome im Energiezustand E1 und N2 Atome im Energiezustand E2 , so ergibt sich die Zahl dZ der Übergänge in der Zeit dt für dZabs = B w N1 dt
Absorption:
spontane Emission: dZem, sp = A N2 dt
(20-54)
induzierte Emission: dZem, ind = B w N2 dt A, B sind die die Übergangswahrscheinlichkeit bestimmenden Einstein-Koeffizienten, wobei angenommen ist, dass die durch das elektromagnetische Feld der Energiedichte w hervorgerufenen Übergänge in beiden Richtungen gleich wahrscheinlich sind. Im Strahlungsgleichgewicht des Hohlraumstrahlers (vgl. 20.2) muss die Bilanz gelten: dZem, sp + dZem, ind = dZabs .
(20-55)
Durch Einsetzen von (20-54) erhält man w=
1 A · . B N1 /N2 − 1
(20-56)
Das Verhältnis der Besetzungsdichten N2 /N1 regelt sich im thermischen Gleichgewicht nach der Boltzmann-Statistik (20-8-20-40): −ΔE hν N2 = e− kT = e− kT . N1
(20-57)
Zwischen der auf den Raumwinkel 1 bezogenen Strahldichte L und der Energiedichte w besteht der
B255
B256
B Physik
Da die Einstein-Koeffizienten A die spontane Emission und B die induzierte Emission beschreiben, folgt daraus, dass die spontane Emission gegenüber der induzierten mit ν3 ansteigt. Maser, Laser
Bild 20-13. Energetische Vorgänge beim Laserprozess: a Drei-Niveau-System (z. B. Rubin-Laser) und b Vier-Niveau-System (z. B. Nd-Glas- oder Nd-YAG-Laser (Neodym-dotierter Yttrium-Aluminium-Granat-Laser), Gaslaser)
Zusammenhang (ohne Herleitung) Lν =
c0 w, 4π
(20-58)
sodass für die spezifische Ausstrahlung Mνs = πLνs (20-16) eines schwarzen Körpers schließlich die Beziehung folgt Mνs =
1 A c0 , · · hν/kT B 4 e −1
(20-59)
die bereits die Form des Planck’schen Strahlungsgesetzes (20-30) hat. Hierin stammt die 1 im Nenner vom Anteil der induzierten Emission, der bei niedrigeren Frequenzen von Bedeutung ist, wo der Wellencharakter stärker hervortritt. Der Faktor A/B lässt sich durch Vergleich mit dem Rayleigh-Jeans’schen Strahlungsgesetz erhalten, das sich im Grenzfall niedriger Frequenzen ν durch Abzählung der möglichen stehenden Wellen in einem Hohlraum und Anwendung des Gleichverteilungssatzes (vgl. 8.3) gewinnen lässt: A 8πhν3 = . B c30
Bild 20-14. Elektronenstoßgepumpter Gaslaser
(20-60)
Es zeigt sich, dass die durch induzierte Emission erzeugten Photonen kohärent zu den Photonen sind, die den Übergang E2 → E1 angeregt haben, d. h., sie stimmen in Ausbreitungsrichtung, Schwingungsebene und Phase überein. Trifft daher ein Photon der Energie E = hν = ΔE = E2 − E1 nacheinander auf mehrere angeregte Atome im oberen Energiezustand E2 , so kann es durch nacheinander induzierte Emissionen entsprechend verstärkt werden (z. B. Bild 20-14). Da bei gleichen Besetzungszahlen die Absorption nach (20-54) genauso wahrscheinlich wie die induzierte Emission ist, muss zur Erreichung einer effektiven Verstärkung die Zahl N2 der Atome im oberen Niveau E2 größer sein als die Zahl N1 der Atome im unteren Niveau E1 : BesetzungszahlInversion N2 > N1 . Im thermischen Gleichgewicht ist das nach der Boltzmann-Statistik nicht der Fall, da die Besetzungszahlen sich nach (20-57) regeln. Eine Besetzungszahl-Inversion lässt sich nur durch ein System mit mindestens drei Niveaus (Bild 20-13) erreichen. Solche Systeme gestatten die kohärente Verstärkung von Mikrowellen (Maser, microwave amplification by stimulated emission of radiation, Townes u. a., 1954) oder Lichtwellen (Laser, light amplification by stimulated emission of radiation, Schawlow u. Townes, 1958; Maiman, 1960). Drei-Niveau-System
Eine Möglichkeit, eine Überbesetzung des oberen Niveaus E2 eines Laserüberganges zu erreichen, ist die Anregung von höheren Niveaus, hier in E3
20 Wechselwirkung elektromagnetischer Strahlung mit Materie
Bild 20-15. Optisch gepumpter Festkörperlaser
zusammengefasst dargestellt (Bild 20-13a), vom unteren Laserniveau E1 aus (Pumpvorgang) durch Elektronenstoßanregung (z. B. in einer Gasentladung, Bild 20-14) oder durch optische Pumpstrahlung (z. B. durch eine Blitzlampe, Bild 20-15). Dadurch kann eine Besetzungszahlangleichung zwischen E1 und E3 erreicht werden. Wenn für die Übergangszeiten τ31 τ32 gilt, gehen die Atome überwiegend durch spontane Emission oder durch strahlungslose Übergänge (Energieabgabe an das Gitter: Wärme) in das benachbarte Niveau E2 über. Bei langer Lebensdauer τ21 dieses Niveaus (metastabiles Niveau mit nur geringer spontaner Emission) und fortgesetztem Pumpen entsteht hier schließlich eine Überbesetzung oder Besetzungszahl-Inversion gegenüber dem Grundniveau E1 : N2 > N1 . Vier-Niveau-System
Sehr viel günstiger arbeitet das Vier-Niveau-System (Bild 20-13b). Hier ist das untere Laserniveau E1 nicht identisch mit dem Grundzustand E0 des Atoms. Ist der energetische Abstand E1 − E0 nicht zu klein, so ist im thermischen Gleichgewicht die Besetzungszahl N1 sehr klein. Ist ferner die Übergangszeit τ10 τ21 , so bleibt das Niveau E1 auch bei Übergängen E2 → E1 praktisch leer. Eine Überbesetzung von E2 gegenüber E1 durch den Pumpvorgang wird daher sehr leicht erreicht. Dem Aufbau der Überbesetzung von E2 gegenüber E1 wirkt die spontane Emission E2 → E1 entgegen. Da diese nach (20-60) mit ν3 ansteigt, ist das Erreichen einer Besetzungszahl-Inversion bei höheren Frequenzen entsprechend schwieriger. Laser-Anordnungen
In einem Medium, in dem durch einen geeigneten Pumpprozess eine Besetzungszahl-Inversion erzeugt
worden ist, etwa in einer Gasentladung eines geeigneten Helium-Neon-Gemisches (Bild 20-14), wird ein Lichtquant der Energie hν = ΔE, das z. B. durch spontane Emission eines angeregten Atoms entstanden ist, durch induzierte Emission weiterer angeregter Atome verstärkt. Jedoch beträgt die Verstärkung je Meter Länge nur wenige Prozent. Deshalb wird das verstärkte Licht durch parallele Spiegel, die einen optischen Resonator bilden, immer wieder durch das aktive Medium geschickt und weiter verstärkt. Sind die Verluste geringer als die Gesamtverstärkung, so hat diese Rückkopplung eine Selbsterregung zur Folge: Die Anordnung emittiert kohärentes, polarisiertes Licht, in dem die einzelnen Photonen phasengerecht mit gleicher Schwingungsebene gekoppelt sind. (Ein glühender Körper sendet dagegen völlig unkorrelierte Photonen mit statistisch wechselnden Schwingungsebenen aus: unpolarisiertes, natürliches Licht.) Die das Gasentladungsrohr abschließenden Glasplatten sind unter dem Brewster-Winkel (siehe 21.2) geneigt, um Reflexionsverluste zu vermeiden. Sie legen damit gleichzeitig die Polarisationsebene des vom Gaslaser emittierten Laserlichtes fest. Festkörperlaser (Bild 20-15) werden optisch gepumpt. Der lichtverstärkende Festkörper (z. B. Rubin, Neodymglas, Nd-YAG-Kristalle) wird beispielsweise in der einen Brennlinie eines elliptischen Spiegels (Pumplicht-Kavität) angeordnet, in dessen zweiter Brennlinie sich die Pumplichtquelle (Blitzlampe) befindet, sodass das von der Pumplichtquelle ausgehende Licht weitgehend in das aktive Medium überführt wird. Der Laserprozess kommt zum Erliegen, wenn die Besetzungsinversion abgebaut ist. Blitzlichtgepumpte Laser arbeiten daher im Pulsbetrieb, während kontinuierlich gepumpte Gaslaser im Dauerstrichbetrieb arbeiten können. Ein Laserlichtstrahl lässt sich mit einer optischen Linse (22.1) nahezu ideal fokussieren. Der Fokusfleckdurchmesser d ist im Wesentlichen durch die Beugung infolge der Strahlbegrenzung bestimmt (vgl. 23 u. 24) und ergibt sich in erster Näherung zu d≈
λf . D
(20-61)
(λ Wellenlänge des Laserlichtes, f Brennweite der Fokussierungslinse, D Durchmesser des Laser-
B257
B258
B Physik
strahls.) Es sind daher Fokusfleckdurchmesser in der Größenordnung der Wellenlänge erreichbar und dementsprechend extrem hohe Leistungsdichten (10 MW/μm2 und mehr) im Fokus. Bei Anwendungen des Lasers wird z. B. ausgenutzt: Extreme Leistungsdichte: nichtlineare Optik, Materialbearbeitung (Bohren, Schneiden, Härten); Fusionsexperimente. Hohe Kohärenz: kohärente Optik, Holographie (vgl. 24.2), Interferometrie (vgl. 23). Extrem kleine Divergenz: Entfernungsmessung über große Strecken, Satellitenvermessung, Vermessungswesen (z. B. Tunnelbau).
21 Reflexion und Brechung, Polarisation Zur Beschreibung des makroskopischen geometrischen Verlaufes der Ausbreitung elektromagnetischer Wellen (Licht) in Materie lassen sich zu den Wellenflächen (Flächen konstanter Phase, siehe 18.1) senkrechte (orthogonale) Linien verwenden: Lichtstrahlen (Bild 21-1). In isotropen Medien stimmen die Lichtstrahlen mit der Richtung des PoyntingVektors (19-18) überein und kennzeichnen den Weg der Lichtenergie im Raum. Satz von Malus: Die Orthogonalität zwischen Strahlen und Wellenflächen (Orthotomie) bleibt bei der Wellenausbreitung, d. h. auch bei Reflexion und Brechung, erhalten. Der Zeitabstand zwischen korrespondierenden Punkten zweier Wellenflächen ist gleich für alle Paare von korrespondierenden Punkten A und A , B und B , C und C usw. (Bild 21-1).
Bild 21-1. Strahlen und Wellenflächen stehen überall aufeinander senkrecht
Für viele Zwecke genügt es, die Lichtausbreitung anhand des Strahlenverlaufes zu betrachten (siehe 22 Geometrische Optik), insbesondere wenn die das Lichtwellenfeld begrenzenden Geometrien (Schirme, Blenden) Dimensionen besitzen, die groß gegen die Wellenlänge sind. Ein Kriterium hierfür ist die Fresnel-Zahl (siehe 23.1).
21.1 Reflexion, Brechung, Totalreflexion Unter Reflexion und Brechung von Licht versteht man die Ausbreitung von Lichtwellen in optisch inhomogener Materie, d. h. in Materie mit örtlich variabler Lichtgeschwindigkeit, insbesondere die Ausbreitung an Grenzflächen zwischen zwei (sonst homogenen) Materiegebieten verschiedener Lichtgeschwindigkeit. Hierüber existieren folgende Erfahrungsgesetze (Bild 21-2): Für die Reflexion von Lichtstrahlen an einer solchen Grenzfläche gilt das Reflexionsgesetz α = α .
(21-1)
Für die Brechung (Refraktion) von Lichtstrahlen beim Durchgang durch die Grenzfläche gilt (Snellius 1621) sin α = const · sin β .
(21-2)
Die Konstante setzt sich aus den optischen Materialeigenschaften beider Medien zusammen. Führt man für jedes Material eine eigene Konstante, die optische Brechzahl n ein, so folgt das Snellius’sche Brechungsgesetz n1 sin α = n2 sin β oder
(21-3)
sin α n2 = = const . sin β n1
Bild 21-2. Reflexion und Brechung von Licht an einer
Grenzfläche
21 Reflexion und Brechung, Polarisation
Für Vakuum wird gesetzt: n0 = 1 .
(21-4)
Die empirischen Gesetze der Reflexion und Brechung lassen sich mit dem Konzept der Wellenausbreitung, insbesondere des Huygens’schen Prinzips (siehe 23.1) verifizieren. Danach werden von jeder Wellenfläche (Phasenfläche) Kugelwellen (Elementarwellen) phasengleich angeregt, deren Überlagerung (tangierende Hüllfläche) eine neue Wellenfläche der ursprünglichen Welle ergibt. Wir betrachten eine ebene Welle, die unter dem Einfallswinkel α gegen das Einfallslot (Bild 21-3) auf eine Grenzfläche zwischen zwei Medien mit den Brechzahlen n1 und n2 sowie den Lichtgeschwindigkeiten c1 und c2 fällt. Die Phasenfläche AB löst beim weiteren Fortschreiten auf der Grenzfläche AB Elementarwellen sowohl im Medium 1 als auch im Medium 2 aus, die sich zu neuen ebenen Phasenflächen A B im Medium 1 bzw. A B im Medium 2 überlagern. Deren unterschiedliche Neigungen ergeben sich aus den unterschiedlich angenommenen Lichtgeschwindigkeiten c1 im Medium 1 bzw. c2 im Medium 2 (hier: c2 < c1 ). Nach dem Satz von Malus sind die Laufzeiten τ zwischen den korrespondierenden Phasenflächenpunkten A und A , B und B sowie A und A gleich. Geometrisch ergibt sich aus Bild 21-3: BB = c1 τ = AB sin α ,
AA = c1 τ = AB sin α , AA = c2 τ = AB sin β .
(21-5a) (21-5b) (21-5c)
Aus (21-5a) und (21-5b) folgt sin α = sin α und damit das Reflexionsgesetz (21-1). Für das Brechungsgesetz (21-3) ergibt sich aus (21-5a) und (21-5c) sin α n2 c1 = = = const , sin β n1 c2
c0 cn
an der Grenzfläche zweier Ausbreitungsmedien mit unterschiedlichen Brechzahlen n bzw. Lichtgeschwindigkeiten c
in Übereinstimmung mit (20-2). Im Normalfall ist n > 1 (Tabelle 21-1), d. h., die Lichtgeschwindigkeit cn in einem Stoff der Brechzahl n ist kleiner als die Vakuumlichtgeschwindigkeit, was durch Messungen der Lichtgeschwindigkeit in durchsichtigen Stoffen, z. B. von Foucault, bestätigt wurde. In Grenzfällen, z. B. bei Röntgenstrahlen, kann n geringfügig kleiner als 1 werden (siehe 20.1). Das bedeutet, dass die Phasengeschwindigkeit des Lichtes hier >c0 wird. In solchen Fällen bleibt jedoch, wie genauere Überlegungen zeigen, die Gruppengeschwindigkeit (siehe 18.1) und damit die Signalgeschwindigkeit stets kleiner als c0 . Wie aus der Betrachtung zur Brechung (Bild 21-3) erkennbar ist, ist für die Ausbreitung einer Lichtwelle in einer vorgegebenen Zeit τ nicht der geometrische Weg s allein maßgebend, sondern eine Größe ns, die bei gleichem Betrag von der Lichtwelle in gleicher Zeit durchlaufen wird. Man definiert daher als optische Weglänge "P n ds .
L=
(21-6)
(21-8)
P
d. h., die Brechzahlen verhalten sich umgekehrt wie die Lichtgeschwindigkeiten. Ist das Medium 1 Vakuum, d. h., n1 = 1, so gilt mit n2 = n sowie mit c1 = c0 (Vakuumlichtgeschwindigkeit) und c2 = cn für die Brechzahl n eines an Vakuum grenzenden Stoffes n=
Bild 21-3. Reflexion und Brechung einer ebenen Welle
(21-7)
Mithilfe der optischen Weglänge lassen sich Reflexions- und Brechungsgesetz auch aus einem Extremalprinzip gewinnen (hier nicht durchgeführt), das Fermat’sche Prinzip: "P L= n ds = Extremum . (21-9) P
B259
B260
B Physik
Das Licht verläuft zwischen zwei Punkten P und P so, dass die optische Weglänge einen Extremwert, meist ein Minimum, annimmt. In der Formulierung (vgl. A 32) lautet (21-9):
der
Variationsrechnung
"P "P "P ds = c0 δ dt = 0 . (21-10) δL = δ n ds = c0 δ cn P
P
P
Aus (21-10) folgt: Laufzeit und optische Länge der physikalisch realisierten Wege des Lichtes sind Minimalwerte. Das Fermat’sche Prinzip (1650) lässt sich als Grenzfall für λ → 0 aus der Wellengleichung (19-7) herleiten und kann auch in der Form der sog. Eikonalgleichung (grad L)2 = n2
Totalreflexion
Geht eine Lichtwelle aus einem Medium mit höherer Brechzahl n1 (optisch dichteres Medium) in ein Medium mit niedrigerer Brechzahl n2 < n1 (optisch dünneres Medium) über, so ist β > α und es lassen sich drei Fälle unterscheiden (Bild 21-4): 1. α = α1 < αc : Lichtstrahl 1 wird gemäß Brechungsgesetz (21-3) und Reflexionsgesetz (21-1) gebrochen und reflektiert. 2. α = αc : Lichtstrahl 2 verläuft nach der Brechung genau entlang der Grenzfläche: β = 90◦ . 3. α = α3 > αc : Lichtstrahl 3 kann nach dem Brechungsgesetz nicht mehr in das optisch dünnere Medium übertreten. Stattdessen wird das Licht an der Grenzfläche vollständig reflektiert: Totalreflexion. Der Grenzwinkel der Totalreflexion αc ergibt sich aus dem Brechungsgesetz (21-3) und mit β = π/2 gemäß sin αc =
(21-11)
n2 . n1
(21-12)
geschrieben werden. Die Eikonalgleichung stellt die Grundgleichung der geometrischen Optik (siehe 22) dar. Aus dem Fermat’schen Prinzip folgen unmittelbar die drei Grundsätze der geometrischen Optik:
Grenzt das Medium an das Vakuum (n2 = 1, n1 = n), so vereinfacht sich (21-12) zu
– Geradlinigkeit der Lichtstrahlen im homogenen Medium, – Umkehrbarkeit des Strahlenganges (in der zeitfreien Formulierung), – Eindeutigkeit und Unabhängigkeit der Lichtstrahlen.
Die Totalreflexion wird z. B. in den Umkehrprismen (Bild 21-5) ausgenutzt (Prismenferngläser, Rückstrahler). Von großer technischer Bedeutung für die Nachrichtentechnik (optische Signalübertragung) ist die Ausnutzung der Totalreflexion in dünnen Glasfasern, die bei einem Durchmesser von 10 bis 50 μm flexibel sind: Lichtleiterfasern (Bild 21-6). Das an einem Ende der Glasfaser eingekoppelte Licht wird durch vielfache Totalreflexion bis an das andere Ende geleitet. Das funktioniert (bei etwas einge-
Bild 21-4. Lichtübergang vom optisch dichteren in ein optisch dünneres Medium: Partielle Reflexion (1) und Totalreflexion (3)
sin αc =
1 . n
(21-13)
Bild 21-5. Totalreflexion im Umkehrprisma und im Rück-
strahler
21 Reflexion und Brechung, Polarisation
Tabelle 21-1. Brechzahlen einiger Stoffe für Licht bei den Wellenlängen wichtiger Fraunhofer’scher Linien
Stoff
Fraunhofer-Linie (Bezeichnung und Wellenlänge in nm): A (O) B (O) C (H) D (Na)a E (Fe) F (H) 760,8 686,7 656,3 589,3 527,0 486,1 Brechzahl n gegen Luft Wasser 1,3289 1,3304 1,3312 1,3330 1,3352 1,3371 Ethanol 1,3579 1,3593 1,3599 1,3617 1,3641 1,3662 Quarzglas 1,4544 1,4560 1,4568 1,4589 1,4614 1,4636 Benzol 1,4910 1,4945 1,4963 1,5013 1,5077 1,5134 Borkronglas BK1 1,5049 1,5067 1,5076 1,5100 1,5130 1,5157 Kanadabalsam 1,542 Steinsalz 1,5368 1,5393 1,5406 1,5443 1,5491 1,5533 Schwerkronglas SK1 1,6035 1,6058 1,6070 1,6102 1,6142 1,6178 Flintglas F3 1,6029 1,6064 1,6081 1,6128 1,6190 1,6246 Schwefelkohlenstoff 1,6088 1,6149 1,6182 1,6277 1,6405 1,6523 Diamant 2,4173 a D1 (Na): λD1 = 589,5932 nm; D2 (Na): λD2 = 588,9965 nm (→ λ¯ D = 589,29 nm)
schränktem Akzeptanzwinkel ϑm ) auch bei gekrümmten Lichtleiterfasern. Geordnete Bündel solcher Lichtleiterfasern leiten ein auf die eine Stirnfläche projiziertes Bild zur anderen Stirnfläche weiter: Glasfaseroptik (medizinische Anwendung: endoskopische Untersuchung des Körperinneren). Brechung am Prisma
Lichtstrahlen werden durch Prismen von der PrismenDachkante weggebrochen (Bild 21-7). Für kleine Dachwinkel γ und senkrechten Einfall auf die erste
G (Fe) 430,8
H (Ca) 396,8
1,3406 1,3703 1,4676 1,5243 1,5205
1,3435 1,3738 1,4709 1,5340 1,5246
1,5614 1,6244 1,6355 1,6765
1,5684 1,6300 1,6542 1,6994
Prismenfläche ergibt sich für den Ablenkwinkel δ aus dem Brechungsgesetz (21-3) näherungsweise δ ≈ γ(n − 1) .
(21-14)
Der Ablenkwinkel δ steigt also mit dem Dachwinkel γ und der Brechzahl n des Prismas an. Qualitativ gilt das auch für größere Dachwinkel und schrägen Einfall. Da die Brechzahl n(λ) eine Funktion der Wellenlänge ist (Dispersion, siehe 20.1 und Tabelle 21-1), wird bei normaler Dispersion kurzwellige Strahlung durch ein Prisma stärker gebrochen als langwellige Strahlung (Bild 21-8). Prismen können daher zur spektralen Analyse von Lichtstrahlung angewendet werden: Prismenspektrographen. Bei voller Ausleuchtung beträgt das spek-
Bild 21-6. Lichtleitung mittels Vielfach-Totalreflexion in
Glasfasern
Bild 21-7. Ablenkung eines Lichtstrahls durch ein Prisma
B261
B262
B Physik
Bild 21-8. Dispersion eines Prismas
trale Auflösungsvermögen (ohne Ableitung): dn λ =B . Δλ dλ
(21-15)
Das spektrale Auflösungsvermögen eines Prismas hängt nur von seiner Basislänge B und der Dispersion dn/dλ des Prismenmaterials, nicht aber vom Prismenwinkel γ ab.
21.2 Optische Polarisation Bei longitudinalen Wellen (z. B. Schallwellen) ist die Schwingungsrichtung mit der Ausbreitungsrichtung identisch (siehe 18.1 und 18.2) und damit eindeutig festgelegt. Bei transversalen Wellen (z. B. elektromagnetische Wellen) ist die Schwingungsrichtung senkrecht zur Ausbreitungsrichtung und muss zur eindeutigen Beschreibung zusätzlich angegeben werden. Eine Welle, die nur in einer, durch die Schwingungs- und die Ausbreitungsrichtung aufgespannten Ebene schwingt, heißt linear polarisiert. Bei elektromagnetischen Wellen (z. B. Licht) wird die Schwingungsebene des elektrischen Feldstärkevektors (vgl. Bild 19-3) als Schwingungsebene, die des magnetischen Feldstärkevektors als Polarisationsebene bezeichnet. Rotieren die Feldstärkevektoren während des Ausbreitungsvorganges um die Ausbreitungsrichtung, so handelt es sich um elliptisch oder zirkular polarisierte Wellen. Bei der Erzeugung elektromagnetischer Wellen durch einen Sendedipol (Bild 19-2) ist die Schwingungsebene durch die Orientierung des Sendedipols festgelegt. Zum Nachweis muss auch der Empfängerdipol in der gleichen Richtung orientiert sein. Die Beobachtung solcher Polarisationserscheinungen beweist daher die Transversalität des betreffenden Wellenvorganges. Die Beobachtung von Polarisationserscheinungen bei Licht ist dementsprechend ein Nachweis dafür, dass Licht ein transversaler Wellenvorgang ist.
Bild 21-9. Erzeugung und Nachweis linear polarisierten Lichtes aus natürlichem Licht mittels Polarisatoren
Die von den Atomen eines glühenden Körpers oder einer normalen Gasentladung (nicht beim Laser) emittierten Lichtquanten haben beliebige Schwingungsebenen. So entstehendes, natürliches Licht ist daher unpolarisiert: Alle Schwingungsebenen kommen gleichmäßig verteilt vor. Durch sog. Polarisatoren, die nur Licht mit einer bestimmten Schwingungsebene passieren lassen (siehe unten), kann aus natürlichem Licht linear polarisiertes Licht erzeugt werden. Durch einen weiteren Polarisator, den Analysator, können die Tatsache der Polarisation und die Lage der Polarisationsebene festgestellt werden (Bild 21-9). Beim schrägen Einfall einer elektromagnetischen Welle S auf eine ebene Grenzfläche zwischen zwei durchsichtigen Medien unterschiedlicher Brechzahlen n1 und n2 hängen sowohl der Reflexionsgrad
(= reflektierte Intensität / einfallende Strahlungsintensität) als auch der Transmissionsgrad τ (= Intensität der gebrochenen Welle / einfallende Strahlungsintensität) von der Lage der Schwingungsebene zur Einfallsebene ab. Reflexions- und Transmissionsgrad seien ⊥ und τ⊥ für eine einfallende Welle S⊥ , bei der der elektrische Feldstärkevektor E⊥ senkrecht zur Einfallsebene schwingt (d. h. parallel zur Grenzfläche), und und τ für eine einfallende Welle S , deren elektrischer Feldstärkevektor E in der Einfallsebene schwingt. Aufgrund des Huygens’schen Prinzips (siehe 21.1 und 23.1) sowie der Strahlungscharakteristik des Dipols (Bild 19-5) ist es anschaulich verständlich, dass die Anregung der Elementarwellen, die sich von der Grenzfläche ausgehend zum reflektierten Strahl überlagern, bevorzugt durch S⊥ erfolgt (E⊥ ⊥ Einfallsebene, d. h. Grenzfläche). Die Elemen-
21 Reflexion und Brechung, Polarisation
Grenzfläche zwischen den beiden Medien herleiten, und aus diesen wiederum Beziehungen für das Reflexionsvermögen = 1 − τ (durchsichtige Medien, Absorptionsgrad α = 0), die Fresnel’schen Formeln:
⊥ = 1 − τ⊥ =
= 1 − τ = Bild 21-10. Polarisation durch Reflexion unter dem
Brewster-Winkel α = αp
tarwellen, die durch S (E Einfallsebene) in der Grenzfläche angeregt werden, haben aufgrund der Dipol-Strahlungscharakteristik nur eine geringe Amplitude in Reflexionsrichtung. Für einen Einfallswinkel α = αP , bei dem gebrochener und reflektierter Strahl einen Winkel von 90◦ bilden (Bild 21-10), wird die Amplitude von S null: Das von einem einfallenden Strahl S unpolarisierten, natürlichen Lichtes an einer Grenzfläche reflektierte Licht S ist partiell, im Falle α = αP vollständig linear polarisiert. Der gebrochene Strahl S ist stets nur partiell polarisiert (Bild 21-11). Der Winkel αP (Brewster-Winkel) lässt sich unter Beachtung von αP + β = 90◦ aus dem Brechungsgesetz (21-3) berechnen. Mit n1 = na = 1 (Vakuum) und n2 = n folgt das Brewster’sche Gesetz: tan αP = n .
(21-16)
Aus den Maxwell’schen Gleichungen (14-41) und (14-42) lassen sich Grenzbedingungen für die elektrische und magnetische Feldstärke an der
sin2 (α − β)
(21-17)
sin2 (α + β) tan2 (α − β) . tan2 (α + β)
(21-18)
Für α + β = 90◦ wird = 0, in Übereinstimmung mit dem Brewster’schen Gesetz (21-16). Zusammen mit dem Brechungsgesetz (21-3) ergibt sich aus (21-17) und (21-18) für ⊥ (α) und (α) der in Bild 21-11 dargestellte Verlauf für die Reflexion an Glas. Für Glas (n = 1,50) erhält man für den BrewsterWinkel αP = 56,3◦ . Wird das unter diesem Winkel von Glasflächen reflektierte, polarisierte Licht durch ein Polarisationsfilter (siehe unten) betrachtet, so lässt es sich durch geeignete Filterstellung (Durchlassebene ⊥ Polarisationsebene) stark abschwächen: → 0 (Anwendung bei der Fotografie durch Fensterscheiben hindurch). Linear polarisiertes Licht mit der Schwingungsebene in der Einfallsebene (E in Bild 21-10) wird unter dem Brewster-Winkel αP ohne Reflexionsverluste gebrochen: Für → 0 wird nach (21-18) das Durchlassvermögen τ = 1 (Anwendung bei den Brewster-Platten des Gaslasers, Bild 20-14). Bei Übergang zu senkrechtem Einfall wird
⊥ = = (Bild 21-11). Aus (21-17) bzw. (21-18) folgt durch Grenzübergang für kleine Winkel
=1−τ=
n−1 n+2
2 .
(21-19)
Für Glas erhält man mit n = 1,50 einen Reflexionsgrad = 0,04, d. h., an jeder Grenzfläche Vakuum/Glas oder Luft/Glas gehen 4% der Lichtintensität durch Reflexion verloren, sofern nicht durch geeignete Aufdampfschichten („Entspiegelung“ bzw. „Vergütung“) für eine Verminderung des Reflexionsvermögens gesorgt wird. Doppelbrechung Bild 21-11. Reflexionsgrad der Grenzfläche Vakuum/Glas
(bzw. Luft/Glas) für linear polarisiertes Licht
Manche durchsichtigen Einkristalle (z. B. Quarz, Kalkspat, Glimmer, Gips) sind optisch anisotrop,
B263
B264
B Physik
d. h., die Phasengeschwindigkeit elektromagnetischer Wellen hängt von der Ausbreitungsrichtung ab. Bei optisch einachsigen Kristallen stimmen die Phasengeschwindigkeiten lediglich in einer Richtung, der optischen Achse, überein. Bei Auftreffen eines Strahlenbündels natürlichen Lichtes auf einen optisch einachsigen Kristall treten im Allgemeinen zwei senkrecht zueinander linear polarisierte Teilbündel auf, die sich mit unterschiedlicher Phasengeschwindigkeit ausbreiten: Der ordentliche Strahl folgt dem Brechungsgesetz, der außerordentliche Strahl nicht, er wird unter anderem Winkel gebrochen. Diese Erscheinung wird Doppelbrechung genannt. Manche Kristalle (z. B. Turmalin) haben die Eigenschaft, den außerordentlichen Strahl sehr viel stärker zu absorbieren als den ordentlichen Strahl: Dichroismus. Geht ein Strahl natürlichen Lichtes durch eine dünne Platte eines solchen dichroitischen Materials, so wird im Wesentlichen der ordentliche Strahl mit nur geringer Schwächung durchgelassen. Solche Stoffe sind als Polarisationsfilter (siehe oben) geeignet.
22 Geometrische Optik Das in 21.1 eingeführte Strahlenkonzept für die makroskopische Beschreibung der Wellenausbreitung hat sich insbesondere bei Problemen der praktischen Optik (optische Abbildung) bewährt und sich zu einem besonderen Zweig der Optik entwickelt: geometrische oder Strahlenoptik. Hier geht es um die Bestimmung des Lichtweges in optischen Geräten und um die Klärung der Grundlagen zur optimalen Konstruktion solcher Geräte. Die Grundannahmen des Strahlenkonzeptes (gradlinige Ausbreitung im homogenen Medium, Unabhängigkeit sich überlagernder Strahlen, Umkehrbarkeit des Strahlenganges, Reflexionsgesetz, Brechungsgesetz) bedeuten eine starke Vereinfachung der Realität, da Beugungserscheinungen (vgl. 23) und nichtlineare Erscheinungen (bei Laserstrahlen sehr hoher Intensität in Materie) nicht berücksichtigt werden. Die Grenzen der geometrischen Optik liegen daher dort, wo Abbildungsdetails oder die den Strahlengang begrenzenden Abmessungen (Schirme, Blenden
Bild 22-1. Zur Herleitung der Abbildungsbedingung
usw.) in den Bereich der Wellenlänge des Lichtes kommen (siehe 23 u. 24).
22.1 Optische Abbildung Eine Abbildung im Gauß’schen Sinne der geometrischen Optik liegt dann vor, wenn Lichtstrahlen, die von einem Gegenstandspunkt ausgehen, in einem Bildpunkt wieder vereinigt werden, und wenn verschiedene Punkte eines ausgedehnten ebenen Gegenstandes in einer Bildebene derart abgebildet werden, dass das Bild dem Gegenstand geometrisch ähnlich ist. Ein optisches System, das eine derartige Abbildung bewirkt, muss folgende Bedingungen erfüllen (Bild 22-1): Das abbildende optische System sei in seiner Wirkung auf eine Ebene S senkrecht zur optischen Achse GOB konzentriert. Ein von G unter dem Winkel α1 gegen die optische Achse ausgehender Strahl möge in S so gebrochen werden, dass er die optische Achse hinter dem brechenden System in B unter dem Winkel β1 schneidet. Eine Abbildung von G nach B liegt dann vor, wenn auch unter anderen Winkeln α2 von G ausgehende Strahlen so gebrochen werden, dass sie durch B gehen. Nach Bild 22-1 gilt r/g = tan α ≈ α und r/b = tan β ≈ β für achsennahe Strahlen. Die zur Abbildung notwendige Strahlablenkung δ ergibt sich dann zu 1 1 + (22-1) δ=α+β≈r . g b Bei gegebener Gegenstandsweite g muss die Bildweite b für alle von G ausgehenden Strahlen gleich sein, darf also nicht von r abhängen. Das ist nach (22-1) dann erfüllt, wenn die Ablenkung proportional zu r erfolgt: δ = α + β = const · r .
(22-2)
22 Geometrische Optik
b(g) ist hiernach unabhängig von α, eine notwendige Voraussetzung für die optische Abbildung. Für g → ∞ (parallel einfallende Strahlen) wird die zugehörige Bildweite b∞ als Brennweite f bezeichnet. Die reziproke Brennweite heißt Brechkraft D, sie ist für eine dünne Sammellinse n−1 1 1 . = =D= b∞ f R
Bild 22-2. Zur Berechnung der Linsenformel
Eine analoge Betrachtung für nicht auf der optischen Achse liegende, aber achsennahe Gegenstandspunkte führt zu derselben Beziehung. Die geometrische Ähnlichkeit folgt ebenfalls aus (22-2): Für Strahlen die durch den Mittelpunkt O des optischen Systems gehen, ist r = 0 und damit δ = 0, d. h., diese Strahlen werden nicht abgelenkt. Anhand solcher Strahlen lässt sich aber die geometrische Ähnlichkeit zwischen Bild und Gegenstand sofort einsehen. Gleichung (22-2) ist daher die zur Erzielung einer Abbildung notwendige Bedingung. Die Realisierung einer derartigen Eigenschaft ist z. B. durch um die optische Achse rotationssymmetrische, konvexe Glas- oder Kunststoffkörper möglich, die durch Kugelflächen begrenzt sind. Wegen ihrer Form werden sie optische Linsen genannt. Die Abbildung eines Punktes in endlicher Entfernung durch eine dünne Sammellinse (z. B. eine Plankonvexlinse mit der Brechzahl n und dem Krümmungsradius R, Bild 22-2) kann mithilfe der Ablenkformel (21-14) für das dünne Prisma berechnet werden, da die Linse als ablenkendes Prisma mit vom Achsenabstand r abhängigen Dachwinkel γ aufgefasst werden kann (Bild 22-2). Der Begriff dünne Linse bedeutet, dass der optische Weg (vgl. 21-8) in der Linse L = nd klein gegen die Gegenstandsweite g und die Bildweite b ist. Für das Dreieck GBC mit dem Ablenkwinkel δ als Außenwinkel zu den Dreieckswinkeln α und β gilt unter Berücksichtigung von (21-14) α + β = δ = γ(n − 1) .
Gesetzliche Einheit: [D] = 1 m−1 = 1 dpt (Dioptrie) . Damit folgt aus (22-4), immer für achsennahe Strahlen, die Abbildungsgleichung (Linsenformel) 1 1 1 + = . g b f
Die beiden Brechungen eines Lichtstrahls an den Oberflächen einer Linse können bei dünnen Linsen in guter Näherung durch eine einzige an der Mittelebene, der Hauptebene H, der Linse ersetzt werden. Zur geometrischen Konstruktion der Lage des Bildes ist nach (22-6) lediglich die Kenntnis der Brennweite f der abbildenden Linse und die Vorgabe der Gegenstandsweite g erforderlich. Die Konstruktion selbst kann dann mittels zweier von drei ausgezeichneten Strahlen erfolgen (Bilder 22-3 bis 22-5): Parallelstrahl (1), geht nach der Brechung durch den Brennpunkt F (1 ); Mittelpunktsstrahl (2), durchdringt die Linse ungebrochen (2 ); Brennpunktsstrahl (3), verläuft nach der Brechung parallel zur optischen Achse (3 ).
(22-3)
(22-4)
(22-6)
Bildkonstruktion
Für achsennahe Strahlen (kleine Winkel) ist α ≈ r/g und β ≈ r/b. Ferner liefert γ ≈ r/R zusammen mit (22-3) die erforderliche Abbildungsbedingung (22-2). Damit folgt aus (22-3) 1 1 n−1 + = = const . g b R
(22-5)
Bild 22-3. Bildkonstruktion bei der Sammellinse
B265
B266
B Physik
Bild 22-4. Zuordnung von Bild und Gegenstand
bei der Abbildung durch Sammellinsen
Tabelle 22-1. Die verschiedenen Abbildungsfälle bei der Sammellinse
Gegenstand G1 G2 G3 G∗ G4
Lage
Bild
βm
Bildlage und -art
Anwendungen
g > 2f g = 2f 2f > g > f g f g< f
B1 B2 B3 B∗ B4
1 →∞ >1
f < b < 2f b = 2f b > 2f b→∞ b f ist b > 0, es erfolgt eine reelle Abbildung, wobei das Bild umgekehrt erscheint (Bildhöhe B < 0, Bild 22-3). Reelle Abbildung bedeutet, dass das Bild auf einem Schirm an dieser Stelle sichtbar wird. Für g < f wird b < 0, das Bild scheint nach dem verlängerten Strahlenverlauf hinter der Linse an einem Ort auf der Gegenstandsseite aufrecht aufzutreten, ohne dass ein Schirm dort das Bild zeigen würde: Virtuelle Abbildung. Der Abbildungsmaßstab ergibt sich mittels des Strahlensatzes aus Bild 22-3 bzw. 22-4 zu B hB b b βm = = = = −1. (22-8) G hG g f Die verschiedenen Fälle der Abbildung bei einer Sammellinse sind in Bild 22-4 und Tabelle 22-1 dargestellt. Bei der Zerstreuungslinse (plankonkave oder bikonkave Linsenflächen) entsteht stets ein aufrechtes, verkleinertes, virtuelles Bild (Bild 22-5).
Bild 22-5. Bildkonstruktion bei der Zerstreuungslinse
Kombination dünner Linsen
Systeme aus dünnen Linsen der Brennweiten f1 und f2 mit geringem Abstand d ( f1 , f2 ) voneinander wirken wie eine Linse mit der Brechkraft 1 1 1 d = + − f f1 f2 f1 f2 bzw.
(22-9)
D = D1 + D2 − dD1 D2 . Bei sehr kleinen Abständen d kann das letzte Glied vernachlässigt werden. Für diesen Fall lässt sich (22-9) sofort anhand des Verlaufs des Brennpunktstrahls herleiten. Dicke Linsen
Bei dicken Linsen gelten die Abbildungsgesetze (22-6) bis (22-8) nur dann, wenn man zwei Hauptebe-
22 Geometrische Optik
Bild 22-7. Projektionsstrahlengang und Projek-
toranordnung
nen H und H einführt, zwischen denen alle Strahlen als achsenparallel laufend angenommen werden (Bild 22-6). Brennweiten, Gegenstands- und Bildweiten beziehen sich dann stets auf die zugehörige Hauptebene.
(siehe 22.2) am geringsten sind. Beim Projektor ist i. Allg. b g, sodass aus (22-8) für den Abbildungsmaßstab folgt
Zusammengesetzte optische Geräte
Optische Geräte bestehen meist aus mehreren Linsen oder Linsensystemen, die verschiedene Abbildungsoder Beleuchtungsfunktionen haben. Projektor. Bild 22-7a zeigt einen Strahlengang zur vergrößerten Projektion, z. B. eines Diapositivs auf eine Leinwand. Dabei wird jedoch der von der Lichtquelle ausgehende Lichtstrom nur zu einem geringen Teil ausgenutzt (Ω1 /4π), während der Anteil (4π−Ω1 ) /4π verloren geht. Deshalb setzt man zwischen Lichtquelle und Gegenstand eine Kondensorlinse, die den ausgenutzten Raumwinkel auf Ω2 > Ω1 vergrößert, sowie einen Kondensorspiegel ein (Bild 22-7b). Die Kondensorlinse bewirkt ferner, dass der Lichtstrom im Wesentlichen durch den achsennahen Projektivbereich geht, wo die Abbildungsfehler
Mikroskop. Zur Beobachtung sehr kleiner Gegenstände wird eine zweistufige Abbildung benutzt (Bild 22-8). In der ersten Stufe wird mit dem Objektiv ein stark vergrößertes reelles Bild B des Gegenstandes G hergestellt (g ≈ f1 ). In der zweiten Stufe wird das reelle Zwischenbild B mit dem Okular, das als Lupe wirkt, weiter vergrößert. Es entsteht ein virtuelles Bild B . Fernrohre benutzen wie Mikroskope eine mindestens zweistufige Abbildung. Hier wird ein weit entfernter Gegenstand (g → ∞ : b ≈ f ) durch das Objektiv in der Nähe des bildseitigen Brennpunktes reell abgebildet. Dieses Zwischenbild wird dann wiederum durch ein Okular als virtuelles, vergrößertes Bild betrachtet. Auf die das Reflexionsgesetz (21-1) ausnutzende Abbildung mit Spiegeln wird hier aus Platzgründen nicht
Bild 22-6. Bildkonstruktion bei einer dicken Linse
Bild 22-8. Strahlengang im Mikroskop
βm ≈
b . f
(22-10)
B267
B268
B Physik
Bild 22-9 a. Öffnungsfehler einer sphärischen
Linse
eingegangen. Man erhält jedoch für die Abbildung mit gekrümmten Spiegeln grundsätzlich analoge Beziehungen wie für die Abbildung mit Linsen.
22.2 Abbildungsfehler Sphärische Linsen erzeugen nur näherungsweise eine fehlerfreie Abbildung, in der jeder Bildpunkt eindeutig einem Gegenstandspunkt zugeordnet ist, und in der die geometrische Ähnlichkeit zwischen Bild und Gegenstand gewahrt ist. Die folgend geschilderten Abbildungsfehler (Linsenfehler, Aberrationen) können teilweise durch Kombinationen geeigneter Linsen (und heute auch durch Verwendung asphärischer Linsen) reduziert (korrigiert) werden. Öffnungsfehler (sphärische Aberration)
Die Gültigkeit der Abbildungsgleichung (22-6) ist auf achsennahe Strahlen begrenzt (Bereich der Gauß’schen Abbildung). Achsenferne Strahlen in den Randbereichen einer sphärischen Linse werden stärker gebrochen, als es der Abbildungsbedingung (22-2) entspricht. Die zugehörige Bildweite (bei Abbildung eines ∞ fernen Gegenstandpunktes: Brennweite) ist daher kürzer als die der achsenahen Strahlen (Bild 22-9a). Die Differenz der Bildweiten (bzw. der Brennweiten δ f = f − fr ) wird im engeren Sinne als Öffnungsfehler bezeichnet. Die Einhüllende des bildseitigen Strahlenbündels heißt Kaustiklinie. Ihr Schnitt mit dem gegenüberliegenden Randstrahl definiert die Ebene kleinster Verwirrung (Radius rs ). Infolge des Öffnungsfehlers wird ein Gegenstandspunkt nicht als Punkt abgebildet, sondern am Ort des Gauß’schen Bildes als Fehlerscheibchen vom Radius ΔÖ . Der mithilfe des Abbildungsmaßstabes βm auf die Gegenstandsseite zurückgerechnete Radius des Fehlerscheibchens δÖ
steigt mit der 3. Potenz des Linsenaperturwinkels α (ohne Ableitung; Seidel’sche Fehlertheorie): δÖ =
ΔÖ = CÖ α3 βm
(22-11)
Je nach Linsenform liegt der Öffnungsfehlerkoeffizient CÖ in der Größenordnung mehrerer Brennweiten f . Er ist am kleinsten, wenn die gegenstandsseitigen und die bildseitigen Randstrahlen etwa die gleichen Winkel zur Linsenoberfläche haben. Das erfordert je nach Abbildungsproblem meist eine asymmetrische Linsenform (z. B. plankonvex, vgl. Mikroskopobjektiv, Bild 22-8). Der Öffnungsfehler kann durch Abblendung auf kleine Aperturwinkel α reduziert werden. Dem stehen jedoch die damit verbundene Lichtschwächung und der steigende Beugungsfehler (siehe unten) entgegen. Eine spezielle Form des Öffnungsfehlers ist die Koma: Das Öffnungsfehlerscheibchen wird asymmetrisch, wenn die Linse seitlich ausgeleuchtet wird (Bild 22-9b). Komafiguren werden daher bei schlechter Linsenzentrierung beobachtet.
Bild 22-9 b. Zur Entstehung der Komafigur
22 Geometrische Optik
Bild 22-10. Astigmatismus einer Linse mit unterschiedlichen Krümmungen: anstelle eines Brennpunktes treten zwei zueinander senkrechte Brennlinien auf
Bild 22-12. Zur Entstehung des Farbfehlers
Bild 22-11. Zur Entstehung von Tonnen- und Kissenver-
zeichnung
Astigmatismus
Linsen mit nicht ganz sphärischen Flächen zeigen in zueinander senkrechten, die optische Achse enthaltenden Schnittflächen unterschiedliche Zylinderlinsenwirkung, d. h., die Brennweiten sind für solche Schnittflächen verschieden. Ein Gegenstandspunkt kann dann bestenfalls in zwei unterschiedlichen Bildebenen als Strich abgebildet werden, wobei die beiden Strichbilder aufeinander senkrecht stehen (Bild 22-10). Derselbe Effekt tritt an sphärischen Linsen bei schiefer Durchstrahlung auf. Für den Astigmatismus korrigierte Linsensysteme: Anastigmate. Kissen- und Tonnenverzeichnung
Zu geometrischen Verzeichnungen infolge des Öffnungsfehlers kommt es, wenn das abbildende Strahlenbündel außerhalb der abbildenden Linse durch Blenden eingeengt wird. Eine Blende im Gegenstandsraum bewirkt, dass für die Abbildung der äußeren Gegenstandsbereiche Randbereiche der
Linse genutzt werden. Das führt zu kleineren Abbildungsmaßstäben im Randbildbereich als im zentralen Bildbereich: Tonnenverzeichnung (Bild 22-11a). Eine Blende im Bildbereich bewirkt das Gegenteil: äußere Bildbereiche werden stärker vergrößert wiedergegeben als innere Bildbereiche: Kissenverzeichnung (Bild 22-11b). Farbfehler (chromatische Aberration)
Die Dispersion des Linsenmaterials bewirkt, dass vor allem im Linsenrandbereich blaues Licht stärker gebrochen wird als rotes Licht (vgl. Bilder 21-8 und 22-12). Mit weißem Licht erzeugte Bilder bekommen dann Farbsäume. Der Farbfehler kann für zwei Wellenlängen durch Kombination einer Konvexlinse aus Kronglas und einer Konkavlinse aus Flintglas, die unterschiedliche Dispersion haben (Tabelle 21-1), korrigiert werden: Achromat. Bildfeldwölbung
Ein ebener Gegenstand wird durch eine Linse in einer gewölbten Fläche scharf abgebildet. Auf einem ebenen Bildschirm werden dann die Randbereiche unscharf. In dieser Hinsicht korrigiertes Linsensystem: Aplanat. Beugungsfehler
Die Berücksichtigung der Welleneigenschaften des Lichtes zeigt, dass Lichtbündel von begrenztem Durchmesser D durch Beugung (siehe 23 und 24) aufgeweitet werden. Bei der Abbildung eines fernen
B269
B270
B Physik
Verstärkung oder Auslöschung, stehende Wellen usw. (bei Wellen gleicher Frequenz, vgl. 18), oder Schwebungen (bei Wellen von etwas verschiedener Frequenz) usw. Bringt man in das Feld einer fortschreitenden Welle ein Hindernis (Schirm, Blendenöffnung), so gelangt z. B. auch in den geometrischen Schattenraum eine Wellenerregung: Beugung. Die Beugungserscheinungen lassen sich durch die Interferenz der von der primären Welle nach dem Huygens’schen Prinzip ausgelösten Elementarwellen (siehe unten) beschreiben.
Bild 22-13. Zur Berechnung des Beugungsfehlers
23.1 Huygens’sches Prinzip
Bild 22-14. Abbildungsunschärfe als Funktion des Öffnungswinkels (qualitativ)
Gegenstandspunktes durch eine Linse des Durchmessers D entsteht daher ein Beugungsfehlerscheibchen vom Radius δB (Bild 22-13). Der Beugungswinkel beträgt nach (23-13) ϑ ≈ λ/D mit λ = Wellenlänge des verwendeten Lichtes. Mit D ≈ 2α f folgt für den Radius des Beugungsfehlerscheibchens δB ≈ ϑ f ≈
λ λf ≈ . D 2α
Die Ausbreitung von Wellen beliebiger Form kann auf die Ausbreitung von Kugelwellen, sogenannten Elementarwellen, und deren phasenrichtige Überlagerung (Interferenz) zurückgeführt werden (Huygens’sches Prinzip, ca. 1680): Jeder Punkt einer Wellenfläche (Phasenfläche) ist Ausgangspunkt einer neuen Elementarwelle (Kugelwelle), die sich im gleichen Medium mit der gleichen Geschwindigkeit wie die ursprüngliche Welle ausbreitet. Die tangierende Hüllfläche aller Elementarwellen gleicher Phase ergibt eine neue Lage der Phasenfläche der ursprünglichen Welle. Beispiele für die Anwendung dieses Prinzips zeigt Bild 23-1.
(22-12)
Beugungsunschärfe δB und Öffnungsfehlerunschärfe δÖ (22-11) hängen also gegensinnig vom Öffnungswinkel (Aperturwinkel) α ab. Die geringste Unschärfe ist daher für einen optimalen Öffnungswinkel αopt zu erwarten, der nahe bei δÖ ≈ δB liegt (Bild 22-14).
23 Interferenz und Beugung Unter Interferenz versteht man die Erscheinungen, die durch Überlagerung von am gleichen Ort zusammentreffenden Wellenzügen gleicher Art (elastische, elektromagnetische, Materiewellen, Gravitationswellen usw.) hervorgerufen werden, z. B. gegenseitige
Bild 23-1. Entstehung neuer Wellenflächen nach dem Huy-
gens’schen Prinzip a für ebene Wellen, b für Kugelwellen
23 Interferenz und Beugung
Bild 23-2. Durchgang einer Welle durch eine Spaltöffnung bei verschiedenen Spaltbreiten D im Vergleich zur Wellenlänge λ
Die Anwendung des Huygens’schen Prinzips werde für den Durchgang einer ebenen Welle durch eine Schirmöffnung der Breite D betrachtet (Bild 23-2): Sind die Abmessungen der Schirmöffnung groß gegenüber der Wellenlänge (D λ, Bild 23-2a), so erhält man hinter dem Schirm ein nahezu ungestörtes Wellenfeld von der Breite der Schirmöffnung. Für diesen Fall ist das Strahlenkonzept offenbar brauchbar. Es treten lediglich geringe Randstörungen auf, die daher rühren, dass im Schattenbereich keine Elementarwellen vom hier ausgeblendeten primären Wellenfeld angeregt werden. Kommt hingegen die Spaltbreite D in die Nähe der Wellenlänge λ (D λ, Bild 23-2b), so wird die Intensitätsverteilung zunehmend stärker durch Interferenzmaxima und -minima strukturiert, sowohl innerhalb als auch außerhalb des geometrischen Strahlbereichs. Wird schließlich D λ (Bild 23-2c), so wird gewissermaßen nur noch eine einzelne Elementarwelle von der Schirmöffnung freigegeben. Das Strahlenkonzept ist hier völlig unbrauchbar, während das Huygens’sche Prinzip die zu beobachtenden Beugungsphänomene richtig beschreibt. Das Huygens’sche Prinzip, insbesondere in der Erweiterung von Fresnel (siehe unten) ist die Grundlage der quantitativen Theorie der Beugung. Huygens-Fresnel’sches Prinzip: Die Amplitude einer Welle in einem beliebigen Raumpunkt ergibt sich aus der Überlagerung aller dort eintreffenden Elementarwellen unter Berücksichtigung ihrer Phase. Bei der Beugung von elektromagnetischen Wellen, insbesondere von Lichtwellen, ist es für viele Zwecke ausreichend, den vektoriellen Charakter des elektromagnetischen Feldes zu vernachlässigen, d. h. eine skalare Wellentheorie zu betreiben. Zur
Vereinfachung der mathematischen Schreibweise werden cos- und sin-Wellen nach der Euler’schen Formel (vgl. A 7.1) komplex zusammengefasst: u(r, t) = uˆ [cos (ωt − kr) + j sin (ωt − kr)] = uˆ e j(ωt−kr) = uˆ e−jkr e jωt .
(23-1)
u ist hierin die Erregung. Das kann z. B. der Betrag der elektrischen oder der magnetischen Feldstärke sein. Eine auslaufende Kugelwelle (vgl. (18-10) lautet in dieser Schreibweise u1 (23-2) u(r, t) = e−jkr e jωt . r Für die Berechnung der Beugungsintensitäten durch phasenrichtige Überlagerung der elementaren Kugelwellen ist der Zeitfaktor e jωt nicht wesentlich und wird daher abgespalten. Im Schlussergebnis der Beugungsrechnung kann, wenn nötig, der Realteil der Lichterregung u wiedergewonnen werden durch Addition der konjugiert komplexen Erregung u∗ . Die mathematische Ausformulierung des HuygensFresnel’schen Prinzips durch Kirchhoff berechnet die Lichterregung u(P) in einem beliebigen Punkt P als Integral der Lichterregung u über eine den Punkt P einschließende Fläche. Handelt es sich um die Beugung an einer Öffnung in einem Schirm (Fläche A), so wird man als Integrationsfläche den Schirm einschließlich Öffnung wählen. Da die Erregung auf dem Schirm jedoch nicht bekannt ist, wird nach Kirchhoff angenommen, dass in der freien Öffnung die Erregung vorliegt, die auch ohne Vorhandensein des Schirmes dort auftreten würde, während die Erregung (und deren Gradient) auf dem Schirm selbst gleich null gesetzt wird. Da die Materialeigenschaften des Schirms dann gar nicht mehr in die Rechnung eingehen, muss das Ergebnis für die unmittelbare Nähe des Schirmrandes nicht in jedem Falle zutreffen. Davon
B271
B272
B Physik
abgesehen ist jedoch die Kirchhoff’sche Beugungstheorie außerordentlich erfolgreich. Für einen ebenen Schirm an der Stelle z = 0 (Bild 23-3) lautet die Kirchhoff’sche Beugungsformel in der Formulierung von Sommerfeld "" j e−jkr cos(n, r) dξ dη . (23-3) u(P) = u(ξ, η) λ r A
u(P) und u(ξ, η) sind die Erregungen im Beobachtungspunkt P(x, y, z) bzw. in der Schirmöffnung (Schirmkoordinaten ξ und η), n ist die Flächennormale des Schirms. Gleichung (23-3) formuliert genau die Huygens’sche Vorstellung: Die resultierende Erregung ergibt sich als Überlagerung aller von der beugenden Öffnung ausgehenden Kugelwellen. Der Faktor cos (n, r) entspricht dabei dem Lambert’schen Cosinusgesetz (siehe 20.2). Ferner ist r λ vorausgesetzt. Die Erregungsverteilung u(ξ, η) in der Schirmöffnung kann z. B. durch eine Lichtquelle Q(x0 , y0 , z0 ) im Abstand R0 erzeugt werden. Sind die linearen Abmessungen der beugenden Öffnung D r, R, so kann r im Nenner durch den mittleren Wert R ersetzt werden und zusammen mit dem dann wenig veränderlichen Faktor cos (n, r) aus dem Integral herausgezogen werden. Wegen R ξ, η kann dann r im Exponenten entwickelt werden: 1 2 [ξ + η2 − (αξ + βη)2 + . . .] . r = R − αξ − βη + 2R (23-4) Hierbei sind α=
x R
und β =
y R
(23-5)
Bild 23-4. Zur Einteilung der Beugungserscheinungen hinter einer Öffnung der Breite D > λ in charakteristische Bereiche mithilfe der Fresnel-Zahl
die Richtungscosinus von R gegen die ξ- bzw. η-Achse. Diese Entwicklung gestattet eine Einteilung der Beugungserscheinungen: Fraunhofer-Beugung. Für große Entfernungen von Lichtquelle Q und Beobachtungspunkt P vom Schirm, d. h. R, R0 → ∞, können die quadratischen Glieder vernachlässigt werden. Aus (23-3) ergibt sich dann unter Weglassung des konstanten Phasenfaktors exp(−jkR) "" j cos(n, R) u(P) = u(ξ, η) e jk(αξ+βη) dξ dη . λR A
(23-6)
Fresnel-Beugung. In Fällen, in denen die Bedingung für Fraunhofer-Beugung nicht erfüllt ist, müssen mindestens die quadratischen Glieder in (23-4) berücksichtigt werden. Entsprechend den genannten Einschränkungen lassen sich die verschiedenen Beugungsbereiche mithilfe der Fresnel-Zahl F=
D2 zλ
(23-7)
(D lineare Abmessung des beugenden Objekts) charakterisieren (Bild 23-4):
Bild 23-3. Zur Beugung an einer Schirmöffnung nach
Kirchhoff
1. Bereich der geometrischen Optik, F 1(F → ∞): Die Ausbreitung erfolgt entsprechend der von der Lichtquelle ausgehenden geometrischen Projektion des Schirms. Kennzeichen sind: Geradlinigkeit der Ausbreitung in homogenen Medien (siehe 22), scharfe Schattengrenzen, Einfluss der Wellenlänge vernachlässigbar. 2. Bereich der Fresnel-Beugung, F ≈ 1 (10−2 < F < 102 ) :
23 Interferenz und Beugung
Die Ausbreitung erfolgt nur näherungsweise im Bereich der geometrischen Schattenprojektion. Mit abnehmenden Werten von F steigt die seitliche Abströmung der Strahlungsenergie und geht in den Beugungswinkel ϑ (siehe 23.2) über. Die Intensitätsverteilung hinter der Öffnung ist stark strukturiert und zeigt eine ausgeprägte z-Abhängigkeit in der Zahl der Interferenzmaxima. 3. Bereich der Fraunhofer-Beugung, F 1 (F → 0): Die Ausbreitung erfolgt hauptsächlich innerhalb des Beugungswinkels ϑ = arcsin (λ/D). Die Form der Intensitätsverteilung hängt nicht mehr von z ab.
23.2 Fraunhofer-Beugung an Spalt und Gitter Die Beobachtung der Fraunhofer-Beugung setzt voraus, dass Lichtquelle Q und Beobachtungspunkt P sehr weit von der beugenden Öffnung entfernt sind (R0 , R → ∞). Im Experiment lässt sich dies durch eine Parallelstrahl-Beleuchtung (z. B. mithilfe einer Linse vor dem Objekt, in deren gegenstandsseitigem Brennpunkt sich eine Punktlichtquelle befindet) und eine hinter dem Beugungsobjekt angeordnete Linse erreichen, in deren hinterer Brennebene das Fraunhofer-Beugungsbild auftritt (Bild 23-5). Nimmt man an, dass die Erregung direkt hinter dem Schirm durch eine konstante Primärerregung ue erzeugt wird (etwa durch eine Punktquelle Q(0, 0, −∞), sodass die Schirmebene eine Phasenfläche ist), die durch den Schirm (und seine Öffnung) örtlich modu-
liert wird, so lässt sich die Erregung auch durch eine Objektfunktion O(ξ, η) beschreiben: u(ξ, η) = ue O(ξ, η) .
Das Kirchhoff’sche Integral (23-6) lautet dann bis auf nur langsam mit x und y variierende Vorfaktoren "" O(ξ, η) e jk(αξ+βη) dξ dη (23-9) u(P) = const A
und stellt mathematisch eine Fourier-Transformation (A 23.1) dar. Beugung am Einfachspalt
Die Objektfunktion für einen in η-Richtung ∞-lang ausgedehnten Spalt der Breite s lautet 1 für −s/2 < ξ < s/2 . O(ξ, η) = O(ξ) = 0 sonst (23-10) Mit dieser Objektfunktion ergibt das leicht auszuführende Kirchhoff’sche Integral (23-9) für den Intensitätsverlauf I(X) ∼ u2 (X) in der Beugungsebene die Spaltbeugungsfunktion sin2 X . (23-11) X2 I0 ist die Intensität an der Stelle X = 0, also in Geradeausrichtung. X = kαs/2 = παs/λ = πsxf /λ f ist eine normierte Koordinate in der Bildebene (Brennebene der nachgeschalteten Linse) mit xf ≈ α f und α = sin ϑ (Bild 23-5): πs sin ϑ . X= (23-12) λ Bild 23-6 zeigt die Intensitätsverteilung I(X). Sie hat Nullstellen bei X = π, 2π, . . . , nπ, . . .. Hier interferieren alle von der Spaltfläche ausgehenden Elementarwellen so miteinander, dass sie sich insgesamt auslöschen. Die zu den Minima gehörenden Beugungswinkel beim Einfachspalt ergeben sich aus (23-12) zu I(X) = I0
λ (n = 1, 2, . . .) . (23-13) s Wird die Spaltbreite s verringert, so wird die Verteilung umgekehrt proportional zu s breiter (die Intensität dabei geringer), bis schließlich eine einfache Kugelwelle mit nahezu richtungsunabhängiger Intensität übrigbleibt (vgl. auch Bild 23-2c). sin ϑmin = ±n
Bild 23-5. Erzeugung des Fraunhofer-Beugungsbildes eines Spaltes in der Brennebene einer Linse
(23-8)
B273
B274
B Physik
Bild 23-6. Spaltfunktion: Fraunhofer-Beugungsintensität hinter Einfachspalten verschiedener Breite s1 und s2 = 0,1 s1
Beugung am Doppelspalt
Die Beugungsintensität hinter zwei oder mehr unendlich dünnen Spalten mit dem Abstand g lässt sich auf direktem Wege berechnen. Die Interferenzamplitude der Erregung auf einem weit entfernten Schirm, die durch Überlagerung der an zwei Spalten gebeugten Wellen entsteht (Bild 23-7), ergibt sich aus dem Gangunterschied (Differenz der optischen Weglängen, siehe 21.1) ΔL = g sin ϑ bzw. der daraus resultierenden Phasendifferenz 2π g sin ϑ . (23-14) Δϕ = kΔL = λ Die Interferenzamplitude der beiden Wellen mit der Einzelamplitude ue beträgt in der Beugungsrichtung ϑ aufgrund der Phasendifferenz gemäß (23-14) uϑ = 2ue cos
Δϕ . 2
(23-15)
Daraus ergibt sich für die Beugungsintensität Iϑ ∼ u2ϑ (siehe 19.1) des Doppelspaltes (Bild 23-7) $ # πg sin ϑ . Iϑ = 4Ie cos2 (23-16) λ
Bild 23-7. Beugung am unendlich dünnen Doppelspalt
Die cos2 -förmige Beugungsintensitätsverteilung beim Doppelspalt ist die typische Erscheinungsform der Zweistrahlinterferenz, die sehr häufig z. B. auch bei Interferometern ausgenutzt wird. Da man es in praxi mit endlichen Wellenzügen zu tun hat (vgl. 18.1), treten Interferenzerscheinungen zwischen beiden Wellenzügen nur dann auf, wenn der Weglängenunterschied ΔL nicht größer ist als die Länge der Wellenzüge, die in diesem Zusammenhang als Kohärenzlänge bezeichnet wird. Zweistrahlinterferenzen treten u. a. bei zwei vom gleichen Verstärker angesteuerten Lautsprechern auf, bei zwei Antennen eines Senders usw. Beugung am Gitter
Erhöht man die Zahl N der Spalte über 2 hinaus, so gilt die Bedingung (23-17) für das Auftreten für Maxima weiterhin, da bei dem Beugungswinkel ϑmax auch die weiteren Spalten phasenrichtig zur Beugungsintensität beitragen (Bild 23-8): λ sin ϑmax = ± n , g
n = 0, 1 . . . .
Diese Beugungsintensitätsverteilung hat Maxima an den Stellen sin ϑmax = ±n
λ g
(n = 0, 1, . . .)
und Minima bei 1 λ sin ϑmin = ± n + 2 g
(n = 0, 1, . . .) .
(23-17)
(23-18) Bild 23-8. Zur Beugung am Gitter mit N Spalten
(23-19)
23 Interferenz und Beugung
$ # πg sin ϑ sin2 N #λ $ . Iϑ = Ie N 2 2 πg 2 N sin sin ϑ λ
Bild 23-9. Verteilung der Fraunhofer-Beugungsintensität
eines Gitters mit zunehmender Spaltzahl N
Der Abstand g der Gitterspalte wird auch Gitterkonstante genannt. Zwischen den Hauptmaxima verteilt sich die Beugungsintensität jedoch anders als beim Doppelspalt, da bei diesen Richtungen jeweils viele unterschiedliche Phasen auftreten, die zur destruktiven Interferenz führen. Die Überlagerung der von den einzelnen Spalten ausgehenden Teilwellen in Richtung ϑ ergibt uϑ = ue [1 + e jkΔL + . . . + e jk(N−1)ΔL ] .
(23-22)
Der Bruchausdruck hat in den durch (23-19) gegebenen Hauptmaxima den Wert 1. Hier wächst demnach die Intensität quadratisch mit der Zahl N der Spaltöffnungen des Gitters. Gleichzeitig sinkt die Halbwertsbreite mit N (Bild 23-9). Für N → ∞ erhält man eine Folge von Deltafunktionen (vgl. A 8.3) an den Stellen der Hauptmaxima: „Delta“-Kamm. Reale Gitterspalte haben immer eine endliche Breite s. Daher überlagert sich der Gitterbeugungsfunktion (23-22) stets die Spaltbeugungsfunktion (23-11) als Intensitätsfaktor (Bild 23-10). Kreuzgitter sind Beugungsschirme mit Gitterstrukturen in zwei verschiedenen Richtungen. Sie erzeugen dementsprechend ein zweidimensionales Beugungspunktmuster. Bei der Beugung an vielen, in einer Ebene liegenden, statistisch orientierten Kreuzgittern ordnen sich die Beugungspunkte gleicher Ordnung zu ringförmigen Beugungsstrukturen um die 0. Ordnung als Zentrum. Dies ist das Analogon zu den DebyeScherrer-Ringen bei der Beugung von Röntgen- und Elektronenstrahlen an Kristallpulvern oder polykristallinen Schichten (siehe unten und 25.4). Gitter-Dispersion Nach (23-19) ist der Beugungswinkel für das Auftre-
ten von Beugungsmaxima von der Wellenlänge λ des gebeugten Lichtes abhängig. Bei der Gitterbeugung von weißem Licht sind danach die Beugungswinkel
(23-20)
Mit der Summenformel für geometrische Reihen ergibt sich daraus uϑ = ue
1 − e jkNΔL sin(kNΔL/2) jk(N−1)ΔL/2 e = ue . sin(kΔL/2) 1 − e jkΔL (23-21)
Der Exponentialterm ist ein Phasenfaktor mit dem Betrag 1. Die Fraunhofer-Beugungsintensität eines Gitters mit N unendlich dünnen Spalten, die sog. Gitterbeugungsfunktion, beträgt demnach mit kΔL/2 = (πg/λ) sin ϑ
Bild 23-10. Beugungsintensitätsverteilung eines Gitters mit
der Gitterkonstante g und der Spaltbreite s = g/3
B275
B276
B Physik
tung noch eine dritte Bedingung für die phasenrichtige Überlagerung aller Beugungswellen zu Beugungsmaxima hinzu. Das hat zur Folge, dass Beugungsmaxima von bestimmten Netzebenen des Raumgitters nur bei Einstrahlung unter dem Bragg-Winkel ϑB auftreten (Bild 23-11). Phasenrichtig überlagern sich Beugungswellen dann in der Richtung 2ϑB . Der Bragg-Winkel ergibt sich aus der Bragg’schen Gleichung: 2g sin ϑB = nλ (n = 1, 2, . . .) .
Bild 23-11. Röntgenbeugung am Raumgitter
des blauen Strahlungsanteils kleiner als die des roten Anteils. Jede Beugungsordnung spreizt sich daher zu einem Spektrum auf. Anwendung bei der Spektralanalyse: Gitterspektrograf. Beugung an Raumgittern
Licht wird (wie jede Welle) nicht nur an Öffnungen gebeugt, sondern ebenso an Hindernissen wie kleinen Kugeln o. ä. Sind solche beugenden Objekte dreidimensional periodisch angeordnet, so liegt ein Raumgitter vor. Fällt eine ebene Welle auf ein solches Raumgitter (Bild 23-11; die Gitterperiodizität ist senkrecht zur Zeichenebene fortgesetzt zu denken), so lässt sich die Beugung daran als sukzessive Beugung an hintereinander angeordneten Flächengittern darstellen (im Bild 23-11 untereinander liegende Kreuzgitter). Während das Entstehen von Beugungsstrahlen an einem einzelnen Flächengitter nicht an bestimmte Einfallswinkel geknüpft ist, tritt bei einem Raumgitter durch die Periodizität auch in der dritten Raumrich-
(23-23)
Die Bragg’sche Gleichung folgt aus der Forderung, dass der durch die Strecke AA A gegebene Gangunterschied ein ganzzahliges Vielfaches n der Wellenlänge λ sein muss. Der Beugungsstrahl tritt dann unter dem Winkel 2ϑB auf, wird also gewissermaßen an den vertikalen Netzebenen „gespiegelt“. Auch die unter dem obersten Flächengitter liegenden beugenden Objekte, z. B. bei C , liefern dann phasenrichtige Beugungswellen in Richtung 2ϑB , wie aus Bild 23-11 sofort abzulesen ist (die Strecken BB und CC sind gleich lang). Solche Raumgitter liegen als Atomgitter in den Kristallen vor. Mit Lichtwellen (λ ≈ 500 nm) sind daran jedoch keine Beugungsmaxima zu erzielen, da die Gitterkonstanten g in der Größenordnung 0,1 bis 1 nm liegen und (23-23) nicht erfüllbar ist. Hingegen lassen sich mit Röntgenstrahlen (siehe 19.2) oder mit Elektronenstrahlen (vgl. 25.4) an Kristallen Beugungsmaxima beobachten, da in beiden Fällen λ < g gemacht werden kann. Durch Röntgenstrahlbeugung an Kristallen haben v. Laue, Friedrich und Knipping (1912) erstmals zugleich den Gitteraufbau von Kristallen als auch die Welleneigenschaften der Röntgenstrahlung durch fotografische Registrierung der Laue-Diagramme Bild 23-12. Röntgenbeugung an Einkristallen (Laue-Diagramm) und an polykristallinen Materialien oder Kristallpulvern (Debye-ScherrerDiagramm)
24 Wellenaspekte bei der optischen Abbildung
nachgewiesen. Seitdem hat sich die Röntgenbeugung als wichtiges Hilfsmittel zur Strukturuntersuchung entwickelt, da durch Messung der Beugungswinkel ϑB über die Bragg’sche Gleichung (23-23) die zugehörigen Gitterkonstanten bestimmt werden können. Bei der Röntgenbeugung an polykristallinen Stoffen oder an Kristallpulvern erhält man (analog zur oben erwähnten Beugung an vielen statistisch orientierten Kreuzgittern) statt der LauePunktdiagramme ringförmige Beugungsdiagramme: Debye-Scherrer-Diagramme (Bild 23-12).
24 Wellenaspekte bei der optischen Abbildung Die optische Abbildung ist in 22 im Rahmen der geometrischen Optik behandelt, d. h. unter Verwendung des Strahlenkonzeptes ohne Berücksichtigung der Welleneigenschaften der zur Abbildung verwendeten Lichtstrahlung (Vernachlässigung der Beugung). Nach Behandlung der Beugung in 23 wird die optische Abbildung hier nochmals vom Standpunkt der Wellenausbreitung aus dargestellt.
24.1 Abbe’sche Mikroskoptheorie Wie ähnlich ist bei der optischen Abbildung die geometrische Struktur des Bildes derjenigen des abgebildeten Gegenstandes (Objektes)? Dazu werde die Abbildung eines Beugungsgitters (Gitterkonstante d) mittels einer Linse betrachtet (Bild 24-1). Die vom Objektgitter ausgehenden Beugungsstrahlen werden in der hinteren Brennebene der Abbildungslinse (Objektiv) fokussiert, hier entsteht das Fraunhofer-Beugungsbild des Objekts (siehe 23.2, Bild 23-5), im Falle eines Gitters ein System von hellen Punkten, die die verschiedenen Beugungsordnungen repräsentieren. Das im Verlauf der weiteren Wellenausbreitung von den Beugungspunkten ausgehende Licht interferiert in der Bildebene zur Lichtverteilung des Bildes. Im dargestellten Beispiel (Bild 24-1) werden von der Objektivöffnung die –1., 0. und +1. Beugungsordnung erfasst und in der Brennebene abgebildet. Dementsprechend ergibt sich in der Bildebene eine Intensitätsverteilung, die der Beugungsintensitätsverteilung eines Dreifachspaltes
entspricht (Bild 23-9 für N = 3). Ersichtlich ist die Ähnlichkeit der Bildintensitätsverteilung mit der des Objekts nur sehr gering. Im Wesentlichen kann aus dem Bild in diesem Falle nur die Gitterkonstante des Objekts (um den Vergößerungsmaßstab gedehnt) entnommen werden. Um eine größere Ähnlichkeit des Bildes mit dem Objekt zu erzielen, müssen offenbar mehr Beugungsordnungen vom Objektiv erfasst und damit zur Abbildung zugelassen werden. Dann verbessert sich die Wiedergabe gemäß Bild 23-9 mit zunehmender Zahl der Quellpunkte in der Brennebene des Objektivs. Demnach erfolgt vom Beugungsstandpunkt her die Abbildung in zwei Schritten: Zunächst entsteht in der Brennebene das Fraunhofer-Beugungsbild des Objekts. Im zweiten Schritt entsteht in der Bildebene das Bild des Objekts als Beugungsbild der Lichtverteilung in der Brennebene. Beide Schritte lassen sich mathematisch durch das Kirchhoff’sche Integral (23-9) beschreiben, das formal eine FourierTransformation (vgl. A 23.1) darstellt. Das Bild entsteht also aus der Objekt-Lichtverteilung durch zweifache Fourier-Transformation. Dies sind die Grundgedanken der Abbe’schen Mikroskoptheorie (Ernst Abbe, 1890). Die Abbe’sche Vorstellung lässt sich durch künstliche Eingriffe in das Beugungsbild in der Objektivbrennebene experimentell überprüfen: Werden alle Beugungsordnungen bis auf eine am weiteren Bildaufbau gehindert (gestrichelte Blende in Bild 24-1), so entsteht lediglich die breite Helligkeitsverteilung auf dem Schirm, die durch eine einzelne Kugelwelle erzeugt wird, ohne jede Strukturinformation über das abzubildende Objekt. Eine Mindestinformation über das abgebildete Objekt ergibt sich offenbar erst dann, wenn mindestens zwei Beugungsordnungen zum Bildaufbau beitragen und eine cos2 -Verteilung in der Bildebene erzeugen (vgl. (23-16)). Beträgt der Öffnungswinkel des Objektivs ϑ0 , so ist der größte noch vom Objektiv zu erfassende Beugungswinkel ϑ ≈ ϑ0 (bei schräger Beleuchtung des Objektgitters, sodass 0. und 1. Ordnung gerade noch durch die Objektivlinse gehen, vgl. Bild 24-2). Dem entspricht ein kleinster, noch abzubildender Gitterspaltabstand d ≈ λ/ sin ϑ0 , den man für n = 1 aus der Beugungsformel (23-19) erhält. Da dieselbe Beugungsformel auch für den Doppelspalt gilt (23-17),
B277
B278
B Physik
Bild 24-1. Zur Abbildung eines Gitterobjekts nach der Abbe’schen Mikroskoptheorie
Bild 24-2. Zur Auflösungsgrenze bei der opti-
schen Abbildung
gilt offenbar generell für den kleinsten bei gegebenem Objektiv-Öffnungswinkel ϑ0 noch abzubildenden Abstand, die sog. Abbe’sche Auflösungsgrenze, dmin ≈
λ . sin ϑ0
(24-1)
Für das Mikroskop ist als untere Grenze sin ϑ0 = 1 zu erreichen, d. h., die Auflösungsgrenze des Mikroskops ist dmin ≈ λ .
(24-2)
Das Lichtmikroskop kann daher prinzipiell keine Strukturen auflösen, deren Abstand kleiner als die Wellenlänge des Lichtes von etwa 0,5 μm ist. Höhere Auflösungen lassen sich nur mit Strahlungen kleinerer Wellenlänge erzielen (Elektronenmikroskop, siehe 25.5). Beim Fernrohr ist die Gegenstandsweite g sehr groß gegen den Objektivdurchmesser D. Dann ist ϑ0 ≈ D/g ≈ sin ϑ0 , womit aus (24-1) für die Auflösungs-
grenze des Fernrohrs folgt: dmin ≈
λ g. D
(24-3)
Beispiel: Bei einer sonst störungsfreien Abbildung mit einem Fernrohrobjektiv von D = 5 cm Durchmesser beträgt die Auflösungsgrenze für Gegenstände in g = 100 km Entfernung dmin ≈ 1 m.
24.2 Holografie Die Abbe’sche Theorie (24.1) stellt die optische Abbildung als zweistufigen Vorgang dar, bei dem zunächst das Beugungsbild des Objekts in der Brennebene des Objektivs erzeugt wird. Anschließend entsteht durch Interferenz aus der Lichtverteilung des Beugungsbildes das Bild in der Bildebene. Diese Vorstellung legt nahe, dass im Grunde die Lichtverteilung nicht nur in der Brennebene des Objektivs, sondern in jeder Ebene zwischen Objekt und Bild die vollständige Objektinformation enthält.
24 Wellenaspekte bei der optischen Abbildung
Gelingt es, diese Lichtverteilung nach Betrag und Phase z. B. fotografisch zu speichern (Holografie, von griech. hólos = ganz und gráphein = schreiben), so muss im Prinzip das Bild daraus rekonstruiert werden können (Gabor, 1948). Wird danach einfach eine Fotoplatte in die vom Objekt ausgehende Objektwelle gestellt und anschließend entwickelt, so erhält man eine vom Objekt bestimmte Schwärzung, die jedoch nur den Betrag der Amplitude (bzw. deren Quadrat) der Objektwelle am Orte der Fotoplatte wiedergibt, während die Phase nicht registriert wird. Eine Rekonstruktion der Objektwelle, z. B. durch Beleuchtung der (zur Erhaltung eines Positivs umkopierten) Fotoplatte, ist daher so i. Allg. nicht möglich. Eine gleichzeitige Registrierung von Betrag und Phase der Objektwelle in einem Hologramm ist durch zusätzliche Überlagerung einer Referenzwelle erreichbar (Bild 24-3). Die Objektwelle in der Ebene der Fotoplatte (x, y), die hier durch Beleuchtung eines teiltransparenten Gegenstandes (Objekt) erzeugt wird, werde nach Abspaltung des Zeitfaktors exp (−jωt) dargestellt durch uG (x, y) = |uG (x, y)| e jϕG (x, y) ,
(24-4)
worin der Betrag der Erregung |uG (x, y)| sich als Beugungserregung aus der Lichtverteilung im Objekt durch Anwendung des Kirchhoff’schen Integrals (für ein ebenes Objekt z. B. aus (23-9)) bestimmen lässt. Bei einiger Entfernung vom Objekt ist uG (x, y) dem Objekt i. Allg. nicht mehr erkennbar ähnlich. ϕG (x, y) ist die Phase in der Registrierebene (x, y).
Bild 24-3. Aufnahme eines Hologramms durch Überlage-
rung der Objektwelle mit einer kohärenten Referenzwelle
Eine gleichzeitig auf die Registrierebene (Hologrammebene) eingestrahlte, zur Objektwelle kohärente Referenzwelle (gemeinsame Erzeugung von Beleuchtungs- und Referenzwelle mittels eines Lasers, Bild 24-3) uR (x, y) = |uR (x, y)| e jϕR (x, y)
(24-5)
interferiert mit der Objektwelle und ergibt eine Intensität in der Hologrammebene I(x, y) ∼ |uG + uR |2 = |uG |2 + |uR |2 + 2|uG | |uR | cos (ϕG − ϕR ) .
(24-6)
Hierin sind |uG |2 , |uR |2 : Intensitäten der Objektwelle bzw. der Referenzwelle ohne Interferenz, 2|uG | |uR | cos (ϕG − ϕR ): Interferenzglied, beschreibt ein Interferenzstreifensystem im Hologramm, dessen Amplitude durch den Betrag der Objektwelle |uG | und dessen örtliche Streifenlage durch die Phasendifferenz ϕG − ϕR zur Referenzwelle bestimmt ist. Das im Hologramm registrierte Interferenzstreifensystem enthält daher die vollständige Objektwelleninformation. Nach fotografischer Entwicklung der Hologrammplatte ist deren Amplitudentransmission t(x, y) ∼ I(x, y). Nunmehr werde das Hologramm in derselben Anordnung allein durch die Referenzwelle beleuchtet (Bild 24-4). Die Lichtverteilung unmittelbar hinter dem Hologramm ist dann mit (24-6) unter Weglassung des Imaginärteils
Bild 24-4. Rekonstruktion der Objektwelle aus dem Hologramm: +1. Ordnung der Beugung des Beleuchtungsstrahls an den Gitterstrukturen des Hologramms
B279
B280
B Physik
25 Materiewellen
u(x, y) = t(x, y) uR (x, y) ∼[|uG | + |uR | + 2|uG uR | cos (ϕG − ϕG )] 2
2
× |uR | cos ϕR u(x, y) ∼ |uR |[|uG |2 + |uR |2 ] cos ϕR transmittierte Referenzwelle +|uR |2 |uG | cos(ϕG − 2ϕR ) +|uR |2 |uG | cos(ϕG )
Zwillingsbild Objektwelle (24-7)
Bis auf einen konstanten Faktor |uR |2 stellt der dritte Term die gesuchte Lichtverteilung der ursprünglichen Objektwelle dar, die jetzt nicht mehr durch die Beleuchtung des Objekts, sondern des Hologramms erzeugt (rekonstruiert) wird. Damit ist aber nach dem Huygens’schen Prinzip die sich von dieser Lichtverteilung weiter nach rechts ausbreitende neue Objektwelle identisch mit der ursprünglichen, sodass beim Blicken durch das so beleuchtete Hologramm das Objekt an der ursprünglichen Stelle (und zwar räumlich) gesehen wird, ohne dass das Objekt dort vorhanden sein muss. Im Bild der Gitterbeugung ist die rekonstruierte Objektwelle die 1. Ordnung der Beugung der Referenzwelle am Hologrammgitter. Der erste Term in (24-7) stellt die 0. Ordnung, der zweite Term die –1. Ordnung dar, die hier nicht weiter betrachtet wird. Achtung: Beim Betrachten eines Hologramms darf zur Vermeidung von Augenschäden nicht in die 0. Ordnung des beleuchtenden Laserstrahls geblickt werden! Die Holografie ist demnach ein zweistufiges Verfahren zur Aufzeichnung und räumlichen Wiedergabe von Bildern beliebiger Gegenstände, das im Prinzip keine Linsen erfordert. Insbesondere bei der Aufnahme der Hologramme werden Wellen zur Interferenz gebracht, die sehr unterschiedliche Wege zurückgelegt haben. Die Anforderungen an die Kohärenz des verwendeten Lichtes sind daher sehr hoch, sodass im Normalfall Laserlicht verwendet werden muss (siehe 20.5). Die hier dargestellte Form der Holografie wird aufgrund der Art der Referenzstrahlführung als Off-axis-Holografie bezeichnet (Leith u. Upatnieks, 1963).
25.1 Teilchen, Wellen, Unschärferelation Es gibt zwei physikalische Phänomene, die Erhaltungsgrößen wie Energie, Impuls und Drehimpuls speichern und transportieren können (Tabelle 25-1): Teilchen (Partikel) und Wellen. Die Teilchen und ihr Verhalten können im Wesentlichen durch die Erhaltungsgesetze für Energie, Impuls und Drehimpuls beschrieben werden (vgl. 3 und 4). Im makroskopischen Bereich der Physik sind daher keine Einschränkungen hinsichtlich der Werte dieser Größen erkennbar. Solche Einschränkungen werden jedoch im mikroskopischen Bereich der Physik (Atomphysik, Kernphysik) beobachtet, wo die experimentellen Ergebnisse dazu zwangen, Quantenhypothesen für Energie und Impuls bzw. Drehimpuls einzuführen: Quantisierte Oszillatoren in der Planck’schen Strahlungstheorie (siehe 20.2), quantisierte Energien und Drehimpulse in der Atomtheorie (vgl. 16.1). Viel länger akzeptiert sind Quantenvorstellungen, soweit es die Grundbausteine der Materie, die Elementarteilchen, die elektrische Ladung usw. betreffen. Schließlich ist es ein Merkmal der Partikel in der klassischen Mechanik, dass ihr Ort, Impuls usw. im Prinzip zu jedem Zeitpunkt genau angegeben werden kann: Partikel sind lokalisiert. Bei der Ausbreitung von Wellen handelt es sich dagegen um die räumliche Fortpflanzung eines Schwingungsvorganges, der typischerweise ausgedehnt, nicht lokalisiert ist. Es handelt sich nicht wie bei den Teilchen um einen Materietransport, dennoch wird auch hier Energie und Impuls transportiert (vgl. 18.1 und 19.1). Quantisierungsvorschriften gibt es hier bereits im makroskopischen Bereich der klassischen Physik: Ist das Medium, in dem sich Wellen ausbreiten, räumlich begrenzt, so gibt es stehende Wellen, die nur für diskrete Wellenlängen, die durch die Abmessungen des Mediums bestimmt sind, stationär existieren können (vgl. 18.1). Im mikroskopischen, atomphysikalischen Bereich musste jedoch auch das Wellenbild modifiziert werden. Die Erklärung der Planck’schen Strahlungsformel (siehe 20.2), des Fotoeffektes (siehe 16.7 und 20.3) und des Compton-Effektes (siehe 20.3) erforderte die Einführung partikelähnlicher Wellenpakete (siehe 18.1): Quantisierung des Lichtes (siehe 20.3).
25 Materiewellen
Tabelle 25-1. Charakteristika von Teilchen und Wellen im makroskopischen und im mikroskopischen Bereich
Teilchen (Partikel)
Welle
Makroskopischer Bereich räumlich lokalisiert; Energie, Impuls, Drehimpuls,. . . können beliebige Werte annehmen
Mikroskopischer Bereich Wellenverhalten: Materiewellen, nicht streng lokalisiert
räumlich ausgedehnt; Energie, Impuls,. . . können beliebige Werte annehmen, aber: Quantelung bei stehenden Wellen
Partikelverhalten: Lichtquanten, nicht beliebig ausgedehnt
Damit erhebt sich die Frage der Lokalisierbarkeit von Wellen. Bei einem klassischen Partikel ist die Ortsbestimmung im Prinzip kein Problem, der Ort eines Partikels lässt sich angeben. Eine Welle hingegen erfüllt immer ein gewisses Gebiet, das beliebig groß sein kann. Dann wird eine Ortsangabe für die Welle unmöglich. Erst der Übergang zu einer endlich langen Welle, einem örtlich begrenzten Wellenpaket (18.1), lässt eine Ortsangabe mit einer gewissen Unschärfe Δx zu, die etwa der Länge des Wellenpakets entspricht (Ausbreitung in x-Richtung angenommen): Δx = vp τ .
(25-1)
vp Phasengeschwindigkeit der Welle, τ zeitliche Dauer des Wellenzuges. Mit der Ortsunschärfe ist eine weitere Unschärfe verknüpft. Nach dem Fourier-Theorem ist ein zeitlich begrenzter Wellenzug der Zeitdauer τ als Überlagerung eines kontinuierlichen Spektrums von unbegrenzten Wellen anzusehen, deren spektrale Amplitudenverteilung (Bild 5-23) die Halbwertsbreite 1 (25-2) τ aufweist: Frequenzunschärfe. Die Frequenz eines Lichtquants hängt gemäß (20-38) mit seinem Impuls pγ = h/λ zusammen: vp vp = pγ . (25-3) ν= λ h Aus der Frequenzunschärfe Δν folgt danach eine Impulsunschärfe Δν ≈
ΔPx =
h h , Δν = vp vp τ
(25-4)
Energie, Impuls, Drehimpuls, ... quantisiert
woraus sich mit (25-1) ergibt: Δp x Δx = h .
(25-5)
Eine genauere Ableitung ergibt die Heisenberg’sche Unschärferelation (Heisenberg, 1927): Δp x Δx .
(25-6)
Die Unschärferelation verknüpft die aufgrund der Struktur von Wellenpaketen entstehenden prinzipiellen Messungenauigkeiten korrespondierender physikalischer Größen (Kennzeichen: das Produkt korrespondierender Größen hat die Dimension einer Wirkung) miteinander: Ort und Impuls eines Wellenpakets sind nicht gleichzeitig genau messbar. Je genauer der Ort bestimmt wird, desto weniger genau lässt sich sein Impuls bestimmen und umgekehrt. Wegen der Verwendung von (20-38) gilt die obige Ableitung der Unschärferelation zunächst für elektromagnetische Wellen (Lichtquanten), erweist sich aber auch für Materiewellen (25.2), elastische Wellen usw. als zutreffend. Dass man in der makroskopischen Physik von der Unschärferelation nichts bemerkt, liegt daran, dass das Planck’sche Wirkungsquantum h = 6,62606896 · 10−34 J · s so außerordentlich klein ist.
25.2 Die De-Broglie-Beziehung Die Zuordnung von im Sinne der klassischen Physik typischen Teilcheneigenschaften, wie Lokalisierbarkeit, Energie, Impuls usw., zu Wellen legt aus Symmetriegründen die Idee nahe (vgl. Tabelle 25-1), um-
B281
B282
B Physik
gekehrt den Materieteilchen auch Welleneigenschaften zuzuordnen: Materiewellen (de Broglie, 1924). Zwischen dem Impuls p = mv der Teilchen und der Wellenlänge λ der den Teilchen zugeordneten Materiewelle wurde derselbe Zusammenhang wie beim Licht (20-38) vermutet: p=
h . λ
(25-7)
Mit (12-53) folgt daraus für die Materiewellenlänge die De-Broglie-Beziehung: λ=
h h h = = √ . p mv 2emU
(25-8)
Für Elektronen gilt (25-8) nur für Beschleunigungsspannungen U < (104 . . . 105 ) V (vgl. 12.5). Bei relativistischen Geschwindigkeiten muss (12-55) verwendet werden. Werte für die DeBroglie-Wellenlänge von Elektronen finden sich in Tabelle 25-2 (siehe 25.4). Natürlich wird man hier wie bei den Lichtquanten annehmen, dass die den Teilchen zugeordneten Materiewellen eine begrenzte Länge haben, sodass es sich um Wellenpakete (18.1) handelt, die etwa am Ort des betreffenden Teilchens ihr Zentrum haben. Damit gilt aber die Heisenberg’sche Unschärferelation (25-6), die aus den Wellengruppeneigenschaften und p = h/λ resultierte, auch für Materiewellen. In weiterer Verfolgung der Analogie zur Lichtquantenvorstellung lässt sich die Energie bewegter Teilchen mit einer Frequenz ν entsprechend (20-36) verknüpfen. Nehmen wir ferner die Äquivalenz von Masse und Energie hinzu, so folgt mit (4-42) für die Frequenz einer Materiewelle mc20 . (25-9) h Damit ergibt sich für die Phasengeschwindigkeit einer Materiewelle mithilfe der De-Broglie-Beziehung (25-8) ν=
mc20 λ c20 = . (25-10) h v Da die Teilchengeschwindigkeit v die Vakuumlichtgeschwindigkeit c0 nicht übersteigen kann (vgl. 4.5), ist offenbar die Phasengeschwindigkeit einer Materiewelle immer größer als c0 . Weil nach (10) die Phasengeschwindigkeit von der Wellenlänge λ abhängt, liegt vp = νλ =
auch Dispersion vor. Für diesen Fall bestimmt sich die Gruppengeschwindigkeit vg , also die Ausbreitungsgeschwindigkeit des dem Teilchen zugeordneten Wellenpaketes (siehe 18.1) aus (18-27) vg = vp − λ
dvp dν = . dλ d(1/λ)
(25-11)
Beschränken wir uns zur Vereinfachung der Rechnung auf nichtrelativistische Teilchen (v c0 ), so ist nach (4-36) bis (4-38) 1 mc20 = m0 c20 + m0 v2 2
und
1 m0 v = . λ h
Damit folgt aus (25-9), (25-11) und (25-12) 1 2 2 d c0 + v 2 vg = =v, dv
(25-12)
(25-13)
d. h., die Teilchengeschwindigkeit ist gleich der Gruppengeschwindigkeit der dem Teilchen zugeordneten Wellengruppe (de Broglie), ein Ergebnis, das befriedigend zur Beschreibung eines Teilchens durch eine Wellengruppe passt. Mit (25-10) ergibt sich schließlich die für Materiewellen gültige Beziehung vg vp = c20 ,
(25-14)
die nicht auf elektromagnetische Wellen (Lichtquanten) übertragen werden darf. Anmerkung: Da die Energie mc20 in (25-9) nicht eindeutig ist, sondern durch eine potenzielle Energie Ep = eV mit frei wählbarem Nullpunkt ergänzt werden kann, ist die Phasengeschwindigkeit (25-10) willkürbehaftet. Andere Rechnungen liefern z. B. vp = vg /2. Dies zeigt, dass die Phasengeschwindigkeit von Materiewellen unbestimmt und eine nicht direkt beobachtbare Größe ist. Beobachtet wird stets nur die Gruppengeschwindigkeit. Der erste Erfolg des Materiewellenkonzepts war eine Deutung der stationären Bohr’schen Bahnen im Atom (siehe 16.1) als stehende Materiewelle der Bahnelektronen auf dem Bahnumfang. Dazu betrachten wir zwei Fälle: Bild 25-1a zeigt den instationären Fall, in dem der Bahnumfang 2πr nicht durch die Materiewellenlänge λ teilbar ist. Bei weiterer Verfolgung der Amplitudenverteilung der Materiewelle über den gezeichneten Bereich hinaus wird deutlich, dass sich
25 Materiewellen
Umlaufgeschwindigkeit des Elektrons ist! Die klassische Rechnung verliert hier also völlig ihren Sinn, d. h., ein solches System darf nicht wie ein klassischer elektromagnetischer Dipol behandelt werden.
25.3 Die Schrödinger-Gleichung Bild 25-1. Materiewellen auf einer Bohr’schen Bahn. a in-
stationärer Fall, b stationärer Fall für n = 3
die Welle durch Interferenz selbst auslöscht. Mit der in der Zeichnung angenommenen Wellenlänge kann sie auf der vorgegebenen Bahn nicht stationär existieren. Ein stationärer Fall ist nur dann möglich, wenn die Bedingung 2πrn = nλ (n = 1, 2, . . .)
(25-15)
erfüllt ist. Mit der De-Broglie-Beziehung (25-8) folgt dann sofort die Bohr’sche Quantenbedingung (16-7) für den Drehimpuls L = rn p = n
h = n , 2π
(25-16)
die sich hier ganz zwanglos aus der Forderung stationärer, stehender Materiewellen ergibt. Mit den den Elektronen im Atom zugeordneten Materiewellen lässt sich auch die im Bohr’schen Atommodell postulierte Strahlungslosigkeit der stationären Bohr’schen Bahnen deuten (vgl. 16.1): Eine längs der klassischen Elektronenbahn schwingende Materiewelle bedeutet, dass das Elektron (besser: seine Aufenthaltswahrscheinlichkeit bzw. die Wellenfunktion, vgl. 25.3) gewissermaßen über den Bahnumfang verschmiert ist. In diesem Bild stellt das System Atomkern – Elektron keinen schwingenden elektrischen Dipol mehr dar, und die Strahlungsnotwendigkeit entfällt. Noch deutlicher zeigt dies die Unschärferelation (25-6), wenn wir sie z. B. auf das Wasserstoffatom anwenden. Legt man den Ort des Elektrons nur etwa auf den Bereich des Atoms fest, wählt man also als Ortsunschärfe den Durchmesser der ersten Bohr’schen Bahn Δx = 2r1 = 106 pm (siehe 16-9), so ergibt sich eine aus der Impulsunschärfe folgende Geschwindigkeitsunschärfe, die von gleicher Größenordnung wie die klassisch nach (16-4) zu berechnende
Über die physikalische Größe, die bei einer Materiewelle schwingt, ist bisher nichts ausgesagt worden. Zur mathematischen Beschreibung wird daher zunächst eine allgemeine Wellenfunktion Ψ eingeführt, die z. B. für ein sich in x-Richtung bewegendes Elektron lauten kann Ψ (x, t) = Ψˆ e j(kx−ωt) = ψ(x)e−jωt .
(25-17)
Das Quadrat der Wellenfunktion eines Teilchens |Ψ (x, t)|2 = Ψ Ψ ∗ gibt die Wahrscheinlichkeitsdichte dafür an, das Teilchen zur Zeit t am Ort x anzutreffen. Demgemäß wird Ψ auch als Wahrscheinlichkeitsamplitude bezeichnet (genauer: deren Dichte). Handelt es sich um viele Teilchen, die durch dieselbe Wellenfunktion beschrieben werden können, so ist |Ψ |2 ∼ n (n Teilchenzahlkonzentration). Die Wellenfunktion muss der Wellengleichung (18-7) genügen ∂2 Ψ 1 ∂2 Ψ − 2 · 2 =0. 2 ∂x vp ∂t
(25-18)
Einsetzen der Wellenfunktion (25-17) liefert für den ortsabhängigen Teil ψ(x) der Wellenfunktion d2 ψ ω2 + 2ψ=0. dx2 vp
(25-19)
Mit der de-Broglie’schen Beziehung p = h/λ und mit vp = νλ wird ω2 p2 = 2 . 2 vp
(25-20)
Aus dem Energiesatz folgt p2 = 2m(E − Ep ) ,
(25-21)
und aus (25-19) bis (25-21) schließlich die eindimensionale zeitfreie Schrödinger-Gleichung (1926): d2 ψ 2m + 2 (E − Ep )ψ = 0 . dx2
(25-22)
B283
B284
B Physik
Wird für Ep die potenzielle Energie des Elektrons in dem jeweiligen System eingesetzt, so beschreibt die Schrödinger-Gleichung dieses System. Beispiele sind (ohne Durchrechnung im Einzelnen): Freies Elektron: Ep = 0. Hierfür ergibt sich aus (25-22) eine räumliche Schwingungsgleichung. Mit dem Lösungsansatz ψ(x) = ψˆ e jkx
(25-23)
erhält man E=
p2 2 k 2 = , 2m 2m
(25-24)
d. h. die kinetische Energie eines freien Elektrons. Dabei ist eine Lösung für jeden Wert von E möglich, die Energie des freien Elektrons ist demnach nicht quantisiert. mω20 2 x (vgl. (5-26)). Harmonische Bindung: Ep = 2 Bei diesem Potenzial ergeben sich stationäre Lösungen für ψ nur bei bestimmten Eigenwerten der Energie: 1 E = En = n + (25-25) hν . 2 Dies sind die schon bei der Behandlung des harmonischen Oszillators angegebenen möglichen Energiewerte (vgl. 5.2.2). Die Energiequantelung erhält man hier also als Lösung des Eigenwertproblems der Schrödinger-Gleichung. Berechnet man die zugehörigen Wellenfunktionen für die verschiedenen Quantenzahlen n = 0, 1, . . . , so zeigt sich, dass es sich auch hier um eine Art stehender Wellen im Parabelpotenzial des harmonischen Oszillators (Bild 25-2, vgl. auch Bild 5-8) handelt. Coulomb-Potenzial des H-Atoms: Ep = −
e2 4πε0 r
(siehe 16.1) .
In diesem Falle erhält man stationäre Lösungen für die Wellenfunktion der Elektronen im Wasserstoffatom nur für die Energie-Eigenwerte En = −
me e 4 1 · . 8ε20 h2 n2
(25-26)
Bild 25-2. a Wellenfunktion (Wahrscheinlichkeitsamplitude), b Aufenthaltswahrscheinlichkeitsdichte für ein Teilchen im Parabelpotenzial der harmonischen Bindung (harmonischer Oszillator)
Dies sind die stationären Energiewerte des Wasserstoff-Atoms, wie sie sich auch aus der Bohr’schen Theorie ergeben haben (16-10). Die Schrödinger’sche Wellenmechanik, deren Grundgleichung die Schrödinger-Gleichung z. B. in der Form (25-22) ist, hat sich in der Atomphysik und in der Chemie (vgl. C 1.4) als außerordentlich erfolgreich erwiesen.
25.4 Elektronenbeugung, Elektroneninterferenzen Der Erfolg der Materiewellenhypothese von de Broglie bei der Deutung der stationären Elektronenzustände im Atom wäre unvollständig ohne einen direkten experimentellen Nachweis für die Welleneigenschaften von Teilchen. Dieser Nachweis wurde ähnlich wie bei den Röntgenstrahlen (vgl. 23.2) durch Beugung am Atomgitter von Kristallen erbracht, und zwar einerseits durch Reflexionsbeugung langsamer Elektronen (E = (30 . . . 300) eV) an Nickel-Einkristallen (Davisson u. Germer, 1927) und andererseits durch Beugung mittelschneller Elektronen (E = (10 . . . 100) keV) bei der Durchstrahlung (Transmission) dünner kristalliner Schichten (G.P. Thomson, 1927). Bild 25-3a zeigt im Prinzip die Anordnung nach Thomson. Dünne einkristalline Schichten verhalten sich dabei ähnlich wie Kreuzgitter (vgl. 23.2), d. h., sie ergeben ein zweidimensionales Beugungsmuster (Bild 25-3b). Trifft dagegen der Elektronenstrahl auf viele kleine, statistisch
25 Materiewellen
Bild 25-3. Elektronenbeugung an kristallinen Schichten (in Transmission): Beugung von 100-keV-Elektronen an Zinnschichten (Dicke: 80 nm). a Prinzip der Anordnung, b einkristalline Schicht, c polykristalline Schicht. (Aufnahmen: G. Jeschke, I. Phys. Inst. TU Berlin)
orientierte Kristallite, wie sie in einer polykristallinen Schicht vorliegen, so überlagern sich die von den einzelnen Kristalliten stammenden Beugungsreflexe zu Beugungsringen (Bild 25-3c), ganz entsprechend den Debye-Scherrer-Beugungsdiagrammen bei der Röntgenbeugung an Kristallpulvern (vgl. 23.2). Aus den Beugungswinkeln ϑB der beobachteten Reflexe lassen sich über die auch hier gültige Bragg’sche Gleichung (23-23) 2g sin ϑB = nλ
(25-27)
die zugehörigen Netzebenenabstände g bzw. Gitterkonstanten bestimmen, wenn man für λ die De-Broglie-Wellenlänge ((25-8), Tabelle 25-2) einsetzt. Ähnlich wie die Röntgenbeugung ist daher die Elektronenbeugung heute ein wichtiges Hilfsmittel der Kristallstruktur- und Substanzanalyse, und jedes (Transmissions-)Elektronenmikroskop (vgl. 25.5) ist heute auch für Elektronenbeugungsaufnahmen eingerichtet. Die aus der Elektronenbeugung an Kristallen resultierenden Beugungsdiagramme (Bild 25-3) stellen Fraunhofer’sche Beugungsdiagramme an atomaren Strukturen dar. Letzte mögliche Zweifel an der Aussagekraft solcher Wechselwirkungen von Elektronen mit atomaren Abständen als Nachweis für
Bild 25-4. Fresnel’sche Elektronenbeugung an der Kante nach Boersch. E = 38 keV, a = 140 μm (H. Boersch: Naturwiss. 28 (1940) 909; Phys. Z. 44 (1943) 202)
die Wellennatur der Elektronen können durch die Fresnel’sche Beugung von Elektronen an einer makroskopischen Kante, wie Bild 25-4 zeigt (Boersch, 1940), als beseitigt gelten. In der Lichtoptik ist es möglich, das Licht einer Lichtquelle mittels zweier mit den Basisflächen gegeneinandergesetzter Prismen (Fresnel’sches Biprisma) in zwei kohärente Teilbündel aufzuteilen und diese damit gegenseitig zu überlagern. Im Überlagerungsbereich beobachtet man auf einem Schirm Zweistrahlinterferenzen. Das entsprechende Experiment lässt sich auch mit kohärenten Elektronenstrahlbündeln durchführen (Möllenstedt u. Düker, 1956). Zur Überlagerung Tabelle 25-2. De-Broglie-Wellenlängen von Elektronen
Beschleunigungsspannung 1V 10 V 100 V 1 kV 10 kV 100 kV 1 MV 10 MV a relativistisch korrigiert
Wellenlänge λ/pm 1200 390 120 39 12 3,7a 0,87a 0,12a
B285
B286
B Physik
im Überlagerungsbereich unter dem Biprisma (gegebenenfalls nach elektronenoptischer Vergrößerung fotografisch) aufgezeichnete Interferenzmuster stellt das Elektronenhologramm dar, das die Amplitudenund Phaseninformation der Objektwelle enthält (vgl. 24.2). Die Rekonstruktion des Objektbildes aus dem aufgezeichneten Hologramm kann nun beispielsweise mit Licht oder rechnerisch per Computer erfolgen. Da sich hierbei die Abbildungsfehler elektronenoptischer Linsen (25.5) kompensieren lassen, hat dieses Verfahren eine besondere Bedeutung bei der modernen Höchstauflösungs-Elektronenmikroskopie (Lichte, 1986). Bild 25-5. Zweistrahl-Elektroneninterferenzen am elektro-
nenoptischen Biprisma nach Möllenstedt (G. Möllenstedt, H. Düker: Z. Phys. 145 (1956) 377)
beider Teilbündel wird ein elektronenoptisches Biprisma (Bild 25-5) verwendet, das im Wesentlichen aus einem sehr dünnen Draht (1 bis 10 μm Durchmesser) besteht, der gegenüber der Umgebung positiv aufgeladen wird und die Umlenkung der Elektronenbündel bewirkt. Im Überlagerungsbereich erhält man Zweistrahlinterferenzen der beiden Elektronenwellenbündel (Bild 25-5). Mit einer solchen Anordnung kann im Prinzip auch Elektronenholografie betrieben werden. Die beiden Teilbündel des elektronenoptischen Biprismas können nämlich als Objektwelle einerseits und als Referenzwelle andererseits benutzt werden, in völliger Analogie zur lichtoptischen Holografie (vgl. 24.3). Dazu wird das Untersuchungsobjekt (z. B. eine sehr dünne Schicht) in das eine Teilbündel gebracht. Das
25.5 Elektronenoptik Das Auflösungsvermögen des Lichtmikroskops ist auf die Wellenlänge des Lichtes von etwa 500 nm begrenzt (vgl. 24.1). Ein besseres Auflösungsvermögen ist nach Abbe (24-1) nur durch Verwendung einer Strahlung kleinerer Wellenlänge erreichbar. Elektromagnetische Strahlung wesentlich kleinerer Wellenlänge bzw. höherer Frequenz (z. B. Röntgenstrahlung) scheidet praktisch aus, da die Brechzahl der Stoffe bei solchen Frequenzen sehr nahe bei 1 liegt (siehe 20.1), sodass sich keine Linsen für derartige Strahlungen herstellen lassen. Dagegen haben Elektronen bei Energien um 100 keV Wellenlängen von etwa 4 pm (Tabelle 25-2), die damit weit kleiner als die Atomabstände in kondensierter Materie sind. Außerdem lassen sich Elektronen durch elektrische oder magnetische Felder (wie Licht durch ein Prisma) ablenken, sodass eine Elektronenoptik z. B. mit rotationssymmetrischen elektrischen oder magnetischen Feldern als Elektronenlinsen mög-
Bild 25-6. Elektronenlinsen. a elektrische Einzellinse; b magnetische Linse
25 Materiewellen
Bild 25-7. Prinzipieller, stark vereinfachter Aufbau eines
abbildenden Transmissions-Elektronenmikroskops
lich ist (Hans Busch, 1926). Bild 25-6 zeigt Ausführungsformen solcher Elektronenlinsen, und zwar eine elektrostatische Dreielektrodenlinse (a) sowie eine eisengekapselte magnetische Linse mit Ringspalt (b). Die Brechkräfte solcher Linsen berechnen sich nach Busch für achsennahe Elektronenstrahlen folgendermaßen (ohne Ableitung): Brechkraft der elektrischen Einzellinse: 2 " dU 1 1 ≈ √ U −3/2 dz . (25-28) f dz 8 Ub Brechkraft der magnetischen Linse: " 1 e ≈ B2z dz . f 8mUb
(25-29)
Die Integrale sind längs der optischen Achsen zu erstrecken, soweit die Achsenfeldstärken Ez = dU/dz oder Bz von 0 verschieden sind. Ub ist die Beschleunigungsspannung der Elektronen, und U = U(z) das variable Potenzial auf der optischen Achse (bei der elektrischen Linse). Zur Erzielung kurzer Brennweiten muss der Feldbereich kurz, aber von hoher Feldstärke sein. Es kommt daher z. B. bei den magnetischen Linsen sehr auf geeignete Formung der Polschuhe am Ringspalt an. Entsprechend den beiden Linsentypen hat man zwei Entwicklungslinien von Elektronenmikroskopen verfolgt: magnetische Elektronenmikroskope (Knoll
u. Ruska, 1931, Bild 25-7) und elektrostatische Elektronenmikroskope (Brüche u. Johannson, 1932). Aus technischen Gründen haben sich heute die magnetischen Elektronenmikroskope weitgehend durchgesetzt. Elektronenlinsen haben sehr große Öffnungsfehlerkoeffizienten CÖ (siehe 22.2) im Vergleich zu lichtoptischen Linsen. Für eine minimale Unschärfe (vgl. Bild 22-14) muss daher die Objektivöffnung bei Elektronenlinsen auf einen Aperturwinkel ϑ0 ≈ 4·10−2 rad (≈ 2◦ ) beschränkt werden, sodass die der Wellenlänge entsprechende Grenzauflösung nicht erreicht wird. Die Abbe’sche Auflösungsgrenze (24-1) beträgt dabei etwa dmin ≈ 0,1 nm, sodass dennoch eine atomare Auflösung heute möglich ist. Ein ganz anderes elektronenmikroskopisches Verfahren stellt das Rasterelektronenmikroskop (Knoll, 1935; v. Ardenne, 1938) dar. Hierbei werden die Objektpunkte durch eine sehr feine elektronenoptisch verkleinerte Elektronensonde von 1 bis 10 nm Durchmesser nacheinander rasterförmig abgetastet (Bild 25-8). In der getroffenen Objektstelle werden Elektronen rückgestreut (RE) und Sekundärelektronen (SE) ausgelöst und von Elektronendetektoren registriert. Das daraus entstehende elektrische Signal wird verstärkt und zur Helligkeitssteuerung des Elektronenstrahls einer Fernsehbildröhre verwendet, der synchron mit dem Abtaststrahl im Rastermikroskop zeilenweise über den Leuchtschirm geführt wird, auf dem dadurch das Bild der abgetasteten Objektfläche erscheint. Dieses Verfahren gestattet damit auch die elektronenmikroskopische Direktabbildung von Oberflächen massiver Objekte. Bei dünnen Schichten als Objekt können auch die transmittierten Elektronen (TE) als Bildsignal dienen. Eine vom Prinzip her extrem einfache Art der Abbildung durch Oberflächenabtastung ist die RasterTunnelmikroskopie (Binnig u. Rohrer, 1982). Eine mittels piezoelektrischer Verstellelemente dreidimensional verschiebbare, feine Metallspitze wird der zu untersuchenden Oberfläche auf ca. 1 nm genähert (Bild 25-9). Wird zwischen Spitze und Objektoberfläche eine elektrische Spannung UT angelegt, so fließt ein Strom IT , obwohl keine metallisch leitende Verbindung vorliegt. Ursache ist der quantenmechanische Tunneleffekt, der auch für die Feldemission (siehe 16.7) maßgebend ist. Der „Tunnelstrom“ IT
B287
B288
B Physik
Bild 25-8. Prinzipieller Aufbau eines Raster-Elektronenmikroskops zur Abbildung von Oberflächen mit Rückstreuelektronen (RE) oder Sekundärelektronen (SE), bzw. von dünnen Schichten mit transmittierten Elektronen (TE)
hängt exponentiell vom Abstand s zwischen Spitze und Objektoberfläche ab. Man erhält nach Binnig und Rohrer für den Tunnelstrom die Beziehung UT √ −β √Φs Φe , (25-30) IT ∼ s mit Φ mittleres Austrittspotenzial von Spitze √ und Objektoberfläche für Elektronen und β = 2 2me e/ = 10,25 V−0,5 nm−1 .
Beim rasternden Abtasten der Objektoberfläche mittels der piezoelektrischen y- und x-Verstellung (Py und P x ) werden mithilfe einer Rückkopplung auf die Abstandsverstellung Pz der Tunnelstrom IT und damit der Abstand s der Spitze von den Oberflächenstrukturen konstant gehalten. Die Spitze folgt dann allen Höhenveränderungen der Objektoberfläche. Wird das Regelsignal Up als Bildsignal über der x, y-Ebene aufgezeichnet, so erhält man ein Rasterbild der Objekt-
Bild 25-9. Objekt-Abtastverfahren beim Raster-Tunnelmikroskop nach Binnig und Rohrer
Literatur
oberfläche. Der Raster- und Wiedergabeteil entspricht dabei demjenigen im Raster-Elektronenmikroskop (Bild 25-8). Die Auflösung konnte mit sehr feinen Spitzen soweit getrieben werden, dass einzelne Atome aufgelöst werden können.
Literatur Handbücher und Nachschlagewerke
Bergmann/Schaefer: Lehrbuch der Experimentalphysik (8 Bde.) Versch. Aufl. Berlin: de Gruyter 1999– 2006 Greulich, W. [Hrsg.]: Lexikon der Physik (6 Bde.). Heidelberg: Spektrum Akad. Verl. 2003 Hering, E.; Martin, R.; Stohrer, M.: Taschenbuch der Mathematik und Physik. 4. Aufl. Berlin: Springer 2005 Kuchling, H.: Taschenbuch der Physik. 18. Aufl. Hanser Fachbuchverlag München; Fachbuchverlag Leipzig 2001 Lide, D. R.: CRC Handbook of Chemistry and Physics. 86th ed. Boca Raton, Fla.: CRC Press 2005 Paul, H. [Hrsg.]: Lexikon der Optik (2 Bde.) Berlin: Springer 2003 Stöcker, H. (Hrsg.): Taschenbuch der Physik. 5. Aufl. Frankfurt/M.: Deutsch 2004 Westphal, W. H.: Physikalisches Wörterbuch. Berlin: Springer 1952 Allgemeine Lehrbücher
Alonso, M.; Finn, E. J.: Physik. 3. durchges. Aufl. München: Oldenbourg 2000 Berkeley Physik-Kurs (5 Bde.). Versch. Aufl. Wiesbaden: Vieweg 1989–1991 Demtröder, W.: Experimentalphysik I-IV. Versch. Aufl. Berlin: Springer 2005–2006 Feynman, R. P.; Leighton, R. B.; Sands, M.: Vorlesungen über Physik. (3 Bde.). Versch. Aufl. München: Oldenbourg 1999–2001
Gerthsen, C., Meschede, D.: Physik. 23. Aufl. Berlin:Springer 2006 Halliday, D.; Resnick, R.; Walker, J.: Physik. Weinheim: Wiley VCH 2005 Hänsel, H.; Neumann, W.: Physik I-IV. Heidelberg: Spektrum Akad. Verl. 2000–2002 Hering, E.; Martin, R.; Stohrer, M.: Physik für Ingenieure. 9. Aufl. Berlin: Springer 2004 Niedrig, H.: Physik. Berlin: Springer 1992 Orear, J.: Physik. 4. Aufl. München: Hanser 1989 Stroppe, H.: Physik. 13. Aufl. Fachbuchverlag Leipzig/Hanser Fachbuchverlag München; 2005 Tipler, P. A.: Physik. 5. Aufl. Heidelberg: Spektrum Akad. Verl. 2004 Darstellungen von Einzelgebieten
Born, M.: Optik. 4. Aufl. Berlin: Springer 2006 Bucka, H.: Atomkerne und Elementarteilchen. Berlin: de Gruyter 1973 Buckel, W., Kleiner, R.: Supraleitung. 6. Aufl. Weinheim: Wiley-VCH 2004 Eichler, J.; Eichler, H. J.: Laser. 5. Aufl. Berlin: Springer 2003 Ibach, H.; Lüth, H.: Festkörperphysik. 6. Aufl. Berlin: Springer 2002 Kittel, Ch.: Einführung in die Festkörperphysik. 14. Aufl. München: Oldenbourg 2005 Mayer-Kuckuk, T.: Atomphysik. 5. Aufl. Stuttgart: Teubner 1997 Mayer-Kuckuk, T.: Kernphysik. 7. Aufl. Stuttgart: Teubner 2002 Oertel, H. [Hrsg,],Prandtl, L.: Führer durch die Strömungslehre. 11. Aufl. Wiesbaden: Vieweg 2002 Schade, H.; Kunz, E.: Strömungslehre. 2. Aufl. Berlin: de Gruyter 2000 Schuster, H. G.: Deterministisches Chaos. 3. Aufl. Weinheim: Wiley-VCH 1995 Stierstadt, K.: Physik der Materie. Weinheim: WileyVCH 2000 Weber, H.; Herziger, G.: Laser. 3. Aufl. Weinheim: Physik-Verl. 1985
B289
C1
Chemie ist die Wissenschaft von chemischen Reaktionen und den physikalisch-chemischen Eigenschaften von Stoffen. Chemie befasst sich mit der Zusammensetzung und der Struktur von Substanzen ebenso wie mit den Bedingungen und Auswirkungen von Reaktionen. Im Hochschulbereich wird die Chemie häufig in die Anorganische Chemie, die Organische Chemie und die Physikalische Chemie unterteilt; daneben sind als Teilfächer die Analytische Chemie, die Technische Chemie, die Makromolekulare Chemie und die Theoretische Chemie verbreitet. Chemie hat Übergangsgebiete zur Physik (Atom- und Molekülphysik, Thermodynamik, Halbleiterphysik), Biologie (Biochemie, Molekularbiologie), den Geowissenschaften (Kristallographie) und den Ingenieurwissenschaften (Verfahrenstechnik, Werkstoffkunde, Umwelttechnik).
1 Atombau 1.1 Das Atommodell von Rutherford Lenard (1903) untersuchte die Streuung von Elektronen an Metallfolien. Die Ergebnisse dieser Messungen ermöglichten Rückschlüsse auf die Größe der streuenden Metallatome. Bei der Verwendung langsamer (energiearmer) Elektronen ergab sich ein Atomradius von etwa 10−10 m. Wurden schnelle Elektronen verwendet, so führten die Versuchsergebnisse zu einem Radius von ca. 10−14 m. Rutherford führte mit α-Teilchen (das sind zweifach positiv geladene Heliumatome) ähnliche Streuversuche an dünnen Goldfolien durch. In Übereinstimmung mit den Versuchsergebnissen, die Lenard mit schnellen Elektronen erhielt, ergaben Rutherfords Experimente einen Teilchenradius von etwa 10−14 m.
Folgerungen Rutherfords: Ein Atom besteht demnach aus einer Hülle und einem Kern. Der Durchmesser des Atomkerns beträgt etwa 10−14 m, der der Hülle ungefähr 10−10 m. Im Kern des Atoms muss praktisch die gesamte Masse des Atoms vereinigt sein, da sonst eine Ablenkung der relativ schweren α-Teilchen nicht möglich ist. Um den positiv geladenen Kern kreisen die fast masselosen, negativ geladenen Elektronen (Ruhemasse eines Elektrons me = 9,1093897 · 10−31 kg) mit einer solchen Geschwindigkeit, bei der die Zentrifugalkraft durch die Coulomb’sche Anziehungskraft gerade kompensiert wird (Planetenmodell des Atoms). Kritik des Rutherford’schen Atommodells: – Dieses Atommodell steht im Widerspruch zu den Gesetzen der klassischen Elektrodynamik, wonach elektrisch geladene Teilchen, die eine beschleunigte Bewegung ausführen, Energie in Form von elektromagnetischer Strahlung abgeben müssen. Deshalb können Elektronen in Atomen, die nach Rutherfords Vorstellungen aufgebaut sind, den Kern nicht mit konstantem Abstand umkreisen, sondern müssten sich spiralförmig dem Atomkern nähern, um schließlich auf ihn zu stürzen. – Eine Erklärung der Linienstruktur der Atomspektren (vgl. B 20.4) ist mit diesem Atommodell nicht möglich.
C
1.2 Das Bohr’sche Atommodell Um die unter 1.1 erwähnten Widersprüche der Rutherford’schen Theorie zu beseitigen, stellte Niels Bohr die folgenden zwei Postulate als Grundlagen seines Atommodells auf: 1. Es gibt Elektronenbahnen, auf denen die Elektronen den Atomkern umkreisen können, ohne Energie durch Strahlung zu verlieren (so genannte stationäre Zustände). Es existiert eine diskontinuier-
Chemie
C
Chemie
B. Plewinsky M. Hennecke W. Oppermann
C2
C Chemie
liche Schar solcher Bahnen. Für sie gilt die Bedingung, dass der Drehimpuls des Elektrons ein ganzzahliges Vielfaches des Drehimpulsquantums = h/2π sein muss (h = 6,62606896 · 10−34 J s Planck-Konstante): me vn rn = n me Ruhemasse des Elektrons, vn Geschwindigkeit des Elektrons auf der n-ten Bahn, rn Radius der n-ten Bahn. Die Zahl n, die als Haupt-Quantenzahl bezeichnet wird, kann ganzzahlige Werte von 1 bis unendlich annehmen. 2. Beim Übergang eines Elektrons zwischen zwei stationären Zuständen wird rein monochromatische Strahlung emittiert bzw. absorbiert. Ihre Frequenz ν ist durch die Energiedifferenz ΔE der stationären Zustände gegeben: h ν = ΔE . Leistung und Grenzen des Bohr’schen Atommodells – Atomspektren: Das Linienspektrum des Wasserstoffatoms (vgl. B 20.4) lässt sich, wie Balmer empirisch fand, durch die folgende Gleichung darstellen: ⎛ ⎞ ⎜⎜ 1 1 ⎟⎟ v = Rv ⎜⎜⎝ 2 − 2 ⎟⎟⎠ , na > ni . ni na Rv = 3,28984195 · 1015 Hz Rydberg-Frequenz, ni , na Haupt-Quantenzahlen. Mithilfe der Bohr’schen Theorie ist es möglich, die Rydberg-Frequenz und damit das Spektrum des Wasserstoffatoms zu berechnen. Anschaulich lässt sich nach Bohr das Zustandekommen des Linienspektrums des Wasserstoffatoms folgendermaßen interpretieren: Durch Energiezufuhr wird das Elektron vom Grundzustand (n = 1) auf einen angeregten Zustand (na > 1) angehoben. Wenn das Elektron dann wieder auf eine energieärmere (kernnähere) Bahn (ni < na ) zurückfällt, gibt es Energie in Form eines Photons ab. Die Energie des Photons ist gleich der Energiedifferenz der beiden stationären Zustände (vgl. Bild 1-1). Die Spektren von Atomen mit mehr als einem Elektron können mit Hilfe der Bohr’schen
Bild 1-1. Termschema des Wasserstoffatoms
Theorie nicht mehr quantitativ beschrieben werden. – Periodensystem: Das Bohr’sche Atommodell wurde besonders von Sommerfeld verfeinert. Diese erweiterte Theorie ermöglichte es, die Systematik des Periodensystems (siehe 2) mithilfe weiterer Quantenzahlen (siehe 1.4.2) zu deuten. – Heisenberg’sche Unschärferelation: Nach Heisenberg ist es nicht möglich, gleichzeitig genaue Angaben über Ort und Geschwindigkeit von Partikeln zu machen. Es gilt (vgl. B 25.1): Δp x Δx ≥ h/2π = . Δp x , Δx Unbestimmtheit von Impuls- bzw. Ortskoordinaten derselben Raumrichtung. Als Folge dieser Theorie muss die Vorstellung einer Teilchenbahn von Mikroobjekten – z. B. von Elektronen – aufgegeben werden.
1.3 Ionisierungsenergie, Elektronenaffinität Als Ionisierungsenergie wird die Energie bezeichnet, die zur Abtrennung eines Elektrons aus einem Atom A erforderlich ist. Dieser Vorgang kann durch folgende Gleichung beschrieben werden: A → A+ + e − . Von dem einfach positiv geladenen Ion A+ können weitere Elektronen abgegeben werden. Auf diese Weise entstehen mehrfach geladene Ionen, z. B.: A+ → A2+ + e− .
1 Atombau
Tabelle 1-1. Elektronenaffinität EA einiger Atome
Vorgang F + Cl + Br + I + H + O + O +
e− e− e− e− e− e− 2 e−
F− Cl− Br− I− H− O− O2−
→ → → → → → →
EA /eV −3,401 −3,613 −3,364 −3,059 −0,754 −1,461 +7,20
Die Ionisierungsenergie für die Abtrennung des ersten Elektrons ist für die Hauptgruppenelemente in den Tabellen 10-1 bis 10-8 zusammengefasst. Elektronenaffinität heißt die bei der Bildung negativ geladener Ionen aus Atomen freiwerdende oder benötigte Energie entsprechend der folgenden Reaktion: A + e − → A− . An einfach negativ geladene Ionen können weitere Elektronen angelagert werden, z. B.: A− + e− → A2− . Tabelle 1-1 enthält einige Werte der Elektronenaffinität.
1.4 Das quantenmechanische Atommodell 1.4.1 Die Ψ-Funktion
In der Quantenmechanik wird jedem Zustand eines Atoms eine Funktion Ψ der Ortskoordinaten (x,y,z) seiner sämtlichen Elektronen zugeordnet (vgl. B 25.3). Aus diesen sog. Zustands- oder Wellenfunktionen lassen sich im Prinzip sämtliche Informationen über das System mathematisch errechnen. Die Wellenfunktion Ψ selbst hat keine anschauliche physikalische Bedeutung (Ψ nimmt in der Regel komplexe Werte an). Ihr Betragsquadrat |Ψ |2 jedoch kann als Wahrscheinlichkeitsdichte bzw. Elektronendichte interpretiert werden. Beim Wasserstoffatom, das nur ein Elektron besitzt, gibt |Ψ |2 (x, y, z) dx dy dz die Wahrscheinlichkeit an, das Elektron im Volumenelement dx dy dz anzutreffen. Entsprechend ist das Produkt e|Ψ |2 (x, y, z) ,
e Elementarladung ,
die Elektronendichte an der Stelle x, y, z.
1.4.2 Die Schrödinger-Gleichung für das Wasserstoffatom
Die Wellenfunktionen der stationären Zustände können durch Lösen der Schrödinger-Gleichung (vgl. B 25.3) ermittelt werden. Für das Elektron im Wasserstoffatom nimmt die zeitunabhängige Schrödinger-Gleichung die folgende Form an: 8π2 me e2 2 ∇ Ψ+ E− Ψ =0. r h2 ∇2 Laplace-Operator, me Ruhemasse des Elektrons, h Planck-Konstante, E Gesamtenergie, e Elementarladung, r Radius. Zur Lösung der Schrödinger-Gleichung für das Wasserstoffatom ist es – wie auch bei der Behandlung anderer zentralsymmetrischer Probleme – zweckmäßig, eine Transformation der kartesischen Koordinaten (x, y, z) in Kugelkoordinaten (Radius r, Winkel θ und ϕ) vorzunehmen. Die Schrödinger-Gleichung hat nur für ganz bestimmte Werte der Energie E Lösungen Ψ . Diese Energiewerte heißen Eigenwerte, die zugehörenden Lösungen werden Eigenfunktionen oder Eigenzustände genannt. Gehört zu jedem Energieeigenwert nur eine einzige Eigenfunktion, so bezeichnet man diesen Eigenwert als nicht entartet. Gehören dagegen mehrere Eigenfunktionen zum gleichen Energiewert, so spricht man von Entartung. Die Lösungen der Schrödinger-Gleichung für das Wasserstoffatom haben die allgemeine Form Ψn, l, m (r, θ, ϕ) = Rn, l (r)Yl, m (θ, ϕ) . Rn, l (r) ist der Radialteil und Yl, m (θ, ϕ) der Winkelteil der Wellenfunktion. Die Radialfunktion enthält nur die Parameter n und l, die Winkelfunktion nur l und m. Diese und ähnliche Funktionen, die die Zustände eines Elektrons in einem Atom beschreiben, werden häufig als Atomorbitale oder kurz Orbitale bezeichnet. Die Parameter n, l, m sind Quantenzahlen. Sie werden folgendermaßen benannt (vgl. Tabelle 1-2): Haupt-Quantenzahl n n = 1, 2, 3, . . .
C3
C4
C Chemie
Tabelle 1-2. Besetzungsmöglichkeiten der Elektronenzustände für die ersten vier Haupt-Quantenzahlen n; l Bahndrehimpuls-Quantenzahl, s Spin-Quantenzahl, Ze maximale Zahl von Elektronen gleicher Haupt-Quantenzahl
n 1 2
Schale K L
3
M
4
N
l 0 0 1 0 1 2 0 1 2 3
Symbol 1s 2s 2p 3s 3p 3d 4s 4p 4d 4f
magnetische Quantenzahl 0 0 −1, 0, +1 0 −1, 0, +1 −2, −1, 0, +1, +2 0 −1, 0, +1 −2, −1, 0, +1, +2 −3, −2, −1, 0, +1, +2, +3
s ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2 ±1/2
Ze 2 8
18
32
Bahndrehimpuls-Quantenzahl (Neben-Quantenzahl) l l = 0, 1, 2, . . . , n − 1 Magnetische Quantenzahl m m = −l, −l + 1, . . . , −1, 0, +1, . . . , l − 1, l. Aus historischen Gründen bezeichnet man Zustände mit l = 0, 1, 2 und 3 als s-, p-, d- bzw. f-Zustände. Zustände gleicher Haupt-Quantenzahl bilden eine so genannte Schale. Hierbei gelten folgende Bezeichnungen: Zustände mit n = 1, 2, 3, 4 oder 5 heißen K-, L-, M-, N- bzw. O-Schale. Beim Wasserstoffatom hängen die Eigenwerte der Energie nur von der Haupt-Quantenzahl n ab, d. h., innerhalb einer Schale sind alle Zustände entartet. Der Zustand niedrigster Energie (beim Wasserstoffatom bei n = 1) wird als Grundzustand bezeichnet. Spin-Quantenzahl s: Elektronen haben drei fundamentale Eigenschaften: Masse, Ladung und Spin (Eigendrehimpuls). Der Spin kann durch die SpinQuantenzahl s charakterisiert werden. Bei Elektronen kann s die Werte + 12 und − 12 annehmen. 1.4.3 Darstellung der Wasserstoff-Orbitale
Die Darstellung der Wellenfunktion erfordert mit den drei unabhängigen Variablen x, y, z bzw. r, θ, ϕ (vgl. 1.4.2) ein vierdimensionales Koordinatensystem. Zweidimensionale Teildarstellungen sind: – Quasi-dreidimensionale Wiedergabe der Winkelfunktion Yl, m . Die in Bild 1-2 dargestellten Flächen entstehen, indem man in jeder Raumrichtung den Betrag abträgt, den die jeweilige Winkelfunktion für diese Richtung liefert.
Bild 1-2. Graphische Darstellung der Winkelfunktion von
Orbitalen des Wasserstoffatoms
1 Atombau
– Darstellung des Radialteils der Wellenfunktion Rn, l bzw. der Radialverteilung 4πr2 R2n, l als Funktion des Radius r.
Pauli-Prinzip: In einem Atom können niemals zwei oder mehr Elektronen in allen vier Quantenzahlen übereinstimmen.
1.4.4 Mehrelektronensysteme
Hund’sche Regel: Atomorbitale, deren Energieeigenwerte entartet sind, werden zunächst mit Elektronen parallelen Spins besetzt. Die Zahl der Elektronen, die die gleiche HauptQuantenzahl haben können, beträgt 2n2 . Diese Verhältnisse sind in Tabelle 1-2 dargestellt.
Infolge der Wechselwirkung zwischen den Elektronen ist die Schrödinger-Gleichung für Atome mit mehreren Elektronen nicht mehr exakt lösbar. Ein verbreitetes Näherungsverfahren besteht darin, die Wechselwirkung eines jeden Elektrons mit den anderen durch ein effektives Potential zu ersetzen, das dem elektrostatischen Potential der Anziehung durch den Atomkern überlagert wird. Auf diese Weise gelingt es, ein Mehrelektronensystem näherungsweise in lauter Einelektronensysteme zu entkoppeln, deren Schrödinger-Gleichungen dann separat gelöst werden können. Die resultierenden Orbitale ähneln weitgehend denen des Wasserstoffatoms. Sie haben dieselben Winkelanteile, jedoch andere Radialanteile als die entsprechenden Wellenfunktionen des Wasserstoffatoms. Wie beim Wasserstoffatom wird der Zustand eines Elektrons vollständig durch die Angabe der Werte der vier Quantenzahlen n, l, m und s beschrieben. Die Energieeigenwerte hängen nun jedoch von n und l ab, d. h., gegenüber dem Wasserstoffatom ist die l-Entartung aufgehoben. Energien und Wellenfunktionen eines Atoms mit mehreren Elektronen werden nun aus denen der einzelnen Elektronen aufgebaut: die Energien als Summe, die Wellenfunktionen als Produkte der entsprechenden Einelektronenbeiträge.
1.5 Besetzung der Energieniveaus Für ein Atom mit mehreren Elektronen erhält man den Grundzustand (in der oben beschriebenen Näherung) durch Besetzung der einzelnen Orbitale nach folgenden drei Regeln (häufig spricht man in diesem Zusammenhang auch von der Besetzung der Energieniveaus): Energieregel: Die Besetzung der Niveaus mit Elektronen geschieht in der Reihenfolge zunehmender Energie. Für diese Reihenfolge gilt in der Regel folgendes Schema: 1s < 2s < 2p < 3s < 3p < 4s < 3d < 4p < 5s < 4d < 5p < 6s < 4f < 5d < 6p < 7s < 6d . . .
1.6 Darstellung der Elektronenkonfiguration Die Zusammensetzung eines Atomzustandes aus Zuständen seiner einzelnen Elektronen wird auch als Elektronenkonfiguration bezeichnet. Die Elektronenkonfiguration kann entweder symbolisch formelartig oder graphisch in der sog. Pauling-Symbolik angegeben werden. Die formelartige Darstellung verläuft nach folgendem Schema: Der Haupt-Quantenzahl folgt die Angabe der Neben-Quantenzahl in der historischen Bezeichnungsart. Als Exponent der Neben-Quantenzahl erscheint die Zahl der Elektronen, die das betrachtete Energieniveau besetzen. Bei der Pauling-Symbolik wird jeder durch die Quantenzahlen n, l und m charakterisierte Zustand durch einen waagerechten Strich (oder durch ein Kästchen) markiert. Die Wiedergabe des Spinzustandes erfolgt mit einem Pfeil. Die Elektronenkonfiguration der Elemente ist in den Tabellen 10-1 bis 10-8 enthalten. Beispiel: Elektronenkonfiguration des Phosphoratoms im Grundzustand (Ordnungszahl 15).
symbolische Darstellung, Pauling-Symbolik
1.7 Aufbau des Atomkerns Der Atomkern besteht aus Nukleonen (Einzelheiten vgl. B 17). Darunter versteht man positiv geladene Protonen und elektrisch neutrale Neutronen. Die Massen von Protonen und Neutronen sind
C5
C6
C Chemie
annähernd gleich groß (mp = 1,672623 · 10−27 kg, mn = 1,674929 · 10−27 kg). Bei einem elektrisch neutralen Atom ist die Zahl der Protonen oder die Kernladungszahl gleich der Zahl der Elektronen in der Atomhülle und gleich der Ordnungszahl im Periodensystem (vgl. 2). Durch diese Zahl werden die chemischen Elemente definiert: Chemische Elemente bestehen aus Atomen gleicher Kernladungszahl. Als Massenzahl wird die Anzahl der in einem Atomkern enthaltenen Protonen und Neutronen bezeichnet. Kernarten, die durch eine bestimmte Zahl von Protonen und Neutronen charakterisiert sind, werden allgemein Nuklide genannt. Isotope sind Nuklide, die die gleiche Zahl von Protonen, aber eine unterschiedliche Anzahl von Neutronen enthalten. Nuklide gleicher Massenzahl heißen Isobare. Chemische Elemente können als Reinelemente oder als Mischelemente vorliegen. Reinelemente sind dadurch gekennzeichnet, dass alle Atome die gleiche Zahl von Neutronen und damit auch die gleiche Massenzahl aufweisen. Bei Mischelementen kommen Nuklide mit unterschiedlicher Anzahl von Neutronen vor. Es ist üblich, die Ordnungszahl unten und die Massenzahl oben vor das Elementsymbol zu setzen. Beispiele: Fluor ist ein Reinelement. Es existiert in der Natur ausschließlich in Form des Nuklides 199 F. Kohlenstoff ist ein Mischelement. Die natürlich vorkommenden Isotope sind 126 C, 136 C und 146 C (Häufigkeiten: 98,89%, 1,11%, Spuren). 146 C ist radioaktiv (Halbwertszeit T 1/2 = 5730 a, vgl. 7.4.1) und zerfällt als β-Strahler in 147 N.
2 Das Periodensystem der Elemente Das Periodensystem wurde erstmals 1869 von L. Meyer und D. Mendelejew als Ordnungssystem der Elemente aufgestellt. In diesem System wurden die chemischen Elemente nach steigenden Werten der molaren Masse der Atome (vgl. 4.5) angeordnet. Das geschah schon damals in der Art, dass chemisch ähnliche Elemente, wie z. B. die Alkalimetalle (vgl. 10.2) oder die Halogene (vgl. 10.8), untereinander standen und eine Gruppe bildeten. In einigen Fällen war es aufgrund der Eigenschaften der Elemente oder ihrer
Verbindungen erforderlich, dieses Ordnungsprinzip durch Umstellungen zu durchbrechen, da sich sonst chemisch nicht verwandte Elemente in einer Gruppe befunden hätten. So steht z. B. das Element Tellur vor dem Iod, obwohl die molare Masse des Iods (126,9 g/mol) kleiner ist als die des Tellurs (127,6 g/mol).
2.1 Aufbau des Periodensystems Die verbreitetste Form des Periodensystems (vgl. Tabelle 2-1) besteht aus 7 Perioden mit 18 Gruppen bzw. 8 Haupt- und 8 Nebengruppen sowie den Lanthanoiden und Actinoiden. Als Perioden werden die horizontalen, als Gruppen die vertikalen Reihen bezeichnet. Die Reihenfolge der Elemente wird durch ihre Ordnungszahl (Kernladungszahl, vgl. 1.7) bestimmt. Die Besetzung der einzelnen Energieniveaus geschieht mit wachsender Ordnungszahl nach den in 1.5 angegebenen Regeln. Die Periodennummer gibt die Haupt-Quantenzahl des höchsten im Grundzustand mit Elektronen besetzten Energieniveaus an. Innerhalb einer Gruppe des Periodensystems stehen Elemente, die ähnliches chemisches Verhalten zeigen. Die freien Atome dieser Elemente haben in der Regel die gleiche Elektronenkonfiguration in der äußersten Schale. Nach ihrer Elektronenkonfiguration werden die Elemente folgendermaßen eingeteilt: – Hauptgruppenelemente (s- und p-Elemente) Bei diesen Elementen werden die s- und p-Niveaus der äußersten Schale mit Elektronen besetzt. Unter den Hauptgruppenelementen befinden sich sowohl Metalle als auch Nichtmetalle. Die Eigenschaften dieser Elemente und ihrer Verbindungen sind in den Abschnitten 10.1 bis 10.9 behandelt. Nach der traditionellen Nummerierung der Gruppen haben die Hauptgruppen den Kennbuchstaben a. – Nebengruppenelemente (d-Elemente) Bei den Elementen dieser Gruppen werden die dNiveaus der zweitäußersten Schale mit Elektronen aufgefüllt. Die Nebengruppenelemente sind ausnahmslos Metalle, siehe Abschnitt 10.10 bis 10.17. Nach der traditionellen Nummerierung haben die Nebengruppen den Kennbuchstaben b. – Lanthanoide und Actinoide (f-Elemente) sind in 10.18 und 10.19 besprochen. Bei diesen Elementgruppen werden die 4f- (bei den Lantha-
Tabelle 2-1. Das Periodensystem der Elemente
2 Das Periodensystem der Elemente C7
C8
C Chemie
noiden) bzw. die 5f-Niveaus (bei den Actinoiden) aufgefüllt. Sämtliche Elemente der beiden Elementgruppen sind Metalle.
2.2 Periodizität einiger Eigenschaften Alle vom Zustand der äußeren Elektronenhülle abhängigen physikalischen und chemischen Eigenschaften der Elemente ändern sich periodisch mit der Ordnungszahl. Für die Hauptgruppenelemente gelten z. B. folgende Periodizitäten (vgl. Tabelle 2-1): – Atomradien. Innerhalb jeder Gruppe nehmen die Atomradien von oben nach unten zu (vgl. Tabellen 10-1 bis 10-16). Innerhalb einer Periode nehmen sie mit steigender Ordnungszahl ab. Beispiel: Atomradien der Elemente der 2. Periode: 3 Li: 152 pm, 4 Be: 112 pm, 5 B: 79 pm, 6 C: 77 pm, 7 N: 55 pm, 8 O: 60 pm, 9 F: 71 pm. – Ionisierungsenergie. Innerhalb jeder Gruppe nimmt die Ionisierungsenergie (vgl. 1.3) von oben nach unten ab, innerhalb einer Periode von links nach rechts zu. Die Alkalimetalle weisen besonders kleine, die Edelgase besonders große Werte der Ionisierungsenergie auf (vgl. Tabellen 10-1 bis 10-18). – Metallischer und nichtmetallischer Charakter. Reaktivität. Der metallische Charakter nimmt von oben nach unten und von rechts nach links zu, der nichtmetallische Charakter entsprechend in umgekehrter Richtung. In der I. und II. Hauptgruppe (Alkalimetalle und Erdalkalimetalle) sind nur Metalle, in der VII. und VIII. Hauptgruppe (Halogene und Edelgase) nur Nichtmetalle enthalten. In der III. bis VI. Hauptgruppe finden sich sowohl Metalle als auch Nichtmetalle. Die Reaktivität der Metalle wie der Nichtmetalle wächst entsprechend ihrem metallischen bzw. nichtmetallischen Charakter. Die reaktionsfähigsten Metalle sind die Alkalimetalle (vgl. 10.2), die reaktionsfähigsten Nichtmetalle die Halogene (vgl. 10.8). Die Elemente der VIII. Hauptgruppe, die Edelgase, sind außerordentlich reaktionsträge.
3 Chemische Bindung Freie, isolierte Atome werden auf der Erde nur selten angetroffen (Ausnahmen sind z. B. die Edelga-
se).Meist treten die Atome vielmehr in mehr oder weniger fest zusammenhaltenden Atomverbänden auf. Dies können unterschiedlich große Moleküle, Flüssigkeiten oder Festkörper sein (Beispiele: molekularer Wasserstoff H2 , Methan CH4 ; flüssige Edelgase, flüssiges Wasser H2 O, flüssiges Quecksilber Hg; Diamant C, festes Natriumchlorid NaCl, metallisches Wolfram W). Die mit der Ausbildung von Atomverbänden zusammenhängenden Fragen behandelt die Theorie der chemischen Bindung. Folgende vier Grenztypen der chemischen Bindung werden unterschieden: – Atombindung (kovalente Bindung), – Ionenbindung, – metallische Bindung – van-der-Waals’sche Bindung mit Wasserstoffbrückenbindung. Häufig müssen zur Beschreibung des Bindungszustandes von Stoffen die Eigenschaften von zwei Grenztypen – meist mit unterschiedlicher Gewichtung – herangezogen werden.
3.1 Atombindung (kovalente Bindung) 3.1.1 Modell nach Lewis
Nach den Vorstellungen von G. N. Lewis, die vor der Formulierung der Quantenmechanik entwickelt wurden, soll eine kovalente Bindung durch ein zwei Atomen gemeinsam angehörendes, bindendes Elektronenpaar bewirkt werden. Die Bildung des gemeinsamen Elektronenpaares führt beim Wasserstoff zur Vervollständigung eines Elektronenduetts und bei den übrigen Bindungspartnern zur Ausbildung eines Elektronenoktetts. Die Vereinigung einzelner spinantiparalleler Elektronen zu einem bindenden Elektronenpaar führt stets zur Spinabsättigung. Die bindenden Elektronenpaare werden als Bindestriche zwischen die Atome eines Moleküls gesetzt. Die anderen Valenzelektronen (Elektronen der äußersten Schale) können so genannte einsame Elektronenpaare bilden, die als Striche um das jeweilige Atom angeordnet werden.
3 Chemische Bindung
In einigen Fällen können auch zwei oder drei bindende Elektronenpaare vorhanden sein.
(vgl. 11.3.1) Wenn ein Partner beide Elektronen des bindenden Elektronenpaares zur Verfügung stellt, spricht man von koordinativer Bindung. Beispiel: Bildung des Ammoniumions aus Ammoniak durch Anlagerung eines Wasserstoffions:
Bild 3-1. MO-Energieniveauschema eines A2 -Moleküls der 1. Periode, Elektronenbesetzung für H2
Die Zahl der kovalenten Bindungen, die von einem Atom ausgehen, wird als dessen Bindigkeit bezeichnet. 3.1.2 Molekülorbitale
Die Beschreibung der Elektronenstruktur von Molekülen erfordert die Lösung der SchrödingerGleichung (vgl. 1.4.2). Diese ist nur für das einfachste Molekül, das H+2 -Molekülion, exakt lösbar. Für die Behandlung von Molekülen mit mehreren Elektronen müssen daher – ähnlich wie bei der Beschreibung von Atomen mit mehreren Elektronen (vgl. 1.4.4) – geeignete Näherungsverfahren angewendet werden. Das am weitesten verbreitete Näherungsverfahren ist die Molekülorbital-Theorie (MO-Theorie). In der MO-Theorie beschreibt man die Elektronenzustände eines Moleküls durch Molekülorbitale. Im Gegensatz zu den Atomen haben Moleküle Mehrzentrenorbitale. Molekülorbitale werden – ähnlich wie die Atomorbitale – durch Quantenzahlen charakterisiert. Die Besetzung der einzelnen Orbitale im Grundzustand erhält man unter Berücksichtigung der Energieregel, des Pauli-Prinzips und der Hund’schen Regel (siehe 1.5). Die Elektronenkonfiguration von Molekülen kann entweder durch ein Zahlenschema oder durch die in Bild 3-1 und 3-2 dargestellte Symbolik angegeben werden.
Bild 3-2. MO-Energieniveauschema eines A2 -Moleküls der 2. Periode, Elektronenbesetzung für O2
Molekülorbitale können in guter Näherung aus Orbitalen der am Bindungssystem beteiligten Atome durch lineare Kombination aufgebaut werden. Man unterscheidet grob zwischen bindenden und lockernden („antibindenden“) Molekülorbitalen, je nachdem, ob ihre Besetzung im Vergleich zu den Energien der beteiligten Atomorbitale eine Energieabsenkung und damit eine Stabilisierung des Moleküls oder aber eine Energieerhöhung zur Folge hat.
C9
C10
C Chemie
Besonders übersichtlich ist diese Beschreibung bei Molekülen aus zwei gleichen Atomen, wie z. B. beim Wasserstoffmolekül H2 . Aus den beiden 1s-Orbitalen der Wasserstoffatome Ha und Hb lassen sich zwei Linearkombinationen herstellen: die symmetrische σ1s = (1s)a + (1s)b und die antisymmetrische σ∗1s = (1s)a − (1s)b . Die umgekehrten Vorzeichenkombinationen (−−) und (−+) ergeben lediglich äquivalente Darstellungen derselben Orbitale. Das σ-MO ist das bindende, σ∗ das lockernde MO; beide Orbitale sind rotationssymmetrisch zur Molekülachse. Bild 3-1 zeigt das entsprechende Energieniveauschema. Im Grundzustand des H2 -Moleküls besetzen beide Elektronen den bindenden σ-Zustand. Die damit verbundene Energieabsenkung gegenüber den Grundzuständen der freien Atome (um die sog. Bindungsenergie) erklärt die Stabilität des Wasserstoffmoleküls. Beim molekularen Sauerstoff O2 steuert jedes Atom sechs Valenzelektronen bei. Die Valenzschale der Atome besteht aus den 2s-Orbitalen und den drei entarteten 2p-Orbitalen. Kombiniert werden Atomorbitale derselben Energie; die energetische Lage der resultierenden Molekülorbitale zeigt schematisch Bild 3-2. Aus den kugelsymmetrischen 2s-Orbitalen sowie den zylindersymmetrischen 2p x -Orbitalen, deren Achse mit der Molekülachse zusammenfällt, entstehen rotationssymmetrische, bindende und lockernde σ- bzw. σ∗ -MOs. Die restlichen 2p-Orbitale ergeben je zwei entartete bindende π- und lockernde π∗ -Zustände; bei diesen Orbitalen ist die Rotationssymmetrie gebrochen. Nach der Hund’schen Regel werden die beiden π∗ -Zustände im Grundzustand des O2 -Moleküls mit einzelnen Elektronen parallelen Spins besetzt. Molekularer Sauerstoff ist daher paramagnetisch. Bei größeren Molekülen, wie z. B. beim Methan CH4 (vgl. 11.3.1), erhält man bei der MO-theoretischen Behandlung des Bindungssystems Resultate, die zunächst der chemischen Erfahrung zu widersprechen scheinen. An den im Grundzustand besetzten Molekülorbitalen sind alle fünf Atome beteiligt, d. h., statt vier äquivalenter und lokalisierbarer C–H-Bindungen
scheint die MO-Theorie vier über das ganze Molekül delokalisierte Bindungen zu liefern. Mit sog. Hybridorbitalen (vgl. 3.1.3) lassen sich die Bindungsverhältnisse beim Methan wie auch bei vielen anderen mehratomigen Molekülen in Übereinstimmung mit den klassischen Valenzstrichformeln der Chemie beschreiben. Es gibt jedoch auch Moleküle mit delokalisierten Bindungen, wie z. B. 1,3-Butadien (vgl. 11.3.1) oder Benzol C6 H6 (vgl. 11.3.3). Einen Extremfall delokalisierter Bindungen trifft man in Metallen an (vgl. 3.3). Die Lage der Energieniveaus in Molekülen lässt sich experimentell z. B. mithilfe der Photoelektronenspektroskopie bestimmen. Die gemessenen Werte zeigen gute Übereinstimmung mit den nach der MO-Theorie berechneten. Die Übereinstimmung bestätigt, dass die in der MO-Theorie gemachten Näherungen brauchbar sind. 3.1.3 Hybridisierung
Die Begriffe Hybridisierung und Hybridorbitale wurden von L. Pauling eingeführt. Hybridorbitale (q-Orbitale) ergeben sich – im Gegensatz zu den Molekülorbitalen – durch Linearkombination von Orbitalen eines Atoms. Sie werden mit Vorteil anstelle der Atom-Eigenfunktionen bei der Beschreibung gerichteter Bindungen verwendet. Folgende Hybridorbitale haben sich dabei besonders bewährt: Hybrid- räumliche orbital Anordnung sp linear sp2 sp3
Beispiele
Acetylen HC ≡ CH (vgl. 11.3.1) eben trigonal Ethylen H2 C = CH2 (vgl. 11.3.1) tetraedrisch Methan CH4 , Ammoniak NH3 , Wasser H2 O, Diamant C
Beispiele: Methan CH4 : Das Kohlenstoffatom hat im Grundzustand die Elektronenkonfiguration 1s2 2s2 2p2 und in einem angeregten Zustand 1s2 2s2p3 . Die für diese Anregung notwendige Energie heißt Promotionsenergie. Ein weiterer Energiebetrag ist zur Bildung der vier sp3 -Hybridorbitale notwendig. Die Elektronen befinden sich jetzt im sog. Valenzzustand. Dieser Zustand ist spektroskopisch nicht beobachtbar. Das
3 Chemische Bindung
bedeutet, dass isolierte Kohlenstoffatome nicht im Valenzzustand vorkommen können. Die sp3 Hybridorbitale sind nach den Ecken eines Tetraeders ausgerichtet. Die Energieeigenwerte sind entartet. Zustandekommen der Bindung: Im CH4 -Molekül überlappen die vier Hybridorbitale des C-Atoms mit den s-Orbitalen von vier H-Atomen. H–C–HBindungswinkel im CH4 -Molekül: 109°28 (Tetraederwinkel). Ammoniak NH3 : Das Stickstoffatom ist in dieser Verbindung sp3 -hybridisiert. Die Hybridorbitale überlappen mit den s-Orbitalen von drei H-Atomen. Das vierte Hybridorbital ist durch das einsame Elektronenpaar des N-Atoms besetzt. H–N–H-Bindungswinkel des NH3 -Moleküls (im Gaszustand): 107°. Wasser H2 O: Analoges Verhalten wie beim NH3 . Zwei Hybridorbitale überlappen mit den s-Orbitalen von zwei H-Atomen, die beiden anderen Hybridorbitale sind durch einsame Elektronenpaare besetzt. H–O–H-Bindungswinkel des H2 O-Moleküls (im Gaszustand): 105°. 3.1.4 Elektronegativität
Kovalente zweiatomige Moleküle mit Übergang zur Ionenbindung weisen keine symmetrische Ladungsverteilung auf. Daher haben solche Moleküle ein permanentes elektrisches Dipolmoment. Neben dieser Größe ist nach L. Pauling die Elektronegativität zur Erfassung der Polarität von Atombindungen geeignet. Erklärung: Die Elektronegativität ist ein Maß für das Bestreben eines kovalent gebundenen Atoms, Elektronen an sich zu ziehen. Zur Bestimmung der (dimensionslosen Größe) Elektronegativität χ sind verschiedene Vorschläge gemacht worden. Viel benutzt wird die folgende Beziehung nach Pauling: χ= f
EI + EA . 2
(3-1)
f (≈0,56/eV) Proportionalitätsfaktor, EI Ionisierungsenergie, EA Elektronenaffinität. Die Elektronegativität der Hauptgruppenelemente ist in den Tabellen 10-1 bis 10-7 angegeben. Im Periodensystem nimmt die Elektronegativität innerhalb einer Periode von links nach rechts zu, innerhalb einer Gruppe in der Regel von oben nach unten ab. Das
Element mit dem größten Wert der Elektronegativität ist das Fluor (χ = 4).
3.2 Ionenbindung Verbinden sich Elemente mit starken Elektronegativitätsunterschieden, so können vollständige Elektronenübergänge stattfinden. Elektronen des Atoms mit der kleineren Elektronegativität gehen vollständig auf das Atom mit der größeren Elektronegativität über. Eine derartige Reaktion wird als Redoxreaktion bezeichnet (siehe 9). Das sich dabei bildende positive Ion heißt Kation, das negativ geladene Anion. Aufgrund der ungerichteten elektrostatischen Anziehungskräfte kommt es zur Bildung von Ionenkristallen. Ionenkristalle werden auch als Ionenverbindungen oder als Salze bezeichnet. Strukturen und Eigenschaften von Ionenkristallen sind in 5.3.2 näher beschrieben. Beispiel: Metallisches Natrium Na reagiert mit molekularem Chlor Cl2 unter Bildung von Natriumchlorid NaCl. Dabei findet ein Elektronenübergang vom Natrium zum Chlor statt: 2 Na(s) + Cl2 (g) → 2 NaCl(s) . χ = 1,0 χ = 3,0 χ Elektronegativität. Als Redoxgleichung formuliert (vgl. 9) wird der Elektronenübergang augenfällig: 2 Na → 2 Na+ + 2 e− Cl2 + 2 e− → 2 Cl− 2 Na(s) + Cl2 (g) → 2 NaCl(s) . 3.2.1 Gitterenergie
Unter der Gitterenergie eines Ionenkristalls versteht man die Energie, die bei der Bildung der kristallinen Substanz aus den gasförmigen (bereits vorgebildeten) Ionen abgegeben wird. Die Gitterenergie kann nur in wenigen Fällen direkt gemessen werden. In der Regel wird sie mithilfe des
C11
C12
C Chemie
Tabelle 3-1. Molare Gitterenergie EmG einiger Salze
Substanz NaF NaCl NaBr NaI CsF CsCl CsBr CsI
EmG /(kJ/mol) −907 −776 −722 −662 −722 −649 −624 −588
Born-Haber’schen Kreisprozesses aus thermodynamischen Daten ermittelt. Tabelle 3-1 zeigt einige repräsentative Werte der Gitterenergie. 3.2.2 Born-Haber’scher Kreisprozess
Die Bildung eines Salzes aus den Elementen kann nach Born und Haber in folgende Teilschritte unterteilt werden (am Beispiel der Bildung von NaCl): Bildung der gasförmigen Na+ -Ionen: Na(s) → Na(g) Δsubl Hm = 109 kJ/mol + − EmI = 496 kJ/mol Na(g) → Na (g) + e Bildung der gasförmigen Cl− -Ionen: 1/2 Cl2 → Cl(g) 1/2 ΔD Hm = 121 kJ/mol Cl(g) + e− → Cl− (g) EmA = −361 kJ/mol Kombination der gasförmigen Ionen zum Ionengitter: Na+ (g) + Cl− (g) → NaCl(s) EmG = −776 kJ/mol Bildung von festem NaCl aus den Elementen: Na(s) + 1/2 Cl(g) → NaCl(s) Δr H = −411 kJ/mol Δsubl Hm molare Sublimationsenthalpie, EmI molare Ionisierungsenergie, ΔD Hm molare Dissoziationsenthalpie, EmA molare Elektronenaffinität, EmG molare Gitterenergie, Δr H Reaktionsenthalpie. (Molare Größen werden dadurch gebildet, dass die entsprechenden extensiven Größen durch die Stoffmenge dividiert werden, Vorzeichen energetischer Größen vgl. 6.2.3). Das folgende Schema zeigt die Reihenfolge der Einzelschritte beim Ablauf des Born-Haber’schen Kreisprozesses:
Wie den Zahlenwerten entnommen werden kann, ist zur Bildung der gasförmigen Kationen eine hohe Energie (Δsubl H + EI ) aufzuwenden, die durch die Energie, die bei der Entstehung der gasförmigen Cl− Ionen frei wird (1/2ΔD H + EA ), nicht kompensiert werden kann. Bei der Bildung des Ionengitters wird jedoch eine beträchtliche Energie, die Gitterenergie, frei. Sie übertrifft die Energie, die zur Bildung der entgegengesetzt geladenen gasförmigen Ionen notwendig ist, bei weitem. Daher verlaufen sehr viele Reaktionen, bei denen Salze gebildet werden, stark exotherm (vgl. 6.2.3). 3.2.3 Atom- und Ionenradien
Aus der quantenmechanischen Beschreibung (vgl. 1.4) folgt, dass Atome und Ionen keine streng definierte Größe haben können. Dennoch werden sie näherungsweise als starre Kugeln mit konstantem Radius aufgefasst. Setzt man den Kernabstand von Nachbarn als Summe der Radien der beteiligten Atome oder Ionen an, so zeigen die daraus ermittelten Radien i. Allg. eine bemerkenswert gute Konstanz. Die Atom- und einige Ionenradien der Hauptgruppenelemente sind in den Tabellen 10-1 bis 10-8 aufgeführt. Durch Vergleich der Ionenradien mit den entsprechenden Atomradien folgt, dass die Kationen stets beträchtlich kleiner und die Anionen immer sehr viel größer als die entsprechenden Atome sind.
3.3 Metallische Bindung Das klassische Elektronengasmodell der metallischen Bindung geht davon aus, dass die Valenzelektronen in Metallen nicht mehr einem einzelnen Atom zugeordnet werden können, sondern dem Kristallgitter als Ganzem angehören. Jedes Metallatom kann eine bestimmte Zahl dieser Elektronen abspalten. Das Metall besteht also aus positiv geladenen Metallionen und einem frei beweglichen „Elektronengas“, das das Gitter zusammenhält. Dieses Modell erklärt z. B. die hohe elektrische und thermische Leitfähigkeit sowie die mechanischen Eigenschaften der Metalle, versagt aber bei der Beschreibung des Elektronenanteils der molaren Wärmekapazität. Quantenmechanisch können die Bindungsverhältnisse in Metallen mit Hilfe der MO-Theorie interpretiert werden. Dabei tritt an die Stelle eines einzelnen Moleküls der Kristall als
4 Chemische Gleichungen und Stöchiometrie
Ganzes. Nach dieser Theorie entstehen in einem Metallkristall delokalisierte Orbitale, die über den gesamten Kristall ausgedehnt sind. Die Energiedifferenzen zwischen benachbarten Kristallorbitalen sind außerordentlich klein. Die dicht aufeinander folgenden Energieniveaus sind in Energiebändern angeordnet (Energiebändermodell, vgl. B 16.1.2). Die Struktureigenschaften von Metallkristallen werden im Abschnitt 5.3.2 beschrieben.
3.4 Van-der-Waals’sche Bindung und Wasserstoffbrückenbindung (Nebenvalenzbindungen) Folgende zwischenmolekulare Kräfte verursachen die van-der-Waals’sche Bindung: – Orientierungskräfte, das sind Anziehungskräfte zwischen permanenten elektrischen Dipolen; sie wirken zwischen polaren Molekülen, d. h. zwischen Molekülen mit einem permanenten elektrischen Dipolmoment, und – Dispersionskräfte, das sind Anziehungskräfte zwischen induzierten elektrischen Dipolen; sie wirken zwischen Atomen sowie zwischen polaren und unpolaren Molekülen.
ten chemischen Verbindung enthalten sind, als auch quantitative Informationen entnommen werden. Die quantitative Information kann für eine Substanz, die durch die Formel Aa Bb charakterisiert ist, folgendermaßen zusammengefasst werden: N (A) /N (B) = n (A) /n (B) = a/b .
(4-1)
In einem Molekül, das durch die Formel Aa Bb , gekennzeichnet ist, verhält sich die Zahl der Atome der Sorte A zur Zahl der Atome der Sorte B wie a zu b. Gleichung (4-1) bildet die Grundlage der Ermittlung von chemischen Formeln aus den Ergebnissen qualitativer und quantitativer Analysen. Beispiel: Ein bestimmtes Antimonoxid (chemische Formel Sb x Oy ) weist einen Sauerstoffmassenanteil von 24,73% auf, M(Sb) = 121,8 g/mol, M(O) = 16,0 g/mol. Für das Stoffmengenverhältnis gilt: n(O)/n(Sb) = y/x. Mit nB = mB /MB erhält man: m (O) M (Sb) 24,73 g · 121,8 g/mol = M (O) m (Sb) 16,0 g/mol (100 − 24,73) g y 2,5 5 = . = = x 1 2
Der Zusammenhalt von Flüssigkeiten und Festkörpern, die aus unpolaren Molekülen aufgebaut sind, wird praktisch vollständig durch Dispersionskräfte bewirkt (Beispiele: feste und flüssige Edelgase bzw. Kohlenwasserstoffe). Bei wasserstoffhaltigen Verbindungen mit SH-, OH- oder NH-Gruppen sind neben den Orientierungskräften stets auch Wasserstoffbrückenbindungen am Zusammenhalt des Molekülverbandes beteiligt. Wasserstoffbrückenbindungen sind z. B. für die Struktur und die Eigenschaften des festen und flüssigen Wassers (vgl. 5.2.3) und für die Struktur und die biologische Funktion von Proteinen und Nucleinsäuren von großer Bedeutung.
Das Antimonoxid hat also die chemische Formel (Sb2 O5 )k . Der Faktor k (positive ganze Zahl) kann allein aufgrund der Ergebnisse quantitativer Analysen nicht ermittelt werden. Hierzu sind z. B. Bestimmungen der molaren Masse (bei Gasen: Zustandsgleichung idealer Gase, bei gelösten Stoffen: Messung des osmotischen Druckes, der Lichtstreuung, Ultrazentrifugation) oder röntgenstrukturanalytische Verfahren notwendig. Im Falle des Antimonoxids nimmt k sehr große Werte an, da die Verbindung polymer ist.
4 Chemische Gleichungen und Stöchiometrie
Chemische Reaktionen können qualitativ und quantitativ durch Umsatzgleichungen beschrieben werden. So kann z. B. der Gleichung
4.1 Chemische Formeln Jeder chemischen Formel können sowohl qualitative Angaben über die Atomsorten, die in einer bestimm-
4.2 Chemische Gleichungen
Zn + 2 HCl → ZnCl2 + H2 (g) entnommen werden, dass das Metall Zink (Zn) mit Salzsäure (wässrige Lösung von HCl) unter Bildung
C13
C14
C Chemie
des Salzes Zinkchlorid (ZnCl2 ) und gasförmigem Wasserstoff (H2 (g)) reagiert. Quantitativ folgt z. B., dass die Zahl der Zinkatome, die bei der Reaktion verbraucht werden, gleich der Zahl der Wasserstoffmoleküle ist, die bei der Reaktion gebildet werden. Mit der Formel N(Zn) = N(H2 ) kann dieser Sachverhalt wesentlich kürzer dargestellt werden. Da die Teilchenzahl N der Stoffmenge n proportional ist, gilt ferner: n(Zn) = n(H2 .
4.3.2 Gesetz der konstanten Proportionen
Verallgemeinert man diesen Sachverhalt, so gilt für die vollständig (oder „quantitativ“) ablaufende Reaktion
Für die Mehrzahl chemischer Verbindungen trifft folgender Satz zu: Die Massenverhältnisse der Elemente in einer bestimmten chemischen Verbindung sind konstant.
νA A + νB B + . . . → νX X + νY Y + . . . n (A) νA n (A) νA ; ; usw. = = n (X) νX n (Y) νY νA , νB , νX und νY heißen stöchiometrische Zahlen. Bei vollständig ablaufenden Reaktionen verhalten sich die Stoffmengen wie die stöchiometrischen Zahlen in den Umsatzgleichungen. Beziehungen der obigen Art können als Grundgleichungen für stöchiometrische Rechnungen angesehen werden.
4.3 Grundgesetze der Stöchiometrie Die Stöchiometrie befasst sich mit der quantitativen Behandlung chemischer Vorgänge und Sachverhalte, soweit ihnen Umsatzgleichungen bzw. chemische Formeln zugrunde liegen. 4.3.1 Gesetz von der Erhaltung der Masse
Bei allen (molekular)chemischen Reaktionen bleibt die Gesamtmasse der Reaktionspartner unverändert. Da chemische Reaktionen praktisch immer mit Energieänderungen verbunden sind, ist dieses Gesetz aufgrund der Einstein’schen Gleichung ΔE = Δm c20 ,
E Energie, m Masse, c0 Vakuumlichtgeschwindigkeit, nur eine Näherung. Bisher ist es jedoch bei keiner (molekular)chemischen Reaktion gelungen, eine die Messunsicherheit überschreitende Änderung der Gesamtmasse der Reaktionspartner messtechnisch nachzuweisen. Bei den mit sehr großen Energieänderungen verknüpften Kernreaktionen (siehe B 17.4) hat das Gesetz von der Erhaltung der Masse keine Gültigkeit, und die Bilanz der Massen und Energien wird dort durch die Einstein’sche Gleichung (4-2) beschrieben.
(4-2)
Das bedeutet: Unabhängig davon, auf welchem Wege eine solche Verbindung entstanden ist, enthält sie die betreffenden Elemente in einem konstanten Massenverhältnis. Je nachdem ob das Gesetz der konstanten Proportionen befolgt wird oder nicht, können chemische Verbindungen in zwei Gruppen eingeteilt werden: 1. Stöchiometrische Verbindungen. Darunter fasst man alle Verbindungen zusammen, die das Gesetz der konstanten Proportionen streng befolgen. Die überwiegende Mehrzahl aller chemischen Substanzen gehört in diese Kategorie. 2. Nichtstöchiometrische Verbindungen. Für diese Gruppe von Verbindungen gilt das Gesetz der konstanten Proportionen nicht. Die Zusammensetzung dieser Substanzen variiert innerhalb eines bestimmten Stabilitätsbereiches kontinuierlich. Besonders zahlreiche Beispiele dafür findet man bei Verbindungen zwischen verschiedenen Metallen (intermetallische Phasen). Aber auch viele Oxide, Sulfide sowie Substanzen, die Mischkristalle bilden können, gehören hierzu. So kann beispielsweise Eisen(II)-oxid in allen Zusammensetzungen innerhalb der durch die Formeln Fe0,90 O und Fe0,95 O angegebenen Grenzen vorkommen.
4 Chemische Gleichungen und Stöchiometrie
4.5 Die molare Masse
4.3.3 Gesetz der multiplen Proportionen
Die Massenverhältnisse zweier sich zu verschiedenen chemischen Verbindungen vereinigender Elemente stehen im Verhältnis einfacher ganzer Zahlen zueinander. Beispiel: Wasserstoff und Sauerstoff bilden zwei verschiedene Verbindungen: Wasser (H2 O) und Wasserstoffperoxid (H2 O2 ). Die Massenverhältnisse in diesen Verbindungen sind: Wasser Wasserstoffperoxid m(O)/m(H) = 7,937 m(O)/m(H) = 15,874. Die Massenverhältnisse verhalten sich also wie 1:2.
4.4 Stoffmenge, Avogadro-Konstante Die Stoffmengen nB eines Stoffes B ist als Quotient aus Teilchenzahl NB und Avogadro-Konstante NA definiert: nB = NB /NA .
(4-3)
(Der Index B bezieht sich auf beliebige Stoffe oder Teilchenarten.) Die Stoffmenge – eine Basisgröße des internationalen Einheitensystems SI – ist eine einheitenbehaftete Größe. Folglich hat die Avogadro-Konstante die Dimension einer reziproken Stoffmenge. Die SI-Einheit der Stoffmenge ist das Mol, das folgendermaßen definiert ist: Ein Mol ist die Stoffmenge eines Systems, das aus ebensoviel Einzelteilchen besteht, wie Atome in 0,012 kg des Kohlenstoffnuklids 12 6 C enthalten sind. Anmerkung: Als Nuklide bezeichnet man alle Atomarten, die durch eine bestimmte Anzahl von Protonen und Neutronen in ihrem Kern charakterisiert sind. Der Kern des Nuklides 126 C besteht aus 6 Protonen und 6 Neutronen. Mit dem Wert der Avogadro-Konstanten NA = 6,02214179 · 1023 mol−1 folgt unter Verwendung der Beziehung NB = nB · NA , dass ein Mol einer beliebigen Substanz 6,02214179 · 1023 Teilchen enthält.
Die molare Masse (früher: Molmasse, Molekulargewicht) MB eines Stoffes B ist durch folgende Beziehung definiert: MB = mB /nB , mB Masse (einer Portion des Stoffes B).
(4-4)
SI-Einheit kg/mol, häufig verwendete Einheit g/mol. Die Bezeichnung molare Masse wird auch auf Atome angewendet. Die Beziehungen (4-4) und (4-3) liefern den Zusammenhang zwischen der Masse eines Teilchens mTB = mB /NB und der molaren Masse: mTB = MB /NA . Danach ist also die molare Masse gleich dem Produkt aus der Masse eines Teilchens und der Avogadro-Konstanten. Beispiel: Die Masse mH eines Wasserstoffatoms soll aus der molaren Masse M(H) = 1,008 g/mol dieses Atoms berechnet werden: mH = M(H)/NA = (1,008 g/mol)/(6,022 · 1023 mol−1 ) = 1,674 · 10−24 g . Die molare Masse einer Verbindung kann durch Addition der molaren Massen der in der Verbindung enthaltenen Atome berechnet werden. Voraussetzung hierfür ist die Gültigkeit des Gesetzes von der Erhaltung der Masse für chemische Reaktionen (siehe 4.3.1). Beispiel: Gesucht sei die molare Masse des Natriumsulfats, M(Na2 SO4 ). Es gilt: M(Na2 SO4 ) = 2M(Na) + M(S) + 4M(O) . = 2 · 23,0 g/mol + 32,1 g/mol + 4 · 16,0 g/mol = 142,1 g/mol .
4.6 Quantitative Beschreibung von Mischphasen 4.6.1 Der Massenanteil
Der Massenanteil (früher: Massenbruch) wB des Stoffes B ist definiert als wB = mB /m .
(4-5a)
C15
C16
C Chemie
Die Gesamtmasse m setzt sich additiv aus den einzelnen Teilmassen mi zusammen: m= mi = m1 + m2 + . . . + mn . (4-5b) Der Massenanteil eines Stoffes ist eine reine Zahl: wB ≤ 1. Die Summe der Massenanteile aller Stoffe in einem gegebenen System ist gleich 1: wi = 1 (4-5c) Häufig wird der Massenanteil auch in Prozent (1%o = 10−2 ), Promille (1 = 10−3 ), parts per million (1 ppm = 10−6 ) und parts per billion (1 ppb = 10−9 ) angegeben. Beispiel: Eine Legierung enthält 1,990 g Au, 0,010 g Ag und 1 · 10−5 g As. Daraus ergibt sich: w(Au) = 0,995 = 99,5%; w(Ag) = 0,005 = 5%o und w(As) = 5 · 10−6 = 5 ppm.
erkennt man, dass in (4-5a) im Zähler die Masse der HCl durch die Stoffmenge dieser Verbindung und im Nenner die (Gesamt)Masse durch das Volumen ersetzt werden muss. Dies geschieht durch die Gleichungen nB = mB /MB und = m/V. Mit
erhält man auf diese Weise:
Der Stoffmengenanteil (früher: Molenbruch) xB ist in Analogie zum Massenanteil folgendermaßen definiert:
w(HCl) = n(HCl)M(HCl)/V
= c(HCl)M(HCl)/
(4-6a)
oder c(HCl) = w(HCl) /M(HCl).
(4-6b)
Die Zahlenrechnung liefert: 1,198 g/cm3 c(HCl) = 0,400 36,46 g/mol
(4-6c)
n Stoffmenge. Auch der Stoffmengenanteil wird häufig in %, %o, ppm und ppb angegeben. Für eine vorgegebene Stoffmischung sind der Stoffmengenanteil und der Massenanteil einer bestimmten Komponente i. Allg. verschieden. Zum Massen- und Stoffmengenanteil analoge Beziehungen existieren auch für den Volumenanteil. Bei idealen Gasen (siehe 5.1.1) sind Volumen- und Stoffmengenanteil gleich. 4.6.3 Die Konzentration (oder Stoffmengenkonzentration)
Die Konzentration cB eines Stoffes B ist definiert als der Quotient aus Stoffmenge nB dieses Stoffes und dem Volumen V: cB = nB /V .
w(HCl) = m(HCl)/m, c(HCl) = n(HCl)/V
w(HCl) = m(HCl)/m
4.6.2 Der Stoffmengenanteil
xB = nB /n , n= ni = n1 + n2 + . . . + nn xi = 1 ,
SI-Einheit: mol/m3, häufig verwendete Einheit: mol/l. Beispiel: Eine Salzsäure (Lösung von Chlorwasserstoff HCl in Wasser, vgl. Tabelle 8-2) enthält einen HCl-Massenanteil von 40,0%. Die Dichte der Säure beträgt = 1,198 g/cm3, M(HCl) = 36,46 g/mol. Gesucht ist die Konzentration des Chlorwasserstoffs c(HCl). Lösung: Durch den Vergleich von (4-5a) und (4-7),
(4-7)
= 0,01314 mol/cm3 = 13,14 mol/l .
4.7 Stöchiometrische Berechnungen 4.7.1 Gravimetrische Analyse
Häufig liegen Stoffe als eine Mischung in flüssiger Phase vor. Gegenstand der gravimetrischen Analyse ist die Ermittlung der Masse eines der Stoffe in dieser Lösung. Dazu wird die Substanz, die gravimetrisch untersucht werden soll, durch Zugabe einer Reagenzlösung in eine schwerlösliche Verbindung überführt. Die Masse der schwerlöslichen Verbindung wird (nach Abfiltrieren und Trocknen) durch Wägung ermittelt. Bei gravimetrischen Analysen muss die Reagenzlösung stets im Überschuss zugeführt werden, damit eine vollständige (oder „quantitative“) Ausfällung des zu untersuchenden Stoffes erfolgen kann.
4 Chemische Gleichungen und Stöchiometrie
Beispiel: Eine Stoffmischung besteht aus Chlorwasserstoff (HCl) und Wasser. Die Masse des Chlorwasserstoffs in dieser Mischung soll ermittelt werden. Dazu werden die Chloridionen durch Zugabe von Silbernitratlösung (AgNO3 in H2 O) als Silberchlorid (AgCl) gefällt. Das Silberchlorid wird abfiltriert, getrocknet und seine Masse durch Wägung ermittelt.
Beispiel: Es soll die Masse von Natriumthiosulfat (Na2 S2 O3 ) in einer wässrigen Natriumthiosulfatlösung durch sog. Titration mit einer Iodlösung der Konzentration c(I2 ) ermittelt werden. Das Volumen der verbrauchten Iodlösung sei V(I2 ). Berechnung: 1. Der Reaktion liegt die folgende Umsatzgleichung zugrunde:
Berechnung: 1. Die Fällungsreaktion wird durch folgende Umsatzgleichung beschrieben: HCl + AgNO3 → AgCl(s) + HNO3 . (Anmerkung: In Umsatzgleichungen werden schwerlösliche Verbindungen mit dem Buchstaben s (lat. solidus: fest) gekennzeichnet.) 2. Entsprechend der Umsatzgleichung gilt folgende Stoffmengenbeziehung: n(HCl) = n(AgCl) . 3. Die gesuchte Masse des Chlorwasserstoffs erhält man aus der durch Wägung bestimmten Masse des Silberchlorids mit nB = mB /MB aus der Stoffmengenbeziehung (Gleichung 3): m(AgCl) m(HCl) = , M(HCl) M(AgCl) M(HCl) m(HCl) = m(AgCl) . M(AgCl) 4.7.2 Maßanalyse
Auch die maßanalytischen Verfahren dienen zur Bestimmung der Masse eines Stoffes in einer aus mehreren Bestandteilen bestehenden Lösung. Hier wird ebenfalls mit dem maßanalytisch zu untersuchenden Stoff eine chemische Reaktion durchgeführt. Die dazu notwendige Substanz befindet sich in einer Reagenzlösung. Im Gegensatz zur Gravimetrie wird hier jedoch nur soviel Reagenzlösung zugefügt, wie zur vollständigen Umsetzung gerade erforderlich ist. Die Konzentration der Reagenzlösung muss hierbei genau bekannt sein. Substanzen oder apparative Einrichtungen, die die Vollständigkeit der Umsetzung – den Reaktionsend- oder Äquivalenzpunkt – anzeigen, heißen Indikatoren.
2 Na2 S2 O3 + I2 → 2 NaI + Na2 S4 O6 . 2. Der Umsatzgleichung entnehmen wir, dass am Reaktionsendpunkt (oder Äquivalenzpunkt) die folgende Stoffmengenbeziehung gilt: n (Na2 S2 O3 ) = 2 n (I2 ) . 3. Die Stoffmenge in der verbrauchten Iodlösung wird aus der Konzentration und dem verbrauchten Volumen berechnet: n (I2 ) = c (I2 ) · V (I2 ) . 4. Damit wird unter Heranziehen der Stoffmengenbeziehung n(Na2 S2 O3 ) = 2n(I2 ) die Stoffmenge des Thiosulfates ermittelt: n (Na2 S2 O3 ) = 2 · c (I2 ) · V (I2 ) . 5. Mithilfe der Beziehung nB = mB /MB kann dann die Masse des Natriumthiosulfates berechnet werden: m (Na2 S2 O3 ) = 2M (Na2 S2 O3 ) · c (I2 ) · V (I2 ) . 4.7.3 Verbrennungsvorgänge
Beispiel: Kohlenstoff soll in Luft verbrannt werden (vgl. 9.3.1). Das zur Verbrennung von 1 kg Kohlenstoff notwendige Luftvolumen ist bei einer Temperatur von 25 ◦ C und bei einem Druck von 1 bar zu berechnen. M(C) = 12 g/mol ,
R = 0,08314 bar · l/(mol · K)
1. Der Verbrennungsvorgang wird durch folgende Umsatzgleichung beschrieben: 6 7 6 7 C (s) + O2 g → CO2 g .
C17
C18
C Chemie
2. Aufgrund dieser Umsatzgleichung gilt bei vollständiger Verbrennung folgende Stoffmengenbeziehung: n (C) = n (O2 ) . 3. In obiger Beziehung wird mit der Gleichung nB = mB /MB die Stoffmenge des Kohlenstoffs durch die Masse ersetzt. Man erhält auf diese Weise: m (C) = M (C) · n (O2 ) . 4. Unter Anwendung der Zustandsgleichung idealer Gase (siehe 5.1.1) wird die Stoffmenge des Sauerstoffs durch das Gasvolumen dieses Elementes ersetzt: p · V (O2 ) = n (O2 ) · RT , p · V (O2 ) m (C) = M (C) · RT m (C) · RT . oder V (O2 ) = M (C) · p
kann hiermit erklärt werden. Mit steigendem Druck und sinkender Temperatur wird der Einfluss der Anziehungskräfte gegenüber der thermischen Bewegung immer größer. Dies führt schließlich zur Verflüssigung aller Gase. 5.1.1 Ideale Gase
– Phänomenologische Definition: Als ideal werden die Gase bezeichnet, deren Verhalten durch die Gleichung pV = nRT beschrieben werden kann. – Atomistische Definition: Ideale Gase sind dadurch charakterisiert, dass zwischen den Teilchen, aus denen diese Gase bestehen, keine Anziehungskräfte wirken. Außerdem haben diese Teilchen kein Eigenvolumen; sie sind also Massenpunkte. 5.1.2 Zustandsgleichung idealer Gase
Trockene atmosphärische Luft enthält einen Sauerstoffvolumenanteil von 20,95% (vgl. Tabelle 5-1), d. h.
Das Verhalten idealer Gase kann mithilfe der folgenden thermischen Zustandsgleichung idealer Gase (universelle Gasgleichung, „ideales Gasgesetz“) beschrieben werden:
V (O2 ) = 0,2095 · V (Luft) .
pV = nRT
Mit obiger Beziehung folgt: m (C) · RT 0,2095 · M (C) · p V(Luft) = 9861 l = 9,861 m3
V (Luft) =
5 Zustandsformen der Materie 5.1 Gase Die zwischen den Gasteilchen wirkenden Anziehungskräfte (hauptsächlich Orientierungs- und Dispersionskräfte, vgl. 3.4) sind nicht groß genug, um Zusammenballungen der Teilchen zu verursachen und um Translationsbewegungen zu verhindern. Bei nicht zu hohen Drücken ist der Abstand zwischen den Gasteilchen groß gegenüber ihrem Durchmesser. Demzufolge füllen die Gase jeden ihnen angebotenen Raum vollständig aus. Auch die große Kompressibilität von Stoffen in diesem Aggregatzustand
(5-1)
p Druck, V Volumen, n Stoffmenge, T Temperatur, R wird als universelle Gaskonstante bezeichnet. Diese Konstante hat die Dimension Energie/(Stoffmenge · Temperatur) oder Druck · Volumen/(Stoffmenge · Temperatur). Für die universelle Gaskonstante hat man folgenden Wert ermittelt: R = 8,314472 J/(K · mol) R = 8,314472 Pa · m3 /(K · mol) Die Gültigkeit der Zustandsgleichung ist – unter Berücksichtigung der in 5.1.1 genannten Bedingungen – unabhängig von der chemischen Natur des Gases. Durch drei der vier Variablen wird der Zustand eines idealen Gases vollständig beschrieben. Beispiel: Eine Druckgasflasche ist mit Sauerstoff gefüllt. Das Volumen der Druckgasflasche ist 50 l, der Druck beträgt bei einer Temperatur von 25 ◦ C 200 bar. Gesucht ist die Masse m des in der Druck-
5 Zustandsformen der Materie
gasflasche vorhandenen Sauerstoffs; molare Masse des Sauerstoffs M(O2 ) = 32,0 g/mol. pV = n(O2 )RT = m(O2 )/M(O2 )RT m(O2 ) = pV M(O2 )/(R · T ) =
200 bar · 50 l · 32,0 g/mol 0,0831 bar · l/(mol · K) · 298,15 K
= 12,9 kg Die Zustandsgleichung idealer Gase ist ein Grenzgesetz, das von realen Gasen nur bei hohen Temperaturen und bei kleinen Drücken angenähert befolgt wird. Unter sonst gleichen Bedingungen sind die Abweichungen dann besonders groß, wenn die Gasmoleküle polarisiert sind oder wenn sie beträchtliche Eigenvolumina aufweisen. Gase mit polaren Molekülen sind z. B. Kohlendioxid CO2 , Chlorwasserstoff HCl und Ammoniak NH3 . Im Gegensatz dazu werden bei sehr kleinen Atomen oder Molekülen (Bedingung: Aufbau aus Atomen gleicher Elektronegativität, siehe 3.1.4) nur geringe Abweichungen vom idealen Verhalten beobachtet. Beispiele sind Helium He, Neon Ne, und Wasserstoff H2 .
Gesetz von Boyle und Mariotte
Gleiche Volumina verschiedener idealer Gase enthalten bei gleichem Druck und gleicher Temperatur (V, p, T = const) stets dieselbe Zahl von Teilchen. oder
(5-2)
Stellt man bei verschiedenen Temperaturen den Druck als Funktion des Volumens graphisch dar, so erhält man als Isothermen eine Schar von Hyperbeln, siehe Bild 5-1. Gesetz von Gay-Lussac
Bei konstantem Druck und vorgegebener Stoffmenge ist das Volumen der thermodynamischen Temperatur direkt proportional: oder V1 /T 1 = V2 /T 2 bei p, n = const.
(5-4) P = (nR/V)T = const · T p1 /T 1 = p2 /T 2 bei V, n = const .
Satz von Avogadro
In der Zustandsgleichung idealer Gase (5-1) sind als Spezialfälle das Boyle-Mariottesche Gesetz, das Gesetz von Gay-Lussac und der Satz von Avogadro enthalten:
V = (nR/P)T = const · T
Ein analoges Gesetz für den Druck erhält man bei konstantem Volumen und vorgegebener Stoffmenge. Auch diese Beziehung wird meist als Gay-Lussac’sches Gesetz bezeichnet:
oder
5.1.3 Spezialfälle der Zustandsgleichung idealer Gase
pV = const bei T, n = const .
Bild 5-1. Der Druck p eines idealen Gases als Funktion des Volumens V (Boyle-Mariotte’sches Gesetz), T Temperatur
(5-3)
n = pV/(RT ) = const N = const bei p, V, T = const
(5-5)
N Teilchenzahl. 5.1.4 Reale Gase
Anders als bei den idealen Gasen wirken zwischen den Teilchen eines realen Gases Anziehungskräfte. Die Wirkung dieser Kräfte ist umso stärker, je kleiner die Abstände der Teilchen voneinander sind, je größer also der Druck des Gases ist. Außerdem haben die Teilchen eines realen Gases ein mehr oder weniger großes Eigenvolumen. Als Folge hiervon kann ein reales Gas nicht beliebig komprimiert werden. Kein natürlich vorkommendes Gas verhält sich wie ein ideales Gas.
C19
C20
C Chemie
Zur quantitativen Beschreibung des Verhaltens realer Gase ist eine Vielzahl empirischer Gleichungen vorgeschlagen worden (vgl. z. B. G. Kortüm und H. Lachmann, 1981, siehe Literatur zu Kap. 6). In diesen Beziehungen werden die Anziehungskräfte der Partikel untereinander sowie das Eigenvolumen der Gasteilchen durch eine unterschiedliche Anzahl empirischer Konstanten berücksichtigt. Im Folgenden werden die Virialgleichung und die van-der-Waals’sche Gleichung beschrieben. 5.1.5 Die Virialgleichung
Bei realen Gasen ist das Produkt aus Druck und Volumen bei vorgegebener Temperatur keine Konstante, sondern vielmehr eine Funktion des Druckes. In der Virialgleichung wird diese Abhängigkeit durch eine Potenzreihe von p dargestellt. Die notwendige Zahl von Korrekturgliedern richtet sich nach der gewünschten Genauigkeit bei der Beschreibung des Verhaltens eines bestimmten realen Gases. pVm = RT + Bp + C p2 + Dp3 + . . .
(5-6)
V Volumen (extensive Größe), Vm = V/n molares Volumen (intensive Größe). Die temperaturabhängigen Konstanten B, C, D heißen Virialkoeffizienten. Sie müssen mithilfe numerischer Methoden aus Messwerten ermittelt werden. Eine Beziehung ähnlicher Form wird auch zur Beschreibung der Konzentrationsabhängigkeit des osmotischen Druckes herangezogen (vgl. 8.2.3). 5.1.6 Die van-der-Waals’sche Gleichung. Der kritische Punkt
Die van-der-Waals’sche Gleichung beschreibt näherungsweise den Zusammenhang der Zustandsgrößen für reale Gase. Qualitativ wird auch das Verhalten von Flüssigkeiten charakterisiert. Diese Beziehung lautet: (5-7a) p + n2 a/V 2 (V − nb) = nRT oder
p + a/Vm2 (Vm − b) = RT .
(5-7b)
Die Stoffkonstanten a und b müssen für jedes Gas empirisch ermittelt werden. Der Term a/Vm2 heißt Kohäsionsdruck. Er beschreibt die Auswirkungen der Anziehungskräfte zwischen den Gasteilchen. Die Konstante b wird als Covolumen bezeichnet. Nimmt man
an, dass die Gasteilchen kugelförmig sind, kann der Zusammenhang zwischen b und dem Radius r der Gasteilchen durch folgende Gleichung beschrieben werden: b = 4NA (4π/3)r3 NA Avogadro-Konstante. In Tabelle 5-1 sind die Konstanten a und b der vander-Waals’schen Gleichung für einige Gase angegeben. Bild 5-2 gibt die mithilfe der van-der-Waals’schen Gleichung für CO2 berechneten Isothermen wieder. Oberhalb der kritischen Temperatur T k = 304 K (siehe unten) ist der Verlauf der Isothermen ähnlich wie bei einem idealen Gas. Bei Temperaturen unterhalb von T k zeigen alle Isothermen dagegen eine Sförmige Gestalt. Bei der kritischen Temperatur ist die Isotherme durch einen Wendepunkt mit waagerechter Tangente gekennzeichnet. Dieser Wendepunkt wird als kritischer Punkt P bezeichnet. Der kritische Punkt kann experimentell bestimmt werden. Er ist durch die Stoffkonstanten kritische Temperatur, kritischer Druck und kritisches molares Volumen charakterisiert (vgl. Tabelle 5-2). Im Folgenden sollen einige Aspekte der Stabilität (vgl. 6.3.5) von Gasen und Flüssigkeiten anhand von Bild 5-2 diskutiert werden. Oberhalb der Temperatur Tk ist ausschließlich die Gasphase stabil. Flüssigkeiten können oberhalb der kritischen Temperatur nicht existieren. Bei Temperaturen, die kleiner als die kritische Temperatur sind, können reine Gas- bzw. Flüssigkeitsphasen stabil, metastabil oder instabil sein. So ist z. B. bei einer Temperatur von T = 290 K, für die die Tabelle 5-1. Konstanten a und b der van-der-Waals’schen Gleichung für einige Gase
Gas Helium Neon Argon Wasserstoff Stickstoff Sauerstoff Kohlendioxid
a bar · l2 /mol2 0,0346 0,208 1,36 0,2452 1,370 1,382 3,658
b l/mol 0,0238 0,0167 0,0320 0,0265 0,0387 0,0319 0,0429
5 Zustandsformen der Materie
Tabelle 5-2. Eigenschaften einiger technisch wichtiger Gase T s Siedepunkt (bezogen auf Normdruck pN = 101 325 Pa), T k kritische Temperatur, pk kritischer Druck, MAK-Wert: maximale Arbeitsplatzkonzentration, Volumenanteil in ppm = 10−6 = cm3 /m3
Name Luft
Formel T s /◦ C
Ammoniak
NH3
−33,3
132,4
Chlor
Cl2
−34,0
144
Chlorwasser- HCl stoff Distickstoff- N2 O monoxid Edelgase Helium Neon Argon Krypton Xenon Kohlendioxid
Kohlenmonoxid Sauerstoff Schwefeldioxid Stickstoff Wasserstoff Kohlenwasserstoffe Methan Ethan Propan Butan Ethylen (Ethen) Acetylen (Ethin)
T k /◦ C
−85,0
51,5
−88,5
36,4
He Ne Ar Kr Xe CO2
−268,9 −267,9 −246,1 −228,8 −185,9 −122,3 −153,2 −63,8 −108,1 16,6 −78,4 31,1
CO
−191,5 −140,2
O2 SO2
−183,0 −118,4 −10,0 157,5
N2 H2
−195,8 −147,0 −252,9 −239,9
CH4 C 2 H6 C 3 H8 C4 H10 C 2 H4
−161,5 −88,6 −42,1 −0,5 −103,7
C 2 H2
pk /bar Bemerkungen Zusammensetzung der trockenen Luft (Volumenanteil): N2 : 78,09%, O2 : 20,95%, Ar: 0,92%, CO2 : 0,03%, Ne: 0,002%, He: 0,0005%, Spuren von Kr, H2 und Xe 113,0 farblos, brennbar, stechender Geruch, giftig, MAK-Wert: 50 ppm, sehr große Löslichkeit in Wasser, mit Luft bilden sich explosionsfähige Gemische 77,0 gelbgrün, erstickend stechender Geruch, hochgiftig, MAK-Wert: 0,5 ppm, sehr starkes Oxidationsmittel 83,4 farblos, stechender Geruch, giftig, MAK-Wert: 5 ppm, sehr große Löslichkeit in Wasser (Bildung von Salzsäure) 72,7 „Lachgas“, farblos, schwach süßlicher Geruch, narkotisch wirkend, starkes Oxidationsmittel, unter bestimmten Bedingungen explosionsartiger Zerfall in die Elemente farblos, geruchlos, sehr wenig oder überhaupt nicht 2,3 reaktionsfähig 26,5 49,0 54,9 59,0 73,8 Sublimationstemperatur (bezogen auf 101 325 Pa): −78,5 ◦ C, farblos, etwas säuerlicher Geruch und Geschmack, MAK-Wert: 5000 ppm, Anhydrid der Kohlensäure 35,0 farblos, brennbar, geruchlos, hochgiftig, MAK-Wert: 30 ppm, mit Luft bilden sich explosionsfähige Gemische 50,8 farblos, geruchlos, sehr starkes Oxidationsmittel 78,8 farblos, stechender Geruch, giftig, MAK-Wert: 2 ppm, gute Löslichkeit in Wasser, Anhydrid der schwefligen Säure 34,0 farblos, geruchlos, nicht brennbar, sehr wenig reaktionsfähig 13,0 farblos, geruchlos, brennbar, mit Luft bilden sich explosionsfähige Gemische farblos, mit Luft bilden sich explosionsfähige Gemische
−82,6 32,3 96,8 152,0 9,2
46,0 48,8 42,6 38,0 50,2
geruchlos geruchlos geruchlos, MAK-Wert: 1000 ppm geruchlos, MAK-Wert: 1000 ppm leicht süßlicher Geruch
35,2
61,9
Sublimationstemperatur (bezogen auf 101 325 Pa): −84,0 ◦ C, schwach ätherisch riechend, narkotisch wirkend, neigt zu explosivem Zerfall in die Elemente farblos, etherähnlicher Geruch, brennbar, giftig, MAK-Wert: 1 ppm, neigt spontan zur Polymerisation (z. T. explosionsartig), neigt zu explosiven Zerfallsreaktionen „R 12“, farblos, schwacher Geruch, narkotisch wirksam, MAKWert: 1000 ppm, chemisch sehr beständig, die Freisetzung von Fluorchlorkohlenwasserstoffen (FCKW) verursacht Umweltschäden (Zerstörung der Ozonschicht der Erdatmosphäre)
Ethylenoxid
C 2 H4 O
10,4
195,8
71,9
Dichlordifluormethan
CCl2 F2
−29,8
112,0
41,2
C21
C22
C Chemie
5.2 Flüssigkeiten Flüssigkeiten nehmen in ihren Eigenschaften eine Mittelstellung zwischen den Festkörpern und den Gasen ein. Im Gegensatz zu den Festkörpern können Flüssigkeiten beliebige Formen annehmen. Einer Änderung des Volumens wird dagegen ein sehr großer Widerstand entgegengesetzt, d. h., die Kompressibilität von Flüssigkeiten ist mit der von Festkörpern, aber nicht mit der von Gasen vergleichbar. 5.2.1 Einteilung der Flüssigkeiten
Flüssigkeiten können nach der Art der Bindung, die zwischen den einzelnen Teilchen wirksam ist, folgendermaßen eingeteilt werden:
Bild 5-2. Der Druck p eines realen Gases als Funktion des molaren Volumens Vm . Die Isothermen wurden für Kohlendioxid nach der van-der-Waals’schen Gleichung berechnet
Bedingung T < T k gilt, die reine Gasphase bei allen molaren Volumina, die größer als VmA sind, stabil. Der Bereich AB der Kurve entspricht übersättigtem Dampf. Hier ist eine reine Gasphase metastabil. Die Zufuhr oder die spontane Bildung eines Keimes führt zur Ausbildung einer flüssigen Phase und zum Absinken des Gasdruckes auf den Sättigungswert pA . Im Bereich BC ist sowohl die reine Gasphase als auch die reine Flüssigkeitsphase instabil. Entsprechende Zustände sind daher nicht realisierbar. Zwischen C und D liegt eine überexpandierte Flüssigkeit vor. Dieser Bereich ist wiederum metastabil. Die Zufuhr eines Keimes oder seine spontane Bildung führt zur (teilweise explosionsartig ablaufenden) Bildung einer Gasphase und Erhöhung des Druckes auf den Sättigungswert pA . Bei molaren Volumina, die kleiner als VmD sind, ist bei 290 K nur die reine flüssige Phase existenzfähig.
– Unpolare Flüssigkeiten. Die Atome bzw. Moleküle werden im Wesentlichen durch Dispersionskräfte zusammengehalten. Beispiel: Tetrachlorkohlenstoff CCl4 . – Polare Flüssigkeiten. Zwischen den Teilchen wirken Dipolkräfte, teilweise zusätzlich auch Wasserstoffbrückenbindungen. Beispiel: Methanol CH3 OH, Wasser (vgl. Abschnitt 5.2.3). – Flüssige Metalle. Der Zusammenhalt der Teilchen in diesen Flüssigkeiten wird durch die metallische Bindung bewirkt. Beispiel: flüssiges Quecksilber. – Salzschmelzen. Zwischen den Ionen in einer Salzschmelze wirken wie bei den Ionenkristallen elektrostatische Anziehungskräfte. 5.2.2 Struktur von Flüssigkeiten
In (idealen) Festkörpern sind die atomaren Bausteine bis in makroskopische Bereiche periodisch angeordnet (Fernordnung) und zwar sowohl hinsichtlich ihrer Position als auch (bei mehratomigen Bausteinen) hinsichtlich ihrer Orientierung. Im Gegensatz dazu sind Flüssigkeiten durch einen als Nahordnung bezeichneten Zustand charakterisiert. Diese Nahordnung, die sich auf den Abstand und die Orientierung der Atome bzw. Moleküle bezieht, erfasst in erster Linie die nächsten Nachbarn eines beliebig herausgegriffenen Teilchens. Als Folge der Temperaturbewegung ist sie schon bei den zweitnächsten Nachbarn wesentlich geringer ausgeprägt; nach einigen Teilchendurchmessern ist sie überhaupt nicht mehr erkennbar. Bei der
5 Zustandsformen der Materie
Tabelle 5-3. Physikalische Eigenschaften des Wassers
Schmelzpunkt Siedepunkt kritische Temperatur kritischer Druck molare Schmelzenthalpie molare Verdampfungsenthalpie (100 ◦ C) dynamische Viskosität (bei 25 ◦ C) elektrische Leitfähigkeit (bei 18 ◦ C) Dichte, Eis (bei 0 ◦ C)
0 ◦C 100 ◦ C 374,1 ◦ C 221,2 bar 6,007 kJ/mol 40,66 kJ/mol 0,8903 mPa s 4 · 10−6 S/m 0,9168 kg/dm3
Tabelle 5-4. Dichte des flüssigen Wassers bei verschiedenen Celsius-Temperaturen Bild 5-3. Radiale Verteilungsfunktion (r) für Wasser bei ◦
◦
1,5 C und 83 C (nach Robinson, R. A.; Stokes, R. H.: Electrolyte solutions)
Annäherung an den Gefrierpunkt werden die Nahordnungsbereiche vergrößert. Der geschilderte Sachverhalt ist in Bild 5-3 verdeutlicht. Die dort dargestellte radiale Dichte-Verteilungsfunktion wurde mit Röntgenbeugungsuntersuchungen an flüssigem Wasser ermittelt. 5.2.3 Eigenschaften des flüssigen Wassers
Unter den kovalenten Hydriden nimmt Wasser aufgrund seiner physikalischen und chemischen Eigenschaften (vgl. Tabellen 5-3 und 5-4) eine Sonderstellung ein. Dies zeigt sich besonders deutlich, wenn man die Schmelz- und Siedepunkte des Wassers mit den anderen Wasserstoffverbindungen der Elemente der VI. Hauptgruppe sowie mit Ammoniak NH3 und Fluorwasserstoff HF vergleicht: Substanz H2 O H2 S H2 Se H2 Te NH3 HF
Schmelzpunkt ◦ C 0 −85,5 −65,7 −49 −77,7 −83,1
Siedepunkt ◦ C 100 −60,7 −41,3 −2 −33,4 19,5
T in ◦ C 0 4 10 15 20 25
in kg/dm3 0,99987 1,00000 0,99973 0,99913 0,99823 0,99707
Im Eis ist jedes Wassermolekül tetraedrisch von vier anderen H2 O-Teilchen umgeben, d. h., die Wassermoleküle haben in diesem Festkörper die Koordinationszahl 4. Über kurze Entfernungen bleibt auch in flüssigem Wasser die Tetraederstruktur erhalten. Das zeigen die Ergebnisse von Röntgenbeugungsuntersuchungen. Danach vergrößert sich die Koordinationszahl mit steigender Temperatur von 4,4 bei 1,5 ◦ C auf 4,9 bei 83 ◦ C. Bei fast allen anderen Flüssigkeiten ist die Koordinationszahl wesentlich größer und hat meist Werte zwischen 8 und 11. Die tetraedrische Nahordnungsstruktur des flüssigen Wassers wird – genau wie beim Eis – hauptsächlich durch Wasserstoffbrückenbindung (vgl. 3.4) verursacht. Viele Eigenschaften des Wassers können mit dieser Struktur erklärt werden, so z. B.: – Der im Vergleich mit den anderen kovalenten Hydriden ungewöhnlich hohe Schmelz- und Siedepunkt. Dieser Effekt kann auf die Wasserstoffbrückenbindung und die Dipoleigenschaften der H2 O-Moleküle zurückgeführt werden.
C23
C24
C Chemie
– Die Ausdehnung des Wassers beim Gefrieren. Diese Volumenvergrößerung ist eine Folge der Verkleinerung der Koordinationszahl beim Übergang vom flüssigen in den festen Aggregatzustand. Im Gegensatz hierzu wird bei fast allen anderen Substanzen beim Gefrieren eine Vergrößerung der Koordinationszahl beobachtet. So ist z. B. im flüssigen Gold die Koordinationszahl 11. Das kubisch flächenzentriert kristallisierende feste Gold hat dagegen die Koordinationszahl 12 (vgl. 5.3.2). – Das Dichtemaximum des flüssigen Wassers bei 4 ◦ C (vgl. Tabelle 5-4). Diese Eigenschaft wird durch zwei gegenläufige Effekte bewirkt: Dem allmählichen Aufbrechen der eisähnlichen Tetraederstruktur (erkennbar an der mit steigender Temperatur einhergehenden Vergrößerung der Koordinationszahl) und der normalen Zunahme des mittleren Teilchenabstandes bei Erhöhung der Temperatur. 5.2.4 Gläser
Definition Gläser sind eingefrorene, unterkühlte Flüssigkeiten. Eine unterkühlte Flüssigkeit ist metastabil (vgl. 6.3.5), befindet sich aber oberhalb der Glastemperatur (siehe unten) im inneren Gleichgewicht, d. h., dass die thermodynamischen Eigenschaften einer vorgegebenen Stoffmenge durch Angabe der Variablen Druck und Temperatur eindeutig bestimmt sind. Bei einer eingefrorenen unterkühlten Flüssigkeit – also bei einem Glas – ist dies jedoch nicht mehr der Fall. Bei der Glasumwandlung ist der Temperaturverlauf einiger Größen – so z. B. der Freien Enthalpie, der Entropie und des Volumens – stetig. Dagegen erfahren bei dieser Umwandlung z. B. die spezifische Wärmekapazität, der thermische Ausdehnungskoeffizient und die Kompressibilität sprunghafte Änderungen. Am Beispiel des Temperaturverlaufs der spezifischen Enthalpie und des spezifischen Volumens ist dies in Bild 5-4 schematisch dargestellt. Die Temperaturabhängigkeit der spezifischen Wärmekapazität wurde hierbei vernachlässigt. Wie dieser Darstellung entnommen werden kann, sinkt der Wert der spezifischen Enthalpie mit einer durch die spezifische Wär-
Bild 5-4. Der Temperaturverlauf der spezifischen Enthal-
pie h und der spezifischen Wärmekapazität cp bei der Glasbildung, T Temperatur, T s Schmelzpunkt, T g Glastemperatur
mekapazität vorgegebenen Steigung (vgl. F 1.2.3). Wenn unterhalb des Gefrierpunktes keine Kristallisation stattfindet, verringert sich die spezifische Enthalpie der (metastabilen) unterkühlten Flüssigkeit mit einer praktisch unveränderten Steigung. Wird die Abkühlung unterhalb der mit T g bezeichneten Temperatur fortgesetzt, so nimmt die spezifische Enthalpie zwar weiterhin ab, jetzt aber mit einem geringeren Temperaturkoeffizienten. Die Temperatur T g wird als Glastemperatur bezeichnet. Eine unterkühlte Flüssigkeit ist erst unterhalb dieser Temperatur ein Glas. Glastemperatur
Die Glastemperatur ist die niedrigste Temperatur, bei der eine unterkühlte Flüssigkeit im Rahmen einer normalen Versuchsdauer das innere Gleichgewicht erreichen kann. Unterhalb dieser Temperatur wird die Relaxationszeit groß im Vergleich zur Dauer eines Experimentes. Aus dem Gesagten folgt, dass die Glastemperatur keine Stoffkonstante ist, sondern je nach der Art und dem Zeitbedarf der ausgeführten Versuche unterschiedliche Werte annehmen kann.
5 Zustandsformen der Materie
Glasbildende Substanzen
Im Prinzip kann jede Substanz durch Abschrecken der Schmelze in ein Glas überführt werden, wenn es gelingt, die Kristallisation zu vermeiden. Da die experimentell erreichbare Abkühlungsgeschwindigkeit jedoch begrenzt ist, konnte die Glasbildung nur bei einer eingeschränkten Zahl von Stoffen beobachtet werden. Als wichtige Beispiele seien angeführt: Oxide. In dieser Verbindungsgruppe befinden sich die wichtigsten glasbildenden Substanzen, so z. B. reines SiO2 (Quarzglas oder Kieselglas) und SiO2 -haltige Mischoxide (Silicatgläser) (vgl. D 4.4). Metallische Legierungen (metallische Gläser) Einfache organische Verbindungen (z. B. Zuckerwatte, das ist Glas aus Rohrzucker). Organische Polymerverbindungen, so z. B. Polymethacrylate, Polystyrol, Polycarbonate (vgl. 12 und D 5.5). 5.2.5 Flüssige Kristalle oder Flüssigkristalle
Flüssigkristalle stellen eine Zustandsform der Materie dar, die zwischen dem kristallinen und dem flüssigen Zustand auftreten kann. Sie werden deshalb auch Mesophasen genannt. Beobachtet wird diese Zustandsform vor allem bei stark anisometrischen (stäbchen- oder scheibenförmigen) organischen Molekülen. Flüssigkristalle weisen einerseits typische Flüssigkeitseigenschaften wie z. B. Fließfähigkeit auf, andererseits auch typische Festkörpereigenschaften wie optische Anisotropie. Diese Eigenschaftskombination wird dadurch hervorgerufen, dass die Ordnungsmerkmale eines Kristalls (Positionsfernordnung und Orientierungsfernordnung) beim Erhitzen nicht gleichzeitig bei einer Temperatur verschwinden, sondern sukzessive bei unterschiedlichen Temperaturen. Viele stäbchenförmige Moleküle, die flüssigkristalline Phasen ausbilden, sind aus starren Mittelstücken und flexiblen Endgruppen aufgebaut; Beispiele dafür sind das 4-Methoxybenzyliden-4-butylanilin (MBBA) sowie das Pentylcyanobiphenyl (5CB).
Diese beiden Moleküle gehen bei den angegebenen Temperaturen von der kristallinen (k) in die nematische (n) bzw. die isotrope flüssige (i) Phase über. Nematische Phasen sind Mesophasen, in denen keine Positionsfernordnung auftritt, die aber eine Orientierungsfernordnung mit relativ großer Fluktuation (mehrere 10°) der Moleküllängsachsen um eine Vorzugsrichtung aufweisen (Bild 5-5). Sofern die anisometrischen Moleküle chiral sind, kommt es zu einer übermolekularen Verdrillung der nematischen Struktur. Man spricht dann von cholesterischen Phasen (Bild 5-6). Höher geordnete Flüssigkristalle sind die smektischen Phasen, bei denen neben der Orientierungsfernordnung eine Positionsfernordnung in einer Raumrichtung erhalten bleibt. Die Moleküle sind in Schichten angeordnet, innerhalb einer Schicht liegt jedoch keine Positionsfernordnung vor. Es gibt eine Reihe unterschiedlicher smektischer Strukturen (Bild 5-7).
Bild 5-5. Struktur einer nematischen Phase
Bild 5-6. Struktur einer cholesterischen Phase
C25
C26
C Chemie
Spaltbarkeit, Härte, Lichtgeschwindigkeit und Kristallwachstumsgeschwindigkeit, in verschiedenen Raumrichtungen unterschiedliche Werte haben (z. B. Graphit, vgl. D 4.2). Im Gegensatz hierzu sind bei isotropen Körpern die physikalischen Eigenschaften unabhängig von der Raumrichtung. Isotrop verhalten sich alle Gase, Flüssigkeiten (mit Ausnahme der flüssigen Kristalle) und Gläser. Bild 5-7. Strukturen einer smektischen A Phase (links) und
Elementarzelle
einer smektischen C Phase (rechts)
Bei der Translation der Gitterbausteine um ein Vielfaches der drei unabhängigen Translationsvektoren a, b und c erhält man ein dreidimensionales Gitter (Raumgitter).Hierbei können die Längen der Translationsvektoren unterschiedlich groß sein und die Winkel außer 90° auch beliebig andere Werte annehmen. Das durch die drei Vektoren aufgespannte Parallelepiped heißt Elementarzelle. Als Gitterkonstanten werden die Längen a, b und c der drei Vektoren sowie die Achsenwinkel α, β und γ bezeichnet. Aus einer Elementarzelle lässt sich durch Translation das gesamte Raumgitter aufbauen.
Kolumnare Phasen werden vor allem von scheibenförmigen Molekülen ausgebildet: Die Moleküle werden in Säulen gestapelt, innerhalb derer eine ungeordnete, flüssigkeitsähnliche Abstandsverteilung vorliegt. Die Säulen selbst können zweidimensionale Gitter ausbilden. Die Moleküle einer flüssigkristallinen Phase lassen sich durch ein elektrisches Feld reorientieren, so dass die Transmission von polarisiertem Licht verändert wird. Dies wird in der Optoelektronik bei Flüssigkristall-Anzeigen ausgenutzt.
5.3 Festkörper Im allgemeinen Sprachgebrauch werden Substanzen, die volumenkonstant und formelastisch sind, Festkörper genannt. Festkörper im engeren Sinne sind definitionsgemäß jedoch nur solche Stoffe, bei denen die atomaren oder molekularen Bausteine in einem regelmäßigen Gitter angeordnet sind, also Stoffe, die einen kristallinen Aufbau haben. Amorphe Substanzen und Gläser (vgl. 5.2.4) werden nach dieser Definition nicht zu den Festkörpern gerechnet. 5.3.1 Kristalle
Kristalle sind Festkörper mit periodisch in einem dreidimensionalen Gitter (Raumgitter, Kristallgitter) angeordneten Bausteinen (Atome, Ionen oder Moleküle). Kristalle haben zwei wesentliche Eigenschaften: Sie sind homogen und anisotrop. Ein Körper wird als homogen bezeichnet, wenn er in parallelen Richtungen gleiches Verhalten zeigt. Er ist anisotrop, wenn bestimmte Eigenschaften, wie z. B.
Kristallsysteme
Nach dem Verhältnis der Kantenlängen in den Elementarzellen sowie nach den Achsenwinkeln kann man sieben verschiedene Kristallsysteme voneinander unterscheiden, siehe D 2.1, Bild D 2-2. 5.3.2 Bindungszustände in Kristallen
Kristallgitter können nach mehreren Gesichtspunkten eingeteilt werden, so z. B. nach Art der Gitterbausteine oder nach der Art der in den Kristallen vorherrschenden Bindung (vgl. D 2.1). Wählt man das zuletzt erwähnte Einteilungsprinzip, kann man folgende vier Gittertypen unterscheiden: – Metallkristalle, Bindungsart: metallische Bindung (vgl. 3.3). Gitterbausteine: Atome. Deren positiv geladene Ionen bilden ein Raumgitter, in dem frei bewegliche Elektronen vorhanden sind. Die Bindungskräfte sind ungerichtet. Eigenschaften: Gute thermische und elektrische Leitfähigkeit, metallischer Glanz, dehnbar, schmiedbar, duktil. Beispiele: Kupfer, Natrium, Eisen. – Ionenkristalle, Bindungsart: Ionenbindung (vgl. 3.2). Gitterbausteine: Kugelförmige Ionen
5 Zustandsformen der Materie
definierter Ladung. Die Bindungskräfte sind ungerichtet. Eigenschaften: hart, spröde, hohe Schmelzund Siedepunkte, nur in polaren Lösungsmitteln löslich, sehr geringe elektrische Leitfähigkeit. Beispiele: Natriumchlorid, Caesiumiodid. – Kovalente Kristalle, Bindungsart: Kovalente Bindung (vgl. 3.1), Gitterbausteine: Atome der IV. Hauptgruppe. Eigenschaften: hart, sehr hohe Schmelz- und Siedetemperaturen, Isolatoren. Beispiel: Diamant. – Molekülkristalle, Bausteine: Moleküle und Edelgasatome. Bindungsart: Van-der-Waals’sche Bindung und Wasserstoffbrückenbindung (Beispiele: feste Edelgase, festes Kohlendioxid; Eis, vgl. 5.2.3). Eigenschaften: weich, tiefe Schmelzund Siedetemperaturen.
Struktur von Metallkristallen
Die meisten Metalle kristallisieren in einer der folgenden Strukturen: – hexagonal dichteste Kugelpackung (Koordinationszahl 12), – kubisch dichteste Kugelpackung (kubisch flächenzentriertes Gitter) (Koordinationszahl 12), – kubisch raumzentriertes Gitter (Koordinationszahl 8). Als Koordinationszahl wird die Zahl der nächsten Nachbarn, die ein bestimmtes Teilchen umgeben, bezeichnet. In Tabelle 5-5 sind neben der Angabe des Strukturtyps die Schmelz- und Siedepunkte einiger Metalle aufgeführt; weitere Angaben siehe D 9.3.3, Tabelle 9-7.
Tabelle 5-5. Strukturtypen, Schmelz- und Siedepunkte einiger metallischer Elemente. kd kubisch dichteste Kugelpackung, hd hexagonal dichteste Kugelpackung, krz kubisch raumzentriert, T sl Schmelzpunkt, T lg Siedepunkt. Die Angaben in Klammern sind Phasenumwandlungstemperaturen
Element Struktur T sl /◦ C T lg /◦ C a Cu kd 1084,62 2562 Ag kd 961,78a 2162 Au kd 1064,18a 2856 Al kd 660,323a 2519 Pb kd 327 1749 γ-Fe kd (1401) – Be hd 1287 2471 Mg hd 650 1090 Zn hd 419,527a 907 Ti hd 1668 3287 Zr hd 1855 4409 Li krz 180 1342 Na krz 97,8 883 K krz 63,4 759 V krz 1910 3407 Ta krz 3017 5458 W krz 3422 5555 α-Fe krz (906) – δ-Fe krz 1538 2750 a Fixpunkt der Internationalen Temperaturskala von 1990 (ITS-90).
Dichteste Kugelpackungen
Für eine zweidimensionale Schicht dichtest gepackter Kugeln gibt es nur eine Möglichkeit der Anordnung. Hierbei ist jede Kugel von sechs anderen umgeben. Die dreidimensionalen dichtesten Kugelpackungen entstehen durch Übereinanderlagerung derartiger Schichten. Dabei müssen die Atome der neuen Schicht in den Lücken der bereits vorhandenen liegen. Für zwei dichtest gepackte Kugelschichten ist dies in Bild 5-8 schematisch dargestellt. Die Zahl der theoretisch möglichen Kugelpackungen ist nahezu unbegrenzt.
Bild 5-8. Dichteste Kugelpackungen, zwei Kugelschichten
mit Tetraeder- (T) und Oktaederlücken (O)
Verwirklicht werden hauptsächlich die folgenden beiden: – Hexagonal dichteste Kugelpackung Die Folge der dichtest gepackten zweidimensionalen Schichten ist hier ABAB. . ., d. h., die Kugeln
C27
C28
C Chemie
der 3. Schicht sind unmittelbar über der ersten angeordnet. (Elementarzelle der hexagonal dichtesten Kugelpackung siehe Bild 5-9.) – Kubisch dichteste Kugelpackung Bei dieser Struktur ist die Stapelfolge ABCABC. . . , d. h., die Kugeln der 4. Schicht befinden sich unmittelbar über der ersten. Nach ihrer Elementarzelle wird diese Struktur auch als kubisch flächenzentriert bezeichnet (vgl. Bild 5-10). Bei den dichtesten Kugelpackungen beträgt die Packungsdichte 74%, d. h., 26% des Gesamtvolumens entfallen auf die zwischen den Kugeln befindlichen Lücken. Es existieren zwei unterschiedliche Arten von Lücken: a) Tetraederlücken, die von vier Atomkugeln in tetraedrischer Anordnung begrenzt sind (vgl. Bild 5-8). Die Zahl dieser Lücken ist doppelt so groß wie die Zahl der Metallatome. b) Oktaederlücken, das sind von acht Atomkugeln in oktaedrischer Anordnung eingefasste Lücken. Ihre Zahl ist gleich der der atomaren Bausteine (vgl. Bild 5-8). Die Packungsdichte beim kubisch raumzentrierten Gitter (vgl. Bild 5-11) ist geringer als bei den dichtesten Kugelpackungen, sie beträgt 68%.
Bild 5-9. Elementarzelle der hexagonal dichtesten Kugelpa-
ckung
Bild 5-10. Elementarzelle der kubisch dichtesten Kugelpa-
ckung, kubisch flächenzentriertes Gitter
Bild 5-11. Kubisch raumzentriertes Gitter
Struktur von Ionenkristallen
Die Struktur von Ionenkristallen hängt im Wesentlichen von folgenden Faktoren ab: – Von der quantitativen Zusammensetzung des Salzes und – vom Radienverhältnis der Kationen (A) und Anionen (B). Für Ionenkristalle des Formeltyps AB treten abhängig vom Radienverhältnis folgende Gitterstrukturen am häufigsten auf: – Caesiumchlorid-Gitter. Grenzradienquotient rA+ /rB− ≥ 0,732. Gitterstruktur: Sowohl die Cs+ -Ionen als auch die Cl− -Ionen bilden kubisch primitive Teilgitter, die um eine halbe Raumdiagonale gegeneinander verschoben sind (vgl. Bild 5-12). Jedes Cs+ -Ion ist von acht Cl− Ionen und jedes Cl− -Ion von acht Cs+ - Ionen umgeben (Koordinationszahl 8). Beispiele: Caesiumchlorid CsCl, CsBr, CsI. – Natriumchlorid-Gitter. Grenzradienquotient 0,414 ≤ rA+ /B− ≤ 0,732. Gitterstruktur: Die Na+ - und die Cl− -Ionen bilden kubisch flächenzentrierte Teilgitter aus, die um eine halbe Kantenlänge in einer Koordinatenachse verschoben sind (vgl. Bild 5-13). Die Cl− -Ionen (r(Na+)/r(Cl− ) = 0,56) bilden eine kubisch dich-
Bild 5-12. Elementarzelle der Caesiumchlorid-Struktur
5 Zustandsformen der Materie
Bild 5-13. Elementarzelle der Natriumchlorid-Struktur
teste Kugelpackung, in deren Oktaederlücken sich die Kationen befinden. Jedes Na+ -Ion ist von sechs Cl− -Ionen und jedes Cl− -Ion von sechs Na+ -Ionen umgeben (Koordinationszahl 6). Beispiele: NaCl, NaF, NaBr, NaI, KF, KCl, KBr, KI, CaO, MgO. – Zinkblende-Gitter. Grenzradienquotient 0,225 ≤ rA+ /rB− ≤ 0,414. (Zinkblende ist eine Modifikation des Zinksulfids ZnS. ZnS kommt noch in einer weiteren Modifikation als Wurtzit vor.) Gitterstruktur: Die S2− -Ionen bilden eine kubisch dichteste Kugelpackung, deren Tetraederlücken die Zinkionen alternierend besetzen; Koordinationszahl 4.
Kovalente Kristalle
Der wichtigste Vertreter dieses Gittertyps ist der Diamant. In dieser Kohlenstoffmodifikation sind die Elektronenzustände sp3 -hybridisiert (vgl. 3.1.3). Jedes C-Atom ist daher tetraedrisch von vier anderen C-Atomen umgeben. Die C-Atome bilden gewinkelte Sechsringe aus, die in parallelen Schichten angeordnet sind (vgl. Bild 5-14). Im Gegensatz zum Graphit werden die Schichten beim Diamanten jedoch durch Atombindungen fest zusammengehalten.
Bild 5-15. Graphitstruktur
Die skizzierte Struktur bedingt die große Härte des Diamanten. Kristalle mit komplexen Bindungsverhältnissen
In sehr vielen Fällen können Kristalle durch die Angabe einer der vier Grenztypen der chemischen Bindung nicht ausreichend beschrieben werden. Vielmehr sind Übergänge zwischen den verschiedenen Grenzbindungsarten vorhanden. So werden z. B. bei vielen Schwermetallsulfiden Mischformen von ionischer und metallischer Bindung beobachtet. Es ist auch möglich, dass in verschiedenen Raumrichtungen unterschiedliche Bindungsarten wirksam sind (Beispiel Graphit, vgl. Bild 5-15 und D 4.2). 5.3.3 Reale Kristalle
In diesem Kapitel wurden ausschließlich Idealkristalle behandelt. Hierunter versteht man Kristalle, die sowohl im makroskopischen wie auch im mikroskopischen Bereich einen mathematisch strengen Aufbau zeigen. In der Natur gibt es jedoch nur reale Kristalle, die sich von den Idealkristallen durch die Anwesenheit von Kristallbaufehlern unterscheiden; siehe D 2.2. 5.3.4 Grenzflächen
Bild 5-14. Diamantstruktur
Bei elementaren Betrachtungen (auch in der Thermodynamik, vgl. 6) sieht man davon ab, dass das Volumen von Festkörpern endlich ist. Reale Festkörper besitzen Grenzflächen, z. B. zu anderen Festkörpern, zu Flüssigkeiten oder zu Gasen (in den beiden letzten Fällen Oberflächen genannt). Chemische und physi-
C29
C30
C Chemie
kalische Prozesse an Grenzflächen sind von entscheidender Bedeutung für – das Kristallwachstum bzw. die Auflösung von Kristallen; – die geschwindigkeitsbestimmenden Schritte chemischer Reaktionen (heterogene Katalyse, vgl. 7.9); – Korrosion, Bruch, Reibung und Verschleiß. Die chemische Zusammensetzung und die Struktur einer Grenzfläche können erheblich von den Verhältnissen im Inneren des Festkörpers abweichen. Beispielsweise besitzen unedle Metalle Oxidoder Hydroxidschichten (s. z. B. 10.13.1) an der Metall-Luft-Grenzfläche; bei der Adsorption werden Teilchen durch van-der-Waals-Wechselwirkungen an einer Oberfläche gebunden. Zur Bestimmung der Struktur und der chemischen Zusammensetzung an Oberflächen dienen die rasterkraftmikroskopischen Methoden (z. B. atomic force microscopy AFM) und oberflächenspektroskopische Methoden (z. B. electronic spectroscopy for chemical analysis ESCA s. D 11.2).
5.4 Plasmen Der Plasmazustand (vgl. B 16.6) wird häufig als vierter Aggregatzustand der Materie bezeichnet. Oberhalb einer Temperatur von 10 000 K liegt die dann ausnahmslos gasförmige Materie vollständig ionisiert vor, sodass sie aus positiv oder negativ geladenen Ionen, Elektronen und (je nach Temperatur noch auftretenden) Neutralteilchen besteht. Während die Materie des Universums ganz überwiegend (> 99%) im Plasmazustand vorliegt, kommt er auf der Erde selten vor, z. B. in thermonuklearen Reaktionen, im Nordlicht oder im Lichtbogen. Bei Niedertemperaturplasmen, die u.a. durch Mikrowelleneinwirkung auf Gase bei geringem Druck (im mbar-Bereich) erzeugt werden können, besitzen nur die Elektronen extrem hohe Temperaturen, nicht aber die (schweren) Ionen oder Neutralteilchen (sogenannte nichtisotherme Plasmen). Technische Anwendungen für Plasmen sind Synthesen im Lichtbogen (z. B. von Acetylen), die Reinigung, Modifizierung und Beschichtung von Oberflächen sowie das Plasmaschneiden.
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht 6.1 Grundlagen 6.1.1 Einteilung der thermodynamischen Systeme
Stoffliche Systeme können folgendermaßen eingeteilt werden: – Nach den Transportmöglichkeiten von Energie und/oder Materie über die Systemgrenzen werden unterschieden: abgeschlossene Systeme (weder Materie- noch Energieaustausch möglich), geschlossene Systeme (nur Energieaustausch möglich) und offene Systeme (sowohl Materie- als auch Energieaustausch möglich). – Nach der stofflichen Zusammensetzung unterscheidet man zwischen Einstoff - und Mehrstoffsystemen. – Nach der Zahl der anwesenden Phasen unterscheidet man zwischen homogenen und heterogenen Systemen. Homogene Systeme weisen überall dieselben physikalischen und chemischen Eigenschaften auf. Sie bestehen aus nur einer Phase. Ein homogenes Einstoffsystem wird auch als reine Phase bezeichnet. Ein System, das aus mehr als einer Phase aufgebaut ist, heißt heterogen. Beispiele von homogenen Systemen: Mischungen von Gasen, flüssiges Wasser, wässrige Lösungen von Salzen (vgl. 8), Metalle und manche Metalllegierungen. Beispiele von heterogenen Systemen: Gemisch aus Eisen und Schwefel, Nebel, Gemisch aus flüssigem und festem Wasser, Granit, Kolloide (vgl. 8.1.1). 6.1.2 Die Umsatzvariable
Die in einer Reaktionsgleichung vor dem Stoffsymbol stehenden Zahlen werden als stöchiometrische Zahlen νB bezeichnet. Vereinbarungsgemäß haben die stöchiometrischen Zahlen der Ausgangsstoffe ein negatives und die der Endprodukte ein positives Vorzeichen. Für die Umsatzgleichung N2 + 3 H2 → 2 NH3
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht
der Umgebung nur Volumenarbeit (W12 = −pΔV) (vgl. F 1.1.2) ausgetauscht wird, erhält man für den 1. Hauptsatz:
gilt also: ν(N2 ) = −1 ν(H2 ) = −3
und ν(NH3 ) = +2 .
ΔU = Q12 − pΔV
Die Angabe von stöchiometrischen Zahlen ist nur bei unmittelbarem Bezug auf eine Reaktionsgleichung sinnvoll. Zur Beschreibung des Verlaufs einer chemischen Reaktion benötigt man nur eine einzige Variable, die Umsatzvariable ξ. Diese Größe wird auch als Reaktionslaufzahl bezeichnet und ist folgendermaßen definiert: dξ = dni /νi
(6-1)
ni Stoffmenge. Die Umsatzvariable hat die Dimension einer Stoffmenge. Wendet man diese Definitionsgleichung auf die oben genannte Reaktionsgleichung an, so erhält man: dξ = −dn(N2 ) = −1/3 dn(N2 ) = 1/2 dn(NH3 ) Die Umsatzvariable kann nicht nur auf chemische Reaktionen und Phasenumwandlungen, sondern auch auf Vorgänge, die nicht mehr mit Umsatzgleichungen beschrieben werden können (z. B. Ordnungs-Unordnungs-Übergänge in Legierungen), angewendet werden.
6.2 Anwendung des 1. Hauptsatzes der Thermodynamik auf chemische Reaktionen
(6-3)
Bei isochoren Vorgängen vereinfacht sich die obige Beziehung zu: ΔU = Q12 ;
V = const .
(6-4)
Bei isochoren Vorgängen ist die mit der Umgebung ausgetauschte Wärme gleich der Änderung der inneren Energie. Die Enthalpie H eines einfachen Bereiches ist folgendermaßen definiert (vgl. F 1.2.3): H = U + pV
(6-5)
Die Enthalpie ist eine Zustandsgröße. Sie ist eine extensive Größe und hat die Dimension einer Energie. Genau wie bei der inneren Energie ist es auch bei der Enthalpie nicht möglich, ihren Absolutwert zu bestimmen. Mit ΔU = Q12 − pΔV und Δ(pV) = VΔp + pΔV folgt aus obiger Beziehung: ΔH = Q12 + VΔp
(6-6)
Bei isobaren Vorgängen vereinfacht sich diese Gleichung zu ΔH = Q12 ;
p = const .
(6-7)
Bei isobaren Vorgängen ist die mit der Umgebung ausgetauschte Wärme gleich der Änderung der Enthalpie.
6.2.1 Der 1. Hauptsatz der Thermodynamik
Für ein geschlossenes System kann der 1. Hauptsatz der Thermodynamik folgendermaßen formuliert werden (vgl. F 1.5.2): ΔU = U2 − U1 = Q12 + W12 ,
oder dU = dQ − pdV
(6-2)
U innere Energie (Index 2: Endzustand, Index 1: Anfangszustand). Q12 Wärme bzw. W12 Arbeit, die mit der Umgebung ausgetauscht wird. Die innere Energie ist der Messung nicht zugänglich. Es können nur Differenzen dieser Größe ermittelt werden. Im Gegensatz zur Wärme und zur Arbeit ist die innere Energie eine extensive Zustandsgröße (vgl. F 1.2.1). Die drei Größen U, Q und W haben die Dimension einer Energie. Vorausgesetzt, dass zwischen dem System und
6.2.2 Die Reaktionsenergie
Anhand der Modellreaktion νA A + νB B + . . . → νN N + νM M + . . . kann folgende Beziehung für die Reaktionsenergie Δr U angegeben werden: Δr U = (νN Um (N) + νM Um (M) + . . .) − (νA Um (A) + νB Um (B) + . . .) oder allgemein νi Umi ; Δr U =
V, T = const .
(6-8)
C31
C32
C Chemie
νi stöchiometrische Zahl, Umi molare innere Energie des Stoffes i, also Umi = Ui /ni . Die Reaktionsenergie ist eine Zustandsgröße. Für die Reaktionsenergie gilt auch die Beziehung Δr U = (∂U/∂ξ)V, T . (Hinweis: Zwischen differenziellen und integralen Reaktionsgrößen, wie sie in ausführlichen Darstellungen der chemischen Thermodynamik verwendet werden, wird im Folgenden nicht unterschieden; eigentlich gilt " νi Umi dξ Δr U = ∫ (∂U/∂ξ)V,T dξ = mit Integration über einen Formelumsatz.) Messung der Reaktionsenergie
Die Messung der Reaktionsenergie kann mit einem Kalorimeter erfolgen. Besonders häufig werden derartige Untersuchungen bei Verbrennungsreaktionen (vgl. 9.3.1) durchgeführt. Hierbei wird eine Substanz mit Sauerstoff in einer kalorimetrischen Bombe verbrannt und die dabei freiwerdende Wärme (Q < 0) gemessen. Da bei diesem Vorgang das Volumen konstant gehalten wird, ist die freiwerdende Wärme gleich der Reaktionsenergie, vgl. (6-4). Ein bei der Kalorimetrie von Verbrennungsreaktionen häufig verwendeter Begriff ist der Brennwert eines Stoffes (vgl. DIN 51900-1:2000): Als Brennwert wird der Quotient aus dem Betrag der bei der Verbrennung freiwerdenden Wärme und der Masse des eingesetzten Brennstoffs bezeichnet. Das dabei gebildete Wasser soll in flüssiger Form vorliegen (CO2 und eventuell gebildetes SO2 müssen als Gas vorhanden sein; Temperatur 25 ◦ C). Da die Bestimmung des Brennwertes in einer kalorimetrischen Bombe vorgenommen wird (V = const), ist der Brennwert gleich der negativen spezifischen Reaktionsenergie.
νi stöchiometrische Zahl, ξ Umsatzvariable, Hmi = Hi /ni ist die molare Enthalpie der Substanz i. Wie die Reaktionsenergie ist auch die Reaktionsenthalpie eine Zustandsgröße. Zusammenhang zwischen Reaktionsenergie und -enthalpie
Für den Zusammenhang zwischen Reaktionsenergie Δr U und Reaktionsenthalpie Δr H gilt näherungsweise Δr H = Δr U + pΔr V .
(6-10)
Δr V ist das Reaktionsvolumen, das folgendermaßen definiert ist: Δr V = νi Vmi mit Vmi = Vi /ni dem molaren Volumen des Stoffes i. Laufen Reaktionen ausschließlich in kondensierten Phasen ab, so fällt in (6-10) der Term pΔr V numerisch kaum ins Gewicht. Es gilt Δr H ≈ Δr U . Sind Gase an einer chemischen Reaktion beteiligt, so wird die Änderung des Reaktionsvolumens praktisch nur durch die Änderung des Gasvolumens bewirkt. Unter Anwendung der Zustandsgleichung idealer Gase erhält man in diesem Fall: νi . (6-11) Δr H = Δr U + pΔr V ≈ Δr U + RT Beispiele: 1. Bei der homogenen Gasreaktion N2 (g) + O2 (g) → 2 NO(g) ist νi = 0, d. h., Δr H = Δr U. 2. Für die heterogene Reaktion 2 H2 (g) + O2 (g) → 2 H2 O(l) gilt νi = −3, da bei der Anwendung der obigen Beziehung Stoffe in kondensierten Phasen nicht zu berücksichtigen sind. Exotherme und endotherme Reaktionen
6.2.3 Die Reaktionsenthalpie
Die Reaktionsenthalpie Δr H ist analog zur Reaktionsenergie 6.2.2 durch folgende Beziehungen definiert: νi Hmi ; p, T = const . (6-9) Δr H = Δr H = (∂H/∂ξ) p, T ,
Nach dem Vorzeichen der Reaktionsenthalpie wird zwischen exothermen und endothermen Reaktionen unterschieden: Δr H < 0 exotherme Reaktion, Δr H > 0 endotherme Reaktion. Diese Unterscheidung wird auch auf Phasenumwandlungen angewandt.
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht
Beim Ablauf exothermer Reaktionen wird (bei konstantem Druck) Wärme an die Umgebung abgegeben. Als Folge hiervon tritt eine Temperaturerhöhung auf (Beispiel: Verbrennungsvorgänge). Entsprechend führt der Ablauf endothermer Prozesse zu einer Temperaturerniedrigung (Beispiel: Verdampfen einer Flüssigkeit).
Zur Bildung des gasförmigen Kohlendioxids aus festem Kohlenstoff sind zwei Reaktionsfolgen möglich: Die erste führt direkt zum CO2 (2. der hier angegebenen Reaktionen), die zweite benutzt den Umweg der CO-Bildung (1. und 3. der hier genannten Reaktionen). Für die Reaktionsenthalpien gilt daher folgender Zusammenhang: Δr H2 = Δr H1 + Δr H3 .
Das Berthelot-Thomsen’sche Prinzip
Nach einem von Thomsen und Berthelot 1878 aufgestellten Prinzip sollten nur exotherme Reaktionen bzw. Vorgänge freiwillig ablaufen. Die Erfahrung zeigt, dass in der Tat exotherme Reaktionen (z. B. Verbrennungsreaktionen) spontan verlaufen können. Dieser Sachverhalt trifft aber auch auf eine große Zahl endothermer Reaktionen zu. So läuft z. B. die Verdampfung von Flüssigkeiten (endothermer Vorgang) freiwillig ab. Dieses Beispiel zeigt deutlich, dass das Vorzeichen von Reaktions- bzw. Phasenumwandlungsenthalpien nicht als alleiniges Kriterium für den freiwilligen Ablauf von Reaktionen bzw. Vorgängen dienen kann, vgl. 6.3.4. 6.2.4 Der Heß’sche Satz
Da die Reaktionsenthalpie eine Zustandsgröße ist, folgt, dass sie nur vom Anfangs- und Endzustand des Systems abhängt, also unabhängig vom Reaktionsweg ist. Lässt man daher ein System einmal direkt und einmal über verschiedene Zwischenstufen von einem Anfangszustand in einen Endzustand übergehen, so sind die Reaktionsenthalpien in beiden Fällen gleich groß. Diese Aussage wird als Heßscher Satz bezeichnet. Er dient zur Berechnung von Reaktionsenthalpien, die nicht direkt messbar sind. Beispiel: Die Reaktionsenthalpie Δr H1 der Reaktion C(s) + 1/2 O2 (g) → CO(g) soll ermittelt werden. Δr H1 ist auf direktem Wege nicht messbar, weil die Verbrennung des Kohlenstoffs nicht so durchgeführt werden kann, dass dabei ausschließlich Kohlenmonoxid CO entsteht. Messbar sind hingegen die Reaktionsenthalpien der folgenden Reaktionen: C(s) + O2 (g) → CO2 (g)
mit Δr H2
CO(g) + 1/2 O2 (g) → CO2 (g)
mit Δr H3
Überprüfung dieser Beziehung mithilfe der Definitionsgleichung der Reaktionsenthalpie (vgl. 6.2.3): Δr H2 = Hm (CO2 ) − Hm (C) − Hm (O2 ) Δr H1 + Δr H3 = Hm (CO) − Hm (C) − 1/2Hm (O2 ) + Hm (CO2 ) − Hm (CO) − 1/2Hm (O2 ) = Hm (CO2 ) − Hm (C) − Hm (O2 ) . 6.2.5 Die Standardbildungsenthalpie von Verbindungen
Die Reaktionsenthalpie, die zur Bildung eines Mols einer chemischen Verbindung aus den Elementen notwendig ist, bezeichnet man als molare Bildungsenthalpie. So ist z. B. die Reaktionsenthalpie der Reaktion 1/2 N2 + 3/2 H2 → NH3 gleich der molaren Bildungsenthalpie ΔB Hm des Ammoniaks. Da die Reaktionsenthalpie druck- und temperaturabhängig (vgl. 6.2.6) ist, muss der Zustand, in dem sich die Elemente befinden sollen, festgelegt werden. Als Standardzustand wählt man – für kondensierte Stoffe den Zustand des reinen Stoffes bei 25 ◦ C und 101 325 Pa und – für Gase den Zustand idealen Verhaltens bei ebenfalls 25 ◦ C und 101 325 Pa. Findet die Bildung eines Mols einer Verbindung aus den Elementen unter Standardbedingungen statt, so heißt die entsprechende Reaktionsenthalpie molare Standardbildungsenthalpie. Die molare Standardbildungsenthalpie einer großen Zahl von Verbindungen ist experimentell ermittelt worden und in Tabellenwerken aufgeführt. Für einige Stoffe ist sie in Tabelle 6-1 angegeben. Die Bedeutung der molaren Standardbildungsenthalpie beruht darauf, dass unter Anwendung des Heß’schen Satzes nach folgender Beziehung Reaktionsenthalpien berechnet
C33
C34
C Chemie
0 Tabelle 6-1. Molare Standardbildungsenthalpien ΔB Hm und 0 einiger Stoffe molare Standardentropien S m
Stoff
Formel
Graphit Diamant Kohlenmonoxid Kohlendioxid Stickstoff Wasserstoff Ammoniak Stickstoffmonoxid Stickstoffdioxid Wasser Wasser Methan Ethan Propan Acetylen Benzol Benzol Tetrafluormethan Tetrafluorethylen
CO CO2 N2 H2 NH3 NO NO2 H2 O(g) H2 O(l) CH4 (g) C2 H6 (g) C3 H8 (g) C2 H2 (g) C6 H6 (g) C6 H6 (l) CF4 (g) C2 F4 (g)
ΔB Hm0 in kJ/mol 0 1,9 −110,5 −393,5 0 0 −45,9 91,3 33,2 −241,8 −285,8 −74,6 −84,0 −103,8 227,4 82,9 49,1 −933,6 −658,9
0 Sm in J/(mol · K) 5,7 2,4 197,75 213,78 191,6 130,7 192,8 210,8 240,1 188,8 69,9 186,3 229,2 270,3 200,9 269,2 173,4 261,6 300,1
werden können (Reaktionsgrößen unter Standardbedingungen sind mit dem Zeichen 0 gekennzeichnet): 0 Δr H 0 = νi ΔB Hmi (6-12) (p = 101 325 Pa, T = 298,15 K) . Beispiele: – Berechnung der Reaktionsenthalpie des Acetylenzerfalls unter Standardbedingungen (vgl. 11.3.1): HC ≡ CH(g) → 2 C(s) + H2 (g) Für die obige Reaktion erhält man: 0 νi ΔB Hmi − ΔB Hm0 (H2 C2 ) Δr H 0 = = −226,7 kJ/mol (vgl. Tabelle 6-1) (Hinweis: Die Standardbildungsenthalpien der Elemente sind null.) – Berechnung der Reaktionsenthalpie für die Verbrennung von Acetylen unter Standardbedingungen (vgl. 11.3.1): HC ≡ CH(g) + 5/2 O2 (g) → H2 O(l) + 2 CO2 (g)
Für die Reaktionsenthalpie unter Standardbedingungen erhält man: Δr H 0 = 2 ΔB Hm0 (CO2 ) + ΔB Hm0 (H2 O(l)) − ΔB Hm0 (H2 C2 ) = (−2 · 393,5 − 285,8 − 226,7) kJ/mol = −1299,5 kJ/mol . 6.2.6 Temperatur- und Druckabhängigkeit der Reaktionsenthalpie
Die Wärmekapazität C p (extensiv) und die molare Wärmekapazität Cmp (intensiv) sind durch folgende Gleichungen definiert: (∂H/∂T )P = C p
(6-13a)
und (∂Hm /∂T )P = Cmp = C p /n
(6-13b)
n Stoffmenge. Differenziert man die Definitionsgleichung (6-9) der Reaktionsenthalpie nach der Temperatur, so erhält man unter Verwendung von (6-13b) (∂Δr H/∂T )P = νi (∂Hmi /∂T )P = νi Cmpi . Durch Integration folgt Δr H(T 2 ) = Δr H(T 1 ) +
"T 2
νiCmpi dT
(6-14)
T1
Diese Beziehung, die die Temperaturabhängigkeit der Reaktionsenthalpie beschreibt, wird als Kirchhoff’sches Gesetz bezeichnet. Im Gegensatz zur Temperaturabhängigkeit der Reaktionsenthalpie ist der Einfluss des Druckes auf Δr H sehr gering und kann i. allg. vernachlässigt werden. Beispiel: Der Ausdruck "T 2
νiCmpi dT
T1
soll für die Gasreaktion N2 +3 H2 → 2 NH3 berechnet werden. Die Temperaturabhängigkeit der molaren Wärmekapazität kann durch folgende Potenzreihe beschrieben werden: Cmp = a0 + a1 T + a2 T 2 + . . . ,
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht
wobei häufig eine Entwicklung bis T 2 ausreicht. Bei dem gewählten Beispiel erhält man für νiCmpi : νiCmpi = 2 Cmp (NH3 ) − Cmp (N2 ) − 3 Cmp (H2 ) = 2 a0 (NH3 )+2 a1 (NH3 ) T +2 a2 (NH3 ) T 2 − a0 (N2 ) − a1 (N2 ) T − a2 (N2 ) T 2 − 3 a0 (H2 ) − 3 a1 (H2 ) T − 3 a2 (H2 ) T 2 Mit den Abkürzungen 2 a0 (NH3 ) − a0 (N2 ) − 3 a0 (H2 ) = A0 , 2 a1 (NH3 ) − a1 (N2 ) − 3 a1 (H2 ) = A1 und 2 a2 (NH3 ) − a2 (N2 ) − 3 a2 (H2 ) = A2 , erhält man
νiCmpi = A0 + A1 T + A2 T 2 .
Damit folgt für "T 2
νi Cmpi dT = A0 (T 2 − T 1 ) + 1/2 A1 T 22 − T 12
T1
+ 1/3 A2 T 23 − T 13 .
6.3 Anwendung des 2. und 3. Hauptsatzes der Thermodynamik auf chemische Reaktionen 6.3.1 Grundlagen
lich reversible Vorgänge statt, so bleibt die Entropie konstant: dS = di S ≥ 0 , di S > 0: irreversibler Vorgang, di S = 0: reversibler Vorgang. Zu den irreversiblen Vorgängen gehören Ausgleichsvorgänge (z. B. chemische Reaktionen, Mischungen, Temperatur- und Druckausgleich) sowie dissipative Effekte (z. B. Reibung, Deformation). Der 3. Hauptsatz der Thermodynamik, das Nernst’sche Wärmetheorem, kann folgendermaßen formuliert werden: Die Entropie einer reinen Phase im inneren Gleichgewicht ist am absoluten Nullpunkt null: S (T = 0) = 0 . Für reine Phasen, die sich, wie z. B. die Gläser, nicht im inneren Gleichgewicht befinden, gilt S (T = 0) > 0 . Der 3. Hauptsatz ermöglicht die Ermittlung von Absolutwerten der Entropie für die verschiedensten Stoffe aus rein kalorischen Daten. Bei Kenntnis der Temperaturabhängigkeit der molaren Wärmekapazität kann die molare Entropie eines reinen Gases nach folgender Formel berechnet werden: "T sl S m = S /n = 0
"T lg +
Die Entropie wird thermodynamisch durch den 2. Hauptsatz definiert (Einzelheiten siehe F 1.1.2). Sie ist eine extensive Zustandsgröße der Dimension Energie/Temperatur. Die Entropie eines Systems kann sich nur auf zwei Arten ändern: Entweder durch Energieaustausch mit der Umgebung (de S ) oder durch Entropieerzeugung infolge der im System ablaufenden irreversiblen Vorgänge (di S ): dS = de S + di S
(6-15)
Beim Ablauf irreversibler Vorgänge kann sich die Entropie in einem abgeschlossenen System (de S = 0, dS = di S ) nur vergrößern; finden dagegen ausschließ-
Cmp (s) Δsl Hm dT + T Ts
T sl
Δlg Hm Cmp (l) dT + + T T Sd
"T
6 7 Cmp g dT T
T lg
(6-16)
Cmp (s), Cmp (l), Cmp (g) molare Wärmekapazität des Feststoffes, der Flüssigkeit bzw. des Gases; T sl , T lg Schmelz- bzw. Siedetemperatur; Δsl Hm , Δlg Hm molare Schmelz- bzw. molare Verdampfungsenthalpie. Eventuelle Phasenumwandlungen des Feststoffes sind in dieser Beziehung nicht berücksichtigt. Zur Berechnung der Entropie von Feststoffen bzw. Flüssigkeiten muss die obige Formel sinngemäß vereinfacht werden. In Tabelle 6-1 sind die molaren Standardentropien einiger Stoffe aufgeführt. Der Standardzustand entspricht dem in 6.2.5 angegebenen.
C35
C36
C Chemie
6.3.2 Reaktionsentropie
Die Reaktionsentropie Δr S ist durch folgende Beziehungen definiert: νi S mi ; (6-17a) Δr S = Δr S = (∂S /∂ξ) p, T
(6-17b)
S mi = Si /ni molare Entropie der Reaktionsteilnehmer, νi Stöchiometrische Zahl, ξ Umsatzvariable. Als Standardreaktionsentropie Δr S 0 wird die Reaktionsentropie unter Standardbedingungen (vgl. 6.2.5) bezeichnet. Bei konstantem Druck kann die Temperaturabhängigkeit der Reaktionsentropie durch folgende Beziehung beschrieben werden (vgl. auch (6-16): Δr S (T 2 ) = Δr S (T 1 ) +
"T 2
νi Cmpi dT/T
(6-18)
T1
6.3.3 Die Freie Enthalpie und das chemische Potential
(6-19)
G ist eine extensive Zustandsgröße. Für das chemische Potential μB der Komponente B in einer Mischphase gilt folgende Definitionsgleichung: μB = (∂G/∂nB) p, T, n j .
H2 (g) + I2 (g) 2 HJ(g) , μ(H2 ) + μ(I2 ) = 2 μ(HJ) . Die Abhängigkeit des chemischen Potentials von der Zusammensetzung wird durch die folgenden Beziehungen beschrieben. In den angeführten Gleichungen werden die Wechselwirkungen der Teilchen untereinander nicht berücksichtigt: μB = μ0Bc + RT ln {cB } ,
Die Freie Enthalpie G ist durch die folgende Gleichung definiert: G = H − TS .
einem willkürlich gewählten Standardzustand (siehe unten) bestimmen. Die Bedeutung des chemischen Potentials veranschaulichen folgende Beispiele: Eine frei bewegliche Substanz wandert stets zum Zustand niedrigeren chemischen Potentials. Ein Gas löst sich so lange in einer Flüssigkeit auf, bis das chemische Potential des Gases in der Gasphase gleich dem in der Flüssigkeit ist (vgl. 8.3). Die Bedingung für das chemische Gleichgewicht (Einzelheiten vgl. 6.4.1) kann elegant mit Hilfe des chemischen Potentials formuliert werden. So gilt z. B. für das Iod-Wasserstoff-Gleichgewicht:
(6-20)
Danach ist das chemische Potential die partielle molare Freie Enthalpie der Komponente B in dieser Mischphase. (Einzelheiten über partielle molare Größen s. F 1.2.2). Vom chemischen Potential einer Komponente in einer Mischphase kann daher gesprochen werden wie z. B. von der Konzentration oder dem Stoffmengenanteil dieser Komponente. Bei Einkomponentensystemen ist μi gleich der molaren Freien Enthalpie des reinen Stoffes. Das chemische Potential ist eine intensive Zustandsgröße der Dimension Energie/Stoffmenge und kann somit auch eine Funktion des Ortes sein. Die Absolutwerte des chemischen Potentials können nicht ermittelt werden. Man kann jedoch Differenzen des chemischen Potentials zwischen dem interessierenden Zustand und
μB = μ0Bp + RT ln {pB } , μB =
μ0Bx
(6-21)
+ RT ln xB .
cB Konzentration, pB (Partial-)Druck, xB Stoffmengenanteil. Die beiden erstgenannten Beziehungen beschreiben auch die Konzentrations bzw. die Druckabhängigkeit des chemischen Potentials reiner Gase μ0Bc , μ0Bp , μ0Bx werden als chemische Standardpotentiale bezeichnet. Unter ln {cB } bzw. ln {pB } soll hier und im Folgenden ln (cB /c∗ ) bzw. ln (pB /p∗ ) mit c∗ = 1 mol/l und p∗ = 1 bar verstanden werden. 6.3.4 Die Freie Reaktionsenthalpie. Die Gibbs-Helmholtzsche Gleichung
Aus der Definitionsgleichung (6-19) der Freien Enthalpie folgt durch Differenzieren nach der Umsatzvariablen ξ (∂G/∂ξ) p, T = (∂H/∂ξ) p, T − T (∂S /∂ξ)p,T Δr G = Δr H − T Δr S . (6-22) ΔrG wird als Freie Reaktionsenthalpie bezeichnet. Die Beziehung (6-22) heißt auch GibbsHelmholtz’sche Gleichung.
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht
Der Zusammenhang zwischen der Freien Reaktionsenthalpie und dem chemischen Potential μi der an einer Reaktion beteiligten Stoffe wird durch folgende Beziehung beschrieben: νi μi p, T = const . (6-23) Δr G = Berücksichtigt man die Abhängigkeit des chemischen Potentials von der Zusammensetzung, vgl. (6-21), so erhält man: νi ln {ci } , Δr G = Δr G0c + RT Δr G = Δr G0p + RT νi ln {pi } , (6-24) Δr G = Δr G0x + RT νi ln xi . Die Größen Δr G0c , Δr G0p , und ΔrG0x werden als Standardwerte der Freien Reaktionsenthalpie bezeichnet (Freie Standardreaktionsenthalpie). Bei Redoxreaktionen kann Δr G leicht durch Messung der elektromotorischen Kraft EMK bestimmt werden (vgl. 9.4). Voraussetzung hierfür ist eine geeignete elektrochemische Zelle, in der bei Stromfluss die interessierende Redoxreaktion ungehindert ablaufen kann. Die Freie Reaktionsenthalpie ist ein Ausdruck für die beim Ablauf einer chemischen Reaktion maximal gewinnbare Arbeit. Der Wert dieser Größe entscheidet darüber, ob eine chemische Reaktion (bzw. ein physikalisch-chemischer Vorgang) freiwillig oder aber nur unter Zwang ablaufen kann oder ob Gleichgewicht vorhanden ist. Es gelten folgende Kriterien (p, T = const): freiwilliger Ablauf Gleichgewicht
Δr G < 0 , Δr G = 0 ,
Reaktion nur unter Zwang Δr G > 0 ,
(6-25)
Ein Beispiel für unter Zwang ablaufende chemische Reaktionen stellen Elektrolysen (vgl. 9.8) dar. Hierbei werden durch Zufuhr elektrischer Arbeit Reaktionen erzwungen, bei denen Δr G > 0 ist. Die Gibbs-Helmholtz’sche Gleichung besteht aus zwei Termen, dem Enthalpieterm Δr H und dem Entropieterm T Δr S . Bei niedrigen Temperaturen ist der Einfluss des Entropieterms gering, sodass in erster Linie der Enthalpieterm über die Möglichkeit des Ablaufs chemischer Reaktionen (bzw. physikalischchemischer Vorgänge) entscheidet. Bei diesen Temperaturen laufen praktisch nur exotherme Re-
aktionen freiwillig ab; das Berthelot-Thomsen’sche Prinzip (vgl. 6.2.3) gilt nahezu uneingeschränkt. Bei höheren Temperaturen gewinnt der Entropieterm in steigendem Maße an Bedeutung. Endotherme Reaktionen können nur dann freiwillig ablaufen, wenn die Bedingung T Δr S > Δr H erfüllt ist, wenn also die Entropie beim Ablauf der Reaktion vergrößert wird. Beispiele hierfür sind alle Schmelz- und Verdampfungsvorgänge. Beides sind endotherme Prozesse mit Δr S > 0. Δr S ist hierbei positiv, da die molare Entropie (oder, umgangssprachlich ausgedrückt, die „Unordnung“ eines Systems) in der Reihenfolge fest – flüssig – gasförmig ansteigt. Beispiele: Es soll festgestellt werden, ob Tetrafluorethylen unter Standardbedingungen (25 ◦ C, 1,01325 bar) gemäß der Gleichung 6 7 6 7 F2 C=CF2 g → CF4 g + 2C (s) in Tetrafluormethan CF4 und Kohlenstoff zerfallen kann. Δr H 0 = ΔB Hm0 (CF4 ) − ΔB Hm0 (F4 C2 ) = (−933,2 + 648,5) kJ/mol = −284,7 kJ/mol 0 0 0 (C) + S m (CF4 ) − S m (F4 C2 ) Δr S = 2S m = (2 · 5,7 + 261,3 − 299, 9) J/ (mol · K) = −27,2 J/ (mol · K) 0
Δr G0 = Δr H 0 − T Δr S 0 = −284,7 kJ/mol + 298,2 K · 27,2 J/ (mol · K) = −276,6 kJ/mol Ergebnis: Δr G0 < 0. Daraus folgt, dass die Reaktion unter Standardbedingungen möglich ist, siehe auch 11.4.1. Ist die Umwandlung von Graphit in Diamant unter Standardbedingungen möglich? C (Graphit) → C (Diamant) Δr H 0 = ΔB Hm0 (Diamant) = +1,9 kJ/mol 7 0 0 6 (Diamant) − S m Δr S 0 = S m Graphit = (2,4 − 5,7) J/(mol · K) = −3,3 J/ (K · mol) Δr G0 = Δr H0 − T Δr S 0 = 1,9 kJ/mol + 298,2 K · 3,3 J/ (mol · K) = +2,9 kJ/mol
C37
C38
C Chemie
Ergebnis: Δr G0 > 0. Daraus folgt, dass die Reaktion unter Standardbedingungen (auch in Gegenwart von Katalysatoren) unmöglich ist. Bei 25 ◦ C sind erst bei Drücken von ca. 15 kbar Diamant und Graphit miteinander im Gleichgewicht, d. h., Δr G wird dann null. Unter diesen Bedingungen ist aber die Geschwindigkeit der Umwandlung wesentlich zu klein, sodass man technisch höhere Temperaturen und Drücke anwenden muss, um Diamanten in Gegenwart von Metallkatalysatoren zu synthetisieren (1500 bis 1800 ◦ C und 53 bis 100 kbar). 6.3.5 Phasenstabilität
Man unterscheidet stabile, metastabile und instabile Phasen: – Stabile Phasen Wenn ein Stoff oder eine Stoffmischung in mehreren Phasen auftreten kann und wenn alle anderen möglichen Phasen gegenüber der ursprünglichen einen höheren Wert der Freien Enthalpie aufweisen, dann nennt man die ursprüngliche Phase stabil. Ändern sich die äußeren Parameter, wie z. B. Druck und Temperatur nicht, so liegt eine stabile Phase zeitlich unbegrenzt vor. Die überwiegende Mehrzahl aller chemischen Verbindungen ist bei natürlichen Umgebungsbedingungen stabil. So ist z. B. unter den genannten Bedingungen Graphit die stabile Kohlenstoffmodifikation. – Metastabile Phasen Bei metastabilen Phasen gibt es mindestens eine Phase, die einen niedrigeren Wert der Freien Enthalpie aufweist. Auch metastabile Phasen können zeitlich unbegrenzt vorliegen, ohne dass eine neue Phase auftritt. Werden jedoch Keime einer neuen stabileren Phase zugeführt oder entstehen diese durch ein statistisches Ereignis spontan, so geht das System in die stabilere Phase über. Diese stabilere Phase ist dadurch gekennzeichnet, dass sie einen kleineren Wert der Freien Enthalpie aufweist. Zur Umwandlung in die stabilere Phase ist die Überwindung einer Energiebarriere erforderlich. Beispiele: Diamant und weißer Phosphor sind bei Raumbedingungen metastabile Kohlenstoff- bzw. Phosphormodifikationen. Unterkühlte Flüssigkeiten, übersättigte Lösungen (vgl. 8.7.7), überhitzte Flüssigkeiten sind weitere Beispiele für meta-
stabile Phasen. Die Umwandlung metastabiler Phasen kann, wie am Beispiel des Siedeverzuges überhitzter Flüssigkeiten gezeigt werden soll, oft mit großer Heftigkeit erfolgen. Staub- und gasfreie Flüssigkeiten lassen sich in sauberen Gefäßen z. T. erheblich über ihren Siedepunkt erwärmen. Diese Erscheinung heißt Siedeverzug. So gelingt es z. B., Wasser in sorgfältig gereinigten Gefäßen bis auf 220 ◦ C zu erhitzen. Durch geringe Erschütterung oder Zufuhr von Keimen (Gasbläschen) kann auf den Siedeverzug ein explosionsartiger Siedevorgang folgen. – Instabile Phasen Instabile Phasen sind unbeständig gegenüber molekularen Schwankungen. Zur Bildung neuer Phasen ist die Anwesenheit von Keimen nicht notwendig (spinodale Zersetzung).
6.4 Das Massenwirkungsgesetz 6.4.1 Chemisches Gleichgewicht
Die meisten chemischen Reaktionen verlaufen nicht vollständig, sondern führen zu einem Gleichgewichtszustand. In diesem Zustand findet makroskopisch kein Stoffumsatz mehr statt (vgl. 7.5). Die Bedingung für das chemische Gleichgewicht ist (vgl. (6-25)): ΔrG = 0. Mit Δr G = νi μi folgt νi μi = 0 , p, T = const . Δr G = Unter Anwendung der in (6-21) angegebenen Beziehungen, die die Abhängigkeit des chemischen Potentials von der Zusammensetzung beschreiben, erhält man: νi ln {pi } 0 = Δr G0p + RT 0 0 = Δr Gc + RT νi ln {ci } (6-26) 0 = Δr G0x + RT νi ln xi oder
⎞ ⎛ ⎜⎜⎜ Δr G0p ⎟⎟⎟ ⎟⎟ = K p = exp ⎜⎜⎝− RT ⎠ ΔrG0c Kc = exp − = RT ΔrG0x K x = exp − = RT
p νi cν i xν i
(6-27)
6 Thermodynamik chemischer Reaktionen. Das chemische Gleichgewicht
Diese Beziehungen werden als Massenwirkungsgesetz bezeichnet. Die Größen K p , Kc und K x heißen Gleichgewichts- oder Massenwirkungskonstanten. Aus historischen Gründen werden K p und Kc meist als dimensionsbehaftete Größen formuliert. Das bedeutet, dass in das Massenwirkungsgesetz dimensionsbehaftete Partialdrücke und Konzentrationen anstelle von normierten Größen eingesetzt werden. Nach diesem Formalismus wird die Dimension von K p und Kc von der Art der chemischen Reaktion bestimmt. K x ist stets dimensionslos. Beispiel: Für die homogene Gasreaktion (Einzelheiten siehe 6.4.2) 6 7 6 7 6 7 N2 g + 3 H2 g ⇔ 2 NH3 g soll das Massenwirkungsgesetz formuliert werden. Die stöchiometrischen Zahlen des Stickstoffs, Wasserstoffs und Ammoniaks sind bei dieser Reaktionsgleichung: ν(NH3 ) = 2, ν(N2 ) = −1, v(H2 ) = −3. Damit erhält man für K p: Kp =
pν = p2 (NH3 ) · p−3 (H2 ) · p−1 (N2 )
oder Kp =
p3
p2 (NH3 ) (H2 ) · p (N2 )
Bei dieser Reaktion hat K p die Dimension Druck−2 . Da die Gleichgewichtskonstante durch die obige Reaktionsgleichung mit dem Standardwert der Freien Reaktionsenthalpie verknüpft ist (siehe oben), dürfen Zähler und Nenner im ausformulierten Massenwirkungsgesetz nicht vertauscht werden! 6.4.2 Homogene Gasreaktionen
Homogene Gasreaktionen laufen ausschließlich in der Gasphase ab. Die Zusammensetzung der Gasmischung wird meist durch Angabe der Partialdrücke (vgl. F 2.2) charakterisiert. Teilweise werden hierzu jedoch auch die Konzentrationen bzw. die Stoffmengenanteile verwendet. Daher ergibt sich häufig die Notwendigkeit, K p , Kc und K x ineinander umrechnen zu müssen. Dies geschieht mit folgenden Beziehungen: K p = Kx p
νi
K p = Kc (RT )
,
(6-28) νi
K x = Kc (RT/p)
, νi
.
Ist bei homogenen Gasreaktionen νi = 0, so gilt: K p = Ke = K x . Beispiel für eine derartige Reaktion ist das Iod-Wasserstoff-Gleichgewicht: 6 7 6 7 6 7 H2 g + I2 g 2 HI g . Beispiel: Für die Gleichgewichtsreaktion 6 7 6 7 6 7 CO g + Cl2 g COCl2 g (COC12 Phosgen, CO Kohlenmonoxid) gilt: ν (COCl2 ) = −1 , ν (CO) = −1 , ν (Cl2 ) = −1 und νi = ν (COCl2 ) + ν (CO) + ν (Cl2 ) = −1. Damit erhält man: K p = K x · p−1 , K p = Kc (RT )−1 , K x = Kc (p/RT ) . 6.4.3 Heterogene Reaktionen
Bei heterogenen Reaktionen ist mehr als eine Phase am Umsatz beteiligt. Ein Beispiel stellt der thermische Zerfall des Calciumcarbonats CaCO3 dar, der durch folgende Gleichung beschrieben wird: 6 7 CaCO3 (s) CaO (s) + CO2 g . CaCO3 und Calciumoxid CaO bilden keine Mischkristalle. In diesem Fall muss das Massenwirkungsgesetz folgendermaßen formuliert werden: K p = p (CO2 ) . Calciumcarbonat und Calciumoxid als reine kondensierte Phasen treten im Massenwirkungsgesetz nicht auf, da das chemische Potential reiner kondensierter Phasen gleich dem Standardpotential ist (vgl. 6.3.3). Bei heterogenen Reaktionen bleiben reine kondensierte Phasen bei der Formulierung des Massenwirkungsgesetzes unberücksichtigt. 6.4.4 Berechnung von Gleichgewichtskonstanten aus thermochemischen Tabellen
Die Gleichgewichtskonstanten können leicht mit (6-27) unter Hinzuziehung der GibbsHelmholtz’schen Beziehung (6-22) aus thermochemischen Daten berechnet werden. Wird der
C39
C40
C Chemie
in 6.2.5 beschriebene Standardzustand gewählt, so erhält man bei Gasreaktionen auf diese Weise die Gleichgewichtskonstante K p : ln
Kp Δr S 0 Δr H 0 − = m (p∗ ) R RT
(6-29)
p∗ Standarddruck. Der Exponent m ist gleich der Summe der stöchiometrischen Zahlen. 6.4.5 Temperaturabhängigkeit der Gleichgewichtskonstante
Die Temperaturabhängigkeit der Gleichgewichtskonstante wird durch folgende Gleichung beschrieben: ∂ ln K Δr H = . (6-30) ∂T p RT 2 Gleichung (6-30) wird als van’t-Hoff’sche Reaktionsisobare bezeichnet. Diese Beziehung beschreibt die Verschiebung der Lage des chemischen Gleichgewichtes infolge von Temperaturänderungen. So vergrößert sich K bei endothermen Reaktionen (Δr H > 0) mit steigender Temperatur. Das bedeutet, dass sich die Lage des chemischen Gleichgewichtes in diesem Fall zur Seite der Reaktionsprodukte verschiebt. In einem kleinen Temperaturintervall kann Δr H angenähert als temperaturunabhängig angesehen werden. Unter dieser Voraussetzung erhält man durch Integration von (6-30) die Beziehung Δr H +C . (6-31) RT Danach ist ln K eine lineare Funktion der reziproken Temperatur. ln K = −
6.4.6 Prinzip des kleinsten Zwanges
Qualitativ kann die Änderung der Lage eines chemischen Gleichgewichtes durch äußere Einflüsse mit dem Prinzip von Le Chatelier und Braun, das auch das Prinzip des kleinsten Zwanges genannt wird, beschrieben werden: Wird auf ein im Gleichgewicht befindliches System ein äußerer Zwang ausgeübt, so verschiebt sich das Gleichgewicht derart, dass es versucht, diesen Zwang zu verringern.
Unter einem äußeren Zwang versteht man Änderungen von Temperatur, Druck oder Volumen bzw. der Zusammensetzung. Beispiel: Die Folgerungen aus diesem Prinzip sollen am Beispiel des Ammoniakgleichgewichtes diskutiert werden (vgl. 7.9.4). 6 7 6 7 6 7 N2 g + 3 H2 g 2 NH3 g , Δr H < 0 . – Temperaturerhöhung (durch Zufuhr von Wärme) Ein Teil der zugeführten Wärme kann dadurch verbraucht werden, dass sich die Lage des chemischen Gleichgewichtes zur Seite der Ausgangsstoffe (also nach links) verschiebt. – Druckerhöhung Nach der Zustandsgleichung idealer Gase ist der Druck der Stoffmenge und damit auch der Teilchenzahl proportional. Ein Teil der Druckerhöhung kann dadurch kompensiert werden, dass sich die Lage des Gleichgewichtes zur Seite des Ammoniaks (nach rechts) verschiebt, da auf diese Weise die Teilchenzahl verringert werden kann. 6.4.7 Gekoppelte Gleichgewichte
Wenn sich in einem System zwei oder mehrere Gleichgewichte gleichzeitig einstellen und ein oder mehrere Stoffe des Systems an verschiedenen Gleichgewichten teilnehmen, spricht man von gekoppelten Gleichgewichten. Über die Zusammensetzungsvariablen der gemeinsamen Stoffe stehen auch die anderen Reaktionsteilnehmer im Gleichgewicht miteinander. Gekoppelte Gleichgewichte sind besonders bei der Chemie der Verbrennungsvorgänge von großer Bedeutung. Beispiel: Werden Stickstoff-Sauerstoff-Gemische auf höhere Temperaturen erwärmt, so müssen bei Vernachlässigung der Dissoziation der Stickstoff- und Sauerstoffmoleküle folgende Gleichgewichte berücksichtigt werden: 1/2 N2 + O2 NO2 , 1/2 N2 + 1/2 O2 NO . Formuliert man für diese Gleichgewichte das Massenwirkungsgesetz, so erhält man: p (NO2 ) p (NO) , K p,2 = 1/2 . K p,1 = 1/2 p (N2 ) p (O2 ) p (N2 ) p1/2 (O2 )
7 Geschwindigkeit chemischer Reaktionen. Reaktionskinetik
Zur Berechnung der vier Partialdrücke (p(NO2 ), p(NO), p(N2 ) und p(O2 )) muss zusätzlich zu den oben genannten Massenwirkungsgesetzen und dem Massenerhaltungssatz (vgl. 4.3.1) auch die Tatsache berücksichtigt werden, dass der Gesamtdruck gleich der Summe der Partialdrücke ist (Einzelheiten des Rechenweges: siehe z. B. Strehlow, R.A., 1985). Die Rechnung liefert für die isobare Erwärmung von Stickstoff-Sauerstoff-Gemischen bei einem Druck von 1 bar folgendes Resultat: T/K 1000 1500 2000 2500 T/K 1000 1500 2000 2500
p(O2 )/bar 0,212 0,212 0,208 0,197 p(NO)/mbar 0,0355 1,33 8,09 23,2
p(N2 )/bar 0,791 0,791 0,787 0,777 p(NO2 )/μbar 1,88 6,82 12,9 18,1
Dieses Ergebnis zeigt, dass bei der Erhitzung von N2 O2 -Gemischen Stickoxide NO x gebildet werden, die sich aus Stickstoffmonoxid und Stickstoffdioxid zusammensetzen. Ein derartiger Prozess findet natürlich auch bei jedem Verbrennungsvorgang statt. Werden nun die erhitzten Gasgemische plötzlich abgekühlt, so bleiben die Stickoxide als metastabile Verbindungen weitgehend erhalten, obwohl sie nach der Lage der chemischen Gleichgewichte in N2 und O2 zerfallen sollten. Dies ist wegen der Umweltschäden, die diese Verbindungen verursachen, sehr unerwünscht. Durch geeignete Katalysatoren gelingt es beim Abkühlungsprozess, die bei tieferen Temperaturen im Gleichgewicht stehenden niedrigeren Stickoxidpartialdrücke einzustellen.
7 Geschwindigkeit chemischer Reaktionen. Reaktionskinetik Die Geschwindigkeiten chemischer Reaktionen unterscheiden sich außerordentlich stark voneinander. Das soll anhand einiger Beispiele verdeutlicht werden:
1. Die schnellste bisher gemessene Ionenreaktion ist die Neutralisation starker Säuren mit starken Basen in wässriger Lösung (vgl. 8.7.1): H+ (aq) + OH− (aq) → H2 O. (Der Zusatz (aq) kennzeichnet hydratisierte Teilchen, vgl. 8.5.) Diese Reaktion ist in ca. 10−10 s abgeschlossen. 2. Die Detonation des Sprengstoffs Glycerintrinitrat (Nitroglycerin) verläuft im Mikrosekundenbereich. 3. Beim Mischen von Lösungen, die Ag+ - und Cl− -Ionen enthalten, bildet sich ein AgClNiederschlag. Hierzu sind Zeiten im Sekundenbereich erforderlich. Dagegen hat im Bereich der Kernchemie der radioaktive Zerfall des Uranisotops 238 92 U in Thorium und Helium 238 92 U
→
234 90 Th
+ 42 He ,
eine Halbwertszeit (vgl. 7.4.1) von 4,47 · 109 Jahren.
7.1 Reaktionsgeschwindigkeit und Freie Reaktionsenthalpie Chemische Reaktionen können nur dann ablaufen, wenn die Freie Reaktionsenthalpie kleiner als null ist (vgl. 6.3.4): Δr G < 0 . Einen Zusammenhang zwischen dem Wert der Freien Reaktionsenthalpie und der Geschwindigkeit der entsprechenden chemischen Reaktion gibt es jedoch – von einigen Spezialfällen abgesehen – nicht. Außerdem sind viele Reaktionen bekannt, die zwar thermodynamisch möglich sind, die aber aufgrund von Reaktionshemmungen dennoch nicht ablaufen (Beispiel: Reaktion von Wasserstoff mit Sauerstoff bei Raumbedingungen). Diese Reaktionshemmungen können häufig durch Energiezufuhr oder durch Zusatz eines Katalysators (vgl. 7.9) beseitigt werden.
7.2 Reaktionsgeschwindigkeit und Reaktionsordnung Am Beispiel der Modellreaktion νA A + νB B + . . . → νN N + νM M + . . .
C41
C42
C Chemie
soll die Definitionsgleichung der Reaktionsgeschwindigkeit (Reaktionsrate) r vorgestellt werden r = 1/V · dξ/dt = 1/νi · dci /dt ,
(7-1)
ξ Umsatzvariable, V Volumen, ci Konzentration. Die stöchiometrischen Zahlen νi müssen für die verschwindenden Stoffe mit negativem und für die entstehenden Stoffe mit positivem Vorzeichen versehen werden. Danach erhält man z. B. für die Reaktion N2 + 3 H2 → 2 NH3 folgenden Ausdruck für die Reaktionsgeschwindigkeit: r = −dc(N2 )/dt = −1/3 dc(H2 )/dt = 1/2 dc(NH3 )/dt . Die Reaktionsgeschwindigkeit ist keine Konstante. Sie hängt im Wesentlichen von folgenden Parametern ab: – Von der Konzentration der Stoffe, die in der entsprechenden Umsatzgleichung auftreten. – Von der Konzentration cK von Stoffen, die nicht in der Umsatzgleichung enthalten sind. Man nennt derartige Stoffe Katalysatoren (siehe 7.9). – Von der Temperatur. Es gilt also: r = r(cA , cB , . . . cK ; T ) .
(7-2)
Diese Funktion wird als Zeitgesetz bezeichnet. Zeitgesetze haben häufig folgende einfache Form: r = k(T )caA cbB ,
(7-3)
k(T ) ist hierbei die Geschwindigkeitskonstante. Die Summe der Exponenten, a + b, wird als Reaktionsordnung bezeichnet. Häufig spricht man auch von der Ordnung einer Reaktion in Bezug auf einen einzelnen Stoff. Darunter versteht man den Exponenten, mit dem die Konzentration dieses Stoffes im Zeitgesetz erscheint. Beispielsweise ist die Reaktion, die durch (8-3) beschrieben wird, von a-ter Ordnung bezüglich des Stoffes A.
7.3 Elementarreaktion. Reaktionsmechanismus und Molekularität Eine molekularchemische Reaktion (Gegensatz: Kernreaktion) läuft in der Regel nicht in der einfachen Weise ab, wie es die (stöchiometrische)
Umsatzgleichung vermuten lässt. Bei der Umwandlung der Ausgangsstoffe in die Endprodukte werden in den meisten Fällen Zwischenprodukte gebildet. Diese Zwischenprodukte werden in weiteren Reaktionsschritten wieder verbraucht und schließlich zu den Endprodukten umgesetzt. Die durch die Umsatzgleichung beschriebene Gesamtreaktion ist also eine Folge von Teilreaktionen. (In vielen Fällen laufen auch unterschiedliche Folgen von Teilreaktionen gleichzeitig ab.) Diese Teilreaktionen werden als Elementarreaktionen bezeichnet. Sie kennzeichnen unmittelbar die Partner, durch deren Zusammenstoß ein bestimmtes Zwischenprodukt gebildet wird. Die Gesamtheit der Elementarreaktionen einer zusammengesetzten Reaktion heißt Reaktionsmechanismus. Die Molekularität gibt die Anzahl der Teilchen an, die als Stoßpartner an einer Elementarreaktion beteiligt sind. Man unterscheidet mono-, bi- und tri-molekulare Elementarreaktionen, je nachdem, ob ein, zwei oder drei Teilchen miteinander reagieren. Eine höhere Molekularität kommt wegen der Unwahrscheinlichkeit gleichzeitiger Zusammenstöße von mehr als drei Teilchen praktisch nicht vor. Für Elementarreaktionen stimmen Molekularität und Reaktionsordnung überein, d. h., ein bimolekularer Vorgang muss auch 2. Ordnung sein. Umgekehrt darf man aber keinesfalls schließen, dass eine beliebige Reaktion, die nach den Versuchsergebnissen 2. Ordnung ist, bimolekular verläuft. Beispiele: 1. Reaktionsmechanismus Bildung von Bromwasserstoff, HBr, aus den Elementen nach folgender Umsatzgleichung: H2 + Br2 → 2 HBr . Der erste Reaktionsschritt besteht in einer Spaltung des Br2 -Moleküls: Br2 + M → 2 Br + M . In dieser bimolekularen Reaktion überträgt ein beliebiger Stoßpartner M dem Br2 -Molekül die für die Dissoziation notwendige Energie. Weitere bimolekulare Elementarreaktionen, durch die HBr gebildet wird, sind:
7 Geschwindigkeit chemischer Reaktionen. Reaktionskinetik
Br + H2 → HBr + H , H + Br2 → HBr + Br . 2. Molekularität einer Elementarreaktion – Monomolekulare Reaktionen Dieser Reaktionstyp wird z. B. beim thermischen Zerfall kleiner Moleküle (bei hohen Temperaturen) sowie bei strukturellen Umlagerungen beobachtet: O3 → O2 + O O3 Ozon, O2 molekularer Sauerstoff, O atomarer Sauerstoff
Cyclopropan Propen – Bimolekulare Reaktionen Dieser Reaktionstyp tritt am häufigsten auf. Beispiele wurden bereits oben vorgestellt. – Trimolekulare Reaktionen Die am besten untersuchten trimolekularen Reaktionen sind Rekombinationsreaktionen der Art 2 I + M → I2 + M . I2 molekulares Iod, I atomares Iod M ist hierbei ein beliebiger Stoßpartner, der einen Teil der Energie der Reaktionspartner (der I-Atome) aufnehmen muss.
7.4 Konzentrationsabhängigkeit der Reaktionsgeschwindigkeit
Die Geschwindigkeitskonstante k hat bei Reaktionen 1. Ordnung die Dimension einer reziproken Zeit. Die Integration von ( 7-4a) liefert mit der Anfangsbedingung cA (t = 0) = c0A : cA = c0A exp(−kt) oder ln cA = ln c0A − kt , (7-5a) NA = N0A exp(−kt) oder ln NA = ln N0A − kt , (7-5b) N Teilchenzahl. Die Funktionen cA = cA (t) und ln cA = ln cA (t) sind in Bild 7-1 graphisch dargestellt. Die experimentelle Ermittlung von k nach obiger Gleichung kann aus dem Anstieg der beim Auftragen von ln cA über t erhaltenen Geraden erfolgen. Halbwertszeit Die Halbwertszeit T 1/2 ist die Zeit, in der die Konzentration des Ausgangsstoffes auf die Hälfte des Anfangswertes gesunken ist. Es gilt also: cA (T 1/2 ) = c0A /2. Aus (7-5a) folgt für diesen Fall T 1/2 = ln 2/k .
Die Halbwertszeit ist bei Reaktionen 1. Ordnung von der Anfangskonzentration unabhängig. Beispiele: – Der radioaktive Zerfall verläuft wie eine Reaktion 1. Ordnung. So zerfällt das radioaktive Kohlenstoffisotop 146 C als β-Strahler nach folgender Gleichung: 14 6C
→
14 7N 14
r = −dN
Die folgenden Ausführungen beziehen sich auf die in 7.2 vorgestellte Modellreaktion; die Temperatur wird als konstant angesehen.
(7-6)
6
+ e− , 14 C /dt = kN C . 6
7.4.1 Zeitgesetz 1. Ordnung
In diesem Fall ist die Reaktionsgeschwindigkeit r der 1. Potenz der Konzentration des Ausgangsstoffes A proportional: r = 1/νA dcA /dt = kcA
(7-4)
Für den Spezialfall νA = −1 erhält man: r = −dcA /dt = kcA .
(7-4a)
Bild 7-1. Zeitlicher Konzentrationsverlauf bei einer Reaktion erster Ordnung, cA Konzentration, c0A Anfangskonzentration, t Zeit
C43
C44
C Chemie
Im Gegensatz zu Reaktionen 1. Ordnung ist hier die Halbwertszeit der Anfangskonzentration umgekehrt proportional. Beispiel: Stickstoffdioxid NO2 zerfällt in der Gasphase nach einem Zeitgesetz 2. Ordnung in Stickstoffmonoxid NO und O2 : 2 NO2 → 2 NO + O2 , r = −1/2 · dc(NO2 )/dt = k c2 (NO2 ) . Bild 7-2. Zeitlicher Konzentrationsverlauf bei einer Reaktion zweiter Ordnung, cA Konzentration, c0A Anfangskonzentration, t Zeit
Die Halbwertszeit dieser Reaktion ist 5730 ± 40 Jahre (Anwendung zur Altersbestimmung archäologischer Objekte, Radiocarbonmethode). – Distickstoffpentoxid N2 O5 reagiert in der Gasphase nach einem Zeitgesetz 1. Ordnung zu Stickstoffdioxid NO2 und O2 : 2 N2 O5 → 4 NO2 + O2 , r = −1/2 · dc(N2 O5 )/dt = k · c(N2 O5 ) .
7.5 Reaktionsgeschwindigkeit und Massenwirkungsgesetz Molekularchemische Reaktionen verlaufen im Allgemeinen nicht vollständig. Sie führen zu einem Gleichgewicht, bei dem makroskopisch kein Umsatz mehr beobachtet wird (vgl. 6.4.1). Mikroskopisch finden jedoch auch im Gleichgewicht Reaktionen statt. Im zeitlichen Mittel werden aus den Ausgangsstoffen genauso viele Moleküle der Endprodukte gebildet, wie Moleküle der Endprodukte zu den Ausgangsstoffen reagieren. Am Beispiel der Reaktionen k
2AB , A2 + B 2
7.4.2 Zeitgesetz 2. Ordnung
k
Folgender Spezialfall soll betrachtet werden: Die Reaktionsgeschwindigkeit r sei dem Quadrat der Konzentration des Ausgangsstoffes A proportional; die stöchiometrische Zahl dieses Stoffes sei νA = −1. Man erhält dann: r = −dcA /dt = k · c2A .
(7-7)
Bei Reaktionen 2. Ordnung hat die Reaktionsgeschwindigkeitskonstante die Dimension Volumen/ (Stoffmenge · Zeit). Eine häufig verwendete Einheit dieser Größe ist l/(mol · s). Die Integration von (7-7) ergibt mit der Anfangsbedingung cA (t = 0) = c0A : cA = c0A /(1 + c0A kt) oder 1/cA = 1/c0A + kt . (7-8) Beide Funktionen sind in Bild 7-2 dargestellt. Halbwertszeit Unter den in 7.4.1 dargestellten Bedingungen erhält
man für die Halbwertszeit T 1/2 einer Reaktion 2. Ordnung: T 1/2 = 1/(k c0A ) .
bei denen Reaktionsordnung und Molekularität übereinstimmen sollen, werden diese Aussagen verdeutlicht. Für die Reaktionsgeschwindigkeiten der Bildung und des Zerfalls von AB ergibt sich, wobei ein Strich die Hinreaktion, zwei Striche die Rückreaktion kennzeichnen: r = k c(A2 ) c(B2 ) bzw. r = k c2 (AB) . Beim Erreichen des Gleichgewichtes wird die makroskopisch messbare Reaktionsgeschwindigkeit null, d. h., die Reaktionsgeschwindigkeiten der Bildung und des Zerfalls von AB müssen gleich sein: r = r .
(7-9)
Daraus folgt: k /k = Kc = c2 (AB)/(c(A2 ) · c(B2 )) , Kc Gleichgewichtskonstante.
(7-10)
7 Geschwindigkeit chemischer Reaktionen. Reaktionskinetik
Die Gleichgewichtskonstante ist der Quotient der Geschwindigkeitskonstanten der Hinund Rückreaktion. Diese Aussage gilt für jedes chemische Gleichgewicht.
7.7 Kettenreaktionen
7.6 Temperaturabhängigkeit der Reaktionsgeschwindigkeit Die Temperaturabhängigkeit der Reaktionsgeschwindigkeitskonstante wird durch die ArrheniusGleichung beschrieben: k = A exp(−EA /RT ) ,
(7-11)
A Frequenz- oder Häufigkeitsfaktor, EA (Arrhenius’sche) Aktivierungsenergie (SI-Einheit: J/mol; EA ist eine molare Größe, die Kennzeichnung molar wird jedoch häufig weggelassen), R universelle Gaskonstante. Aus der differenzierten Form der ArrheniusGleichung d ln k/dT = EA /(RT 2 ), der Beziehung (7-10) und der van’t-Hoff’schen Reaktionsisobaren (vgl. 6.4.5) folgt, dass die Differenz der Aktivierungsenergien von Hin- und Rückreaktion (EA bzw. EA ) gleich der Reaktionsenthalpie (Δr H) ist: EA − EA = Δr H .
Die Arrhenius-Gleichung gilt nicht nur für Elementarreaktionen, sondern auch für die meisten zusammengesetzten Reaktionen. Im zuletzt erwähnten Fall wird die Größe EA der Arrhenius-Gleichung als scheinbare Aktivierungsenergie bezeichnet.
(7-12)
Die Beziehung zwischen den Aktivierungsenergien und der Reaktionsenthalpie ist in Bild 7-3 dargestellt.
Unter den komplizierteren molekularchemischen Reaktionen haben vor allem die Kettenreaktionen große Bedeutung. Dieser Reaktionstyp ist dadurch gekennzeichnet, dass zu Beginn der Reaktion reaktive Zwischenprodukte gebildet werden. Diese aktiven Teilchen reagieren in Folgereaktionen sehr schnell mit den Ausgangsstoffen. Die reaktiven Zwischenprodukte werden dabei ständig regeneriert, sodass der Reaktionszyklus erneut durchlaufen werden kann. Die Reaktionskette endet, wenn die Kettenträger durch Abbruchreaktionen verbraucht sind (vgl. 12.1). Man unterscheidet einfache und verzweigte Kettenreaktionen. Bei einer verzweigten Kettenreaktion wird innerhalb eines Reaktionszyklus mehr als ein aktives Teilchen erzeugt. Beispiele für einfache Kettenreaktionen sind Polymerisationen; verzweigte Kettenreaktionen haben in der Chemie der Verbrennungsvorgänge größte Bedeutung. Als Beispiel für diesen Reaktionstyp sei die Knallgasreaktion (H2 + 1/2 O2 → H2 O) angeführt. Für den Mechanismus dieser Reaktion kann folgendes Schema gelten (OH, H, O sind Radikale): Startreaktion H2 + O2 → 2 OH Reaktionskette OH + H2 → H2 O + H
(ohne Verzweigung)
H + O2 → OH + O
(mit Verzweigung)
O + H2 → OH + H
(mit Verzweigung)
Kettenabbruch H + H + M → H2 + M . M ist ein beliebiger Reaktionspartner (auch Wand des Reaktionsgefäßes), der einen Teil der Energie aufnimmt. Bild 7-3. Schema des Energieverlaufs bei einer Elementar-
reaktion
Kettenreaktionen mit Verzweigung laufen häufig sehr schnell (explosionsartig) ab (vgl. 7.8).
C45
C46
C Chemie
7.8 Explosionen Explosionen sind schnell ablaufende exotherme chemische Reaktionen, die mit einer erheblichen Drucksteigerung verbunden sind. (vgl. hierzu EN 1127-1:1997) Explosionen werden in Deflagrationen und Detonationen unterteilt. Bei Deflagrationen ist die Geschwindigkeit des Umsatzes durch Transportvorgänge (z. B. Konvektion, Wärmeleitung) begrenzt. Daher sind die Fortpflanzungsgeschwindigkeiten hier relativ gering; 10 m/s werden in gasförmigen Systemen selten überschritten. Bei Detonationen ist die Zone, in der die chemische Umsetzung abläuft, eng an eine sich mit Überschallgeschwindigkeit ausbreitende Stoßwelle gekoppelt. Die Detonationsgeschwindigkeiten liegen in gasförmigen Systemen bei ca. 2000 bis 3000 m/s und erreichen in kondensierten Systemen Werte bis ca. 9400 m/s (Nitroglycerin 7600 m/s, Octogen 9100 m/s, Hexanitro-Isowurtzitan 9400 m/s). Die bei den Detonationen auftretenden Druckgradienten sind denen von Stoßwellen analog. Das bedeutet, dass der Druck in außerordentlich kurzen Zeitspannen ansteigt (Größenordnung kleiner als eine Nanosekunde). Auch in anderen Eigenschaften gleichen sich Detonationen und Stoßwellen. So tritt bei Reflexion der Detonationsfront erneut ein Drucksprung auf (der Druckerhöhungsfaktor nimmt in der Regel Werte zwischen 2 und 3 an, teilweise werden jedoch wesentlich höhere Werte erreicht). Deflagrationen und Detonationen können in gasförmigen, flüssigen und festen Systemen auftreten. Aber auch feinverteilte Flüssigkeitströpfchen bzw. Feststoffpartikel in Gasen können explosiv reagieren. Beispiele 1. Bei Normaldruck reagieren H2 -O2 -Gemische im Bereich des nachfolgend angegebenen H2 Volumenanteils, x(H2 ), explosiv: 4,0% ≤ x(H2 ) ≤ 94%. Diese Grenzzusammensetzungen, bei denen gerade noch Deflagrationen zu beobachten sind, werden als untere bzw. obere Explosionsgrenze bezeichnet. Analog sind die Detonationsgrenzen definiert. Im System H2 /O2 liegen sie bei x(H2 ) = 15 % (untere Detonationsgrenze) und x(H2 ) = 90 % (obere Detonationsgrenze). Die Explosionsgrenzen von Wasserstoff und
von einigen Kohlenwasserstoffen in Luft sind in Tabelle 11-3 aufgeführt. 2. Nitroglycerin (Glycerintrinitrat) ist einer der wichtigsten und meistgebrauchten Sprengstoffbestandteile. Alfred Nobel bereitete aus ihm das sog. Gur-Dynamit (Nitroglycerin-Kieselgur-Mischung mit einem Nitroglycerin-Massenanteil von 75 %). 3. Als Beispiel für eine Deflagration in einem heterogenen System sei die sog. Staubexplosion angeführt. Eine derartige Deflagration kann auftreten, wenn brennbarer Staub (z. B. Mehl, mittlerer Teilchendurchmesser < 0,5 mm) in Luft oder Sauerstoff aufgewirbelt und gezündet wird. Ungewollt ablaufende Staubexplosionen können in Betrieben – ebenso wie z. B. Gasexplosionen – beträchtlichen Schaden verursachen.
7.9 Katalyse 7.9.1 Grundlagen
Unter dem Begriff Katalyse versteht man die Veränderung der Geschwindigkeit einer chemischen Reaktion unter der Einwirkung einer Substanz, des Katalysators. Beschleunigen Katalysatoren die Reaktionsgeschwindigkeit, so spricht man von positiver Katalyse, vermindern Stoffe die Reaktionsgeschwindigkeit, so nennt man diesen Vorgang negative Katalyse, den entsprechenden Wirkstoff bezeichnet man als Inhibitor. Katalysatoren in lebenden Zellen (Biokatalysatoren) werden als Enzyme bezeichnet. Katalysatoren sind durch folgende Eigenschaften charakterisiert: Sie sind Stoffe, die die Reaktionsgeschwindigkeit ändern, ohne selbst in der Umsatzgleichung aufzutreten. Vor und nach der Umsetzung liegen sie in unveränderter Menge vor. Sie haben keinen Einfluss auf den Wert der Freien Reaktionsenthalpie, können also weder die Gleichgewichtskonstante noch die Lage des chemischen Gleichgewichtes verändern. Dagegen ist die Geschwindigkeit der Einstellung des Gleichgewichtes von ihrer Anwesenheit abhängig. Die Geschwindigkeiten der Hin- und Rückreaktion werden dabei in gleicher Weise beeinflusst.
7 Geschwindigkeit chemischer Reaktionen. Reaktionskinetik
Katalysatoren verringern die Aktivierungsenergie einer Reaktion (Vernachlässigung der negativen Katalyse). Das ist nur möglich, wenn die Reaktion in Gegenwart des Katalysators nach einem anderen Mechanismus verläuft als in seiner Abwesenheit. Intermediär bilden sich zwischen den Ausgangsstoffen und dem Katalysator unbeständige Zwischenverbindungen, die dann in die Endprodukte und den Katalysator zerfallen. 7.9.2 Homogene Katalyse
Die homogene Katalyse ist dadurch gekennzeichnet, dass Katalysator und Reaktionspartner in der gleichen Phase vorliegen. Eine homogen katalysierte Gasreaktion findet z. B. beim klassischen Bleikammerverfahren statt, das zur Herstellung von Schwefelsäure dient. Hierbei wird Schwefeldioxid SO2 durch Sauerstoff zu Schwefeltrioxid SO3 oxidiert. Als Katalysator dienen Stickoxide. Schematisch kann der Vorgang folgendermaßen beschrieben werden: N2 O3 + SO2 → 2 NO + SO3 2 NO + 1/2 O2 → N2 O3 SO2 + 1/2 O2 → SO3 .
Bild 7-4. Schema des Energieverlaufs einer katalysierten und einer nicht katalysierten Reaktion
In Bild 7-4 sind die Energieprofile der katalysierten und der nichtkatalysierten Reaktion dargestellt. Man erkennt, dass die Reaktion in Gegenwart des Katalysators hier über zwei Energiestufen verläuft, von denen jede eine niedrigere Aktivierungsenergie hat, als dies beim nichtkatalysierten Verlauf der Reaktion der Fall ist.
Anschließend reagiert das gebildete Schwefeltrioxid mit Wasser unter Bildung von Schwefelsäure H2 SO4 .
7.9.4 Haber-Bosch-Verfahren
7.9.3 Heterogene Katalyse
Ein Beispiel für einen großtechnischen Prozess, dem eine heterogene Katalyse zugrunde liegt, ist das Haber-Bosch-Verfahren zur Herstellung von Ammoniak NH3 aus den Elementen (vgl. 6.4.6):
Bei der heterogenen Katalyse liegen Katalysator und Reaktionspartner in verschiedenen Phasen vor. Von großer technischer Bedeutung sind die Systeme fester Katalysator und flüssige bzw. gasförmige Reaktionspartner. Der Hauptvorteil gegenüber der homogenen Katalyse besteht in der leichteren Abtrennbarkeit des Katalysators von den Reaktionsprodukten und in der Möglichkeit kontinuierlicher Prozessführung. Aus diesen Gründen werden heute im technischen Bereich fast ausschließlich heterogene Katalysen durchgeführt. Beispiel: Für die Reaktion mit der Umsatzgleichung A → B+C können folgende Teilschritte formuliert werden: A + K → AK , AK → K + B + C Dabei ist K der Katalysator.
N2 + 3 H2 2 NH3 , Δr H < 0 . Dieses Verfahren wird bei einem Druck von 200 bar und bei einer Temperatur von 500 ◦ C in Gegenwart eines Eisenkatalysators durchgeführt. Zur Auswahl der Verfahrensparameter
Nach dem Prinzip von Le Chatelier und Braun (vgl. 6.4.6) wird die Lage des oben erwähnten exothermen Gleichgewichtes durch Verringerung der Temperatur und Erhöhung des Druckes auf die Seite des Ammoniaks verschoben. Bei den von der Thermodynamik geforderten tiefen Temperaturen erfolgt aber die Einstellung des chemischen Gleichgewichtes nicht mehr in einem technisch vertretbaren Zeitraum. Darüber hinaus wird die
C47
C48
C Chemie
Reaktion durch Katalysatoren erst bei höheren Temperaturen in ausreichendem Maße beschleunigt. Die Optimierung dieser Effekte führte zu den genannten Versuchsparametern. Mechanismus der Ammoniaksynthese
Der Reaktionsablauf bei der Ammoniaksynthese kann wie jede andere durch einen Feststoff katalysierte Gasphasenreaktion in folgende Einzelschritte unterteilt werden: 1. Transport der Ausgangsstoffe durch Konvektion und Diffusion an die innere Oberfläche des Katalysators. 2. Adsorption der Reaktionsteilnehmer an der Oberfläche des Katalysators. 3. Reaktion der adsorbierten Teilchen auf der Katalysatoroberfläche. 4. Desorption des gebildeten Ammoniaks in die Gasphase. 5. Abtransport des Ammoniaks (durch Diffusion und Konvektion). Der Mechanismus der Ammoniakbildung an der Katalysatoroberfläche kann durch folgendes Schema wiedergegeben werden (die adsorbierten Teilchen sind mit dem Zusatz ad, Moleküle in der Gasphase mit g gekennzeichnet): H2 (g) 2 H(ad) N2 (g) N2 (ad) 2 N(ad) N(ad) + H(ad) 2 NH(ad) NH(ad) + H(ad) NH2 (ad) NH2 (ad) + H(ad) NH3 (ad) NH3 (g) . Die Geschwindigkeit der Gesamtreaktion wird im Wesentlichen durch die Geschwindigkeit der dissoziativen Stickstoff-Adsorption (Reaktionsschritt 2) bestimmt.
8 Stoffe und Reaktionen in Lösung 8.1 Disperse Systeme Ein disperses System ist eine Stoffmischung, die aus zwei oder mehreren Komponenten zusammengesetzt
ist. Bei einem derartigen System liegen ein oder mehrere Bestandteile, die als disperse oder dispergierte Phasen bezeichnet werden, fein verteilt in dem so genannten Dispersionsmittel vor. Disperse Systeme können aus einer oder aber auch aus mehreren Phasen bestehen. Nach der Teilchengröße d der dispersen Phase unterscheidet man – grobdisperse Systeme (d > 10−6 m), – kolloiddisperse Systeme (10−9 < d/m < 10−6 ) und – molekulardisperse Systeme (d < 10−9 m). 8.1.1 Kolloide
In kolloiden Systemen sind die Teilchen der dispersen Phase zwischen 10−9 m und 10−6 m groß. Das entspricht etwa 103 bis 1012 Atomen pro Teilchen. Kolloide nehmen eine Zwischenstellung zwischen den molekulardispersen und den grobdispersen Systemen ein. Aufgrund ihrer geringen Teilchengröße sind Kolloide im Lichtmikroskop nicht sichtbar. In Wasser dispergierte Kolloide werden von Membranfiltern – nicht aber von Papierfiltern – zurückgehalten. Kolloide können nach dem Aggregatzustand der dispersen Phase und dem des Dispersionsmittels eingeteilt werden, siehe Tabelle 8-1. Haben die Teilchen der dispersen Phase alle die gleiche Größe, so spricht man von monodispersen Kolloiden, andernfalls liegen polydisperse Kolloide vor. Tabelle 8-1. Einteilung der Kolloide
Dispersionsmittel disperser Bestandteil gasförmig gasförmig
flüssig fest
flüssig flüssig flüssig
gasförmig flüssig fest
fest
gasförmig
fest fest
flüssig fest
Bezeichnung Aerosole: Nebel Staub, Rauch Lyosole: Schaum Emulsion Suspension Xerosole: fester Schaum, Gasxerosol feste Emulsion feste Kolloide, Vitreosole
8 Stoffe und Reaktionen in Lösung
8.1.2 Lösungen
Unter einer Lösung versteht man eine homogene Mischphase, die aus verschiedenen Stoffen zusammengesetzt ist. Die Komponenten müssen molekulardispers verteilt sein. Der Bestandteil, der im Überschuss vorhanden ist, wird in der Regel als Lösungsmittel bezeichnet; die anderen Komponenten werden gelöste Stoffe genannt. Der Begriff Lösung wird üblicherweise auf flüssige und feste Mischphasen beschränkt. Im Folgenden werden ausschließlich homogene flüssige Mischphasen behandelt. Derartige Lösungen werden in Elektrolytlösungen und Nichtelektrolytlösungen unterteilt. Während Elektrolytlösungen gelöste Elektrolyte (siehe 8.1.3) enthalten, die in polaren Lösungsmitteln in Ionen dissoziieren (z. B. wässrige Lösung von Natriumchlorid), sind in Nichtelektrolytlösungen (z. B. wässrigen Lösungen von Rohrzucker) praktisch keine Ionen vorhanden. 8.1.3 Elektrolyte, Elektrolytlösungen
Als Elektrolyt wird eine chemische Verbindung bezeichnet, die im festen oder flüssigen (geschmolzen oder in Lösung) Zustand ganz oder teilweise aus Ionen besteht. Man unterscheidet zwischen: – Festen Elektrolyten. Alle in Ionengittern kristallisierenden Stoffe, also sämtliche Salze (z. B. festes NaCl, dessen Gitter aus Na+ - und Cl− -Ionen aufgebaut ist) und salzartigen Verbindungen (z. B. NaOH) gehören hierzu. – Elektrolytschmelzen. Geschmolzene Salze bzw. geschmolzene salzartige Verbindungen bestehen im flüssigen Zustand weitgehend aus Ionen. – Elektrolytlösungen. Die Lösungen von echten und/oder potentiellen Elektrolyten (siehe unten) in einem polaren Lösungsmittel (dessen Moleküle ein permanentes elektrisches Dipolmoment haben) werden als Elektrolytlösungen bezeichnet. Elektrolytlösungen enthalten stets Ionen in hoher Menge. Im Hinblick auf ihr Verhalten beim Lösen in polaren Lösungsmitteln werden die Elektrolyte in zwei Gruppen unterteilt:
– Echte Elektrolyte. Diese Substanzen sind bereits als Festkörper aus Ionen aufgebaut. Salze und salzartige Verbindungen gehören hierzu. Beim Lösungsvorgang in einem polaren Lösungsmittel wird das Kristallgitter zerstört und die Ionen gehen solvatisiert (siehe 8.5) in Lösung. – Potentielle Elektrolyte. Diese Verbindungsgruppe ist als reine Phase (vgl. 6.1.1) nicht aus Ionen aufgebaut. Erst durch eine chemische Reaktion mit einem polaren Lösungsmittel werden Ionen gebildet. Beispiele für potentielle Elektrolyte: Chlorwasserstoff HCl und Ammoniak NH3 sind bei Raumbedingungen Gase, die mit flüssigem Wasser unter Bildung der hydratisierten Ionen H+ (aq) und Cl− (aq) bzw. NH+4 (aq) und OH− (aq) reagieren: HCl(g) + xH2 O(l) → H+ (aq) + Cl− (aq) NH3 (g) + yH2 O(l) → NH+4 (aq) + OH− (aq)
8.2 Kolligative Eigenschaften von Lösungen Zu den kolligativen Eigenschaften gehören die Dampfdruckerniedrigung, die Gefrierpunktserniedrigung, die Siedepunktserhöhung sowie der osmotische Druck. Diese Eigenschaften hängen bei starker Verdünnung nur von der Zahl (d. h. der Stoffmenge) der gelösten Teilchen, nicht aber von deren chemischer Natur ab. Im Folgenden werden ausschließlich Zweikomponentensysteme betrachtet. Das Lösungsmittel wird durch den Index 1, der gelöste Stoff durch den Index 2 gekennzeichnet. Ferner wird vorausgesetzt, dass der gelöste Stoff keinen messbaren Dampfdruck hat. 8.2.1 Dampfdruckerniedrigung
Durch Zusatz eines Stoffes mit den oben geschilderten Eigenschaften zu einem Lösungsmittel wird dessen Dampfdruck erniedrigt. Es gilt p1 = x1 · p01 ,
T = const ,
(8-1)
p1 Dampfdruck über der Lösung, p01 Dampfdruck des reinen Lösungsmittels, x1 = n1 /(n1 + n2 ) Stoffmengenanteil des Lösungsmittels, T Temperatur. Mit x1 + x2 = 1 und Δp = p01 − p1 folgt aus (8-1) für die relative Dampfdruckerniedrigung Δp/p01 = x2 ,
(8-2)
C49
C50
C Chemie
Die relative Dampfdruckerniedrigung des Lösungsmittels ist gleich dem Stoffmengenanteil des gelösten Stoffes. Die hier angegebenen Beziehungen gelten nur bei verdünnten Lösungen unter der Voraussetzung, dass der gelöste Stoff ein Nichtelektrolyt (z. B. Rohrzucker) ist.
Fügt man zu einem reinen Lösungsmittel einen gelösten Stoff, so führt dies, wie in 8.2.1 dargelegt wurde, stets zu einer Dampfdruckerniedrigung. Diese bewirkt einerseits, dass über der Lösung der Normalluftdruck (101 325 Pa) erst bei einer höheren Temperatur erreicht wird als über dem reinen Lösungsmittel. Die Dampfdruckerniedrigung führt also zu einer Siedepunktserhöhung. Andererseits bewirkt der Zusatz des gelösten Stoffes, dass die Dampfdruckkurve der Lösung die des festen Lösungsmittels schon bei einer tieferen Temperatur schneidet als die entsprechende Kurve des reinen Lösungsmittels, d. h., der Gefrierpunkt wird durch den Zusatz des gelösten Stoffes erniedrigt. Dies ist schematisch in Bild 8-1 dargestellt. Für die Gefrierpunktserniedrigung gilt: p = const ,
kG = 1,860 K kg/mol . Eine analoge Beziehung besteht für die Siedepunktserhöhung:
8.2.2 Gefrierpunktserniedrigung und Siedepunktserhöhung
ΔT sl = T sl1 − T sl = kG b2 ,
tät des gelösten Stoffes, n2 Stoffmenge des gelösten Stoffes, m1 Masse des Lösungsmittels, p Druck. Die Größe kG , die nur von den Eigenschaften des reinen Lösungsmittels abhängt, heißt kryoskopische Konstante. Ihr Wert für Wasser ist bei 101 325 Pa
(8-3)
T sl1 Schmelzpunkt des reinen Lösungsmittels, T sl Schmelztemperatur der Lösung, b2 = n1 /m1 Molali-
ΔT lg = T lg − T lg1 = kS b2
p = const ,
(8-4)
T lg Siedetemperatur der Lösung, T lg1 Siedetemperatur des reinen Lösungsmittels, kS ebullioskopische Konstante. Für Wasser ist kS = 0,513 K kg/mol . Die Beziehungen, die für den Zusammenhang zwischen der Siedepunktserhöhung bzw. der Gefrierpunktserniedrigung und der Molalität des gelösten Stoffes angegeben sind, gelten nur für sehr verdünnte Lösungen unter der Voraussetzung, dass der gelöste Stoff ein Nichtelektrolyt ist. Messungen der Gefrierpunktserniedrigung wurden früher häufig zur Bestimmung der molaren Masse eines gelösten Stoffes benutzt. Hierzu wird (8-3) folgendermaßen umgeformt; ΔT sl = kG b2 = kG m2 /(M2 m1 ) , M2 = kG m2 /(ΔT sl m1 )
(8-5)
M2 molare Masse des gelösten Stoffes, m2 Masse des gelösten Stoffes. Bei Elektrolytlösungen wird die Abhängigkeit der Gefrierpunktserniedrigung bzw. der Siedepunktserhöhung von der Molalität des gelösten Stoffes durch folgende Beziehungen beschrieben: Gefrierpunktserniedrigung (8-6) ΔT sl /b2 = ν kG + a b2 Siedepunktserhöhung ΔT lg /b2 = ν kS + b b2
Bild 8-1. Schema der Dampfdruckkurve einer Lösung (Kur-
ve B) und des entsprechenden Lösungsmittels (Kurve A). ΔT lg Siedepunktserhöhung, ΔT sl Gefrierpunktserniedrigung
b2 Molalität.
(8-7)
8 Stoffe und Reaktionen in Lösung
Hierbei sind a und b Konstanten, die auch von den Eigenschaften des gelösten Stoffes abhängen. ν ist die Summe der Zerfallszahlen. Diese Größe ist durch die Zahl der Ionen gegeben, in die die Formeleinheit des Elektrolyten zerfällt. Beispiel: Natriumsulfat Na2 SO4 zerfällt in zwei Na+ Ionen und ein SO2− 4 -Ion, daher ist ν = 3. Messungen der Gefrierpunktserniedrigung und der Siedepunktserhöhung von Elektrolytlösungen können als Nachweis dafür dienen, dass Elektrolyte in wässriger Lösung dissoziiert vorliegen. 8.2.3 Osmotischer Druck
In Bild 8-2 ist ein System dargestellt, in dem eine semipermeable Membran zwei flüssige Teilsysteme trennt. Eine derartige Membran ist nur für bestimmte Teilchenarten durchlässig, in diesem Fall nur für die Moleküle des Lösungsmittels (Index 1), nicht aber für den gelösten Stoff (Index 2). Im Teilsystem I befindet sich nur das Lösungsmittel, im Teilsystem II zusätzlich ein gelöster Stoff (z. B. Rohrzucker). Im Gleichgewicht muss auf den Kolben II zusätzlich zum Druck p, der auch auf den Kolben I wirkt, der Druck π ausgeübt werden. Ein derartiges Gleichgewicht heißt osmotisches Gleichgewicht. Der Zusatzdruck π wird als osmotischer Druck bezeichnet. Wirkt auf den Kolben II kein Zusatzdruck, so wandern Lösungsmittelmoleküle vom Teilsystem I ins Teilsystem II und verdünnen dadurch die Lösung. Als Folge dieses Vorganges wird der Flüssigkeitsspiegel im Zylinder II erhöht und im Zylinder I gesenkt. Dieser Vor-
gang wird so lange fortgesetzt, bis die hydrostatische Druckdifferenz den osmotischen Druck der Lösung erreicht hat. Die Konzentrationsabhängigkeit des osmotischen Druckes π eines gelösten Nichtelektrolyten wird durch folgende Beziehung beschrieben: π = c2 RT + Bc22 + Cc32 + . . . π/ 2 = RT /M2 + B
2 + C 22
(8-8a)
+...
(8-8b)
c2 Konzentration des gelösten Stoffes, 2 = m2 /V Massenkonzentration (Partialdichte), R universelle Gaskonstante. Die Konstanten B, C, B und C werden als Virialkoeffizienten bezeichnet. Diese Gleichung stimmt formal mit der Virialform der Zustandsgleichung realer Gase überein (vgl. 5.1.5). Für sehr verdünnte Nichtelektrolytlösungen vereinfacht sich die obige Beziehung. Es gilt näherungsweise π = c2 RT .
(8-9)
Diese Beziehung gleicht der Zustandsgleichung idealer Gase. Elektrolytlösungen weisen bei gleichen Konzentrationen einen höheren osmotischen Druck auf als Nichtelektrolytlösungen. Für stark verdünnte Lösungen von Elektrolyten gilt: π = ν c2 RT ,
(8-10)
ν Summe der Zerfallszahlen. Umkehrosmose
Wirkt auf den linken Kolben des in Bild 8-2 dargestellten Systems ein äußerer Druck, der größer als der osmotische Druck π ist, so geschieht folgendes: Lösungsmittelmoleküle wandern durch die semipermeable Membran vom Teilsystem II (Lösungsseite) zum Teilsystem I (Seite des Lösungsmittels). Dieser Vorgang wird als Umkehrosmose bezeichnet und technisch zur Meerwasserentsalzung eingesetzt. Anwendungen und Beispiele
Bild 8-2. Osmotisches Gleichgewicht, die semipermeable
Membran ist für den Stoff 2 undurchlässig (nach Tombs, M.P.; Peacocke, A.R.: The osmotic pressure of biological macromolecules)
1. Bestimmung der molaren Masse gelöster Nichtelektrolyte. Hierzu wird π/ 2 als Funktion der Massenkonzentration 2 aufgetragen und die molare Masse unter Anwendung obiger Beziehung aus dem Ordinatenabschnitt der graphischen Darstellung bestimmt.
C51
C52
C Chemie
2. Im menschlichen Blut besitzen sowohl das Blutplasma als auch der Inhalt der roten Blutkörperchen den gleichen osmotischen Druck (7,7 bar bei 37 ◦ C). Eine Zufuhr von reinem Wasser bewirkt eine Verringerung des osmotischen Druckes des Blutplasmas und führt durch Quellung zum Platzen der roten Blutkörperchen (Hämolyse). Wird der Wassergehalt des Blutplasmas erniedrigt und damit der osmotische Druck erhöht, so schrumpfen die roten Blutkörperchen. Bei intravenösen Injektionen muss daher darauf geachtet werden, dass der osmotische Druck der injizierten Flüssigkeiten gleich dem des Blutplasmas ist.
8.3 Löslichkeit von Gasen in Flüssigkeiten Die Löslichkeit von Gasen in Flüssigkeiten wird quantitativ durch das Gesetz von Henry und Dalton beschrieben: x2 = k p 2 ,
T = const
(8-11)
Bei konstanter Temperatur ist der Stoffmengenanteil x2 eines Gases in einer Flüssigkeit seinem Partialdruck p2 in der Gasphase proportional. k ist eine von der chemischen Natur des Gases und des Lösungsmittels sowie von der Temperatur abhängige Stoffkonstante.
8.5 Wasser als Lösungsmittel Die Löslichkeit von Ionenkristallen (Salzen) oder Molekülkristallen in einem Lösungsmittel wird durch zwei unterschiedliche energetische Faktoren bestimmt. Beim Auflösen des Kristalls muss dessen Gitter zerstört werden. Dazu ist eine Energie notwendig, die größenordnungsmäßig gleich der Gitterenergie ist. Diese Energie wird durch die Wechselwirkung zwischen den Lösungsmittelmolekülen und den gelösten Teilchen geliefert und heißt Solvatationsenergie (beim Lösungsmittel Wasser: Hydratationsenergie). Die Wechselwirkung der gelösten Teilchen mit den Lösungsmittelmolekülen wird Solvatation (beim Lösungsmittel Wasser: Hydratation) genannt. Es gilt folgende Beziehung zwischen der Gitterenthalpie ΔG H, der Solvatationsenthalpie ΔS H und der Lösungsenthalpie ΔL H (der Unterschied zwischen der Energie und der Enthalpie soll hier vernachlässigt werden): ΔL H = |ΔG H| − |ΔS H| .
(8-13)
Folgende drei Fälle sollen diskutiert werden:
8.4 Verteilung gelöster Stoffe zwischen zwei Lösungsmitteln Zwei (praktisch) unmischbare Flüssigkeiten enthalten beide einen dritten Stoff (Index B). Wenn sich das Verteilungsgleichgewicht eingestellt hat, gilt das Nernst’sche Verteilungsgesetz: cIB /cIIB = k, T, p = const .
sungsmittel sowie von Druck und Temperatur abhängig. Voraussetzung für die Gültigkeit von (8-12) ist, dass der molekulare Zustand des Stoffes B in beiden flüssigen Phasen gleich ist.
(8-12)
(Kennzeichnung der beiden flüssigen Phasen durch I und II.) Das Verhältnis der Konzentrationen eines sich zwischen zwei nicht mischbaren Lösungsmitteln verteilenden Stoffes ist konstant, d. h. unabhängig von der ursprünglich eingesetzten Stoffportion. Die Konstante k wird als Verteilungskoeffizient des Stoffes B bezeichnet. Sie ist von der Natur der Lö-
1. |ΔG H| > |ΔS H|. Hier ist ΔL H > 0, d. h., beim Auflösen des Kristalls kühlt sich die Lösung ab (endothermer Vorgang). Die endotherme Auflösung eines Kristalls ist nur möglich, wenn die Bedingung T Δr S > Δr H erfüllt ist (vgl. 6.3.4), da nur in diesem Fall Δr G < 0 sein kann (die Reaktionsgrößen beziehen sich auf den Gesamtvorgang der Auflösung). 2. |ΔG H| < |ΔS H|. In diesem Fall ist ΔL H < 0, d. h., die Lösung erwärmt sich (exothermer Vorgang). 3. |ΔG H| |ΔS H|. Die energetischen Voraussetzungen für eine Auflösung des Kristalls sind jetzt nicht mehr gegeben. Hydratation von Ionen
Die direkte Ion-Dipol-Wechselwirkung führt zur Hydratation in der unmittelbaren Umgebung des Ions (primäre Hydratation). In dieser Hydrathülle sind die
8 Stoffe und Reaktionen in Lösung
Wassermoleküle relativ fest gebunden. Die primäre Hydrathülle bleibt sowohl bei der thermischen Eigenbewegung als auch bei der Bewegung unter dem Einfluss eines elektrischen Feldes erhalten. Kleine und hochgeladene Ionen sind besonders stark hydratisiert. Die Zahl der Wassermoleküle in der primären Hydrathülle liegt je nach Ionensorte meist zwischen 1 und 10. Die äußere, locker gebundene Hülle entsteht durch Wechselwirkung der Wassermoleküle mit dem bereits in erster Sphäre hydratisierten Ion (sekundäre Hydratation).
8.6 Eigendissoziation des Wassers, Ionenprodukt des Wassers Auch chemisch reines Wasser besitzt eine elektrische Leitfähigkeit. So fanden Kohlrausch und Heydweiler (1894) für die Leitfähigkeit γ von Wasser bei 18 ◦ C einen Wert von γ = 4,4 · 10−6 S/m . Ursache dieser Restleitfähigkeit ist die Bildung von Ionen durch die Eigendissoziation von Wassermolekülen, die durch folgende Gleichung beschrieben werden kann: H2 O H+ (aq) + OH− (aq) . Die Wasserstoff- und die Hydroxidionen sind hydratisiert, was durch den Zusatz (aq) gekennzeichnet ist. Wendet man auf die obige Umsatzgleichung das Massenwirkungsgesetz an, so folgt c(H+ ) c(OH− ) = KW , KW = 1,01 · 10−14 mol2 /l2
(25 ◦ C) .
KW wird als Ionenprodukt des Wassers bezeichnet. KW ist, wie die nachfolgende Tabelle zeigt, stark von der Temperatur abhängig: T in ◦ C 0 5 25 40 55 70 85 100
KW in (mol2 /l2 ) 0,115 · 10−14 0,188 · 10−14 1,006 · 10−14 2,83 · 10−14 6,85 · 10−14 14,7 · 10−14 28,3 · 10−14 49,9 · 10−14
In reinem Wasser ist die Konzentration der H+ (aq)und OH− (aq)-Ionen gleich. Daher gilt: c(H+ ) = c(OH− ) = KW . Bei 25 ◦ C erhält man mit dieser Beziehung: c(H+ ) = c(OH− ) = 1 · 10−7 mol/l . Da die Konzentration des undissoziierten Wassers 55,5 mol/l beträgt, folgt, dass lediglich ein Bruchteil von 1,8 · 10−9 der Wassermoleküle dissoziiert ist.
8.7 Säuren und Basen 8.7.1 Definitionen von Arrhenius und Brønsted
Nach Arrhenius werden Säuren und Basen folgendermaßen definiert: Säuren sind wasserstoffhaltige Verbindungen, die in wässriger Lösung in positiv geladene Wasserstoffionen (H + ) und negativ geladene Säurerest-Ionen dissoziieren. Basen sind hydroxidgruppenhaltige Verbindungen, die in wässriger Lösung in negative Hydroxidionen (OH− ) und positive BaserestIonen dissoziieren. Beispiele: Die Säure Chlorwasserstoff HCl dissoziiert in wässriger Lösung gemäß folgender Gleichung: HCl H+ (aq)+Cl− (aq). Im Gegensatz zur HCl kann ein Schwefelsäuremolekül H2 SO4 zwei Wasserstoffionen abgeben: H2 SO4 H+ (aq) + HSO−4 (aq) (1. Dissoziationsstufe) und HSO−4 (aq) H+ (aq)+SO2− 4 (aq) (2. Dissoziationsstufe). Die Base Natriumhydroxid NaOH dissoziiert in wässriger Lösung in Natrium- und Hydroxidionen: NaOH Na+ (aq) + OH− (aq) . Nach Arrhenius bildet sich bei der Reaktion einer Säure mit einer Base ein Salz und undissoziiertes Wasser. Dieser Reaktionstyp wird als Neutralisation bezeichnet. Beispiele: HCl + NaOH NaCl + H2 O H2 SO4 + 2 NaOH Na2 SO4 + 2 H2 O .
C53
C54
C Chemie
Das Wesentliche der Neutralisation besteht in der Reaktion von Wasserstoffionen und Hydroxidionen zu undissoziiertem Wasser: H+ (aq) + OH− (aq) H2 O J.N. Brønsted (dt.: Brönsted) erweiterte 1923 die Definition von Arrhenius folgendermaßen: Säuren sind Protonendonatoren, d. h. Stoffe, die Protonen abgeben können. Basen sind Protonenakzeptoren, d. h. Stoffe, die Protonen aufnehmen können. Diese Definition von Brönsted ist unabhängig vom verwendeten Lösungsmittel. Arrhenius-Säuren sind stets auch Brönsted-Säuren. Brönsted-Basen sind z. B. OH− , NH3 , Cl− und SO2− 4 . Durch Protonenanlagerung werden diese Verbindungen zu H2 O, NH+4 , HCl und HSO−4 . Die zuletzt genannten Moleküle bzw. Ionen sind, da sie die aufgenommenen Protonen wieder abspalten können, Brönsted-Säuren. 8.7.2 Starke und schwache Säuren und Basen
Säuren wie auch Basen unterscheiden sich durch das Ausmaß, in dem die Aufspaltung in Ionen, die Dissoziation, erfolgt. Die zuverlässigste Größe, die die Dissoziation quantitativ beschreibt, ist die Dissoziationskonstante. Für die Dissoziation einer Säure (HA) bzw. Base (BOH) gilt: HA H+ (aq) + A− (aq) . BOH B+ (aq) + OH− (aq) . Wendet man auf diese Gleichgewichte das Massenwirkungsgesetz an, so folgt: 6 7 6 7 6 7 6 7 c H+ · c A− c B+ · c OH− KS = KB = . c (HA) c (BOH) Hierbei sind c(H+ ), c(A− ), c(HA), c(OH− ), c(B+ ) und c(BOH) die Konzentrationen der im Gleichgewicht vorliegenden Teilchen. KS und KB werden als Dissoziationskonstanten bezeichnet. c(HA) bzw. c(BOH) unterscheiden sich von der analytischen oder der Gesamtkonzentration c0 . Die zuletzt genannten Größen setzen sich additiv aus der Konzentration der dissoziierten und der undissoziierten Säure bzw. Base zusammen. Es gilt:
6 7 c0 = c H+ + c (HA) bzw. 6 7 c0 = c OH− + c (BOH) . Häufig wird das Ausmaß der Dissoziation durch den Dissoziationsgrad α ausgedrückt. Hierunter versteht man den Quotienten aus der Zahl der dissoziierten Moleküle und der Gesamtzahl der Moleküle, α kann Werte zwischen 0 (undissoziierte Verbindung) und 1 (vollständige Dissoziation) annehmen. Säuren und Basen werden als stark bezeichnet, wenn die Dissoziationskonstante größer oder gleich 1 mol/l ist. In diesem Fall dissoziiert die Säure bei allen Konzentrationen praktisch vollständig, d. h., α ist bei allen Konzentrationen nahezu 1. Beispiele für starke Säuren und Basen: Salzsäure (HCl in Wasser), Salpetersäure HNO3 , Schwefelsäure H2 SO4 und Perchlorsäure HClO4 sind starke Säuren. Starke Basen sind die Alkalimetallhydroxide (NaOH, KOH usw.) und die meisten Erdalkalimetallhydroxide (Ca(OH)2 , Ba(OH)2 , vgl. 10.3). Säuren und Basen, die Dissoziationskonstanten aufweisen, die kleiner als 1 mol/l sind, werden als schwache Säuren bzw. Basen bezeichnet. Das Ausmaß der Dissoziation ändert sich hier sehr stark mit der Konzentration der Säure bzw. Base. Die Dissoziationskonstanten einiger schwacher Säuren bzw. Basen gibt die folgende Tabelle wieder (Temperatur 25 ◦ C): Salpetrige Säure Essigsäure Ameisensäure Kohlensäure 1. Stufe 2. Stufe Silberhydroxid Ammoniak
HNO2 CH3 COOH HCOOH H2 CO3
AgOH NH3 · H2 O
4,6 · 10−4 mol/l 1,75 · 10−5 mol/l 1,77 · 10−4 mol/l 1,32 · 10−4 mol/l 4,69 · 10−11 mol/l 1,1 · 10−4 mol/l 1,77 · 10−5 mol/l
Namen und Formeln wichtiger anorganischer Säuren sind in Tabelle 8-2 aufgeführt. 8.7.3 Der pH-Wert
Häufig verwendet man anstelle der Wasserstoffionenkonzentration den pH-Wert, der durch folgende Beziehung definiert ist: pH = − log(c(H+ )/(mol/l)) .
(8-14)
8 Stoffe und Reaktionen in Lösung
Tabelle 8-2. Wichtige anorganische Säuren
Name
Formel
Bromwasserstoff Chlorwasserstoff
HBr HCl
Anion (Säurerestion) Formel Name Br− Bromid Cl− Chlorid
Fluorwasserstoff
HF
F−
Fluorid
Schwefelwasserstoff
H2 S
Hypochlorige Säure Chlorige Säure Chlorsäure Perchlorsäure Kohlensäure
HClO HClO2 HClO3 HClO4 H2 CO3
HS− S2− ClOClO−2 ClO−3 ClO−4 HCO−3 CO2− 3
Hydrogensulfid Sulfid Hypochlorit Chlorit Chlorat Perchlorat Hydrogencarbonat Carbonat
Phosphorsäure
H3 PO4
H2 PO−4
Dihydrogenphosphat
Salpetrige Säure Salpetersäure Schweflige Säure
HNO2 HNO3 H2 SO3
HPO2− 4 PO3− 4 NO−2 NO−3 SO2− 3
Hydrogenphosphat Phosphat Nitrit Nitrat Sulfit
Schwefelsäure
H2 SO4
SO2− 4
Sulfat
Der pH-Wert ist der negative dekadische Logarithmus des Zahlenwertes der Wasserstoffionenkonzentration in mol/l. Reines Wasser hat bei 25 ◦ C wegen KW = 10−14 mol2 /l2 und c(H+ ) = 10−7 mol/l den pHWert 7. Durch Säurezusatz kann eine höhere Wasserstoffionenkonzentration erreicht werden. Derartige Lösungen haben einen pH-Wert, der kleiner als 7 ist. Sie werden als sauer bezeichnet. Ist durch Zusatz einer Base zu Wasser die Hydroxidionenkonzentration erhöht worden, so muss wegen der Gleichgewichtsbedingung KW = c(H+ ) c(OH− ) die Wasserstoffionenkonzentration entsprechend kleiner geworden sein. Derartige alkalische oder basische Lösungen haben einen pH-Wert, der größer als 7 ist: pH < 7 saure Lösungen
Bemerkungen
unter Normalbedingungen farbloses Gas, wässrige Lösungen heißen Salzsäure bei 19,5 ◦ C siedende Flüssigkeit, wässrige Lösungen heißen Flusssäure farbloses, übelriechendes (wie faule Eier), sehr giftiges Gas
Kohlensäure ist nur in wässriger Lösung beständig, CO2 ist das Anhydrid der Kohlensäure (Oxid reagiert mit Wasser unter Bildung von Kohlensäure) Anhydrid der Phosphorsäure: Phosphorpentoxid P4 O10
Stickstoffdioxid NO2 ist das gemischte Anhydrid der Salpetrigen und der Salpetersäure Anhydrid der schwefligen Säure: Schwefeldioxid SO2 Anhydrid der Schwefelsäure: Schwefeltrioxid SO3
pH = 7 neutrale Lösungen pH > 7 alkalische Lösungen. 8.7.4 pH-Wert der Lösung einer starken Säure bzw. Base Nach der in 8.7.2 angegebenen Definition sind starke
Säuren bei allen Konzentrationen praktisch vollständig dissoziiert. Daraus folgt, dass die Wasserstoffionenkonzentration c(H+ ) bei starken Säuren gleich der analytischen oder Gesamtkonzentration c0 der Säure ist: c(H+ ) = c0 . Beispiel: Der pH-Wert einer Salzsäure der Konzentration c(HCl) = 2 mol/l ist zu berechnen. Mit c(H+ ) = c0 (HCl) = 2 mol/l folgt: pH = −0,3. Man erkennt, dass der pH-Wert der Lösung einer starken Säure auch kleinere Werte als 0 (bei c(H+ ) > 1 mol/l) annehmen kann. Bei Lösungen starker Basen gilt infolge der vollständigen Dissoziation dieser Verbindungen, dass die
C55
C56
C Chemie
Konzentration der Hydroxidionen gleich der analytischen Konzentration der Base ist: c(OH− ) = c0 . Die Wasserstoffionen-Konzentration ist durch das Ionenprodukt des Wassers festgelegt: 6 7 c H+ =
KW KW . 6 7= c0 c OH−
Beispiel: Der pH-Wert einer Natriumhydroxidlösung der Konzentration c0 (NaOH) = 0,1 mol/l ist gesucht (25 ◦ C). Ergebnis: c(OH− ) = 0,1 mol/l, c(H+ ) = 10−13 mol/l, pH = 13. 8.7.5 pH-Wert der Lösung einer schwachen Säure bzw. Base
Gegeben sei die wässrige Lösung einer schwachen Säure HA (z. B. Essigsäure CH3 COOH) mit der analytischen Konzentration c0 . Das Dissoziationsgleichgewicht von HA wird durch die Dissoziationskonstante KS beschrieben (vgl. 8.7.2): 6 7 6 7 6 7 6 7 c H+ · c A− HA H+ aq + A− aq , KS = . c (HA) (8-15) Bei Lösungen, die außer dem Lösungsmittel Wasser nur die schwache Säure enthalten, gilt c(H+ ) = c(A− ). Ersetzt man in der obigen Beziehung c(HA) durch die analytische Konzentration c0 , so folgt: 6 7 c 2 H+ 6 7. KS = (8-16) c 0 − c H+ Diese Gleichung bildet die Grundlage der Berechnung der Wasserstoffionenkonzentration und damit des pH-Wertes von Lösungen schwacher Säuren. Für den Fall, dass c0 c(H+ ) ist, wovon bei nicht zu verdünnten Lösungen der schwachen Säure ausgegangen werden kann, vereinfacht sich (8-16) zu folgender Näherungsbeziehung: 6 7 c 2 H+ . (8-17) KS = c0 Beispiel: Der pH-Wert einer wässrigen Essigsäurelösung der Konzentration c0 = 0,057 mol/l ist zu berechnen (25 ◦ C). Mit KS = 1,75 · 10−5 mol/l erhält man mit obiger Näherungsgleichung c(H+ ) = 10−3 mol/l und pH = 3.
Zur Ermittlung des pH-Wertes der wässrigen Lösung einer schwachen Base können die folgenden Bestimmungsgleichungen herangezogen werden (Gleichgewichtsreaktion 6 7 6 7 BOH B+ aq + OH− aq ) : 6 7 6 7 c B+ · c OH− KB = , c (BOH) KW = c(H+ ) · c(OH− ) und c(B+ ) = c(OH− ) . Auch hier kann bei nicht zu verdünnten Lösungen die Konzentration der undissoziierten Base, c(BOH), gleich der analytischen oder Gesamtkonzentration c0 gesetzt werden. Unter dieser Bedingung folgt: 8 2 KW 6 +7 c H = . KB · c0 8.7.6 pH-Wert von Salzlösungen (Hydrolyse)
Nach Arrhenius werden Salze durch Neutralisation einer Säure mit einer Base gebildet (vgl. 8.7.1). Dabei können nun die Säure und/oder die Base stark oder schwach sein. Ist bei der Salzbildung eine schwache Säure und/oder Base beteiligt, so muss sich in der Lösung das Dissoziationsgleichgewicht dieser Verbindung mit dem des Wassers überlagern. Als Folge davon reagiert die Lösung nicht mehr neutral, sondern alkalisch oder sauer. Beispiele: 1. Salz aus schwacher Säure und starker Base. (Wässrige Lösung reagiert alkalisch.) Natriumacetat NaCH3 COO ist ein Beispiel für ein derartiges Salz. In wässriger Lösung reagiert das Acetation (CH3 COO− ) als Salz der schwachen Essigsäure teilweise mit den Ionen des Wassers unter Bildung undissoziierter Essigsäure. Dadurch bildet sich ein Überschuss an Hydroxidionen, die Lösung reagiert alkalisch: CH3 COO− + Na+ + H2 O CH3 COOH + Na+ + OH− (aq) 2. Salz aus starker Säure und schwacher Base. (Wässrige Lösung reagiert sauer.) Ammoniumchlorid (NH4 Cl) ist ein Salz, das derartig aufgebaut ist. In wässriger Lösung dissoziiert es in Ammonium- und Chloridionen. Die Ammoniumio-
8 Stoffe und Reaktionen in Lösung
nen reagieren mit den Hydroxidionen des Wassers teilweise unter Bildung von undissoziiertem Ammoniumhydroxid (NH4 OH). Dadurch entsteht ein Überschuss an Wasserstoffionen und die wässrige Lösung dieses Salzes reagiert sauer: 6 7 NH+4 + Cl− + H2 O NH4 OH + Cl− + H+ aq . 3. Salz aus starker Säure und starker Base. (Beispiel NaCl, wässrige Lösung reagiert neutral.) 4. Salz aus schwacher Säure und schwacher Base. Ein derartiges Salz reagiert abhängig vom Wert der Dissoziationskonstanten der schwachen Säure bzw. Base neutral, alkalisch oder sauer. Ammoniumacetat (NH4 CH3 COO) ist ein Beispiel für diesen Salztyp. Da in diesem Falle die Dissoziationskonstanten der Essigsäure und des Ammoniumhydroxids praktisch gleich groß sind (vgl. 8.7.2), reagiert die wässrige Lösung dieses Salzes neutral. 8.7.7 Löslichkeitsprodukt
Wir betrachten die Lösung eines (schwerlöslichen) Elektrolyten in Wasser. Die Lösung sei bei konstanter Temperatur und bei konstantem Druck mit der festen Phase des Elektrolyten, dem Bodenkörper, im Gleichgewicht. Unter diesen Bedingungen spricht man von einer gesättigten Lösung. Für einen Elektrolyten des Formeltyps AB (Beispiel Silberchlorid AgCl) kann dieser Vorgang durch die folgende Umsatzgleichung beschrieben werden: AgCl(s) Ag+ (aq) + Cl− (aq) . Wendet man auf das vorstehende heterogene Gleichgewicht das Massenwirkungsgesetz an, so erhält man: c(Ag+ ) · c(Cl− ) = K = L . Die Massenwirkungskonstante heißt in diesem Fall Löslichkeitsprodukt. In der Tabelle 8-3 sind die Löslichkeitsprodukte einiger Elektrolyte (in Wasser) bei 20 ◦ C und 1 bar aufgeführt. Aus dem Wert des Löslichkeitsprodukts lässt sich die Sättigungskonzentration (oder die Löslichkeit) cS einer Verbindung berechnen. Bei Elektrolyten des Formeltyps AB erhält man für den Zusammenhang zwischen cS und dem Löslichkeitsprodukt die folgende Beziehung (Beispiel Silberchlorid): √ cS = c(Ag+ ) = c(Cl− ) = c(AgCl) = L .
Tabelle 8-3. Löslichkeitsprodukte schwerlöslicher Elektrolyte bei 20 ◦ C und 1 bar (Lösungsmittel Wasser)
Elektrolyt
a
L
AgCl
1,8 · 10−10 mol2 /l2
AgBr
5,4 · 10−13 mol2 /l2
AgI
8,5 · 10−17 mol2 /l2
BaSO4
1,7 · 10−10 mol2 /l2
PbSO4
2,3 · 10−8 mol2 /l2
Hg2 Cla2
1,4 · 10−18 mol3 /l3
PbCl2
1,7 · 10−5 mol3 /l3
Mg(OH)2
5,6 · 10−12 mol3 /l3
Das Löslichkeitsgleichgewicht von Quecksilber (I)- Chlorid wird durch folgende Umsatzgleichung beschrieben: 6 7 −6 7 Hg2 Cl2 (s) Hg2+ 2 aq + 2 Cl aq .
In der vorstehenden Gleichung ist c(AgCl) die Konzentration des Silberchlorids. Der Begriff Silberchlorid ist hierbei formal stöchiometrisch zu verstehen. Die Tatsache, dass Silberchlorid – wie auch fast alle anderen Salze bei hinreichend kleinen Konzentrationen – vollständig dissoziiert ist, wird hierbei nicht berücksichtigt. Analoge Überlegungen gelten für den Begriff Sättigungskonzentration. Beispiel: Fügt man zu einer Silberchlorid-Lösung, die sich im Gleichgewicht mit dem Bodenkörper befindet, eine Lösung, die Cl− -Ionen enthält (z. B. in Form einer Kochsalzlösung), so stellt man eine Verringerung der Konzentration der Ag+ -Ionen fest, da auch in diesem Fall das Produkt der Ionenkonzentrationen von Ag+ und Cl− gleich dem Löslichkeitsprodukt sein muss. Es kommt also zu einer Ausscheidung von festem Silberchlorid aus der Lösung. Aus diesem Grunde sollte die Ausfällung eines schwerlöslichen Salzes zu Zwecken der quantitativen Analyse (vgl. 4.7.1) mit einem Überschuss des Fällungsmittels geschehen. Übersättigte Lösungen
In Abwesenheit des festen Bodenkörpers sind auch Konzentrationen des Elektrolyten möglich, die größer als die Sättigungskonzentration sind: c > cS (übersättigte Lösung) . Auch in diesem Falle kann das System zeitlich unbegrenzt als übersättigte Lösung vorliegen, ohne dass ei-
C57
C58
C Chemie
ne neue Phase, der feste Bodenkörper, gebildet wird. Werden jedoch zu der flüssigen Phase Keime des Bodenkörpers hinzugefügt, oder entstehen diese spontan, so wachsen die Keime auf Kosten der Konzentration der gelösten Substanz, bis die momentane Konzentration den für den jeweiligen Druck und die jeweilige Temperatur charakteristischen Wert der Sättigungskonzentration erreicht hat. Übersättigte Lösungen sind metastabil (vgl. 6.3.5).
8.8 Härte des Wassers Natürlich vorkommendes Wasser ist im chemischen Sinne niemals rein, sondern enthält verschiedene Verunreinigungen. Zu diesen gehören in erster Linie gelöste Gase (Kohlendioxid, Stickstoff, Sauerstoff) und Salze. Besonders wichtig für die Qualität von technisch nutzbarem Wasser ist sein Gehalt an Erdalkalimetallsalzen. Nutzwasser, das einen geringen bzw. hohen Gehalt dieser Salze aufweist, wird als weich bzw. hart bezeichnet. Nach dem Verhalten der gelösten Erdalkalimetallsalze beim Kochen unterscheidet man zwei Arten der Härte des Wassers: 1. temporäre (vorübergehende) Härte und 2. permanente (bleibende) Härte. Die temporäre Härte, die durch die Hydrogenkarbonate des Calciums und des Magnesiums hervorgerufen wird, kann durch Kochen beseitigt werden. Dabei bildet sich unlösliches Erdalkalimetallcarbonat, z. B.: Ca2+ + 2 HCO−3 → CaCO3 (s) + CO2 (g) + H2 O . Im Gegensatz dazu wird die permanente Härte, die durch einen hohen Gehalt an Erdalkalimetallsulfaten und Chloriden verursacht wird, durch Kochen nicht beseitigt. Die Härte des Wassers kann sich in der Technik vor allem durch Bildung von Kesselstein negativ auswirken.
9 Redoxreaktionen 9.1 Oxidationszahl Eine zur Beschreibung von Redoxvorgängen nützliche, wenn auch künstlich konstruierte Größe ist die
Oxidationszahl. Man versteht darunter diejenige Ladungszahl, die ein Atom in einem Molekül aufweisen würde, das nur aus Ionen aufgebaut wäre. Die Oxidationszahl ist eine positive oder negative Zahl. Die Oxidationszahl wird nach folgenden Regeln ermittelt: 1. Ein chemisches Element hat die Oxidationszahl null. 2. Für ein einatomiges Ion ist die Oxidationszahl gleich dessen (vorzeichenbehafteter) Ladungszahl. 3. Für eine kovalente Verbindung ist die Oxidationszahl gleich der Ladungszahl, die ein Atom erhält, wenn die bindenden Elektronenpaare vollständig dem elektronegativeren Atom zugeordnet werden. Bei gleichen Atomen werden die Elektronenpaare zwischen diesen aufgeteilt. Die Oxidationszahl wird in Formeln als römische Zahl rechts oben neben das betreffende Elementsymbol gesetzt. Nur negative Vorzeichen werden geschrieben und vor die römischen Ziffern gesetzt. Beispiele: Elemente: O2 , N2 , Cl2 , H2 , S8 . Die Oxidationszahl der Elementmoleküle ist null. Einatomige Ionen: Na+ , Cl− , Fe3+ , Sn4+ . Die Oxidationszahlen dieser Ionen sind I, – I, III, IV. Moleküle: Ammoniak N−III H3 , H2 O−II , Wasserstoff−II −II peroxid H2 O−I 2 , Methanol HO −C H3 , Formalde−II hyd HC°HO (Oxidationszahl des Wasserstoffs in diesen Verbindungen: I). Molekülionen: Permanganation Mn−VII O−4 , Sulfation III − V − SVI O2− 4 , Nitrition N O2 , Nitration N O3 (Oxidationszahl des Sauerstoffs in diesen Verbindungen: -II).
9.2 Oxidation und Reduktion, Redoxreaktionen Die Abgabe von einen oder mehreren Elektronen aus einem Atom, Molekül oder Ion wird als Oxidation bezeichnet. Bei diesem Vorgang wird die Oxidationszahl erhöht. (Ursprüngliche Definition: Oxidation ist die Aufnahme von Sauerstoff.) Oxidationsvorgänge: Zn
→ Zn2+ + 2 e−
9 Redoxreaktionen
→ Fe3+ + e−
Fe2+ NO−2 − Cl
NO−3
+
+ H2 O → +2H +2e → 1/2 Cl2 + e− .
−
Als Reduktion definiert man die Aufnahme von einem oder mehreren Elektronen durch ein Atom, Molekül oder Ion. Hierbei wird die Oxidationszahl erniedrigt. (Ursprüngliche, historische Definition: Reduktion ist die Abgabe von Sauerstoff.) Cu2+ + 2 e−
→ Cu
Fe3+ + e−
→ Fe2+
H +e MnO−4
−
→ 1/2 H2 +
(I)
Zn
→ Zn2+ + 2 e−
(II) Cu2+ + 2 e− → Cu Zn + Cu2+ → Zn2+ + Cu (Bei dieser Summation muss – wie erwähnt – die Zahl der abgegebenen Elektronen gleich der der aufgenommenen sein.) Berücksichtigt man zusätzlich die Sulfationen, so erhält man schließlich: CuSO4 + Zn → ZnSO4 + Cu .
Reduktionsvorgänge:
+
Die Summation beider Teilreaktionen ergibt die Redoxreaktion:
−
+ 8 H + 5 e → Mn2+ + 4 H2 O .
Freie Elektronen sind in chemischen Systemen i. Allg. nicht beständig. Daher müssen die Elektronen, die von einer Substanz (z. B. Zn, Fe2+ , NO) abgegeben werden, von einem anderen Stoff (z. B. Cu2+ , Fe3+ , H+ , MnO−4 ) aufgenommen werden. Oxidation und Reduktion können also nie allein, sondern müssen stets gekoppelt als Redoxreaktion ablaufen.
– Kaliumchlorid KCl wird in saurer Lösung (Zusatz von verdünnter Schwefelsäure H2 SO4 ) durch Kaliumpermanganat KMnO4 oxidiert. Das Permanganation wird dabei zu Mn2+ reduziert: Oxidation ×5 2 Cl− → Cl2 + 2 e− Reduktion ×2 MnO−4 + 8 H+ + 5 e− → Mn2+ + 4 H2 O Summe 10 Cl− +2 MnO−4 +16 H+ → 5 Cl2 +2 Mn2+ +8 H2 O Berücksichtigt man die Begleitionen, so erhält man: 10 KCl + 2 KMnO4 + 8 H2 SO4 → 5 Cl2 + 2 MnSO4 + 8 H2 O .
Substanzen, die andere Stoffe oxidieren können, d. h. mehr oder weniger leicht Elektronen aufnehmen können, werden Oxidationsmittel genannt (Cu+ , Fe+ , H+ , MnO−4 ). Reduktionsmittel sind dagegen Substanzen, die Elektronen abgeben können (Zn, Fe2+ , metallisches Na und K).
Derartige Gleichungen geben selbstverständlich nur die stöchiometrischen Verhältnisse wieder. Sie gestatten keinesfalls Rückschlüsse auf den wirklichen Ablauf der Reaktion.
Beispiele:
9.3.1 Verbrennungsvorgänge
– Metallisches Zink reagiert in wässriger Lösung mit Kupfersulfat CuSO4 unter Bildung von Zinksulfat ZnSO4 und metallischem Kupfer:
Als Verbrennung (im engeren Sinn) wird die in der Regel stark exotherme Reaktion von Substanzen, wie z. B. von Kohlenstoff, Kohlenwasserstoffen, Wasserstoff oder Metallen, mit Sauerstoff bezeichnet. Der Sauerstoff kann hierbei in reiner Form oder als Bestandteil von Gasmischungen (z. B. Luft) vorliegen. Sämtliche Verbrennungsvorgänge sind Redoxreaktionen. Der molekulare Sauerstoff wird hierbei von der Oxidationsstufe 0 in die Oxidationsstufe−II überführt, wird also reduziert. Der Brennstoff wird oxidiert. Beispiele für Verbrennungsvorgänge:
CuSO4 + Zn → ZnSO4 + Cu . In einer Teilreaktion (I) wird hierbei Zn zu Zn2+ oxidiert: (I) Oxidation: Zn → Zn2+ + 2 e− , während in einer Teilreaktion (II) die Cu2+ -Ionen zu metallischem Kupfer reduziert werden: (II) Reduktion: Cu2+ + 2 e− → Cu.
9.3 Beispiele für Redoxreaktionen
C59
C60
C Chemie
– Kohlenstoffverbrennung C + O2 → CO2 , C + 1/2 O2 → CO . Die vollständige Verbrennung des Kohlenstoffs führt bis zum Kohlendioxid CO2 . Bei unvollständiger Verbrennung entsteht neben CO2 auch das giftige Kohlenmonoxid CO. – Verbrennung von Kohlenwasserstoffen (Beispiel Benzol) C6 H6 + 15/2 O2 → 6 CO2 + 3 H2 O . Die Reaktionsprodukte bei vollständiger Verbrennung von Kohlenwasserstoffen sind CO2 und Wasser. Bei unvollständiger Verbrennung werden zusätzlich Kohlenmonoxid und teilweise auch Ruß gebildet. Ruß ist eine grafitische Form des Kohlenstoffs, die wechselnde Mengen an Wasserstoff und Sauerstoff enthält. – Verbrennung von Schwefel S + O2 → SO2 . Schwefel – auch wenn er in organischen Molekülen gebunden ist oder als Sulfid (vgl. Tabelle 8-2) vorliegt – liefert bei der Verbrennung Schwefeldioxid SO2 . SO2 ist neben den Stickoxiden (siehe 10.7.1), Kohlenmonoxid und Kohlenwasserstoffen einer der giftigen Bestandteile des sog. Smog. SO2 entsteht bei der Verbrennung fossiler Brennstoffe, da diese, mit Ausnahme von Erdgas, stets mehr oder weniger große Mengen Schwefel enthalten. In der Atmosphäre wird SO2 langsam zu Schwefeltrioxid SO3 oxidiert. SO3 reagiert mit Wasser unter Bildung von Schwefelsäure H2 SO4 (vgl. 8-2). Daher ist Schwefeldioxid der Hauptverursacher des umweltschädlichen sauren Regens. Wird anstelle von reinem Sauerstoff Luft verwendet, so entstehen bei der Verbrennung stets auch Stickoxide (Stickstoffmonoxid NO und Stickstoffdioxid NO2 ), da diese bereits bei der Erwärmung von Stickstoff-Sauerstoff-Gasmischungen auf die Flammentemperatur gebildet werden (vgl. 6.4.7). Stickoxide sind Smogbestandteile und für viele Umweltschäden mitverantwortlich.
9.3.2 Auflösen von Metallen in Säuren
Unedle Metalle können sich in wässrigen Lösungen von Säuren (teilweise auch in reinem Wasser und in wässrigen Lösungen von Basen) auflösen. Diese Reaktionen sind ebenfalls Redoxvorgänge. Als Beispiel wird die Auflösung von Aluminium in Salzsäure (wässrige Lösung von Chlorwasserstoff HCl) als Redoxvorgang formuliert: → Al3+ + 3 e−
Al +
−
2 H + 2 e → H2 (g) +
2 Al + 6 H → 2 Al
3+
×2 ×3
+ 3 H2 (g)
Berücksichtigt man die Anionen, so erhält man: 2 Al + 6 HCl → 2 AlCl3 + 3 H2 (g) 9.3.3 Darstellung von Metallen durch Reduktion von Metalloxiden
Als Reduktionsmittel werden unedle Metalle, Wasserstoff und Koks verwendet. Auf diese Weise wird z. B. Roheisen durch Reduktion oxidischer Eisenerze mit Koks im Hochofen dargestellt (Hochofenprozess), vgl. D 3.1. Die Reduktion der Eisenoxide erfolgt bei diesem Verfahren im Wesentlichen durch Kohlenmonoxid (CO): 3 Fe2 O3 + CO → 2 Fe3 O4 + CO2 Fe3 O4 + CO → 3 FeO + CO2 FeO + CO → Fe + CO2 . Das für die Reduktion der Eisenoxide notwendige CO bildet sich durch Reaktion von Kohlendioxid mit Kohlenstoff nach folgender Gleichung: CO2 + C(s) → 2 CO(g) .
9.4 Redoxreaktionen in elektrochemischen Zellen Als Beispiel einer elektrochemischen Zelle sei das Daniell-Element angeführt (vgl. Bild 9-1). In dieser Zelle taucht ein Kupferstab in eine Kupfersulfatlösung und ein Zinkstab in eine Zinksulfatlösung. Beide Lösungen sind durch ein Diaphragma D (poröse Wand) an der Vermischung weitgehend gehindert. Die Redoxvorgänge finden hier an den beiden
9 Redoxreaktionen
Bild 9-1. Schematischer Aufbau des Daniell-Elementes. D Diaphragma
Phasengrenzflächen Zn/Zn2+ und Cu/Cu2+ statt. Die chemische Reaktion wird durch folgende Umsatzgleichung beschrieben (vgl. 9.2): Zn + CuSO4 → ZnSO4 + Cu . Sie kann jedoch nur stattfinden, wenn die vom Zink abgegebenen Elektronen durch einen metallischen Leiter zum Kupfer befördert werden, um dort die Cu2+ -Ionen zu entladen (zu reduzieren). Ursache, dass sich zwischen der Cu- und Zn-Elektrode eine Spannung aufbaut, die den erwähnten Elektronenstrom treibt, ist der negative Wert der Freien Reaktionsenthalpie Δr G (vgl. 6.3.4). Die bei Stromlosigkeit an einer elektrochemischen Zelle gemessene Leerlaufspannung heißt auch elektromotorische Kraft (EMK). Quantitativ gilt folgender Zusammenhang zwischen der Freien Reaktionsenthalpie und der EMK E: Δr G = −n∗ FE ,
(9-1)
n∗ Anzahl der in der jeweiligen Umsatzgleichung enthaltenen Elektronen. Beispiel: Zn + CuSO4 → Cu + ZnSO4 :
n∗ = 2 ;
F = NA e = 96 485,34 C/mol Faraday-Konstante, NA Avogadro-Konstante, e Elementarladung.
9.5 Elektrodenpotenziale, elektrochemische Spannungsreihe Potenziale von Einzelelektroden (Halbzellen) kann man nicht direkt messen, doch ist ein paarweiser
Vergleich der verschiedenen Elektrodenpotenziale anhand der Potenzialdifferenzen, d. h. der Spannungen zwischen den Elektroden möglich. Für einen solchen Vergleich ist die Festlegung einer Bezugselektrode erforderlich. Als Bezugselektrode wird die Standardwasserstoffelektrode verwendet. Diese Elektrode besteht aus einem Platinblech, das von gasförmigem Wasserstoff (p(H2 ) = 101 325 Pa) bei einer Temperatur von 25 ◦ C umspült wird und das in eine Lösung der Wasserstoffionenkonzentration c(H+ ) = 1 mol/l taucht. Elektrodenreaktion: 1/2 H2 H+ + e− . Schaltet man eine Standardwasserstoffelektrode mit einer beliebigen Halbzelle zusammen, so wird die bei Stromlosigkeit gemessene Spannung als Elektrodenpotenzial der Halbzelle oder als Halbzellenpotenzial bezeichnet. Die unter Standardbedingungen (T = 25 ◦ C, p = 101 325 Pa, sämtliche Konzentrationen ci = 1 mol/l) gemessene Spannung heißt Standardelektrodenpotenzial (Standardhalbzellenpotenzial). Dem Standardelektronenpotenzial der Wasserstoffelektrode hat man durch Vereinbarung den Wert null zugeordnet. Die Potenziale der Elektroden haben ein negatives Vorzeichen, wenn sie bei Stromfluss der Standardwasserstoffelektrode Elektronen abgeben, wenn also an diesen Elektroden Oxidationsvorgänge stattfinden. Finden unter den genannten Bedingungen an den Halbzellen Reduktionsvorgänge statt, so wird dem Potenzial dieser Elektroden ein positives Vorzeichen zugeordnet. Zur besseren Übersicht werden die den verschiedenen Elektroden (Halbzellen) zugeordneten Elektrodenreaktionen nach dem Zahlenwert der Halbzellenstandardpotenziale geordnet. Man erhält auf diese Weise die elektrochemische Spannungsreihe (siehe Tabelle 9-1). Je kleiner (negativer) das Standardelektrodenpotenzial ist, umso stärker wirkt ein Redoxpaar als Reduktionsmittel und umso leichter wird es selbst oxidiert. Starke Oxidationsmittel müssen dagegen möglichst große Werte des Standardelektrodenpotenzials aufweisen. 9.5.1 Definition von Anode und Kathode
In der Elektrochemie werden die Bezeichnungen Anode und Kathode in Zusammenhang mit den Begriffen Oxidation und Reduktion verwendet. An der An-
C61
C62
C Chemie
Tabelle 9-1. Standardelektrodenpotenziale ϕ0 (wässrige Lösungen, 25 ◦ C)
Kurzbezeichnung der Elektrode K/K+ Ca/Ca2+ Na/Na+ Mg/Mg2+ Al/Al3+ Mn/Mn2+ Zn/Zn2+ Cr/Cr3+ Fe/Fe2+ Pb/Pb2+ Pt/H2 /H+ Pt/Cu+ , Cu2+ Cu/Cu2+ Pt/O2 /OH− Pt/I2 /I− Pt/Fe2+ , Fe3+ Ag/Ag+ Pt/Cl2 /Cl− Pt/Mn2+ , MnO−4 Pt/F2 /F−
Elektrodenreaktion
ϕ0 in V
K+ Ca2+ Na+ Mg2+ Al3+ Mn2+ Zn2+ Cr3+ Fe2+ Pb2+ 2 H+ Cu2+ Cu2+ O2 (g) + 2 H2 O I2 Fe3+ Ag+ Cl2 (g) MnO−4 + 8 H+ F2 (g)
−2,931 −2,868 −2,71 −2,372 −1,662 −1,185 −0,7618 −0,744 −0,447 −0,1262 0 +0,153 +0,3419 +0,401 +0,5355 +0,771 +0,7996 +1,3583 +1,507 +2,866
+ e− K + 2 e− Ca + e− Na + 2 e− Mg + 3 e− Al + 2 e− Mn + 2 e− Zn + 3 e− Cr + 2 e− Fe + 2 e− Pb + e− H2 (g) + e− Cu + + 2 e− Cu + 4 e− 4 OH− + 2 e− 2 I− + e− Fe2+ + e− Ag + 2 e− 2 Cl− + 5 e− Mn2+ + 4H2 O + 2 e− 2 F−
ode werden Stoffe oxidiert, an der Kathode reduziert. Bei galvanischen Zellen ist die Elektrode mit dem niedrigeren Potenzial die Anode. 9.5.2 Konzentrations- bzw. Partialdruckabhängigkeit des Elektrodenpotenzials einer Halbzelle
Das Elektrodenpotenzial einer Halbzelle ist von der Konzentration bzw. vom Partialdruck der an der Elektrodenreaktion beteiligten Stoffe abhängig. Diese Abhängigkeit wird durch die Nernst’sche Gleichung beschrieben. Für die Elektrodenreaktion aR1 + bR2 xO1 + yO2 + ze− gilt: ϕ = ϕ0 +
x (O
y (O
RT c 1) c 2) zF ca (R1 ) cb (R2 )
(9-2)
Sind an der Elektrodenreaktion Gase beteiligt, so wird ihr Gehalt in der Nernst’schen Gleichung durch Angabe der Partialdrücke berücksichtigt. Reine kondensierte Phasen und Stoffe, deren Konzentration beim Ablauf der Elektrodenreaktion praktisch
unverändert bleibt, werden in der Nernst’schen Gleichung nicht berücksichtigt. Beispiele für die Formulierung der Nernst’schen Gleichung: 1. Elektrodenreaktion: Zn Zn2+ + 2 e− Nernst’sche Gleichung: ϕ = ϕ0 +
RT ln c Zn2+ 2F
2. Elektrodenreaktion: 6 7 H2 g 2 H+ + 2 e − Nernst’sche Gleichung:
6 7 c H+ RT ln ϕ= . F p (H2 )
Hinweis: Das Standardpotenzial der Wasserstoffelektrode ist definitionsgemäß null. In reinem Wasser (c(H+ ) = 10−7 mol/l) nimmt das Halbzellenpotenzial bei einem Wasserstoffpartialdruck von p(H2 ) = 1 bar den Wert ϕ = −0,41 V an.
9 Redoxreaktionen
9.6 Elektrochemische Korrosion
9.5.3 Berechnung der EMK elektrochemischer Zellen aus Elektrodenpotenzialen
Die Berechnung der EMK galvanischer Ketten aus den Elektrodenpotenzialen erfolgt derart, dass man das Potenzial der Anode (ϕA ), also der Elektrode, an der eine Oxidation stattfindet, von dem Potenzial der Kathode (ϕK ) subtrahiert: E = ϕK − ϕA .
(9-3)
Beispiel: Daniell-Element Bei Stromfluss findet an der Kupferelektrode eine Reduktion der Kupferionen zu metallischem Kupfer und an der Zinkelektrode eine Oxidation des Zinks zu Zn2+ -Ionen statt. Die Kupferelektrode ist in diesem Fall Kathode und die Zinkelektrode Anode, da ϕ0Cu > ϕ0Zn . Mit den aus Tabelle 9-1 entnommenen Werten der Elektrodenpotenziale folgt für die EMK: E 0 = ϕ0K − ϕ0A = 0,3419 V − (−0,7613 V) . = 1,1032 V . 9.5.4 Edle und unedle Metalle
Je größer die Tendenz von Metallionen ist, aus dem Metallzustand in den hydratisierten Zustand überzugehen, umso kleiner sind die Standardelektrodenpotenziale. Unedle Metalle haben Standardpotenziale, die kleiner als null sind. Entsprechend gilt für edle Metalle, dass ihr Standardpotenzial größer als null ist. Im Gegensatz zu edlen Metallen lösen sich unedle Metalle in Säuren (Wasserstoffionenkonzentration 1 mol/l) auf, wenn sich das chemische Gleichgewicht ungehemmt einstellen kann. Dagegen können sich im reinem Wasser nur solche Metalle lösen, deren Halbzellenpotenzial kleiner als −0,41 V ist (vgl. 9.5.2, Beispiel 2). Einige Metalle, z. B. Aluminium und Zink, werden in reinem Wasser nicht gelöst, obwohl die Halbzellenpotenziale kleiner als −0,41 V sind. Man bezeichnet diese Eigenschaft als Passivität. Ihre Ursache liegt in der Ausbildung unlöslicher, fest haftender Metalloxidschichten auf der Metalloberfläche, die das Metall vor weiterem Angriff der Wasserstoffionen schützen. In stark sauren und in stark alkalischen Lösungen sind diese Schichten löslich, sodass diese Metalle unter diesen Bedingungen von Wasserstoffionen angegriffen werden.
Die elektrochemische Korrosion von Metallen besteht in einer von der Oberfläche ausgehenden Zerstörung des Metallgefüges. Sie beruht auf einer Oxidation des Metalls. Notwendig ist hierbei die Anwesenheit eines zweiten, edleren Metalls, dessen Standardpotenzial also höher ist als das des korrodierenden Metalls. Die elektrochemische Korrosion findet an der Anode einer elektrochemischen Korrosionszelle (eines Korrosionselementes bzw. Lokalelementes) statt und kann nur in Gegenwart eines Elektrolyten (z. B. eines Feuchtigkeitsfilmes) erfolgen. Ein Korrosionselement ist also nichts anderes als eine kurzgeschlossene elektrochemische Zelle, vgl. D 10.4.
9.7 Erzeugung von elektrischem Strom durch Redoxreaktionen Prinzipiell kann jede elektrochemische Zelle als Spannungsquelle dienen. Handelsübliche elektrochemische Zellen, die zur Stromerzeugung Verwendung finden, werden auch als galvanische Elemente bezeichnet. Kann die freiwillig ablaufende Zellreaktion durch Elektrolyse (vgl. 9.8) vollständig rückgängig gemacht werden, so spricht man von Sekundärelementen oder von Akkumulatoren. Im anderen Falle liegen Primärelemente vor. Primärelemente
Das älteste technisch wichtige Primärelement ist das Leclanché-Element, das folgendermaßen aufgebaut ist: In einem Zinkbecher, der gleichzeitig als Anode dient, befindet sich eine wässrige ammoniumchloridhaltige Elektrolytpaste. Als Gegenelektrode dient ein Graphitstab, der von Mangandioxid (Braunstein) MnO2 umgeben ist. Diesem sog. Trockenelement liegt folgende Zellreaktion zugrunde: Zn + 2 MnO2 + 2 H+ → Zn2+ + Mn2 O3 + H2 O . Sekundärelemente
Im Bleiakkumulator wird folgende chemische Reaktion ausgenutzt: Entladung
PbO2(s)+Pb(s)+2 H2 SO4
Ladung
PbSO4(s)+2 H2 O .
C63
C64
C Chemie
Im Nickel-Cadmium-Akkumulator läuft folgende Reaktion ab: Entladung
Cd(s)+2 NiOOH(s)+2 H2 O
Ladung
2 Cd (OH)2 (s) +2 Ni (OH)2 .
Elektrolyten geflossenen Elektrizitätsmenge Q direkt und der Ladungszahl z der Ionen umgekehrt proportional: m M·Q Q = oder m = , (9-4) n= z·F M z·F F Faraday-Konstante, M molare Masse, m Masse.
Brennstoffzellen
In Brennstoffzellen werden die Reaktionspartner für die Redoxreaktion kontinuierlich zugeführt und die Reaktionsprodukte fortwährend entfernt. Für Spezialanwendungen (Raumfahrt, U-Boote) hat sich die Wasserstoff-Sauerstoff-Zelle, die auch als Knallgaselement bezeichnet wird, bewährt. Als Elektrolytlösungen kommen sowohl Laugen als auch Säuren in Betracht. Platin, Nickel und Graphit werden hauptsächlich (auch in Kombination) als Elektrodenmaterial eingesetzt. In dieser Zelle laufen die folgenden Reaktionen ab: (Anodenreaktion) H2 → 2 H+ + 2 e − − − 1/2 O2 + H2 O + 2 e → 2 OH (Kathodenreaktion) H2 + 1/2 O2 → 2 H2 O
(Zellreaktion)
9.8 Elektrolyse, Faraday-Gesetz Galvanische Zellen ermöglichen durch den Übergang von Elektronen den freiwilligen Ablauf der Zellreaktion. Solange sich das System noch nicht im thermodynamischen Gleichgewicht befindet, gilt für die Zellreaktion Δr G < 0. Die Spannung zwischen den Elektroden verschwindet und der Stromfluss endet, wenn durch die Konzentrationsänderungen der Reaktionsteilnehmer Δr G = 0 wird (thermodynamisches Gleichgewicht) oder wenn einer der Reaktionsteilnehmer vollständig verbraucht ist. Durch Anlegen einer äußeren Spannung und Zufuhr elektrischer Arbeit kann ein Elektronenstrom in umgekehrter Richtung erzwungen werden. In diesem Fall finden Redoxreaktionen statt, bei denen Δr G > 0 ist. Einen derartigen Vorgang nennt man Elektrolyse. So ist es z. B. beim Daniell-Element durch Anlegen einer Spannung von mehr als 1,1 V möglich, Zink abzuscheiden und Kupfer aufzulösen. Faraday-Gesetz
Die Stoffmenge n der an den Elektroden bei einer Elektrolyse umgesetzten Stoffe ist der durch den
9.8.1 Technische Anwendungen elektrolytischer Vorgänge Darstellung unedler Metalle
Unedle Metalle, wie z. B. Aluminium, Magnesium und die Alkalimetalle, können durch Elektrolyse wasserfreier geschmolzener Salze (Schmelzflusselektrolyse) dargestellt werden. In diesen Salzen müssen die erwähnten Metalle als Kationen enthalten sein. Bei der Gewinnung von Aluminium geht man von Aluminiumoxid Al2 O3 aus. Da dessen Schmelzpunkt sehr hoch liegt (2045 ◦ C) elektrolysiert man eine Lösung von Al2 O3 in geschmolzenem Kryolith Na3 AlF6 bei ca. 950 ◦ C. Die an den Elektroden stattfindenden Prozesse können schematisch durch die folgenden Gleichungen beschrieben werden: 2 Al3+ + 6 e− → 2 Al 3O
2−
→ 3/2 O2 + 6 e
(Kathodenreaktion) −
(Anodenreaktion)
Al2 O3 → 2 Al + 3/2 O2 Die Dichte der Salzschmelze ist bei der Temperatur, bei der die Elektrolyse durchgeführt wird, kleiner als die des flüssigen Aluminiums. Daher kann sich das flüssige Metall am Boden des Reaktionsgefäßes ansammeln und wird so vor der Oxidation durch den Luftsauerstoff geschützt. Reinigung von Metallen (elektrolytische Raffination)
Dieses Verfahren wird z. B. zur Gewinnung von reinem Kupfer (Cu-Massenanteil 99,95%) und von reinem Gold eingesetzt. Zur Reindarstellung von Kupfer werden eine Rohkupferanode und eine Reinkupferkathode verwendet. Als Elektrolyt dient eine schwefelsaure (H2 SO4 enthaltende) Kupfersulfatlösung. Bei Stromfluss wird metallisches Kupfer an der Anode zu Cu2+ -Ionen oxidiert (Cu → Cu2+ + 2 e− ). Die unedlen Verunreinigungen des Rohkupfers (wie Eisen,
10 Die Elementgruppen
Nickel, Kobalt, Zink) gehen ebenfalls in Lösung, die edlen Bestandteile (Silber, Gold, Platin) bleiben als Anodenschlamm ungelöst zurück. An der Kathode wird praktisch nur das Kupfer wieder abgeschieden, während die unedlen Begleitelemente in Lösung bleiben und sich dort allmählich anreichern. Anodische Oxidation von Aluminium (Eloxal-Verfahren)
Beim Lagern von Aluminium an der Luft überzieht sich die Oberfläche des Metalls mit einer dünnen, festhaftenden Oxidschicht. Sie schützt das Aluminium vor weiterer Korrosion durch atmosphärische Einflüsse. Durch anodische Oxidation lässt sich die Dicke der Oxidschicht und damit die Schutzwirkung ganz erheblich verstärken (Dicke ca. 0,02 mm). Chloralkali-Elektrolyse
Dieses Verfahren dient zur Darstellung von Chlor und Natronlauge durch Elektrolyse einer wässrigen Natriumchloridlösung. Der Gesamtvorgang kann durch folgende Umsatzgleichung beschrieben werden: 2 H2 O + 2 NaCl → H2 + 2 NaOH + Cl2 . Bei diesem Verfahren muss verhindert werden, dass die im Kathodenraum entstehenden Hydroxidionen zum Anodenraum gelangen, da sonst das Chlor mit der Lauge unter Bildung von Chlorid und Hypochlorit ClO− reagieren würde: Cl2 + 2 OH− → Cl− + ClO− + H2 O . Derartige Redoxvorgänge, bei denen eine Verbindung mittlerer Oxidationszahl gleichzeitig in eine Substanz mit größerer und kleinerer Oxidationszahl übergeht, werden als Disproportionierungen bezeichnet.
10 Die Elementgruppen 10.1 Wasserstoff Elementarer Wasserstoff
Wasserstoff ist ein Mischelement und besteht aus drei Isotopen: 1 H, 2 H und 3 H (Häufigkeiten: 99,985%, 0,015% und 10−5 %). Die Isotope 2 H und 3 H werden auch als Deuterium D und Tritium T bezeichnet. Tri-
tium ist radioaktiv und zerfällt als ß-Strahler in 32 He (Halbwertszeit t1/2 = 12,346 a). Gewinnung: 1. Elektrolyse von Wasser, vgl. 9.8. 2. Reaktion von Säuren mit unedlen Metallen, vgl. 9.5.4, z. B.: Zn + 2 H+ (aq) → Zn2+ + H2 . 3. Umsetzung von Wasserdampf mit glühendem Koks: H2 O(g) + C CO + H2 . Eine Mischung von Kohlenmonoxid CO und Wasserstoff wird als Wassergas bezeichnet. Eigenschaften: Siehe Tabelle 5-2; Elektronegativität χ = 2,1. Wasserstoffverbindungen
Wasserstoffverbindungen heißen auch Hydride. Nach der Art der Bindung unterscheidet man: – Ionische (salzartige) Hydride. Solche Verbindungen bildet Wasserstoff mit den Elementen der I. und II. Hauptgruppe. Sie werden durch das negativ geladene Hydridion H− charakterisiert (Oxidationszahl des Wasserstoffs in diesem Ion:−I). Beispiele: Lithiumhydrid LiH, Calciumhydrid CaH2 . Alkalimetallhydride kristallisieren im NaCl-Gitter, vgl. 5.3.2. Hydridionen reagieren mit Verbindungen, die Wasserstoffionen enthalten, unter Bildung von molekularem Wasserstoff, z. B. 6 7 H− + H2 O → OH− aq + H2 . – Kovalente Hydride. Verbindungen dieses Typs entstehen bei der Reaktion des Wasserstoffs mit den Elementen der III. bis VII. Hauptgruppe. Beispiele: Methan CH4 , Wasser H2 O, Schwefelwasserstoff H2 S. – Metallartige Hydride. Derartige Einlagerungsverbindungen bildet Wasserstoff mit den meisten Übergangsmetallen. Der Wasserstoff besetzt häufig die Oktaeder- und/oder Tetraederlücken in kubisch bzw. hexagonal dichtesten Kugelpackungen, die von den Metallatomen ausgebildet werden (vgl. 5.3.2). Beispiele TiH1,0−2,0 und ZrH1,5−2,0 . – Komplexe Hydride. Hierunter versteht man Wasserstoffverbindungen der Art LiAlH4 (Lithiumaluminiumhydrid), an denen außer Alkalimetallen die Elemente Bor, Aluminium oder Gallium beteiligt sind.
C65
C66
C Chemie
10.2 I. Hauptgruppe: Alkalimetalle Zu den Alkalimetallen gehören die Elemente Lithium Li, Natrium Na, Kalium K, Rubidium Rb, Caesium Cs und Francium Fr. Francium ist radioaktiv und kommt in der Natur nur in sehr geringen Mengen als Zerfallsprodukt des Actiniums vor. Die Elemente der I. Hauptgruppe sind silbrig glänzende, kubisch raumzentriert kristallisierende Metalle (vgl. 5.3.2). Sie sind sehr weich, haben eine geringe Dichte und niedrige Schmelz- und Siedepunkte (vgl. Tabelle 10-1). In der äußeren Schale haben die Alkalimetalle ein ungepaartes s-Elektron, das leicht abgegeben werden kann. Sie sind daher sehr starke Reduktionsmittel. In Verbindungen treten die Elemente der I. Hauptgruppe ausschließlich mit der Oxidationszahl I als einfach positiv geladene Ionen auf. Gewinnung: Schmelzflusselektrolyse (siehe 9.8.1) der Hydroxide bzw. der Chloride. Reaktionen
Die Alkalimetalle sind äußerst reaktionsfähig. Sie reagieren z. B. mit Halogenen, Schwefel und Wasserstoff unter Bildung von Halogeniden (z. B. Natriumchlorid NaCl), Sulfiden (z. B. Natriumsulfid Na2 S) und ionischen Hydriden (siehe 10.1). Die Reaktionsfähigkeit der Alkalimetalle nimmt mit steigender Ordnungszahl zu. Reaktionen mit Sauerstoff : Lithium reagiert mit Sauerstoff unter Bildung von Lithiumoxid Li2 O. Natrium verbrennt an der Luft zu Natriumperoxid Na2 O2 : 2 Na + O2 → Na2 O2 . Die anderen Alkalimetalle reagieren mit Sauerstoff unter Bildung von Hyperoxiden, die durch das O−2 -Ion charakterisiert sind; Beispiel: K + O2 → KO2 .
Reaktionen mit Wasser: Hierbei werden Alkalimetallhydroxide und Wasserstoff gebildet, z. B.: 6 7 2 Na + 2 H2 O → 2 NaOH + H2 g . Die Reaktion nimmt mit steigender Ordnungszahl an Heftigkeit zu. Bei der Reaktion von Kalium mit Wasser entzündet sich der gebildete Wasserstoff an der Luft von selbst. Alkalimetallhydroxide
Wässrige Lösungen der Alkalimetallhydroxide (z. B. Natriumhydroxid NaOH) sind starke Basen (vgl. 8.7.4). Die Basenstärke nimmt mit wachsender Ordnungszahl der Alkalimetalle zu. Für wässrige Lösungen von Natriumhydroxid und Kaliumhydroxid sind die Trivialnamen Natronlauge und Kalilauge üblich.
10.3 II. Hauptgruppe: Erdalkalimetalle Die Elemente Beryllium Be, Magnesium Mg, Calcium Ca, Strontium Sr, Barium Ba und das radioaktive Radium Ra (vgl. Tabelle 10-2) werden als Erdalkalimetalle bezeichnet. Es sind – mit Ausnahme des sehr harten Berylliums – nur mäßig harte Leichtmetalle. Die Erdalkalimetalle haben in der äußersten Schale zwei Elektronen, die leicht abgegeben werden können. Daher sind diese Elemente starke Reduktionsmittel. In ihren Verbindungen treten sie stets mit der Oxidationszahl II auf. Reaktionen
Die Erdalkalimetalle sind i. Allg. sehr reaktionsfreudig. Sie reagieren direkt mit Halogenen, Wasserstoff und Sauerstoff zu Halogeniden (z. B. Calciumchlorid
Tabelle 10-1. Eigenschaften der Alkalimetalle
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Ionenradius Elektronegativitat
◦
C C eV pm pm ◦
Lithium [He]2s 180,5 1342 5,39 152 59 1,0
Natrium [Ne]3s 97,80 883 5,14 186 99 0,9
Kalium [Ar]4s 63,38 759 4,34 227 138 0,8
Rubidium [Kr]5s 39,31 688 4,18 248 152 0,8
Caesium [Xe]6s 28,44 671 3, 89 266 167 0,8
10 Die Elementgruppen
Tabelle 10-2. Eigenschaften der Erdalkalimetalle
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Ionenradius (Ladungszahl 2+) Elektronegativität
◦
C C eV pm pm ◦
Beryllium [He]2s2 1287 2471 9,32 111 27 1,6
CaCl2 ), ionischen Hydriden (vgl. 10.1) bzw. Oxiden (z. B. Magnesiumoxid MgO). An feuchter Luft und in Wasser bilden sich Hydroxide. Mg und vor allem Be werden dabei – wie bekanntlich auch Aluminium – mit einer dünnen, fest haftenden oxidischen Deckschicht überzogen. Daher sind diese beiden Metalle gegenüber Wasser beständig. Wie bei den Alkalimetallen nimmt auch bei den Erdalkalimetallen die Reaktionsfähigkeit mit steigender Ordnungszahl zu. Gewinnung der Erdalkalimetalle: Durch Schmelzflusselektrolyse (siehe 9.8.1) der Halogenide oder durch Reduktion der Oxide mit Koks, Silicium oder Aluminium, letzteres wird als aluminothermisches Verfahren bezeichnet. Beispiel: 3 MgO + 2 Al → Al2 O3 + 3 Mg . Erdalkalimetallhydroxide
Erdalkalimetalle bilden Hydroxide des Typs M(OH)2 (M Erdalkalimetall). Der basische Charakter der Hydroxide nimmt mit steigender Ordnungszahl zu. Berylliumhydroxid Be(OH)2 kann je nach Art des Reaktionspartners als Säure oder als Base reagieren und ist daher sowohl in Säuren alsauch in starken Basen (vgl. 8.7) löslich. Verbindungen mit einem derartigen Verhalten werden als amphoter bezeichnet: +2 H+
+2 OH−
Be(aq)2+ ←−−−−−− Be(OH)2 −−−−−−−→ [Be(OH)4 ]2− −2 H2 O
Berylliumhydroxid
Beryllation
Magnesiumhydroxid Mg(OH)2 ist eine schwache Base ohne amphotere Eigenschaften. Ba(OH)2 und Ra(OH)2 sind starke Basen.
Magnesium [Ne]3s2 650 1090 7,65 160 57 1,3
Calcium [Ar]4s2 842 1484 6,11 197 100 1,0
Strontium [Kr]5s2 777 1382 5,70 215 118 0,95
Barium [Xe]6s2 727 1897 5,21 217 135 0,9
Radium [Rn]7s2 700 1140 5,28 148 0,9
10.4 III. Hauptgruppe: die Borgruppe Die Elemente Bor B, Aluminium Al, Gallium Ga, Indium In und Thallium Tl bilden die III. Hauptgruppe, vgl. Tabelle 10-3. Alle Elemente dieser Gruppe haben drei Valenzelektronen, können also in Verbindungen maximal in der Oxidationszahl III auftreten. Daneben tritt in der Borgruppe auch die Oxidationszahl I auf, deren Beständigkeit mit steigender Ordnungszahl zunimmt. So sind beim Bor nur dreiwertige Verbindungen bekannt, während beim Thallium die Oxidationszahl I vorherrscht. Bor tritt nie als B3+ -Kation auf und unterscheidet sich dadurch von allen anderen Elementen der III. Hauptgruppe. Metallcharakter: Der metallische Charakter nimmt – wie auch innerhalb der anderen Hauptgruppen – mit steigender Ordnungszahl zu. Elementares Bor ist ein hartes Halbmetall mit einem starken kovalenten Bindungsanteil. Die elektrische Leitfähigkeit ist gering ( 56 · 10−6 S/m bei 0 ◦ C) und steigt mit zunehmender Temperatur rasch an. Die Schmelz- und Siedepunkte sind hoch (vgl. Tabelle 10-3). Aluminium ist bereits ein in der kubisch dichtesten Kugelpackung kristallisierendes Leichtmetall mit hoher elektrischer Leitfähigkeit (37,74 · 106 S/m bei 20 ◦ C). Säure-Base-Eigenschaften: Die basischen (oder sauren) Eigenschaften der Oxide und Hydroxide der Elemente der Borgruppe nehmen mit steigender Ordnungszahl zu (bzw. ab). Ähnlich verhalten sich die entsprechenden Verbindungen in den anderen Hauptgruppen. B(OH)3 (Borsäure) ist, wie der Name schon sagt, sauer, die entsprechenden Al- und Ga-Verbindungen sind amphoter und die In- und Tl-Verbindungen reagieren basisch.
C67
C68
C Chemie
Tabelle 10-3. Eigenschaften der Elemente der Borgruppe
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Elektronegativität a
◦
C C eV pm ◦
Bor
Aluminium
Gallium
Indium
Thallium
[He]2s2 2p 2075 4000 8,30 79 2,0
[Ne]3s2 3p 660,323a 2519 5,99 143 1,6
[Ar]3d10 4s2 4p 29,8 2204 6,00 122 1,8
[Kr]4d10 5s2 5p 156,6 2072 5,79 162,6 1,8
[Xe]4f14 5d10 6s2 6p 303,5 1473 6,11 170 1,8
Fixpunkt der Internationalen Temperaturskala von 1990 (ITS-90).
Indium-Zinn-Oxid (ITO) hat als transparentes und leitfähiges Beschichtungsmaterial eine erhebliche Bedeutung für die Display- und Solarzellentechnik, für elektrische Abschirmungen und als Sensormaterial gewonnen. ITO ist eine Mischung aus Indium(III)oxid In2 O3 und Zinn(IV)oxid SnO2 , typischerweise mit einem Massenverhältnis 90:10. 10.4.1 Bor
Borwasserstoffe (Borane) existieren in großer Vielfalt. Es sind sehr reaktionsfähige und meist giftige Substanzen, die mit Luft oder mit Sauerstoff explosionsfähige Gemische bilden. Die einfachste Verbindung ist das Diboran B2 H6 . Mit Sauerstoff reagiert es unter großer Wärmeentwicklung gemäß folgender Gleichung: B2 H6 + 3 O2 → B2 O3 + 3 H2 O . Diboran Bortrioxid
Borsäure H3 BO3 oder B(OH)3 ist in wässriger Lösung eine sehr schwache einbasige Säure, da die Verbindung als OH− -Akzeptor reagiert: B(OH)3 + HOH H[B(OH)4 ] H+ (aq) + [B(OH)4 ]− . Die Salze der Borsäure heißen Borate. Es gibt Orthoborate (z. B. Li3 [BO3 ]), Metaborate (z. B. Na3 [B3 O6 ]) und Polyborate (z. B. Borax Na2 B4 O7 · 10 H2 O). Viele Wasch- und Bleichmittel enthalten Perborate. Das sind in der Regel Anlagerungsverbindungen des Wasserstoffperoxids H2 O2 (siehe 10.7.1) an gewöhnliche Borate.
Bornitrid BN kommt in einer hexagonalen dem Graphit und einer kubischen dem Diamanten analogen Modifikation (Borazon), vor. Borcarbid B4 C eine chemisch sehr beständige Verbindung, ist in seiner Härte mit dem Diamanten vergleichbar. Metallboride bilden sich beim Erhitzen von Bor mit Metallen. Es sind sehr harte, chemisch beständige Verbindungen. 10.4.2 Aluminium Elementares Aluminium
Vorkommen in Feldspäten z. B. Kalifeldspat oder Orthoklas K[AlSi3 O8 ], in Glimmern und in Tonen (Tone sind die Verwitterungsprodukte von Feldspäten oder feldspathaltigen Gesteinen), als reines Aluminiumoxid Al2 O3 (Korund) und als Aluminiumhydroxid (Bauxit). Darstellung: Schmelzflusselektrolyse von Aluminiumoxid (vgl. 9.8.1). Aluminiumverbindungen
Aluminiumoxid Al2 O3 kommt in zwei verschiedenen Modifikationen als γ-Al2 O3 und α-Al2 O3 vor. γ-Al2 O3 ist ein weiches Pulver mit großer Oberfläche, das beim Glühen (1100 ◦ C) in das sehr harte α-Al2 O3 (Korund) übergeht. Im Korund bilden die O2− -Ionen eine hexagonal dichteste Kugelpackung. Die Al3+ -Ionen besetzen 2/3 der vorhandenen Oktaederlücken (vgl. 5.3.2). Aluminiumhydroxid Al(OH)3 ist amphoter und löst sich daher sowohl in Säuren als auch in Basen auf: +3 H+
+OH−
Al(aq)3+ ←−−−−−− Al(OH)3 −−−−−−→ [Al(OH)4 ]− −3 H2 O
10 Die Elementgruppen
Das [Al(OH)4 ]− -Ion heißt Tetrahydroxoalumination oder kurz Alumination.
10.5 IV. Hauptgruppe: die Kohlenstoffgruppe Die Elemente Kohlenstoff C, Silicium Si, Germanium Ge, Zinn Sn und Blei Pb bilden die IV. Hauptgruppe des Periodensystems (vgl. Tabelle 10-4). In Verbindungen treten diese Elemente in den Oxidationszahlen IV und II auf. Die Stabilität von Verbindungen mit der Oxidationszahl IV (II) nimmt mit steigender Ordnungszahl ab (zu). Der metallische Charakter wächst in Richtung vom Kohlenstoff zum Blei hin. 10.5.1 Kohlenstoff
Kohlenstoffverbindungen
Carbide heißen die Verbindungen des Kohlenstoffs mit Metallen oder Nichtmetallen, wenn der Kohlenstoff der elektronegativere (vgl. 3.1.4) Partner ist. Diese Substanzen werden unterteilt in: – Salzartige Carbide (z. B. Calciumcarbid CaC2 ), – metallische Carbide (z. B. Vanadiumcarbid VC) und – kovalente Carbide (z. B. Siliciumcarbid SiC ,Carborundum‘). Kovalente Carbide sind extrem hart, schwer schmelzbar und chemisch inert. Viele salzartige Carbide reagieren mit Wasser unter Bildung von Acetylen HC≡CH, Beispiel: CaC2 + 2 H+ → Ca2+ + HC ≡ CH .
Elementarer Kohlenstoff
Kohlenstoff kommt in mehreren Modifikationen vor. Die beiden wichtigsten sind Diamant und Graphit (vgl. Bild 5-14 und 5-15; siehe auch D 4.2). Die Kohlenstoffsorten mit technischer Bedeutung wie Kunstgraphit (Elektrographit), Koks, Ruß und Aktivkohle besitzen weitgehend Graphitstruktur. Graphit kann als Stapel einer zweidimensionalen Kohlenstoffschicht (sog. Graphen) aufgefasst werden, die auch die Grundlage weiterer Kohlenstoffmodifikationen bildet. Bei den Fullerenen handelt es sich um sphärische Käfigverbindungen, die z. B. 60 oder 70 Kohlenstoffatome im Molekül enthalten (C60 , bzw. C70 ). Kohlenstoff-Nanoröhrchen bestehen aus ein- oder mehrlagigen röhrenförmigen Graphenstrukturen mit Durchmessern im Bereich von 10 nm und Längen im Bereich von 100 nm bis 1 μm.
Kohlenstoffdioxid (Kohlendioxid) CO2 ist ein farbloses, etwas säuerlich schmeckendes Gas. CO2 ist ein natürlicher Bestandteil der Luft (vgl. Tabelle 5-2). Es entsteht bei der Verbrennung von Kohle, Erdöl und Erdgas (vgl. 9.3.1). Mit Wasser reagiert CO2 unter Bildung von Kohlensäure H2 CO3 , die als schwache zweibasige Säure in Wasserstoffionen, Hydrogencarbonat- (HCO−3 ) und Carbonat-Ionen (CO2− 3 ) dissoziiert: 6 7 CO2 + H2 O H2 CO3 H+ aq + HCO−3 6 7 2 H+ aq + CO2− 3 . CO2 -Gehalt in der Luft und Klima. Der Gehalt an CO2 in der Luft hat sich durch die Verbrennung fossiler Energieträger (in Kraftwerken, Haushalten, Verkehr und Industrie) seit 1800 von 280 ppm auf den
Tabelle 10-4. Eigenschaften der Elemente der Kohlenstoffgruppe
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Elektronegativität a
Fixpunkt der ITS-90.
◦ ◦
C C
eV pm
Kohlenstoff [He]2s2 2p2 3550 (Diam.) 3825 (Sublim., Graphit) 11,26 77 2,55
Silicium [Ne]3s2 3p2 1414 3265 8,15 118 1,9
Germanium [Ar]3d10 4s2 4p2 938,25 2833 7,90 122 2,0
Zinn [Kr]4d10 5s2 5p2 231,928a 2602 7,34 140 2,0
Blei [Xe]4f4 5d10 6s2 6p2 327,46 1749 7,42 175 1,8
C69
C70
C Chemie
Stand von 383 ppm (2007) erhöht. Zwischen 1900 und 1973 betrug die mittlere jährliche Zuwachsrate der CO2 -Emission weltweit ca. 4%. Seit 1973 ist dieser Wert auf 2,3% gesunken. Da CO2 (wie andere klimawirksame Spurengase, z. B. Methan CH4 , Distickstoffmonoxid N2 O, Ozon O3 und Fluorchlorkohlenwasserstoffe) die infrarote Strahlung des Sonnenspektrums und vor allem die von der Erdoberfläche ausgehende Wärmestrahlung absorbiert, ist zu erwarten, dass eine Vergrößerung des CO2 -Gehaltes eine globale Temperaturerhöhung bewirkt. Die damit verbundenen Klimaänderungen können schwere Umweltschäden verursachen. 2004 wurden in Deutschland ca. 850 · 106 t CO2 aus der Verbrennung fossiler Energierohstoffe (Kohle, Öl, Gas) freigesetzt (pro Einwohner jährlich ca. 10,4 t). Kohlenstoffmonoxid (Kohlenmonoxid) CO ist ein farb- und geruchloses, sehr giftiges Gas (vgl. Tabelle 5-2). CO ist Nebenprodukt bei der unvollständigen Verbrennung von Kohle, Erdöl oder Erdgas (vgl. 9.3.1). Technisch kann es durch Reaktion von CO2 mit Koks (C) bei 1000 ◦ C dargestellt werden (Boudouard-Gleichgewicht): CO2 + C 2CO . CO ist Bestandteil von Wassergas, das beim Überleiten von Wasserdampf über stark erhitzten Koks entsteht, vgl. 10.1. Schwefelkohlenstoff oder Kohlenstoffdisulfid CS2 ist eine wasserklare Flüssigkeit (Siedepunkt 46,2 ◦ C, MAK-Wert 10 ppm). CS2 -Dämpfe bilden mit Sauerstoff oder Luft explosionsfähige Gasgemische. 10.5.2 Silicium Elementares Silicium
Die bei Raumtemperatur und Normaldruck stabile Modifikation, das α-Silicium, ist ein dunkelgraues, hartes Nichtmetall mit Diamantstruktur. Silicium ist – wie Germanium – ein Halbleiter, dessen elektrische Leitfähigkeit mit steigender Temperatur zunimmt. Geringe gezielt eingebrachte Fremdatome (Dotierungen) können die elektrische Leitfähigkeit um Größenordnungen steigern. Darstellung: Reduktion von Siliciumdioxid SiO2 mit Koks, Magnesium oder Aluminium.
Siliciumverbindungen
Siliciumwasserstoffe (Silane) sind durch die Summenformel Si2n H2n+2 charakterisiert. Sie gleichen in ihrer Struktur den Alkanen (vgl. 11.3.1). Das erste Glied dieser Reihe ist das Monosilan SiH4 . In den Siliciumwasserstoffen ist Silicium vierbindig (tetraedrische Anordnung). Silane sind sehr oxidationsempfindlich und bilden mit Luft, bzw. mit Sauerstoff, explosionsfähige Gasmischungen. Mit Wasser reagieren sie unter Bildung von Siliciumdioxid und Wasserstoff, so z. B.: SiH4 + 2 H2 O → SiO2 + 4 H2 . Siloxane, Silicone: Die Kondensation von Silanolen R3 Si–OH (R Alkyl-Rest, vgl. 11.3.1) führt zu Disiloxanen: R3 Si–OH + HO–SiR3 → R3 Si–O–SiR3 + H2 O . Bei der Kondensation von Silandiolen R2 Si(OH)2 oder Silantriolen RSi(OH)3 entstehen Polysiloxane . . . –SiR2 –O–SiR2 –O–SiR2 –O– . . . bzw. analog aufgebaute Schichtstrukturen. Diese Polymerverbindungen werden zusammengefasst als Silicone bezeichnet. Siliciumoxide: Wie beim Kohlenstoff existieren auch beim Silicium zwei Oxide: Siliciummonoxid SiO und Siliciumdioxid SiO2 . Siliciumdioxid kommt in mehreren Modifikationen vor. Wichtig sind: α- und β-Quarz, β-Tridymit, β-Cristobalit sowie die beiden Hochdruckmodifikationen Stishovit und Coesit. Das technisch wichtige Quarzglas kann durch Abkühlen von geschmolzenem Siliciumdioxid hergestellt werden (vgl. 5.2.4 und D 4.3). Silicate heißen die Salze der Kieselsäuren, deren einfachstes Glied die Orthokieselsäure H4 SiO4 ist. Silicate weisen große Strukturmannigfaltigkeiten auf. Man unterscheidet, insbesondere bei der Klassifizierung der Minerale: – Inselsilicate mit isolierten SiO4 -Tetraedern (z. B. Olivin (Mg, Fe)2 [SiO4 ]). – Gruppen- und Ringsilicate mit einer begrenzten Anzahl verknüpfter SiO4 -Tetraeder (Beispiel für ein Ringsilicat: Beryll Al2 Be3 [Si6 O18 ]).
10 Die Elementgruppen
– Ketten- und Bandsilicate, die aus einer unbegrenzten Zahl von verketteten SiO4 -Tetraedern aufgebaut sind. – Schichtsilicate mit zweidimensional unbegrenzten Schichten. Quantitative Zusammensetzung: [Si2 O2− 5 ] x . Beispiele: Glimmer, Tonminerale, Asbest. – Gerüstsilicate mit dreidimensional unbegrenzter Struktur. In diesen Substanzen ist ein Teil der Si-Atome des Siliciumdioxids durch Aluminium ersetzt. Beispiel: Feldspäte, Zeolithe (Verwendung als Molekularsiebe). Technisch wichtige Silicate
– Wasserglas, eine wässrige Lösung von Alkalisilicaten (Verwendung: Verkitten von Glas und Porzellan, Flammschutzmittel). – Silikatgläser (Gläser im allgemeinen Sprachgebrauch, vgl. 5.2.4 und D 4.3). – Silikatkeramik-Erzeugnisse. Hierunter versteht man im Wesentlichen technische Produkte, die durch Glühen von Tonen (vgl. 10.4.2) hergestellt werden.
treten die Elemente der Stickstoffgruppe mit der Oxidationszahl−III auf (z. B. NH3 , PH3 , AsH3 ). In Verbindungen mit elektronegativen Elementen wie Sauerstoff oder Chlor werden hauptsächlich die Oxidationszahlen III und V beobachtet. Metallcharakter: Der metallische Charakter der Elemente der V. Hauptgruppe nimmt mit steigender Ordnungszahl zu. Stickstoff ist ein typisches Nichtmetall und Bismut ein reines Metall. Die Elemente Phosphor, Arsen und Antimon kommen sowohl in metallischen als auch in nichtmetallischen Modifikationen vor. 10.6.1 Stickstoff Elementarer Stickstoff
Vorkommen: Bestandteil der Luft, vgl. Tabelle 5-2. Gewinnung: Durch fraktionierte Destillation von flüssiger Luft. Eigenschaften: Stickstoff ist bei Raumtemperatur nur als N2 -Molekül beständig. Er ist unter diesen Bedingungen ein farb- und geruchloses Gas (vgl. Tabelle 5-2).
10.5.3 Germanium, Zinn und Blei
α-Germanium ist die bei Raumtemperatur und Normaldruck stabile Germanium-Modifikation. Es ist ein grauweißes, sehr sprödes Metall mit Diamantstruktur. α-Ge hat Halbleitereigenschaften. Zinn kommt in drei verschiedenen Modifikationen als α-, β- und γ-Sn vor. Bei Raumtemperatur ist das metallische β-Sn stabil. Unterhalb 13,2 ◦ C wandelt sich diese Modifikation allmählich in graues α-Zinn mit Diamantstruktur um. Gegenstände aus Zinn zerfallen dabei in viele kleine Kriställchen („Zinnpest“). Blei ist ein graues, weiches Schwermetall. Es kristallisiert in der kubisch dichtesten Kugelpackung, also in einem echten Metallgitter (vgl. 5.3.2).
10.6 V. Hauptgruppe: die Stickstoffgruppe Zur V. Hauptgruppe gehören die Elemente Stickstoff N, Phosphor P, Arsen As, Antimon Sb und Bismut (auch Wismut) Bi, vgl. Tabelle 10-5. Oxidationszahl: Gegenüber elektropositiven Elementen (vgl. Tabelle 9-1), so z. B. Wasserstoff,
Stickstoffverbindungen
Ammoniak NH3 : Darstellung nach dem Haber-BoschVerfahren, siehe 7.9.4. Ammoniak ist ein farbloses Gas mit stechendem Geruch, vgl. Tabelle 5-2. Es ist sehr leicht in Wasser löslich. Die wässrige Lösung reagiert schwach basisch: NH3 + H2 O NH+4 + OH− . Verwendung von Ammoniak: Herstellung von Salpetersäure und Düngemitteln. Hydrazin H2 N–NH2 oder N2 H4 : Darstellung durch Oxidation von Ammoniak: −H2 O
H2 N–H + O + H–NH2 H2 N–NH2 . Hydrazin ist bei Raumtemperatur eine farblose ölige Flüssigkeit (Siedepunkte 113,5 ◦ C), MAK-Wert: 0,1 ppm. Reines Hydrazin kann explosionsartig in Ammoniak und Stickstoff zerfallen: 6 7 6 7 3 N2 H4 (l) → 4 NH3 g + N2 g . Mit starken Säuren reagiert Hydrazin unter Bildung von Hydraziniumsalzen (z. B. Hydraziniumsulfat [N2 H6 ][SO4 ]).
C71
C72
C Chemie
Tabelle 10-5. Eigenschaften der Elemente der Stickstoffgruppe
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Elektronegativität a
◦
C C eV ◦
pm
Stickstoff [He]2s2 2p3 −210,0 −195,79 14,53 55 3,0
Phosphor [Ne]3s2 3p3 44,15a 280,5a 10,49
Arsen [Ar]3d10 4s2 4p3 817 (28 bar) 613 (Sublim.) 9,81
110 2,2
124 2,2
Antimon [Kr]4d10 5s2 5p3 630,63 1587 8,64 145 2,05
Bismut [Xe]4f14 5d10 6s2 6p3 271,40 1564 7,29 154 1,9
weißer Phosphor .
Stickstoffwasserstoffsäure HN3 ist eine farblose, giftige (MAK-Wert: 0,1 ppm), explosive Flüssigkeit: 6 7 6 7 2 HN3 (l) → 3 N2 g + H2 g .
Nitrate (z. B. Natriumnitrat NaNO3 ). Konzentrierte Salpetersäure besitzt ein besonders starkes Oxidationsvermögen. Sie wird dabei zum Stickstoffmonoxid reduziert:
Wässrige Lösungen reagieren schwach sauer. Die Salze der Stickstoffwasserstoffsäure heißen Azide. Schwermetallazide (z. B. Bleiazid Pb(N3 )2 und Silberazid AgN3 ) sind schlagempfindlich und werden daher in der Sprengtechnik als Initialzünder verwendet.
NO−3 + 4 H+ + 3 e− → NO + 2 H2 O . Aufgrund dieses Reaktionsverhaltens werden sämtliche Edelmetalle (vgl. 9.5.4) außer Gold und Platin von konzentrierter Salpetersäure gelöst. 10.6.2 Phosphor
Oxide des Stickstoffs
– Distickstoffmonoxid N2 O (Lachgas), Oxidationszahl des Stickstoffs I, vgl. Tabelle 5-2. – Stickstoffmonoxid NO ist ein farbloses, giftiges Gas, vgl. 6.4.7 und 9.3.1. Mit Sauerstoff reagiert es in einer Gleichgewichtsreaktion unter Bildung von Stickstoffdioxid NO2 : 2 NO + O2 2 NO2 . – Stickstoffdioxid NO2 ist ein rotbraunes erstickend riechendes Gas, MAK-Wert: 5 ppm, vgl. 6.4.7 und 9.3.1. Mit Wasser reagiert das Oxid unter Bildung von salpetriger Säure HNO2 und Salpetersäure HNO3 (s. unten): 2 NO2 + H2 O → HNO2 + HNO3 . Sauerstoffsäuren des Stickstoffs
– Salpetrige Säure HNO2 : Diese Säure ist nur in verdünnter wässriger Lösung beständig. Die Salze heißen Nitrite (z. B. Natriumnitrit NaNO2 ). – Salpetersäure HNO3 ist eine farblose stechend riechende Flüssigkeit (Siedepunkt 84,1 ◦ C). Die Verbindung ist eine starke Säure. Ihre Salze heißen
Elementarer Phosphor
Phosphor kommt in mehreren monotropen (einseitig umwandelbaren) Modifikationen vor: – Weißer Phosphor. Metastabil (vgl. 6.3.5), fest (Schmelzpunkt 44,2 ◦ C), wachsweich, sehr giftig, in Schwefelkohlenstoff CS2 löslich. Festkörper, Schmelze und Lösung enthalten tetraedrische P4 -Moleküle. Feinverteilter weißer Phosphor entzündet sich an der Luft von selbst und verbrennt zu Phosphorpentoxid P4 O10 . Im Dunkeln leuchtet Phosphor an der Luft wegen der Oxidation der von weißem Phosphor abgegebenen Dämpfe (Chemolumineszenz). – Roter Phosphor (metastabil) entsteht aus weißem Phosphor durch Erhitzen auf ca. 300 ◦ C (unter Ausschluss von Sauerstoff). – Schwarzer Phosphor (stabil von Raumtemperatur bis ca. 400 ◦ C) bildet sich aus weißem Phosphor bei erhöhter Temperatur (ca. 200 ◦ C) und sehr hohem Druck (12 kbar). Das Gitter besteht aus Doppelschichten. Schwarzer Phosphor hat Halbleitereigenschaften.
10 Die Elementgruppen
Phosphorverbindungen
Phosphin PH3 ist ein farbloses, sehr giftiges Gas (MAK-Wert: 0,1 ppm). Oxide des Phosphors
– Diphosphortrioxid (Phosphortrioxid) P4 O6 entsteht beim Verbrennen des Phosphors bei ungenügender Sauerstoffzufuhr. Es leitet sich vom tetraedrisch aufgebauten weißen Phosphor dadurch ab, dass zwischen jede P–P-Bindung ein Sauerstoffatom eingefügt ist. Das entspricht der Formel P4 O6 . Mit Wasser reagiert P4 O6 unter Bildung von phosphoriger Säure H3 PO3 : P4 O6 + 6 H2 O → 4 H3 PO3 . – Diphosphorpentaoxid (Phosphorpentoxid) P2 O5 bildet sich bei vollständiger Verbrennung von elementarem Phosphor. Die Molekülstruktur der Verbindung unterscheidet sich von der des P4 O6 dadurch, dass an jedem Phosphoratom zusätzlich ein Sauerstoffatom gebunden ist. Das entspricht der Formel P4 O10 . P4 O10 ist ein weißes, geruchloses Pulver. Es ist äußerst hygroskopisch (Wasser entziehend). Mit Wasser reagiert es über Zwischenstufen unter Bildung von Phosphorsäure H3 PO4 : P4 O10 + 6 H2 O → 4 H3 PO4 . Phosphorsäure H3 PO4 bildet drei Reihen von Salzen primäre Phosphate (Dihydrogenphosphate, z. B. NaH2 PO4 ), sekundäre Phosphate (Hydrogenphosphate, z. B. Na2 HPO4 ) und tertiäre Phosphate (z. B. Na3 PO4 ). Verwendung von Phosphaten: Düngemittel. Kondensierte Phosphorsäuren: Bei höheren Temperaturen kondensiert Orthophosphorsäure unter Wasserabspaltung zur Diphosphorsäure, die oberhalb
300 ◦ C unter weiterem Austritt von Wasser in kettenförmige Polyphosphorsäuren übergeht. 10.6.3 Arsen, Antimon
Arsen und Antimon bilden mit Wasserstoff die Verbindungen Arsin AsH3 bzw. Antimonwasserstoff SbH3 . AsH3 ist noch giftiger als Phosphin PH3 . Die wichtigsten Oxide des Arsens und des Antimons sind As4 O6 (,Arsenik‘) und Sb4 O6 . Beide haben einen dem P4 O6 analogen molekularen Aufbau.
10.7 VI. Hauptgruppe: Chalkogene Die Elemente der VI. Hauptgruppe sind Sauerstoff O, Schwefel S, Selen Se, Tellur Te und Polonium Po. Polonium ist ein außerordentlich seltenes radioaktives Element. Die Sonderstellung, die der Sauerstoff als erstes Element innerhalb dieser Gruppe einnimmt, beruht auf seinem besonders kleinen Atomradius und seiner hohen Elektronegativität, vgl. Tabelle 10-6. Oxidationszahl: Die Chalkogene kommen in den Oxidationszahlen –II bis VI vor. Sauerstoff tritt aufgrund seiner großen Elektronegativität (er ist nach Fluor das elektronegativste Element) fast nur in der Oxidationszahl –II auf. Im Wasserstoffperoxid und in anderen Peroxiden hat er die Oxidationszahl –I. In Verbindungen mit Fluor sind die Oxidationszahlen des Sauerstoffs positiv. Metallcharakter: Der metallische Charakter nimmt mit steigender Ordnungszahl zu. Sauerstoff und Schwefel sind typische Nichtmetalle, Polonium ist ein reines Metall. Die Elemente Selen und Tellur kommen sowohl in metallischen als auch in nicht-metallischen Modifikationen vor. 10.7.1 Sauerstoff Elementarer Sauerstoff
Vorkommen: Elementar als Bestandteil der Luft (vgl. Tabelle 5-2), gebunden hauptsächlich in Form von Oxiden und Silicaten als Bestandteil der meisten Gesteine. Der Massenanteil des Sauerstoffs am Aufbau der Erdrinde beträgt rund 49%. Gewinnung: Durch fraktionierte Destillation von flüssiger Luft.
C73
C74
C Chemie
Tabelle 10-6. Eigenschaften der Chalkogene
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Ionenradius (Ladungszahl 2−) Elektronegativität
◦
C C eV ◦
pm pm
Sauerstoff [He]2s2 2p4 −218,79 −182,95 13,62 60 138 3,4
Schwefel [Ne]3s2 3p4 119,6 444,6 10,36
Selen [Ar]3d10 4s2 4p4 220,5 685 9,75
Tellur [Kr]4d10 5s2 5p4 449,5 988 9,01
Polonium [Xe]4f14 5d10 6s2 6p4 254 962 8,42
104 184
116 198
143 221
167
2,6
Modifikationen des Sauerstoffs: – Molekularer Sauerstoff O2 ist ein farbloses, geruchloses, paramagnetisches Gas, vgl. Tabelle 5-2. Sauerstoff ist Oxidationsmittel bei der Verbrennung fossiler Brennstoffe (vgl. 9.3.1) und bei der Verbrennung von Nahrungsmitteln (Kohlenhydrate, Fette, Eiweißstoffe) in Organismen. Verbrennungsreaktionen laufen in reinem Sauerstoff wesentlich heftiger ab als in Luft. Mit flüssigem Sauerstoff reagieren viele Substanzen explosionsartig. – Ozon O3 ist ein bei Raumtemperatur deutlich blaues, sehr giftiges, charakteristisch riechendes, diamagnetisches Gas; Siedepunkt −110,5 ◦ C, MAKWert: 0,1 ppm. Ozon ist energiereicher als molekularer Sauerstoff (ΔB Hm0 (O3 ) = 142,7 kJ/mol, vgl. 6.2.5). Es hat eine große Neigung – unter bestimmten Bedingungen explosionsartig – in molekularen Sauerstoff zu zerfallen. Ozon ist ein sehr starkes Oxidationsmittel. Das O3 -Molekül ist gewinkelt (116,8°). Die äußeren Atome sind vom zentralen 127,8 pm entfernt. In der Erdatmosphäre wird Ozon fotochemisch aus molekularem Sauerstoff gebildet. Seine größte Teilchendichte hat es in 20 bis 25 km Höhe. Da Ozon einen großen Anteil der kurzwelligen Strahlung des Sonnenlichtes absorbiert, ist die Ozonschicht von großer Bedeutung für das Leben auf der Erde. Besonders Fluorchlorkohlenwasserstoffe (siehe 11.4.1 und Tabelle 5-2) verringern die Ozonkonzentration in den oberen Schichten der Atmosphäre. Die dadurch bedingte Erhöhung der UV-Strahlung auf der Erdoberfläche kann u. a. zu einem Ansteigen der Häufigkeit von bösartigen Hauterkrankungen führen.
2,55
2,1
2,0
Sauerstoffverbindungen – Wasser H2 O, vgl. 5.2.3, schweres Wasser D2 O, vgl. 10.1, Eigenschaften von D2 O: Schmelzpunkt
3,82 ◦ C, Siedepunkt 101,42 ◦ C. – Wasserstoffperoxid H2 O2 ist eine in reinem Zustand praktisch farblose, sirupartige Flüssigkeit (Siedepunkt 150,2 ◦ C, MAK-Wert: 1 ppm). Charakteristisch für diese Verbindung ist die folgende exotherme Zerfallsreaktion: 2 H2 O2 → 2 H2 O + O2 .
In hochreinem Wasserstoffperoxid ist die Zerfallsgeschwindigkeit bei Raumtemperatur sehr klein. In Gegenwart von Katalysatoren (vgl. 7.9), wie z. B. Braunstein MnO2 , Mennige Pb3 O4 , feinverteiltem Silber oder Platin, kann die Zerfallsreaktion explosionsartig ablaufen. Wasserstoffperoxid ist ein starkes Oxidationsmittel. Mischungen von organischen Verbindungen mit konzentriertem Wasserstoffperoxid können explosiv reagieren. Verwendung: Bleichmittelzusatz in Waschmitteln, Desinfektionsmittel. 10.7.2 Schwefel Elementarer Schwefel
Vorkommen: Frei (elementar) z. B. in Sizilien und Kalifornien, gebunden vorwiegend in Form von Sulfiden (z. B. Schwefelkies oder Pyrit FeS2 , Zinkblende ZnS, Bleiglanz PbS) oder Sulfaten (z. B. Gips CaSO4 · 2 H2 O). Eigenschaften: Die bei Raumtemperatur stabile Schwefelmodifikation ist der rhombische αSchwefel. Dieser wandelt sich bei 95,6 ◦ C reversibel
10 Die Elementgruppen
in den monoklinen β-Schwefel um, der bei 119,6 ◦ C schmilzt. Beide Schwefelmodifikationen sind aus ringförmigen S8 -Molekülen aufgebaut. Schwefelverbindungen
Schwefelwasserstoff H2 S ist ein farbloses, wasserlösliches, sehr giftiges Gas, das nach faulen Eiern riecht, MAK-Wert: 10 ppm. Wässrige Lösungen von H2 S reagieren sauer, vgl. Tabelle 8-2. Schwermetallsulfide sind in der Regel schwerlöslich. Oxide des Schwefels
– Schwefeldioxid SO2 , MAK-Wert: 2 ppm, siehe 9.3.1 und Tabelle 8-2. – Schwefeltrioxid SO3 , siehe Tabelle 8-2. Sauerstoffsäuren des Schwefels
– Schweflige Säure H2 SO3 , siehe Tabelle 8-2. – Schwefelsäure H2 SO4 (siehe Tabelle 8-2) ist eine ölige, sehr hygroskopische Flüssigkeit (Siedepunkt 330 ◦ C). Sie wird daher als Trockenmittel verwendet. Auf viele organische Verbindungen, damit auch auf Holz, Papier und menschliche Haut, wirkt konzentrierte Schwefelsäure verkohlend, indem sie diesen Substanzen Wasser entzieht. Schwefelsäure ist eine starke zweibasige Säure. Die elektrolytische Dissoziation erfolgt in zwei Stufen: H2 SO4 H
+
HSO−4
+
2H +
SO2− 4
.
10.8 VII. Hauptgruppe: Halogene Zur VII. Hauptgruppe gehören die Elemente Fluor F, Chlor Cl, Brom Br, Iod I und das radioaktive Astat At, vgl. Tabelle 10-7.
Oxidationszahl: Sämtliche Halogene bilden negativ einwertige Ionen (Oxidationszahl –I). Darüber hinaus sind viele Verbindungen bekannt, in denen Halogene die Oxidationszahlen I bis VII haben. Fluor ist das elektronegativste Element. In seinen Verbindungen kommt es stets mit der Oxidationszahl –I vor. 10.8.1 Fluor Elementares Fluor
Fluor ist ein in dicker Schicht grünlichgelbes, sehr giftiges Gas mit starkem, charakteristischem Geruch, MAK-Wert: 0,1 ppm. Fluor ist das reaktionsfähigste Element und das stärkste Oxidationsmittel. Die Verbindungen des Fluors mit anderen Elementen heißen Fluoride. Fluorverbindungen
Fluorwasserstoff HF riecht stechend und ist sehr giftig, MAK-Wert: 3 ppm, vgl. Tabelle 8-2. Eine bemerkenswerte Eigenschaft von Fluorwasserstoff ist die Fähigkeit, Quarz- und Silicatgläser (vgl. 5.2.4 und D 4.4) anzugreifen. Dabei wird neben Wasser gasförmiges Siliciumtetrafluorid SiF4 gebildet: SiO2 + 4 HF → SiF4 + 2 H2 O . 10.8.2 Chlor Elementares Chlor
Eigenschaften des Chlors: siehe Tabellen 5-2 und 10-7. Chlor gehört nach Fluor zu den reaktionsfähigsten Elementen. Mit Wasserstoff reagiert Chlor unter Bildung von Chlorwasserstoff (sog. Chlorknallgasreaktion). Die explosionsartig verlaufende Reaktion kann durch Bestrahlung mit blauem oder kurzwelligerem Licht gestartet werden. Dabei werden
Tabelle 10-7. Eigenschaften der Halogene
Elektronenkonfiguration Schmelzpunkt Siedepunkt Ionisierungsenergie (1. Stufe) Atomradius Ionenradius (Ladungszahl 1−) Elektronegativität
Fluor Chlor Brom [He]2s2 2p5 [Ne]3s2 3p5 [Ar]3d10 4s2 4p5 ◦ C −219,62 −101,5 −7,2 ◦ C −188,12 −34,04 58,8 eV 17,42 12,97 11,81 pm 71 99 114 pm 133 181 196 4,0 3,2 3,0
Iod [Kr]4d10 5s2 5p5 113,7 184,4 11,81 133 220 2,7
Astat [Xe]4f4 5d10 6s2 6p5 302 337 (gesch.)
2,2
C75
C76
C Chemie
Chlormoleküle in Atome gespalten. Die Umsetzung verläuft nach einem Kettenmechanismus (vgl. 7.7). Viele Elemente (z. B. Natrium, Arsen, Antimon) reagieren direkt unter Feuererscheinungen mit Chlor. Die Umsetzung mit Wasser führt zu einem Gleichgewicht. Es entstehen Chlorwasserstoff HCl und hypochlorige Säure HClO (siehe unten): Cl2 + H2 O HCl + HClO . Chlorverbindungen
Chlorwasserstoff HCl, siehe Tabellen 5-2 und 8-2. Sauerstoffsäuren des Chlors, vgl. Tabelle 8-2. – Hypochlorige Säure HClO, Oxidationszahl des Chlors I. Wässrige Lösungen von Hypochloriten (Salze der HClO) sind starke Oxidationsmittel und werden in Bleichlösungen und Desinfektionsmitteln verwendet. – Chlorige Säure HClO2 , Oxidationszahl des Chlors III. – Chlorsäure HClO3 , Oxidationszahl des Chlors V. – Perchlorsäure HClO4 , Oxidationszahl des Chlors VII. Die reine Säure ist eine farblose Flüssigkeit, die sich explosiv zersetzen kann. Perchlorsäure gehört zu den stärksten Säuren. 10.8.3 Brom und Iod
Brom ist neben Quecksilber das einzige bei Raumtemperatur flüssige Element (Siedepunkt 58,8 ◦ C). Iod ist bei Raumtemperatur fest. Es bildet blauschwarze, metallisch glänzende Kristalle.
10.9 VIII. Hauptgruppe: Edelgase Zur VIII. Hauptgruppe gehören die Elemente Helium He, Neon Ne, Argon Ar, Krypton Kr, Xenon Xe und
das radioaktive Radon Rn. Die Stabilität der Edelgase gegenüber der Aufnahme und der Abgabe von Elektronen folgt aus den hohen Werten der Elektronenaffinität und der Ionisierungsenergie, vgl. Tabelle 10-8. Vorkommen: Die Edelgase He, Ne, Ar, Kr und Xe sind Bestandteile der Luft. He und Rn kommen auch als Produkte radioaktiver Zerfallsvorgänge in einigen Mineralien vor. Gewinnung: Helium wird hauptsächlich aus amerikanischen Erdgasen gewonnen. Die Gewinnung von Neon, Argon, Krypton und Xenon erfolgt entweder durch fraktionierte Destillation verflüssigter Luft oder durch selektive Adsorption an Aktivkohle. Eigenschaften: Die Elemente der VIII. Hauptgruppe, vgl. Tabelle 5-2, sind farb- und geruchlose Gase. Flüssiges Helium existiert unterhalb 2,2 K im supraflüssigen Zustand mit extrem kleiner Viskosität und sehr hoher Wärmeleitfähigkeit. Edelgasverbindungen
Von den Edelgasen Krypton und Xenon sind zahlreiche Verbindungen mit Sauerstoff und Fluor bekannt. So bildet Xenon die Fluoride Xenondifluorid XeF2 (Schmelzpunkt 129 ◦ C), Xenontetrafluorid XeF4 (Schmelzpunkt 117 ◦ C) und Xenonhexafluorid XeF6 (Schmelzpunkt 49,5 ◦ C). Xenondioxid XeO2 und Xenontrioxid XeO3 sind explosiv.
10.10 Scandiumgruppe (III. Nebengruppe) Zur Scandiumgruppe gehören Scandium Sc, Yttrium Y, Lanthan La und Actinium Ac, vgl. Tabelle 10-9. Die auf das Lanthan bzw. das Actinium folgenden Lanthanoide und Actinoide sind in den Abschnitten 10.18 bzw. 10.19 behandelt. Actinium kommt als radioaktives Zerfallsprodukt des Urans in geringen Mengen in Uranerzen vor. Die Elemente sind Metalle
Tabelle 10-8. Eigenschaften der Edelgase. (Vgl. auch Tabelle 5-2)
Helium Neon Argon Krypton Xenon Radon Elektronen ls2 1s2 2s2 2p6 [Ne]3s2 3p6 [Ar]3d10 4s2 4p6 [Kr]4d10 5s2 5p6 [Xe]4f14 5d10 6s2 6p6 konfiguration ◦ Schmelzpunkt a C < −272,2c −248,59 −189,3442 tpd −157,38 tp −111,79 tp −71 Ionisierungsenergie eV 24,59 21,56 15,76 14,0 12,13 10,75 (1. Stufe) Atomradius b pm 140 150 180 190 210 a tp: Tripelpunktstemperatur b Van-der-Waals-Radius c bei 26,3 bar d Fixpunkt der IST-90 .
10 Die Elementgruppen
Tabelle 10-9. Eigenschaften der Elemente der Scandiumgruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (25 ◦ C)
pm ◦ C ◦ C g/cm3
Scandium [Ar]3d4s2 161 1541 2836 2,989
Yttrium [Kr]4d5s2 178 1522 3345 4,469
Lanthan [Xe]5d6s2 187 918 3464 6,145
Actinium [Rn]6d7s2 188 1051 3198 10,07
mit hoher elektrischer Leitfähigkeit und großem Reaktionsvermögen. Dies zeigt sich in den Standardelektrodenpotenzialen (vgl. 9.5), die zwischen − 2,077 V (Sc) und −2,6 V (Ac) liegen (bezogen auf die Elektrodenreaktion Me Me3+ + 3 e− ). In den meisten Verbindungen kommen die Elemente in der Oxidationszahl III vor. Die basischen Eigenschaften der Hydroxide nehmen mit der Ordnungszahl zu. So besitzt Sc(OH)3 nur schwach basische Eigenschaften, während La(OH)3 als starke Base reagiert. Die Darstellung der Metalle erfolgt durch Schmelzflusselektrolyse (vgl. 9.8.1) der Chloride oder durch Reduktion der Oxide mit Alkalimetallen.
10.11.1 Titan
10.11 Titangruppe (IV. Nebengruppe)
10.11.2 Zirconium
Zur Titangruppe gehören Titan Ti, Zirconium Zr und Hafnium Hf, vgl. Tabelle 10-10. Die Metalle sind silberweiß und duktil. Sie haben hohe Schmelz- und Siedepunkte. Aufgrund ihrer negativen Standardelektrodenpotenziale, die zwischen −0,88 V (Ti) und −1,57 V (Hf) liegen (bezogen auf die Elektrodenreaktion Me + H2 O MeO2+ + 2H+ + 4e− ), sind sie gegenüber den meisten Oxidationsmitteln ziemlich reaktionsfähig (vgl. 9.5 und 10.11.1). Die Oxidationszahlen des Titans in seinen Verbindungen sind II, III und IV, die des Zirconiums III und IV. Die beständigste und wichtigste Oxidationszahl ist bei beiden IV. Hafnium kommt in seinen Verbindungen nur in der Oxidationszahl IV vor.
Eigenschaften, Verwendung: Zirconium ist ein verhältnismäßig hartes, korrosionsbeständiges Metall, das rostfreiem Stahl ähnelt. Es ist bei Raumtemperatur gegen Säuren ziemlich resistent. Zirconium und Zirconiumlegierungen mit mehr als 90% Zr (Zircaloy) haben als Werkstoffe in der Kerntechnik Bedeutung erlangt.
Vorkommen: Titandioxid TiO2 (in der Natur in den Modifikationen Rutil, Anatas und Brookit), Ilmenit FeTiO3 , Perowskit CaTiO3 . Eigenschaften, Darstellung, Verwendung: Titan ist ein silberweißes Metall mit relativ kleiner Dichte (4,54 g/cm3 ). Reines Titan wird durch eine kompakte Oxiddeckschicht vor dem Angriff von Luftsauerstoff, Meerwasser und verdünnten Mineralsäuren geschützt. Bei höheren Temperaturen ist es jedoch mit Sauerstoff und Stickstoff recht reaktionsfähig. Darstellung und Verwendung siehe D 3.4.3.
10.12 Vanadiumgruppe (V. Nebengruppe) Zur Vanadiumgruppe gehören die Metalle Vanadium (früher: Vanadin) V, Niob Nb und Tantal Ta, vgl. Tabelle 10-11. Vanadium kommt in seinen Verbindungen in den Oxidationszahlen II bis V vor. Davon sind
Tabelle 10-10. Eigenschaften der Elemente der Titangruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (20 ◦ C)
pm ◦ C ◦ C g/cm3
Titan [Ar]3d2 4s2 145 1668 3287 4,54
Zirconium [Kr]4d2 5s2 159 1855 4409 6,506
Hafnium [Xe]4f14 5d2 6s2 156 2233 4603 13,31
C77
C78
C Chemie
Tabelle 10-11. Eigenschaften der Elemente der Vanadiumgruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte
pm ◦ C ◦ C g/cm3
Vanadium [Ar]3d3 4s2 131 1910 3407 6,092
IV und V gewöhnlich am stabilsten. Niob und Tantal kommen hauptsächlich in der Oxidationsstufe V vor, sie bilden praktisch keine Kationen, sondern existieren nur in anionischen Verbindungen. Die Metalle sind wichtige Legierungsbestandteile von Stählen. 10.12.1 Vanadium
Eigenschaften, Darstellung, Verwendung: Vanadium ist ein stahlgraues, ziemlich hartes Metall, das durch eine dünne Oxidschicht vor dem Angriff von Luftsauerstoff und Wasser geschützt wird. Das reine Metall wird durch Reduktion von Vanadium(V)-oxid V2 O5 mit Aluminium dargestellt. Vanadium wird hauptsächlich als Legierungsbestandteil von Stählen verwendet (vgl. D 3.3.3). Als Ferrovanadin werden Legierungen aus Vanadium und Eisen mit einem Vanadiumanteil von mindestens 50 Gew.-% V bezeichnet. Ihre Darstellung erfolgt durch Reduktion einer Mischung von Vanadium- und Eisenoxid mit Kohle. Vanadiumverbindungen: In Kaliummonovanadat K3 VO4 , Kaliumdivanadat K4 V2 O7 und Kaliummetavanadat KVO3 hat Vanadium die Oxidationszahl V. Kaliummetavanadat liegt in wässriger Lösung in Form tetramerer [V4 O12 ]4− -Ionen vor. Im festen Zustand besteht es aus hochpolymeren VO−3 -Ketten. In beiden Fällen sind die Polyvanadationen aus über Ecken verknüpften VO4 -Tetraedern aufgebaut. Bei
Niob [Kr]4d4 5s 143 2477 4744 8,57 (20 ◦ C)
Tantal [Xe]4f14 5d3 6s2 143 3017 5458 16,65
Zugabe von Säuren zu wässrigen Monovanadatlösungen erfolgt über die Bildung des Ions HVO2− 4 Aggregation unter Wasserabspaltung (Kondensation). Dabei entstehen Salze von Polyvanadinsäuren (unter anderem werden auch Metavanadate gebildet). Diese Säuren gehören zu den Isopolysäuren und sind dadurch charakterisiert, dass ihre Anionen außer den entsprechenden Schwermetallionen nur Sauerstoff und Wasserstoff enthalten.
10.13 Chromgruppe (VI. Nebengruppe) Zur Chromgruppe gehören die hochschmelzenden Schwermetalle Chrom Cr, Molybdän Mo und Wolfram W, vgl. Tabelle 10-12. 10.13.1 Chrom
Vorkommen: Chromeisenstein (Chromit) FeCr2 O4 , Rotbleierz (Krokoit) PbCrO4 . Eigenschaften, Darstellung: Chrom ist ein silberglänzendes, in reinem Zustand zähes, dehn- und schmiedbares Metall. Metallisches Chrom wird durch eine dünne, zusammenhängende Oxidschicht vor dem Angriff von Luftsauerstoff und Wasser geschützt. Es behält daher trotz seines negativen Standardelektrodenpotenzials (−0,74 V bezogen auf die Elektrodenreaktion Cr Cr3+ + 3 e− ) auch an feuchter Luft seinen metallischen Glanz. Darstellung des metallischen
Tabelle 10-12. Eigenschaften der Elemente der Chromgruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (20 ◦ C)
pm ◦ C ◦ C g/cm3
Chrom [Ar]3d5 4s 125 1907 2671 7,19
Molybdän [Kr]4d5 5s 136 2623 4639 10,22
Wolfram [Xe]4f14 5d4 6s2 137 3422 5555 19,3
10 Die Elementgruppen
Chroms aus Chromeisenstein: Nach der Abtrennung des Eisens wird Chrom(III)-oxid mit Aluminium zu metallischem Chrom reduziert: Cr2 O3 + 2 Al Al2 O3 + 2 Cr . Verwendung: Chrom ist ein wichtiger Legierungsbestandteil von nichtrostenden Stählen. Es dient als Korrosionsschutz unedler Metalle, indem diese mit einer dünnen Chromschicht überzogen werden. Das Verchromen geschieht auf elektrochemischem Wege auf einer dichten Zwischenschicht aus Nickel, Cadmium oder Kupfer. Chromverbindungen: Die wichtigsten Oxidationszahlen des Chroms sind III und VI. Beispiele sind Chrom(III)-chlorid CrCl3 und Kaliumdichromat K2 Cr2 O7 . Zwischen beiden Oxidationsstufen besteht folgendes Redoxgleichgewicht: + − 2 Cr3+ + 7 H2 O Cr2 O2− 7 + 14 H + 6 e . 2− Das CrVI 2 O7 -Ion heißt Dichromation. Diese Redoxreaktion ist Grundlage für ein wichtiges maßanalytisches Verfahren (vgl. 4.7.2 und 9.2). Mit Kaliumdichromatlösungen bekannter Konzentration kann beispielsweise der Gehalt von Fe2+ -Ionen quantitativ bestimmt werden. Zwischen Dichromationen und Chromationen CrO2− 4 besteht in wässriger Lösung folgende von der Wasserstoffionenkonzentration abhängige Gleichgewichtsreaktion: + 2− 2 CrO2− 4 + 2 H Cr2 O7 + H2 O .
10.13.2 Molybdän
Vorkommen: Molybdänglanz (Molybdänit) MoS2 , Gelbbleierz PbMoO4 . Eigenschaften, Verwendung: Molybdän ist ein zinnweißes, hartes und sprödes Metall. Verwendung als Legierungsbestandteil in Stählen (Molybdänstähle sind besonders hart und zäh). Molybdänverbindungen: Molybdän tritt in seinen Verbindungen hauptsächlich mit der Oxidationszahl IV oder VI auf. Beispiel für Molybdän(IV)Verbindungen: Molybdän(IV)-sulfid MoS2 , das in einem Schichtgitter kristallisiert und sich durch leichte Spaltbarkeit und hohe Schmierfähigkeit auszeichnet. In der Oxidationsstufe VI bildet Molybdän wie Vanadium Isopolysäuren (vgl. 10.12.1).
10.13.3 Wolfram
Vorkommen: Wolfram (FeII , Mn)WO4 , Scheelit CaWO4 , Wolframocker WO3 · xH2 O. Eigenschaften, Darstellung: Wolfram ist ein weißglänzendes Metall von hoher Festigkeit. Es hat mit 3422 ◦ C den höchsten Schmelzpunkt aller Metalle. Die Darstellung erfolgt durch Reduktion von Wolfram(VI)-oxid WO3 mit Wasserstoff. Das dabei entstehende Pulver wird zu größeren Stücken gesintert. Verwendung: Legierungsbestandteil von Wolframstählen (z. B. Schnellarbeitsstählen), als Glühfäden in Lampen. Wolframverbindungen: In seinen Verbindungen tritt Wolfram hauptsächlich mit der Oxidationszahl VI auf. Beim Ansäuern wässriger Natriumwolframatlösungen (Natriumwolframat Na2 WO4 ) tritt Aggregation zu Isopolysäuren ein (vgl. Vanadium und Molybdän). Beispiel: Natriummetawolframat Na6 [H2 W12 O40 ] ist das Natriumsalz der Metawolframsäure. Wässrige Lösungen von Natriummetawolframat dienen als Schwereflüssigkeit (Dichte einer gesättigten Lösung: 3,1 g/cm3 ) .
10.14 Mangangruppe (VII. Nebengruppe) Zur Mangangruppe gehören Mangan Mn, Technetium Tc und Rhenium Re, vgl. Tabelle 10-13. Technetium kommt in der Natur nicht vor. Es entsteht z. B. beim Beschuss von Molybdän mit Deuteronen d (= 2 H+ ) und bei der Uranspaltung. 10.14.1 Mangan
Vorkommen: Braunstein (Pyrolusit) MnO2 , Braunit Mn2 O3 , Hausmannit Mn3 O4 , Manganspat MnCO3 und als Bestandteil der in der Tiefsee vorkommenden Manganknollen. Eigenschaften, Verwendung: Mangan ist ein sprödes, hartes silbergraues Metall. Es erhöht als Legierungsbestandteil des Stahls dessen Härte und Zähigkeit. Manganverbindungen: In seinen Verbindungen kommt Mangan in den Oxidationszahlen I, II, III, IV, VI und VII vor. Kaliumpermanganat KMnVII O4 ist ein wichtiges Reagenz zur maßanalytischen Bestimmung (vgl. 4.7.2) von Reduktionsmitteln,
C79
C80
C Chemie
Tabelle 10-13. Eigenschaften der Elemente der Mangangruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte a
pm ◦ C ◦ C g/cm3
Mangan [Ar]3d5 4s2 137 1246 2061 7,21–7,44 a
Technetium [Kr]4d6 5s 135 2157 4265 11,5 (berechnet)
Rhenium [Xe]4f14 5d5 6s2 137 3186 5596 21,02 (20 ◦ C)
abhängig von der Modifikation .
wie z. B. Fe2+ -Ionen und Oxalationen C2 O2− 4 sowie von Wasserstoffperoxid H2 O2 und Nitritionen NO−2 . Das Permanganation MnO−4 wird dabei je nach dem pH-Wert der Lösung zu Mn2+ bzw. Mangandioxid MnIV O2 reduziert (vgl. 9.2): MnO−4 + 8 H+ + 5 e− Mn2+ + 4 H2 O (Reaktion in saurer Lösung) bzw. MnO−4 + 4 H+ + 3 e− MnO2 (s) + 2 H2 O (Reaktion in neutraler oder alkalischer Lösung).
10.15 Eisenmetalle und Elementgruppe der Platinmetalle (VIII. Nebengruppe) Zur Elementgruppe der Eisenmetalle gehören die in der 4. Periode der Nebengruppe VIIIA angeordneten Elemente Eisen Fe, Cobalt Co und Nickel Ni, vgl. Tabelle 10-14. Es sind Metalle mit hohem Schmelzpunkt und hoher Dichte. In ihren Verbindungen treten sie hauptsächlich mit den Oxidationszahlen II und III auf. Nickel kommt in seinen Verbindungen überwiegend in der Oxidationsstufe II vor. Zur Elementgruppe der Platinmetalle gehören Ruthenium Ru, Rhodium Rh, Palladium Pd sowie Osmium Os, Iridium Ir und Platin Pt, vgl. Tabelle 10-14. Diese Elemente sind reaktionsträge. Sie zählen, da ihre Standardelektrodenpotenziale positiv sind, zu den Edelmetallen. 10.15.1 Eisen
Vorkommen: Magneteisenstein (Magnetit) Fe3 O4 , Roteisenstein (Hämatit) Fe2 O3 , Brauneisenstein Fe2 O3 · xH2 O, Spateisenstein (Siderit), FeCO3 und Eisenkies (Pyrit) FeS2 .
Eigenschaften, Verwendung, Darstellung: Reines Eisen ist ein silberweißes, verhältnismäßig weiches Metall. Es kommt in drei Modifikationen vor: α-Eisen (kubisch raumzentriert), γ-Eisen (kubisch dichteste Kugelpackung) und δ-Eisen (kubisch raumzentriert). Die Umwandlungstemperatur zwischen α- und γ-Fe beträgt 906 ◦ C, die zwischen γ- und δ-Fe 1401 ◦ C. α-Eisen ist, wie auch Cobalt und Nickel, ferromagnetisch. Bei der Curie-Temperatur von 768 ◦ C wird es paramagnetisch. Das Standardelektrodenpotenzial (Fe/Fe2+ ) ist −0,440 V. Daher ist reines Eisen recht reaktionsfähig. Von feuchter CO2 -haltiger Luft wird es angegriffen. Es bilden sich Eisen(III)-oxid-hydrate (Rost). Pulverförmiges, gittergestörtes Eisen entzündet sich von selbst an der Luft (pyrophores Eisen). Weiteres siehe D 3.3. Zur Eisengewinnung werden die oxidischen Erze fast ausschließlich in Hochöfen reduziert, vgl. 9.3.3. Eisenverbindungen: Eisen tritt in seinen Verbindungen hauptsächlich in den Oxidationszahlen II und III auf. Zwischen beiden Oxidationsstufen existiert folgendes Redoxgleichgewicht: Fe2+ Fe3+ + e− . Beispiele für Eisen(II)-Verbindungen: Eisensulfat FeSO4 , Beispiele für Eisen(III)-Verbindungen: Fe3+ Ionen in Wasser: Beim Auflösen von Fe(III)-Salzen in Wasser bilden sich [Fe(H2 O)6 ]3+ -Ionen. Bei Basenzusatz entstehen unter Braunfärbung kolloide Kondensate der Zusammensetzung (FeOOH) x · yH2 O. 10.15.2 Cobalt
Vorkommen: Speiskobalt (Skutterudit) (Co,Ni)As3 , Kobaltglanz (Cobaltit) CoAsS, Kobaltkies (Linneit) Co3 S4 .
10 Die Elementgruppen
Tabelle 10-14. Eigenschaften der Elemente der VIII. Nebengruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (20 ◦ C)
pm ◦ C ◦ C g/cm3
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (20 ◦ C)
pm ◦ C ◦ C g/cm3
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte
pm ◦ C ◦ C g/cm3
Eisen [Ar]3d6 4s2 124 1538 2861 7,874 Ruthenium [Kr]4d7 5s 133 2334 4150 12,41 Osmium [Xe]4f14 5d6 6s2 134 3033 5012 22,57
Eigenschaften, Verwendung: Cobalt ist ein stahlgraues, glänzendes Metall. Von feuchter Luft wird Cobalt nicht angegriffen. Verwendet wird es z. B. als Bestandteil korrosionsbeständiger und hochwarmfester Legierungen. Ein Sinterwerkstoff aus Wolframcarbid WC in einer Cobaltmatrix von ca. 10 Gew.-% Cobalt wird als Widia („wie Diamant“) bezeichnet. Es dient zur Herstellung von Schneidwerkzeugen. 10.15.3 Nickel
Vorkommen: Rotnickelkies (Nickelin) NiAs. Eigenschaften, Darstellung: Nickel ist ein silberweißes, zähes Metall, das sich ziehen, walzen und schmieden lässt. Kompaktes Nickel ist gegenüber Luft und Wasser korrosionsbeständig. Weiteres siehe D 3.4.5. Da Nickelmineralien verhältnismäßig selten sind, wird es als Nebenprodukt bei der Aufbereitung von Kupferkies CuFeS2 gewonnen. Nickelverbindungen: Mit Kohlenmonoxid bildet Nickel bei hohen Temperaturen tetraedrisches Nickeltetracarbonyl Ni(CO)4 (Oxidationszahl des Nickels 0). Die Bildung und anschließende Zersetzung von Nickeltetracarbonyl dient zur Reindarstellung von Nickel nach dem sog. Mond-Verfahren. Außer Nickel bilden auch andere Metalle der Nebengruppen VA bis
Cobalt [Ar]3d7 4s2 125 1495 2927 8,9 Rhodium [Kr]4d8 5s 134 1964 3695 12,41 Iridium [Xe]4f14 5d7 6s2 136 2446 4428 22,42 (17 ◦ C)
Nickel [Ar]3d8 4s2 125 1455 2913 8,902 (25 ◦ C) Palladium [Kr]4d10 138 1555 2963 12,02 Platin [Xe]4f14 5d9 6s 137 1768 3825 21,45 (20 ◦ C)
VIIIA Kohlenmonoxidverbindungen, die als Metallcarbonyle bezeichnet werden.
10.16 Kupfergruppe (I. Nebengruppe) Zur Kupfergruppe, vgl. Tabelle 10-15, gehören Kupfer Cu, Silber Ag und Gold Au. Sie besitzen positive Standardelektrodenpotenziale und sind daher Edelmetalle (vgl. 9.5.3). Kupfer, Silber und Gold kristallisieren in der kubisch-dichtesten Kugelpackung (vgl. 5.3.2). 10.16.1 Kupfer
Vorkommen: Kupferkies (Chalkopyrit) CuFeS2 , Buntkupfererz (Bornit) Cu3 FeS3 , Rotkupfererz (Cuprit) Cu2 O, Malachit Cu2 (OH)2 CO3 und gediegen (elementar). Eigenschaften, Verwendung: Kupfer ist ein hellrotes, verhältnismäßig weiches, schmied- und dehnbares Metall. Bei Raumtemperatur besitzt es nach dem Silber die zweithöchste elektrische Leitfähigkeit aller Metalle (59,59 · 106 S/m, 20 ◦ C). Wichtiger Legierungsbestandteil z. B. in Messing (Cu-Zn-Legierungen), Bronzen (Kupferlegierungen mit mindestens 60% Cu) und Monel (Ni-Cu-
C81
C82
C Chemie
Tabelle 10-15. Eigenschaften der Elemente der Kupfergruppe
Elektronenkonfiguration Atomradius Schmelzpunkt Siedepunkt Dichte (20 ◦ C) a
pm ◦ C ◦ C g/cm3
Kupfer [Ar]3d10 4s 128 1084,62a 2562 8,96
Silber [Kr]4d10 5s 144 961,78a 2162 10,50
Gold [Xe]4f14 5d10 6s 144 1064,18a 2856 19,3
Fixpunkt der ITS-90 .
Legierungen). Monel zeichnet sich durch große Korrosionsbeständigkeit, auch gegenüber Chlor und Fluor, aus. Weiteres siehe D 3.4.4. Kupferverbindungen: Kupfer tritt in seinen Verbindungen hauptsächlich in den Oxidationszahlen I und II auf. Kupfer(I)-Verbindungen können leicht zu Kupfer(II)-Verbindungen oxidiert werden: Cu+ → Cu2+ + e− . 10.16.2 Silber
Vorkommen: Silberglanz (Argenit) Ag2 S, Hornsilber AgCl, in silberhaltigen Erzen (z. B. Bleiglanz PbS (0,01 bis 1 Gew.-% Ag) und Kupferkies CuFeS2 ) und gediegen. Eigenschaften, Verwendung: Silber ist ein weißglänzendes, weiches, dehnbares Metall. Bei Raumtemperatur hat es die höchste elektrische Leitfähigkeit aller Metalle (63,01 · 106 S/m, 20 ◦ C). Silber wird als kupferhaltige Legierung (zur Erhöhung der Härte) in der Schmuckindustrie, als Münzmetall und zum Versilbern von Gebrauchsgegenständen verwendet. Insbesondere Silberbromid AgBr wird in der Photographie eingesetzt (s. u.). Silberverbindungen: In seinen Verbindungen tritt Silber hauptsächlich mit der Oxidationszahl I auf: Silberchlorid AgCl, Silberbromid AgBr und Silberiodid AgI. Die genannten Halogenide sind in Wasser schwerlöslich (vgl. 8.8). Durch Licht werden sie gemäß folgender Bilanzgleichung zersetzt: AgX + hν → Ag + 1/2 X2 hν Photon hinreichend hoher Energie; X = Cl, Br oder I. 10.16.3 Gold
Vorkommen: Hauptsächlich gediegen.
Eigenschaften, Verwendung: Gold ist ein rötlichgelbes, weiches Metall. Neben Kupfer, Caesium, Calcium, Strontium und Barium ist Gold das einzige Metall, das das Licht des sichtbaren Spektrums nicht fast vollständig reflektiert und deshalb farbig erscheint. Legiertes Gold wird u. a. zur Schmuckherstellung, als Zahngold und für elektrische Kontakte in der Elektronik verwendet. In seinen Verbindungen tritt Gold mit den Oxidationszahlen I, III und V auf. Beispiele für Goldverbindungen sind: Gold(III)-chlorid AuCl3 und Gold(V)-fluorid AuF5 .
10.17 Zinkgruppe (II. Nebengruppe) Zur Zinkgruppe, vgl. Tabelle 10-16, gehören Zink Zn, Cadmium Cd und Quecksilber Hg. Die Standardelektrodenpotenziale von Zink und Cadmium sind negativ, das des Quecksilbers ist positiv. Quecksilber ist also ein edles Metall. Zink und Cadmium kommen hauptsächlich in der Oxidationszahl II vor. Quecksilber tritt in seinen Verbindungen häufig auch in der Oxidationsstufe I auf. An der Luft überziehen sich Zink und Cadmium mit einer dünnen Deckschicht (Oxid, Hydroxid, Carbonat), die sie vor weiterem Angriff durch Wasser und Sauerstoff schützt. 10.17.1 Zink
Vorkommen: Zinkblende ZnS (kubisch) bzw. Wurtzit ZnS (hexagonal) (natürliche Modifikationen des Zinksulfids ZnS), Zinkspat ZnCO3 . Eigenschaften, Verwendung, Darstellung: Zink ist ein bläulichweißes Metall, das bei Raumtemperatur recht spröde ist. Seinem Standardelektrodenpotenzial entsprechend (–0,762 V bezogen auf die Elektrodenreaktion Zn Zn2+ + 2 e− ) reagiert Zink mit Säuren unter Bildung von Wasserstoff, z. B.: Zn + 2 HCl ZnCl2 + H2 (g) .
10 Die Elementgruppen
Tabelle 10-16. Eigenschaften der Elemente der Zinkgruppe
Elektronenkonfiguration Atomradius pm ◦ Schmelzpunkt C ◦ Siedepunkt C Dichte (20 ◦ C) g/cm3 a Fixpunkt der ITS-90 .
Zink [Ar]3d10 4s2
Cadmium [Kr]4d10 5s2
Quecksilber [Xe]4f14 5d10 6s2
133 419,527 a 907 7,133 (25 ◦ C)
149 321,1 767 8,65
150 -38,83 356,73 13,546
Zink ist Legierungsbestandteil z. B. von Messing (CuZn-Legierung) und dient als dünner Überzug zum Korrosionsschutz von Eisen und Stahl. Über die Anwendung des Zinks in Primärelementen siehe 9.7. Die Darstellung erfolgt entweder durch Reduktion von Zinkoxid ZnO mit Kohle oder elektrochemisch durch Elektrolyse wässriger Zinksulfatlösungen. 10.17.2 Quecksilber
Vorkommen: Zinnober HgS (Quecksilber(II)-sulfid), gediegen (elementar) in Form kleiner Tröpfchen. Eigenschaften, Verwendung: Quecksilber ist das einzige bei Raumtemperatur flüssige Metall, Schmelzpunkt −38,84 ◦ C, Dichte des flüssigen Quecksilbers 13,546 g/cm3 (20 ◦ C). Der Sättigungsdampfdruck des flüssigen Hg beträgt bei 25 ◦ C 0,25 Pa. Quecksilberdämpfe sind stark toxisch (MAK-Wert: 0,01 ppm). Quecksilberlegierungen heißen Amalgame. Einige Amalgame, wie z. B. Silberamalgam, sind unmittelbar nach der Herstellung weich und knetbar und erhärten nach einiger Zeit. Aufgrund dieser Eigenschaft wird Silberamalgam für Zahnfüllungen eingesetzt. Verwendung von reinem Quecksilber in Thermometern und Barometern. Quecksilberverbindungen: Hg(I)-Verbindungen enthalten die dimeren Ionen Hg2+ 2 , Beispiel: Quecksilber(I)chlorid (Kalomel) Hg2 Cl2 . Beispiel einer Hg(II)-Verbindung: Quecksilber(II)-chlorid (Sublimat) HgCl2 . Im festen Zustand existiert diese Verbindung in Form von HgCl2 -Molekülen. Auch in wässriger Lösung bleiben diese Teilchen weitgehend erhalten. Das haben z. B. Untersuchungen der Gefrierpunktserniedrigung (vgl. 8.2.2) und Messungen des osmotischen Druckes (vgl. 8.2.3) an wässrigen HgCl2 -Lösungen bewiesen. Quecksilber(II)-chlorid
ist also kein typisches Salz, sondern eine Verbindung mit hohem kovalenten Bindungsanteil. HgCl2 hat den Trivialnamen Sublimat, weil es leicht sublimiert.
10.18 Die Lanthanoide Bei der Elementgruppe der Lanthanoide (früher: Lanhanide) werden die 4f-Niveaus der Elektronenhülle aufgebaut (vgl. 2.1). Zu dieser Gruppe gehören die auf das Lanthan (57 La) folgenden 14 Elemente Cer Ce, Praseodym Pr, Neodym Nd, Promethium Pm, Samarium Sm, Europium Eu, Gadolinium Gd, Terbium Tb, Dysprosium Dy, Holmium Ho, Erbium Er, Thulium Tm, Ytterbium Yb und Lutetium Lu, vgl. Tabelle 10-17. Heute wird häufig auch das Lanthan selbst zu den Lanthanoiden gerechnet. Der Sammelname Seltenerdmetalle bezeichnet die Lanthanoide zusammen mit Lanthan, Scandium und Yttrium. Lanthanoidenkontraktion: Unter der Lanthanoidenkontraktion versteht man die monotone Abnahme der Ionenradien mit steigender Ordnungszahl (vgl. Tabelle 10-17). Die Lanthanoidenkontraktion ist eine Folge der wachsenden Kernladungszahl bei gleichzeitiger Auffüllung der inneren 4f-Niveaus. Sie ist der Grund dafür, dass die auf die Lanthanoide in der 6. Periode folgenden Elemente (Hafnium, Tantal, Wolfram usw.) fast die gleichen Ionenradien aufweisen wie ihre leichteren Homologen (Zirconium, Niob, Molybdän usw.) in der 5. Periode. Eigenschaften: Die Lanthanoide sind silberweiße, sehr reaktionsfähige Metalle. Die Standardelektrodenpotenziale liegen zwischen −2,48 V (Cer) und −2,25 V (Lutetium) (bezogen auf die Elektrodenreaktion Me Me3+ + 3 e− ). Die Metalle reagieren mit Wasser unter Wasserstoffentwicklung. Da sich
C83
C84
C Chemie
Tabelle 10-17. Eigenschaften der Lanthanoide
Cer Praseodym Neodym Promethium Samarium Europium Gadolinium Terbium Dysprosium Holmium Erbium Thulium Ytterbium Lutetium
Elektronenkonfiguration [Xe]4f1 sd1 6s2 [Xe]4f3 6s2 [Xe]4f4 6s2 [Xe]4f5 6s2 [Xe]4f6 6s2 [Xe]4f7 6s2 [Xe]4f7 5d6s2 [Xe]4f9 6s2 [Xe]4f10 6s2 [Xe]4f11 6s2 [Xe]4f12 6s2 [Xe]4fl3 6s2 [Xe]4fl4 6s2 [Xe]4f14 5d6s2
Atomradius pm 182,5 182,8 182,1 181,1 180,4 204,2 180,1 178,3 177,4 176,4 175,7 174.6 193,9 173,5
Radius des M3+ -Ions pm 115 113 112 111 110 109 108 106 105 104 103 102 101 100
Schmelzpunkt ◦ C 798 931 1021 1042 1074 822 1313 1356 1412 1474 1529 1545 819 1663
Siedepunkt ◦ C 3443 3520 3074 3000 1794 1527 3273 3230 2567 2700 2868 1950 1196 3402
Kristallstruktur kd hds hds hds rhomb krz hd hd hd hd hd hd kd hd
Dichte (25 ◦ C) g/cm3 6,770 6,773 7,008 7,264 7,520 5,244 7,901 8,230 8,551 8,795 9,066 9,321 6,966 9,841
kd kubisch dichteste Kugelpackung, hd hexagonal dichteste Kugelpackung, krz kubisch raumzentriert, rhomb rhomboedrisch, hds dichteste Kugelpackung mit der Stapelsequenz A B A C ... (Lanthan-Typ)
die Lanthanoide im Wesentlichen nur in der Elektronenkonfiguration des 4f-Niveaus, das nur geringen Einfluss auf die chemischen Eigenschaften hat, unterscheiden, ähneln sich diese Elemente chemisch außerordentlich. Daher bereitete ihre Trennung und Reindarstellung lange Zeit erhebliche Schwierigkeiten. Heute werden die Lanthanoide entweder durch Ionenaustausch mit Kationenaustauschern oder durch Flüssig-Flüssig-Extraktionsverfahren getrennt. Die reinen Metalle werden durch Reduktion der Trichloride (Ce bis Gd) bzw. der Trifluoride (Tb, Dy, Ho, Er, Tm und Y) mit Calcium bei 1000 ◦ C dargestellt. Promethium wird durch Reduktion von PmF3 mit Lithium erhalten. In den Verbindungen treten die Lanthanoide hauptsächlich als Kationen mit der Ladungszahl +3 auf. Cer bildet auch Ce4+ -Ionen, Samarium, Europium und Ytterbium auch Me2+ -Ionen. Verwendung: Aufgrund ihres Fluoreszenz- bzw. Lumineszenzverhaltens werden z. B. Terbium, Holmium und Europium als Oxidphospore in Bildröhren verwendet. Eine Legierung, die neben Eisen leichtere Lanthanoidmetalle enthält, wird als Zündstein in Feuerzeugen eingesetzt. Darüber hinaus finden Lanthanoide u. a. zur Herstellung farbiger Gläser, in Feststoffasern (z. B. Nd-Laser) und als Legie-
rungsbestandteile in hartmagnetischen Werkstoffen Verwendung.
10.19 Die Actinoide Bei der Elementgruppe der Actinoide (früher: Actinide) werden die 5f-Niveaus der Elektronenhülle aufgebaut (vgl. 2.1). Die Gruppe umfasst die auf das Actinium (89 Ac) folgenden 14 Elemente Thorium Th, Protactinium Pa, Uran U, Neptunium Np, Plutonium Pu, Americium Am, Curium Cm, Berkelium Bk, Californium Cf, Einsteinium Es, Fermium Fm, Mendelevium Md, Nobelium No und Lawrencium Lr, vgl. Tabelle 10-18. Heute wird häufig auch das Actinium selbst mit zu den Actinoiden gerechnet. Die auf das Uran folgenden Elemente heißen Transurane. Eigenschaften: Die Actinoide sind sehr reaktionsfähige Metalle. Die Standardelektrodenpotenziale liegen zwischen −1,17 V (Thorium) und −2,07 V (Americium) (bezogen auf die Elektrodenreaktion Me Me3+ + 3e− ). Frische Metalloberflächen oxidieren rasch an der Luft. Im feinverteilten Zustand sind die Actinoide pyrophor, d. h. sie entzünden sich von selbst an der Luft. Alle Actinoide und ihre Verbindungen sind stark toxisch. In den Verbindungen treten die Actinoide mit Oxidationszahlen
10 Die Elementgruppen
Tabelle 10-18. Eigenschaften der Actinoide
Elektronenkonfiguration [Rn]6d2 7s2 [Rn]5f2 6d7s2 [Rn]5f3 6d7s2 [Rn]5f5 7s2 [Rn]5f6 7s2 [Rn]5f7 7s2 [Rn]5f7 6d7s2 [Rn]5f9 7s2 [Rn]5f10 7s2 [Rn]5f11 7s2 [Rn]5f12 7s2 [Rn]5f13 7s2 [Rn]5f14 7s2 [Rn]5f14 6d7s2
Thorium Protactinium Uran Neptunium Plutonium Americium Curium Berkelium Californium Einsteinium Fermium Mendelevium Nobelium Lawrencium
Atomradius pm 180 164 154 150 152 173 174 170 169 (169) (194) (194) (194) (171)
Schmelzpunkt ◦ C 1750 1572 1132 640 641 994 1340 986 900
zwischen II und VII auf. Thorium kommt in seinen Verbindungen praktisch nur mit der Oxidationszahl IV vor (z. B. Thoriumnitrat ThIV (NO3 )4 ). Bei Uranverbindungen werden Oxidationszahlen zwischen III und VI beobachtet, wobei IV und VI die beständigsten sind (z. B. Uranylnitrat UVI O2 (NO3 )2 ). Neptunium und Plutonium treten in ihren Verbindungen mit Oxidationszahlen zwischen III und VII auf, wobei V (Np) bzw. IV (Pu) die beständigsten sind. Bis auf die natürlich vorkommenden Actinoide Thorium, Protactinium und Uran (in winzigen Mengen kommen auch 237 Np, 239 Np und 239 Pu in Uranerzen vor) werden die Elemente dieser Gruppe künstlich durch Kernreaktionen dargestellt. Dabei wird vor allem die Bestrahlung von Uran, Plutonium und Americium mit Neutronen angewendet. Bei diesen Verfahren entstehen durch Neutroneneinfang bevorzugt β− -aktive Nuklide. Beim β− -Zerfall erhöht sich die Ordnungszahl um eine Einheit: n,y A+1 β− A+1 A Z X −→ Z X −→ Z+1 Y
X, Y Elemente der Ordnungszahl Z bzw. Z + 1, A Massenzahl. 10.19.1 Thorium
Vorkommen: Monazit (Ce,Th)[(P, Si)O4 ].
Siedepunkt ◦ C 4788 4131 3903 3228 2011
Dichte g/cm3 11,72 15,37 18,95 20,25 19,84 13,67 13,51
Wichtiges Isotop: 232 90 Th, Häufigkeit 100%, Halbwertszeit T 1/2 = 1,405 · 10l0 a, Zerfall: α, γ. 232 Th ist Ausgangsnuklid für die Gewinnung von 233 U, das mit thermischen Neutronen spaltbar ist (vgl. B 17.4). Die Darstellung von 233 U erfolgt in einem Brutreaktor. Der Zweck eines derartigen Brutreaktors ist die Erzeugung von spaltbaren Stoffen aus nicht spaltbaren Nukliden.Als Brutreaktoren für die Gewinnung von 233 U können z. B. gasgekühlte Hochtemperaturreaktoren eingesetzt werden. Der Brutvorgang kann mit folgender Umsatzgleichung beschrieben werden: 232
β− β− 6 7 Th n, γ 233 Th −→ 233 Pa −→ 233 U .
10.19.2 Uran
Vorkommen: Uranpecherz (Uranpechblende) UO2 , Uraninit U3 O8 , Uranglimmer (z. B.: Torbernit Cu(UO2 )2 (PO4 )2 · 8 H2 O), im Meerwasser mit 3,2 mg U pro Tonne. Wichtige Isotope: 238 92 U relative Häufigkeit 99,276 Gew.-%, T 1/2 = 4,468 · 109 a, Zerfall: α, γ; 235 U, relative Häufigkeit 0,7205 Gew.-%, T 1/2 = 7,038· 108 a, Zerfall: α, γ; 233 U T 1/2 = 1,585 · 105 a, Zerfall: α, γ (Gewinnung von 233 U siehe 10.19.1). Die Trennung der beiden natürlich vorkommenden Isotope 235 U und 238 U kann durch fraktionierte Diffusion von gasförmigem Uranhexafluorid UF6 erfolgen. Weitere
C85
C86
C Chemie
Verfahren zur Isotopentrennung sind z. B. Ultrazentrifugation, Thermodiffusion und optische Verfahren. Die Isotope 235 U und 233 U sind mit thermischen Neutronen spaltbar und dienen daher als Kernbrennstoff für Kernreaktoren. Anfangs wurde 235 U auch zur Herstellung der Atombomben verwendet. 238 92 U ist Ausgangsmaterial für die Gewinnung von spaltbarem Plutonium 239 94 Pu in Brutreaktoren: 238
β− β− 6 7 U n, γ 239 U −→ 239 Np −→ 239 Pu .
Die Trennung von Uran, Plutonium und Spaltprodukten erfolgt mit einem Wiederaufarbeitungsverfahren. Ein Beispiel ist das Purex-Verfahren (Plutonium and Uranium Recovery by Extraction). Bei diesem Extraktionsverfahren werden die Kernbrennstoffe in wässriger Salpetersäure gelöst und anschließend Uran und Plutonium extrahiert. Als Extraktionsmittel dient ein Gemisch aus Tri-n-butylphosphat mit Dodecan oder mit Kerosin. 10.19.3 Plutonium
Wichtiges Isotop: 239 94 Pu, α-Strahler, Halbwertszeit T 1/2 = 2,411 · 104 a, wird bei der Bestrahlung von 238 233 U 92 U mit Neutronen gebildet (siehe 10.19.2). Wie 235 239 und U ist auch Pu durch thermische Neutronen spaltbar. Es ist daher als Brennstoff für Kernreaktoren und als Spaltmaterial für Kernwaffen geeignet.
11 Organische Verbindungen 11.1 Organische Chemie: Überblick Als organische Chemie wird die Chemie der Kohlenstoffverbindungen zusammengefasst. Jedoch werden die verschiedenen Modifikationen des Kohlenstoffs und die Oxide des Kohlenstoffs, die Carbonate, Carbide und die Metallcyanide, zur anorganischen Chemie gerechnet. Die meisten organischen Verbindungen enthalten neben Kohlenstoff nur verhältnismäßig wenige andere Elemente, vor allem Wasserstoff, Sauerstoff, Stickstoff und Halogene. Die Besonderheit des Kohlenstoffs besteht darin, dass er in fast unbegrenztem Maße Bindungen mit sich selbst eingehen und auf diese Weise
ketten- und ringförmige Strukturen ausbilden kann. Überschreitet die molare Masse einen gewissen, eigenschaftsabhängigen Wert, spricht man von Makromolekülen (s. 12). Nach der Art des Aufbaus der Kohlenstoffgerüste wird zwischen folgenden Verbindungsklassen unterschieden: – Aliphatische Verbindungen enthalten unverzweigte oder verzweigte Kohlenstoffketten. – Alicydische Verbindungen sind durch unterschiedlich große Kohlenstoffringe charakterisiert. In der Bindungsart ähneln sie den aliphatischen Verbindungen. – Aromatische Verbindungen sind zusätzlich zu einem ebenen, ringförmigen Aufbau durch besondere Bindungsverhältnisse charakterisiert (siehe 11.3). – Heterocyclische Verbindungen sind ebenfalls ringförmig aufgebaut. Der Ring enthält jedoch neben Kohlenstoff auch andere Atome (sog. Heteroatome), vgl. Tabelle 11-3.
11.2 Isomerie bei organischen Molekülen Chemische Verbindungen nennt man isomer, wenn sie bei gleicher quantitativer Zusammensetzung – also bei gleicher Summenformel – strukturell verschieden aufgebaut sind. Im Folgenden wird zwischen Struktur- und Stereoisomerie unterschieden. Isomere Stoffe unterscheiden sich in physikalischen und chemischen Eigenschaften, z. B. durch die Schmelz- und Siedepunkte, die Löslichkeit, die Kristallform sowie durch ihr Verhalten im polarisierten Licht. 11.2.1 Strukturisomerie
Strukturisomere Verbindungen unterscheiden sich voneinander durch eine unterschiedliche Atomverknüpfung in den Molekülen. Zum Teil treten bei diesem Isomerietyp auch unterschiedliche Bindungsarten auf. Beispiele – Die strukturisomeren Verbindungen Ethanol (Ethylalkohol) und Dimethylether haben bei-
11 Organische Verbindungen
de dieselbe Summenformel C2 H6 O, weisen aber verschiedene Strukturen mit unterschiedlichen Atomverknüpfungen auf. Ethanol und Dimethylether zeigen neben unterschiedlichen physikalisch-chemischen Eigenschaften auch verschiedenartiges chemisches Verhalten. So reagiert Ethanol im Gegensatz zu Dimethylether mit metallischem Natrium unter Bildung von gasförmigem Wasserstoff und Natriumalkoholat.
Beispiel: 1,2-Dichlorethylen C2 H2 Cl2 :
Der Abstand der Cl-Atome unterscheidet sich bei den beiden Chlorkohlenwasserstoffen. Er beträgt bei der cis-Form dieser Verbindung 370 pm und bei der trans-Form 470 pm. Spiegelbildisomerie
– Bei dem gesättigten Kohlenwasserstoff Butan (vgl. 11.3.1) sind folgende strukturisomere Verbindungen möglich (Summenformel C4 H10 ):
11.2.2 Stereoisomerie
Spiegelbildisomerie tritt bei Molekülen auf, die in zwei zueinander spiegelbildlichen, aber nicht deckungsgleichen Formen auftreten. Dieser Isomerietyp ist bei allen Verbindungen, die ein asymmetrisches Kohlenstoffatom enthalten, vorhanden. Ein solches C-Atom ist dadurch gekennzeichnet, dass an ihm vier unterschiedliche Atome oder Atomgruppen (sog. Liganden) tetraedrisch gebunden sind. Das chemische Verhalten der beiden spiegelbildisomeren Formen, die auch als optische Antipoden bezeichnet werden, ist bei fast allen Reaktionen völlig gleich. Zwei Spiegelbildisomere unterscheiden sich aber z. B. dadurch, dass sie die Ebene des linear polarisierten Lichtes in entgegengesetzte Richtung drehen. Spiegelbildisomerie wird bei den meisten organischen Naturstoffen, so z. B. bei Kohlenhydraten und Proteinen, beobachtet. Beispiel:
Stereoisomere Verbindungen zeigen unterschiedliche räumliche Anordnung von Atomen oder Atomgruppen im Molekül. Nachfolgend werden zwei Typen der Stereoisomerie näher beschrieben: die cis-trans-Isomerie und die Spiegelbildisomerie. Cis-trans-Isomerie
Dieser Isomerietyp tritt z. B. bei den Derivaten des Ethylens auf, bei denen infolge der Doppelbindung die freie Drehbarkeit um die C–C-Achse durch eine hohe Energiebarriere aufgehoben ist (vgl. 11.3.1). Die Atome oder Atomgruppen können zwei stabile, durch unterschiedliche Atomabstände gekennzeichnete Lagen einnehmen.
Die Buchstaben d und l kennzeichnen die Konfiguration am asymmetrischen C-Atom. Die Vorzeichen + und − geben die Drehrichtung der Polarisationsebene des linear polarisierten Lichtes an.
11.3 Kohlenwasserstoffe Kohlenwasserstoffe sind ausschließlich aus Kohlenstoff und Wasserstoff aufgebaut. Kohlenwasserstof-
C87
C88
C Chemie
Tabelle 11-1. Einteilung der Kohlenwasserstoffe (KW)
fe mit kettenförmiger Anordnung der C-Atome heißen aliphatische Kohlenwasserstoffe. Sind die Kohlenstoffatome ringförmig angeordnet, so spricht man von ringförmigen oder cyclischen Kohlenwasserstoffen. Diese werden nach der Art der Bindung in alicyclische und aromatische Kohlenwasserstoffe unterteilt (vgl. Tabelle 11-1). 11.3.1 Aliphatische Kohlenwasserstoffe Alkane Cn H2n+2
Alkane (früher: Paraffine) sind unverzweigte und verzweigte Kohlenwasserstoffe, die ausschließlich C–H- und C–CEinfachbindungen enthalten. Verbindungen, die nur einfache C–C-Bindungen enthalten, werden als gesättigt bezeichnet. Die Zusammensetzung der Alkane wird durch die Summenformel Cn H2n+2 beschrieben. Die Alkane sind das einfachste Beispiel einer homologen Reihe. Darunter versteht man eine Gruppe von Verbindungen, deren einzelne Glieder sich durch eine bestimmte Atomgruppierung (hier CH2 ) oder ein Vielfaches davon unterscheiden. Glieder einer homologen Reihe zeigen große Ähnlichkeit im chemischen Verhalten. Nomenklatur
Die ersten vier Glieder der Alkane werden mit sog. Trivialnamen bezeichnet und heißen: Methan CH4 Ethan H3 C–CH3
Propan H3 C–CH2 –CH3 Butan H3 C–CH2 –CH2 –CH3 Die Namen der höheren Glieder bestehen aus einem Stamm, der von einem griechischen Zahlwort hergeleitet ist, und der Endung -an (siehe Tabelle 11-2). Benennung verzweigter Alkane: Die Bezeichnungen der Seitenketten werden der längsten vorhandenen Kette vorangestellt. Die längste Kette wird von einem Ende zum anderen nummeriert. Dabei wählt man die Richtung derart, dass Verzweigungsstellen möglichst niedrige Nummern erhalten. Beispiel: Die Verbindung Isobutan (vgl. 11.2.1)
hat den systematischen Namen 2-Methylpropan. Tabelle 11-2. Schmelz- und Siedepunkte der Alkane, T sl
und T lg (bezogen auf 101 325 Pa) (vgl. auch Tabelle 5-2) Name Methan Ethan Propan Butan Pentan Hexan Heptan Octan Nonan Decan Undecan Dodecan
Formel CH4 C 2 H6 C 3 H8 C4 H10 C5 H12 C6 H14 C7 H16 C8 H18 C9 H20 C10 H22 C11 H24 C12 H26
T sl /◦ C −182 −183,3 −189,7 −138,4 −130 −95,0 −90,6 −56,8 −51 −29,7 −25,6 −9,6
T lg /◦ C −164 −88,6 −42,1 −0,5 36,1 69,0 98,4 125,7 150,8 174,1 196,8 216,3
11 Organische Verbindungen
Benennung der Alkyl-Reste: Alkyl-Reste entstehen aus Alkanen durch Wegnahme eines endständigen Wasserstoffatoms. Diese Reste werden benannt, indem man die Endung -an im Namen des entsprechenden Alkans durch -yl ersetzt. Beispiele: Die Alkyl-Reste CH3 –, CH3 –CH2 –, und CH3 –CH2 –CH2 – heißen Methyl, Ethyl bzw. Propyl. Für die folgenden verzweigten Alkyl-Reste werden unsystematische Namen verwendet: Isopropyl (CH3 )2 CH– Isobutyl (CH3 )2 CH–CH– sec-Butyl H3 C–CH2 –(CH3 )CH– tert-Butyl (CH3 )3 C– (sec sekundär, tert tertiär) Struktur des Methans
Im Methanmolekül sind die vier C–H-Bindungen tetraedrisch angeordnet. Der Valenzwinkel (H–C–HWinkel) ist 109°28. Die Elektronenzustände am CAtom sind beim Methan wie auch bei allen anderen Alkanen sp3 -hybridisiert (vgl. 3.1.3. Eigenschaften, Reaktionen
Die Alkane sind farblose Verbindungen. Die niedrigen Glieder der Reihe bis einschließlich Butan sind bei Raumtemperatur gasförmig, die mittleren bis zum Hexadekan (C16 H34 ) flüssig und die höheren fest (vgl. Tabellen 5-2 und 11-2). Die Alkane sind recht reaktionsträge und verbinden sich nur mit wenigen Substanzen direkt, so z. B. mit Sauerstoff. Verbrennungsreaktionen der Alkane Die Verbrennungsreaktionen (vgl. 9.3.1) der Alkane
sind wie die aller Kohlenwasserstoffe stark exotherm. Daher werden diese Reaktionen technisch in großem Maße zur Energiegewinnung genutzt (Alkane sind die Hauptbestandteile von Erdgas, Benzin, Heizöl und Dieselkraftstoff). Gasmischungen, die aus Alkanen oder aus anderen Kohlenwasserstoffen und Luft bestehen, reagieren in bestimmten Bereichen der Zusammensetzung explosiv, teilweise sogar detonativ (vgl. 7.8). Ähnliches Verhalten zeigen auch viele andere organische Verbindungen. In Tabelle 11-3 sind die Explosionsgrenzen für einige organische Substanzen aufgeführt.
Tabelle 11-3. Explosionsgrenzen des Wasserstoffs und einiger organischer Verbindungen in Luft bei 20 ◦ C und 101 325 Pa. Die oberen Explosionsgrenzen der bei Raumbedingungen flüssigen Verbindungen wurden bei den in Klammern aufgeführten Temperaturen angegeben. φuL , φoL Volumenanteil des Brennstoffs an der unteren bzw. oberen Explosionsgrenze k. A.: keine Temperaturangabe Z: reines Acetylen kann explosiv in die Elemente zerfallen. Die aufgeführten Werte sind der Datenbank chemsafe und dem Tabellenwerk Brandes, W.; Möller, W.: Sicherheitstechnische Kenngrößen. Bremerhaven: Wirtschaftsverlag NW 2003 entnommen
Substanz Methan Ethan Propan Butan Ethylen Acetylen Benzol Toluol Methanol Ethanol Formaldehyd Acetaldehyd Aceton Ameisensäure Essigsäure Essigsäureethylester Diethylether Wasserstoff
φuL (%) φoL (%) 4,4 17,0 2,4 14,3 1,7 10,8 1,4 9,4 2,4 32,6 2,3 100 (Z) 1,2 ≈ 8,6 (k. A.) 1,1 7,8 (k. A.) 6,0 50 (100 ◦ C) 3,1 27,7 (100 ◦ C) 7,0 73,0 (k. A.) 4,0 57,0 (k. A.) 2,5 14,3 (100 ◦ C) 10,0 45,5 (100 ◦ C) ≈ 4,0 ≈ 17,0 (k. A.) 2,0 12,8 (100 ◦ C) 1,7 36,0 (k. A.) 4,0 77,0
Wichtige Alkane
Schmelz- und Siedepunkte, kritische Daten und die MAK-Werte einiger wichtiger Alkane sind in den Tabellen 5-2 und 11-2 aufgeführt. Alkene Cn H2n
Alkene (früher: Olefine) sind Kohlenwasserstoffe, die außer C–H– und C– C-Einfachbindungen auch eine C= =CDoppelbindung im Molekül enthalten. Alkene haben die allgemeine Summenformel Cn H2n . Kohlenwasserstoffe mit Doppel- oder Dreifachbindungen werden als ungesättigt bezeichnet.
C89
C90
C Chemie
Nomenklatur
Das erste Glied der Alkene heißt: =CH2 Ethylen H2 C= (systematischer Name: Ethen). Die Namen der höheren Glieder der homologen Reihe entsprechen denen der Alkane, jedoch wird hier anstelle der Endung -an die Endung -en verwendet; Beispiel: Propen H3 C–CH=CH2 . Bei höheren Gliedern der Alkene wird die Kette so nummeriert, dass die an den Doppelbindungen beteiligten Atome möglichst niedrige Zahlen erhalten. Man kennzeichnet die Lage der Doppelbindung durch Anführen der Nummer desjenigen C-Atoms, von dem aus sich die Doppelbindung zum nächst höheren CAtom erstreckt. Beispiel: 6
5
3
4
2
1
lekül sp2 -hybridisiert (vgl. 3.1.3). Die Hybridorbitale sind planar unter einem Winkel von 120° (trigonal) angeordnet. An jedem Kohlenstoffatom verbleibt ein p-Orbital, das senkrecht zur Ebene der Hybridorbitale steht. Die beiden sp2 -Hybrid-Orbitale bilden eine σ-Bindung zwischen den beiden C-Atomen aus. Zusätzlich überlappen sich die beiden p-Orbitale. Dabei entsteht eine π-Bindung. Die π-Bindung ist wegen der geringen Überlappung der p-Elektronenzustände nicht so fest wie die σ-Bindung. Sie besitzt eine geringere Bindungsenergie als die σ-Bindung. Als Folge der geschilderten Bindungsverhältnisse ist das Ethylen-Molekül eben aufgebaut. Der HCH-Winkel beträgt 120°. Dieses Bindungsmodell erklärt die Aufhebung der freien Drehbarkeit um die C–C-Atome folgendermaßen: Jede Drehung um diese Achse führt zu einer weniger guten Überlappung der beiden p-Elektronenzustände, was nur durch Energiezufuhr ermöglicht wird.
2-Hexen H3 C–CH2 –CH2 –CH=CH–CH3 . Eigenschaften und Reaktionen der Alkene
Benennung der Alkylen-Reste: Alkylen-Reste entstehen aus Alkenen durch Wegnahme eines Wasserstoffatoms. Die ersten Glieder dieser Reihe werden nicht systematisch benannt. Sie heißen vielmehr: H2 C=CH–
Vinyl
Allyl H2 C=CH–CH2 – Isopropenyl H2 C=C – | H3 C Die Namen der höheren Glieder entsprechen denen der Alkene. Sie haben jedoch die Endung -enyl. Beispiele: 2-Butenyl
4
3
2
1
5
4
3
2
H3 C–CH=CH–CH2 − 4
3-Pentenyl H3 C–CH=CH–CH2 –CH2 − Entfernt man beim Ethylen an einem C-Atom zwei Wasserstoffatome, erhält man den Vinyliden-Rest: Vinyliden H2 C=C= .
In ihren physikalischen Eigenschaften ähneln die Alkene den Alkanen. So sind z. B. die Alkene bis einschließlich des Butens bei Raumtemperatur gasförmig. Aufgrund ihrer Doppelbindung sind die Alkene reaktionsfähiger als die Alkane. Typisch für die Alkene sind Additionsreaktionen (z. B. Hydrierung und Halogenierung, siehe unten). Dabei werden aus der πBindung zwei neue Einfachbindungen (σ-Bindungen) gebildet. Einige physikalisch-chemische Eigenschaften des wichtigsten Alkens, des Ethylens, sind in Tabelle 5-2 aufgeführt. 1. Verbrennung Die leichtflüssigen Alkene bilden im Gemisch mit Luft explosionsfähige Gasmischungen. Die Explosionsgrenzen des Ethylens sind in Tabelle 11-3 angegeben. 2. Hydrierung (Anlagerung von Wasserstoff) Mit Wasserstoff reagieren die Alkene in Gegenwart von Katalysatoren zu Alkanen:
Struktur des Ethylens
Beispiel: H2 C=CH2 + H2 → H3 C–CH3 Ethylen Ethan
Im Ethylenmolekül sind vier C–H-Bindungen und eine C=C-Doppelbindung vorhanden. Die Elektronenzustände an den beiden C-Atomen sind in diesem Mo-
3. Halogenierung (Anlagerung von Halogenenen) Die Anlagerung von Halogenen führt spontan zu Dihalogenalkanen:
11 Organische Verbindungen
Beispiel: H2 C=CH2 + Br2 →H2 C–CH2 | | Br Br 1,2-Dibromethan 4. Polymerisation (s. 12.1) Verschiedene Alkene lagern sich unter Umwandlung der Doppelbindung zu längeren Kettenmolekülen zusammen. Dieser Reaktionstyp wird als Polymerisation bezeichnet. Alkine Cn H2n−2
Alkine (früher: Acetylene) sind Kohlenwasserstoffe, die außer C–H- und C–C-Einfachbindungen eine C≡C-Dreifachbindung im Molekül enthalten. Nomenklatur
Das erste Glied der Alkine heißt: Acetylen HC≡CH. (systematischer Name: Ethin) Die Namen der höheren Glieder der homologen Reihe (Summenformel Cn H2n−2 ) entsprechen denen der Alkane, jedoch wird bei den Alkinen anstelle der Endung -an die Endung -in verwendet. Struktur des Acetylenmoleküls
Im Acetylenmolekül sind zwei C–H-Bindungen und eine C≡C-Dreifachbindung vorhanden. Die Elektronenzustände an den beiden C-Atomen sind sp-hybridisiert (vgl. 3.1.3). Mit diesen Orbitalen werden σ-Bindungen zwischen den Kohlenstoffund Wasserstoffatomen und zwischen den beiden C-Atomen ausgebildet. Hinzu kommen zwei π-Bindungen durch das Überlappen der jeweils zwei p-Orbitale der beiden Kohlenstoffatome, die senkrecht zur Molekülachse angeordnet sind. Das Acetylenmolekül ist linear. Eigenschaften und Reaktionen des Acetylens
Der wichtigste Vertreter der homologen Reihe der Alkine ist das Acetylen. Acetylen ist bei Raumtemperatur gasförmig (vgl. Tabelle 5-2). 1. Verbrennungsreaktionen des Acetylens Mit Luft und besonders mit reinem Sauerstoff bildet Acetylen außerordentlich reaktionsfähige Gemische, die in einem großen Bereich der Zusammensetzung
explosions- oder detonationsfähig sind (vgl. Tabelle 11-3). Die Temperatur von Acetylen-Sauerstoff-Flammen ist ungewöhnlich hoch und erreicht ca. 3400 K (Acetylen-Luft-Flammen erreichen maximal 2500 K). Daher werden Acetylen-SauerstoffFlammen zum autogenen Schneiden und zum Schweißen von Stahlteilen eingesetzt. 2. Zerfallsreaktion des Acetylens Acetylen kann gemäß folgender Umsatzgleichung in die Elemente zerfallen (Reaktionsenthalpie vgl. 6.2.5): 6 7 6 7 HC≡CH g → 2 C(s) + H2 g . Diese Reaktion kann als Deflagration oder als Detonation ablaufen. Aus diesem Grunde darf Acetylen nur in speziellen Druckgasflaschen in den Handel kommen. Der Hohlraum dieser Acetylenflaschen ist mit einer porösen Masse, in der sich ein geeignetes Lösungsmittel (z. B. Aceton) befindet, ausgefüllt. Diese Füllung verhindert die explosionsartige Zersetzung des Acetylens in der Flasche. 3. Additionsreaktionen Ähnlich wie bei den Alkenen werden auch beim Acetylen zahlreiche Additionsreaktionen beobachtet, so die folgenden: 3.1 Hydrierung Acetylen kann katalytisch über Ethylen als Zwischenprodukt zum Ethan hydriert werden: H2
H2
HC≡CH −→ H2 C=CH2 −→ H3 C − CH3 . Acetylen Ethylen Ethan 3.2 Halogenierung Die Anlagerung von Halogen an Acetylen verläuft, wie am Beispiel der Bromierung gezeigt wird, über die Zwischenstufe des 1,2-Dibromethylens: Br2
HC≡CH −→ BrHC=CHBr 1,2-Dibromethylen Br2
−→ Br2 HC–CHBr2 1,1,2,2-Tetrabromethan 3.3 Addition von Halogenwasserstoffen Diese Reaktion dient hauptsächlich zur Herstellung von Vinylhalogeniden
C91
C92
C Chemie
(Beispiel: Anlagerung von Chlorwasserstoff): HC≡CH + HCl → H2 C=CHCl Acetylen Vinylchlorid
Mesomeriezeichen (↔) verbunden sind. Im Falle des Butadiens werden folgende Grenzformeln formuliert: CH2 =CH–CH=CH2 # ⊕ ↔ |CH2 –CH=CH–CH2 ⊕ # ↔ CH2 –CH=CH–CH2 .
Die Polymerisation von Vinylchlorid führt zum Polyvinylchlorid (PVC) (vgl. 12.1 und D 5.3). Kohlenwasserstoffe mit zwei oder mehr Doppelbindungen
Enthalten Kohlenwasserstoffe zwei oder mehr C=CDoppelbindungen im Molekül, so kann man je nach Lage dieser Doppelbindungen drei verschiedene Verbindungstypen unterscheiden: – Kohlenwasserstoffe mit kumulierten Doppelbindungen Bei diesem Verbindungstyp sind im Molekül mehrere Doppelbindungen unmittelbar benachbart. Kohlenwasserstoffe mit zwei kumulierten Doppelbindungen werden Allene genannt. Der einfachste Vertreter dieser Verbindungsgruppe heißt: Allen H2 C=C=CH2 (systematischer Name: Propadien). – Kohlenwasserstoffe mit konjugierten Doppelbindungen Zwei oder mehr C=C-Doppelbindungen werden als konjugiert bezeichnet, wenn sich zwischen ihnen jeweils eine C–C-Einfachbindung befindet. Verbindungen mit zwei konjugierten C=CDoppelbindungen heißen Diene. Die wichtigsten Vertreter dieser Verbindungsgruppe sind: 1,3-Butadien H2 C=CH–CH=CH2
– Kohlenwasserstoffe mit isolierten Doppelbindungen Sind die C=C-Doppelbindungen eines Kohlenwasserstoffes durch mehr als eine C–CEinfachbindung getrennt, so spricht man von isolierten Doppelbindungen. Die Wechselwirkungen zwischen derartigen Doppelbindungen können vernachlässigt werden. Kohlenwasserstoffe mit isolierten Doppelbindungen verhalten sich wie Alkene. 11.3.2 Alicyclische Kohlenwasserstoffe
Als monocyclische Kohlenwasserstoffe werden diejenigen Kohlenwasserstoffe bezeichnet, die aus nur einem Ringsystem aufgebaut sind. Derartige alicyclische Verbindungen werden folgendermaßen benannt: Dem Präfix Cyclo- folgt der Name des analogen acyclischen Kohlenwasserstoffs. Beispiele:
und
Isopren H2 C=CH–C=CH2 | CH3 (systematischer Name des Isoprens: 2-Methyl-1,3butadien). 1,3-Butadien und Isopren sind Ausgangsstoffe zur Herstellung von synthetischem Kautschuk. Bei Dienen und anderen Verbindungen mit konjugierten Doppelbindungen liegen in gewissem Ausmaß delokalisierte π-Elektronenzustände vor. Diese Delokalisation ist mit einer energetischen Stabilisierung des Moleküls verbunden (vgl. 11.3.3). Die formelmäßige Wiedergabe der Delokalisation der π-Elektronenzustände geschieht mithilfe so genannter mesomerer Grenzformeln, die durch das
11.3.3 Aromatische Kohlenwasserstoffe
Aromatische Kohlenwasserstoffe sind durch folgende Eigenschaften charakterisiert: – Sie bestehen aus eben aufgebauten Kohlenstoffringen.
11 Organische Verbindungen
– Im Kohlenstoffring sind abwechselnd C–CEinfach- und C=C-Doppelbindungen vorhanden, die C=C-Doppelbindungen sind also konjugiert angeordnet (vgl. 11.3.1). Nach der Hückel’schen Regel muss die Zahl der im Ring vorhandenen π-Elektronen 4n + 2 betragen n = 0, 1, . . .). – Die π-Elektronenzustände sind delokalisiert. Dadurch wird eine energetische Stabilisierung des Moleküls erreicht. Die Namen und Formeln einiger aromatischer Kohlenwasserstoffe sind in der Tabelle 11-4 zusammengestellt.
Das Benzolmolekül ist – wie alle aromatischen Verbindungen – eben aufgebaut. Sämtliche Bindungswinkel betragen 120°. In seinen Bindungsverhältnissen ähnelt das Benzolmolekül dem Graphit (vgl. 5.3.2). Die Elektronenzustände der C-Atome sind sp2 -hybridisiert. Es entsteht ein cyclisches Gerüst aus C–C-σ-Bindungen. Das an jedem Kohlenstoffatom verbleibende dritte sp2 -Orbital bildet mit dem 1s-Orbital des Wasserstoffatoms eine C–HBindung aus. Die p-Orbitale ergeben ein cyclisches Gerüst aus delokalisierten C–C-π-Bindungen. Diesen Bindungszustand des Benzols symbolisiert die Kurzformel:
Benzol C6 H6 Struktur des Benzolmoleküls
Benzol – der wichtigste aromatische Kohlenwasserstoff – hat die Summenformel C6 H6 und wird durch folgende Strukturformel beschrieben. Zur Vereinfachung werden die C- und H-Atome häufig nicht einzeln dargestellt (rechts).
Die Delokalisation des π-Elektronensystems führt zu einer energetischen Stabilisierung des Benzolmoleküls. Die molare Stabilisierungsenergie kann theoretisch abgeschätzt werden. Sie beträgt ca. −150 kJ/mol. Aufgrund des großen Betrages dieser Energie sind Reaktionen, die die Aromatizität des Ringsystems aufheben würden (z. B. Addition von Halogenen, vgl. 11.3.1), nur sehr schwer durchführbar.
Tabelle 11-4. Die wichtigsten aromatischen Kohlenwasser-
Nomenklatur von Abkömmlingen des Benzols
stoffe o ortho, m meta, p para
Der Rest, der durch Entfernen eines H-Atoms vom Benzol entsteht, heißt
Als Biphenyl C12 H10 wird der Kohlenwasserstoff bezeichnet, der aus zwei Phenylresten aufgebaut ist:
Sind zwei Substituenten am Benzolrest vorhanden, so werden die Kennzeichnungen o- (ortho), m- (meta) oder p- (para) verwendet. Einzelheiten siehe Tabelle 11-4. Eigenschaften und Reaktionen des Benzols
Benzol ist eine bei Raumtemperatur farblose Flüssigkeit, die bei 80,1 ◦ C siedet (Schmelzpunkt 5,5 ◦ C). Benzol (auch Benzoldampf) ist stark giftig und darüber hinaus kanzerogen. Informationen über kanze-
C93
C94
C Chemie
rogene Substanzen finden sich in der Gefahrstoffverordnung (GefStoffV). Nähere Angaben zum Umgang mit diesen Stoffen können den Technischen Regeln für Gefahrstoffe (TRGS) entnommen werden. Substitutionsreaktionen
Charakteristisch für aromatische Verbindungen sind Substitutionsreaktionen. Hierbei wird ein H-Atom durch einen anderen Rest (einen anderen Liganden) ersetzt. Beispiele: 1. Halogenierung Die Reaktion gelingt nur in Gegenwart eines Katalysators (z. B. Eisen(III)-chlorid):
11.4.1 Halogenderivate der aliphatischen Kohlenwasserstoffe
Unter Halogenkohlenwasserstoffen versteht man Verbindungen, bei denen ein oder mehrere Halogenatome an Stelle von Wasserstoffatomen an einem Kohlenwasserstoff gebunden sind. Bei Raumbedingungen sind die Halogenkohlenwasserstoffe häufig Flüssigkeiten mit relativ hoher Dichte. Sie werden in großem Umfang als Lösungsund/oder Entfettungsmittel (besonders Chlorkohlenwasserstoffe), als Kältemittel und Treibgase (besonders Fluorchlorkohlenwasserstoffe, FCKW) verwendet. Einige dieser Substanzen dienen zur Einführung von Alkylgruppen in andere Verbindungen (Alkylierungsmittel). Wichtige Halogenkohlenwasserstoffe
2. Nitrierung Benzol kann mit Nitriersäure, ein SalpetersäureSchwefelsäure-Gemisch, in Nitrobenzol umgewandelt werden:
11.4 Verbindungen mit funktionellen Gruppen Unter funktionellen Gruppen versteht man Atomgruppen in organischen Verbindungen, die charakteristische Eigenschaften und ein bestimmtes Reaktionsverhalten verursachen. O Hierzu gehören z. B. die Carboxylgruppe – C–OH und die Hydroxylgruppe –OH. Organische Verbindungen mit diesen funktionellen Gruppen heißen Carbonsäuren bzw. Alkohole oder Phenole. Bei den Alkoholen ist die Hydroxylgruppe an einen aliphatischen Rest, bei den Phenolen direkt an einen aromatischen Rest gebunden. Einen Überblick über organische Verbindungen mit funktionellen Gruppen gibt die Tabelle 11-5. Die Namen von Verbindungen, bei denen funktionelle Gruppen direkt am Benzol gebunden sind, können Tabelle 11-6 entnommen werden.
In Klammern sind hinter den Formeln der Substanzen die Siedepunkte und die MAK-Werte (vgl. Tabelle 5-2) angegeben. – Dichlormethan (Methylenchlorid) CH2 Cl2 (40 ◦ C, 100 ppm), – Trichlormethan (Chloroform) CHCl3 (61,7 ◦ C, 10 ppm), – Tetrachlormethan (Tetrachlorkohlenstoff) CCl4 (76,5 ◦ C, 10 ppm), – 1,1,1-Trichlorethan Cl3 C–CH3 (74,1 ◦ C, 200 ppm), – Trichlorethylen („Tri“) Cl2C=CHCl(87 ◦ C,50 ppm) und – Tetrachlorethylen („Perchlorethylen“, „Per“)Cl2 C= CCl2 (121 ◦ C, 50 ppm) werden vornehmlich als Lösungs-, Reinigungsund/oder Entfettungsmittel eingesetzt. – Trichlorfluormethan („R11“) CCl3 F (23,6 ◦ C, 1000 ppm) und Dichlordifluormethan CCl2 F2 („R12“) (vgl. Tabelle 5-2) sind die Verbindungen, die aus der Gruppe der Fluorchlorkohlenwasserstoffe hauptsächlich verwendet werden. Das Freisetzen von Fluorchlorkohlenwasserstoffen verursacht Umweltschäden, vgl. Tabelle 5-2. – Vinylchlorid H2 C=CHCl (kanzerogenes Gas, −13,9 ◦ C) ist Ausgangsstoff zur Herstellung von Polyvinylchlorid (PVC) (vgl. D 5.5). – Tetrafluorethylen (TFE) F2 C=CF2 (−76,3 ◦ C, giftig) ist Ausgangsstoff für die Herstellung des Polymerwerkstoffes Polytetrafluorethylen (PTFE). Die-
11 Organische Verbindungen
Tabelle 11-5. Organische Verbindungen mit funktionellen Gruppen (mit Beispielen). R, R1 , und R2 stehen für Kohlenwas-
serstoffreste
ser Kunststoff zeichnet sich durch relativ hohe Hitzebeständigkeit und chemische Widerstandsfähigkeit aus (vgl. D 5.5). Zur Verhinderung der Polymerisation von TFE, die äußerst heftig ablaufen kann, werden dem handelsüblichen monomeren Produkt Stabilisatoren zugesetzt. TFE zerfällt auch gemäß folgen der Gleichung in Kohlenstoff und Tetrafluormethan (siehe auch 6.3.4): F2 C=CF2 → C(s) + CF4 . TetrafluorTetrafluorethylen methan
im Molekül enthalten. Die Kohlenstoffatome, an denen eine Hydroxylgruppe gebunden ist, dürfen außerdem nur noch C–H- oder C–C-Einfachbindungen eingehen. Verbindungen mit einer direkt am aromatischen Rest gebundenen OH-Gruppe heißen Phenole (vgl. Tabelle 11-6). Nach der Zahl der C–C-Bindungen, an denen das Kohlenstoffatom beteiligt ist, an dem sich die Hydroxylgruppe befindet, unterscheidet man
Diese Zerfallsreaktion kann als Explosion ablaufen. Als Zündquelle kann die Polymerisationsreaktion des TFE fungieren. 11.4.2 Alkohole
Alkohole sind Verbindungen, die eine oder mehrere Hydroxylgruppen (OH-Gruppen)
Alkohole werden auch nach der Zahl der im Molekül enthaltenen OH-Gruppen in ein- und mehrwertige Alkohole unterteilt:
C95
C96
C Chemie
Beispiele:
Tabelle 11-7. Heterocyclische Verbindungen
Einwertiger Alkohol H3 C–CH2 –OH
Zweiwertiger Alkohol H2 C–OH | H2 C–OH Ethanol (Ethylalkohol) Ethylenglykol (Glykol) .
Tabelle 11-6. Derivate des Benzols
Reaktionen
1. Intramolekulare Wasserabspaltung (Bildung von Alkenen) Die innerhalb eines Moleküls stattfindende (intramolekulare) Wasserabspaltung erfolgt in der Hitze in Gegenwart von Katalysatoren oder von starken Säuren: H3 C–CH2 –OH → H2 C=CH2 + H2 O . Ethylen Ethanol 2. Intermolekulare Wasserabspaltung (Bildung von Ethern) An der intermolekularen Wasserabspaltung sind zwei Moleküle beteiligt. Bei Alkoholen bilden sich in diesem Fall Ether R–O–R (Erhitzen in Gegenwart von konzentrierter Schwefelsäure): H3 C–CH2 –OH + H3 C–CH2 –OH Ethanol Ethanol →H3 C–CH2 –O–CH2 –CH3 + H2 O . Diethylether
11 Organische Verbindungen
3. Verbrennung, Oxidation Leichtflüchtige Alkohole bilden mit Luft explosionsfähige Gasmischungen (vgl. Tabelle 11-3). Primäre, sekundäre und tertiäre Alkohole unterscheiden sich in ihrem Verhalten gegenüber Oxidationsmitteln. So können primäre und sekundäre Alkohole bis zu Carbonsäuren bzw. zu Ketonen oxidiert werden. Die Oxidation von tertiären Alkoholen gelingt nicht, ohne dass das Kohlenstoffgerüst zerstört wird:
Glycerin, Siedetemperatur 290 ◦ C, in jedem Verhältnis mit Wasser mischbar. Vorkommen: Bestandteil aller Fette (vgl. 11.4.5). Verwendung: Frostschutzmittel, in pharmazeutischen Präparaten, Herstellung von Nitroglycerin, Lösungsmittel. Nitroglycerin (Salpetersäuretriester des Glycerins) detonationsfähiger Stoff (vgl. 7.8), außerordentlich schlagempfindlich. Verwendung: einer der wichtigsten und meistgebrauchten Sprengstoffbestandteile; Mischungen von Nitroglycerin und Nitrocellulose sind Bestandteile von Treibmitteln und Raketentreibstoffen.
CH2 –OH | CH–OH | CH2 –OH
CH2 –O–NO2 | CH–O–NO2 | CH2 –O–NO2
11.4.3 Aldehyde
4. Veresterung Säuren und Alkohole reagieren in Gegenwart von Katalysatoren unter Bildung von Estern (siehe 11.4.5). Wichtige Alkohole
Methanol (Methylalkohol) H3 C–OH, Siedepunkt 65,1 ◦ C, giftig (letale Dosis: etwa 25 g), MAK-Wert: 200 ppm). Verwendung: Treibstoffzusatz, Lösungsmittel, Ausgangsstoff für Synthesen (z. B. Formaldehyd, Polyester). Ethanol (Ethylalkohol) C2 H5 –OH, Siedepunkt 78,5 ◦ C. Verwendung: verdünnt als Genussmittel (letale Dosis ca. 300 g, MAK-Wert: 1000 ppm). Lösungsmittel, Ausgangsstoff für Synthesen (z. B. Essigsäure), technischer Ethylalkohol wird durch Vergällungsmittel (z. B. Pyridin, Benzin, Campher) ungenießbar gemacht. Ethylenglykol (Glykol), Siedetemperatur 198,9 ◦ C, giftig, in jedem Verhältnis mit Wasser mischbar. Verwendung: Frostschutzmittel.
CH2 –OH | CH2 –OH
Aldehyde sind durch die funktionelle Gruppe H | –C=O charakterisiert. Sie haben die allgemeine Formel R–CH=O. R kann hierbei ein aliphatischer, aromatischer oder heteroeyclischer Rest sein. Reaktionen
1. Verbrennung, Oxidation Leichtflüchtige Aldehyde bilden mit Luft explosionsfähige Gasmischungen (vgl. Tabelle 11-3). Die Oxidation der Aldehyde führt unter milderen Bedingungen zu Carbonsäuren: H3 C–CHO + 1/2 O2 → H3 C–COOH . Acetaldehyd Essigsäure 2. Reduktion Aldehyde werden katalytisch mit Wasserstoff zu primären Alkoholen reduziert: H3 C–CHO + H2 → H3 C–CH2 –OH . Acetaldehyd Ethanol
C97
C98
C Chemie
3. Polymerisation Aldehyde können wie die Alkene polymerisieren. So führt z. B. die Polymerisation von Formaldehyd zu kettenförmig aufgebautem Polyoxymethylen (POM, Polyformaldehyd) (vgl. D 5.5): n H2 C=O → HO[CH2 –O]n H . Formaldehyd Polyoxymethylen
11.4.4 Ketone
O Ketone sind durch die Carbonylgruppe –C– , die sich mittelständig in einer Kohlenstoffkette befinden muss, gekennzeichnet. Ketone haben die allgemeine Formel R1 –CO–R2 . Reaktionen
4. Polykondensation Unter einer Kondensation versteht man eine Reaktion, bei der C–C-Einfach- oder auch C=CDoppelbindungen unter Abspaltung kleiner Moleküle (z. B. Wasser) entstehen. Werden hierbei polymere Verbindungen gebildet, so spricht man von Polykondensation, vgl. 12.1 und D 5.3. Von den unter Wasserabspaltung verlaufenden Polykondensationsreaktionen soll hier die Bildung von Phenoplasten aus Formaldehyd und Phenol angeführt werden.
1. Verbrennung, Oxidation Leichtflüchtige Ketone bilden mit Luft explosionsfähige Gasmischungen (vgl. Tabelle 11-3). Die Oxidation unter Spaltung der Kohlenstoffkette gelingt nur mit starken Oxidationsmitteln (z. B. Chromtrioxid CrO3 ). Hierbei wird die von der Carbonylgruppe ausgehende C–C-Bindung gespalten, es entstehen zwei Carbonsäuren: R1 –CH2 –CO–CH2 –R2 + 3/2 O2 → R1 COOH + HOOC–CH2 –R2 . 2. Reduktion Ketone werden katalytisch oder mit starken Reduktionsmitteln (z. B. Lithiumaluminiumhydrid LiAlH4 ) zu sekundären Alkoholen reduziert: H3 C–CO–CH3 + H2 → H3 C–CHOH–CH3 . Aceton Isopropanol
Durch weitere Kondensationsvorgänge bilden sich dreidimensional vernetzte Makromoleküle. Wichtige Aldehyde
H | Formaldehyd H–C=O, Siedepunkt −21 ◦ C, MAKWert: 0,5 ppm. Verwendung: Desinfektionsmittel. Ausgangsstoff für Polymerwerkstoffe: Polykondensation mit Harnstoff H2 N–CO–NH2 (Harnstoff-Formaldehydharze), Melamin (Formel, siehe Tabelle 11-3) (MelaminFormaldehydharze, MF) und mit Phenol (PhenolFormaldehydharze, PF). Polymerisation zu Polyoxymethylen (Einzelheiten siehe D 5.5). H | Acetaldehyd H3 C–C=O, Siedepunkt 20,8 ◦ C, MAKWert: 50 ppm.
Beispiel für ein Keton: Aceton H3 C–CO–CH3 , Siedepunkt 56,2 ◦ C, MAKWert: 500 ppm. Verwendung: Lösungsmittel für Harze, Lacke, Farben. 11.4.5 Carbonsäuren und ihre Derivate
Stoffe, die eine oder mehrere CarboxylO gruppen –C–OH enthalten, werden als Carbonsäuren bezeichnet. Allgemeine Formel der Carbonsäuren: R–COOH. Namen und Formeln einiger Carbonsäuren
gesättigte Carbonsäuren Ameisensäure H–COOH Essigsäure CH3 –COOH
11 Organische Verbindungen
Propionsäure Buttersäure Palmitinsäure Stearinsäure Oxalsäure Malonsäure
C2 H5 –COOH C3 H7 –COOH C15 H31 –COOH C17 H35 –COOH HOOC–COOH HOOC–CH2 -COOH
ungesättigte Carbonsäuren Ölsäure H3 C–(CH2 )7 -CH=CH–(CH2 )7 –COOH Linolsäure H3 C–(CH2 )4 –CH=CH–CH2 –CH=CH–(CH2 )7 – COOH Linolensäure H3 C–CH2 –CH=CH–CH2 –CH=CH–CH2 –CH=CH– (CH2 )7 –COOH aromatische Carbonsäuren (siehe Tabelle 11-6) Reaktionen
1. Elektrolytische Dissoziation, Salzbildung Carbonsäuren dissoziieren in wässriger Lösung gemäß der Gleichung: R–COOH RCOO− + H+ . Das Dissoziationsgleichgewicht liegt ganz oder überwiegend auf der Seite der undissoziierten Säure; Carbonsäuren sind schwache Säuren. Mit Basen wie NaOH und KOH reagieren Carbonsäuren unter Salzbildung. Wässrige Lösungen dieser Salze reagieren alkalisch (vgl. 8.7.6). Seifen sind die Natriumsalze der höheren Carbonsäuren (z. B. Palmitin-, Stearin- und Ölsäure). 2. Verbrennung Explosionsgrenzen von Ameisen- und Essigsäure sind in Tabelle 11-3 angegeben. 3. Veresterung Mit Alkoholen reagieren Carbonsäuren in einer Gleichgewichtsreaktion unter Bildung von Carbonsäureestern und Wasser: H3 C–COOH + HO–C2 H5 Essigsäure Ethanol O H3 C–C–O–C2 H5 + H2 O . Essigsäureethylester
Der umgekehrte Vorgang – also die Spaltung eines Esters in Carbonsäure und Alkohol – heißt Verseifung. Wichtige Carbonsäuren
Ameisensäure HCOOH, Siedepunkt 100,7 ◦ C, MAKWert: 5 ppm. Essigsäure H3 C–COOH, Siedepunkt 117,9 ◦ C, MAK-Wert: 10 ppm. Verwendung: Speiseessig H3 C–COOH-Massenanteil: ca. 5 bis 10%. Carbonsäurederivate
Carbonsäurehalogenide. Bei diesen Verbindungen ist die OH-Gruppe des Carboxylrestes durch ein Halogenatom ersetzt. Beispiel: O H3 C–C–Cl Acetylchlorid (Säurechlorid der Essigsäure) . Carbonsäureester. Anstelle der OH-Gruppe des Carboxylrestes haben Carbonsäureester eine O–R-Gruppierung. Allgemeine Formel dieser Verbindungen: O R1 – C–OR2 Fette und Öle sind die Glycerinester der höheren Carbonsäuren. Tierische Fette enthalten hauptsächlich gemischte Glycerinester von Palmitin-, Stearinund Ölsäure. Pflanzliche Öle bestehen zusätzlich aus Glycerinestern der mehrfach ungesättigten höheren Carbonsäuren (Linol- und Linolensäure). Carbonsäureamide. Bei diesen Verbindungen ist die OH-Gruppe der Carbonsäure durch eine NH2 Gruppe ersetzt. Säureamide haben die allgemeine Formel O R–C—NH2 .
C99
C100
C Chemie
11.4.6 Aminocarbonsäuren (Aminosäuren)
Aminocarbonsäuren – oder kurz Aminosäuren – enthalten neben der Carboxylgruppe eine Aminogruppe im Molekül. Sind die NH2 – und die COOH-Gruppe benachbart, liegen α-Aminosäuren vor. α-Aminosäuren haben die allgemeine Formel: R–CH—COOH. | NH2 Namen und Formeln einiger α-Aminosäuren:
Aminosäuren mit unpolarem Rest Glycin (Glykokoll) (Gly) H2 N—CH2 –COOH Alanin (Ala) H3 C—CH(NH2 )–COOH Valin (Val) (CH3 )2 CH—CH(NH2 )–COOH Leucin (Leu) (CH3 )2 CH—CH2 –CH(NH2 )–COOH Isoleucin (Ile) (C2 H5 )CH(CH3 )–CH(NH2 )–COOH
Saure Aminosäuren
In dieser und in den folgenden Formeln sind zur besseren Übersicht die C-Atome und die an den CAtomen befindlichen Wasserstoffatome weggelassen worden. Basische Aminosäuren
Aminosäuren mit polaren Resten Serin (Ser) HO–H2 C—CH(NH2 )–COOH Threonin (Thr) HO–CH(H3 C)—CH(NH2 )–COOH
Bis auf Glycin besitzen alle α-Aminosäuren ein oder mehrere asymmetrische Kohlenstoffatome, sie sind also optisch aktive Verbindungen (vgl. 11.2.2). Die in Proteinen vorkommenden Aminosäuren weisen durchweg die L-Konfiguration auf.
12 Synthetische und natürliche Makromoleküle
Reaktionen
Bei neutralem pH-Wert im wässrigen Milieu ist die Carbonsäuregruppe dissoziiert und die Aminogruppe protoniert, sodass die Aminosäuren in zwitterionischer Form vorliegen.Aminosäuren kondensieren unter Bildung von Peptiden. Die in diesen Verbindungen enthaltene Säureamid-Bindung heißt Peptidbindung; Beispiel: H2 N–CH–OOH + H–NH–CH–COOH | | R1 R2 Aminosäure 1
Aminosäure 2
→ H2 N–CH–CO–NH–CH–COOH + H2 O . | | R1 R2 Dipeptid Proteine (Eiweißstoffe) sind Polypeptide. Sie gehören zu den wichtigsten Grundbausteinen des menschlichen und des tierischen Körpers (s. 12.5.1).
ne besteht, die durch kovalente Bindungen miteinander verknüpft sind. Ein Monomer ist ein kleines Molekül, das eine oder mehrere polymerisationsfähige Gruppen besitzt und das bei der Polymerisation in einen Baustein des Polymers überführt wird. Monomere können zu einem linearen Makromolekül (auch Fadenmoleküle oder Kettenmoleküle genannt) verknüpft sein, wie in Bild 12-1a dargestellt. Andere Molekülarchitekturen sind in verzweigten (12-1b) oder vernetzten (12-1c) Polymeren realisiert. Eines der einfachsten linearen Polymere ist Polyethylen, das aus einer Aneinanderreihung von Methylengruppen –CH2 – besteht. Der Name Polyethylen leitet sich von der Tatsache ab, dass es durch Polymerisation von Ethylen (systematischer Name: Ethen) hergestellt wird. Ausgehend von der Struktur des Polymers könnte es auch Polymethylen genannt werden. In der Regel erfolgt die Bezeichnung des Polymers aber nach den Ausgangsmonomeren, die mit der Vorsilbe Poly-
12 Synthetische und natürliche Makromoleküle Unter Makromolekülen versteht man Moleküle mit Molmassen in der Größenordnung 104–107 g/mol. Sie sind in der Regel organischer Natur. Der Grund für eine gesonderte Behandlung liegt darin, dass einige wesentliche Eigenschaften von Stoffen, die aus solchen Molekülen aufgebaut sind, mehr von der Größe der Moleküle als von ihrer individuellen chemischen Zusammensetzung abhängen. Des Weiteren besitzen Stoffe aus solchen Molekülen als Kunststoffe eine erhebliche technische Bedeutung, und natürliche Makromoleküle sind wesentlich am Aufbau lebender Organismen und an den Lebensvorgängen beteiligt.
12.1 Synthetische Polymere Oft wird synonym zum Begriff Makromolekül auch das Wort Polymer (gr.: viele Teile) benutzt, um hervorzuheben, dass ein Makromolekül aus einer großen Zahl kleiner, im einfachsten Fall identischer Baustei-
Bild 12-1. Lineare (a), verzweigte (b) und vernetzte (c) Makromoleküle
C101
C102
C Chemie
versehen werden. Die Synthese von Polyethylen lässt sich formal folgendermaßen darstellen: n H2 C=CH2 → –[CH2 –CH2 ]n –
Nach dem Mechanismus b) werden z. B. Polyoxymethylen
n1
12.1.1 Verknüpfung von Monomeren
Es gibt drei grundsätzliche Möglichkeiten, um die Verknüpfung von Monomeren zu einem Polymer zu erreichen: a) Öffnen einer Doppelbindung, b) Öffnen eines ringförmigen Moleküls, c) Verwendung von Monomeren mit zwei funktionellen Gruppen. Eine große Zahl von Polymeren leitet sich von Monomeren des Typs CH2 =CHX ab, wobei X ein Substituent ist. Diese Polymere werden Vinyl-Polymere genannt. Wichtige Beispiele sind: Polypropylen
Polystyrol
und Polycaprolactam (Nylon 6)
gebildet. Wichtige Vertreter der Möglichkeit c) sind: Polyethylenterephthalat
Polyhexamethylenadipinamid (Nylon 66)
Polyvinylchlorid
Polyacrylnitril
12.1.2 Mittelwerte der Molmassen
Die Zahl n nennt man den Polymerisationsgrad. Zwischen der Molmasse des Polymers M und dem Polymerisationsgrad besteht die Beziehung M = n M0 , Ein ähnlicher Typ ist: Polymethylmethacrylat (Acrylglas Plexiglas ™)
wobei M0 die Molmasse der Wiederholungseinheit darstellt. Bei dieser Betrachtungsweise vernachlässigt man den Einfluss der Kettenenden. In der Regel werden die Kettenenden auch in der Formeldarstellung nicht angegeben; häufig sind sie nicht genau bekannt. n bzw. M weisen in der Regel für ein bestimmtes Material eine Verteilung auf, die man durch Mittelwerte
12 Synthetische und natürliche Makromoleküle
charakterisieren kann. Der Zahlenmittelwert der Molmasse MN berechnet sich nach MN =
Ni M i /
Ni .
(12-1)
Hierin bedeutet Ni die Zahl der Moleküle mit der Molmasse Mi . Alle Moleküle werden bei der Mittelwertbildung gleich gewichtet, obwohl sie sich deutlich im Polymerisationsgrad unterscheiden können. Ein anderer wichtiger Mittelwert ist der Massenmittelwert der Molmasse Mw . Mw =
wi Mi /
wi =
Ni Mi2 /
Ni Mi . (12-2) Bei dieser Mittelwertbildung wird mit dem Massenanteil wi der Moleküle mit der Molmasse Mi gewichtet. Als Maß für die Breite der Verteilung (Uneinheitlichkeit) wird häufig das Verhältnis Mw /MN angegeben. Homopolymere bestehen aus nur einer Sorte von Wiederholungseinheiten (alle bisher vorgestellten Beispiele sind Homopolymere), während Copolymere aus zwei oder mehr unterschiedlichen Monomeren gebildet werden, die wiederum in statistischer Abfolge (–A–A–B–A–B–B–A–B–B–B–B–A–), alternierend (–A–B–A–B–A–B–A–B–) oder blockartig (–A–A–A–A–A–B–B–B–B–B–B–) miteinander verknüpft sein können. Eine weitere wichtige Klasse von Copolymeren sind Pfropfcopolymere, die allerdings zu den verzweigten Polymeren gehören. 12.1.3 Synthese von Polymeren
Es existieren zwei grundsätzlich verschiedene Arten der Polymerisation, die man als Kettenwachstumsreaktion und Stufenwachstumsreaktion bezeichnet. Kettenwachstumsreaktion
Die Kettenwachstumsreaktion ist eine typische Kettenreaktion (vgl. 7.7) mit den Schritten Kettenstart (Initiierung), Kettenwachstum und Kettenabbruch. Für den Fall einer radikalischen Polymerisation ergibt sich folgendes Schema: Start: I → 2 R• ;
R• + M → R–M•
Der Initiator I zerfällt thermisch oder lichtinduziert in zwei Radikale R• , die jeweils an ein Monomermolekül M addiert werden. Alternative Mechanismen zur Generierung von Radikalen sind ebenfalls möglich.
Wachstum: R–M• + M → R–M–M• R–M–M• + M → R–M–M–M•
etc.
allgemein R–M•n + M → R–M•n+1 Pn + M → P•n+1
oder
Das Radikal addiert sukzessive Monomere, wobei der Radikalcharakter immer auf das zuletzt addierte Monomer übertragen wird. Diese Reaktion erfolgt sehr schnell, sodass eine einmal gestartete Reaktion zu relativ großen (n 1) Polyradikalen führt. Abbruch: P•n + P•m → Pn+m P•n
+
P•m
oder
→ Pn + Pm
Der Kettenabbruch erfolgt durch Kombination zweier Polyradikale oder durch Disproportionierung (Übertragung eines Wasserstoffatoms). Die kinetische Behandlung dieser Prozesse, bei der von Quasistationarität bezüglich der Radikalkonzentrationen ausgegangen wird, liefert als Bruttopolymerisationsgeschwindigkeit: (12-3) r p = −dc(M)/dt ∼ c(M) c(I) , d. h. r p ist proportional zur Monomerkonzentration und zur Wurzel aus der Initiatorkonzentration. In die Proportionalitätskonstante gehen die Geschwindigkeitskonstanten der einzelnen Teilreaktionen ein. Als weitere und wichtigere Konsequenz der kinetischen Behandlung ergibt sich für die Molmasse des Produkts: (12-4) MN ∼ c(M)/ c(I) , d. h. der Zahlenmittelwert der Molmasse ist ebenfalls proportional zur Monomerkonzentration, aber umgekehrt proportional zur Wurzel aus der Initiatorkonzentration. Die Eigenschaften des Produkts sind demnach kinetisch kontrolliert und lassen sich über diese beiden Konzentrationen steuern. Die Verteilungsfunktion der Molmasse hängt davon ab, ob der Abbruch überwiegend durch Kombination
C103
C104
C Chemie
oder Disproportionierung erfolgt. In guter Näherung erwartet man im ersten Fall Mw /MN = 1,5, im zweiten Fall Mw /MN = 2. Allerdings ergeben sich bei der Polymerisation in Masse oder in hochkonzentrierter Lösung zu hohen Umsätzen Abweichungen zu deutlich höheren Molmassen, die auf starke Viskositätserhöhung und daraus folgende Unterdrückung der Abbruchreaktion zurückzuführen sind. Eine andere Steuerungsmöglichkeit für die erzielte Molmasse bietet der Zusatz eines Reglers. Dabei handelt es sich um ein Agens S, auf das der Radikalcharakter übertragen werden kann, ohne dass die kinetische Kette unterbrochen wird. Als zusätzliche Reaktion im Wachstumsschritt tritt dann P•n + S → Pn + S• S• + M → S–M• auf, wodurch die Länge der Molekülkette begrenzt wird. Sehr wirksame Regler sind zum Beispiel Mercaptane. Übertragungen können aber auch auf das Lösemittel, das Monomer, den Initiator oder das Polymer selber erfolgen. Neben der radikalischen Polymerisation gehören die ionischen (anionischen und kationischen) Polymerisationen und die koordinative Polymerisation zu den Kettenwachstumsreaktionen. Die einzelnen Schritte verlaufen ähnlich wie bei der radikalischen Polymerisation mit dem Unterschied, dass die reaktiven Spezies als Anionen P−n , Kationen P+n oder koordinativ an einen Katalysator gebunden vorliegen. Als Initiatoren verwendet man bei der anionischen Polymerisation typischerweise Alkylverbindungen der Alkalimetalle, z. B. Butyl-Li, bei der kationischen Polymerisation kommen Protonen- oder Lewis-Säuren oder Carbeniumsalze zum Einsatz. Die Polarität des Lösemittels und die Natur des Gegenions sind entscheidend dafür, ob der Initiator in dissoziierter Form, als Ionenpaar oder kovalent vorliegt. Davon hängen wiederum Reaktionsgeschwindigkeiten und Mechanismen ab. Eine Besonderheit, die vor allem bei der anionischen Polymerisation genutzt wird, ist die Vermeidung von Abbruch und Übertragungsreaktionen (sog. lebende Polymerisation). Durch geeignete Reaktionsführung lassen sich so sehr enge Molmassenverteilungen erzielen (Mw /MN < 1,05).
Bei der koordinativen Polymerisation, auch ZieglerNatta-Polymerisation genannt, werden Mischkatalysatoren aus einer Verbindung eines Übergangsmetalls (z. B. TiCl4 ) und einer metallorganischen Verbindung (z. B. Al(C2 H5 )3 ) verwendet. Neuere Katalysatoren sind sog. Metallocene, z. B. Bis-cyclopentadienylMetall-Komplexe. Die koordinative Polymerisation wird zur Herstellung von linearem Polyethylen, stereoregulärem Polypropylen und Polybutadien eingesetzt. Stufenwachstumsreaktion
Monomere mit zwei funktionellen Gruppen polymerisieren in der Regel nach dem Stufenwachstumsmechanismus. Ein typisches Beispiel ist die Polykondensation von Adipinsäure mit Hexamethylendiamin zum Nylon 66, einem Polyamid (s. vorige S.) oder die Kondensation von Terephthalsäure mit Ethylenglykol zum Polyethylenterephthalat (PET), einem Polyester (s. S.102). Nach dem gleichen Schema, aber ohne Abspaltung niedermolekularer Substanzen, erfolgt die Bildung von Polyurethanen aus Diisocyanaten und Diolen:
Die statistische Behandlung der Stufenwachstumsreaktion zeigt, dass hohe Molmassen nur bei sehr großen Umsätzen p erreicht werden. Dies wird in der Carothers-Gleichung ausgedrückt: MN = M0 /(1 − p)
(12-5)
Hierin ist M0 die Molmasse der Wiederholungseinheit, also die Summe aus der Molmase der beiden Monomere abzüglich der Summe der Molmasse der ggf. abgespaltenen Verbindungen (in obigen Beispielen Wasser). Für den Massenmittelwert ergibt sich: Mw = M0 (1 + p)/(1 − p) .
(12-6)
und für p → 1 folgt Mw /MN = 2, wie bei der radikalischen Polymerisation mit Abbruch durch Disproportionierung. Wenn bei einer Stufenwachstumsreaktion auch Monomere eingesetzt werden, die über mehr als zwei
12 Synthetische und natürliche Makromoleküle
funktionelle Gruppen verfügen, bilden sich bei geringem Umsatz verzweigte Polymere, bei höherem Umsatz dreidimensionale Netzwerke. Die Netzwerkbildung äußert sich in einem plötzlichen drastischen Anstieg der Viskosität. Dieser Vorgang wird als Gelierung bezeichnet. Der Übergang von einem löslichen verzweigten Polymer zu einem vernetzten unlöslichen Polymer erfolgt am Gelpunkt. Technisch wichtige Beispiele für derartige vernetzte Polymere, die man auch als Duroplaste bezeichnet, sind PhenolFormaldehyd-Harze, Melamin-Harze und Epoxidharze (s. 11.4.3 und D 5.6).
12.2 Gestalt synthetischer Makromoleküle 12.2.1 Knäuelmoleküle
Die Gestalt einer flexiblen Kette aus identischen Bausteinen, die keine speziellen Wechselwirkungen aufeinander ausüben, ist ein statistisches Knäuel. Flexibel bedeutet in diesem Zusammenhang, dass durch Rotation um Einfachbindungen unterschiedliche räumliche Anordnungen (Konformationen) ermöglicht werden. Diese Voraussetzung ist für die allermeisten synthetischen Polymere gegeben. Bei einer Kette mit nur durch Einfachbindungen verknüpften C-Atomen im Rückgrat (z. B. einem Vinylpolymeren) beträgt der Bindungswinkel etwa 109° (Tetraederwinkel). Bezüglich einer herausgegriffenen C–C-Bindung sind die 3 Konformationen, anti, gauche(+) und gauche(−), energetisch in etwa gleich günstig.
Besteht eine Polymerkette aus n solchen Bindungen, existieren folglich etwa 3n (genau: 3(n−2) ) energetisch günstige Konformationen, bei großem n also eine sehr große Zahl. Deshalb ist nur eine Beschreibung mit geeigneten Mittelwerten, die als Maß für die wahrscheinlichste Gestalt des Makromoleküls dienen, und mit Verteilungsfunktionen sinnvoll. Die komplexe Problematik wird dadurch etwas erleichtert, als eine reale Polymerkette sich in sehr guter Näherung auf eine Zufallskette, deren Bindungen überhaupt keine Korrelationen zueinander aufweisen, abbilden lässt.
12.2.2 Charakterisierung der Gestalt
Eine wichtige Größe ist der End-zu-End Abstand einer Polymerkette, für dessen quadratisch gemittelten Mittelwert gilt: %r2 & = C∞ nl2
(12-7)
Hierin ist n die Zahl der Bindungen, l deren Länge, und C∞ stellt einen durch bestimmte Bindungswinkel, Konformationsverhältnisse sowie sterische Effekte für das betreffende Polymer individuellen Parameter dar. C∞ wird deshalb als charakteristisches Verhältnis bezeichnet. Es liegt für zahlreiche Polymere im Bereich 4 < C∞ < 10. Für die Verteilungsfunktion des Betrags des Endzu-End-Abstands ergibt sich in guter Näherung (für r nl, nl ist die hypothetische Länge des vollständig gestreckten Moleküls und wird auch als Konturlänge bezeichnet): P(r)dr = const · r2 exp(−3r2 /2%r2 &)dr .
(12-8)
Hieraus folgt über statistisch-thermodynamische Betrachtungen, dass eine Polymerkette, deren End-zuEnd Vektor auf einem Wert r gehalten wird, eine rücktreibende elastische Kraft f entgegen die Richtung des End-zu-End Vektors ausübt. f (r) = −(3kT/%r2 &)r .
(12-9)
Eine Polymerkette verhält sich wie eine Hooke’sche Feder. Die Elastizität hat ihre Ursache darin, dass man das Molekül bei einer Vergrößerung des End-zu-End Abstands aus einer wahrscheinlicheren Konformation in eine weniger wahrscheinliche bringt. Dadurch verringert sich die Entropie. Man spricht deshalb von Entropieelastizität. Dies kommt dadurch zum Ausdruck, dass die Federkonstante in erster Näherung zur absoluten Temperatur proportional ist. Die Entropieelastizität einzelner Polymerketten wirkt sich makroskopisch als Kautschuk- bzw. Gummielastizität aus. Als weitere wichtige Größe für die mittlere Ausdehnung eines Polymermoleküls wird der Trägheitsradius (Gyrationsradius) RG verwendet, der als quadratisch gemittelter Abstand aller Kettenatome vom Schwerpunkt des Moleküls definiert ist. Er steht zu %r2 & in Beziehung über R2G = %r2 &/6 .
(12-10)
RG lässt sich mit Streumethoden (Licht-, Neutronenstreuung) experimentell ermitteln.
C105
C106
C Chemie
Die mittlere Knäueldichte ergibt sich als Quotient aus der Molekülmasse einer Polymerkette und dem mittleren Volumen des Knäuels. Wenn letzteres als (4π/3) R3G angenähert wird, ergibt sich:
= nM0 /NA (4π/3)R3G ∼ n−1/2 .
(12-11)
Hierin wird unter n wieder der Polymerisationsgrad verstanden. Mit zunehmendem Polymerisationsgrad sinkt die Knäueldichte auf recht kleine Werte; eine Rechnung mit typischen Zahlen ergibt eine Größenordnung von etwa 0,01 g/mL, d. h. das Knäuel einer typischen Polymerkette umfasst ein Volumen, das etwa 100-mal so groß ist wie das Eigenvolumen der Monomereinheiten. Der freie Raum wird im Falle einer verdünnten Polymerlösung von Lösemittelmolekülen eingenommen, im Falle eines reinen Polymers von den Segmenten anderer Polymermoleküle, d. h. die Moleküle sind stark miteinander verschlauft.
12.3 Konfiguration Ein wesentliches Strukturmerkmal v. a. von Vinylpolymeren ist die stereochemische Konfiguration. Wegen der Tetraedersymmetrie am C-Atom kann jedes unsymmetrisch substituierte C-Atom in zwei Konfigurationen vorliegen (vgl. 11.2.2):
Beide Formen werden als stereoreguläre Polymere bezeichnet. Demgegenüber spricht man bei einer ungeordneten Abfolge von Konfigurationen von einem ataktischen Polymer. Die Stereoregularität hat eine wichtige Konsequenz: Stereoreguläre Polymere haben einen regelmäßigen Molekülaufbau und können deshalb kristallisieren, ataktische wegen der unregelmäßigen Abfolge der Monomerbausteine hingegen nicht. Die radikalische Polymerisation von Vinylmonomeren führt in der Regel zu überwiegend ataktischen Polymeren. Zum Aufbau stereoregulärer Polymere werden die koordinative Polymerisation oder ionische Polymerisationen genutzt. Neben der Taktizität spielen bei einigen Polymeren andere geometrische Isomerien (vgl. 11.2) eine Rolle. Bei der Polymerisation von Butadien entstehen je nach Katalysator überwiegend cis-1,4-Polybutadien,
trans-1,4-Polybutadien
oder 1,2–Polybutadien Die beiden Konfigurationen können nicht durch Rotation um Einfachbindungen ineinander überführt werden. Die sterische Ordnung entlang der Hauptkette bezeichnet man mit dem Begriff Taktizität. Isotaktische Vinylpolymere sind solche, die alle Substituenten auf einer Seite tragen, wenn die Hauptkette in der Zick-Zack-Konformation dargestellt wird.
die sich in ihren Eigenschaften deutlich unterscheiden.
12.4 Kristallisation von Polymeren Bei syndiotaktischen Polymeren sind die Substituenten abwechseln vorn und hinten angeordnet.
Kristallisation setzt die Möglichkeit einer regelmäßigen Packung von Einheiten in einem Kristallgitter
12 Synthetische und natürliche Makromoleküle
voraus. Polymere können deshalb nur dann kristallisieren, wenn es sich um regelmäßig aufgebaute lineare Ketten handelt. Stark vernetzte und verzweigte Polymere, ataktische Polymere und statistische Copolymere sind in der Regel nicht kristallisierbar; bei hinreichend niedrigen Temperaturen bilden diese Polymere ein Glas (s. 5.2.4). Beim Abkühlen der Schmelze eines kristallisationsfähigen Polymers kommt es nur zu einer teilweisen Kristallisation. Der erreichte Kristallisationsgrad hängt stark von der thermischen Vorgeschichte ab, oft lässt sich aber ein Wert in der Größenordnung von 50% kaum überschreiten (eine Ausnahme ist Polyethylen). Das Material liegt dann zweiphasig vor; der andere Teil ist amorph und befindet sich im (im Prinzip) flüssigen Zustand oder im Glaszustand. Die Ursache für die Teilkristallinität liegt in der Verschlaufung der Ketten in der Schmelze und ist kinetisch bedingt. Die einzelnen Kristallite sind oft sehr klein, was zu einem breiten Schmelzbereich führt, und sie weisen untereinander eine Korrelation auf, die zu überkristallinen Morphologien wie Sphäroliten oder Fibrillen führt.
12.5 Biopolymere (natürliche Makromoleküle) In der belebten Natur spielen Makromoleküle eine wichtige Rolle. Die wesentlichen Typen von Biopolymeren sind – Polypeptide und Proteine, – Polynukleotide und – Polysaccharide. 12.5.1 Polypeptide und Proteine
Polypeptide oder Proteine lassen sich als Polykondensate aus α-Aminosäuren auffassen. Dabei wird der Begriff Polypeptid meist für Makromoleküle mit Polymerisationsgraden bis etwa 50–100 verwendet, während als Proteine höhermolekulare Stoffe bezeichnet werden, manchmal auch Aggregate aus mehreren solchen Makromolekülen. Die Abgrenzung ist nicht scharf. Natürlich vorkommende Proteine sind Copolymere aus etwa 20 verschiedenen Aminosäuren (s. 11.4.6).
Ihre Primärstruktur lässt sich wie folgt darstellen:
Im Gegensatz zu synthetische Polymeren, die i. Allg. eine statistische Abfolge der unterschiedlichen Monomerbausteine aufweisen, kommt es bei Proteinen auf die exakte Abfolge (Sequenz) der einzelnen Aminosäurereste an. Diese bestimmt die Struktur des Proteins und ist wesentlich für dessen Funktion. Die räumliche Gestalt eines Proteins (die Art der Faltung; Sekundärstruktur) wird wesentlich durch intraoder intermolekulare Wechselwirkungen, insbes. Wasserstoffbrückenbindungen, bestimmt. Die Carbonamidgruppierung kann zu anderen solchen Gruppen H-Brücken ausbilden, es ist aber auch möglich, dass die Funktionalitäten der Seitenketten daran beteiligt sind. Hydrophobe Wechselwirkungen spielen bei Aminosäuresequenzen mit aliphatischen Seitenketten eine Rolle. Darüber hinaus kann es durch CysteinCystin Umwandlung zu kovalenten Verknüpfungen (Disulfidbrücken) kommen. Im Cystin sind zwei Cysteinmoleküle unter Wasserstoffabspaltung am Schwefel verbrückt. Die C–N-Bindung in der Carbonamidgruppe trägt wegen der Mesomerie:
partiellen Doppelbindungscharakter und weist keine freie Drehbarkeit auf. Alle Atome der Einheit liegen deshalb in einer Ebene, Drehbarkeit in der Hauptkette ist nur um die Bindungen am α-C-Atom gegeben:
Proteine fallen grob in zwei Gruppen, die Faser- oder Skleroproteine einerseits und die globulären Proteine andererseits.
C107
C108
C Chemie
Faserproteine
Die i. Allg. unlöslichen Faserproteine finden sich als Stütz- und Gerüstmaterial in Haaren, Haut, Nägeln und Krallen, Vogelfedern, Muskeln und Sehnen. Sie haben von Natur aus eine Faserstruktur, bei der Polypeptidketten zu Strängen vereint und ggf. umeinander gewunden sind. In der β-Faltblattstruktur liegen mehrere Polypeptidketten so parallel oder antiparallel zueinander, dass jeweils intermolekulare Wasserstoffbrückenbindungen zwischen benachbarten Carbonamidgruppen ausgebildet werden. Das Kettenrückgrat ist dabei leicht gefaltet, um dem Platzbedarf der Aminosäurereste zu genügen. Die Seitenketten der Aminosäuren ragen dabei abwechselnd nach beiden Seiten senkrecht von der Faltblatt-Ebene. Die β-Faltblattstruktur findet man gut ausgebildet bei natürlicher Seide. In der α-Helix werden die Wasserstoffbrückenbindungen intramolekular ausgebildet. Die Polypeptidkette ist dazu in Form einer Helix gewunden, bei der die Seitengruppen nach außen weisen und bei der Wasserstoffbrückenbindungen zwischen der 1. und 5., 2. und 6., 3. und 7., etc., Aminosäure auftreten. Mehrere solcher Helices werden zu Fibrillen umeinander gewunden. α-Helix-Strukturen findet man z. B. im Keratin und in den globulären Proteinen. Globuläre Proteine
Globuläre Proteine existieren als kompakte, mehr oder weniger sphärische Gebilde aus einer oder wenigen Polypeptidketten, in die ggf. andere funktionale Struktureinheiten eingelagert sind. Beispiele sind Enzyme, Hämoglobin, Myoglobin. Die Polypeptidkette ist dazu in bestimmter Weise gefaltet und wird durch Disulfidbindungen und Nebenvalenzkräfte in dieser Lage gehalten. Abschnittsweise spielen α-Helix und β-Faltblattstruktur als Ordnungsprinzipien eine Rolle. 12.5.2 Polynucleotide
Polynucleotide, auch Nucleinsäuren genannt, setzen sich aus über Phosphorsäure esterartig verknüpften Zuckerbausteinen zusammen, die an jedem Zucker eine Pyrimidin- oder Purinbase tragen. Es gibt zwei Sorten von Polynucleotiden: Ribonucleinsäuren (RNA) enthalten als Zucker die Ribose, Desoxyribonukleinsäuren (DNA) enthalten
2-Desoxyribose.
Die Einheit aus Base und Zucker heißt Nucleosid, die Einheit aus Base, Zucker und Phosphorsäure Nucleotid. Die DNA kommt u. a. im Zellkern vor und ist dort in Chromosomen angeordnet. Sie ist das genetische Material, das die Information für die Synthese der Proteine von einer Generation auf die nächste weitergibt. Ein Gen ist ein Abschnitt der DNA,der die dafür notwendige Information beinhaltet. Viren besitzen ca. 50 Gene, Bakterien in der Größenordnung von 1000, höhere Säugetiere 50 000. Die RNA überträgt die Information und ist bei der Biosynthese der Proteine direkt beteiligt.Die Hauptkette beider Polynucleotide ist streng alternierend aus den entsprechenden Zucker- und Phosphorsäureeinheiten aufgebaut. Die darauf gespeicherte Information liegt in der Sequenz der verschiedenen Basen. Dabei handelt es sich um fünf organische Stickstoffbasen: Adenin (A) und Guanin (G) sind Derivate der Grundstruktur Purin; Cytosin (C), Thymin (T) und Uracil (U) leiten sich von Pyrimidin ab (T kommt in DNA vor, U in RNA.). Eine Sequenz aus drei Basen codiert eine Aminosäure bei der Proteinsynthese (genetischer Code).
12 Synthetische und natürliche Makromoleküle
Native DNA-Moleküle weisen einen außerordentlich hohen Polymerisationsgrad auf, die Molmassen können in der Größenordnung 109 –1012 g/mol liegen. Zwei solcher Moleküle bilden eine Doppelhelix, bei der die Basen zum Zentrum zeigen und jeweils zwei Basen miteinander mehrere Wasserstoffbrückenbindungen ausbilden. Dies ist nur für die Paarungen A-T (bzw. A-U) und C-G möglich. Auf Grund dieser Basenpaarung legt die Sequenz in einem DNA-Molekül die Sequenz im komplementären Molekül vollständig fest. Die Wasserstoffbrückenbindungen halten die beiden Stränge der Doppelhelix zusammen und stabilisieren sie (s. Bild 12-2). Für ein menschliches Gen sind ca. 70 000 Basenpaare erforderlich. Die Analyse der Reihenfolge der Bausteine der DNA (Sequenzanalyse) geschieht heute weitgehend automatisiert. Dabei wird die DNA normalerweise durch Enzyme in kürzere Bruchstücke geschnitten, die vervielfältigt, gelelektrophoretisch aufgetrennt und schließlich spektroskopisch und mit Unterstützung bioinformatischer Methoden analysiert werden. Bei der Teilung von Zellen wird die DNA als Ganzes kopiert. Im Labor dient die sogenannte polymerasechain-reaction (PCR) zur Vervielfältigung der DNA. Dabei können durch enzymatische Katalyse große
Mengen identischen Materials hergestellt werden. Auf diese Weise erfolgen Identitätsbestimmungen in der forensischen Medizin. 12.5.3 Polysaccharide
Saccharid ist ein anderes Wort für Zucker. Man bezeichnet solche Verbindungen auch als Kohlenhydrate, weil sie die Summenformel C x (H2 O)y aufweisen, wobei x und y ganze Zahlen sind. Aus dieser Summenformel leitet sich der Begriff Kohlenhydrat für Hydrat des Kohlenstoffs ab. Einfache Zucker, sog. Monosaccharide, haben die Zusammensetzung (CH2 O)n mit 3 ≤ n ≤ 6. Die Ribose mit n = 5 (eine Pentose) ist der Zucker , der in der RNA auftritt. Desoxyribose ist ein Derivat davon und findet sich in der DNA. Der am weitesten verbreitete Zucker ist die Glucose, eine Hexose mit n = 6 und der Summenformel C6 H12 O6 ; die Strukturformel ist aus Bild 12-3 ersichtlich. Von der Glucose leiten sich die beiden wichtigsten Polysaccharide ab: Cellulose und Stärke. Cellulose ist das am weitesten verbreitete natürliche Polymer. Sie bildet das strukturelle Gerüst von Holz (s. D 5.1.1) und findet sich in der Zellwand fast aller Pflanzen. In nahezu reiner Form kommt sie in Baum-
Bild 12-2. Struktur der Basenpaare in einem Ausschnitt der DNA-Doppelhelix
C109
C110
C Chemie
Bild 12-3. Struktur der Cellulose. Die Glucoseringe sind β-1,4-glykosidisch verknüpft
Bild 12-4. Struktur der Stärke; Stärke besteht aus Amylose (ca. 25%), die vom (verzweigten) Amylopektin umhüllt wird.
Die Glucoseringe sind α-1,4-glykosidisch (im Amylopektin auch α-1,6-glykosidisch) verknüpft
wolle vor. Die globale biologische Produktion von Cellulose beträgt etwa 1011 t/Jahr.
Cellulose ist ein unverzweigtes β-1,4-Polymer der Glucose mit Polymerisationsgraden in der
Literatur
Größenordnung 500–5000. Intramolekulare Wasserstoffbrückenbindungen sorgen dafür, dass keine freie Drehbarkeit um die glykosidischen Bindungen besteht; glykosidische Bedingungen sind Etherbindungen (vgl. 11-5). Cellulose ist deshalb ein recht steifes, bändchenförmiges Molekül. Cellulose ist hoch kristallin, wobei intermolekulare Wasserstoffbrückenbindungen ausgebildet werden. Aufgrund der starken intermolekularen Wechselwirkungen ist Cellulose wasserunlöslich. Stärke ist ebenfalls aus Glukose-Einheiten aufgebaut, allerdings erfolgt die Verknüpfung hier im Gegensatz zur Cellulose über eine α-glykosidische Bindung. Stärke besteht zu ca. 25% aus Amylose, die vom Amylopektin umhüllt wird. Amylopektin enthält außer den α-1,4- auch α-1,6-glykosidische Bindungen, die eine verzweigte Struktur ermöglichen, sowie geringe Anteile von Phosphatgruppen. Das Amylopektin ist für die Quellfähigkeit der Stärke in Wasser verantwortlich.
Formelzeichen der Chemie a, b b cB cS C p , CV e E EA EG EI F G Δr G Δr G0 H Hm = H/n Δr H Δr H 0 ΔB Hm ΔB Hm0 k
van-der-Waals’sche Konstanten Molalität Konzentration des Stoffes B Sättigungskonzentration Wärmekapazität bei konstantem Druck bzw. Volumen Elementarladung Energie Aktivierungsenergie Gitterenergie Ionisierungsenergie Faraday-Konstante Freie Enthalpie Freie Reaktionsenthalpie Freie Standardreaktionsenthalpie Enthalpie molare Enthalpie molare Reaktionsenthalpie molare Standardreaktionsenthalpie molare Bildungsenthalpie molare Standardbildungsenthalpie Reaktionsgeschwindigkeitskonstante
KB , KS Kc , K p , K x KW L MB n N NA p Q r R RG S Δr S t T T 1/2 U Δr U V wB xB z νB μB0 vB ξ π
B χ
Dissoziationskonstanten von Basen bzw. Säuren Gleichgewichtskonstanten Ionenprodukt des Wassers Löslichkeitsprodukt molare Masse des Stoffes B Stoffmenge Teilchenzahl Avogadro-Konstante Druck; Impuls Wärme Reaktionsgeschwindigkeit universelle Gaskonstante Gyrationsradius Entropie Reaktionsentropie Zeit (thermodynamische) Temperatur Halbwertszeit innere Energie Reaktionsenergie Volumen Massenanteil des Stoffes B Stoffmengenanteil des Stoffes B Ladungszahl von Ionen chemisches Potenzial des Stoffes B chemisches Standardpotenzial des Stoffes B Stöchiometrische Zahl des Stoffes B in einer Reaktion Umsatzvariable osmotischer Druck Dichte Massenkonzentration des Stoffes B Elektronegativität
Literatur Nachschlagewerke Beilstein: Handbuch der Organischen Chemie. 4. Aufl. (Hauptwerk und 5 Ergänzungswerke). Berlin: Springer CRC Handbook of Chemistry and Physics. 84th ed. Boca Raton, Fla.: CRC Press 2003 JANAF Thermochemical Tables. 3rd ed. J. Phys. Chern. Ref. Data, Suppl., 1985 Landolt-Börnstein, Zahlenwerte und Funktionen aus Naturwissenschaft und Technik. Neue Serie. (Zahlreiche Bände in 7 Gruppen). Berlin: Springer
C111
C112
C Chemie
Nabert, K.; Schön, G.: Sicherheitstechnische Kennzahlen brennbarer Gase und Dämpfe. 2. Aufl. Braunschweig: Dt. Eich-Vlg. 1968 Römpp Lexikon Chemie, 6 Bde. (Falbe, J; Regitz, M. (Hrsg.)). 10. Aufl. Stuttgart: Thieme 1996–1999 (auch als elektronische Version erhältlich) Ullmann’s Encyclopedia of Industrial Chemistry. 6th ed. Weinheim: Wiley-VCH 2002 ff TRGS 900: Grenzwerte in der Luft am Arbeitsplatz „Luftgrenzwerte“, BArbBl, 1996, Nr. 10, 106–108 (hierzu Änderungen!) TRGS 905: Verzeichnis krebserzeugender, erbgutverändernder oder fortpflanzungsgefährdender Stoffe. BArbBl, 1997, Nr. 6, 40–46 (hierzu Änderungen!)
Allgemeine Chemie Christen, H.R., Meyer, G.: Allgemeine und anorganische Chemie, 2Tle, Frankfurt a. M.: Salle; Aarau: Sauerländer 1994, 1995 Forst, D.; Flottenmann, D.; Roßwag, H.: Chemie für Ingenieure. 2. Aufl. Berlin: Springer 2003 Pauling, L.: General Chemistry. Mineola, USA: Dover Publications 1988 Mortimer, Ch. E., Müller, U.: Chemie. Das Basiswissen der Chemie. 7. Aufl. Stuttgart: Thieme 2001 Riedel, E.: Allgemeine und Anorganische Chemie. 7. Aufl. Berlin: de Gruyter 1999
Wiberg, N.: Hollemann-Wiberg: Lehrbuch der Anorganischen Chemie. 101. Aufl. Berlin: de Gruyter 1995
Organische Chemie Beyer, H.; Walter, W.: Lehrbuch der Organischen Chemie. 24. Aufl. Stuttgart: Hirzel 2004 Carey, F.A.; Sundberg, R.J.: Organische Chemie. Weinheim: VCH 1995 Christen, H.R.; Vögtle, F.: Grundlagen der organischen Chemie. 2. Aufl. Frankfurt a.M.: Salle; Aarau: Sauerländer 1998 Hart, H.; Craine, L.E.; Hart, D.J.: Organische Chemie. 2. Aufl. Weinheim: Wiley–VCH 2002 IUPAC; Kruse, G. (Hrsg.): Nomenklatur der Organischen Chemie. Weinheim: Wiley-VCH 1997 Streitwieser, A.; Heathcock, C.H.; Kosower, E.M.: Organische Chemie. 2. Aufl. Weinheim: VCH 1994 Sykes, P.: Reaktionsmechanismen der Organischen Chemie. 9. Aufl. Weinheim: VCH 1988 Vollhardt, K.P.C.; Schore, N.E.: Organische Chemie. 3. Aufl. Weinheim: Wiley-VCH 2000 Weissermel, K.; Arpe, H.-J: Industrial Organic Chemistry. 4. Aufl. Weinheim; Wiley-VCH 2003
Physikalische Chemie Anorganische Chemie Büchel, K.H.; Moretto, H.-H.; Woditsch, P.: Industrielle Anorganische Chemie. 3. Aufl. Weinheim: Wiley-VCH 1999 Cotton, F.A.; Wilkinson, G.; Gaus P.L.: Basic inorganic chemistry. 3rd ed. New York: Wiley 1995 Cotton, F.A.; Wilkinson, G.; u. a.: Advanced inorganic chemistry. New York: Wiley 1999 Greenwood, N.N.; Earnshaw, A.: Chemistry of the elements. 2nd ed. Oxford: Butterworth-Heinsmann 1997 Huheey, J.E.; Keiter, E.; Keiter, R.: Anorganische Chemie. 3. Aufl. Berlin: de Gruyter 2003 Liebscher, W. GDCh (Hrsg.): Nomenklatur der Anorganischen Chemie. Weinheim: VCH 1994 Riedel, E.: Anorganische Chemie. 5. Aufl. Berlin: de Gruyter 2002 Shriver, D.F.; Atkins, P.W.; Langford, C.H.: Anorganische Chemie. 2. Aufl. Weinheim: Wiley-VCH 1997 Steudel, R.: Chemie der Nichtmetalle. 2. Aufl. Berlin: de Gruyter 1998 Wayne, R.P.: Chemistry of atmospheres. Oxford: Clarendon Pr. 2000
Atkins, P.W.: Physikalische Chemie. 3. Aufl. Weinheim: Wiley-VCH 2001 Brdièka, R.: Chemie. 15. Aufl. Weinheim: VCH 1992 Moore, W.J.: Grundlagen der Physikalischen Chemie. Berlin: de Gruyter 1990 Wedler, G.: Lehrbuch der Physikalischen Chemie. 4. Aufl. Weinheim: Wiley-VCH 1997
Spezielle Literatur zu Kapitel 4 und zur Analytischen Chemie Doerffel, K.; Geyer, R.: Analytikum. 9. Aufl. Leipzig: Dt. Vlg. f. Grundstoffindustrie 1994 Jander, G.; Jahr, K.F.: Maßanalyse. 16. Aufl. Berlin: de Gruyter 2003 Küster, F.W.; Thiel, A.: Rechentafeln für die Chemische Analytik. l05. Aufl. Berlin: de Gruyter 2003 Nylén, P; Wigren, N.; Joppien, G.: Einführung in die Stöchiometrie. 19. Aufl. Darmstadt: Steinkopff 1999 Otto, M.: Analytische Chemie. 2. Aufl. Weinheim: VCH 2000
Literatur
Wittenberger, W.: Rechnen in der Chemie. 14. Aufl. Berlin: Springer 1995
Spezielle Literatur zu Kapitel 1 und 2 Gray, H.B.: Elektronen und Chemische Bindung. Berlin: de Gruyter 1973 Großmann, G.; Fabian, J.; Kammer, H.-W: Struktur und Bindung: Atome, und Moleküle. Weinheim: Vlg. Chemie 1973 Haken, H.; Wolf, H.C.: Molekülphysik und Quantenchemie. 3. Aufl. Berlin: Springer 1998 Hensen, K.: Theorie der chemischen Bindung. Darmstadt: Steinkopff 1974 Kutzelnigg, W.: Einführung in die theoretische Chemie, Weinheim: Wiley-VCH 2001 Lieser, K.H.: Nuclear and Radiochemistry. 2. Aufl. Weinheim: Wiley-VCH 2001 Sieler, J., u. a.: Struktur und Bindung: Aggregierte Systeme und Stoffsystematik. Weinheim: Vlg. Chemie 1990
Spezielle Literatur zu Kapitel 5 Poling, B.; Prausnitz, J.; O’Connell, J.: The properties of gases and liquids. New York: McGraw-Hill 2001 Doremus, R.H.: Glass science. 2nd ed. NewYork: Wiley 1994 Egelstaff, P.A.: An introduction to the liquids State. London: Oxford Univ. Pr. 1992 Robinson, R.A.; Stokes, R.H.: Electrolyte solutions. 2nd ed. New York: Dover Publ. 2002 Kelker, H.; Hatz, R.: Handbook of Liquid Crystals. Weinheim: Verlag Chemie 1980 Scholze, H.: Glas: Struktur und Eigenschaften. 3. Aufl. Berlin: Springer 1988 Kleber, W; Bautsch, H.-J.; Bohm, J.: Einführung in die Kristallographie. Berlin: Vlg. Technik 1998 Müller, U.: Structural inorganic chemistry. New York: Wiley 1993 Rösler, H.J.: Lehrbuch der Mineralogie. Heidelberg: Spektrum Akad. Verlag 2002 Wells, A.F.: Structural inorganic chemistry. London: Oxford Univ. Pr. 1983
Prigogine, I.; Defay, R.: Chemische Thermodynamik. Leipzig: Dt. Vlg. f. Grundstoffindustrie 1962 Strehlow, R.A.: Combustion fundamentals. New York: McGraw-Hill 1985 Warnatz, J.; Maas, U.; Dibble, R.W.: Combustion. Berlin: Springer 2001
Spezielle Literatur zu Kapitel 7 Baker, W.E.; Tang, M.J.: Gas, dust and hybrid explosions. Amsterdam: Elsevier 1991 Houston, P.L.: Chemical Kinetics and Reaction Dynamics. New York: McGraw-Hill 2001 Lewis, B.; von Elbe, G.: Combustion, flames and explosions of gases. 3rd ed. Orlando, Fla.: Academic Pr. 1987 Logan, S.R.: Grundlagen der Chemischen Kinetik. Weinheim: Wiley-VCH 1997 Nettleton, M.A.: Gaseous detonations. London: Chapman & Hall 1987 Steen, H. (Hrsg.): Handbuch des Explosionsschutzes. Weinheim: Wiley-VCH 2000 Dörfler, H.-D.: Grenzflächen- und kolloid-disperse Systeme. Berlin: Springer 2002 Robinson, R.A.; Stokes, R.H.: Electrolyte Solutions. 2nd ed. New York: Dover Publ. 2002 Tombs, M. P; Peacocke, A.R.: The osmotic pressure of biological macromolecules. London: Oxford Univ. Pr. 1974
Spezielle Literatur zu Kapitel 8 und 9 Haase, R.: Elektrochemie I: Thermodynamik elektrochemischer Systeme. Darmstadt: Steinkopff 1972 Hamann, C.H.; Vielstich, W.: Elektrochemie. 3. Aufl. Weinheim: Wiley-VCH 1998 Kortüm, G.: Lehrbuch der Elektrochemie. Weinheim: Vlg. Chemie 1972 Strehlow, R.A.: Combustion fundamentals. New York: McGraw-Hill 1985 Wang, J.: Analytical Electrochemistry. 2. Aufl. Heidelberg: Wiley-VCH 2000
Spezielle Literatur zu Kapitel 6
Spezielle Literatur zu Kapitel 10
Haase, R.: Thermodynamik der Mischphasen. Berlin: Springer 1956 Haase, R.: Thermodynamik. 2. Aufl. Darmstadt: Steinkopff 1985 Kortüm, G.; Lachmann, H.: Einführung in die chemische Thermodynamik. 7. Aufl. Weinheim: Vlg. Chemie; Göttingen: Vandenhoeck & Ruprecht 1981
Bantista, R.G.; Mistiva, B.: Rare Earths and Actinides: Science, Technology ans Aplications. TMS The Minerals, Metals and Materials. Soc.: 2000 Katz, J.J.; Seaborg, T.; Mors, L.R.: The chemistry of the actinide elements, vols. 1,2. London: Chapman & Hall 1986 Lieser, K.H.: Nuclear- and Radiochemistry. Weinheim: Wiley-VCH 2001
C113
C114
C Chemie
Loveland, W.; Morrissey, D.J.; Seaborg, G.: Modern Nuclear Chemistry. New York: Wiley 2004 Pope, M.T.: Heteropoly and isopoly oxometalates. Berlin: Springer 1983 Seaborg, G.T.; Loveland, W. D.: The elements beyond uranium. New York: Wiley 1990 Sinha, S.P.: Systematics and properties of the lanthanides. Dordrecht: Reidel 1983
Spezielle Literatur zu Kapitel 12 Echte, A.: Handbuch der technischen Polymerchemie, Weinheim: VCH 1993 Elias, H.G.: Makromoleküle, Band 1–4, Heidelberg: Hüthig & Wepf 1999–2002 Lehninger, A.L.; Nelson, D.L.; Cox, M.M.: Lehninger Biochemie. Berlin: Springer 2001
D1
1 Übersicht 1.1 Der Materialkreislauf Die Prozesse und Produkte der Technik erfordern zu ihrer Realisierung eine geeignete materielle Basis. Material ist die zusammenfassende Bezeichnung für alle natürlichen und synthetischen Stoffe, Materialforschung, Materialwissenschaft und Materialtechnik sind die sich mit den Stoffen befassenden Gebiete der Forschung, Wissenschaft und Technik. Werkstoffe im engeren Sinne nennt man Materialien im festen Aggregatzustand, aus denen Bauteile und Konstruktionen hergestellt werden können [1]. Bei den Konstruktionswerkstoffen stehen die mechanischtechnologischen Eigenschaften im Vordergrund. Funktionswerkstoffe sind Materialien, die besondere
Bild 1-1. Der Materialkreislauf
funktionelle Eigenschaften, z. B. physikalischer und chemischer Art oder spezielle technisch nutzbare Effekte realisieren, z. B. optische Gläser, Halbleiter, Dauermagnetwerkstoffe [2]. Die Energieträger, wie Kraftstoffe, Brennstoffe, Explosivstoffe gehören im strengen Sinne nicht zu den genannten Gruppen, d. h. sie sind als Materialien, aber nicht als Werkstoffe zu bezeichnen. Den stofflichen Grundprozess der gesamten Technik fasst der im Bild 1-1 skizzierte Materialkreislauf zusammen. Er stellt den Weg der (späteren) Materialien von den natürlichen Vorräten über Rohstoffe, Werkstoffe zu technischen Produkten dar und ist durch die Aufeinanderfolge unterschiedlichster Technologien gekennzeichnet: – Rohstofftechnologien zur Ausnutzung der natürlichen Ressourcen,
D
Werkstoffe
D
Werkstoffe
H. Czichos B. Skrotzki F.-G. Simon
D2
D Werkstoffe
– Werkstofftechnologien zur Erzeugung von Werkstoffen und Halbzeugen aus den Rohstoffen, – Konstruktionsmethoden und Produktionstechnologien für Entwurf und Fertigung von Bauteilen und technischen Produkten, – Betriebs-, Wartungs- und Reparaturtechnologien zur Gewährleistung von Funktionsfähigkeit und Wirtschaftlichkeit des Betriebs, – Wiederaufbereitungs- und Rückgewinnungstechnologien zur Schließung des Materialkreislaufs durch Recycling oder – falls dies nicht möglich ist – durch Deponierung. Unter wirtschaftlichen Aspekten ist der Materialkreislauf auch als Wertschöpfungskette zu betrachten. Die für technische Produkte benötigten Konstruktions- und Funktionswerkstoffe müssen dem jeweiligen Anwendungsprofil entsprechen und gezielt bezüglich Material- und Energieverbrauch, Qualität, Zuverlässigkeit, Wirtschaftlichkeit, Gebrauchsdauer, Umweltschutzerfordernissen usw. optimiert werden.
1.2 Werkstoffe in Kultur, Wirtschaft, Technik und Umwelt Kultur- und Technikgeschichte der Werkstoffe
Werkstoffe bilden die stoffliche Basis aller von Menschen geschaffenen Erzeugnisse: von den Gebrauchsgegenständen der Kupfer-, Bronze- und Eisenzeit bis zu den heutigen „High-Tech-Produkten“. Materialeigenschaften prägen damit nicht nur das Erscheinungsbild und die Originalität von Kulturgütern und Kunstwerken [3], sondern auch die Funktionalität technischer Bauteile und Konstruktionen. Die folgenden Stichworte geben eine kurze Übersicht über kulturelle und technische Entwicklungen: – – – – – –
Kulturgeschichte Altsteinzeit vor etwa 10 000 Jahren Jungsteinzeit, 8000 bis 7000 v. Chr. Kupferzeit, 7000 bis 3000 v. Chr. Bronzezeit, 3000 bis 1000 v. Chr. Eisenzeit seit Mitte 2. Jahrtausend v. Chr. „Eiserne Engel“ Maschinen von der Antike bis zur industriellen Revolution (Walter Kiaulehn)
– – – – – – – –
Werkstoffe im 20. Jahrhundert: Basis für Technologien und Industrien [4] Aluminiumlegierungen seit den 20ern → Flugzeugbau, Luftfahrtindustrie Hartmetalle seit den 30ern → Fertigungs-, Produktionstechnik Polymere seit den 40ern → Kunststoffe, Chemische Industrie Superlegierungen seit den 50ern → Düsentriebwerke, Turbinenbau Halbleiter seit den 60ern → Transistortechnik, Elektronikindustrie Neue Keramiken seit den 70ern → „High-TechIndustrien“ Bio-Materialien seit den 80ern → Biotechnologien, Medizintechnik Nano-Materialien seit den 90ern → Mikro- und Nanotechnik
Wirtschaftliche Bedeutung
„Leistungsfähigkeit, Wirtschaftlichkeit und Akzeptanz industrieller Produkte und Systeme hängen entscheidend von den eingesetzten Materialien ab. Die zentrale Rolle von Materialien und maßgeschneiderten Werkstoffen für die Entwicklung zukunftsorientierter Technologien ist einer breiteren Öffentlichkeit jedoch kaum bewusst und wird oft verkannt, da die eingesetzten Materialien vielfach hinter das fertige System oder das Endprodukt zurücktreten. Die technologische und volkswirtschaftliche Bedeutung von Materialien liegt vor allem in den Produkt- und Systeminnovationen, die sie ermöglichen.“ (Wissenschaftsrat, 1996 [5]). Die wirtschaftliche Bedeutung des Produktionsfaktors Material geht z. B. aus Tabelle 1-1 hervor. Ressourcen für Werkstoffe
Die Erzeugung von Metallen, Baustoffen und Kunststoffen basiert naturgemäß auf der WeltRohstoffförderung. Tabelle 1-2 gibt einen Überblick über die Weltproduktion zahlreicher Rohstoffe. Die Energierohstoffe Kohle, Erdöl und Erdgas sind ebenfalls aufgeführt. Als Ressource für die Herstellung von Werkstoffen und anderen Chemieprodukten werden nur etwa 8% des Erdöls genutzt. Der Anteil von
1 Übersicht
Tabelle 1-1. Materialien als Produktionsfaktor der Wirt-
schaft (Quelle: Statist. Jahrbuch für die Bundesrepublik Deutschland 2005) − Kraftfahrzeugbau Bruttoproduktionswert 280,2 Mrd. e, davon − Materialverbrauch 50,8% − Personalkosten 18,3% − Sonstiges 30,9% − Maschinenbau Bruttoproduktionswert 162,8 Mrd. e, davon − Materialverbrauch 40,2% − Personalkosten 30,9% − Sonstiges 28,9% − Chemische Industrie Bruttoproduktionswert 140,1 Mrd. e, davon − Materialverbrauch 35,1% − Personalkosten 20,6% − Sonstiges 44,3% − Elektrizitätserzeugung, Gerätetechnik Bruttoproduktionswert 85,1 Mrd. e, davon − Materialverbrauch 41,4% − Personalkosten 28,6% − Sonstiges 30,3% − Rundfunk- u. Nachrichtentechnik Bruttoproduktionswert 41,1 Mrd. e, davon − Materialverbrauch 35,1% − Personalkosten 19,4% − Sonstiges 45,5%
Kohle, Erdöl und Erdgas am Primärenergieverbrauch betrug 2001 in Deutschland 24, 39 bzw. 22%. Die derzeit bekannten Vorräte führen unter den jetzigen Verbrauchsbedingungen zu geschätzten Nutzungsdauern von etwa 200, 40 bzw. 60 Jahren. Die statische Nutzungsdauer der Metalle (Momentaufnahme eines dynamischen Systems) variiert zwischen 20 und 40 Jahren; sie liegt bei Aluminium (Bauxit) und Eisenerz bei über 100 Jahren. Der spezifische Energiebedarf für die Erzeugung von Stahl, Kunststoffen und Aluminium ist in Tabelle 1-3 dargestellt [6, 7]. Die Analyse des Energieverbrauchs für ein technisches Produkt hat den kumulierten Energiebedarf im Materialkreislauf zu berücksichtigen, der sich als Summe des Energieverbrauchs für die Herstellung, bei der Nutzung und für die Entsorgung des Produktes ergibt.
Tabelle 1-2. Weltproduktion von mineralischen Rohstoffen und Energierohstoffen. Bei den Metallen beziehen sich die Zahlenwerte auf den Metallgehalt, wenn nicht ausdrücklich das Erz genannt wird
Rohstoff
Weltjahresproduktion (1000 t, Erdgas in 106 m3 ) Kohle 5 535 000 Rohöl 3 826 000 Erdgas 2 785 000 Eisenerz 1 363 000 Salz 230 300 Bauxit 163 000 Phosphat 146 000 Gips 111 600 Schwefel 58 500 Pottasche 32 100 Aluminium 29 900 Kaolin 22 600 Magnesit 22 300 Chromerze 18 300 Feldspat 15 500 Kupfer 14 500 Bentonit 13 000 Zink 9 400 Baryt 7 200 Titanoxid 5 000 Blei 3 100 Nickel 1 358 Zirkon 1 187 Brom 499 Zinn 275 Molybdän 153 Antimon 148 Vanadium 64 Wolfram 51,3 Kobalt 48 Uran 42,8 Jod 23,5 Silber 19,7 Cadmium 18,6 Wismut 3,7 Gold 2,49 Quecksilber 1,2 Platin-Metalle 0,514 Diamanten 0,032 Stand 2004, Quelle: British Geological Survey, World Mineral Production 2000 – 04, Keyworth, Nottingham, UK
D3
D4
D Werkstoffe
Tabelle 1-3. Abschätzung des spezifischen Energiebedarfs
für die Erzeugung von Werkstoffen Werkstoff
Aluminium (Halbzeug) Primäraluminium (aus Bauxit) Sekundäraluminium (auf Schrottbasis) Kunststoffe (Granulat) Polyvinylchlorid Polyethylen Polystyrol Stahl (Halbzeug) Oxygenstahl (auf Erzbasis) Elektrostahl (auf Schrottbasis)
spezifischer Energiebedarf MJ/kg 160 . . . 240 12 . . . 20 48 68 75 16 . . . 27 10 . . . 18
Werkstoffe und die Eigenschaften technischer Produkte
Wie ebenfalls aus dem Materialkreislauf, Bild 1-1, abgelesen werden kann, werden Werkstoffe durch Konstruktion und Fertigung in technische Produkte „transformiert“, formelartig geschrieben: Konstruktion Materialien −−−− −−−−−−−−−−−−−→ technisches Produkt Fertigung Informationsbezogen kann das heißen: Kenntnis der Beschaffenheit und des Verhaltens der Materialien ist Voraussetzung einer erfolgreichen Konstruktion. Stoffbezogen: Die Verfügbarkeit und Verwendung von technologisch und funktionell geeigneten Stoffen ist Voraussetzung guter Produktionsqualität. Auch drückt die Formel die Tatsache aus, dass durch ingeniöse Konstruktion und Fertigung die Materialeigenschaften in eine Fülle von Produkteigenschaften aufgefächert und übersetzt werden können. Ein besonders für Erwerber und Benutzer wichtiges Merkmal technischer Produkte ist deren Qualität, sie ist eng mit den Merkmalen Zuverlässigkeit und Sicherheit verknüpft. Qualität ist die Beschaffenheit einer Betrachtungseinheit bezüglich ihrer Eignung, festgelegte und vorausgesetzte Erfordernisse und Funktionen zu erfüllen. Zuverlässigkeit ist die Eigenschaft, funktionstüchtig zu bleiben. Sie ist definiert als die Wahrscheinlichkeit, dass ein Werkstoff,
Bauteil oder System seine bestimmungsgemäße Funktion für eine bestimmte Gebrauchsdauer unter den gegebenen Funktions- und Beanspruchungsbedingungen ausfallfrei, d. h. ohne Versagen, erfüllt. Sicherheit ist die Wahrscheinlichkeit, dass von einer Betrachtungseinheit während einer bestimmten Zeitspanne keine Gefahr ausgeht, bzw. dass das Risiko – gekennzeichnet durch Schadenswahrscheinlichkeit und Schadensausmaß – unter einem vertretbaren Grenzrisiko bleibt. Die Beurteilung der Qualität, Zuverlässigkeit und Sicherheit von Werkstoffen, Bauteilen oder Systemen geschieht mit den Mitteln der Materialprüfung, siehe Kap. 11. Dabei ist insbesondere auch festzustellen, inwieweit oder auf welche Weise die Ergebnisse von Werkstoffprüfungen auf Bauteile oder Systeme übertragen werden können. Werkstoffe und die Umwelt
Bild 1-1 erinnert daran, dass Werkstoffe als Bestandteile technischer Produkte bei deren technischer Funktion in Wechselwirkung mit ihrer Umwelt stehen. Die Wechselwirkungen beschreibt man allgemein als den einen oder anderen von zwei komplementären Prozessen: – Immission, die Einwirkung von Stoffen oder Strahlung auf einen Werkstoff, die z. B. zur Korrosion führen kann. – Emission, der Austritt von Stoffen oder Strahlung (auch Schall). Eine Emission aus einem Werkstoff ist in der Regel gleichzeitig eine Immision in die Umwelt. Auf Umweltbeanspruchung und Umweltsimulation wird in Kap. 8.4 näher eingegangen. Zum Schutz der Umwelt – und damit des Menschen – bestehen gesetzliche Regelungen für den Emissionsund Immissionsschutz mit Verfahrensregelungen und Grenzwerten für schädliche Stoffe und Strahlungen. Hinsichtlich des Umweltschutzes sind an die Werkstoffe selbst hauptsächlich die folgenden Forderungen zu stellen: – Umweltverträglichkeit, die Eigenschaft, bei ihrer technischen Funktion die Umwelt nicht zu beeinträchtigen (und andererseits von der jeweiligen Umwelt nicht beeinträchtigt zu werden).
2 Aufbau der Werkstoffe
Tabelle 1-4. Recyclingquoten von Werkstoffen bezogen auf
den Verbrauch Werkstoff Recyclingquote % Aluminium 35 Blei 59 Kupfer 54 Eisen 55 Zink 41 Quelle: BGR, Rohstoffwissenschaftliche Steckbriefe, 2006
– Recyclierbarkeit (siehe auch Kap. 7.2), die Möglichkeit der Rückgewinnung und Wiederaufbereitung nach dem bestimmungsgemäßen Gebrauch. Einen Eindruck von den gegenwärtig erzielbaren Recyclingquoten von Metallen in Deutschland gibt Tabelle 1-4. – Abfallbeseitigung, die Möglichkeit der Entsorgung von Material, wenn ein Recycling nicht möglich ist [9]. Nach dem Vorbild der Stoffkreisläufe in der belebten Natur sind heute auch für die Materialien der Technik im Prinzip stets geschlossene Kreisläufe anzustreben und ggf. durch „Ökobilanzen“ zu kennzeichnen. Auf die Wechselwirkungen von Material und Umwelt wird in Kap. 7 näher eingegangen.
1.3 Gliederung des Werkstoffgebietes Für die fachliche Gliederung des Werkstoffgebietes gibt es mehrere Aspekte, die mit den Methoden der Systemtechnik kombiniert werden können. Werkstoffe sind bestimmungsgemäß Bestandteil von Gegenständen oder technischen Systemen. Jedes technische System ist durch die beiden Merkmale Funktion und Struktur gekennzeichnet, vgl. K 2. Entwicklung und Anwendung technischer Systeme erfordern neben der Kennzeichnung struktureller und funktioneller Eigenschaften Mess- und Prüftechniken zur Beurteilung des Systemverhaltens sowie Auswahl- und Gestaltungsmethoden für ihre Bauelemente. Für das Werkstoffgebiet ist ein mehrdimensionales Gliederungsschema mit folgenden Schwerpunkten zweckmäßig: a) Aufbau der Werkstoffe: Stoffliche Natur, unterschiedlich hinsichtlich chemischer Zusammensetzung, Bindungsart und Mikrostruktur.
b) Beanspruchung: Einflüsse, die auf Werkstoffe bei der Anwendung einwirken, deren Parameter und zeitlicher Verlauf. c) Eigenschaften: Kenngrößen und Systemdaten, die das Verhalten von Werkstoffen gegenüber den verschiedenen Beanspruchungen und in ihren technisch-funktionellen Anwendungen beschreiben. d) Schädigungsmechanismen: Veränderungen der Stoff- oder Formeigenschaften von Werkstoffen bzw. Bauteilen, die deren Funktion beeinträchtigen können. e) Materialprüfung: Techniken und Methoden zur Untersuchung und Beurteilung von Materialien, Bauteilen und Konstruktionen. f) Materialauswahl: Techniken und Methoden zur anwendungsbezogenen Auswahl von Materialien. g) Referenzmaterialien und Referenzverfahren zur Qualitätssicherung des Materialverhaltens in technischen Anwendungen.
2 Aufbau der Werkstoffe Der Aufbau eines Werkstoffs ist durch folgende Merkmale bestimmt: a) Die chemische Natur seiner atomaren oder molekularen Bausteine. b) Die Art der Bindungskräfte (Bindungsart) zwischen den Atomen bzw. Molekülen. c) Die atomare Struktur, das ist die räumliche Anordnung der Atome bzw. Moleküle zu elementaren kristallinen, molekularen oder amorphen Strukturen, diese bilden bei kristallinen Stoffen Elementarzellen, die als eigentliche Grundbausteine des Stoffs angesehen werden können. d) Die Kristallite oder Körner, das sind einheitlich aufgebaute Bereiche eines polykristallinen Stoffs, die durch sog. Korngrenzen voneinander getrennt sind. e) Die Phasen der Werkstoffe, das sind Bereiche mit einheitlicher atomarer Struktur und chemischer Zusammensetzung, die durch Grenzflächen (Phasengrenzen) von ihrer Umgebung abgegrenzt sind. f) Die Gitterbaufehler, das sind Abweichungen von der idealen Kristallstruktur: – Punktfehler: Fremdatome, Leerstellen, Zwischengitteratome, Frenkel-Defekte
D5
D6
D Werkstoffe
– Linienfehler: Versetzungen – Flächenfehler: Stapelfehler, Korngrenzen, Phasengrenzen g) Die Mikrostruktur oder das Gefüge, das ist der mikroskopische Verbund der Kristallite, Phasen und Gitterbaufehler.
2.1 Aufbauprinzipien von Festkörpern Alle Materie ist aus den im Periodensystem der Elemente zusammengefassten Atomen aufgebaut (siehe C 2 und C 4). Die Bindung zwischen je zwei Atomen eines Festkörpers resultiert aus elektrischen Wechselwirkungen zwischen den beiden Partnern, siehe Bild 2-1. Die Überlagerung der Abstoßungsund Anziehungsenergien (oder Potenziale) führt zu einem Potenzialminimum, dessen Tiefe die Bindungsenergie UB und dessen Lage den Gleichgewichtsabstand r0 (Größenordnung 0,1 nm) angibt. Die chemischen Bindungen zwischen den Elementarbausteinen fester Körper werden eingeteilt in (starke) Hauptvalenzbindungen (Ionenbindung, Atombindung, metallische Bindung) und (schwache) Nebenvalenzbindungen: Ionenbindung (heteropolare Bindung): Jedes Kation gibt ein oder mehrere Valenzelektronen an ein oder mehrere Anionen ab. Bindung durch ungerichtete elektrostatische (Coulomb-)Kräfte zwischen den Ionen.
Atombindung (homöopolare oder kovalente Bindung): Gemeinsame (Valenz-)Elektronenpaare zwischen nächsten Nachbarn; gerichtete Bindung mit räumlicher Lokalisierung der bindenden Elektronenpaare. Metallische Bindung: Gemeinsame Valenzelektronen aller beteiligten Atome (Elektronengas); ungerichtete Bindung zwischen dem Elektronengas und den positiv geladenen Atomrümpfen. Van-der-Waals-Bindung: Interne Ladungspolarisation (Dipolbildung) benachbarter Atome oder Moleküle; schwache elektrostatische Dipoladsorptionsbindung. Aus der Bindungsart und den Atomabständen (bzw. den Molekülformen) der Elementarbausteine ergeben sich die elementaren Kristallstrukturen fester Stoffe. Die atomaren Bestandteile von Kristallen sind wie die Knoten eines räumlichen Punktgitters (Raumgitters) angeordnet, das entsteht, wenn drei Scharen paralleler Ebenen (Netzebenen) sich kreuzend durchdringen. Das kleinste Raumelement, durch dessen wiederholte Verschiebung um die jeweilige Kantenlänge in jeder der drei Achsrichtungen man sich ein Raumgitter aufgebaut denken kann, wird als Elementarzelle bezeichnet. Die möglichen Raumgitter der Kristalle werden durch 7 Koordinatensysteme bzw. 14 BravaisGittertypen gekennzeichnet, siehe Bild 2-2. Die Lage eines Atoms in der Elementarzelle eines Kristalls wird durch den Ortsvektor r = xa + yb + zc (0 ≤ x, y, z < 1)
Bild 2-1. Wechselwirkungsenergien zwischen zwei isolierten Atomen (UB Bindungsenergie; r0 Gleichgewichtsabstand)
beschrieben, wobei a, b, c die Einheitsvektoren auf den drei kristallographischen Achsen a, b, c eines Kristallgitters und x, y, z die Koordinaten des Atoms darstellen. Ein Gitterpunkt mit den Koordinaten uvw wird gefunden, indem vom Koordinatenursprung aus der Vektor ua in a-Richtung, vb in b-Richtung und wc in c-Richtung zurückgelegt wird. Mit der Verbindungsgeraden vom Koordinatenursprung zum Gitterpunkt uvw kann auch eine Richtung im Gitter beschrieben werden: [uvw]. Damit ist gleichzeitig auch eine Fläche charakterisiert, nämlich diejenige Fläche, deren Flächennormale die Richtung vom Koordinatenursprung zum Punkt uvw hat. Zur Bezeichnung einer Kristallfläche oder einer Schar von parallelen Gitterebenen dienen Miller’sche Indizes: die durch Multiplikation mit dem Hauptnenner
2 Aufbau der Werkstoffe
ganzzahlig gemachten reziproken Achsabschnitte der betreffenden Fläche. In Bild 2-3 ist die Koordinatenschreibweise am Beispiel eines kubischen Gitters illustriert. Während ideale Kristalle durch eine regelmäßige Anordnung ihrer Elementarbausteine gekennzeichnet sind (Fernordnung), besteht bei amorphen Festkörpern nur eine strukturelle Nahordnung im Bereich der nächsten Nachbaratome. Sie ähneln Schmelzen und werden daher auch als Gläser, d. h. als unterkühlte,
in den festen Zustand eingefrorene Flüssigkeiten bezeichnet. Als einphasige Festkörper werden feste Stoffe mit einheitlicher chemischer Zusammensetzung und atomarer Struktur bezeichnet. Die unterschiedlichen Zustände mehrphasiger Festkörper werden – in Abhängigkeit von der chemischen Zusammensetzung und der Temperatur – durch Zustandsdiagramme beschrieben (s. 2.7).
Bild 2-2. Die 7 Kristallsysteme und die 14
Bravais-Gitter
D7
D8
D Werkstoffe
Bild 2-4. Nulldimensionale Gitterbaufehler (Punktfehler) Bild 2-3. Indizierung von Richtungen und Ebenen in einem kubischen Gitter
2.2 Mikrostruktur Der mikrostrukturelle Aufbau technischer Werkstoffe unterscheidet sich von der idealer Festkörper durch Gitterbaufehler, die für die Werkstoffeigenschaften von grundlegender Bedeutung sind. Nach ihrer Geometrie ist folgende Klassifizierung üblich: a) Nulldimensionale Gitterbaufehler (Punktfehler), siehe Bild 2-4: Es werden neben der Substitution von Gitterbausteinen durch Fremdatome die folgenden Grundformen unterschieden:
Versetzungen bezeichnet. Eine Versetzung lässt sich als Randlinie eines zusätzlich in das Gitter eingefügten (oder aus ihm herausgenommenen) Ebenenstückes A–B darstellen. Das Maß für die Größe der Verzerrung eines Kristallgitters durch eine Versetzung ist der Burgers-Vektor b. Bei einer Stufenversetzung liegen Burgers-Vektor und Versetzungslinie rechtwinklig, bei einer Schraubenversetzung parallel zueinander. Eine Versetzungslinie muss im Gitter stets in sich geschlossen sein oder an einer Grenzfläche oder Oberfläche enden. Versetzungen ermöglichen den energetisch günstigen Elementarschritt der plastischen Deformation, bei
– Leerstellen: Jeder Kristall enthält eine mit der Gittertemperatur zunehmende Anzahl von Leerstellen. Der Anteil der Leerstellen bezogen auf die Zahl der Gitterbausteine in einem fehlerfreien Kristall beträgt bei Raumtemperatur ca. 10−12 . Die Bildungsenergie für Leerstellen ist in Metallen etwa der Verdampfungsenthalpie proportional. Durch Punktfehler in Kristallen mit Ionenbindung entsteht im Gitter örtlich eine positive oder negative Polarisation. – Zwischengitteratome: In zahlreichen Kristallgittern können, besonders kleine, Gitteratome, wie z. B. H, C, N, auf Zwischengitterplätze abwandern. Die Kombination einer Leerstelle mit einem entsprechenden Zwischengitteratom heißt Frenkel-Paar oder Frenkel-Defekt. b) Eindimensionale Gitterbaufehler (Linienfehler), siehe Bild 2-5: Eindimensionale Gitterbaufehler stellen eine linienförmige Störung des Gitters dar und werden als
Bild 2-5. Eindimensionale Gitterbaufehler: a Stufenverset-
zung in einem kubischen Kristall, b Versetzungsbewegung (Abgleitung) unter Schubspannung, c Resultierende Gleitstufe; b Burgers-Vektor
2 Aufbau der Werkstoffe
dem durch eine Schubspannung τ ein Gitterblock gegenüber einem anderen stufenweise um den Betrag des Burgers-Vektors verschoben wird. Die Abgleitung erfolgt bei reinen Metallen längs bestimmter kristallographischer Ebenen (Gleitebenen) in definierten Gleitrichtungen. Das aus Gleitebene und Gleitrichtung bestehende Gleitsystem ist für Gittertyp und Bindungsart charakteristisch (siehe 9.2.3). c) Zweidimensionale Gitterbaufehler (Flächenfehler): Zweidimensionale Gitterbaufehler kennzeichnen diskontinuierliche Änderungen der Gitterorientierung oder der Gitterabstände. Man unterscheidet: – Stapelfehler: Das sind Störungen der Stapelfolge von Gitterebenen. Sie erschweren die Versetzungsbewegung und beeinflussen die Verfestigung der Metalle bei plastischer Verformung. – Korngrenzen: Grenzflächen zwischen Kristalliten gleicher Phase mit unterschiedlicher Gitterorientierung. Sie sind Übergangszonen mit gestörtem Gitteraufbau. Nach der Größe des Orientierungsunterschieds benachbarter Kristallite unterscheidet man Kleinwinkelkorngrenzen (aufgebaut aus flächig angeordneten Versetzungen) und Großwinkelkorngrenzen mit (amorphen) Grenzbereichen von etwa zwei bis drei Atomabständen. – Phasengrenzen: Grenzflächen zwischen Gitterbereichen mit unterschiedlicher chemischer Zusammensetzung oder Gitterstruktur. Als Gefüge eines Werkstoffs bezeichnet man den kennzeichnenden mikroskopischen Verbund der Kristallite (Körner), Phasen und Gitterbaufehler. Mittlerer Korndurchmesser (beeinflussbar durch Wärmebehandlung und Umformung): wenige μm bis mehrere cm. Ein- oder mehrphasige Polykristalle mit einem Kristallitdurchmesser zwischen 5 und 15 nm und etwa gleichen Atomanteilen in Kristalliten und Grenzflächen werden als nanokristalline Materialien bezeichnet. Sie können nach der herkömmlichen Terminologie weder den Kristallen (ferngeordnet) noch den Gläsern (nahgeordnet) zugerechnet werden.
2.3 Werkstoffoberflächen Gegenüber dem Werkstoffinnern weisen Oberflächen folgende Unterschiede auf:
– Veränderte Mikrostruktur; – Veränderung der Oberflächenzusammensetzung durch Einbau von Bestandteilen des Umgebungsmediums (Physisorption, Chemisorption, Oxidation, Deckfilmbildung); – Änderung von Werkstoffeigenschaften. Bei technischen Oberflächen ist außerdem noch der Einfluss der Fertigung zu beachten. Spanend bearbeitete und umgeformte Oberflächen zeigen in der Oberflächenzone folgende Veränderungen: – Unterschiedliche Verfestigung durch plastische Verformungen, – Aufbau von Eigenspannungen infolge Oberflächenverformung, – Ausbildung von Texturinhomogenitäten zwischen Randzone und Werkstoffinnerem. Der Schichtaufbau technischer Oberflächen ist in Bild 2-6 wiedergegeben [1]. Die innere Grenzschicht besteht aus einer an den Grundwerkstoff anschließenden Verformungs- oder Verfestigungszone. Die äußere Grenzschicht besitzt meist eine vom Grundwerkstoff abweichende Zusammensetzung und besteht aus Oxidschicht, Adsorptionsschicht und Verunreinigungen. Die Mikrogeometrie von Oberflächen (Oberflächenrauheit) wird durch verschiedene „Rauheitskenngrößen“ gekennzeichnet (siehe 11.3.2).
2.4 Werkstoffgruppen Nach der dominierenden Bindungsart und der Mikrostruktur lassen sich die folgenden hauptsächlichen Werkstoffgruppen unterscheiden, siehe Bild 2-7. Metalle
Die Atomrümpfe werden durch das Elektronengas zusammengehalten. Die freien Valenzelektronen des Elektronengases sind die Ursache für die hohe elektrische und thermische Leitfähigkeit sowie den Glanz der Metalle. Die metallische Bindung – als Wechselwirkung zwischen der Gesamtheit der Atomrümpfe und dem Elektronengas – wird durch eine Verschiebung der Atomrümpfe nicht wesentlich beeinflusst. Hierauf beruht die gute Verformbarkeit der Metalle. Die Metalle bilden die wichtigste Gruppe der
D9
D10
D Werkstoffe
strukturierten sog. III-V-Verbindungen, wie z. B. Galliumarsenid (GaAs) und Indiumantimonid (InSb). In den am absoluten Nullpunkt nichtleitenden Halbleitern können durch thermische Energie oder durch Dotierung mit Fremdatomen einzelne Bindungselektronen freigesetzt werden und als Leitungselektronen zur elektrischen Leitfähigkeit beitragen. Halbleiter stellen wichtige Funktionswerkstoffe für die Elektronik dar. Anorganisch-nichtmetallische Stoffe Bild 2-6. Werkstoffoberflächen-Schichtaufbau: schemati-
sche Darstellung des Querschnitts einer Metalloberfläche
Konstruktions- oder Strukturwerkstoffe, bei denen es vor allem auf die mechanischen Eigenschaften ankommt. Halbleiter
Eine Übergangsstellung zwischen den Metallen und den anorganisch-nichtmetallischen Stoffen nehmen die Halbleiter ein. Ihre wichtigsten Vertreter sind die Elemente Silicium und Germanium mit kovalenter Bindung und Diamantstruktur sowie die ähnlich
Bild 2-7. Klassifikation der Werkstoffgruppen
Die Atome werden durch kovalente Bindung und Ionenbindung zusammengehalten. Aufgrund fehlender freier Valenzelektronen sind sie grundsätzlich schlechte Leiter für Elektrizität und Wärme. Da die Bindungsenergien erheblich höher sind als bei der metallischen Bindung, zeichnen sich anorganischnichtmetallische Stoffe, wie z. B. Keramik, durch hohe Härten und Schmelztemperaturen aus. Eine plastische Verformung wie bei Metallen ist analog nicht begründbar, da bereits bei der Verschiebung der atomaren Bestandteile um einen Gitterabstand theoretisch eine Kation-Anion-Bindung in eine Kation-Kation- oder Anion-Anion-Abstoßung umgewandelt oder eine gerichtete kovalente Bindung aufgebrochen werden muss.
2 Aufbau der Werkstoffe
Organische Stoffe
Organische Stoffe, deren technisch wichtigste Vertreter die Polymerwerkstoffe sind, bestehen aus Makromolekülen, die im Allgemeinen Kohlenstoff in kovalenter Bindung mit sich selbst und einigen Elementen niedriger Ordnungszahl enthalten. Deren Kettenmoleküle sind untereinander durch (schwache) zwischenmolekulare Bindungen verknüpft, woraus niedrige Schmelztemperaturen resultieren (Thermoplaste). Sie können auch chemisch miteinander vernetzt sein und sind dann unlöslich und unschmelzbar (Elastomere, Duroplaste). Naturstoffe
Bei den als Werkstoff verwendeten Naturstoffen wird unterschieden zwischen mineralischen Naturstoffen (z. B. Marmor, Granit, Sandstein; Glimmer, Saphir, Rubin, Diamant) und organischen Naturstoffen (z. B. Holz, Kautschuk, Naturfasern). Die Eigenschaften vieler mineralischer Naturstoffe, z. B. hohe Härte und gute chemische Beständigkeit, werden geprägt durch starke Hauptvalenzbindungen und stabile Kristallgitterstrukturen. Die organischen Naturstoffe weisen meist komplexe Strukturen mit richtungsabhängigen Eigenschaften auf. Verbundwerkstoffe, Werkstoffverbunde
Verbundwerkstoffe werden mit dem Ziel, Strukturoder Funktionswerkstoffe mit besonderen Eigenschaften zu erhalten, als Kombination mehrerer Phasen oder Werkstoffkomponenten in bestimmter
geometrisch abgrenzbarer Form aufgebaut, z. B. in Form von Dispersionen oder Faserverbundwerkstoffen. Werkstoffverbunde vereinen unterschiedliche Werkstoffe mit verschiedenen Aufgaben, z. B. bei Email.
2.5 Mischkristalle und Phasengemische Strukturwerkstoffe bestehen eigentlich nie aus nur einer Atomart, da reine Stoffe keine ausreichenden mechanische Eigenschaften für technische Anwendungen aufweisen. Daher werden Atome einer anderen Art zugefügt (Legieren). Wenn es gelingt, diese in der festen Phase zu lösen, dann spricht man von Mischkristallen. In idealen Mischkristallen sind die zugefügten Atome stochastisch verteilt (Bild 2-8a). Die Fremdatome ersetzen entweder die Atome auf den Gitterplätzen oder sie nehmen Zwischengitterplätze ein (Bild 2-4). Die Mischbarkeit von Kristallen ist gewöhnlich begrenzt, sie ist bei hoher Temperatur größer als bei niedriger Temperatur. Voraussetzung für eine vollständige Mischbarkeit von Kristallen ist die gleiche Kristallstruktur beider Komponenten. Unterscheiden sich die Gitterkonstanten oder Atomradien um mehr als 15%, so ist die Mischbarkeit meist begrenzt. Ein Sonderfall sind interstitielle Atome, die sehr klein sind und in Gitterlücken eingebaut werden. Ein bestimmtes Verhältnis der Atomradien darf dabei allerdings nicht überschritten werden. Chemische Voraussetzungen bestimmen ebenfalls die Löslichkeit, denn die äußeren Elektronen beider Atomarten treten in Wechselwirkung miteinander.
Bild 2-8. a Regellose Verteilung der Legierungsatome. b In einer Ordnungsstruktur nehmen beide Atomarten bestimmte
Gitterplätze ein. c Entmischung beider Atomarten
D11
D12
D Werkstoffe
Die Zusammensetzung der Mischphasen wird als Stoffmengengehalt x (in Atomprozent oder Molprozent) oder als Massegehalt c (in Gewichtsprozent) angegeben. Letzterer hat den Vorteil, dass er direkt mit der Einwaage der Elemente in Zusammenhang steht. Folgende Beziehungen erlauben die Umrechnung: cA =
xA · AA · 100 mA = · 100 x A · A A + x B · A B mA + mB
xA =
cA AA cA AA
· 100 +
cB AB
nA = · 100 nA + nB
[Gew.%] (2-1)
[Atom.%] (2-2)
Die Umrechnung von Massegehalt in Volumengehalt erfolgt mit: VA =
100 100 = 1 + ccBAρρAB 1 + xBρAB B xAρAA A
[Vol.%]
(2-3)
AA und AB sind die Atomgewichte, mA und mB entsprechen der Masse und nA und n B der Anzahl der Atome. A und B sind die Dichten der Komponenten A und B. Für die Masse gilt mA = nA AA bzw. mB = nB AB und xA = nA /(nA + nB ). Es gilt immer, dass i xn = 100% (2-4) n=1
ist. Die Anzahl der Elemente ist i. Häufig werden diese Gehalte nicht in Prozent, sondern in Bruchteile von 1 angegeben. In realen Mischkristallen sind die gelösten Atome nicht immer stochastisch verteilt. Wenn sich die beiden Atomarten anziehen, besteht eine Neigung zur Bildung einer chemischen Verbindung. Ist die Anziehung sehr groß, so bilden sich Ordnungsstrukturen (Bild 2-8b). Ist die Anziehung zwischen gleichen Nachbarn groß, so gibt es eine Tendenz zur Trennung in A-reiche und B-reiche Bereiche. Dieser Vorgang wird als Entmischung bezeichnet (Bild 2-8c). Oftmals sind Werkstoffe nicht nur aus einer Kristallart, sondern aus zwei oder mehr Kristallarten zusammengesetzt. Bereiche mit konstanter Atomstruktur und chemischer Zusammensetzung werden als Phase bezeichnet. Die Grenze zwischen zwei Phasen wird als Phasengrenze bezeichnet. Diese kann zwischen zwei verschiedenen Kristallarten verlaufen, aber auch zwischen einem Glas und einem Kristall
(z. B. in Keramiken und Kunststoffen). Technische Werkstoffe bestehen vornehmlich aus Phasengemischen. Beispiele dafür sind Stahl, aushärtbare Aluminiumlegierungen, Verbundwerkstoffe.
2.6 Gleichgewichte Analog zum mechanischen Gleichgewicht wird auch in der Thermodynamik nach labilen, metastabilen und stabilen Gleichgewichten unterschieden. Im stabilen Gleichgewicht weist die Energie ein Minimum auf, während im metastabilen Gleichgewicht die Energie nach Aktivierung noch weiter erniedrigt werden kann. Im labilen Gleichgewicht genügen hingegen kleinste Schwankungen zur Erniedrigung der Energie. Das thermodynamische Gleichgewicht umfasst das mechanische, thermische (kein Temperaturgradient) und chemische (keine chemische Reaktion) Gleichgewicht. Befindet sich ein Stoff im thermodynamischen Gleichgewicht, so ändert sich sein Druck, seine Temperatur, sein Volumen und seine Zusammensetzung mit der Zeit nicht mehr. In diesem Zustand weist die Freie Energie bzw. die Freie Enthalpie ihr Minimum auf. Häufig sind Werkstoffe im Zustand ihrer Anwendung nicht im thermodynamischen Gleichgewicht. Dies hat zur Folge, dass sie während ihres Einsatzes eine Tendenz zeigen, ihren Zustand z. B. durch Kristallisation oder Entmischung oder Bildung einer chemischen Verbindung zu ändern, wenn man ihnen Gelegenheit dazu gibt. Dies ist in der Regel mit einer Änderung ihrer Eigenschaften (Festigkeit, Härte) verbunden. Mischphasen und Phasengemische, die sich im Gleichgewicht befinden, bleiben jedoch unverändert. Folglich sind Kenntnisse über Gleichgewichte und Ungleichgewichte sehr nützlich, sowohl für die Herstellung von Werkstoffen, als auch zur Einschätzung ihres Verhaltens im Einsatz. Es wird zwischen homogenen und heterogenen Gleichgewichten unterschieden. Letzere betreffen Stoffe mit mehr als einer Phase. Jedem Stoff kann in seinem vorliegenden Zustand eine charakteristische Freie Enthalpie G = H − T S zugeschrieben werden. H bezeichnet die Enthalpie, S die Entropie und T die Temperatur. Die Änderung der Freien Enthalpie dG = dH − T dS , die eine Zustandsänderung begleitet, stellt die treibende Kraft für diesen Prozess dar. Alle spontan ablaufenden
2 Aufbau der Werkstoffe
Zustandsänderungen müssen mit einer Erniedrigung der gesamten Freien Enthalpie des Systems verbunden sein, d. h. ΔG muss negativ sein. Im Gleichgewichtszustand, in dem keine treibende Kraft für eine Zustandsänderungen vorhanden ist, muss folglich ΔG = 0 gelten. Jede Phase in einem System, ob stabil oder instabil, besitzt ihre Funktion G(T). Dies sei am Beispiel der technisch bedeutenden Umwandlung des (reinen) Eisens verdeutlicht (Bild 2-9a). Bei tiefer Temperatur ist das krz α-Eisen stabil, oberhalb von 911 ◦ C (= T αγ ) jedoch das kfz γ-Eisen. Bei 1392 ◦ C (= T γδ ) tritt eine weitere Umwandlung in das ebenfalls krz δ-Eisen ein und bei 1536 ◦ C (= T δL ) beginnt das Eisen zu schmelzen. Die γ → α Umwandlung tritt bei T < 911 ◦ C ein, da dann Gα < Gγ und daher eine treibende Kraft für die Umwandlung vorhanden ist (Bild 2-9b). Diese Umwandlung ist entscheidende Voraussetzung für die Stahlhärtung (siehe 3.3). Ähnliche Überlegungen können für Mehrstoffsysteme angestellt werden. Für die Betrachtung eines Zweistoffsystems wird ein zweidimensionales Temperatur-Konzentrations-Diagramm benötigt. Bild 2-10a zeigt einen Mischkristall γ, der sich bei tiefen Temperaturen in einen α-Kristall (reich an A) und einen β-Kristall (reich an B) entmischt: das System weist eine Mischungslücke auf. Die isothermen G(x)-Kurven sind ebenfalls in Bild 2-10 für 3 verschiedene Temperaturen T 1 bis T 3 gezeigt. Die Konzentration der Phasen, die sich bei einer bestimmten Temperatur im Gleichgewicht befinden, wird durch die gemeinsame Tangente an die G(x)-Kurve ermittelt.
Bild 2-10. a Zustandsdiagramm eines Zweistoffsystems mit Mischungslücke. Der Mischkristall γ entmischt sich in αund β-Kristalle. Der stabile Zustand ist der mit der niedrigsten Freien Enthalpie: b bei T 3 und c T 2 : Phasengemische aus α- und β-Kristallen mit bestimmten Zusammensetzungen. d Bei T 1 ist die Mischphase γ stabil
2.7 Zustandsdiagramme
Bild 2-9. a Zustandsdiagramm des reinen Eisens mit zwei Phasenumwandlungen (α → γ und γ → δ) im festen Zustand. b Freies Enthalpie-Temperatur-Diagramm für Eisen mit γ → α-Umwandlung bei 911 ◦ C und Gγ = Gα
Phasendiagramme erweisen sich bei der Interpretation metallischer oder keramischer Gefüge als sehr nützlich. Sie zeigen auf, welche Phasen vermutlich vorliegen und geben Daten zu ihrer chemischen Zusammensetzungen. Leider geben Phasendiagramme keine Hinweise darauf, in welcher Form und Verteilung die Phasen vorliegen, ob sie sich z. B. lamellar, globular oder intergranular ausbilden. Dies ist aber für die mechanischen Eigenschaften entscheidend. Eine weitere Einschränkung besteht darin, dass Zustands-
D13
D14
D Werkstoffe
diagramme lediglich Gleichgewichtszustände repräsentieren, die sich nur bei langsamer Abkühlung bzw. Aufheizung einstellen. Abschrecken, also schnelles Abkühlen, wie es z. B. für die Härtung von Stählen erforderlich ist, erzeugt metastabile Zustände, die in Zustandsdiagrammen nicht dargestellt werden. Auch in diesem Fall gibt aber das Zustandsdiagramm darüber Auskunft, welchen Zustand ein Stoff im Gleichgewicht anstrebt. Zustandsdiagramme geben z. B. an, bei welcher Zusammensetzung die höchste oder geringste Schmelztemperatur vorliegt; die Anzahl von Phasen und deren Volumenanteile bei einer bestimmten Zusammensetzung; die günstigste Zusammensetzung einer ausscheidungshärtbaren Legierung; die Temperatur, bis zu der aufgeheizt werden darf, ohne dass eine Umwandlung in eine andere Kristallstruktur oder Auflösung oder Entmischung eintritt. Die Gibbs’sche Phasenregel gibt den Zusammenhang zwischen der Anzahl der Phasen P eines Systems mit K Komponenten und dem äußeren Druck sowie Temperatur und der chemischen Zusammensetzung an. Die Freiheitsgrade F des Systems ergeben sich zu: F = K−P+2
Bild 2-11. Grundtypen einiger wichtiger binärer Zustands-
(2-5)
In der Praxis ist der Druck meist konstant, sodass sich die Zahl der Freiheitsgrade um 1 reduziert: F = K−P+1
(2-6)
Wenden wir dies auf das System mit der Mischungslücke (Bild 2-10) an, so erhalten wir K = 2 (Komponenten A und B), P = 1 im Gebiet des homogenen Mischkristalls γ, P = 2 im heterogenen Gebiet (α + β). Somit ergibt sich F = 2 im homogenen und F = 1 im heterogenen Gebiet. Dies bedeutet, dass im homogenen Gebiet die Freiheitsgrade Temperatur und Konzentration geändert werden können, ohne dass eine Zustandsänderung eintritt. Im Zweiphasengebiet (α + β) existiert jedoch nur ein Freiheitsgrad, d. h. bei Temperaturänderung ändert sich notwendigerweise auch die Zusammensetzung und umgekehrt. Es gibt vielfältige Ausbildungen von Zustandsdiagrammen. Im Folgenden werden einige wichtige binäre Grundtypen vorgestellt. Kompliziertere Systeme setzen sich aus diesen zusammen (Bild 2-11).
diagramme. a Nahezu vollständige Unmischbarkeit im flüssigen (L) und festen (S) Zustand. Beispiel: Fe-Mg, Fe-Pb. b Vollständige Mischbarkeit im flüssigen und festen Zustand. xL = Konzentration der Schmelze, xS = Konzentration des Kristalls beim Erstarren. Beispiel: Cu-Au. c Eutektisches System mit vollständiger Mischbarkeit im flüssigen und begrenzter Mischbarkeit im festen Zustand. Beispiel: Al-Si. d Peritektisches System vollständiger Mischbarkeit im flüssigen und begrenzter Mischbarkeit im festen Zustand. Niedrig schmelzende Komponente A und hoch schmelzende Komponente B. Beispiel: Cu-Zn (Messing). e Verbindung V bildet mit den Elementen A und B eutektische Teilsysteme. f Verbindung V mit stöchiometrischer Zusammensetzung Ax By , zersetzt sich beim Schmelzen in L + B
(Fast) völlige Unmischbarkeit der Komponenten A und B im flüssigen und festen Zustand (Bild 2-11a): Es gibt im Diagramm lediglich horizontale Linien bei den Schmelz- und Siedetemperaturen. Mischbarkeit liegt erst im Gaszustand vor. Stoffe, die nicht miteinander reagieren dürfen, sollten dieses Zustandsdiagramm besitzen. Beispiel: Schmelzen von Blei in Eisentiegeln.
2 Aufbau der Werkstoffe
Völlige Mischbarkeit im festen und flüssigen Zustand (Bild 2-11b): Die jeweiligen reinen Komponenten A und B besitzen einen Schmelzpunkt, die Gemische jedoch ein Schmelzintervall. Beim Abkühlen einer Schmelze mit der Konzentration x bildet sich zuerst ein Kristall der Zusammensetzung xS . Bei weiterer Abkühlung ändert sich diese bis zu x. Parallel dazu ändert sich die Zusammensetzung der Schmelze von x nach xL . Beispiele für Mischkristallsysteme sind Al-Mg-Legierungen und α-Messing. Vollständige Mischbarkeit im flüssigen Zustand bei begrenzter Mischbarkeit im festen Zustand: Die Komponenten A und B weisen ähnliche Schmelztemperatur auf. Zumischen von B in A (sowie A in B) erniedrigt den Schmelzpunkt (Bild 2-11c). Der Schnittpunkt der beiden Löslichkeitslinien flüssig → kristallin ist der eutektische Punkt. Bei dieser Temperatur sind drei Phasen im Gleichgewicht, nämlich die Mischkristalle α und β sowie die Schmelze. Beim Abkühlen einer Schmelze mit Zusammensetzung xE tritt bei T E die Reaktion L → α + β ein, wobei sich α und β gleichzeitig bilden. Gusslegierungen sind häufig eutektische Systeme, da ihre Schmelztemperatur niedrig und die Gefügeausbildung fein ist. Beispiele sind Al-Si-Gusslegierungen sowie Gusseisen, aber auch Lote. Sind die Schmelztemperaturen der beiden Komponenten sehr verschieden, so kann sich ein Dreiphasengleichgewicht einstellen, das als peritektisches System bezeichnet wird (Bild 2-11d). Beim Abkühlen aus der Schmelze entsteht zuerst ein Mischkristall entsprechend dem Zweiphasengleichgewicht L + β. Bei T P tritt die Reaktion L + β = α ein, bei der α-Mischkristalle gebildet werden. Beispiele dafür sind Mischkristalle in Messing- und Bronzelegierungen. Bildung einer Verbindung: Die Komponenten A und B reagieren miteinander und bilden eine neue Phase V mit der Zusammensetzung A x By (Bild 2-11e). Diese hat eine andere Kristallstruktur als die Komponenten A und B. Manchmal besitzt die Verbindung ein definiertes stöchiometrisches Verhältnis von A und B und erscheint als vertikale Linie im Diagramm (Bild 2-11f).
Häufig existiert sie aber über einen gewissen Bereich der Zusammensetzung, sodass der Begriff Verbindung dann nicht ganz korrekt ist. Der Schmelzpunkt der Phase V kann höher oder niedriger sein als der der Komponenten. Dies gibt erste Hinweise auf die Stabilität der Verbindung. Weist die Verbindung nur eine geringe Mischbarkeit mit A und B auf, so ergibt sich ein einfaches Zustandsdiagramm, das sich auf A + A x By sowie A x By + B zurückführen lässt. Ein Beispiel für ein solches Zustandsdiagramm findet sich im System Mg-Si mit der Verbindung Mg2 Si. Häufig sind Verbindungen hart und spröde und weisen eine komplexe Kristallstruktur auf (z. B. Fe3 C, Al2 Cu) Systeme mit drei und mehr Komponenten können ebenfalls dargestellt werden. Dies erfordert jedoch eine räumliche Darstellung, auf die hier nicht weiter eingegangen werden soll. Zusammenfassende Darstellungen binärer und ternärer Zustandsdiagramme lassen sich in der Literatur z. B. in [4] finden. Abschließend bleibt die Frage zu beantworten, wie die sich bildenden Mengenanteile für eine bestimmte Zusammensetzung ermittelt werden kann. Hierzu wendet man die Hebelregel an, was im Folgenden mit Bild 2-12 erläutert werden soll. Man denke sich bei einer bestimmten Temperatur im Zweiphasengebiet einen zweiarmigen Hebel mit Drehpunkt bei c und den Gewichten mL (Schmelze) und mS (Kristall). Dann ergeben sich die Mengenanteile zu: mL · (c − cL ) = mS · (cS − c)
(2-7)
Anschaulich ausgedrückt: kurzer Hebelarm in Richtung A bedeutet viel Schmelze, langer Hebelarm in Richtung B bedeutet wenig Kristall. Die Hebelregel kann immer im Zweiphasengebiet angewendet werden, also auch um z. B. die Menge an α- und β-Mischkristall im Gebiet (α + β) zu bestimmen (vgl. Bild 2-11).
2.8 Diffusionsprozesse Diffusionsvorgänge sind in der Werkstofftechnik von großer Bedeutung, denn sie kontrollieren z. B. die Wärmebehandlung, Phasenumwandlungen, Hochtemperaturkorrosionsprozesse, Erholung und Rekristallisation und die Hochtemperaturverformung.
D15
D16
D Werkstoffe
Über eine Entfernung Δx im Gitter besteht ein (negativer) Konzentrationsgradient ∂c/∂x, sodass sich aufgrund der Diffusion ein (positiver) Stofftransportstrom j einstellt. j beschreibt die transportierte Masse pro Flächen- und Zeiteinheit und ist dem Konzentrationsgradienten ∂c/∂x proportional. Das 2. Fick’sche Gesetz beschreibt die zeitlichen Konzentrationsänderungen: dj ∂2 c ∂c =− =D 2 ∂t dx ∂x Bild 2-12. Bestimmung der Mengenanteile von Schmelze
und Mischkristall aus dem Zustandsdiagramm mit Hilfe der Hebelregel
Der Begriff Diffusion beschreibt thermisch aktivierte Stofftransportvorgänge, die mit der Wanderung einzelner Atome verbunden ist. Diffusion kann in Gasen, Flüssigkeiten und Festkörpern stattfinden. Im Folgenden wird die Diffusion in Festkörpern beschrieben. Dafür gibt es verschiedene Mechanismen. Zwischengitteratome besitzen eine geringe Löslichkeit, daher stehen ihnen meistens alle benachbarten Zwischengitterplätze frei. Die Diffusion von Zwischengitteratomen tritt häufig in Legierungen auf, die H, C oder N enthalten, z. B. Diffusion von Kohlenstoff im Stahl. Gitteratome (Selbstdiffusion) und Substitutionsatome (Fremddiffusion) benötigen für Platzwechsel Leerstellen, deren Konzentration ist erheblich geringer. Daher hängen diese Prozesse von der Leerstellenkonzentration und deren Temperaturabhängigkeit ab. Leerstellen liegen immer auch im Gleichgewicht vor, im Ungleichgewicht (z. B. nach Abschrecken von hoher Temperatur, nach plastischer Verformung) ist ihre Konzentration höher als im Gleichgewicht. Diffusionsprozesse machen sich bemerkbar bei Temperaturen, die etwa 0,3 bis 0,5 mal der Schmelztemperatur in Kelvin entsprechen. Liegen verschiedene Atomarten vor und ist im Mischkristall oder in Phasengemischen ein Konzentrationsunterschied vorhanden, so streben Diffusionsvorgänge zur Einstellung der Gleichgewichtskonzentration. Dies wird durch das 1. Fick’sche Gesetz beschrieben: Δc ∂c c1 − c2 = −D (2-8) = −D j = −D x1 − x2 Δx ∂x
(2-9)
Die expliziten Lösungsformen des 2. Fick’schen Gesetzes hängen von den Anfangsbedingungen des jeweils betrachteten Diffusionsproblems ab und haben die Form c(x, t). Der Diffusionskoeffizient D ist ein Maß für die Beweglichkeit der diffundierenden Atome und wird durch den folgenden Zusammenhang beschrieben: # Q $ D (2-10) D = D0 · exp − RT QD ist die Aktivierungsenergie für Diffusion und wird durch die Bildungs- und Wanderungsenergie der Leerstellen bestimmt. Die Temperaturabhängigkeit des Diffusionskoeffizienten ist in Bild 2-13 als Arrhenius-Diagramm dargestellt. Häufig genügt die Näherungsformel √ (2-11) x¯ = 2 Dt , um den mittleren Weg x¯ anzugeben, den ein Atom mit einem Diffusionskoeffizienten D(T ) bei einer Temperatur T nach einer Zeit t zurückgelegt hat. Dies ermöglicht z. B. die Abschätzung, welche Zeit für den Konzentrationsausgleich einer Probe mit Konzentrationsunterschieden bei einer Glühung bei einer konstanten Temperatur erforderlich ist. Die vorangegangenen Beschreibungen (Volumendiffusion) setzten voraus, dass abgesehen von den Leerstellen keine Gitterbaufehler vorliegen. Im realen Gitter sind aber Versetzungen, Korngrenzen und freie Oberflächen vorhanden, die die Diffusion beeinflussen, denn sie sind Pfade bevorzugter Diffusion (Versetzungsdiffusion, Korngrenzendiffusion). In der Umgebung dieser Defekte können sich die Atome einfacher bewegen und die Platzwechselhäufigkeit ist daher höher. Beispiele für die Folge dieser Prozesse sind das bevorzugte Wachstum von Ausscheidungen entlang von Versetzungen und Korngrenzen oder
2 Aufbau der Werkstoffe
Bild 2-13. Temperaturabhängigkeit des Diffusionskoeffizienten D für Kohlenstoff und Eisen (Selbstdiffusion) im Ferrit-
und Austenitkristallgitter (unter Verwendung von Daten aus [5])
auch das Diffusionskriechen bei tieferen Temperaturen. Bei tiefen Temperaturen ist Diffusion über Gitterfehler sehr viel größer als die Volumendiffusion, während bei hoher Temperatur die Volumendiffusion schneller abläuft als über Gitterfehler.
Teilchen aufgrund der Volumendifferenz nicht ganz genau in das Matrixgitter passt. Unter der Annahme kugelförmiger Keime ergibt sich:
2.9 Keimbildung von Phasenumwandlungen
Die in (2-13) auftretenden Terme sind schematisch in Bild 2-14 dargestellt. Durch die Umwandlung wird Energie gewonnen. Die frei werdende Freie Enthalpie ist proportional r3 . Die Kurve für ΔG hat ein Maximum bei ΔG∗ und r∗ . Nach Nullsetzen der ersten Ableitung von (2-13) erhält man den kritischen Teilchenradius:
Die Keimbildung als Startvorgang von Phasenumwandlungen ist für verschiedene Prozesse in der Werkstofftechnik von Bedeutung. Beispiele sind die Erstarrung beim Gießen (Übergang flüssig-fest) oder das Vergüten von Stahl (Übergang fest-fest). Keimbildung im flüssigen und festen Zustand kann analog behandelt werden. Bei der Keimbildung im flüssigen Zustand entfällt der Term für die Verzerrungsenergie. Im Folgenden wird die Keimbildung im festen Zustand beschrieben. Unter der Annahme, dass sich Ausscheidungen (= Keime) im festen Zustand durch homogene Keimbildung bilden, kann die folgende Energiebilanz aufgestellt werden: ΔG = VΔgV + Aγ + VΔg s
(2-12)
ΔgV ist der Gewinn an Freier Enthalpie pro Volumen gebildeter Ausscheidung (also ist ΔgV negativ), γ die aufzubringende Grenzflächenenergie durch die neu zu bildende Oberfläche der Ausscheidung und Δg s die aufzubringende Verzerrungsenergie, da das
ΔG =
4 3 πr (ΔgV + Δg s ) + 4πr2 γ 3
r∗ = −
2γ (ΔgV + Δg s )
(2-13)
(2-14)
Ist der Radius des Teilchens größer als r∗ , so kann es wachsen. Wird diese Beziehung in (2-13) eingesetzt, so erhält man: ΔG∗ =
16πγ3 3 (ΔgV + Δg s )2
(2-15)
Die Keimbildungsrate N ist die Anzahl der Keime, die pro Zeit- und Volumeneinheit überkritisch werden. Sie ist proportional zur Oberfläche des Keims und zur Platzwechselhäufigkeit an der Oberfläche. # Q$ ΔG∗ T N = C exp − exp − kT k
(2-16)
D17
D18
D Werkstoffe
2.10 Metastabile Zustände
Bild 2-14. Schematische Darstellung der Energiebilanz für
homogene Ausscheidung im festen Zustand
Dabei ist C die Anzahl der Keimbildungsorte pro Volumen, Q die Aktivierungsenergie für Diffusion, k die Bolzmann-Konstante und T die absolute Temperatur. Ausscheidungen werden nach der Natur ihrer Grenzfläche unterschieden: kohärent ohne Verzerrung, kohärent mit Verzerrung, teilkohärent und inkohärent. Kohärente Ausscheidungen haben eine geringe Grenzflächenenergie (0–200 mJ m−2 ), aber die Verzerrung kann groß sein. Teilkohärente Ausscheidungen haben eine höhere Grenzflächenenergie Inkohärente Ausscheidun(200–500 mJ m−2 ). gen besitzen die höchste Grenzflächenenergie (500–1000 mJ m−2 ) aber keine Kohärenzspannungen. Bei der heterogenen Keimbildung wirken Gitterdefekte als bevorzugte Keimbildungsorte, zum Beispiel (mit steigender Wirksamkeit):
homogene Orte Leerstellen Versetzungen Korngrenzen und Phasengrenzen freie Oberflächen.
In 2.6 wurde das thermodynamische Gleichgewicht als Zustand niedrigster Freier Enthalpie definiert. Häufig begegnen uns allerdings Zustände, die diese Voraussetzung nicht erfüllen und trotzdem für relativ lange Zeit stabil sind. Strukturwerkstoffe wie z. B. gehärteter Stahl, ausscheidungsgehärtete Aluminiumlegierungen oder Kunststoffe befinden sich während ihres Einsatzes im metastabilen Gleichgewicht. Diese Zustände treten auf, wenn die Keimbildung einer stabileren Phase aufgrund der dafür erforderlichen Aktivierungsenergie (z. B. aufgrund von hoher Grenzflächen- und Verzerrungsenergie) weniger wahrscheinlich ist. Dies ist z. B. in dem technisch wichtigen Kohlenstoffstahl der Fall. Eisen bildet ein stabiles Gleichgewicht mit Graphit. Das Carbid Fe3 C ist weniger stabil, trotzdem bildet sich fast ausschließlich Carbid im Stahl, der auch nach langer Zeit nicht in Graphit umwandelt. Es gibt also im Zustandsdiagramm Fe-C ein stabiles System EisenGraphit und ein metastabiles System Fe-Fe3 C, die häufig gemeinsam dargestellt werden. Die Gleichgewichtskonzentrationen und -temperaturen sind darin etwas verschieden. Die Ausscheidungshärtbarkeit von Aluminiumlegierungen (2.12) basiert ebenfalls auf der Bildung verschiedener metastabiler Phasen. Sie treten in der Reihenfolge zunehmender Aktivierungsenergie auf. Die Struktur stark verformte Metalle ist ebenfalls metastabil und kann durch Erholung und Rekristallisation (siehe 2.11) in einen Zustand geringerer Energie gelangen. Die Tatsache, dass sich nahezu kein Strukturwerkstoff im thermodynamischen Gleichgewicht befindet, hat Folgen für die Stabilität von Gefügen, da diese sich mehr oder weniger stark mit den entsprechenden Konsequenzen für die Eigenschaften während des Einsatzes von Werkstoffen ändern kann. Dies wird von Martin, Doherty und Cantor [6] ausführlich behandelt.
2.11 Erholung und Rekristallisation Erholungsprozesse erfordern thermisch aktivierte Prozesse, also Platzwechsel im Gitter bei Temperaturen, die dieses ermöglichen. Die Erholung plastisch verformter und verfestigter Kristalle besteht aus der
2 Aufbau der Werkstoffe
Umordnung von Versetzungen durch Annihilation (Auslöschung von Versetzungen mit gegensätzlichem Vorzeichen, wenn diese auf verschiedenen Gleitebenen aufeinander zuklettern) oder durch Bildung von Kleinwinkelkorngrenzen, eine Anordnung, die niedrigere Energie besitzt als die homogene Verteilung von Versetzungen (Bild 2-15). Die Versetzungsdichte wird dabei nur teilweise abgebaut. Bei Wechselwirkung der Versetzungen mit Leerstellen können die Versetzungen klettern, wobei die Leerstellen in den Bereich der Druckspannungen der Versetzung diffundiert und sich dort anlagert. Dadurch wandert ein Atom von der Versetzung fort und die Versetzungslinie wird normal zum Burgers-Vektor verschoben. Ein erholtes Gefüge ist durch ein Subkorngefüge mit Kleinwinkelkorngrenzen gekennzeichnet. Während des Erholungsprozesses nehmen innere Spannungen und die Streckgrenze ab. Während der Erholung bewegen sich die Korngrenzen nicht. Bei Temperaturen oberhalb von 0,5 mal der Schmelztemperatur (in Kelvin) tritt in stark verformten Metallen Rekristallisation ein. Dieser Begriff umfasst alle Prozesse, die mit Neubildung und Wachstum von weitgehend versetzungsfreien Körnern verbunden sind (Bild 2-15). Treibende Kraft dafür ist die gesamte Versetzungsenergie, die in den durch die Verformung eingebrachten Versetzungen steckt. Die Neubildung kann durch Keimbildung und -wachstum
bestimmt sein (diskontinuierliche Rekristallisation) oder durch Vergröberung der Subkörner des Erholungsgefüges, verbunden mit einer Zunahme des Orientierungsunterschieds (kontinuierliche Rekristallisation). Der auftretende Mechanismus hängt u. a. vom Werkstoff, von der Verformung, vom Temperatur-Zeit-Verlauf der Wärmebehandlung ab. Nach der Rekristallisation weist der Werkstoff Eigenschaften (Streckgrenze, Bruchdehnung, Härte) auf, wie sie auch für den unverformten Zustand vorliegen. Einen guten und umfassenden Überblick über dieses Gebiet geben Humphreys und Hatherly [7].
2.12 Ausscheidungsund Umwandlungsprozesse Voraussetzung für die Ausscheidungshärtung ist eine mit sinkender Temperatur abnehmende Löslichkeit im Mischkristall, wie es schematisch in Bild 2-16a gezeigt ist. Ein wichtiges Beispiel dafür ist das System Aluminium-Kupfer, an dem die Aushärtbarkeit von Aluminiumlegierungen von Alfred Wilm 1906 entdeckt wurde. Zur Ausscheidungshärtung von Legierungen müssen folgende Schritte eingeleitet werden (Bild 2-16b): Lösungsglühen zur Auflösung löslicher Phasen und Maximierung der Gehalte gelöster Atome und Leerstellen Abschrecken zur Erhaltung der Übersättigung gelöster Atome und Leerstellen Kaltauslagerung (bei Raumtemperatur) oder Warmauslagerung (bei erhöhter Temperatur). Nach dem Abschrecken wird die Übersättigung abgebaut durch: homogene Keimbildung (ohne Hilfe von bereits existierenden Keimbildungsorten), heterogene Keimbildung (Keimbildung an Heterogenitäten wie Versetzungen, Korngrenzen) oder spinodale Entmischung (keine Barriere für den Entmischungsprozess).
Bild 2-15. Schematische Darstellung von Erholungs- und
Rekristallisationsprozessen
Die Keimbildung im festen Zustand basiert auf den gleichen Einflussgrößen wie bei der Erstarrung. Die Stadien während des Ausscheidungsprozesses (beim Kalt- oder Warmauslagern) sind in der Regel
D19
D20
D Werkstoffe
Bild 2-16. a Voraussetzung für eine Ausscheidungshärtung ist eine mit sinkender Temperatur abnehmende Löslichkeit. b Wärmebehandlung zum Herbeiführen einer Ausscheidungshärtung: Aufheizen auf Lösungsglühtemperatur und Halten bei dieser Temperatur, Abschrecken, Aushärten bei Raumtemperatur oder erhöhter Temperatur
Keimbildung, Wachstum der Ausscheidungen unter Zunahme ihres Volumenbruchteils und schließlich Vergröberung, wobei sich der ausgeschiedene Volumenbruchteil nicht mehr ändert.
3 Metallische Werkstoffe 3.1 Herstellung metallischer Werkstoffe Metallische Werkstoffe werden aus metallhaltigen Mineralien (Erzen) in den Verfahrensstufen Rohstoffgewinnung, Aufbereitung und Metallurgie gewonnen. Die Technologien zur Gewinnung von Rohstoffen gehören zum Bereich der Bergbautechniken. Sie umfassen das Erkunden, Erschließen, Gewinnen, Fördern und Aufbereiten von abbauwürdigen Lagerstätten mineralischer Rohstoffe und Erze. Die Erze enthalten das gewünschte Metall nicht in metallischer Form, sondern in Form chemischer Verbindungen: Oxide, Sulfide, Oxidhydrate, Carbonate, Silicate. Bei der Aufbereitung, der Vorstufe der Umwandlung von Rohstoffen in Werkstoffe wird das geförderte Erz zunächst durch Brechen und Mahlen der Zerkleinerung unterworfen und dann Trennprozessen zugeführt, welche die metalltragenden Komponenten separieren, z. B. Trennung durch (a) unterschiedliche magnetische Eigenschaften, (b) Schwerkraft, (c) unterschiedliche Löslichkeit in Säuren oder Laugen, (d) unterschiedliches Benetzungsverhalten in organischen Flüssigkeiten (Flotation). Eisenerze, die Sulfide, aber auch Oxidhydrate oder Carbonate enthalten, werden durch Erhitzen an Luft („Rösten“)
in Oxide überführt, wobei SO2 bzw. H2 O oder CO2 frei werden; SO2 wird abgebunden oder verwertet. Die Herstellung metallischer Werkstoffe aus den aufbereiteten Erzen oder metallhaltigen Rückständen, ihre Raffination und Weiterverarbeitung (insbesondere zu Legierungen) erfolgt mit Methoden der Metallurgie (Hüttenwesen). Ein grundlegender metallurgischer Prozess besteht darin, die in Erzen z. B. in Form von Metalloxiden gebundenen Metallbestandteile durch Aufbrechen der Bindung zwischen Metall (M) und Sauerstoff (O) freizusetzen. Der Reduktionsvorgang M x Oy + ΔGMx Oy → xM + (y/2)O2 erfordert die Zufuhr der Bildungsenthalpie ΔGM des Oxids. Kennzeichnend für die verschiedenen metallurgischen Verfahren sind sowohl die Prozesstechnologie als auch der für die Erzreduktion erforderliche Einsatz an chemischen Reduktionsmitteln und elektrischer Energie.
3.2 Einteilung der Metalle Die Einteilung der Metalle kann nach verschiedenen Merkmalen, wie z. B. Stellung im Periodensystem, Dichte, Schmelztemperatur, sowie physikalischen oder technologischen Eigenschaften erfolgen. Knapp 70 der 90 natürlichen Elemente sind Metalle, wobei je nach Stellung im Periodensystem die folgende Einteilung üblich ist:
3 Metallische Werkstoffe
– Alkali- (oder A-)Metalle: Gruppe Ia (ohne H) – Edle Metalle: Gruppe Ib – B-Metalle: Gruppe II, Gruppe IIIa (ohne B), Gruppe IVa (ohne C), Gruppe Va (ohne N, P) – Übergangsmetalle: Gruppe IIIb bis Gruppe VIIIb – Lanthanoide – Actinoide Nach der Dichte werden unterschieden (vgl. Tabelle 9-1): – Leichtmetalle: Dichte < 4,5 kg/dm3 – Schwermetalle: Dichte > 4,5 kg/dm3. Das Kriterium Schmelztemperatur führt zu folgender Einteilung (vgl. Tabelle 9-8, Abschnitt 9.3.3): – Niedrigschmelzende Metalle: Schmelztemperatur < 1000 ◦ C – Mittelschmelzende Metalle: ∼ 1000 ◦ C < Schmelztemperatur < 2000 ◦ C – Hochschmelzende Metalle: Schmelztemperatur > 2000 ◦ C . Die metallischen Werkstoffe sind nach wie vor die wichtigsten Konstruktions- oder Strukturwerkstoffe. Sie werden in die beiden großen Gruppen der Eisenwerkstoffe und der Nichteisenmetalle (NE-Metalle) eingeteilt. „Hartmetalle“ kennzeichnen eine Übergangsgruppe zu den „Keramiken“ (siehe 4.3.4).
3.3 Eisenwerkstoffe Als Eisenwerkstoffe werden Metalllegierungen bezeichnet, bei denen der Massenanteil des Eisens höher ist als der jedes anderen Legierungselements. Reines Eisen ist wegen seiner geringen Festigkeit nicht als Konstruktionswerkstoff geeignet; seine besonderen magnetischen Eigenschaften sind jedoch für die Elektrotechnik von Bedeutung. Das wichtigste Legierungselement des Eisens ist Kohlenstoff. Abhängig vom Kohlenstoffgehalt und von der Wärmebehandlung erhält man verschiedene Stähle und Gusseisen, für deren Verständnis das EisenKohlenstoff-Zustandsdiagramm eine wesentliche Basis darstellt [1]. (Eigenschaften und technische Daten der Eisenwerkstoffe: siehe 9.)
3.3.1 Eisen-Kohlenstoff-Diagramm
Im thermodynamischen Gleichgewicht liegen in einem Eisen-Kohlenstoff-System Eisen und Kohlenstoff als Graphit nebeneinander vor (stabiles System). In der Praxis häufiger benutzt wird das metastabile Eisen-Zementit-Diagramm. Zementit ist das Eisenkarbid, Fe3 C, das bei langen Glühzeiten in eine Eisenphase und Graphit zerfällt. Aus dem EisenKohlenstoff-Zustandsdiagramm, Bild 3-1, lassen sich die verschiedenen Gefügezustände als Funktion von Kohlenstoffgehalt und Temperatur entnehmen. Die Zustandsfelder der einzelnen Phasen werden von Linien begrenzt, die durch die Buchstaben ihrer Endpunkte bezeichnet werden. Diese Linien können als Verbindungslinien der Haltepunkte, die als Verzögerungen bei Erwärmung oder Abkühlung infolge Gefügeumwandlung auftreten, angesehen werden. Bei Temperaturen oberhalb der Liquiduslinie ABCD liegen Eisen-Kohlenstoff-Lösungen als Schmelze vor. Sie erstarren in Temperaturbereichen, die zwischen der Liquiduslinie ABCD und der Soliduslinie AHIECF liegen. Mit abnehmender Temperatur nimmt der Anteil der ausgeschiedenen Kristalle in der Schmelze zu, bis an der Soliduslinie die Schmelze vollständig erstarrt ist. Das am niedrigsten Erstarrungspunkt aller Schmelzen (Punkt C) einheitlich erstarrende Gefüge wird Eutektikum genannt. Im erstarrten Zustand ergeben sich für verschiedene Bereiche von C-Gehalt und Temperatur unterschiedliche Phasen und Gefüge. Beim reinen Eisen treten Modifikationen mit kubisch raumzentriertem (krz) oder dem dichteren kubisch flächenzentriertem (kfz) Gitter auf, die sich an den Haltepunkten Ar , Ac (r refroidissement: Abkühlung; c chauffage: Erwärmung) umwandeln. Man unterscheidet: • α-Fe (Ferrit); krz; ϑ < 911 ◦ C (A3 ) (unter ϑ = 769 ◦ C, Curie-Temperatur, ist α-Fe ohne Gitterumwandlung ferromagnetisch) • γ-Fe (Austenit); kfz; 911 ◦ C < ϑ < 1392 ◦ C (A4 ) • δ-Fe (δ-Eisen); krz; 1392 ◦ C < ϑ < 1536 ◦ C Bei C-Gehalten > 0 wird Kohlenstoff im α-, γ- und δ-Eisen in Zwischengitterplätzen eingelagert, wobei Mischkristalle (MK) bis zu den folgenden maximalen Löslichkeiten des Kohlenstoffs in Eisen entstehen:
D21
D22
D Werkstoffe
• α-Mischkristall; 0,02 Gew.-% C bei 723 ◦ C (A1 ) • γ-Mischkristall (Austenit); 2,06 Gew.-% C bei 1147 ◦ C • δ-Mischkristall; 0,1 Gew.-% C bei 1493 ◦ C Wird der maximal lösliche C-Gehalt überschritten, so werden im stabilen System Kohlenstoff (Graphit) oder im technisch wichtigeren metastabilen System Zementit Fe3 C ausgeschieden. Das metastabile System beschreibt dann die Reaktionen zwischen Eisen und Zementit. Ein Gehalt von 100% Zementit entspricht 6,69 Gew.-% C. Fe3 C weist eine relativ hohe Härte (1400 HV) auf und besitzt ein kompliziertes Gitter (orthorhombisch) mit 12 Fe-Atomen und 4 eingelagerten C-Atomen je Elementarzelle. Eisen-Kohlenstoff-Legierungen mit einem C-Gehalt > 6,69 Gew.-% besitzen keine technische Bedeutung. Die am niedrigsten Liquiduspunkt C bei 4,3 Gew.% C vorliegende Schmelze zerfällt bei Erstarrung im festen Zustand in ein als Eutektikum bezeichnetes feinverteiltes Gemenge von γ-Mischkristallen (Auste-
Bild 3-1. Eisen-Kohlenstoff-Diagramm (metastabiles System)
nit) mit 2,06 Gew.-% C und Fe3 C-Kristallen (Zementit) mit 6,69 Gew.-% C. Im übereutektischen Bereich (> 4,3 Gew.-% C) bilden sich Gefüge aus Ledeburit und Primärzementit, im untereutektischen Bereich (< 4,3 Gew.% C) Gefüge aus Austenit, Ledeburit und Sekundärzementit. (Sekundärzementit entsteht durch Ausscheidung von Eisenkarbid aus Austenit). Das bei der Abkühlung von homogenem Austenit (γ-Mischkristalle) bei einem C-Gehalt von 0,8 Gew.-% entstehende Eutektoid Perlit besteht aus nebeneinanderliegendem lamellenförmigem Ferrit (α-Mischkristalle) und Zementit. Bei untereutektoiden Legierungen (< 0,8 Gew.-% C) scheiden sich vor Erreichen des Perlitpunktes (S) Ferritkristalle aus, bei übereutektoiden Legierungen (> 0,8 Gew.-% C) bildet sich Sekundärzementit. Die im Eisen-Kohlenstoff-Zustandsdiagramm angegebenen Zustandsfelder gelten nur dann, wenn für die Einstellung der Gleichgewichte und die erforderlichen Diffusionsvorgänge genügend Zeit zur Verfügung steht.
3 Metallische Werkstoffe
3.3.2 Wärmebehandlung
Die zur Erzeugung bestimmter Gefügezustände oder Werkstoffeigenschaften eingesetzten Verfahren der Wärmebehandlung bestehen aus den Verfahrensschritten Erwärmen, Halten und Abkühlen und umfassen das Härten und die Glühbehandlungen. a) Härten Beim Härten werden durch rasches Abkühlen aus dem Austenitfeld des Fe-C-Zustandsdiagramms Gefügezustände mit höherer Härte und Festigkeit erzeugt. Die Kinetik der Umwandlung des Austenits in andere Phasen wird durch ein Zeit-TemperaturUmwandlungsdiagramm (ZTU-Diagramm) beschrieben (Bild 3-2). In einem Zeit-Temperatur-Koordinatensystem werden Kurven gleichen Umwandlungsgrades eingetragen (0%: Beginn, 100%: Ende der Umwandlung). Die Umwandlungsmechanismen und die Gefügeausbildung der Umwandlungsprodukte (Austenit, Perlit, Bainit und Martensit) hängen von der Abkühlgeschwindigkeit ab. In Abhängigkeit von der Abkühlgeschwindigkeit lässt sich Austenit diffusionsgesteuert in Perlit oder in ein als Bainit bezeichnetes feines Gemenge von Ferrit und Carbid umwandeln. Durch sehr rasche Abkühlung (Abschrecken) kann die diffusionsgesteuerte Umwandlung in die beiden Gleichgewichtsphasen unterdrückt und nach Unterschreiten der sog. Martensit-Starttemperatur
(Ms ) eine diffusionslose Umwandlung (Umklappen) der kfz Elementarzellen des Austenits in die tetragonal verzerrten Gefügestrukturen des Martensits bewirkt werden. Infolge der hohen Übersättigung an Zwischengitter-C-Atomen und einer durch die Gitterverzerrungen erhöhten Versetzungsdichte zeichnet sich das aus latten- und plattenförmigen Strukturen bestehende Martensitgefüge durch hohe Härte aus. Das beim Härten entstehende hart-spröde Martensitgefüge wird meist angelassen oder vergütet: Erwärmen auf 200 bis 600 ◦ C, um spröden Martensit durch Abbau von Spannungen und Ausscheidung von Carbiden in einen duktileren Zustand zu überführen. Eine auf die Oberflächen beschränkte Härtung (Randschichthärten) ist mit Flammenhärten, Laserhärten und dem Induktionshärten möglich. Bei zu geringem C-Gehalt eines Bauteils kann durch Aufkohlen (Einsetzen in C-abgebende Mittel) eine C-Anreicherung erreicht und durch das Einsatzhärten eine hohe Oberflächenhärte bei hoher Zähigkeit des Kern erzielt werden. Eine Oberflächenhärtung kann auch durch thermochemische Behandlungen unter Eindiffundieren bestimmter Elemente, wie z. B. Stickstoff, Bor oder Vanadium, vorgenommen werden. Von besonderer technischer Bedeutung ist das Nitrieren, das im Ammoniakstrom (Gasnitirieren), in Salzbädern (Badnitrieren) oder unter Ionisation des Stickstoffs durch Glimmentladung (Plasmanitrieren) durchgeführt werden kann.
3-2. Isothermes Zeit-TemperaturUmwandlungsschaubild (ZTU-Schaubild): schematische Darstellung für eutektoiden Stahl
Bild
D23
D24
D Werkstoffe
b) Glühbehandlungen Durch Glühbehandlungen bei einer bestimmten Temperatur und Haltedauer sowie nachfolgendem Abkühlen werden bestimmte Gefügezustände und Werkstoffeigenschaften erreicht. Wichtige Verfahren sind: – Normalglühen, (Normalisieren). Erwärmen kurz über die Gleichgewichtslinie (GOS) im Austenitgebiet und anschließendes Abkühlen an Luft führt zur völligen Umkristallisation und Ausbildung eines feinkörnigen perlitisch ferritischen Gefüges. – Weichglühen. Verbesserung des Formänderungsvermögens durch längeres Pendelglühen im Temperaturbereich der Perlitumwandlung, wobei sich die im streifigen Perlit vorliegenden Zementitlamellen in die energieärmere rundliche Carbidform umwandeln. – Rekristallisationsglühen. Glühen kaltverformter Werkstoffe unterhalb der Temperatur der Perlitreaktion, sodass Versetzungen durch Erholung oder Rekristallisation ausheilen können und die Verformbarkeit wieder hergestellt wird. Die Korngröße ist verformungsabhängig. – Spannungsarmglühen. Beseitigung von Eigenspannungen durch Erwärmen unterhalb der Temperatur beginnender Rekristallisation und langsames Abkühlen. 3.3.3 Stahl
Eisen-Kohlenstoff-Legierungen mit einem Kohlenstoffanteil i. Allg. unter 2 Gew.-%, die kalt oder warm umformbar (schmiedbar) sind, werden als Stähle, nichtschmiedbare Eisenwerkstoffe, C-Anteil über 2 Gew.-%, als Gusseisen bezeichnet [1]. Die gezielt zur Herstellung der verschiedenen Stähle zugefügten Legierungselemente bilden mit Eisen meist Mischkristalle. Die Elemente Cr, Al, Ti, Ta, Si, Mo, V, W lösen sich bevorzugt in Ferrit (Ferritbildner); die Elemente Ni, C, Co, Mn, N, Cu vorwiegend in Austenit. Sie erweitern das γ-Gebiet und machen den Stahl austenitisch. Stähle mit hohen Ni- oder Mn-Gehalten sind bis zur Raumtemperatur austenitisch. Neben Mischkristallen können sich in Stählen Verbindungen bilden, wenn zwischen min-
destens zwei Legierungselementen starke Bindungskräfte vorhanden sind, wodurch sich komplizierte, harte Kristallgitter bilden können. Wichtig sind dabei Carbide, Nitride und Carbonitride. Wichtige Carbidbildner sind: Mn, Cr, Mo, W, Ta, V, Nb, Ti. Schwache Carbidbildner (Mn, Cr) lagern sich z. B. in Fe3 C als Mischkristalle ein, z. B. (Fe, Cr)3 C, (Fe, Mn)3 C); starke Carbidbildner (Ti, V) bilden Sonderkarbide mit einer von der des Fe3 C abweichenden Gitterstruktur, z. B, Mo2 C, TiC, VC. Durch die Nitritbildner Al, Cr, Zr, Nb, Ti, V werden harte Nitride (bis 1200 HV) gebildet und beim Nitrierhärten technisch genutzt. Carbonitridausscheidungen erzeugen ein sehr feinkörniges Umwandlungsgefüge (Feinkornbaustähle). Bei den Stählen werden nach der Verwendung Bereiche mit den folgenden Hauptsymbolen unterschieden [2]: S Stähle für den allgemeinen Stahlbau P Stähle für den Druckbehälterbau L Stähle für den Rohrleitungsbau E Maschinenbaustähle B Betonstahl Y Spannstahl R Stähle für oder in Form von Schienen H Kaltgewalzte Flacherzeugnisse in höherfesten Ziehgüten D Flacherzeugnisse aus weichen Stählen zum Kaltumformen T Verpackungsblech- und -band M Elektroblech und -band [mit besonderen magnetischen Eigenschaften] Bei entsprechenden Gusswerkstoffen wird dem Kurznamen z. B. G- vorangestellt. Für die systematische Bezeichnung von Stahlwerkstoffen gibt es nach DIN EN 10027–1 (Bezeichnungssysteme für Stähle), die folgenden Möglichkeiten: a. Kurznamen, beruhend auf der Verwendung, mit dem Aufbau – Hauptsymbol (siehe oben)
3 Metallische Werkstoffe
– Kennwert der charakteristischen mechanischen (oder physikalischen) Eigenschaft, z. B. Streckgrenze in MPa, Zugfestigkeit in MPa, Ummagnetisierungsverlust in 0,01 × W/kg bei 1,5 Tesla. – Zusatzsymbole gemäß DIN V 17 006-100: Bezeichnungssysteme für Stähle bzgl. Kerbschlagarbeit bei unterschiedlicher Prüftemperatur sowie besonderer Eigenschafts-, Einsatzoder Erzeugnisbereiche, z. B. „F“ zum Schmieden geeignet, „L“ für tiefe Temperaturen, „Q“ vergütet. Beispiel: S690Q bedeutet Stahl für den Stahlbau mit einer Streckgrenze von 690 MPa, vergütet. b. Kurznamen, basierend auf der chemischen Zusammensetzung, mit vier Typen: 1. Unlegierte Stähle: Hauptsymbol C (Kohlenstoff) und Zahlenwert des 100fachen mittleren C-Gehaltes in Gew.-% für unlegierte Stähle mit Mangan-Gehalt < 1 Gew.-% (Beispiel: C 15) 2. Unlegierte Stähle mit Mn-Gehalt > 1 Gew.-%, unlegierte Automatenstähle und legierte Stähle (außer Schnellarbeitsstähle) mit Gehalten der einzelnen Legierungselemente < 5 Gew.-%: Hauptsymbol 100facher mittlerer C-Gehalt in Gew.-% dazu Nennung der charakteristischen Legierungselemente und ganzzahlige Angabe ihrer mit folgenden Faktoren multiplizierten Massenanteile Legierungselemente Faktor Cr, Co, Mn, Ni, Si, W 4 Al, Be, Cu, Mo, Nb, Pb, Ta, Ti, V, Zr 10 C, N, P, S, Ca 100 B 1000 Beispiel: 13 CrMo4-4 ist legierter Stahl mit 0,13% C, 1% Cr und 0,4% Mo; 3. Hochlegierte Stähle: Hauptsymbol X, dazu Angabe 100fachen mittleren C-Gehaltes in Gew.-% sowie der charakteristischen Legierungselemente (chem. Symbole und Anteile in Gew.-%) für legierte Stähle, wenn für mindestens ein Legierungselement der Gehalt 5 Gew.-% übersteigt. Beispiel: X5CrNiMo18-10 ist hochlegierter Stahl mit 0,05% C, 18% Cr, 10% Ni sowie auch Mo;
4. Schnellarbeitsstähle: Hauptsymbol HS und Zahlen, die in gleichbleibender Reihenfolge den Massenanteil folgender Legierungselemente angeben: W, Mo, V, Co. Beispiel: HS 2-9-1-8. c. Werkstoffnummern, die durch die Europäische Stahlregistratur vergeben werden, mit folgendem Aufbau: – Bei Stählen steht an erster Stelle der Werkstoffnummer eine 1. – Nach einem Punkt folgt eine zweistellige Stahlgruppennummer, z. B. 00 für Grundstähle oder 01 bis 09 für Qualitätsstähle. Bei den legierten Edelstählen gelten die Gruppennummern 20 bis 28 für Werkzeugstähle, 40 bis 49 für chemisch beständige Stähle, sowie die vier Dekaden 50 bis 89 für Bau-, Maschinen- und Behälterstähle. – Es folgt eine zweistellige Zählnummer für die einzelne Stahlsorte. Beispiel: 1.2312 bedeutet: 1 für Stahl, 23 für molybdänhaltige Werkzeugstähle, Zählnummer 12. Stähle stellen nach wie vor die wichtigsten und vielfältigsten Konstruktions- sowie auch Funktionswerkstoffe dar. Eine kurze Zusammenstellung technisch wichtiger Stähle mit stichwortartigen Angaben über Aufbau, Eigenschaften und Verwendungszweck sowie Sortenbeispielen und zugehörigen Normbezeichnungen gibt Tabelle 3-1. 3.3.4 Gusseisen
Gebräuchliche Gusseisenwerkstoffe haben C-Anteile zwischen 2 und ca. 4 Gew.-% und sind im Allgemeinen nicht schmiedbar. Die Legierungselemente Kohlenstoff und Silicium bestimmen in Verbindung mit der Erstarrungsgeschwindigkeit das Gefüge bezüglich der entstehenden Kohlenstoffphasen, siehe Bild 3-3. Mit zunehmendem C- und Si-Gehalt werden die folgenden hauptsächlichen Felder unterschieden: I.
Weißes Gusseisen (Hartguss, metastabiles System), II. Graues Gusseisen (Grauguss, stabiles System), III. Graues Gusseisen (Grauguss, stabiles System), ferritisches Gefüge: Graphit und Ferrit;
D25
D26
D Werkstoffe
Tabelle 3-1. Technische Stahlsorten (Übersicht) Stahlsorten
Merkmale, Beispiele
• Baustähle für Hoch-, Tief-, Brückenbau, Fahrzeug-, Behälter- und Maschinenbau Allgemeine Baustähle (DIN EN 10 025-1, -2)
Unlegierte und niedriglegierte ferritisch-perlitische Gefüge; Mindeststreckgrenzen 180 bis 360 MPa
Hochfeste Baustähle (DIN EN 10 113-1/3)
Mikrolegierte (TiC-NbC-VC-Dispersionen), schweißgeeignete Feinkornbaustähle, z. B. S460N
Baustähle für spezielle Erzeugnisse
Blankstahl nach DIN 1652-1/4; Feinbleche, DIN 1623; Band und Blech aus unlegiertem Stahl, DIN 1614, kaltgewalzte Flacherzeugnisse aus weichen Stählen zum Kaltumformen nach DIN EN 10130; warmgewalzte Flacherzeugnisse aus Stählen mit hoher Streckgrenze zum Kaltumformen nach DIN EN 10 149-1/3
• Stähle für eine Wärmebehandlung Vergütungsstähle (DIN EN 10083-1/3)
Mn/Cr/Mo/Ni/V-legiert; 0,2 bis 0,6% C, für dynamisch beanspruchte Bauteile hoher Festigkeit; z. B. C45E, 42CrMo4
Stähle für das Randschichthärten (DIN 17 212)
Vergütungsstähle für kernzähe, oberflächenharte Bauteile durch Flammund Induktionshärten, z. B. 45Cr2 (55 HRC)
Einsatzstähle (DIN EN 10084)
Mn/Cr/Mo/Ni-legiert, niedr. C-Gehalt; kernzäh und oberflächenhart durch Aufkohlen und Härten, z. B. C10, 20MoCrS4
Nitrierstähle (DIN EN 10 085)
Vergütungsstähle mit perlitisch-martensitischem Gefüge und Nitridbildnern (Cr, Mo, Al); z. B. 31CrMo12, 34CrAlMo5
• Stähle für besondere Fertigungsverfahren Automatenstähle (DIN EN 10 087)
Durch S- und Pb-Zusätze gut zerspanbar und spanbrüchig bei hohen Schnittgeschwindigkeiten; einsatzhärtbar (z. B. 10S20), vergütbar (z. B. 45S20)
Stahlguss
Fe-C-Legierungen mit < 2% C; allg. Stahlguss (z. B. GS-60) DIN EN 10293; warmfester Stahlguss (z. B. G17CrMo 5-5), DIN EN 10 213-2
• Stähle mit besonderen technologischen Eigenschaften Kaltzähe Stähle (DIN EN 10 028-4)
Ni-legierte Stähle mit ausreichender Zähigkeit bei −60 bis 195 ◦ C; z. B. X8Ni9
Hochwarmfeste austenitische Stähle (DIN EN 10 028-7, DIN EN 10 2225, DIN EN 10 302)
Ferritisch perlitisches Gefüge; z. B. X3CrNiMoN17-13 (T 0,75%); z. B. S10-4-3-10
3 Metallische Werkstoffe
Gusseisen wird in folgende Gruppen eingeteilt:
3.4 Nichteisenmetalle und ihre Legierungen
– Gusseisen mit Lamellengraphit (GJL, DIN EN 1561). Eisengusswerkstoff mit lamellarem Graphit im Gefüge, geringe Verformbarkeit durch heterogenes Gefüge, steigende (Zug-)Festigkeit (100 bis 400 MPa) mit feiner werdender Graphitverteilung, gute Dämpfungseigenschaften, Druckfestigkeit etwa viermal so hoch wie Zugfestigkeit. – Gusseisen mit Kugelgraphit (GJS, DIN EN 1563) Kugelige (globulitische) Ausbildung des Graphits durch Zusatz geringer Mengen von Magnesium, Cer und Calcium, Festigkeit erheblich höher als bei GJL bei erheblich erhöhter Duktilität. – Temperguss (GJM, DIN EN 1562): Fe-CLegierungen, die zunächst graphitfrei erstarren und durch anschließende Glühbehandlung in weißen Temperguss (entkohlend geglüht) oder schwarzen Temperguss (nichtentkohlend geglüht) mit ferritisch perlitischem Gefüge und Temperkohle umgewandelt werden. Temperguss vereinigt gute Gusseigenschaften des Graugusses mit nahezu stahlähnlicher Zähigkeit, er ist schweißbar und gut zerspanbar. – Hartguss (GJH): Zementitbildung durch schnelles Abkühlen und Manganzusatz zur Schmelze, durch sog. Schalenhartguss Erzielung von Bauteilen mit weißem (sehr harten) Gusseisen in der Oberflächenschicht und Grauguss im Kern, dadurch Kombination hochbeanspruchbarer Oberflächen mit verbesserter Kernzähigkeit. Es gibt auch hochlegiertes Gusseisen mit Cr und Mo und somit harten Carbiden.
Die als Werkstoffe genutzten Nichteisenmetalle (NEMetalle) werden traditionell eingeteilt in
Bild 3-3. Gusseisendiagramm nach Maurer
– Leichtmetalle (Dichte 4,5 kg/dm3): Al, Mg, Ti; [3] – Schwermetalle (Dichte 4,5 kg/dm3): Cu, Ni, Zn, Sn, Pb; – Edelmetalle: Au, Ag, Pt-Metalle. Im Folgenden sind Gewinnung, Eigenschaften und Anwendungen der technisch wichtigsten Leichtmetalle und Schwermetalle stichwortartig beschrieben. Eigenschaftswerte und technische Daten der NEMetalle sind im Kap. 9 zusammengestellt; eine Übersicht über die wichtigsten DIN-Normen gibt Tabelle 3-2. 3.4.1 Aluminium
Gewinnung durch Schmelzflusselektrolyse von aufbereitetem Bauxit bei 950 bis 970 ◦ C; 4 t Bauxit liefern 1 t Hütten-Al mit 99,5 bis 99,9% Al. Aluminium hat einen kfz Gitteraufbau und ist ausgezeichnet warm- und kaltverformbar (Walzen, Ziehen, Pressen, Strangpressen, Fließpressen, Kaltverformen). Es besitzt günstige Festigkeits-Dichteund Leitfähigkeits-Dichte-Verhältnisse sowie eine gute Korrosionsbeständigkeit gegenüber Witterungseinflüssen in sauren wie schwach alkalischen Lösungen durch Bildung von (ca. 0,01 μm dicken) Oxid-Oberflächenschichten, die vor der Herstellung von Schweißverbindungen entfernt werden müssen („Schutzgasschweißen“ unter Argon oder Helium). Wichtige Legierungselemente für Aluminium sind Cu, Mg, Zn und Si. Durch geeignete Wärmebehandlung (Lösungsglühen, Abschrecken, Auslagern) kann eine Ausscheidungshärtung erzielt werden: feindisperse Ausscheidungen und die von ihnen bewirkten Matrixgitterverzerrungen behindern die Versetzungsbeweglichkeit und erhöhen damit die Festigkeit. Wichtig sind besonders die Knetlegierungen AlCuMg, AlMgSi, AlZnMg, AlZnMgCu und die Gusslegierung AlSi. Die Hauptanwendungsgebiete liegen in der Luft- und Raumfahrt, im Bauwesen und Fahrzeugbau (z. B. Profilsätze, Motorenblöcke, Gleitlager, Aufbauten), im Behälter- und Gerätebau (z. B. Leichtbaukonstruktionen), in der chemischen
D27
D28
D Werkstoffe
Tabelle 3-2. Normen über Nichteisenmetalle und ihre Legierungen (Übersicht, Kurzbegriffe)
Metall Aluminium (Al)
Magnesium (Mg)
Titan (Ti)
Kupfer (Cu)
Nickel (Ni)
Zinn (Sn)
Zink (Zn)
Blei (Pb)
Normen DIN EN 576, DIN EN 573-3, -4 DIN EN 573-3, -4; DIN EN 1706 DIN EN 485-2, DIN EN 546-2 DIN 17 611 DIN EN 14 121-1, DIN EN 40 501-2 ISO 8287 DIN 1729-1, DIN EN 1753 DIN 9715 DIN 17 850/51 DIN 17 860 DIN 17 862/64 DIN EN 1976, DIN EN 1978 DIN EN 1652, DIN EN 12 163/65 DIN EN 1982 DIN EN 1982 DIN EN 1982 DIN 1701 DIN 17 740 DIN 17 741/43 DIN EN 610 DIN 1742 DIN EN 611-1 DIN EN 1179 DIN EN 1774, DIN EN 12844 DIN EN 988 DIN 17640-1 DIN 17 640-1
Industrie (z. B. Behälter, Rohrleitungen), im Verpackungswesen (z. B. Folien) und in der Elektrotechnik (z. B. Schienen, Kabel und Freileitungsseile). 3.4.2 Magnesium
Gewinnung durch Schmelzflusselektrolyse von aufbereitetem Magnesiumchlorid bei 700 ◦ C (70 bis 80% der Mg-Weltproduktion) oder direkter Reduktion von
Gegenstand Al rein, Masseln; Halbzeug Al, Knetlegierungen (T1), Gusslegierungen (T2) Al-Halbzeug (Bleche, Rohre, Profile), Festigkeit Anodisch oxidiertes Al (Eloxal), Lieferbedingungen Al für die Elektrotechnik, DIN EN 1715-1, -2 Hüttenmagnesium Mg, Knetlegierungen (T1), Gusslegierungen Mg-Halbzeug, Festigkeit Ti/Ti-Knetlegierungen, Zusammensetzung Bleche und Bänder aus Ti und Ti-Knetlegierungen Halbzeug aus Ti und Ti-Legierungen (Stangen, Drähte, Schmiedestücke) Cu rein, Sorten; Halbzeuge Cu-Halbzeug (Bleche, Rohre, Profile), Festigkeit CuSn-Legierungen (Zinnbronze; Guss-Zinnbronze) CuZn-Legierungen (Messing; Guss-Messing) CuAl-Legierungen (Al-Bronze; Guss-Al-Bronze) Hüttennickel Nickel in Halbzeug; Zusammensetzung Ni-Knetlegierungen, mit Cr, mit Cu; Zusammensetzung Sn, Sorten und Lieferformen Sn-Druckgusslegierungen, Verwendungsrichtlinien Zinngerät, Zusammensetzung der Sn-Legierungen Zn, Feinzink, Hüttenzink Feinzink-Gusslegierungen Zn-Halbzeug für das Bauwesen (Bleche, Bänder) Pb-Druckgusslegierungen Pb und Pb-Legierungen; allgemeine Verwendung (T1) Kabelmäntel (T2), Akkumulatoren (T3)
Magnesiumoxid durch karbothermische oder silicothermische Verfahren. Magnesium kristallisiert in hexagonal dichtester Kugelpackung, ist leicht zerspanbar und hat bei mittleren Festigkeitseigenschaften die niedrigste Dichte aller metallischen Werkstoffe (1,74 kg/dm3). Die hohe Affinität zum Sauerstoff macht trotz Bildung von Oxid-Oberflächenschichten Korrosionsschutzmaßnahmen erforderlich.
3 Metallische Werkstoffe
Die wichtigsten Legierungselemente (Al, Zn, Mn) verbessern die Festigkeit, vermindern die hohe Kerbempfindlichkeit und erhöhen die Korrosionsbeständigkeit (Mn). Die bei Raumtemperatur mehrphasigen Legierungen (Mischkristalle, intermetallische Phasen) lassen sich durch Wärmebehandlung bezüglich Zähigkeit (Lösungsglühen, Abschrecken) oder Festigkeit (Lösungsglühen, langsames Abkühlen) beeinflussen. Umformung der Knetlegierungen geschieht durch Strangpressen, Warmpressen, Schmieden, Walzen und Ziehen oberhalb 200 ◦ C. Hauptanwendungsgebiete der Legierungen sind der Flugzeugbau (z. B. Türen, Cockpitkomponenten), der Automobilbau (z. B. Getriebegehäuse) sowie der Instrumenten-und Gerätebau (z. B. Kameragehäuse, Büromaschinen). 3.4.3 Titan
Herstellung kompakten Titans durch Vakuumschmelzen von porösem Titan, das aus Rutil bzw. Ilmenit über die Zwischenstufen Titandioxid und Titantetrachlorid durch Aufschließen, Fällung und Reduktion gewonnen wird. Titan hat bei Raumtemperatur eine hexagonale (verformungsungünstige) Gitterstruktur (α-Phase), die sich oberhalb von 882 ◦ C in die kubisch raumzentrierte β-Phase umwandelt. Es hat eine hohe Festigkeit, relativ geringe Dichte, sowie eine ausgezeichnete Korrosionsbeständigkeit durch Oxidschichtbildung infolge hoher Sauerstoffaffinität und kann unter Schutzgas und im Vakuum geschweißt werden. Legierungszusätze von Al, Sn oder O begünstigen die hexagonale α-Phase, solche von V, Cr und Fe die kubisch raumzentrierte β-Phase mit besserer Kaltumformbarkeit und höherer Festigkeit. Ähnlich wie bei Stahl können durch geeignete Wärmebehandlung (z. B. Ausscheidungshärtung, Martensithärtung) die mechanischen Eigenschaften beeinflusst und zweiphasige (α + β)-Legierungen mit günstigem Festigkeits-Dichte-Verhältnis hergestellt werden. Hauptanwendungsgebiete sind die Flugzeug- und Raketentechnik (z. B. Leichtbauteile hoher Festigkeit), Chemieanlagen (z. B. Wärmetauscher, Elektroden), Schiffsbau (z. B. seewasserbeständige Teile, wie Schiffsschrauben) und die Medizintechnik (biokompatible Implantate).
3.4.4 Kupfer
Gewinnung durch Pyrometallurgie (75% der Cu-Weltproduktion), Elektrometallurgie und Hydrometallurgie. Kupfer hat ein kfz Gitter und eine Elektronenkonfiguration mit abgeschlossenen d-Niveaus der zweitäußersten Schale und einem s-Elektron in der äußersten Schale. Es besitzt gute Verformbarkeit, ausgezeichnete elektrische und thermische Leitfähigkeit sowie hohe Korrosionsbeständigkeit infolge des relativ hohen Lösungspotenzials und der Fähigkeit zur Deckschichtbildung in verschiedenen Medien. Es lässt sich gut schweißen und löten, ist jedoch gegen Erhitzung in reduzierender Atmosphäre empfindlich, sog. Wasserstoffkrankheit. Geringe Legierungszusätze steigern die Festigkeit von Kupfer durch Mischkristallbildung (Ag, Mn, As) oder durch Aushärten (Cr, Zr, Cd, Fe, P). Wichtig sind folgende Kupferlegierungen: – Messing: Kupfer-Zink-Legierungen mit den hauptsächlichen Gefügegruppen: α-Messing mit einem Zn-Anteil < 32 Gew.-% (gut kaltumformbar, schwieriger warmumformbar, schlecht zerspanbar), β-Messing mit 46% bis 50% Zn (schwierig kaltverformbar, gut warmverformbar, gut zerspanbar) und (α + β)-Messing mit einem Zn-Gehalt von 32 bis 46%. Sondermessing enthält weitere Legierungsbestandteile, wie z. B. Ni oder Al, zur Erhöhung von Festigkeit, Härte, Feinkörnigkeit oder Mn, Sn zur Verbesserung von Warmfestigkeit und Seewasserbeständigkeit. – Neusilber: Kupfer-Zink-Legierungen, bei denen ein Teil des Kupfers durch einen Nickelanteil (10 bis 25%) zur Verbesserung der Anlaufbeständigkeit ersetzt ist. – Bronze: Kupfer-Legierungen mit einem Anteil von mehr als 60% Cu und den Hauptgruppen Zinnbronze (Knetlegierungen < 10% Sn, Gusslegierungen < 20% Sn), Aluminiumbronze (< 11% Al), Bleibronze für Lager (< 22% Pb), Nickelbronze (< 44% Ni), Manganbronze (< 5% Mn), Berylliumbronze (< 2% Be). Hauptanwendungsgebiet von legiertem und unlegiertem Kupfer sowie von Mangan- und Berylliumbronze ist die Elektrotechnik (z. B. Kabel, Drähte; Wider-
D29
D30
D Werkstoffe
standswerkstoffe, z. B. CuNi44 ,Konstantan‘) und der (Elektro-)Maschinenbau (z. B. Kommutatorlamellen in Elektromotoren, Punktschweißelektroden). Messing eignet sich besonders für die spanende Bearbeitung (z. B. Drehteile, Bauprofile) und die spanlose Formgebung (z. B. extreme Tiefziehbeanspruchung bei 28% Zn möglich). Neusilber ist sowohl für Relaisfedern in der Nachrichtentechnik als auch für Tafelgeräte und Geräte der Feinwerktechnik geeignet. Bronze findet Anwendung in der Tribotechnik (z. B. Gleitlager, Schneckenräder, kavitations- und erosionsbeanspruchte Bauteile). 3.4.5 Nickel
Gewinnung aus sulfidischen oder silikatischen Erzen durch komplizierte metallurgische Prozesse: Flotationsaufbereitung, Rösten, Schmelzen im Schacht- oder Flammenofen, Verblasen im Konverter, Raffination. Nickel hat wegen seines kubisch flächenzentrierten Gitters gute Umformbarkeit und Zähigkeit; es ist sehr korrosionsbeständig und bis zur Curietemperatur von 360 ◦ C ferromagnetisch. Gegenüber Eindiffusion von Schwefel ist Nickel empfindlich und neigt dann zum Aufreißen bei der Kaltumformung, zur Warmrissigkeit beim Schweißen und bei der Warmumformung (sog. Korngrenzenbrüchigkeit). Wichtige Legierungen sind: – Nickel-Kupfer-Legierungen: Ni bildet eine lückenlose Mischkristallreihe und ist mit Cu durch Gießen, spanlose und spanende Formgebung sowie durch Löten und Schweißen verarbeitbar. Legierungen mit 30% Cu (z. B. NiCu30Fe, ,Monel‘) sind sehr korrosionsbeständig, Festigkeitssteigerung durch Aushärten (Zusatz von Al und Si). – Nickel-Chrom-Legierungen: Massenanteile von 15 bis 35% Cr erhöhen die Zunderbeständigkeit und die Warmfestigkeit, z. B. bei Heizleitern mit hohem spezifischem Widerstand. – Nickelbasis-Gusslegierungen, z. B. mit 0,1% C, 16% Cr, 9% Co, 1,7% Mo, 2% Ta, 3,5% Ti, 3,5% Al, 2,7% W (Inconel 738 LC) besitzen hohe Warmfestigkeit durch Ausscheidung eines hohen Volumenanteils der intermetallischen γ -Phase Ni3 (Al, Ti) in die γ-Matrix (sog. Superlegierungen). Eine weitere Erhöhung der
Warmfestigkeit, besonders der Kriechfestigkeit und der Lebensdauer wird erzielt durch besondere Gießtechniken zur Vermeidung von Korngrenzen senkrecht zur Richtung maximaler Beanspruchung (gerichtete oder einkristalline Erstarrung). Superlegierungen dienen auch als Basis für oxiddispersionsgehärtete (ODS) mechanisch legierte hochwarmfeste Werkstoffe, z. B. MA 6000. – Nickel-Eisen-Legierungen: Weichmagnetische Werkstoffe (29 bis 75 Gew.-% Ni) mit hoher Permeabilität und Sättigungsinduktion sowie geringen Koerzitivfeldstärken und Ummagnetisierungsverlusten. Al, Co, Fe-Ni-Legierungen sind dagegen hartmagnetische Werkstoffe hoher, möglichst unveränderlicher Magnetisierung; FeNi36 (,Invar‘) mit sehr kleinem thermischen Ausdehnungskoeffizienten. Nickelbasis-Hochtemperaturwerkstoffe werden hauptsächlich in der Kraftfahrzeug- und Luftfahrttechnik(z. B. Verbrennungsmotorventile, Turbinenschaufeln) sowie in der chemischen Anlagentechnik (z. B. Reaktorwerkstoffe, Heizleiter) eingesetzt. Nickel-Eisen-Legierungen sind im Bereich der Elektrotechnik unentbehrlich (z. B. als weich- und hartmagnetische Werkstoffe). 3.4.6 Zinn
Gewinnung durch Reduktion von Zinnstein (Zinndioxid) nach nassmechanischer Aufbereitung (z. B. Flotation) und Abrösten, anschließend Raffination durch Seigerung oder durch Elektrolyse. Zinn hat ein tetragonales Gitter, das sich unterhalb von 13,2 ◦ C (träge) in die kubische Modifikation umwandelt („Zinnpest“ bei tiefen Temperaturen). Es ist gegen schwache Säuren und schwache Alkalien beständig. Infolge seiner niedrigen Rekristallisationstemperatur tritt bei der Umformung (Walzen, Pressen, Ziehen) bereits bei Raumtemperatur Rekristallisation ein, sodass die Kaltverfestigung ausbleibt (hohe Bruchdehnung). Wichtige Zinnlegierungen sind: – Lagermetalle: Weißmetall-Legierungen, z. B. GlSn80 (80% Sn, 12% Sb, 7% Cu, 1% Pb), dessen Gefüge aus harten intermetallischen Verbindungen (Cu6 Sn) sowie Sn-Sb-Mischkristallen besteht, die in ein weicheres bleihaltiges Eutektikum eingelagert sind.
4 Anorganisch-nichtmetallische Werkstoffe
– Weichlote: L-Sn60 (60% Sn, 40% Pb), erstarrt zu 95% eutektisch (dünnflüssig, für feine Lötarbeiten), L-Sn30 (30% Sn, 70% Pb), bei niedriger Arbeitstemperatur (190 ◦ C dünnflüssig besitzt großes Erstarrungsintervall (für großflächige Lötarbeiten). Hauptanwendungen der Zinnlegierungen betreffen die Tribotechnik (Lagermetalle), die Fügetechnik (Lote) und den Korrosionsschutz von Metallen durch Verzinnen (z. B. Weißblech). 3.4.7 Zink
Gewinnung aus (einheimischer) Zinkblende (Wurtzit, ZnS) durch Aufbereiten (Flotation) Rösten, Reduktion mit Kohle und Kondensation des zunächst als Metalldampf entstandenen Zn in der Ofenvorlage; alternativ durch Auslaugung des Erzes und Elektrolyse. Zink ist ein Schwermetall mit hexagonaler Gitterstruktur, guten Gusseigenschaften, anisotropen Verformungseigenschaften. Durch Zinkhydrogenkarbonat-Deckschichtbildung ausgezeichnete Beständigkeit gegen atmosphärische Korrosion. Negatives Potenzial gegen Fe in wässrigen Lösungen begründet guten Korrosionsschutz auf Stahl (Feuerverzinkung, galvanische Verzinkung) als „Opferanode“ (Abtrag von Zn statt Fe). Zinklegierungen mit technischer Bedeutung sind vor allem die aus Feinzink (99,9 bis 99,95% Zn) hergestellten Gusslegierungen, die 3,5 bis 6% Al sowie bis zu 1,6% Cu zur Erhöhung der Festigkeit durch Mischkristallbildung und 0,02 bis 0,05% Mg zur Verhinderung interkristalliner Korrosion enthalten. Hauptanwendungsgebiete sind neben der Feuerverzinkung von Stahl (ca. 40% der Zinkproduktion) vor allem der allgemeine Maschinenbau (z. B. Zn-Druckguss für kleinere Maschinenteile und Gegenstände komplizierter Gestaltung) sowie das Bauwesen (z. B. Bleche für Dacheindekkungen, Dachrinnen, Regenrohre). Zink ist toxisch: das Lebensmittelgesetz verbietet die Verwendung von Zinkgefäßen zum Zubereiten und Aufbewahren von Nahrungs- und Genussmitteln. 3.4.8 Blei
Gewinnung aus Bleiglanz (PbS) durch Aufbereiten (Flotation zur Pb-Anreicherung), Rösten, Schachtofenschmelzen und Raffination.
Blei lässt sich wegen seines kubisch flächenzentrierten Gitters gut verformen, sowie außerdem gut gießen, schweißen und löten. Da die Rekristallisationstemperatur bei Raumtemperatur liegt, ist die Festigkeit sehr gering und die Neigung zum Kriechen hoch. Blei ist gegen Schwefelsäure beständig, da es unlösliche Bleisulfate bildet, die weiteren Korrosionsangriff ausschließen. Wegen seiner hohen Massenzahl ist Blei ein wirksamer Strahlenschutz für Röntgengeräte und radioaktive Stoffe. Zusatz von Legierungsbestandteilen (Sb, Sn, Cu) erhöht die Festigkeit durch Mischkristallbildung und Aushärtung und verbessert die Korrosionsbeständigkeit. Bei der Blei-Antimon-Legierung Hartblei sind bei Raumtemperatur 0,24% Sb im Mischkristall löslich, im Eutektikum ca. 3% Sb. Hauptanwendungsgebiete sind die Kraftfahrzeugtechnik (50% des PbVerbrauchs für Starterbatterien), die Elektrotechnik (z. B. Bleikabel), der chemische Apparatebau (Beschichtungslegierungen) und der Strahlenschutz. Blei und seine Verbindungen sind stark toxisch; die Verwendung von bleihaltigen Legierungen im Nahrungsund Genussmittelwesen ist verboten.
4 Anorganisch-nichtmetallische Werkstoffe 4.1 Mineralische Naturstoffe Die in technischen Anwendungen verwendeten anorganischen Naturstoffe sind Minerale oder zumeist Gesteine, d. h. Aggregate kristalliner oder amorpher Minerale aus der (zugänglichen) Erdkruste. Minerale werden nach ihrer chemischen Zusammensetzung in neun Mineralklassen klassifiziert und nach ihrer Härte gemäß der Mohs’schen Härteskala gekennzeichnet, siehe Tabelle 4-1. Nach Mohs liegt die Härte eines Minerals zwischen der Härte des Skalenminerals, von dem es geritzt wird und derjenigen des Minerals, das es selbst ritzt. Die qualitative Härteskala nach Mohs lässt sich durch quantitative Härtemessungen (siehe 11.5.3) ergänzen [1], deren Mittelwerte für die Minerale der Mohsskala annähernd eine geometrische Folge bilden. (Im Mittel Multiplikation der Härtewerte mit dem Faktor 1,6 beim Übergang von einer Mohs-Härtestufe zur nächsthöheren.)
D31
D32
D Werkstoffe
Tabelle 4-1. Minerale und ihre Härtewerte [1]
Mineral
Talk Gips Kalkspat Flussspat Apatit Orthoklas Quarz Topas Korund Diamant a
Härtestufe nach Mohs
1 2 3 4 5 6 7 8 9 10
Härtemesswertea
20 . . . 56 36 . . . 70 115 . . . 140 175 . . . 190 300 . . . 540 470 . . . 620 750 . . . 1 280 1 200 . . . 1 430 1 800 . . . 2 020 (7 575 . . .10 000)
Geometr. Folge (Stufung 1,6) 47 75 119 191 305 488 781 1 250 2 000 (>4 000)
nach Vickers und Knoop (Einheit: HV bzw. HK)
Ein Gestein ist durch die vorhandenen Minerale und sein Gefüge gekennzeichnet. Nach ihrer Entstehung unterscheidet man (vgl. Tabelle 4-2): – Magmatische Gesteine, z. B. die Plutonite (Tiefengesteine) Granit, Syenit, Diorit, Gabbro; die schwach metamorphen (alten) Vulkanite (Ergussgesteine) Quarzporphyr, Porphyrit, Diabas, Melaphyr und jungen Vulkanite Trachyt, Andesit, Basalt; – Sedimentgesteine, z. B. Sandsteine, Kalksteine und Dolomite, Travertin (Kalksinter), Anhydrit, Gips, Steinsalz, sowie unverfestigte Sedimente, z. B. Sande, Kiese, Tone und Lehme; – Metamorphe Gesteine, z. B. Quarzit, Quarzitschiefer, Gneise, Glimmerschiefer, Marmor. Die Dichte der Natursteine liegt zwischen ca. 2,0 und 3,2 kg/dm3. Ihre Biegefestigkeit beträgt infolge Sprödigkeit und Kerbempfindlichkeit nur etwa 5 bis 20% der Druckfestigkeit.
4.2 Kohlenstoff Reiner Kohlenstoff in den mineralisch vorkommenden Modifikationen Diamant und Graphit sowie als glasartiger Kohlenstoff oder Faser ist ein elementarer mineralischer bzw. künstlicher Stoff. Die Eignung
neuartiger kugelförmiger Kohlenstoffmodifikationen (Fullerene) als technische Materialien steht derzeit noch dahin. Diamant
Bei der Diamantstruktur ist jedes C-Atom durch vier tetraedrisch angeordnete sehr feste kovalente Bindungen an seine vier nächsten Nachbarn gebunden. Sie kann synthetisch erst bei hohen Drücken über 4 GPa (= 40 kbar) und Temperaturen über 1400 ◦ C hergestellt werden. Diamant zeichnet sich aus durch: – – – – –
extrem hohe Härte, siehe Tabelle 4-1; hohe Schmelztemperatur; hohen spezifischen elektrischen Widerstand; ausgezeichnete chemische Beständigkeit; hohe Wärmeleitfähigkeit.
Technische Anwendung findet Diamant hauptsächlich als Hochleistungsschneidstoff zur Bearbeitung harter Werkstoffe und als Miniaturlager in der Feinwerktechnik. Graphit
Graphit kristallisiert in einer hexagonalen Schichtstruktur, wobei der Kohlenstoff innerhalb der Basisebenen überwiegend kovalent gebunden ist. Zwischen den Schichten besteht eine quasimetallische Bindung. Graphit hat eine geringere Dichte und Festigkeit als Diamant und weist folgende Anisotropien auf: – Der Wärmeausdehnungskoeffizient parallel zu den Basisebenen ist negativ, senkrecht dazu positiv. – Die elektrische Leitfähigkeit parallel zu den Schichten ist ca. um den Faktor 5000 größer als senkrecht dazu. – Die Schichten des Graphitgitters gleiten bei Schubbeanspruchung leicht gegeneinander ab, sodass Graphit als Festschmierstoff geeignet ist. (Für das leichte Abgleiten ist jedoch die Anwesenheit von Wasserdampf erforderlich.) Angewendet wird Graphit z. B. in der Elektrotechnik (Elektroden- und Schleifkontakte) sowie im Reaktorbau (Moderatormaterial mit ausgezeichnetem Bremsvermögen für schnelle Neutronen) und in der Elektrotechnik (Elektroden- und Kollektormaterial).
4 Anorganisch-nichtmetallische Werkstoffe
Tabelle 4-2. Technisch bedeutsame Natursteine
Für die Kennzeichnung der wichtigeren magmatischen Gesteine hinsichtlich ihres Mineralbestandes genügen sieben silikatische Minerale bzw. Mineralgruppen: a) Helle Minerale (sämtlich Gerüstsilikate): 1. Plagioklase (Mischkristallreihe Albit („sauer“) – Anorthit („basisch“), Na[AlSi3 O8 ]-Ca[Al2 Si2 O8 ]; 2. Alkalifeldspäte (Orthoklas, K[AlSi3 O8 ],u. a.); 3. Quarz, SiO2 . Dunkle Minerale: 4. Dunkelglimmer (Dreischichtsilikate: Biotit, K(Mg, Fe)3 [(OH)2 ] [Si3 AlO10 ], u. a.); 5. Amphibole (Doppelkettensilikate: Hornblende u. a.); 6. Pyroxene (Kettensilikate: monoklines Klinopyroxen (Augit, (Ca)(Mg, Fe, Al)[(Si, Al)2 O6 ], u. a.) und rhombisches Orthopyroxen; 7. Olivin, (Mg, Fe)2 [SiO4 ], ein Inselsilikat. – Die Carbonate Calcit, CaCO3 , und Dolomit, CaMg(CO3 )2 , bauen den größten Teil der chemischen Sedimente auf. Gesteinsart Granit Syenit Diorit Gabbro Quarzporphyr Diabas Melaphyr Basalt Kalkstein Dolomit[stein] Grauwacke [Quarz-] Sandstein Marmor
wesentliche Mineralbestandteile (Hauptgemengeteile) Kalifeldspat, Plagioklas, Quarz, Biotit; Hornblende Orthoklas, Hornblende, Biotit Plagioklas, Hornblende, Biotit; Augit Plagioklas, Klinopyroxen, Orthopyroxen, Olivin granitische Matrix mit Quarz- und Orthoklas-Einsprenglingen Plagioklas, Augit, Magnetit- oder Titaneisenerz; Olivin Plagioklas, Pyroxen; Olivin Plagioklas, Pyroxen Calcit Dolomit Quarz, Feldspat, (Gesteinsbruchstücke) Quarzsand
Druckfestigkeit MPa
metamorph umgewandelter Calcit oder Dolomit
40. . .280
Glasiger Kohlenstoff
Kohlenstoff-Modifikationen mit amorpher Verteilung der C-Atome, die durch thermische Zersetzung organischer Kohlenstoffverbindungen (z. B. Zellulose) und anschließendes Sintern der Zersetzungsprodukte erhalten werden. Anwendung z. B. als gasdichter und korrosionsbeständiger Hochtemperaturwerkstoff im Apparatebau. Kohlenstofffasern (Carbonfasern)
Hochfeste C-Fasern, die ähnlich wie glasiger Kohlenstoff durch Pyrolyse organischer Kohlenstoffverbindungen in Inertgas erhalten werden, haben
80. . .270 150. . .200 180. . .240 100. . .280 190. . .350 130. . .300 120. . .380 100. . .580 25. . .190 50. . .160 180. . .360 15. . .320
Technische Verwendung Monumentalarchitektur, Fassadenund Bodenplatten; Pflastersteine; Schotter
Schotter, Splitt, Pflastersteine, Bausteine Schotter, Splitt, Mosaikpflaster, Pflastersteine Schotter, Splitt, Werkstein, Gesteinsmehl Schotter, Splitt, Pflastersteine Schotter, Splitt, Pflastersteine Baustoff, Kalkbrennen Schotter, Baustein Schotter, Splitt, Pflastersteine Hochbau (historisch wichtiger Bauund Werkstein in Mitteleuropa) polierte Platten für Innenausbau; Bildhauerstein
ein hohes Festigkeits-Dichte-Verhältnis und werden in Hochleistungs-Faser-Verbundwerkstoffen zur Erhöhung der Zugfestigkeit verwendet (siehe 6.2).
4.3 Keramische Werkstoffe Keramische Werkstoffe sind anorganisch-nichtmetallische Materialien mit Atom- und Ionenbindung, deren komplexes kristallines Gefüge durch Sintern erzeugt wird. Die Einteilung keramischer Werkstoffe kann nach folgenden Kriterien geschehen: – Chemische Zusammensetzung: Silicatkeramik, Oxidkeramik, Nichtoxidkeramik;
D33
D34
D Werkstoffe
– Größe der Gefügebestandteile: Grobkeramik, Feinkeramik (Gefügeabmessungen kleiner als 0,2 mm); – Dichte und Farbe: Irdengut (porös, farbig), Steingut (porös, hell), Steinzeug (dicht, farbig), Porzellan (dicht, hell); – Anwendungsbereiche: Zierkeramik, Geschirrkeramik, Baukeramik, Feuerfestkeramik, Chemokeramik, Mechanokeramik, Reaktorkeramik, Elektrokeramik, Magnetokeramik, Optokeramik, Biokeramik. 4.3.1 Herstellung keramischer Werkstoffe
Keramische Werkstoffe werden aus natürlichen Rohstoffen (Silicatkeramik) oder aus synthetischen Rohstoffen (Oxid- und Nichtoxidkeramik) durch die Verfahrensschritte (a) Pulversynthese, (b) Masseaufbereitung, (c) Formgebung, (d) Sintern, (e) Endbearbeiten hergestellt, vgl. Bild 4-1. Für die Herstellungstechnologien technischer (Hochleistungs-)Keramik sind u. a. folgende Gesichtspunkte von Bedeutung: Verwendung hochreiner, feiner Pulver mit großer reaktiver Oberfläche,
Überführen der zu verpressenden Pulver durch spezielle Trocknungsmethoden in gut verarbeitbares Granulat, individuelles Anpassen des Sinterpressens (Aufheizrate, Haltezeiten, Temperatur, Atmosphäre) an das betreffende Material, Berücksichtigung notwendiger Maßtoleranzen für die Nachbearbeitung zum Optimieren der Oberflächengüte. 4.3.2 Silicatkeramik
Keramische Werkstoffe auf silikatischer Basis, wie Steinzeug, Porzellan, Schamotte, Silikasteine, Steatit, Cordierit, sind seit langem in der technischen Anwendung bekannt. Sie werden als tonkeramische Werkstoffe meist aus dem Rohstoffdreieck Quarz-Ton-Feldspat entsprechend den Dreistoffsystemen SiO2 -Al2 O3 -K2 O (oder CaO, MgO, Na2 O) gebildet. Die pulverisierten Feststoffe werden mit einer genau zu bemessenden Menge Wasser zu einer bei Raumtemperatur knetbaren Masse (bzw. einem dünnflüssigen „Schlicker“) verarbeitet, durch Drehen oder Pressen einer Bauteil-Formgebung unterzogen und getrocknet. Beim Brennen und nachfolgendem
Bild 4-1. Herstellungsverfahren für keramische Werkstoffe (schematische Übersicht). Bei der Silicatkeramik entfallen die Schritte Pulversynthese und Endbearbeiten
4 Anorganisch-nichtmetallische Werkstoffe
Abkühlen bildet sich durch Stoffumwandlungen und Flüssigphasensintern ein Verbund von „MullitPhasen“ (3 Al2 O3 · 2 SiO2 ) in einer glasigen Matrix. Eventuell vorhandene Poren werden durch Glasieren geschlossen. Abhängig von den Anteilen der Grundstoffe und den Verfahrensbedingungen erhält man Steingut, Steinzeug, Weichporzellan, Hartporzellan oder technisches Porzellan, siehe Bild 4-2. Steingut und Porzellan werden als Isolierstoffe in der Elektrotechnik angewendet. Sie sind temperaturwechselbeständig, jedoch spröde, die Druckfestigkeit ist bis zu 50mal höher als die Zugfestigkeit. Feuerfestwerkstoffe sind keramische Werkstoffe mit besonders hoher Schmelz- oder Erweichungstemperatur, Temperaturwechselfestigkeit und chemischer Beständigkeit. Man unterscheidet (Massenanteile in %): – Schamottsteine (55 . . . 75% SiO2 20 . . . 45% Al2 O3 ), Verwendung bis etwa 1670 ◦ C im Ofenbau; – Silikasteine (ca. 95% SiO2 , 1% Al2 O3 ), Verwendung bis etwa 1700 ◦ C auch in aggressiven Medien; – Sillimanit- und Mullitsteine enthalten als hochtonerdeführende Materialien 60 bis 70 bzw. 72 bis 75 Gew.-% Al2 O3 , Verwendung bis etwa 1900 ◦ C wegen ihrer hochtemperaturfesten Mullitphase.
Bild 4-2. Dreistoffsystem Quarz-Ton-Feldspat
Weitere technisch wichtige Silicatkeramiken: – Steatit (Hauptrohstoffe: Speckstein 3 MgO · 4 SiO2 · H2 O, < 15% Steingutton, < 10% Feldspat), etwa doppelte Festigkeit von Hartporzellan und gute Wärmebeständigkeit, Verwendung z. B. in der Hochfrequenztechnik (kleine dielektrische Verluste) oder als Träger für Heizwicklungen und Zündkerzen. – Cordierit (Ringsilikat der Zusammensetzung 2 MgO · 2 Al2 O3 · 5 SiO2 ), sehr niedriger Wärmeausdehnungskoeffizient, hohe Temperatur-Wechselbeständigkeit. 4.3.3 Oxidkeramik
Oxidkeramische Werkstoffe sind polykristalline glasphasenfreie Materialien aus Oxiden oder Oxidverbindungen. Aufgrund der hohen Bindungsenergie der Oxide sind die Verbindungen sehr stabil (hohe Härte und Druckfestigkeit), meist elektrisch isolierend und chemisch resistent. Wichtige Vertreter: – Oxide (Aluminiumoxid Al2 O3 , Zirconiumoxid ZrO2 , Titandioxid TiO2 , Berylliumoxid BeO, Magnesiumoxid MgO) – Titanate – Ferrite Aluminiumoxid (Al2 O3 ), die technisch wichtigste Oxidkeramik, kristallisiert in seiner stabilen ionisch gebundenen α-Phase (Korund) in hexagonal dichtester Kugelpackung von O-Atomen, in der Al-Ionen 2/3 der oktaedrischen Lücken besetzen. Mit dem AlGehalt (z. B. 85, 99, 99,7%) steigt die Druckfestigkeit (1800, 2000, 2500 MPa), der spezifische elektrische Widerstand (4 · 104 , 5 · 107 , 4 · 108 Ω · m bei 600 ◦ C) und die maximale Einsatztemperatur (1300, 1500, 1700 ◦ C) [2]. Die Verwendungsmöglichkeiten erstrecken sich damit von Feuerfestmaterial über chemisch oder mechanisch beanspruchte Teile, Isolierstoffe bis hin zu Schneidwerkzeugen, Schleifmitteln und medizinischen Implantaten. Transparentes Material für lichttechnische Zwecke lässt sich bei äußerster Reinheit und definiertem Gefüge erzeugen. Noch höhere Schmelztemperaturen als Al2 O3 (2050 ◦ C) haben Zirconiumoxid (2690 ◦ C), Berylliumoxid (2585 ◦ C) und Magnesiumoxid (2800 ◦ C).
D35
D36
D Werkstoffe
Bei Zirconiumoxid treten mit steigender Temperatur folgende Strukturumwandlungen auf: monoklin → tetragonal (1000 bis 1200 ◦ C, 8% Volumenabnahme), tetragonal → kubisch (2370 ◦ C), kubisch → Schmelze (2690 ◦ C). Die für kompakte Bauteile sehr nachteiligen temperaturabhängigen Formänderungen von ZrO2 -Bauteilen können durch Zusätze, z. B. von MgO, unterdrückt werden (teilstabilisiertes ZrO2 ). Keramische Doppeloxide mit der allgemeinen Formel MO · Fe2 O3 (z. B. BaO · Fe2 O3 , SrO · Fe2 O3 ) und hexagonalem Gitter gehören zu den wichtigsten ferrimagnetischen Werkstoffen. Da im Ferritgitter ein Teil der Spinrichtungen kompensiert wird, ist ihre Sättigungspolarisation zwar kleiner als bei metallischen Magneten, die Koerzitivfeldstärke kann jedoch infolge der Kristallanisotropie mehr als dreifach so hoch sein. Ferritpulver ist technisch vielseitig einsetzbar und kann auch in Kunststoffschichten, wie z. B. in Tonbändern, eingelagert werden. 4.3.4 Nichtoxidkeramik
Nichtoxidkeramische Werkstoffe sind sogenannte Hartstoffe: Carbide, Nitride, Boride und Silicide. Sie haben im Allgemeinen einen hohen Anteil kovalenter Bindungen, die ihnen hohe Schmelztemperaturen, Elastizitätsmodulen, Festigkeit und Härte verleihen. Daneben besitzen viele Hartstoffe auch hohe elektrische und thermische Leitfähigkeit und Beständigkeit gegen aggressive Medien. Siliciumcarbid, SiC, wird durch die Herstellungstechnologie gekennzeichnet, z. B. heißisostatisch gepresstes SiC (HiPSiC), gesintertes SiC (SSiC), Si-infiltriertes SiC (SiSiC). Sowohl heißgepresstes als auch gesintertes Material ist äußerst dicht, SiSiC enthält freies Si (Einsatztemperatur niedriger als SiSchmelztemperatur). SiC kristallisiert in zahlreichen quasi-dichtegleichen Modifikationen mit ca. 90% kovalentem Bindungsanteil, z. B. multiple hexagonale bzw. rhomboedrische Strukturen (α-SiC) oder kubische (Zinkblende-)Strukturen (β-SiC). Wegen seiner hohen Härte, thermischen Leitfähigkeit und Oxydationsbeständigkeit (Bildung einer SiO2 -Deckschicht bis ca. 1500 ◦ C) ist es für zahlreiche technische Anwendungen im Hochtemperaturbereich geeignet. Siliciumnitrid, Si3 N4 , gibt es heißgepresst (HSPN), heiß isostatisch gepresst (HiPSN), gesintert (SSN),
reaktionsgebunden (RBSN). Durch Reaktionssintern können komplizierte Teile hoher Maßhaltigkeit (jedoch mit einer gewissen Porosität) hergestellt werden. Si3 N4 kristallisiert mit ca. 70% kovalentem Bindungsanteil in quasi-dichtegleichen α- und β-Modifikationen hexagonaler Symmetrie, jedoch unterschiedlicher Stapelfolge. Technisch interessant ist die bis ca. 1400 ◦ C beibehaltene Festigkeit und Kriechbeständigkeit und die beachtliche Temperaturwechselbeständigkeit. Wird ausgehend von Si3 N4 ein Teil des Siliciums durch Aluminium und ein Teil des Stickstoffs durch Sauerstoff ersetzt, gelangt man zu festen Lösungen, die als SIALON bezeichnet werden. Diese sind aus (Si, Al)(N, O4 )-Tetraedern aufgebaut, die – ähnlich den β-Si3 N4 -Strukturen – über gemeinsame Ecken verknüpft sind. Infolge der variablen Zusammensetzung (ggf. auch Einbau anderer Elemente, wie Li, Mg oder Be) sind Eigenschaftsmodifizierungen möglich [3]. Werden Nichtoxidkeramiken, besonders Carbide (TiC, WC, ZrC, HfC), aber auch Nitride, Boride oder Silicide, in Metalle (bevorzugt Co, Ni oder Fe) eingelagert, erhält man sog. Hartmetalle. Sie werden durch Sintern hergestellt. Die Hartmetalle bilden eine interessante Übergangsgruppe zwischen anorganischnichtmetallischen Werkstoffen und den Metallen, gekennzeichnet durch Anteile kovalenter Bindung (hohe Schmelztemperatur, hohe Härte) und Metallbindung (elektrische Leitfähigkeit, Duktilität). Anwendung als Schneidstoffe und hochfeste Verschleißteile.
4.4 Glas Gläser sind amorph erstarrte, meist lichtdurchlässige anorganisch-nichtmetallische Festkörper, die auch als unterkühlte hochzähe Flüssigkeiten mit fehlender atomarer Fernordnung aufgefasst werden können. Insofern spricht man von einem Glaszustand auch bei amorphen Metallen und Polymerwerkstoffen. Glas besteht aus drei Arten von Komponenten: 1. Glasbildnern: z. B. Siliciumdioxid, SiO2 ; Bortrioxid, B2 O3 ; Phosphorpentoxid, P2 O5 . 2. Flussmitteln: Alkalioxide, besonders Natriumoxid, Na2 O. 3. Stabilatoren: z. B. Erdalkalioxide, vor allem Calciumoxid, CaO. Die Glasstruktur ist ein unregelmäßig räumlich verkettetes Netzwerk bestimmter Bauelemente (z. B. SiO4 -Tetraeder), in das große Kationen eingelagert sind.
4 Anorganisch-nichtmetallische Werkstoffe
Nach der chemischen Zusammensetzung werden die verbreitetsten Gläser in folgende Hauptgruppen eingeteilt: – Kalknatronglas (Na2 O · CaO · 6 SiO2 ): Gebrauchsglas, geringe Dichte (ca. 2,5 kg/dm3), lichtdurchlässig bis zum nahen Infrarot (360 bis 2500 nm). – Bleiglas (Na2 O, K2 O · PbO · 6 SiO2 ): Dichte (bis ca. 6 kg/dm3), hohe Lichtbrechung, Grundwerkstoff für geschliffene Glaserzeugnisse (sog. Kristallglas). – Borosilikatglas (70 bis 80% SiO; 7 bis 13% B2 O3 ; 4 bis 8% Na2 O, K2 O; 2 bis 7% Al2 O3 ) chemisch und thermisch beständig, Laborglas, „feuerfestes“ Geschirr. Glasfasern, Durchmesser ca. 1 bis 100 μm, erreichen wegen fehlender Oberflächenfehler nahezu maximale theoretische Zugfestigkeit, Verwendung als Verstärkungsmaterialien in Verbundwerkstoffen (z. B. glasfaserverstärkter Kunststoff, GFK). Optisches Glas wird gekennzeichnet bzgl. Lichtbrechung durch die Brechzahl n (n < 1,6: niedrig brechend, n > 1,6: hochbrechend) und bzgl. der Farbzerstreuung (Dispersion) durch die Abbe’sche Zahl ν (siehe 9.7). Für die Verwendung in optischen Geräten werden hauptsächlich unterschieden: Flintgläser (ν < 50, große Dispersion) und Krongläser (ν > 55, große Dispersion). Optische Filter mit unterschiedlichen Transmissions-, Absorptions- und Reflexionseigenschaften in bestimmten Wellenlängenbereichen werden durch Einbau von Verbindungen der Elemente Cu, Ti, V, Cr, Mn, Fe, Co, Ni erstellt. Lichtleiter mit optisch hochbrechendem Kern und niedrigbrechendem Oberflächenbereich können als Lichtwellenleiter Licht durch Totalreflexion weiterleiten und werden zur breitbandigen Signalübertragung eingesetzt (ca. 30 000 parallele Telefonleitungen pro Faserstrang; Lichtverluste, d. h. Dämpfung < 0,2 dB/km).
4.5 Glaskeramik Glaskeramische Werkstoffe sind polykristallines Material (z. B. Lithium-Alumo-Silicate), gewonnen durch Temperung speziell zusammengesetzter Gläser (partielle Kristallisation). Aus einer Glasschmelze werden durch Pressen, Blasen, Walzen oder Gießen Bauteile geformt und einer Wärmebehandlung
unterworfen: Unterkühlen der hochschmelzende Keimbildner (meist TiO2 und ZrO2 ) enthaltenden Schmelze und anschließendes Tempern bei höherer Temperatur. Es entstehen in eine Glasmatrix eingebettete Kristalle mit besonderen optischen und elektrischen Eigenschaften oder geringer thermischer Ausdehnung und entsprechend hoher Temperaturwechselbeständigkeit. Der Kristallanteil im Volumen kann 50 bis 95% betragen. Die Anwendungsbereiche umfassen Wärmeschutzschichten für Raumfahrzeuge, hitzeschockfeste Wärmeaustauscher, große astronomische Spiegel mit mehreren m Durchmesser, hochpräzise Längennormale, Kochfelder und hitzebeständiges Geschirr.
4.6 Baustoffe Die im Bauwesen angewendeten anorganischnichtmetallischen Stoffe lassen sich allgemein nach Bild 4-3 einteilen in: – Naturbaustoffe (vgl. 4.1), – Keramische Baustoffe (vgl. 4.3), – Glasbaustoffe (vgl. 4.4), sowie in die unter Mitwirkung von Bindemitteln (z. B. Zement, Kalk, Gips) hergestellten Baustoffgruppen – – – –
Mörtel, Beton, Kalksandstein, Gipsprodukte.
Neben den anorganisch-nichtmetallischen Stoffen finden im Bauwesen naturgemäß auch Baustoffe aus den anderen Stoffgruppen Verwendung: metallische Baustoffe (siehe 3), Kunststoffe (siehe 5) und Verbundwerkstoffe, wie z. B. Stahlbeton und Spannbeton (siehe 6.3). 4.6.1 Bindemittel
Anorganische Bindemittel sind pulverförmige Stoffe, die unter Wasserzugabe erhärten und zur Bindung oder Verkittung von Baustoffen verwendet werden. Die Verfestigung des Bindemittels beruht hauptsächlich auf chemischen und physikalischen Reaktionen (Hydratation, Carbonatbildung; Kristallisation). Durch Zugabe von Sand zum Bindemittel erhält man Mörtel, mit gröberen Zuschlägen Beton.
D37
D38
D Werkstoffe
Man unterscheidet hydraulische und Luftbindemittel: – Hydraulische Bindemittel (Zemente, hydraulisch erhärtende Kalke, Mischbinder, Putz- und Mauerbinder) können nach Wasserzugabe sowohl an der Luft als auch unter Wasser erhärten und sind nach dem Erhärten wasserfest. Die Erhärtung beruht auf Hydratationsvorgängen von vorwiegend silikatischen Bestandteilen. – Luftbindemittel (Luftkalke, Baugipse, Anhydritbinder und Magnesitbinder) erhärten nur an der Luft und sind nach dem Erhärten nur an der Luft beständig. Die Erhärtung beruht bei Luftkalk auf der Bildung von CaCO3 und bei den übrigen Bindemitteln hauptsächlich auf Hydratationsvorgängen. 4.6.2 Zement
Zement, das wichtigste Bindemittel von Baustoffen, wird hauptsächlich durch Brennen von Kalk und Ton (z. B. Mergel) und anschließendes Vermahlen des Sinterproduktes in Form einer pulvrigen Masse (Teilchengröße 0,5 bis 50 μm) erhalten, das bei Wasserzugabe erhärtet und die umgebenden Oberflächen anderer Stoffe miteinander verklebt. Die
Bild 4-3. Baustoffe: Übersicht
wichtigsten Phasen des Zements, ihre Massenanteile und charakteristischen Eigenschaften sind: – Tricalciumsilikat, 3 CaO · SiO2 (40 bis 80%), schnelle Erhärtung, hohe Hydratationswärme; – Dicalciumsilikat, 2 CaO · Si2 (0 bis 30%), langsame, stetige Erhärtung, niedrige Hydratationswärme; – Tricalciumaluminat, 3 CaO · Al2 O3 (7 bis 15%), schnelle Anfangserhärtung, anfällig gegen Sulfatwasser; – Tetracalciumaluminatferrit, 4 CaO · Al2 O3 · Fe2 O3 (4 bis 15%), langsame Erhärtung, widerstandsfähig gegen Sulfatwasser. Diese Verbindungen gehen bei Wasserzugabe in Hydratationsprodukte (z. B. amorphes Calciumsilikathydrat und kristallines Calciumhydroxid) über, die geringe Wasserlöslichkeit, kleine Teilchendurchmesser (unter 1 μm) und nach Aushärtungszeiten von 28 Tagen Druckfestigkeiten von 25 bis 55 MPa aufweisen. Zement ist in DIN 1164-10, DIN EN 197-1 als Portlandzement (PZ), Eisenportlandzement, (EPZ), Hochofenzement (HOZ) und Trasszement (TrZ) genormt. Ein Gemisch aus Zement, Sand und Wasser wird als (Zement-)Mörtel bezeichnet.
4 Anorganisch-nichtmetallische Werkstoffe
4.6.3 Beton
– Steine: Abmessungen > 60 mm;
Beton ist ein Gemenge aus mineralischen Stoffen verschiedener Teilchengröße, (gekennzeichnet durch „Sieblinien“) z. B. Sand: 0,06 bis 2 mm; Kies: 2 bis 60 mm; Bindemittel Zement: 0,1 bis 10 μm und Wasser, das nach seiner Vermischung formbar ist, nach einer gewissen Zeit abbindet und durch chemische Reaktionen zwischen Bindemittel und Wasser erhärtet. Durch unterschiedliche Teilchengröße der Betonbestandteile wird eine große Raumausfüllung und hohe Dichte des Betons erzielt: die Zwischenräume zwischen dem Kies werden durch Sand gefüllt, die Zwischenräume der Sandkörner durch Zement, der dabei das Verkleben von Sand und Kies übernimmt. Beton lässt sich durch seine guten Form- und Gestaltungsmöglichkeit und seine hohe Witterungsund Frostbeständigkeit als Baustoff vielfältig einsetzen. In mechanischer Hinsicht ist er durch eine hohe Druckfestigkeit und eine geringe Zugfestigkeit gekennzeichnet. Je nach Druckfestigkeit, deren Prüfung aufgrund der großen Abmessungen der Gefügebestandteile des Betons mit relativ großen Probenkörperabmessungen durchgeführt werden muss (Würfel von 20 cm Kantenlänge, Korngröße < 4 cm) werden verschiedene Festigkeitsklassen (Druckfestigkeit 5 bis 55 MPa) unterschieden. „Hochfester Beton“ wird durch Reduzierung des Porenanteils entwickelt, sein Anwendungspotenzial liegt in der Reduzierung von Bauwerksabmessungen. Die Betonarten werden gemäß Rohdichte eingeteilt in
– Kies: grob, 20 bis 60; mittel, 6 bis 20; fein, 2 bis 6 mm;
– Leichtbeton, Rohdichte < 2,0 kg/dm3; – Normalbeton, Rohdichte 2,0 bis 2,8 kg/dm3; – Schwerbeton, Rohdichte > 2,8 kg/dm3. Die beim Austrocknen von Beton an Luft auftretende Schwindung (ca. 0,5%) kann durch Zusatz von Gips (CaSO4 ) kompensiert werden.
4.7 Erdstoffe Erdstoffe oder Böden sind Zweiphasengemische aus mineralischen Bestandteilen und Wasser oder Dreiphasensysteme aus Mineral- und Gesteinsbruchstücken, Wasser und Luft. Sie stellen die oberste, meist verwitterte Schicht der Erdkruste dar und heißen auch Lockergestein:
– Sand: grob, 0,6 bis 2; mittel, 0,2 bis 0,6; fein, 0,06 bis 0,2 mm; – Schluff: grob, 0,02 bis 0,06; mittel, 0,006 bis 0,02; fein, 0,002 bis 0,006 mm; – Ton: Korngröße < 0,002 mm. Erdstoffe kommen in verschiedenen Konsistenzen und Verdichtungsgraden vor. So besitzen z. B. Ton und Mergel Carbonatgehalte von 0 bis 10, bzw. 50 bis 70%, während Lehm ein natürliches Gemisch aus Ton und feinsandigen bis steinigen Bestandteilen darstellt. Nach ihrem stofflichen Zusammenhalt werden Erdstoffe in zwei große Gruppen eingeteilt: (a) Kohäsionslose Erdstoffe, z. B. Steine, Kiese, Sande, Grobschluffe, die keinen merklichen Tonanteil haben und deren „Festigkeit“ durch Reibung zwischen den körnigen Bestandteilen bestimmt wird. Bei ihrer Verformung unterscheidet man drei Verformungsanteile: – Gegenseitige Verschiebung der Körner (psammischer Anteil), im Wesentlichen bestimmt durch die Dichte; – elastische Verformung der Körner; – Kornbruch, vornehmlich an Berührungsflächen. (b) Kohäsive Erdstoffe, z. B. Schluffe, Tone, Mischböden, deren Zusammenhalt durch Rohton, bzw. verwitterte Feldspäte verursacht wird. Bei kohäsiven (bindigen) Böden hat Wasser wesentlichen Einfluss auf die Stoffeigenschaften. Erdstoffe bilden Baugrund, wenn sie im Einflussbereich von Bauwerken stehen und sind Baustoffe, wenn aus ihnen Bauwerke, z. B. Erddämme oder Deponieabdichtungen hergestellt werden. Bei dynamischer Belastung, z. B. Schwingungen von Fundamenten oder Ausbreitung von Erschütterungen im Boden, kann der Boden i. Allg. als elastisch und viskos angesehen werden. Die Bodengruppen sind in DIN 18 196, Baugrunduntersuchungsmethoden in DIN 18 123 sowie 18 124, 18 126, 18 127 genormt.
D39
D40
D Werkstoffe
5 Organische Stoffe; Polymerwerkstoffe 5.1 Organische Naturstoffe Organische Naturstoffe bestehen aus chemischen Verbindungen, die von Pflanzen oder Tieren erzeugt werden. Eine Zwischenstellung nehmen Polymere für technische Anwendungen ein, die von Mikroorganismen synthetisiert werden, z. B. Polyhydroxybuttersäure, Xanthan. Die technisch wichtigsten organischen Naturstoffe sind Holz und Holzwerkstoffe sowie Fasern. 5.1.1 Holz und Holzwerkstoffe
Holz ist ein natürlicher Verbundwerkstoff, der in seinem molekularen Aufbau im Wesentlichen aus Zellulosefasern (40 bis 60%), den „Bindemitteln“ Lignin (ca. 20 bis 30%, besonders in Nadelhölzern) und Hemizellulose (10 bis 30%, besonders in Laubhölzern) gebildet wird und hauptsächlich die chemischen Elemente Kohlenstoff (49%), Sauerstoff (44%) und Wasserstoff (6%) enthält. Die Ligninmoleküle sind räumlich mit den Zelluloseund Hemizellulosemolekülen vernetzt und bedingen dadurch die gute Druckfestigkeit des Holzes. Die mikroskopische Struktur von Holz ist gekennzeichnet durch lang gestreckte, röhrenförmige, über Tüpfel miteinander verbundene Zellen, die als Leitgewebe zum Transport von Wasser und Mineralstoffen beitragen und als Festigungsgewebe mehrachsige Spannungen aufnehmen können [1]. Im makroskopischen Stammquerschnitt schließen sich an das Markzentrum (wenige mm Durchmesser) das Kernholz (abgestorbene, wasserarme Zellen), das Splintholz (lebende, wassertransportierende Zellen), das Kambium (teilungsaktive Zellen), der Bast (Innenrinde) und die Borke als Außenrinde an, siehe Bild 5-1. Die jahreszeitlich bedingten periodischen Änderungen der Teilungstätigkeiten des Kambiums sind in Form von unterschiedlich strukturierten Dickenzuwachszonen als Jahresringe erkennbar. Hölzer besitzen geringe Dichte und günstige Zugfestigkeits-Dichte-Verhältnisse. Die Festigkeit ist jedoch stark richtungsabhängig: In der Faserachse beträgt die Zugfestigkeit etwa das Doppelte der Druckfestigkeit, die Querzugfestigkeit
Bild 5-1. Holz: Stammquerschnitt und struktureller Aufbau (vereinfachte Darstellung für einen vierjährigen Trieb eines Nadelbaums)
etwa ein Fünfzigstel der axialen Zugfestigkeit und die Querdruckfestigkeit etwa ein Zwanzigstel der axialen Druckfestigkeit. Bei Holzwerkstoffen wird die Anisotropie der Eigenschaften des gewachsenen Holzes durch schubfeste Verleimung fasergekreuzter Schichten teilweise ausgeglichen. Holzwerkstoffe bestehen aus zerkleinertem Holz, das unter Druck und Wärme mit Bindemitteln zu Platten oder Formteilen verpresst wird. Unter Sperrholz werden alle Platten aus mindestens drei aufeinandergeleimten Holzlagen verstanden, deren Faserrichtungen vorzugsweise um 90◦ gegeneinander versetzt sind. Sperrholz mit zwei Furnierdecklagen und einer Holzleistenmittellage wird als Tischlerplatte, Sperrholz, das nur aus Furnierlagen besteht, als Furnierplatte bezeichnet. Bei Faserplatten ist die Holzsubstanz in einem mehrstufigen Mahlprozess bis zur Faser aufgelöst. Der Faserstoff wird im Nass- oder Trockenverfahren zu Platten verschiedenen Typs verarbeitet. Spanplatten sind Holzwerkstoffe, die aus Spänen von Holz oder anderen verholzten Pflanzenteilen (Biomasse) mit Kunstharzen (z. B. Melamin, Isocyanat) als Bindemittel hergestellt sind. Neben Kunstharzen werden auch Zement oder Gips als Bindemittel verwendet. Die Eigenschaften von Holzwerkstoffen lassen sich durch die Herstellungstechnologien und die verwendeten Stoffanteile in weiten Grenzen variieren, wobei jedoch i. Allg. die Festigkeitseigenschaften von Holzwerkstoffen unter denen des gewachsenen Holzes in Faserrichtung bleiben. Während Faserplatten nur eine geringe Dimensionsstabilität aufweisen, zeichnen
5 Organische Stoffe; Polymerwerkstoffe
sich Furnierplatten durch günstige FestigkeitsGewichts-Verhältnisse aus. Zu den Vorzügen von Spanplatten gehören der Einsatz feuchtebeständiger Klebstoffe, Steuerung der Festigkeitseigenschaften durch Kombination bestimmter Fertigungsparameter (Rohdichte, Verdichtungsprofile, Beleimungsfaktoren usw.), Einarbeitung von insektiziden und fungiziden Holzschutzmitteln und Feuerschutzmitteln. Mit der sog. OSB-Technik (oriented structural board) kann durch Spanorientierung eine erhebliche Festigkeitssteigerung erzielt werden, sodass bei gleicher Dichte die Festigkeitswerte von fehlerfreiem Nadelholz annähernd erreicht werden [2].
Form hochmolekularer Eiweißkörper), die in den Zellen der Haarrindenschicht in Form von Fibrillen vorliegen. Seidenfasern bestehen zu ca. 75% aus Fibroin, einem Eiweißstoff der in den Spinndrüsen des Seidenspinners gebildet wird und zu ca. 25% aus dem, die sehr feinen Fibroinfibrillen (ca. 20 nm Durchmesser) umhüllenden kautschukähnlichem Eiweißstoff Sericin. Hauptverwendungsgebiete von Fasern sind die Bereiche Textilien und Papier. Textilrohstoffe sind nach dem Textilkennzeichnungsgesetz Fasern, die sich verspinnen oder zu textilen Flachgebilden verarbeiten lassen.
5.1.2 Fasern
5.2 Papier und Pappe
Fasern sind lang gestreckte Strukturen geringen Querschnitts mit paralleler Anordnung ihrer Moleküle oder Kristallbereiche und daraus resultierender guter Flexibilität und Zugfestigkeit. Organische Naturfasern werden eingeteilt in: (a) Pflanzenfasern: – Pflanzenhaare: Baumwolle, (Anteil an der Faserstoff-Weltproduktion ca. 50%), Kapok; – Bastfasern: Flachs, Hanf, Jute, Kenaf, Ramie, Ginster; – Hartfasern: Manila, Alfa, Kokos, Sisal; (b) Tierfasern: – Wolle und Haare: Schafwolle, Alpaka, Lama, Kamel, Kaschmir, Mohair, Angora, Vikunja, Yak, Guanako, Rosshaar; – Seiden: Naturseide (Maulbeerspinner), Tussahseide. Chemiefasern aus natürlichen Polymeren gliedern sich in: (a) Zellulosefasern: – aus regenerierter Zellulose: Viskose, Cupro, Modal, Papier; – aus Zelluloseresten: Acetat, Triacetat; (b) Eiweißfasern: – aus Pflanzeneiweiß: Zein; – aus Tiereiweiß: Kasein. Der Hauptbestandteil aller Pflanzenfasern und der wichtigsten Chemiefasern aus natürlichen Polymeren ist Zellulose, ein Polysaccharid (siehe C 12.5.3). Wollfasern bestehen zu mehr als 80% aus (hygroskopischen) α-Keratinen (Hornsubstanzen in
Papier ist ein aus Pflanzenfasern durch Verfilzen, Verleimen und Pressen hergestellter flächiger Werkstoff. Rohstoffe sind vor allem der durch Schleifen von Holz gewonnene Holzschliff und der durch chemischen Aufschluss von Holz erhaltene Zellstoff. Beide Stoffe haben die Eigenschaft, sich beim Austrocknen aus wässriger Suspension zu verfilzen und dann über die OH-Gruppen der Zellulose durch Wasserstoffbrückenbindungen fest zu verbinden. Füllstoffe (z. B. Kaolin oder Titandioxid) und Leimstoffe (z. B. Harzseifen) verbessern Weißgrad, Oberflächengüte und Flüssigkeitseindringungswiderstand; Zusätze von Kunstharz, Tierleim, Wasserglas und Stärke erhöhen Nassfestigkeit, Härte, Glätte sowie Zug- und Falzfestigkeit. Papier hat i. Allg. Flächengewichte zwischen 7 und 150 (225) g/m2 . Über 225 g/m2 sprechen die europäischen Normen (vgl. DIN 6730) von Pappe. Im deutschen Sprachraum kennt man daneben den Karton (ca. 150 bis 600 g/m2 ). Die Papier- und Pappsorten werden nach dem Hauptanwendungszweck in fünf Hauptgruppen mit unterschiedlichen prozentualen Anteilen an der Produktionsmenge unterteilt: – Graphische Papiere (ca. 45%): Schreib- und Druckpapiere (holzfrei: überwiegend aus Zellstoff gearbeitet; holzhaltig: überwiegend aus Holzschliff gefertigt), Tapetenrohpapiere, Banknotenpapiere, usw., – Papier für Verpackungszwecke (ca. 25%): Packpapier, Pergaminpapier usw.,
D41
D42
D Werkstoffe
– Karton und Pappe für Verpackungszwecke (ca. 18%): Vollpappen, Graukarton, Lederpappen, Handpappen usw., – Hygienepapiere u. ä. (ca. 7%): Zellstoffwatte, Toilettenpapier, Papiertaschentücher usw., – Technische Papiere und Pappen (ca. 5%): Kondensatorpapier, Kohlepapier, Filtrierpapier, Filzpappen, Pressspanpappen, Kofferpappen usw.
5.3 Polymerwerkstoffe: Herstellung Polymerwerkstoffe (Kunststoffe) sind in ihren wesentlichen Bestandteilen organische Stoffe makromolekularer Art. Die Makromoleküle werden aus niedermolekularen Verbindungen (Monomeren) durch die Verfahren Polymerisation, Polykondensation und Polyaddition synthetisch hergestellt (s. C 12.1).
5.4 Polymerwerkstoffe: Aufbau und Eigenschaften Aufbau und Eigenschaften der Polymerwerkstoffe werden primär geprägt durch ihren makromolekularen Aufbau (chemische Bestandteile, Bindungen, Molekülkonfiguration, Kettenlängen, Verzweigungen, Vernetzungen, Copolymere, Kristallisation) und ihre Rezeptur (Polymermischungen, Verstärkungsmittel, Antioxidantien, Weichmacher, Füll- und Farbstoffe). Weitere wichtige Einflussgrößen sind die Herstellungs- und Verarbeitungstechnologien. Der Zusammenhalt der einzelnen, chemisch nicht durch Hauptvalenzbindungen verbundenen Makromoleküle zum kompakten Polymerwerkstoff erfolgt durch physikalische Nebenvalenzbindungen, wie z. B. Van-der-Waals-Bindungen (Dispersionskräfte, Dipol-Dipol-Wechselwirkungen, Induktionskräfte) oder Wasserstoffbrückenbindungen. Die Realisierung eines gewünschten Eigenschaftsprofils von synthetischen Polymeren erfordert die zielgerichtete Synthese von Polymerstrukturen („tailor-made polymers“). Zu diesen Eigenschaften gehören insbesondere das mechanische Verhalten (Festigkeit, Schlagzähigkeit), die Transparenz sowie die Witterungs- und die Oxidationsbeständigkeit. Durch die Modifizierung bekannter Polymere wie z. B. Polystyrol (PS), Poly(methylmethacrylat) (PMMA) und Polyethylen (PE) sowie die Kombination
Bild 5-2. Architektur von Polymerwerkstoffen
von verschiedenen Monomeren können Eigenschaften gezielt verändert werden. Möglichkeiten für diese Modifizierung sind z. B.: – das Mischen von zwei oder mehreren polymeren Komponenten (Polymerblends), – die Copolymerisation zweier oder mehrerer Monomere, – das Einführen von funktionellen Gruppen längs oder an den Enden der Polymerkette, – die Entwicklung neuartiger Polymerstrukturen wie Sterne, kammförmige oder hyperverzweigte Polymere, Zyklen oder Dendrimere. Von einem allgemeinen Standpunkt aus gesehen können diese Möglichkeiten der Modifizierung von Polymerstrukturen durch das Konzept der Polymerheterogenitäten beschrieben werden. Die wesentlichen in Polymeren auftretenden Architekturen sind in Bild 5-2 veranschaulicht (vgl. C 12.2–12.4). Neben der für die Polymereigenschaften in ihren technischen Anwendungen wichtigen Kontrolle der Polymeraufbaureaktionen gewinnt die Analyse (siehe 11.2.2) von Polymerabbauprozessen zunehmend an Bedeutung. Unter ökologischen Gesichtspunkten sind Abbauprozesse hinsichtlich der steigenden Abfallproblematik zu betrachten. Massenkunststoffe sollen nach Gebrauch durch Recycling oder Energiegewinn verwertet werden. In beiden Fällen
5 Organische Stoffe; Polymerwerkstoffe
sind vor allem Kenntnisse über das thermische und enzymatische Abbauverhalten sowie die Struktur der entstehenden Abbauprodukte erforderlich. Die Zusammenhänge zwischen Aufbau und Eigenschaften von Polymerwerkstoffen sind in Bild 5-3 schematisch dargestellt.
5.5 Thermoplaste Thermoplaste sind amorphe oder teilkristalline Polymerwerkstoffe mit kettenförmigen Makromolekülen, die entweder linear oder verzweigt vorliegen und nur durch physikalische Anziehungskräfte (Nebenvalenzkräfte) (thermolabil) verbunden sind. Eine Zusammenstellung technisch wichtiger thermoplastischer Polymerwerkstoffe mit ihren Strukturformeln, allgemeine Kennzeichen und Anwendungsbeispielen gibt Tabelle 5-1. Unterhalb der sog. Glastemperatur T g sind Thermoplaste glasig-hart erstarrt (s. C 5.2.4). Oberhalb von T g sind Thermoplaste im Zustand der unterkühlten Schmelze, bzw. der Schmelze. Bei hinreichend hohen Beanspruchungsfrequenzenz lassen sich die Moleküle durch mechanische Beanspruchungen deformieren, gehen jedoch nach Rückgang der Beanspruchung entropieelastisch in ihre ursprüngliche Form zurück.
Amorphe Thermoplaste (wie PVC, PS, PC) verhalten sich oberhalb von T g thermoelastisch, bei weiterer Erwärmung werden sie weich und plastisch verformbar. Bei teilkristallinen Thermoplasten (wie PE, PP, PA) sind oberhalb von T g die amorphen Bereiche ebenfalls entropieelastisch verformbar. Die kristallinen Anteile bewirken durch ihren festen Zusammenhalt ein zähelastisches Verhalten und Formbeständigkeit. Oberhalb der sog. Kristallitschmelztemperatur T m erfolgt bei allen Thermoplasten der Übergang in die Schmelze (viskoser Fließbereich). Weil eine Verdampfung von Makromolekülen nicht möglich ist, werden bei Überschreiten der Zersetzungstemperatur die Molekülketten aufgelöst. In Bild 5-4 sind die Zustandsbereiche einiger thermoplastischer Werkstoffe in vereinfachter Form zusammengestellt; die höchsten Gebrauchstemperaturen sind werkstoffabhängig und liegen im Bereich von etwa 70 bis 300 ◦ C. Hinsichtlich ihrer Anwendungen werden die thermoplastischen Polymerwerkstoffe in folgende Gruppen eingeteilt (Werkstoffkennwerte siehe 9): – Gebrauchswerkstoffe (Massenkunststoffe) Die hauptsächlichen Massenkunststoffe sind Polyethylen (PE), Polyvinylchlorid (PVC), Polypropylen (PP) und Polystyrol (PS). Sie machen
Bild 5-3. Polymerwerkstoffe: Zusammenhänge
zwischen Moleküleigenschaften und Werkstoffeigenschaften
D43
D44
D Werkstoffe
Tabelle 5-1. Beispiele thermoplastischer Polymerwerkstoffe
5 Organische Stoffe; Polymerwerkstoffe
Bild 5-4. Zustandsbereiche thermoplastischer Polymerwerkstoffe
mehr als 80% der gesamten Kunststoffproduktion aus und werden den verschiedenen Verwendungszwecken häufig durch spezielle Behandlung, wie Weichmachung, Vernetzung, Verstärkung usw., angepasst. – Konstruktionswerkstoffe (techn. Kunststoffe) Als Konstruktionswerkstoff eignen sich vor allem teilkristalline Thermoplaste, wie z. B. Polyamide (PA), Polyoxymethylen (POM), Polyethylenterephthalat (PET) und Polybutylenterephthalat (PBT) sowie die hochtemperaturbeständigen Thermoplaste Polyimid (PI), Polytetrafluorethylen (PTFE), Polyphenylensulfid (PPS) und Polyetherketon (PEK). – Funktionswerkstoffe Thermoplastische Polymerwerkstoffe mit speziellen funktionellen Eigenschaften sind z. B. die für optische Bauteile geeigneten (leichten) transparenten Kunststoffe Polymethylmethacrylat (PMMA) und Polycarbonat (PC), das thermisch und chemisch höchst stabile Polytetrafluorethylen (PTFE), Materialien für Kondensatorfolien (PP, PET) sowie neuere (teure) warmfeste Polymere wie Polyimid (PI) und Polyphenylensulfid (PPS), deren höchste Gebrauchstemperatur bei 260 ◦ C liegt.
5.6 Duroplaste Duroplaste sind harte, glasartige Polymerwerkstoffe, die über chemische Hauptvalenzbindungen räumlich fest vernetzt sind. Die Vernetzung erfolgt beim Mischen von Vorprodukten mit Verzweigungsstellen und wird entweder bei hohen Temperaturen thermisch (Warmaushärten) oder bei Raumtemperatur mit Katalysatoren chemisch aktiviert (Kaltaushärten). Da bei den Duroplasten die Bewegung der eng vernetzten Moleküle stark eingeschränkt ist, durchlaufen sie beim Erwärmen keine ausgeprägten Erweichungsoder Schmelzbereiche, sodass ihr harter Zustand bis zur Zersetzungstemperatur erhalten bleibt. Technisch wichtige Duroplaste sind in Tabelle 5-2 zusammengestellt (Werkstoffkennwerte siehe 9).
5.7 Elastomere Elastomere sind gummielastisch verformbare Polymerwerkstoffe, deren (verknäuelte) Kettenmoleküle weitmaschig und lose durch chemische Bindungen vernetzt sind. Die Elastomervernetzung (sog. Vulkanisierung) findet während der Formgebung unter Mitwirkung von Vernetzungsmitteln (z. B. Schwefel,
D45
D46
D Werkstoffe
Tabelle 5-2. Beispiele duroplastischer Polymerwerkstoffe
Tabelle 5-3. Beispiele elastomerer Polymerwerkstoffe (Vernetzungen nicht dargestellt)
6 Verbundwerkstoffe
Peroxide, Amine) statt. Bei mechanischen Beanspruchungen lassen sich die Kettenmoleküle leicht und reversibel verformen. Durch Füllstoffe (z. B. Ruß, feindisperses SiO2 ) können Elastomere durch die Ausbildung von Sekundarbindungen zwischen den Elastomermolekülen und den Partikeln verstärkt und in ihren mechanischen Eigenschaften modifiziert werden. Bei Elastomeren kann die Glastemperatur so niedrig liegen, dass eine Versprödung erst weit unterhalb der Einsatztemperaturen eintritt. Bei Erwärmung durchlaufen sie keine ausgeprägten Erweichungsoder Schmelzbereiche; ihr gummielastischer Zustand bleibt bis zur Zersetzungstemperatur erhalten. Auch bei Elastomeren kann in manchen Fällen Kristallisation auftreten, insbesondere im hochgereckten Zustand (Dehnungskristallisation). Wichtige Elastomere sind in Tabelle 5-3 zusammengestellt (Werkstoffkennwerte siehe 9). Thermoplastische Elastomere sind physikalisch vernetzte Polymere (z.B. Polyolefine) mit Glastemperaturen unterhalb der Anwendungstemperatur; im Anwendungstemperaturbereich verhalten sie sich wie Elastomere. Sie sind wie thermoplastische Polymere schmelzbar und können daher wie diese verarbeitet werden.
6 Verbundwerkstoffe Ein Verbundwerkstoff besteht aus heterogenen, innig miteinander verbundenen Festkörperkomponenten. In stofflicher Hinsicht werden unterschieden: Metall-Matrix-Composite (MMC), Polymer-MatrixComposite (PMC)- und Keramik-Matrix-Composite (CMC). Eine Einteilung der Verbundwerkstoffe nach ihrem Aufbau zeigt Bild 6-1.
6.1 Teilchenverbundwerkstoffe Teilchenverbundwerkstoffe bestehen aus einem Matrixmaterial, in das Partikel eingelagert sind. Die Abmessungen der Partikel betragen von ca. 1 μm bis zu einigen mm (Volumenanteile bis zu 80%), wobei Matrix und Partikel unterschiedliche funktionelle Aufgaben im Werkstoffverbund übernehmen. Neben Beton (siehe 4.6.3) sind folgende Werkstoffgruppen mit Metall- oder Kunststoffmatrix wichtig: Hartmetalle enthalten 0,8 bis 5 μm große Hartstoffpartikel (z. B. WC, TiC, TaC) in Volumenanteilen
Bild 6-1. Einteilung der Verbundwerkstoffe
bis zu 94%, eingebettet in metallische Bindemittel wie Kobalt, Nickel oder Eisen. Sie werden durch Flüssigphasensintern hergestellt und hauptsächlich für warmfeste Schneidstoffe (Arbeitstemperaturen bis zu 700 ◦ C) oder Umformwerkzeuge verwendet. Cermets (engl.
ceramics + metals) bestehen bis zu 80% Volumenanteil aus einer oxidkeramischen Phase (z. B. Al2 O3 , ZrO2 , Mullit) in metallischer Matrix (z. B. Fe, Cr, Ni, Co, Mo). Sie werden pulvermetallurgisch hergestellt und als Hochtemperaturwerkstoffe, Reaktorwerkstoffe oder verschleißresistentes Material eingesetzt.
Gefüllte Kunststoffe bestehen aus einem Grund-
werkstoff aus Duroplasten (z. B. Phenolharz, Epoxidharze, siehe 5.6) oder Thermoplasten (z. B. PMMA, PP, PA, PI, PTFE, siehe 5.5), in den sehr unterschiedliche Partikel-Füllstoffe, wie beispielsweise Holzmehl, feindispersive Kieselsäure (SiO2 ), Glaskugeln oder Metallpulver eingebettet sind. Die Partikelgrößen reichen von weniger als 1 μm (SiO2 ) bis zu mehreren mm (Glaskugeln) mit Volumenanteilen bis zu 70%. Gefüllte Kunststoffe zeichnen sich durch günstige Herstellungskosten und/oder verbesserte mechanische Eigenschaften aus.
6.2 Faserverbundwerkstoffe Durch die Entwicklung von Faserverbundwerkstoffen werden wenig feste bzw. spröde Matrixwerkstoffe verbessert: (a) Erhöhung der mechanischen Eigenschaften des Matrixmaterials durch Einlagern von Fasern mit hoher Bruchfestigkeit und -dehnung. Dabei soll die Ma-
D47
D48
D Werkstoffe
trix einen geringeren E-Modul aufweisen und sich bei einem Faserbruch zum Abbau von Spannungsspitzen örtlich plastisch verformen können. Beispiele: Glasfaserverstärkte Kunststoffe (GFK), polymerfaserverstärkte Kunststoffe (PFK), karbonfaserverstärkte Kunststoffe (CFK), bestehend aus einer Kunststoffmatrix (hauptsächlich Duroplaste, wie z. B. ungesättigtes Polyesterharz (UP), Epoxidharz (EP), neuerdings auch Thermoplaste) verstärkt durch Glasfasern (5 bis 15 μm Durchmesser), Aramidfasern (aromatische Polyamide) oder Kohlenstoff-(Carbon-)fasern. Aluminiumlegierungen, verstärkt durch Bor- oder Si-Fasern hergestellt durch CVD-Abscheidung (siehe 6.5) von B, SiC auf W- oder C-Fasern. (b) Einlagerung von duktilen Fasern in sprödes Matrixmaterial, wodurch die Rissausbreitung unterbunden und die Sprödigkeit herabgesetzt wird. Beispiele: Si3 N4 -Keramik verstärkt durch SiC-Fasern. Mullit verstärkt durch C-Fasern. Beton verstärkt durch PAFasern („Polymerbeton“). Zur Herstellung von Faserverbundwerkstoffen werden Einzelfasern (Kurzfasern, ungerichtet oder gerichtet, bzw. Langfasern), Faserstränge (Rovings), Fasermatten oder Faservliese verwendet. Durch Orientierung der Fasern kann eine mechanische Anisotropie der Bauteile erzielt und so die Festigkeit den Beanspruchungen angepasst werden. Für die Anwendung von Faserverbundwerkstoffen sind neben den Eigenschaften von Matrix und Fasern besonders deren Zusammenspiel bedeutsam. Es kommt dabei auf die Volumenanteile von Fasern bzw. Matrix und die chemisch-physikalische Verträglichkeit (z. B. Diffusionsverhalten, Ausdehnungskoeffizienten) sowie die Adhäsion zwischen Matrix und Fasern und ihre mögliche Beeinflussung durch eine Oberflächenbehandlung der Fasern an. Eine Abschätzung der elastischen Eigenschaften von Faserverbundwerkstoffen mit einem Volumenanteil ϕF an (Lang-) Fasern ergibt unter idealisierten Bedingungen (parallele Faserausrichtung, linear-elastisches Materialverhalten, gute Matrix-Faser-Haftung) anhand der Bedingungen: Matrixdehnung = Faserdehnung (εM = εF ) in Faserrichtung,Matrixspannung = Faserspannung (σM = σF ) quer zur Faserrichtung für die obere Grenze des Elastizitätsmoduls des Verbundwerkstoffs
EV max = ϕF · EF + (1 − ϕF )EM und für die untere Grenze EV min = 1/(ϕF /EF + (1 − ϕF )/EM ) Bild 6-2 zeigt die Abhängigkeit der elastischen Eigenschaften von Faserverbundwerkstoffen in Abhängigkeit vom Faser-Volumenanteil und illustriert die Anisotropie der Faserverstärkung bezüglich der Beanspruchungsrichtung [1].
6.3 Stahlbeton und Spannbeton Die bedeutendsten Verbundwerkstoffe mit anorganisch-nichtmetallischer Matrix und metallischer Verstärkung sind Stahlbeton und Spannbeton. Sie kombinieren im makroskopischen Maßstab den Verbundwerkstoff Beton (siehe 4.6.3) mit einer Faserverstärkung. Die geringe Zugfestigkeit des Betons wird beim Stahlbeton durch eine sog. Bewehrung mit einem Werkstoff hoher Zugfestigkeit verbessert. Wichtige Voraussetzungen sind eine ähnliche thermische Ausdehnung und gute Haftung beider Komponenten sowie ein ausreichender Korrosionsschutz des Stahls durch das alkalische Milieu im Beton (geringe Chlorionenkonzentration erforderlich) und die Abschirmung von atmosphärischem Sauerstoff. Beim Spannbeton wird eine weitere Verbesserung der mechanischen Eigenschaften dadurch erreicht,
Bild 6-2. Elastische Eigenschaften von Faserverbundwerkstoffen: Einflüsse von Faseranteil und Beanspruchungsrichtung (schematisch vereinfachte Darstellung)
6 Verbundwerkstoffe
dass mittels Spannstählen der Beton in Beanspruchungsrichtung unter Druckspannung gesetzt wird. Hierdurch soll die Wirkung von Zugspannungen unwirksam gemacht und das Auftreten korrosionsbegünstigender Risse vermieden werden. Spannbeton ermöglicht eine gute Ausnutzung der Betonfestigkeit, geringere Querschnitte und einen Druckzustand der fertigen Teile. Zur Ausnutzung der Möglichkeiten des Spannbetons sind sorgfältige Herstellung, Ausgleich des Schwindens durch volumenvergrößernde Zusatzstoffe (z. B. Gips, CaSO4 , als Zusatz zu Portlandzement) und Verhinderung von Korrosionseinflüssen erforderlich.
6.4 Schichtverbundwerkstoffe Schichtverbundwerkstoffe (Laminate) sind flächige Verbunde, bei denen die Herstellung häufig mit der Formgebung verbunden ist. Schichtpressstoffe bestehen aus geschichtetem organischem Trägermaterial (z. B. Papier, Pappe, Zellstoff, Textilien) und einem Bindemittel (z. B. Phenolharz, PF; Melaminharz, MF; Harnstoffharz, UF) und werden durch Pressen unter Erwärmen hergestellt. Beim Laminieren werden zunächst Prepregs (engl. preimpregnated materials) durch Tränken des Trägermaterials mit einem Harz vorfabriziert, die später in den Verfahrensschritten Formgebung, Aushärten, Nachbehandeln weiterverarbeitet werden. Beim Kalandrieren wird Material in einem vorgemischten und vorplastifizierten Rohzustand in einer Walzenanordnung zu Platten- oder Folienbahnen verarbeitet. Einen silikatisch-metallischen Schichtverbundwerkstoff bildet Email mit seiner Unterlage. Er besteht aus einer oxidisch-silikatischen Masse, die unter Mitwirkung von Flussmitteln (z. B. Borax, Soda), in einer oder mehreren Schichten auf einem metallischen Trägerstoff (meist Stahlblech mit C-Anteil π/2 für u > K): ⎫ ⎪ y(x1 ) = y1 , y(x1 + a) = y2 , ⎪ ⎪ ⎪ ⎬ 2 l = b[E(am(bx1 /c + K), k) (2-25) ⎪ ⎪ ⎪ ⎪ −E(am(b(x1 + a)/c2 + K), k)] − a . ⎭
2.5 Coulomb’sche Reibungskräfte 2.5.1 Ruhereibungskräfte
Berührungsflächen zwischen ruhenden Körpern sind Lagerstellen, an denen nicht nur normal zur Fläche eine Lagerreaktion N, sondern auch tangential eine Lagerreaktion H, eine sog. Haftkraft oder Ruhereibungskraft auftreten kann (Bild 2-29a, b). Beide Komponenten stehen mit den übrigen Kräften im Gleichgewicht. Im Fall statischer Bestimmtheit werden sie aus Gleichgewichtsbedingungen berechnet. Das Lager hält stand, d. h., die Körper gleiten nicht aufeinander, wenn (2-26) H/N μ0 = tan 0 ist, d. h., wenn die aus H und N resultierende Lagerreaktion innerhalb des Reibungskegels mit dem halben Öffnungswinkel 0 um die Flächennormale liegt (Bild 2-29b). 0 heißt Ruhereibungswinkel. Die Ruhereibungszahl μ0 hängt von vielen Parametern ab, z. B. von der Werkstoffpaarung und der Oberflächenbeschaffenheit, aber in weiten Grenzen weder von der Größe der Berührungsfläche noch von N. Reibungszahlen sind tribologische Systemkenngrößen. Sie müssen experimentell bestimmt werden, siehe D 10.6.1 und D 11.7.3. Die Ruhereibungszahl
ist im Allg. etwas größer als die Gleitreibungszahl bei derselben Werkstoffpaarung. Beispiel 2-12: In der Klemmvorrichtung von Bild 2-30a verursacht eine Zugkraft F im Fall der Ruhereibung Lagerreaktionen H1 , H2 , N1 und N2 am Keil (Bild 2-30b). Gleichgewicht verlangt H1 = H2 cos α + N2 sin α und N1 = N2 cos α − H2 sin α, also H1 (H2 /N2 ) cos α + sin α . = N1 cos α − (H2 /N2 ) sin α Der Keil haftet an beiden Flächen, wenn H1 /N1 tan 01 und H2 /N2 tan 02 ist. Die erste Bedingung liefert tan α
tan 01 − H2 /N2 1 + tan 01 (H2 /N2 )
und die zweite tan 01 − tan 02 tan 01 − H2 /N2 1 + tan 01 (H2 /N2 ) 1 + tan 01 tan 02 = tan( 01 − 02 ) . Also ist α 01 − 02 unabhängig von μ03 eine hinreichende Bedingung für das Funktionieren der Vorrichtung. Die Ruhereibungskräfte sind statisch unbestimmt. 2.5.2 Gleitreibungskräfte
Wenn trockene Berührungsflächen zweier Körper beschleunigt oder unbeschleunigt aufeinander gleiten, dann üben die Körper aufeinander Gleitreibungskräfte tangential zur Berührungsfläche aus, siehe D 10.6.1. Gleitreibungskräfte sind eingeprägte Kräfte. An jedem Körper ist die Kraft der Relativgeschwindigkeit dieses Körpers entgegengerichtet und vom Betrag μN = tan · N. Darin ist N die Anpress-
Bild 2-29. a Eingeprägte Kräfte an einem Körper auf rau-
er Unterlage. b Wenn die Resultierende aus Normalkraft N und Ruhereibungskraft H wie gezeichnet innerhalb des Ruhereibungskegels liegt, herrscht Gleichgewicht. Eine Resultierende außerhalb des Kegels ist unmöglich
Bild 2-30. a Klemmvorrichtung. b Der freigeschnittene Keil
2 Statik starrer Körper
kraft der Körper normal zur Berührungsfläche, μ die Gleitreibungszahl und der Gleitreibungswinkel (Bild 2-31a, b). Eine Umkehrung der Relativgeschwindigkeit wird formal durch Änderung des Vorzeichens von μ berücksichtigt. μ ist wie μ0 eine tribologische Systemkenngröße, die von vielen Parametern abhängt, z. B. von der Werkstoffpaarung und der Oberflächenbeschaffenheit, aber in weiten Grenzen weder von der Größe der Berührungsfläche noch von N. Vom Betrag vrel der Relativgeschwindigkeit ist μ nur wenig abhängig (Messergebnisse siehe in [6]). Eine schwache Abhängigkeit nach Bild 2-32 kann zu Ruckgleiten (stick-slip) führen und selbsterregte Schwingungen verursachen, z. B. das Rattern bei Drehmaschinen oder das Kreischen von Bremsen (vgl. Bild 4-15 und [7]). Tabelle 2-5 gibt Gleitreibungszahlen für technisch trockene Oberflächen in Luft an. Messungen unter genormten Bedingungen (siehe D 10.6.1 und D 11.7.3) liefern die Näherungswerte der Spalten 2 und 3. Bei trockenen Oberflächen mit technisch üblichen, geringen Verunreinigungen liegen Gleitreibungszahlen in den Wertebereichen der Spalten 4 und 5. Bei Schmierung von Oberflächen ist μ wesentlich kleiner, z. B. μ ≈ 0, 1 bei Stahl/Stahl und Stahl/Polyamid, μ ≈ 0, 02 . . . 0, 2 bei Stahl/ Grauguss, μ ≈ 0, 02 . . .0, 1 bei Metall/Holz und μ ≈ 0, 05 . . . 0, 15 bei Holz/Holz.
Für die Paarung Stahl/Eis (trocken) ist μ ≈ 0, 0015. Ruhereibungszahlen μ0 sind i. Allg. ca. 10% größer als die entsprechenden Gleitreibungszahlen. Beispiel 2-13: Um eine Schraube mit Trapezgewinde nach Bild 2-33 unter einer Last F unbeschleunigt in Bewegung zu halten, muss man das Moment M = Frm tan(α ± ) aufbringen (+ bei Vorschub gegen F und − bei Vorschub mit F;
Gleitreibungswinkel, α Gewindesteigungswinkel). Bei Spitzgewinde mit dem Spitzenwinkel β tritt = arctan[ μ/ cos(β/2)] an die Stelle von
= arctan μ. Bei Befestigungsschrauben muss α < sein. Reibung an Seilen und Treibriemen. In einem biegeschlaffen Seil, das nach Bild 2-34a in der gezeichneten Richtung über eine Trommel gleitet, besteht zwischen den Seilkräften S1 am Einlauf und S2 am Auslauf die Beziehung S2 = S1 exp( μα). Sie gilt auch für nicht kreisförmige Trommelquerschnitte (Bild 2-34b). Bei haftendem Seil ist S2 S1 exp( μ0 α). Ein laufender Treibriemen hat in einem Bereich β α des Umschlingungswinkels α wegen Änderung seiner Dehnung längs des Umfangs Schlupf. Auf dem Restbogen α − β haftet er. Bei Volllast ist β = α. Dann ist S2 − m v2 = (S1 − m v2 ) exp( μα), wobei die Massenbelegung m = Masse/Länge und die
Bild 2-33. In den Gleichgewichtsbedingungen für die Bild 2-31. a Relativ zueinander bewegte Körper. b Freikör-
perbild mit Gleitreibungskräften
Bild 2-32. Die dargestellte Abhängigkeit der Gleitreibungszahl μ von der Relativgeschwindigkeit vrel kann Ruckgleiten (stick-slip) verursachen
Schraube unter der Kraft F und dem Moment M spielen Normalkräfte und Gleitreibungskräfte an den Gewindeflanken eine Rolle
Bild 2-34. Für kreiszylindrische (Bild a) und nicht kreis-
zylindrische Seiltrommeln (Bild b) gilt S 2 = S 1 exp(μα), wenn das Seil in Pfeilrichtung auf den Trommeln gleitet
E31
E32
E Technische Mechanik / Mechanik fester Körper
Tabelle 2-5. Gleitreibungszahlen μ bei Festkörperreibung. Spalten 2 und 3 für technisch trockene Oberflächen in Luft (Messwerte nach [5] und [6]). Spalten 4 und 5 für technisch übliche, geringe Verunreinigungen (Wertebereiche sind Anhaltspunkte). Paarung mit jeweils gleichem Werkstoff (Spalten 2 und 4), mit Stahl 0,13% C; 3,4% Ni (Spalte 3) und mit Stahl (Spalte 5)
Werkstoff gleicher Werkst. Aluminium Blei Chrom Eisen Kupfer Nickel Silber Gusseisen Stahl (austenitisch) Stahl (0,13% C; 3,4% Ni) Werkzeugstahl Konstantan (54% Cu; 45% Ni) Lagermetall (Pb-Basis) Lagermetall (Sn-Basis) Messing (70% Cu; 30% Zn) Phosphorbronze Gummi (Polyurethan) Gummi (Isopren) Polyamid (Nylon) Polyethylen (PE-HD) Polymethylmethacrylat (PMMA, ,Plexiglas‘) Polypropylen (PP) Polystyrol (PS) Polyvinylchlorid (PVC) Polytetrafluorethylen (PTFE, ,Teflon‘) Al2 O3 -Keramik Diamant Saphir Titankarbid Wolframkarbid ∗
1,3 1,5 0,4 1,0 1,3 0,7 1,4 0,4 1,0 0,8 0,4
1,2 0,4
0,12 0,4 0,1 0,2 0,15 0,15
trocken Stahl 0,13% C, 3,4% Ni 0,5 1,2 0,5 0,8 0,5 0,5 0,4 0,8
0,4 0,5 0,8 0,5 0,3 ⎫ 1,6 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 3−10 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0,4 ⎪ ⎪ ⎪ ⎪ ⎪ 0,08 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬∗ ) 0,5 ⎪ ⎪ ⎪ ⎪ ⎪ 0,3 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0,5 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0,5 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 0,05 ⎭ 0,7
gleicher Werkst.
verunreinigt Stahl
0,95 · · · 1,3 0,5 · · · 1,2
0,6 · · · 1,3 0,4 · · · 0,7 0,2 · · · 0,4
0,25 · · · 0,8
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
0,1 · · · 0,15 0,4 · · · 1,0
0,2 · · · 0,5
0,3 · · · 0,45
0,04 · · · 0,22
) niedrige Gleitgeschwindigkeit
Riemengeschwindigkeit v den Fliehkrafteinfluss berücksichtigen. (S1 + S2 )/2 = Sv ist die Kraft, mit der der ruhende Riemen gleichmäßig vorgespannt
wird. Zur Erzeugung eines geforderten Reibmoments M = r(S2 − S1 ) = r(S1 − m v2 )(exp( μα) − 1)
3 Kinetik starrer Körper
muss man Sv passend wählen. Bei Keilriemen mit dem Keilwinkel γ tritt μ/sin(γ/2) an die Stelle von μ.
2.6 Stabilität von Gleichgewichtslagen Zur Definition der Stabilität siehe 3.7. Bei einem konservativen System (siehe 2.1.14) hat die potenzielle Energie V des Systems in jeder Gleichgewichtslage einen stationären Wert. Das Gleichgewicht ist stabil bei Minima und instabil bei Maxima und Sattelpunkten. Bei einem System mit n Freiheitsgraden und mit n Koordinaten q1 , . . . , qn ist V eine Funktion von q1 , . . . , qn . Ein Minimum liegt vor, wenn die symmetrische (n × n)-Matrix aller zweiten partiellen Ableitungen ∂2 V/∂qi∂q j in der Gleichgewichtslage n positive Hauptminoren hat. Beispiel 2-14: Der Körper in Bild 2-35 mit daranhängendem Pendel kann mit seiner zylindrischen Unterseite auf dem Boden rollen. Unter welchen Bedingungen ist die Gleichgewichtslage ϕ1 = ϕ2 = 0 stabil? Lösung: Die potenzielle Energie ist V(ϕ1 , ϕ2 ) = −m1 ga cos ϕ1 − m2 g[b cos ϕ1 + l cos(ϕ1 + ϕ2 )] . Die Matrix der zweiten partiellen Ableitungen an der Stelle ϕ1 = ϕ2 = 0 ist m1 ga + m2 g(b + l) m2 gl . m2 gl m2 gl Ihre Hauptminoren – das Element (1,1) und die Determinante – sind positiv, wenn l > 0 (hängendes Pendel) und m1 a + m2 b > 0 ist. a < 0 bedeutet, dass S1 oberhalb von M liegt und b < 0, dass der Pendelaufhängepunkt oberhalb von M liegt.
Bild 2-35. Ein Rollpendel (Masse m1 , Schwerpunkt S 1 , Kreismittelpunkt M) mit daranhängendem Pendel (m2 , l) hat die stabile oder instabile Gleichgewichtslage ϕ1 = ϕ2 = 0
In der Statik spricht man von einer indifferenten Gleichgewichtslage, wenn es in jeder beliebig kleinen Umgebung der Lage Lagen mit gleicher potenzieller Energie, aber keine Lagen mit kleinerer potenzieller Energie gibt. Ein Beispiel ist eine Punktmasse in den tiefsten Lagen einer horizontal liegenden Zylinderschale. Indifferente Gleichgewichtslagen sind als instabil zu bezeichnen, wenn man als Störungen nicht nur Auslenkungen, sondern auch Anfangsgeschwindigkeiten berücksichtigt (siehe 3.7).
3 Kinetik starrer Körper 3.1 Grundlagen 3.1.1 Inertialsystem und absolute Beschleunigung
In der klassischen (nichtrelativistischen) Mechanik wird die Existenz von Bezugskoordinatensystemen vorausgesetzt, die sich ohne Beschleunigung bewegen. Sie heißen Inertialsysteme (vgl. B 2.3). Jedes Koordinatensystem, das sich relativ zu einem Inertialsystem rein translatorisch mit konstanter Geschwindigkeit bewegt, ist selbst ein Inertialsystem. Geschwindigkeiten und Beschleunigungen relativ zu einem Inertialsystem heißen absolute Geschwindigkeiten bzw. Beschleunigungen. Punkte und Koordinatensysteme, die im Inertialsystem fest sind, heißen auch raumfest. Erdfeste Bezugssysteme sind wegen der Erddrehung beschleunigt, allerdings so wenig, dass man sie beim Studium vieler Bewegungsvorgänge als Inertialsysteme ansehen kann. 3.1.2 Impuls
Für ein Massenelement dm mit der absoluten Geschwindigkeit v ist der Impuls oder die Bewegungsgröße p definiert als p = v dm. Ein starrer oder nichtstarrer Körper (Masse m, absolute Schwerpunktsge. schwindigkeit vS ) hat den Impuls p = v dm = vS m, und für ein System aus n Körpern ist " n vSi mi = vS mges (3-1) p= v dm = i=1
(mges Masse und vS Schwerpunktsgeschwindigkeit des Gesamtsystems).
E33
E34
E Technische Mechanik / Mechanik fester Körper
3.1.3 Newton’sche Axiome
Für einen rein translatorisch bewegten starren Körper der konstanten Masse m gilt das 2. Newton’sche Axiom (3-2) ma = F (a = ¨r absolute Beschleunigung, F resultierende äußere Kraft). Als Beispiele siehe den freien Fall und den schiefen Wurf in B 2.1. Aus dem 2. und 3. Newton’schen Axiom (siehe B 3.2 und B 3.3) folgt für beliebige Systeme mit konstanter Masse für beliebige Bewegungen (auch bei Überlagerung von Drehbewegungen) die Verallgemeinerung von (3-2) mges aS = Fres (3-3) (mges Masse des Gesamtsystems, aS = ¨rS absolute Beschleunigung des Systemschwerpunkts S , Fres Resultierende aller äußeren Kräfte). (3-2) und (3-3) liefern in Verbindung mit dem Schnittprinzip (siehe 2.1.12) Differenzialgleichungen der Bewegung und Ausdrücke für Zwangskräfte. Beispiel 3-1: Das Federpendel in Bild 3-1a hat im statischen Gleichgewicht die Länge l. Für die Verlängerung x und den Winkel ϕ sollen zwei Bewegungsgleichungen aufgestellt werden. Man schneidet die Punktmasse frei (Bild 3-1b). Die Federkraft ist A = −(mg + kx)er . In (3-2) ist F = A + mg und nach (1-7)
Beispiel 3-2: Auf das Zweikörpersystem mit Feder auf reibungsfreier schiefer Ebene (Bild 3-2a) wirkt in x-Richtung die äußere Kraft (m1 + m2 )g sin α. Nach (3-3) bewegt sich der Gesamtschwerpunkt S mit der konstanten Beschleunigung x¨S = g sin α. Für die freigeschnittenen Körper in Bild 3-2b mit der Federkraft k(x2 − x1 − l0 ) lautet (3-2) m1 x¨1 = m1 g sin α + k(x2 − x1 − l0 ) , m2 x¨2 = m2 g sin α − k(x2 − x1 − l0 ) . Multiplikation der ersten Gleichung mit m2 , der zweiten mit m1 und Subtraktion liefern m1 m2 ( x¨2 − x¨1 ) = −(m1 + m2 )k(x2 − x1 − l0 ) oder mit der Federverlängerung z = x2 −x1 −l0 und mit ω20 = k(m1 + m2 )/(m1 m2 ) die Schwingungsgleichung z¨ + ω20 z = 0 mit der Lösung z = A cos(ω0 t − ϕ). Beispiel 3-3: Die Beschleunigungen der Massen m1 und m2 in Bild 3-3a und die Normalkräfte N1 und N2 in den beiden reibungsbehafteten Berührungsflächen werden an den freigeschnittenen Körpern in Bild 3-3b ermittelt. (3-2) liefert m1 x¨1 = −N1 sin α + μ1 N1 cos α , m1 y¨ 1 = N1 cos α + μ1 N1 sin α − m1 g ,
˙ ϕ. a = [ x¨ − (l + x)ϕ˙ 2 ]er + [(l + x)ϕ¨ + 2 x˙ϕ]e Zerlegung von (3-2) in die Richtungen er , eϕ liefert die gesuchten Gleichungen x¨ − (l + x)ϕ˙ 2 + (k/m)x + g(1 − cos ϕ) = 0 , (l + x)ϕ¨ + 2 x˙ϕ˙ + g sin ϕ = 0 .
Bild 3-2. a Zweikörpersystem auf reibungsfreier schiefer
Ebene; b Freikörperbild. l0 ist die Länge der ungespannten Feder
Bild 3-3. a Zweikörpersystem. b Freikörperbild. Die geBild 3-1. Federpendel (a) mit Freikörperbild (b)
zeichneten Gleitreibungskräfte setzen voraus, dass sich Körper 1 nach unten und Körper 2 nach rechts bewegt
3 Kinetik starrer Körper
m2 x¨2 = N1 sin α − μ1 N1 cos α − μ2 N2 , m2 y¨ 2 = −N1 cos α − μ1 N1 sin α + N2 − m2 g = 0 . Die Relativbeschleunigung ( x¨1 − x¨2 , y¨ 1 ) hat die Richtung der schiefen Ebene, sodass y¨1 = ( x¨1 − x¨2 ) tan α ist. Das sind fünf Gleichungen für die Unbekannten x¨1 , x¨2 , y¨1 , N1 und N2 . 3.1.4 Impulssatz. Impulserhaltungssatz
Integration von (3-3) über t in den Grenzen von t0 bis t liefert den Impulssatz "t Fres dt . (3-4) mges [vS (t) − vS (t0 )] = t0
Wenn Fres explizit als Funktion von t bekannt ist, ist das Integral berechenbar. Es liefert Größe und Richtung der Schwerpunktsgeschwindigkeit vS (t). Wenn die resultierende äußere Kraft Fres am System insbesondere identisch null ist oder eine identisch verschwindende Komponente in einer Richtung e hat, dann ist die Geschwindigkeit vS (t) bzw. die entsprechende Komponente von vS (t) konstant, d. h. mit (3-1) n n vSi mi = const bzw. e · vSi mi = const . i=1
i=1
(3-5)
Das ist der Impulserhaltungssatz. Beispiel 3-4: Wenn in Bild 3-3a μ2 = 0 ist, dann ist Fres und damit aS vertikal gerichtet. Wenn das System aus der Ruhe heraus losgelassen wird, bewegt sich sein Gesamtschwerpunkt S also vertikal nach unten (m1 x˙1 + m2 x˙2 = 0 und m1 x1 + m2 x2 = const). 3.1.5 Kinetik der Punktmasse im beschleunigten Bezugssystem
tierenden System treten die gezeichneten Zentrifugal- und Corioliskräfte auf. Nur die Zentrifugalkraft hat ein Moment um B. b Kräfte und Hebelarme im Fall ϕ 1. Das Gewicht wird vernachlässigt
mω2 Zentrifugalkraft oder Fliehkraft und −2mω × vrel Corioliskraft. Beispiel 3-5: Das Fadenpendel in Bild 3-4a (Masse m, Länge l, Aufhängepunkt B) bewegt sich relativ zu der mit ω = const um A rotierenden Scheibe in der Schei˙ = 0, ω · = 0. Die Fliehbenebene. aA = 0, ω kraft mω2 und die Corioliskraft sind eingezeichnet. Die erstere hat im Fall ϕ 1 den Betrag mω2 (R + l) und die in Bild 3-4b angegebenen Koordinaten. Wenn man das Gewicht vernachlässigt, stellt in (3-6) F die ¨ Fadenkraft dar. arel hat die Umfangskoordinate lϕ. Gleichheit der Momente beider Seiten von (3-6) bezüglich B bedeutet ml2 ϕ¨ = mω2 [−(R + l)lϕ + l2 ϕ] oder ϕ¨ + ω20 ϕ = 0 mit der Pendeleigenkreisfrequenz √ ω0 = ω R/l. 3.1.6 Trägheitsmomente. Trägheitstensor
Relativ zu einem beschleunigt bewegten Bezugssystem bewegt sich eine Punktmasse m unter dem Einfluss einer Kraft F mit einer Beschleunigung arel . Mit (3-2) und (1-35b) gilt ˙ × − mω × (ω × ) marel = F + [−maA − mω − 2mω × vrel ] .
Bild 3-4. a Rotierende Scheibe mit Pendel bei B. Im ro-
(3-6)
Die Ausdrücke in Klammern heißen Trägheitskräfte. Insbesondere heißt −mω × (ω × ) = −m(ω · )ω +
Für einen starren Körper sind bezüglich jeder körperfesten Basis e mit beliebigem Ursprung A (Bild 3-5) axiale Trägheitsmomente JiiA und Deviationsmomente (auch zentrifugales Trägheitsmoment) JiAj definiert (siehe auch B 7-2): " " JiiA = (x2j + x2k ) dm , JiAj = − xi x j dm (3-7) m
(i, j, k = 1, 2, 3 verschieden)
m
E35
E36
E Technische Mechanik / Mechanik fester Körper
Der Trägheitsradius i eines Körpers bezüglich einer körperfesten Achse ist durch die Gleichung J = mi2 definiert (m Masse des Körpers, J axiales Trägheitsmoment des Körpers bezüglich der Achse). Bild 3-5. Größen zur Erklärung des Begriffs Trägheitsmo-
ment
(Koordinaten x1 , x2 , x3 von dm in e, Integrationen über die gesamte Masse). x2j + x2k ist das Abstandsquadrat des Massenelements von der Achse ei . Zwischen diesen Trägheitsmomenten und den Trägheitsmomenten bezüglich einer zu e parallelen Basis im Schwerpunkt S (im Bild 3-5 gestrichelt) bestehen die Beziehungen von Huygens und Steiner JiiA = JiiS + (x2S j + x2Sk )m,
JiAj = JiSj − xSi xS j m (3-8)
(i, j, k = 1, 2, 3 verschieden) . Darin sind xS1 , xS2 und xS3 die Koordinaten von S in e. Die axialen und die zentrifugalen Trägheitsmomente bezüglich der Basis e in A bilden die symmetrische Trägheitsmatrix ⎤ ⎡ A A A ⎥ ⎢⎢⎢ J11 J12 J13 ⎥⎥⎥ ⎢ A A A ⎥ (3-9) J A = ⎢⎢⎢⎢⎢ J12 J22 J23 ⎥⎥⎥⎥ . ⎣ A A A ⎦ J13 J23 J33 Sie ist die Koordinatenmatrix des Trägheitstensors J A in der Basis e. Für einen beliebigen Bezugspunkt A (der Index A wird im Folgenden weggelassen) gelten die Ungleichungen Jii + J j j Jkk ,
Jii 2|J jk | ,
Jii J j j Ji2j
(i, j, k = 1, 2, 3 verschieden) .
Hauptachsen. Hauptträgheitsmomente. Für jeden Bezugspunkt A gibt es ein Hauptachsensystem, in dem die Trägheitsmatrix nur Diagonalelemente, die sog. Hauptträgheitsmomente J1 , J2 und J3 hat. Wenn die Trägheitsmatrix J für eine Basis e mit dem Ursprung A bekannt ist, ergeben sich die Hauptträgheitsmomente Ji und die Einheitsvektoren ni (i = 1, 2, 3) in Richtung der Hauptachsen als Eigenwerte bzw. Eigenvektoren des Eigenwertproblems (J − Ji E)ni = 0. Bei einem homogenen Körper ist jede Symmetrieachse eine Hauptträgheitsachse. 3.1.7 Drall
Der Drall L0 (auch Drehimpuls oder Impulsmoment) eines beliebigen Systems bezüglich eines raumfesten Punktes 0 ist das resultierende Moment der Bewegungsgrößen v dm seiner Massenelemente bezüglich 0, " r × v dm . (3-11) L0 = m
Für eine Punktmasse m am Ortsvektor r ist L0 = r × vm. Für einen starren Körper mit der Masse m und dem Trägheitstensor J A bezüglich eines beliebigen körperfesten Punktes A ist (Bild 3-6) L0 = J A · ω + (rA × vS + S × vA )m
(3-12)
(ω absolute Winkelgeschwindigkeit, vA = ˙rA und vS = ˙rS absolute Geschwindigkeiten von A bzw. des −−→ Schwerpunkts S , S = AS ). Sonderfälle: Wenn es
Zwischen den Trägheitsmatrizen J 1 und J 2 bezüglich zweier gegeneinander gedrehter Basen e1 und e2 mit demselben Ursprung A besteht die Beziehung J 2 = A J 1 AT .
(3-10)
Darin ist A die Koordinatentransformationsmatrix aus der Beziehung e2 = A e1 (vgl.1.2.1). Tabelle 3-1 gibt Trägheitsmomente für massive Körper und für dünne Schalen an.
Bild 3-6. Kinematische Größen, die bei allgemeiner räumlicher Bewegung den Drall L0 eines Körpers bezüglich des raumfesten Punktes 0 bestimmen; siehe (3-12)
3 Kinetik starrer Körper
einen raumfesten Körperpunkt gibt, dann wählt man ihn als Punkt A und als Punkt 0, sodass L0 = J 0 · ω ist. Wenn A = S gewählt wird, dann ist bei beliebiger Bewegung L0 = J S · ω + rS × vS m. In einer Basis e, in der J A und ω die Koordinatenmatrizen J A bzw. ω haben, hat J A · ω die Koordinatenmatrix J A ω und speziell im Hauptachsensystem die Koordinaten (J1A ω1 , J2A ω2 , J3A ω3 ). Bei n Freiheitsgraden der Rotation (n = 1, 2 oder 3) kann ω durch n Winkelkoordinaten und deren Ableitungen ausgedrückt werden (siehe (1-27a), (1-28a)). 3.1.8 Drallsatz (Axiom von Euler)
Der Drallsatz sagt aus: Für jedes System ist die Zeitableitung des Dralls L0 im Inertialraum gleich dem resultierenden Moment aller am System angreifenden äußeren Kräfte bezüglich desselben Punktes 0, dL0 = M0 . (3-13) dt Für eine Punktmasse m am Ortsvektor r lautet der Satz d(r × vm) = r × am = M0 mit a = v˙ = ¨r . dt (3-14) Jeder sich nicht rein translatorisch bewegende starre Körper ist ein Kreisel. Für ihn entsteht aus (3-13), (3-12) und (1-5) JA · ω ˙ + ω × J A · ω + S × a A m = M A
(3-15)
(aA = r¨ A absolute Beschleunigung von A; siehe Bild 3-6). Die Gleichung wird z. B. auf ein Pendel angewendet, dessen Aufhängepunkt A eine vorgegebene Beschleunigung aA (t) hat. Im Sonderfall aA = 0 und bei beliebigen Bewegungen im Fall A = S lautet (3-15): ˙ + ω × J A · ω = MA . JA · ω
Beispiel 3-6: Wenn Bild 3-7a ein Pendel mit dem Gewicht mg am Schwerpunkt S und mit der Gleichgewichtslage ϕ = 0 darstellt, ist M3A = −mgl sin ϕ. Für Schwingungen im Bereich ϕ 1 (sinϕ ≈ ϕ) hat (3-17) A angenähert die Form ϕ¨ + ω20 ϕ = 0 mit ω20 = mgl/J33 und die Lösung ϕ(t) = ϕmax cos(ω0 t − α) mit Integrationskonstanten ϕmax und α. Die Periodendauer ist ⎞1/2 ⎛ S ⎜⎜ J + ml2 ⎟⎟⎟ ⎟⎠ T = 2π/ω0 = 2π ⎜⎜⎝ 33 . mgl S Für einen gegebenen Körper mit m und J33 ist T ma S ximal, wenn A die Entfernung J33 /m von S hat.
Auswuchten
Für Bild 3-7a und b liefert (3-16) in körperfesten e1 und e2 -Richtungen die Koordinatengleichungen A A 2 M1A = J13 ϕ¨ − J23 ϕ˙ ,
A A 2 M2A = J23 ϕ¨ + J13 ϕ˙ .
Diese Momente müssen von Lagerreaktionen auf den Körper ausgeübt werden, damit er seine ebene Bewegung ausführen kann. Die Gegenkräfte wirken auf die Lager. Im Fall ϕ˙ = const sind die Kräfte in der körperfesten Basis konstant, im raumfesten System also mit ϕ˙ umlaufend. Wegen immer vorhandener Elastizitäten erregen sie SchwingunA A = J23 = 0 sein, e3 also gen. Deshalb soll J13 Hauptachse bezüglich A sein. Kleine Abweichungen der Hauptachse werden durch dynamisches Auswuchten korrigiert, indem man an geeigneten Stellen des Körpers Massen hinzufügt oder wegnimmt. Zur Theorie des Auswuchtens siehe [1, 2]. In Bild 3-7a verursacht die sog. statische Unwucht ml
(3-16)
Drehung um eine feste Achse. Ebene Bewegung. In Bild 3-7a und b ist ω = ϕe ˙ 3 bei konstanter Richtung von e3 . Die e3 -Koordinate von (3-16) lautet in beiden Fällen A J33 ϕ¨ = M3A .
(3-17)
Das ist eine Differenzialgleichung für ϕ(t), wenn M3A bekannt ist.
Bild 3-7. a Ebene Bewegung um einen festen Punkt.
b Ebene Bewegung ohne festen Punkt. In beiden Fällen ist ω = ϕe ˙ 3
E37
E38
E Technische Mechanik / Mechanik fester Körper
Tabelle 3-1. Massen und Trägheitsmomente homogener, massiver Körper und dünner Schalen. Dünne Schalen haben die konstante Wanddicke t r. Sie haben an den Enden (z. B. bei Zylindern und Kegeln) keine Deckel
zusätzlich umlaufende Lagerreaktionen. Das Fachgebiet Rotordynamik untersucht die Bewegung des Gesamtsystems Rotor–Lager–Fundament unter Berücksichtigung von Elastizität und Trägheit aller Teile [3, 4], vgl. Beispiel 3-11 in 3.2.3.
3.1.9 Drallerhaltungssatz
Wenn in (3-13) M0 oder eine raumfeste Komponente von M0 dauernd null ist, dann ist L0 bzw. die entsprechende Komponente von L0 konstant.
3 Kinetik starrer Körper
Beispiel 3-7: Die Bewegung einer Punktmasse unter einer resultierenden Kraft beliebiger Größe, deren Wirkungslinie dauernd durch einen raumfesten Punkt 0 weist (sog. Zentralkraft; Beispiele sind die Gravitationskraft und die Kraft einer Feder, die die Punktmasse mit einem festen Punkt 0 verbindet). In (3-14) ist M0 ≡ 0, r × vm = const. Daraus folgt, dass die Bewegung in der durch Anfangsbedingungen r0 und v0 festgelegten Ebene abläuft, und dass r in gleichen Zeitintervallen gleich große Flächen überstreicht (1. und 2. Kepler’sches Gesetz). Beispiel 3-8: Das Gewicht eines räumlichen Pendels hat um die Vertikale durch den Aufhängepunkt A kein Moment. Folglich ist die Vertikalkomponente des Dralls J A · ω konstant. 3.1.10 Kinetische Energie
Die kinetische Energie T (auch Ekin , Ek ) eines beliebigen Systems der Gesamtmasse m ist definiert als " 1 v2 dm (3-18) T= 2 m
(v = r˙ absolute Geschwindigkeit von dm). Für einen starren Körper ist T=
1 2 1 mvS + J1 ω21 + J2 ω22 + J3 ω23 2 2
(3-19)
(m Masse, vS Schwerpunktgeschwindigkeit, Trägheitsmomente und Winkelgeschwindigkeitskomponenten im Hauptachsensystem bezüglich S ). Wenn es einen körperfesten Punkt A gibt, der auch raumfest ist, dann gilt auch T=
1 J1 ω21 + J2 ω22 + J3 ω23 2
(3-20)
Das ist der Energieerhaltungssatz. Bei einem konservativen System mit einem Freiheitsgrad kann man mit ihm berechnen, mit welcher Geschwindigkeit das System eine gegebene Lage passiert, wenn man die Geschwindigkeit in einer anderen Lage kennt. Beispiel 3-9: Bei der antriebslosen und reibungsfreien Hebebühne in Bild 3-8 mit vier gleichen Stangen (Länge l, Masse m, zentrales Trägheitsmoment J S , Feder entspannt bei ϕ = ϕ0 ) und mit der Masse M ist 1 2 1 1 S 2 1 2 2 T = 4J ϕ˙ + 4m x˙ + 2 m˙y + m(3˙y) 2 2 2 2 1 + M(4˙y)2 2 5m m2 2 2 S 2 2 + 2M l cos ϕ , = ϕ˙ 2J + l sin ϕ + 2 2 1 V = 2(mgy + mg · 3y) + Mg · 4y + k(2x − 2x0 )2 2 1 = 2(2m + M)gl sin ϕ + kl2 (cos ϕ − cos ϕ0 )2 . 2 Zu gegebenen ϕ1 und ϕ˙ 1 in einer Lage 1 lässt sich ϕ˙ 2 in einer anderen gegebenen Lage 2 aus T 2 + V2 = T 1 + V1 berechnen. 3.1.12 Arbeitssatz
Die Begriffe Arbeit und Leistung sind in 2.1.13 erklärt. Für Systeme, in denen sowohl Potenzialkräfte als auch Nichtpotenzialkräfte wirken, gilt statt (3-21) der Arbeitssatz T 2 + V2 = T 1 + V1 + W12 .
Darin sind T 1 , T 2 und V1 , V2 die kinetischen bzw. die potenziellen Energien des Systems in zwei Zuständen 1 und 2 einer Bewegung und W12 die Arbeit aller
(Trägheitsmomente und Winkelgeschwindigkeitskomponenten im Hauptachsensystem bezüglich A). 3.1.11 Energieerhaltungssatz
Zu den Begriffen Potenzialkraft, potenzielle Energie und konservatives System siehe 2.1.14. In einem konservativen System ist die Summe aus kinetischer Energie T und potenzieller Energie V konstant, T + V = const .
(3-21)
(3-22)
Bild 3-8. Ein-Freiheitsgrad-System
E39
E40
E Technische Mechanik / Mechanik fester Körper
Nichtpotenzialkräfte bei der Bewegung vom Zustand 1 in den Zustand 2. Jede Nichtpotenzialkraft. F leistet zu W12 den in (2.1.13) erklärten Beitrag F · dr. Ein Moment der Größe M leistet . bei einer Drehung um den Winkel ϕ den Beitrag Mdϕ. Die Integrale lassen sich i. Allg. selbst dann nicht exakt angeben, wenn die Bahnform und die Anfangs- und Endpunkte 1 bzw. 2 der Bahn bekannt sind, weil F und M nicht nur vom Ort, sondern z. B. von der Geschwindigkeit abhängen. Eine Ausnahme: Auf einer schiefen Ebene (Neigungswinkel α) wirkt an einem Körper der Masse m die Coulomb’sche Reibungskraft μmg cos α = const entgegen dem Wegelement ds, sodass "s2 W12 = −μmg cos α
◦
|ds|
J A · ω + Ω × J A · ω = MA .
s1
ist. Das Integral ist s2 − s1 , wenn der Weg von s1 nach s2 ohne Richtungsumkehr zurückgelegt wird. Bei einer gekrümmten Bahn ist die Reibkraft über die Fliehkraft vom Geschwindigkeitsquadrat abhängig. Wenn man (3-22) nur zu Abschätzungen von Geschwindigkeitsverläufen braucht, genügt eine Näherung für W12 .
3.2 Kreiselmechanik Viele technische Gebilde können als einzelner starrer Körper, d. h. als Kreisel, angesehen werden. Wenn er drei Freiheitsgrade der Rotation hat, wird (3-16) im Hauptachsensystem bezüglich A zerlegt (der Index A wird im Folgenden weggelassen). Das ergibt die Euler’schen Kreiselgleichungen ˙ i − (J j − Jk )ω j ωk = Mi Ji ω
ω j = ωk ≡ 0; i, j, k = 1, 2, 3 verschieden). Nur die Drehungen um die Achsen des größten und des kleinsten Hauptträgheitsmoments sind stabil. Ein Kreisel mit zwei gleichen Hauptträgheitsmomenten J1 = J2 heißt symmetrisch. Bei ihm liegen ω, J A · ω und die Figurenachse (Symmetrieachse) immer in einer Ebene (Bild 3-9a). Die Figurenachse denkt man sich in einem masselosen Käfig gelagert (Bild 3-9b). Seine absolute Winkelgeschwindigkeit Ω beschreibt Drehbewegungen der Figurenachse, wobei der Kreisel sich relativ zum Käfig drehen kann. Wegen der Symmetrie hat J A auch in einer käfigfesten Basis konstante Trägheitsmomente. Deshalb gilt nicht nur (3-16), sondern allgemeiner
(3-23)
(3-24)
A ist entweder der Schwerpunkt oder, falls vorhanden, ein Punkt der Figurenachse mit ◦ ≡ 0. ω ist die der Beschleunigung aA Ableitung von ω in der käfigfesten Basis. Wenn die Bewegung des symmetrischen Kreisels (d. h. ω und Ω) vorgeschrieben ist, wird aus (3-24) das Moment MA berechnet, das zur Erzeugung der Bewegung nötig ist. Bei gegebenem Moment ist (3-24) eine Differenzialgleichung der gesuchten Bewegung. Beispiel 3-10: In der Kollermühle in Bild 3-10 legen die Antriebswinkelgeschwindigkeit ω0 und die angenommene Lage des Abrollpunktes P die Bewegung −→ fest, denn ω hat die Richtung der Momentanachse AP und die schiefwinklige Komponente ω0 . Als Käfig für die Figurenachse wird die gezeichnete Basis e mit der Winkelgeschwindigkeit Ω = ω0 gewählt. In ihr ist ω
(i, j, k = 1, 2, 3 zyklisch vertauschbar) . Für die Translationsbewegung gilt (3-2). Die äußere Kraft und das äußere Moment sind i. Allg. von Ort, Translationsgeschwindigkeit, Winkellage und Winkelgeschwindigkeit abhängig, sodass (3-2) und (3-23) miteinander und mit kinematischen Differenzialgleichungen (z. B. (1-27b), (1-28b) oder (1-29b)) gekoppelt sind. Zur Lösung von (3-23) in speziellen Fällen siehe [15]. Beim momentenfreien Kreisel (M1 = M2 = M3 ≡ 0) existieren als spezielle Lösungen permanente Drehungen um die Hauptträgheitsachsen (ωi = const,
Bild 3-9. a Bei einem symmetrischen Kreisel liegen die Figurenachse e3 , die Winkelgeschwindigkeit ω und der Drall J A ·ω in einer Ebene. b Kreisel in einem gedachten Bezugssystem (Käfig) mit anderer Winkelgeschwindigkeit Ω.
3 Kinetik starrer Körper
und mit ν = ω30 (J1 − J3 )/J1 . Die Figurenachse umfährt mit einer konstanten Nutationswinkelgeschwindigkeit ψ˙ einen Kreiskegel (Nutationskegel) vom halben Öffnungswinkel ϑ, dessen Achse der raumfeste Drallvektor L = J S · ω ist (Bild 3-11). Bild 3-10. Kollermühle ◦
konstant, also ω ≡ 0. Das Moment MA ist die Summe aus dem Gewichtsmoment −mgRS e1 und dem Moment Me1 der Anpresskraft gegen die Lauffläche. Das Bild liefert Ω = ω0 sin α e2 + ω0 cos α e3 , ω = ω0 sin α e2 + ω0 (cos α + R/r) e3 , J A · ω = J1A ω0 sin α e2 + J3A ω0 (cos α + R/r) e3 . Einsetzen in (3-24) ergibt M = mgRS + ω20 sin α[(J3A − J1A ) cos α + J3A R/r] . Bei geeigneter Parameterwahl kann man erreichen, dass die Anpresskraft M/R wesentlich größer als das Gewicht ist.
L2 = J12C 2 + J32 ω230 , cos ϑ = J3 ω30 /L , ω30 J3 (≈ ω30 J3 /J1 für ϑ 1) . ψ˙ = J1 cos ϑ (3-26) 3.2.3 Linearisierte Kreiselgleichungen
Bei vielen symmetrischen Kreiseln macht die Figurenachse nur kleine Winkelausschläge ϕ1 und ϕ2 um raumfeste Achsen. Typische Beispiele sind Rotoren mit elastischer Lagerung (Bild 3-12a) und in Kardanrahmen gelagerte Kreisel in Messgeräten (Bild 3-13). Bei stationärem Betrieb ist das Moment M3 entlang der Figurenachse Null, sodass wegen (3-23) ω3 konstant ist. In der raumfesten Basis e0 von Bild 3-12a hat der Drall J A · ω angenähert die Komponenten (J1 ϕ˙ 1 + J3 ω3 ϕ2 , J1 ϕ˙ 2 − J3 ω3 ϕ1 ,
3.2.1 Reguläre Präzession
Bewegungen des symmetrischen Kreisels, bei denen die Figurenachse sich mit Ω = const dreht, während MA und LA = J A · ω dem Betrag nach konstant und dauernd orthogonal zueinander sind, heißen reguläre ◦ Präzessionen. Für sie ist in (3-24) ω = 0, also Ω × J A · ω = MA .
(3-25)
Bild 3-11. Nutation eines symmetrischen Kreisels
Ω heißt Präzessionswinkelgeschwindigkeit. Die Bewegung in Bild 3-10 ist eine reguläre Präzession. Literatur siehe [5, 15]. 3.2.2 Nutation
Die Bewegung, die ein symmetrischer Kreisel ausführt, wenn er im Schwerpunkt unterstützt oder frei fliegend keinem äußeren Moment unterliegt, heißt Nutation. In diesem Fall hat (3-23) mit J1 = J2 J3 (bezüglich S) und mit MS = 0 die Lösung ω1 = C cos νt, ω2 = C sin νt, ω3 ≡≡ ω30 = const mit Konstanten C und ω30 aus Anfangsbedingungen
Bild 3-12. a Scheibe auf rotierender, elastischer Welle.
b Freikörperbild der Welle
E41
E42
E Technische Mechanik / Mechanik fester Körper
Bild 3-13. Symmetrischer Kreisel in Kardanrahmen (i innen, a außen). Bei kleinen Drehwinkeln ϕ1 und ϕ2 der Rahmen um ihre Achsen ist ϕ2 angenähert auch Drehwinkel des Innenrahmens um die Achse e02
J3 ω3 ). In Bild 3-13 hat der Gesamtdrall von Rotor, Außenrahmen (oberer Index a) und Innenrahmen (oberer Index i) in e0 angenähert die Komponenten [(J1 + J1a + J1i )ϕ˙ 1 + J3 ω3 ϕ2 , (J1 + J2i )ϕ˙ 2 − J3 ω3 ϕ1 , J3 ω3 ] . Diese Näherungen sind umso besser, je größer die dritte gegen die beiden anderen Komponenten ist. Direkte Anwendung von (3-13) liefert für ϕ1 und ϕ2 die linearisierten Kreiselgleichungen J1 ϕ¨ 1 + J3 ω3 ϕ˙ 2 = M1 ,
J1 ϕ¨ 2 − J3 ω3 ϕ˙ 1 = M2 (3-27a)
bzw. (J1 + J1a + J1i )ϕ¨ 1 + J3 ω3 ϕ˙ 2 = M1 , (J1 + J2i )ϕ¨ 2 − J3 ω3 ϕ˙ 1 = M2 .
' (3-27b)
1 m x¨1 = − (bx1 − cϕ2 ) , N 1 m x¨2 = − (bx2 + cϕ1 ) , N 1 J1 ϕ¨ 1 + J3 ω3 ϕ˙ 2 = − (aϕ1 + cx2 ) , N 1 J1 ϕ¨ 2 − J3 ω3 ϕ˙ 1 = − (aϕ2 − cx1 ) . N Das sind homogene lineare Differenzialgleichungen für x1 , x2 , ϕ1 und ϕ2 . Mit den komplexen Variablen z1 = x1 + jx2 , z2 = ϕ1 − jϕ2 werden sie paarweise zusammengefasst zu Nm¨z1 + bz1 − cz2 = 0 , N J1 z¨2 − jN J3 ω3 z˙2 + az2 − cz1 = 0 . Der Ansatz zi = Zi exp(jω0 t) für i = 1, 2 liefert eine charakteristische Gleichung für die Eigenkreisfrequenzen ω0 . Kleinste Exzentrizitäten des Schwerpunkts verursachen eine periodische Erregung mit der Kreisfrequenz ω3 , sodass Resonanz im Fall ω0 = ω3 eintritt. In diesem Fall lautet die charakteristische Gleichung −Nmω23 + b −c =0. det −c N(J3 − J1 )ω23 + a Sie liefert die kritischen Winkelgeschwindigkeiten ω3 des Rotors (eine im Fall J3 > J1 , zwei im Fall J3 < J1 ). Wellen mit mehreren Scheiben siehe in [5, 14]. 3.2.4 Präzessionsgleichungen
Beispiel 3-11: Rotor auf beliebig gelagerter elastischer Welle, z. B. nach Bild 3-12a. Die Festigkeitslehre liefert für die freigeschnittene Welle in Bild 3-12b Einflusszahlen a, b, c für den Zusammenhang zwischen den Kräften und Momenten F1 , F2 , M1 und M2 an der Welle bei S einerseits und den Auslenkungen und Neigungen x1 , x2 , ϕ1 und ϕ2 bei S andererseits: x1 = aF1 + cM2 , x2 = aF2 − cM1 , ϕ1 = −cF2 + bM1 , ϕ2 = cF1 + bM2 . Daraus folgt 1 1 F1 = (bx1 − cϕ2 ) , F2 = (bx2 + cϕ1 ) , N N 1 1 M1 = (aϕ1 + cx2 ) , M2 = (aϕ2 − cx1 ) N N mit N = ab − c2 . Da am Rotor −F1 , −F2 , −M1 und −M2 angreifen, lauten die Newton’sche Gleichung (3-2) und der Drallsatz (3-27a) für ihn
Gleichungen (3-25) und (3-26) zeigen, dass bei Kreiseln mit großem J3 ω3 die Präzessionswinkelgeschwindigkeit und die Nutationsfrequenz um viele Größenordnungen voneinander verschieden sind, wenn das Moment M A hinreichend klein ist. In solchen Fällen ist die Lösung von linearisierten Kreiselgleichungen (3-27a) oder (3-27b) in guter Näherung die Summe zweier Bewegungen. Die eine ist eine i. Allg. vernachlässigbare, sehr schnelle Nutation mit sehr kleinen Amplituden von ϕ1 und ϕ2 . Sie ist Lösung der Gleichungen für M1 = M2 ≡ 0. Die andere, technisch wichtigere Bewegung ist die Lösung der sog. technischen Kreiselgleichungen oder Präzessionsgleichungen J3 ω3 ϕ˙ 2 = M1 ,
−J3 ω3 ϕ˙ 1 = M2 ,
(3-28)
3 Kinetik starrer Körper
in denen die Trägheitsglieder mit ϕ¨ 1 und ϕ¨ 2 von (3-27a) und (3-27b) vernachlässigbar sind. Diese Bewegung ist ein langsames Auswandern (eine Präzession) der Figurenachse. In Bild 3-13 können M1 und M2 z. B. durch ein Gewicht am Außenrahmen oder durch Federn und Dämpfer zwischen Rahmen und Lagerung verursacht werden. Gleichung (3-28) beschreibt daher die Wirkungsweise vieler Kreiselgeräte.
3.3 Bewegungsgleichungen für holonome Mehrkörpersysteme Für ein System mit f Freiheitsgraden werden f generalisierte Lagekoordinaten q1 , . . . , q f gebraucht. Es kann nützlich sein, ν überzählige Koordinaten zu verwenden, also q1 , . . . , q f +ν . Dann gibt es ν Bindungsgleichungen der Form (1-36). Aus ihnen folgen die linearen Beziehungen (1-37) und (1-38) für die generalisierten Geschwindigkeiten q˙ i , Beschleunigungen q¨ i und virtuellen Änderungen δqi (i = 1, . . . , f + ν). Man kommt mit f Differenzialgleichungen der Bewegung aus, wenn überzählige Koordinaten entweder gar nicht verwendet oder mithilfe von (1-36) und (137) wieder eliminiert werden. Die Ableitungen von überzähligen Koordinaten lassen sich immer eliminieren. Die Koordinaten selbst nur dann, wenn (136) explizit nach ν Koordinaten auflösbar ist (siehe Beispiel 3-12). Zur Formulierung von Differenzialgleichungen und Bindungsgleichungen werden drei Methoden angegeben. 3.3.1 Synthetische Methode
Alle Körper werden durch Schnitte isoliert. An den Schnittstellen werden paarweise entgegengesetzt gleich große Schnittkräfte eingezeichnet (eingeprägte Kräfte und unbekannte Zwangskräfte). Mit passend gewählten Koordinaten werden das Newton’sche Gesetz (3-2) für jeden translatorisch bewegten Körper und eine geeignete Form des Drallsatzes für jeden sich drehenden Körper formuliert. Wenn dabei ν überzählige Koordinaten verwendet werden, werden am nicht geschnittenen System ν Bindungsgleichungen (1-36) und deren Ableitungen (1-37) formuliert. Beispiel 3-12: Das System in Bild 3-14a. Bild 3-14b zeigt die freigeschnittenen Körper. Für sie lie-
Bild 3-14. a Zwei-Freiheitsgrad-System mit Koordinaten x und ϕ. b Freikörperbilder. Im Fall F = 0 ist x = ϕ = 0 die Gleichgewichtslage
fern (3-2) und (3-17) mit den Koordinaten x, ϕ, xS und yS (davon sind zwei überzählig) die Gleichungen m1 x¨ =
B − m2 g sin α − kx ,
m2 x¨S = −B + m2 g sin α + F cos α , m2 y¨ S = A + m2 g cos α − F sin α , J S ϕ¨ = l[A sin(ϕ + α) + B cos(ϕ + α)] . Aus Bild 3-14a werden die Bindungsgleichungen und deren Ableitungen gewonnen ' xS = x + l sin(ϕ + α) , (3-29) yS = l cos(ϕ + α) , ' x¨S = x¨ + lϕ¨ cos(ϕ + α) − lϕ˙ 2 sin(ϕ + α) , (3-30) y¨ S = −lϕ¨ sin(ϕ + α) − lϕ˙ 2 cos(ϕ + α) . Die Zwangskräfte A und B werden eliminiert (durch Addition der ersten und zweiten Bewegungsgleichung und durch Einsetzen der zweiten und dritten in die vierte). Dann werden mit (3-30) x¨S und y¨S eliminiert. Das liefert für x und ϕ die Bewegungsgleichungen ⎡ ⎤ ⎢⎢⎢ m1 + m2 m2 l cos(ϕ + α) ⎥⎥⎥ x¨ ⎢⎢⎣ ⎥⎥⎦ ϕ¨ J S + m2 l2 m2 l cos(ϕ + α) 2 F cos α kx − m2 lϕ˙ sin(ϕ + α) (3-31) = + 0 m2 gl sin ϕ − Fl cos ϕ
E43
E44
E Technische Mechanik / Mechanik fester Körper
und für die Zwangskräfte die Ausdrücke A = −m2 [lϕ¨ sin(ϕ + α) + lϕ˙ 2 cos(ϕ + α) + g cos α] + F sin α ,
Die einzige nichtkonservative eingeprägte Kraft ist F. Bei einer virtuellen Verschiebung δxS , δyS ist ihre virtuelle Arbeit δW = F(δxS cos α − δyS sin α) oder mit (3-29)
B = m1 x¨ + kx + m2 g sin α . Statt (3-31) kann man bei dieser Methode irgendeine Linearkombination der Gleichungen (3-31) erhalten, sodass die Koeffizientenmatrix vor den höchsten Ableitungen nicht automatisch symmetrisch wird. 3.3.2 Lagrange’sche Gleichung
Bewegungsgleichungen für ein System mit f Freiheitsgraden und mit Koordinaten q1 , . . . , q f +ν (darunter ν überzählige) entstehen durch Auswertung der Lagrange’schen Gleichung ν d ∂L ∂ fi ∂L = Qk + λi (3-32) − dt ∂q˙ k ∂qk ∂qk i=1 (k = 1, . . . , f + ν) . Die sog. Lagrange’sche Funktion L = T − V ist die Differenz aus der kinetischen Energie T und der potenziellen Energie V des Systems. Die fi sind die Funktionen in den Bindungsgleichungen (1-36), und λi sind unbekannte Lagrange’sche Multiplikatoren (Funktionen der Zeit). Zur Berechnung der nichtkonservativen generalisierten Kräfte Qk siehe 2.1.15. Gleichung (3-32) und die Bindungsgleichungen reichen zur Bestimmung der Unbekannten q1 , . . . , q f +ν und λ1 . . . λν aus. Beispiel 3-13: In Bild 3-14a ist 1 T= m1 x˙2 + m2 x˙2S + y˙ 2S + J S ϕ˙ 2 , 2 2 1 1 V = k x + (m1 + m2 )g sin α 2 k − m1 gx sin α − m2 g(xS sin α + yS cos α) . Die überzähligen Koordinaten xS und yS werden mithilfe der Bindungsgleichungen (3-29) und ihrer ersten Ableitung eliminiert. Das liefert ⎫ 1 1 ⎪ ⎪ T = (m1 + m2 ) x˙2 + (J S + m2 l2 )ϕ˙ 2 ⎪ ⎪ ⎪ ⎪ 2 2 ⎪ ⎬ +m2 l x˙ϕ˙ cos(ϕ + α) , (3-33) ⎪ ⎪ ⎪ ⎪ ⎪ 1 2 ⎪ ⎪ ⎭ V = kx − m2 gl cos ϕ + const . 2
δW = F[(δx + lδϕ cos(ϕ + α)) cos α − (−lδϕ sin(ϕ + α)) sin α] = F(cos α δx + l cos ϕ δϕ) . Daraus folgt Q1 = F cos α für q1 = x und Q2 = Fl cos ϕ für q2 = ϕ. Damit und mit (3-33) und mit f = 2, ν = 0 liefert (3-32) wieder die Gleichung (3-31). Die Koeffizientenmatrix der höchsten Ableitungen in den Bewegungsgleichungen wird bei dieser Methode immer symmetrisch. 3.3.3 D’Alembert‘sches Prinzip
Die allgemeine Form des d’Alembert‘schen Prinzips für beliebige Systeme lautet in der Lagrange’schen Fassung " (3-34) δr · (¨rdm − F) = 0 (r Ortsvektor, r¨ absolute Beschleunigung und δr virtuelle Verschiebung des Massenelements dm; F resultierende eingeprägte Kraft an dm; Integration über die gesamte Systemmasse). Zwangskräfte leisten zu (3-34) keinen Beitrag (siehe 2.1.10). Für ein System aus n starren Körpern lautet das Prinzip n
[δri · (mi r¨ i − Fi )
i=1
˙ i + ωi × J Si · ωi − MSi )] = 0 (3-35) + δπi · (J Si · ω (mi Masse, J Si auf den Schwerpunkt bezogener Trägheitstensor, ri Schwerpunktortsvektor, ωi absolute Winkelgeschwindigkeit, δri virtuelle Schwerpunktsverschiebung, δπi virtuelle Drehung (siehe 1.5), Fi resultierende eingeprägte Kraft und MSi resultierendes eingeprägtes Moment um den Schwerpunkt; alles für Körper i). Im Sonderfall der ebenen Bewegung lautet die Gleichung n δri · (mi ¨ri − Fi ) + δϕi JiS ϕ¨ i − MiS = 0 (3-36) i=1
3 Kinetik starrer Körper
(JiS Trägheitsmoment um die Achse durch den Schwerpunkt und normal zur Bewegungsebene, MiS Moment und ϕi absoluter Drehwinkel um dieselbe Achse). Gleichung (3-35) lautet in Matrixschreibweise ∗
δr · (m r¨ − F) + δπ · (J · ω ˙ −M )=0 T
T
(3-37)
∗
(δr, ¨r, F, δπ, ω ˙ und M Spaltenmatrizen mit je n Vektoren δri bzw. r¨ i usw. bis M∗i = MSi − ωi × J Si · ωi (i = 1, . . . , n); m und J Diagonalmatrizen der Massen bzw. Trägheitstensoren; T kennzeichnet die transponierte Matrix). Beispiel 3-14: In Bild 3-14a ist ¨r1 = x¨e x , δr1 = δxe x , ϕ¨ 1 = 0, δϕ1 = 0, ϕ¨ 2 = ϕ, ¨ δϕ2 = δϕ und mit (3-30)
wobei a1 und a2 von q und b1 , b2 von q und q˙ abhängen. Als Beispiel siehe (1-46) und (1-47) für beliebige offene Gliederketten. Mit (3-38) liefert (3-37) die Gleichung δqT (A q¨ − B) = 0 mit
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ∗ T T B = a1 · (F − m b1 ) + a2 · (M − J · b2 ) . ⎭ (3-39b)
A = aT1 · m a1 + aT2 · J · a2 ,
Wenn q keine überzähligen Koordinaten enthält, folgen daraus die Bewegungsgleichungen A q¨ = B .
r¨ 2 = [ x¨ + lϕ¨ cos(ϕ + α) − lϕ˙ 2 sin(ϕ + α)]ex + [−lϕ¨ sin(ϕ + α) − lϕ˙ 2 cos(ϕ + α)]ey δr2 = [δx + lδϕ cos(ϕ + α)]ex − lδϕ sin(ϕ + α)ey . Die eingeprägte Kraft F1 an Körper 1 ist die Resultierende aus m1 g und der Federkraft [−kx − (m1 + m2 )g sin α]e x . Sie hat die x-Komponente F1x = −(kx+ m2 g sin α) (nur diese interessiert hier); an Körper 2 ist F2 = (m2 g sin α + F cos α)e x + (m2 g cos α − F sin α)ey . Substitution aller Ausdrücke in (3-35) ergibt δx[(m1 + m2 ) x¨ + m2 lϕ¨ cos(ϕ + α) − m2 lϕ˙ 2 sin(ϕ + α) + kx − F cos α] +δϕ[m2 l x¨ cos(ϕ + α) + (J S + m2 l2 )ϕ¨ + m2 gl sin ϕ − Fl cos ϕ] = 0 . Da δx und δϕ voneinander unabhängig beliebig sind, sind beide Klammerausdrücke null. Das sind wieder die Bewegungsgleichungen (3-31). Die Koeffizientenmatrix der höchsten Ableitungen wird bei diesem Verfahren immer symmetrisch. Bei komplizierten Systemen wird (3-37) verwendet. Nach Wahl von generalisierten Koordinaten q = [q1 . . . q f +ν ]T (ohne oder mit ν überzähligen Koordinaten) liefert die Kinematik Beziehungen der Form ⎫ ⎪ r¨ = a1 q¨ + b1 , δr = a1 δq , ⎪ ⎬ (3-38) ⎪ ⎪ ω ˙ = a q¨ + b , δπ = a δq , ⎭ 2
2
2
(3-39a)
(3-40)
Diese Formulierung ist leicht programmierbar. Bevor die Produkte gebildet werden, müssen alle Vektoren und Tensoren mithilfe der Matrizen Ai von (1-44) und mithilfe von (1-12) in ein gemeinsames Koordinatensystem transformiert werden. Wenn in (3-38) ν Koordinaten überzählig sind, werden ν Bindungsgleichungen (1-36) und deren Ableitungen (1-37) gebildet. Diese Ableitungen sind lineare Beziehungen. Sie werden nach ν von den f + ν Größen q˙ i bzw. δqi und q¨ i aufgelöst. Damit entstehen Beziehungen der Form q˙ = J ∗ q˙ ∗,
δq = J ∗ δq∗,
q¨ = J ∗ q¨ ∗ + h∗
mit der Spaltenmatrix q∗ = [q1 . . . q f ]T der f unabhängigen Koordinaten, mit einer (( f + ν) × f )-Matrix J ∗ und einer (( f +ν)×1)-Matrix h∗ . Einsetzen in (3-39) liefert die f Bewegungsgleichungen (J ∗T A J ∗ )¨q∗ = J ∗T (B − A h∗ ) . Weitere Einzelheiten siehe in [15].
3.4 Stöße 3.4.1 Vereinfachende Annahmen über Stoßvorgänge
Bei einem Stoß wirken an der Stoßstelle und in Lagern und Gelenken eines Systems kurzzeitig große Kräfte. Idealisierend wird vorausgesetzt, . daß der endlich große Kraftstoß Fˆ = F(t) dt
E45
E46
E Technische Mechanik / Mechanik fester Körper
einer solchen Kraft während einer infinitesimal kurzen Stoßdauer Δt → 0 ausgeübt wird. Das bedeutet eine unendlich große Kraft F. Dennoch wird vorausgesetzt, dass sich die Körper sowie Führungen in (reibungsfrei vorausgesetzten) Lagern und Gelenken starr verhalten. Endlich große Kräfte (z. B. Gewichtskräfte, Federkräfte, Zentrifugalkräfte) haben keinen Einfluss auf den Stoßvorgang, weil ihr Kraftstoß in der Zeitspanne Δt → 0 gleich null ist. Eine Coulomb’sche Reibungskraft R = μN hat nur dann Einfluss, wenn N selbst einen endlichen Kraftstoß Nˆ bewirkt. Dann ˆ Während wirkt auch ein Reibkraftstoß Rˆ = μN. der Stoßdauer ist die Lage der Körper konstant, und ihre Geschwindigkeiten machen endlich große Sprünge. In einer kleinen Umgebung der Stoßstelle (nicht in Lagern und Gelenken) wird während der Stoßdauer mit einer Kompressionsphase und einer Dekompressionsphase des Werkstoffs gerechnet. Durch die Einführung der sog. Stoßzahl e als Verhältnis des Kraftstoßes in der Dekompressionsphase zu dem in der Kompressionsphase werden vollelastische Stöße (e = 1), vollplastische Stöße (e = 0) und teilplastische Stöße (0 < e < 1) unterschieden. 3.4.2 Stöße an Mehrkörpersystemen
.
ˆ = F dt an der Stoßstelle und die Der Kraftstoß F durch ihn verursachten Geschwindigkeitssprünge werden wie folgt berechnet. Man formuliert zunächst Bewegungsgleichungen des Gesamtsystems für stetige Bewegungen mit Kräften F und −F an den Stoßpunkten beider Körper. Sie haben bei f Freiheitsgraden und f generalisierten Koordinaten die Form A¨q = Q + . . . (siehe 3.3). Die generalisierten Kräfte Q berücksichtigen nur die Kräfte F und −F an den beiden zusammenstoßenden Körperpunkten. Alle anderen Kräfte sind endlich groß und in der Gleichung oben durch drei Punkte angedeutet. Integration über die unendlich kurze Stoßdauer liefert ˆ . AΔ˙q = Q
Fall I: Bei Stößen ohne Reibung an der Stoßstelle hat F die bekannte Richtung der Stoßnormale en (Einheitsvektor normal zur Berührungsebene ˆ = Fe ˆ n ist und nur eine im Stoßpunkt), sodass F Gleichung für den Betrag Fˆ fehlt. Sie lautet (c1 − c2 ) · en = −e(v1 − v2 ) · en .
(3-42)
Darin sind vi und ci = vi + Δvi (i = 1, 2) die Geschwindigkeiten der zusammenstoßenden Körperpunkte vor bzw. nach dem Stoß. Sie sind durch q˙ und q˙ + Δ˙q vor bzw. nach dem Stoß ausdrückbar. Einzelheiten siehe in [15]. Fall II: Die zusammenstoßenden Körperpunkte haben unmittelbar nach dem Zusammenstoß gleiche Geschwindigkeiten, c1 −c2 = 0. Das liefert die fehlenden skalaren Gleichungen. Beispiel 3-15: Auf das zu Beginn ruhende, reibungsfreie Zweikörpersystem in Bild 3-15 trifft eine Punktmasse m mit der Geschwindigkeit v in vollelastischem Stoß (Fall I mit e = 1). Bewegungsgleichungen für stetige Bewegungen unter einer horizontal durch S gerichteten Kraft F werden aus (3-31) übernommen. Bei Beachtung von ϕ = 0 ergibt sich (3-41) in der Form der ersten beiden Zeilen der Gleichung ⎡ ⎢⎢⎢ m1 + m2 m2 l cos α ⎢⎢⎢⎢ ⎢⎢⎢ m2 l cos α J S + m2 l2 ⎢⎣ 0 0
⎤ 0 ⎥⎥⎥ ⎡⎢⎢ Δ x˙ ⎤⎥⎥ ⎡⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ Δϕ˙ ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢⎢ ⎦ ⎣ ⎦⎥ ⎣ − m Δv
⎤ Fˆ cos α ⎥⎥⎥ ⎥⎥⎥ ˆ Fl ⎥⎥⎥ . ⎦ Fˆ
Die dritte Zeile beschreibt den Stoß auf die Punktmasse. Gleichung (3-42) lautet Δ x˙ cos α + lΔϕ˙ − (v + Δv) = v . Das sind insgesamt vier Gleichungen für Δ x˙, Δϕ, ˙ Δv ˆ und F.
(3-41)
Das sind f Gleichungen für f + 3 Unbekannte, nämˆ enthaltene lich für Δq˙ 1 , . . . , Δq˙ f und für drei in Q ˆ Komponenten von F. Die drei fehlenden Gleichungen werden wie folgt formuliert.
Bild 3-15. Stoß einer Masse gegen ein Zweikörpersystem
3 Kinetik starrer Körper
3.4.3 Der schiefe exzentrische Stoß
Beim Stoß zweier Körper nach Bild 3-16 bei ebener Bewegung lauten die integrierten Bewegungsgleichungen ' ˆ 1, ˆ 2, Δ˙r2 = F/m Δ˙r1 = − F/m ˆ S , Δω2 = 2 × F/J ˆ S . (3-43) Δω1 = −1 × F/J 1 2 Die Geschwindigkeiten der Stoßpunkte vor und nach dem Stoß sind ' vi = ˙ri + ωi × i (i = 1, 2) . (3-44) ci = ˙ri + Δ˙ri + (ωi + Δωi ) × i Im Fall I liefert Substitution in (3-42) die Gleichung S ˆ F{1/m 1 + 1/m2 + [(1 × en ) × 1 /J1
+ (2 × en ) × 2 /J2S ] · en } = (1 + e)(v1 − v2 ) · en . Mit ihrer Lösung für Fˆ erhält man aus (3-43) Δ˙ri und Δωi (i = 1, 2). 3.4.4 Gerader zentraler Stoß
Der Stoß zweier rein translatorisch bewegter Körper heißt gerade, wenn ihre Geschwindigkeiten v1 und v2 die Richtung der Stoßnormale haben (Bild 3-17). Er
heißt zentral, wenn die Schwerpunkte auf der Stoßnormale liegen. Die Geschwindigkeiten c1 und c2 unmittelbar nach dem Stoß und der Kraftstoß Fˆ an m2 (alles positiv in positiver x-Richtung) sowie der Verlust ΔT an kinetischer Energie sind. ⎫ m2 ⎪ (1 + e)(v1 − v2 ) , ⎪ c1 = v1 − ⎪ ⎪ ⎪ m1 + m2 ⎪ ⎪ ⎪ ⎪ m1 ⎪ ⎪ c2 = v2 + (1 + e)(v1 − v2 ) , ⎪ ⎪ ⎪ ⎪ m1 + m2 ⎬ (3-45) ⎪ m m ⎪ 1 2 ⎪ ⎪ (1 + e)(v1 − v2 ) , Fˆ = ⎪ ⎪ ⎪ m1 + m2 ⎪ ⎪ ⎪ ⎪ ⎪ 1 m1 m2 ⎪ 2 2 ⎪ ΔT = (1 − e )(v1 − v2 ) . ⎪ ⎭ 2 m1 + m2 Zur Messung der Stoßzahl e lässt man den einen Körper in geradem, zentralem Stoß aus einer Höhe h auf den anderen, unbeweglich gelagerten Körper fallen. Aus der Rücksprunghöhe h∗ ergibt sich e2 = h∗ /h. 3.4.5 Gerader Stoß gegen ein Pendel
In Bild 3-18 seien v2 und c2 die Geschwindigkeiten des Punktes P vor bzw. nach dem Stoß, sodass ϕ˙ = v2 /l und ϕ˙ + Δϕ˙ = c2 /l die Winkelgeschwindigkeiten des Pendels vor bzw. nach dem Stoß sind. Für c1 , c2 , Fˆ und ΔT gilt auch hier (3-45), wenn man überall m2 durch J A /l2 ersetzt. Der Kraftstoß im Lager ist ˆ 2 llS /J A − 1). Das Lager ist stoßfrei bei der Aˆ = F(m Abstimmung m2 llS = J A = J S + m2 l2S . Dann heißt A Stoßmittelpunkt. Um diesen Punkt als Pol dreht sich der Körper unmittelbar nach dem Stoß auch dann, wenn das Lager fehlt. Zur Messung hoher Geschwindigkeiten v1 lässt man m1 vollplastisch in ein ruhendes Pendel einschlagen. Der maximale Pendelwinkel ϕmax nach dem Stoß wird gemessen. Er liefert v1 = 2 sin(ϕmax /2)[(1 + J A /(m1 l2 ))
Bild 3-16. Stoß zweier Körper bei allgemeiner ebener Be-
× (l + lS m2 /m1 )g]1/2 .
wegung
Bild 3-17. Gerader zentraler Stoß
Bild 3-18. Stoß gegen ein Pendel
E47
E48
E Technische Mechanik / Mechanik fester Körper
3.5 Körper mit veränderlicher Masse Die Bilder 3-19a und b zeigen starre Körper, die aus einem unveränderlichen starren Träger und einer ebenfalls starren, aber veränderlichen Teilmasse bestehen. Die Gesamtmasse ist m(t). Der Punkt A ist auf dem Träger an beliebiger Stelle fest. Der Ortsvektor S des Gesamtschwerpunkts und der Trägheitstensor J A des gesamten Körpers bezüglich A sind variabel. Bewegungsgleichungen werden für den Punkt A des Trägers und für die Rotation des Trägers angegeben. Sei P der Punkt, an dem Masse in den Körper eintritt oder aus ihm austritt. Austretende Masse ändert ihre Geschwindigkeit relativ zum starren Körper von vrel 1 = 0 auf vrel 2 0, eintretende Masse dagegen von vrel 1 0 auf vre1 2 = 0. Sei Δvrel = vrel 2 , wenn Masse austritt und Δvrel = vrel 1 , wenn Masse eintritt. Zwei Fälle werden untersucht. Fall I: Δvrel tritt während einer unendlich kurzen Zeitdauer auf (Bilder 3-19a und 3-20).
Fall II: Δvrel entwickelt sich stetig in einer stationären, inkompressiblen Strömung durch einen geradlinigen Kanal der Länge l (Bild 3-19b; der Einheitsvektor e hat die Richtung der Strömung). In beiden Fällen werden Bewegungsgleichungen an einem Zweikörpersystem mit konstanter Masse entwickelt. Es besteht aus dem starren Körper der Masse m(t) und einem relativ zu diesem bewegten Massenelement Δm. Einzelheiten siehe in [8]. Die Gleichungen für die Translation und die Rotation lauten im Fall II ˙ × S + ω × (ω × S )] m[¨rA + ω = F + m(Δv ˙ rel + 2ωl × e) ,
(3-46)
JA · ω ˙ + ω × J A · ω + mS × r¨ A = MA + m[ ˙ P × Δvrel + (P − le/2) × (2ωl × e)] . (3-47) Die Gleichungen für Fall I sind hierin als der Sonderfall l = 0 enthalten. F und MA sind die äußere eingeprägte Kraft (bzw. das Moment) am augenblicklich vorhandenen Körper. m ˙ = dm/dt kann positiv oder negativ sein. Alle anderen Bezeichnungen sind wie in (3-15) und Bild 3-6. Wenn verschiedene Massenstöme m ˙ i an mehreren Stellen Pi (i = 1, 2, . . .) auftreten, muss man die Glieder mit m ˙ in (3-46) und (3-47) durch entsprechende Summen über i ersetzen (siehe Bild 3-20). Beispiel 3-16: Translatorischer Aufstieg einer Rakete mit der Startmasse m0 in vertikaler z-Richtung. Annahmen: Konstante relative Ausströmgeschwin˙ ≡ −a = const. Damit digkeit vom Betrag vrel und m ist m = m0 − at, F = −mgez , Δvrel = −vrel ez . Für die Beschleunigung der Raketenhülle liefert (3-46) die Gleichung (m0 − at)¨z = −(m0 − at)g + avrel , also z¨ = −g + avrel /(m0 − at) .
Bild 3-19. a Körper mit zunehmender Masse. b Körper mit
abnehmender Masse
Bild 3-20. Abbremsung eines Körpers der Masse m0 durch Mitziehen zweier neben der Bahn ausgelegter Ketten
Integration mit den Anfangsbedingungen z(0) = z˙(0) = 0 ergibt die Geschwindigkeit z˙(t) = −gt + vrel ln(m0 /m(t)) und die Flughöhe z(t) = −gt2 /2 + vrel t − (m(t)vrel /a) ln(m0 /m(t)). Probleme bei Raketen mit Rotation siehe in [8]. Beispiel 3-17: Ein Körper der Anfangsmasse m0 und der Anfangsgeschwindigkeit v0 wird nach Bild 3-20 entlang der horizontalen x-Achse dadurch gebremst, dass er zunehmend größere Teile von zwei anfangs
3 Kinetik starrer Körper
ruhenden Ketten (Masse/Länge = μ) hinter sich herzieht. In (3-46) ist m = m0 + 2(μx/2) = m0 + μx, m ˙ = μ x˙, vrel 1 = − x˙, vrel 2 = 0, also Δvrel = − x˙. Also lautet (3-46) bei Vernachlässigung von Reibung (m0 + μx) x¨ = −μ x˙2 . Man setzt x¨ = (d x˙/dx) x˙ und erhält d x˙/ x˙ = −μdx/(m0 + μx). Integration liefert die Geschwindigkeit v(x) = x˙(x) = v0 /(1 + μx/m0 ) = v0 m0 /m(x) . Dieses Ergebnis drückt die Impulserhaltung m(x)v(x) = m0 v0 aus. Eine weitere Integration nach Trennung der Veränderlichen führt mit der Anfangsbedingung x(0) = 0 auf x(t) = (m0 /μ)[(1 + 2μv0 t/m0 )1/2 − 1] .
3.6 Gravitation. Satellitenbahnen
Die Gravitationskraft (3-48) der Erde auf einen Körper an der Erdoberfläche (r = R ≈ 6370 km) heißt Gewichtskraft G des Körpers: G = m(−er GME /R2 )= mg. g heißt Fallbeschleunigung. Ihre Größe ist in der Nähe der Erdoberfläche wenig vom Ort abhängig und hat den Normwert gn = 9, 80665 m/s2 . Satellitenbahnen
Zwei einander mit Gravitationskräften (3-48) anziehende Himmelskörper der Massen M und m bewegen sich so, dass der gemeinsame Schwerpunkt in Ruhe bleibt. Im Fall M m (Beispiel Sonne und Planet oder Planet und Raumfahrzeug) bleibt die große Masse M praktisch in Ruhe. Die Bewegungsgleichungen (3-2) und (3-14) für m lauten dann (Bild 3-22a) ¨r = (−GM/r2 )er
Gravitationskraft. Gravitationsmoment. Gewichtskraft
Zwei Punktmassen M und m in der Entfernung r ziehen einander mit Gravitationskräften F und −F an. Mit er nach Bild 3-21 ist ⎫ ⎪ ⎪ F = −(GMm/r2 )er , ⎬ (3-48) 2 ⎪ 2 −11 ⎭ G = 6, 67428 · 10 N m /kg . ⎪
und
L = r × ˙rm = const . (3-50)
Im Folgenden ist K = GM = gR2 (Fallbeschleunigung g und Erdradius R bzw. entsprechende Größen bei anderen Gravitationszentren). Durch Polarkoordinaten r, ϕ ausgedrückt liefert (3-50) mit (1-7) die Gleichungen (3-51) r¨ − rϕ˙ 2 = −K/r2 und ϕ˙ = h/r2 mit h = L/m = const .
G ist die Gravitationskonstante. F hat das Potenzial V = −GMm/r. (3-48) gilt auch dann, wenn M und m die Massen zweier sich nicht durchdringender, beliebig großer homogener Kugeln oder Kugelschalen mit der Mittelpunktsentfernung r sind. Sie gilt auch dann, wenn M die Erdmasse ME und m die Masse eines beliebig geformten, im Vergleich zur Erde sehr kleinen Körpers ist, der sich außerhalb der Erdkugel befindet. Auf den Körper wirkt dann um seinen Massenmittelpunkt das Gravitationsmoment Mg = 3ω20 e r × J S · e r ,
ω20 =
GME r3
(3-49)
(J S zentraler Trägheitstensor des Körpers, ω0 Umlaufwinkelgeschwindigkeit eines Satelliten auf der Kreisbahn mit Radius r).
Bild 3-21. Gravitationskräfte zwischen zwei Massen
Bild 3-22. Geometrische Größen für elliptische (a) und für
hyperbolische Satellitenbahnen (b)
E49
E50
E Technische Mechanik / Mechanik fester Körper
Mit der zweiten Gleichung ist dr h d(1/r) dr ϕ˙ = · = −h r˙ = dϕ dϕ r2 dϕ oder mit u = 1/r auch r˙ = −hdu/dϕ und nach Differenziation d2 u d2 u r¨ = −h 2 ϕ˙ = −h2 u2 2 . dϕ dϕ Damit ergibt die erste Gleichung (3-51) d2 u/dϕ2 +u = K/h2 und die Lösung u = [1 + ε cos(ϕ − δ)]K/h2 mit Integrationskonstanten ε und δ. Willkürlich sei ϕ = 0 bei u = umax (d. h. bei r = rmin , also im sog. Perigäum der Bahn). Im Fall ε > 0 ist dann δ = 0, also h2 /K . (3-52) 1 + ε cos ϕ Das sind Kreise (ε = 0) oder Ellipsen (0 < ε < 1) oder Parabeln (ε = 1) oder Hyperbeln (ε > 1) mit der numerischen Exzentrizität ε und dem Gravitationszentrum in einem Brennpunkt (Bild 3-22a, b). h und ε hängen von den Anfangsbedingungen r = r(t0 ), v0 = v(t0 ) (Bahngeschwindigkeit) und α0 = α(t0 ) (zur Bedeutung von α siehe Bild 3-22b) wie folgt ab: ⎫ ⎪ h = r0 v0 cos α0 , ⎪ ⎬ 4 51/2 ⎪ 2 (3-53) ⎪ 2 2 2 ⎪ ε = r0 v0 /K − 1 cos α0 + sin α0 .⎪ ⎭ r(ϕ) =
Gleichung (3-52) liefert den Winkel ϕ = ϕ0 zu r = r0 und damit die Lage der Hauptachsen. Für die Halbachsen a und b gilt a = h2 /[K(1 − ε2 )] (hier und im Folgenden für Hyperbeln negativ) und b2 = a2 |1 − ε2 |, h2 /K = b2 /|a|. Aus (3-50b) folgt, dass r in gleichen Zeitintervallen gleich große Flächen überstreicht (2. Kepler’sches Gesetz). Die Beziehung zwischen Bahngeschwindigkeit v, großer Halbachse a und r ist v2 = K(2/r − 1/a) für alle Bahntypen. Damit ist die gesamte Energie E=
und damit die Bahnhöhe über der Erdoberfläche zu 35 851 km ergibt. In der Entfernung r = r0 ist vf = (2K/r0 )1/2 die minimale Geschwindigkeit, die sog. Fluchtgeschwindigkeit, mit der bei beliebiger Richtung von vf r → ∞ erreicht wird. Am Erdradius R ist vf ≈ 11,2 km/s. Die Umlaufzeit für geschlossene Bahnen ist T = 2π(a3/K)1/2 (3. Kepler’sches Gesetz). Der Zusammenhang zwischen ϕ und der Zeit t mit t = 0 für ϕ = 0 ist ⎞ 1/2 ⎡ ⎛ |a| ϕ ⎟⎟⎟⎟ ⎢⎢⎢⎢ ⎜⎜⎜⎜ |1 − ε| tan ⎟⎠ t(ϕ) = a ⎢⎣2 f ⎜⎝ K 1+ε 2 sin ϕ (3-54) −ε |1 − ε2 | 1 + ε cos ϕ mit f = arctan für elliptische und f = artanh für hyperbolische Bahnen. Bei Ellipsen gilt auch t(ψ) = (ψ − ε sin ψ)(a3 /K)1/2 mit ψ nach Bild 3-22a. Mit ψ hat die Ellipse die Parameterdarstellung x = a cos ψ, y = b sin ψ. Weitere Einzelheiten zu Satellitenbahnen siehe in [8, 9]. Bei elliptischen Bahnen nach Bild 3-23 (Ballistik ohne Luftwiderstand) sind die Reichweite β, die Flughöhe H und die Flugdauer tF von den Anfangsbedingungen v0 und α wie folgt abhängig: ⎫ Rv20 /K sin α cos α ⎪ ⎪ ⎪ ⎪ ⎪ ,⎪ tan(β/2) = ⎪ 2 ⎪ ⎪ 1 − Rv0 /K cos2 α ⎪ ⎪ ⎪ ⎬ 2 2 (3-55) ⎪ Rv0 /K = v0 /(Rg) , ⎪ ⎪ ⎪ ⎪ ⎪ H = R (1 − cos( β/2)) ε/(1 − ε) , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ tF = 2π(a3/K)1/2 − 2t(ϕ) mit ε, a, ϕ = π − β/2 und t(ϕ) wie oben. β ist bei gegebenem v0 maximal für cos2 α = (2 − Rv20 /K)−1 .
1 2 mK −mK mv − = . 2 r 2a
Bei Ellipsen ist vmax /vmin = rmax /rmin = (1 + ε)/ (1 − ε). Auf einer Kreisbahn mit dem Radius r0 ist v = (K/r0 )√1/2 . Am Erdradius r0 = R ergibt sich daraus v = gR = 7,904 km/s. Auf einer geostationären Kreisbahn ist v/r0 gleich der absoluten Winkelgeschwindigkeit Ω der Erde, woraus sich für diese Bahn r0 = (gR2 /Ω2 )1/3 = 6,627 R ≈ 42 222 km
Bild 3-23. Ballistische Flugbahn
4 Schwingungen
3.7 Stabilität Zur Stabilität von Gleichgewichtslagen bei konservativen Systemen siehe 2.6. Die Stabilität von Gleichgewichtslagen und von Bewegungen wird in gleicher Weise definiert und mit denselben Methoden untersucht. Begriffe: Bei einem System mit n Freiheitsgraden mit generalisierten Koordinaten q = [q1 . . . qn ] sei q∗ (t) eine Bewegung zu bestimmten Anfangsbedingungen q∗ (0) und q˙ ∗ (0) und im Sonderfall q∗ (t) ≡ q∗ (0) = 0 eine Gleichgewichtslage. Zu gestörten An˙ gehört eine gestörte fangsbedingungen q(0) und q(0) Bewegung q(t). Die Abweichungen y(t) = q(t) − q∗ (t)
und y˙(t) = q(t) ˙ − q˙ ∗ (t) (3-56)
heißen Störungen der Bewegung bzw. der Gleichgewichtslage q∗ (t). Ein Maß für die Störungen ist ⎤ ⎡ n ⎥⎥1/2 ⎢⎢ 2 . r(t) = ⎢⎢⎢⎣ yi (t) + y˙ 2i (t) ⎥⎥⎥⎦ i=1
Damit ist insbesondere r(0) das Maß für die Störungen der Anfangsbedingungen. Definition: Eine Bewegung oder Gleichgewichtslage q∗ (t) heißt Ljapunow-stabil, wenn für jedes beliebig kleine ε > 0 ein δ > 0 existiert, sodass für alle Bewegungen mit r(0) < δ dauernd r(t) < ε ist. Andernfalls heißt die Bewegung instabil. Sie heißt insbesondere asymptotisch stabil, wenn sie stabil ist, und wenn außerdem r(t) für t → ∞ asymptotisch gegen null strebt. Beispiel 3-18: Die untere Gleichgewichtslage eines Pendels ist stabil, weil die potenzielle Energie dort minimal ist (vgl. 2.6). Dagegen sind Eigenschwingungen des Pendels instabil, weil die Periodendauer vom Maximalausschlag ϕmax abhängt (siehe 4.6). Man kann nämlich selbst mit einem beliebig kleinen δ > 0 nicht verhindern, dass die gestörte und die ungestörte Bewegung nach endlicher Zeit ungefähr in Gegenphase sind, d. h., dass die Störung r ≈ 2ϕmax ist. In den Bewegungsgleichungen des betrachteten mechanischen Systems wird für q nach (3-56) der Ausdruck q∗ + y eingesetzt. Wenn q∗ (t) bekannt ist, erzeugt das neue Differenzialgleichungen für die Störungen y(t). Diese Differenzialgleichungen haben die spezielle Lösung y(t) ≡ 0, d. h. eine Gleichge-
wichtslage. Die Stabilität der Bewegung q∗ (t) mit den ursprünglichen Differenzialgleichungen untersuchen heißt also, die Stabilität der Gleichgewichtslage für die Differenzialgleichungen der Störungen untersuchen. Sonderfall. Die ursprünglichen Differenzialgleichungen für q sind linear mit konstanten Koeffizienten. Dann sind die Differenzialgleichungen für die Störungen mit den ursprünglichen identisch. Daraus folgt: Jede Bewegung q∗ (t) des Systems hat dasselbe Stabilitätsverhalten, wie die Gleichgewichtslage q∗ ≡ 0. Zur Bestimmung des Stabilitätsverhaltens überführt man die n Bewegungsgleichungen in ein System von 2n Differenzialgleichungen erster Ordnung der Form A x˙ = 0. Die Realteile der Eigenwerte der Matrix A entscheiden. Asymptotische Stabilität liegt vor, wenn alle Realteile negativ sind. Instabilität liegt vor, wenn wenigstens ein Realteil positiv ist oder wenn im Fall ausschließlich nicht-positiver Realteile ein mehrfacher Eigenwert λ mit dem Realteil Null existiert, für den der Rangabfall der Matrix A − λE kleiner ist als die Vielfachheit von λ. Stabilität liegt vor, wenn weder asymptotische Stabilität noch Instabilität vorliegt. Da A für mechanische Systeme besondere Strukturen hat, gibt es spezielle Stabilitätssätze [13]. Eine Stabilitätsuntersuchung nichtlinearer Systeme anhand linearisierter Differenzialgleichungen ist nur zulässig, wenn sie entweder zu dem Ergebnis „asymptotisch stabil“ oder zu dem Ergebnis „instabil“ führt. Das Ergebnis “stabil“ erlaubt keine Aussage über das nichtlineare System! Für Kriterien bei nichtlinearen Systemen siehe die direkte Methode von Ljapunow (A 32.2, I 9.5 und [11, 12]) und die Methode der Zentrumsmannigfaltigkeit [13].
4 Schwingungen Unter Schwingungen versteht man Vorgänge, bei denen physikalische Größen mehr oder weniger regelmäßig abwechselnd zu- und abnehmen. Ein schwingungsfähiges System heißt Schwinger. Mechanische Schwingungen werden durch Differenzialgleichungen der Bewegung beschrieben. Methoden zu deren Formulierung siehe in 3.1.3, 3.1.8 und 3.3.
E51
E52
E Technische Mechanik / Mechanik fester Körper
Klassifikation von Schwingungen. Freie Schwingungen (auch Eigenschwingungen genannt) sind solche, bei denen dem Schwinger keine Energie zugeführt wird. Von selbsterregten Schwingungen spricht man, wenn sich ein Schwinger im Takt seiner Eigenschwingungen Energie aus einer Energiequelle (z. B. einem Energiespeicher) zuführt. Ein einfaches Beispiel ist die elektrische Klingel, bei der der Klöppel, von einem Elektromagneten angezogen, gegen die Glocke schlägt, durch diese Bewegung einen Stromkreis unterbricht und den Magneten abschaltet, sodass der Klöppel zurückschwingt und den Stromkreis wieder schließt. Die Energiequelle ist in diesem Fall das elektrische Netz. Eigenschwingungen und selbsterregte Schwingungen werden autonome Schwingungen genannt. Den Gegensatz zu autonomen Schwingungen bilden fremderregte Schwingungen. Bei ihnen existiert ein Erregermechanismus, in dem eine fest vorgegebene Funktion der Zeit eine Rolle spielt. Wenn diese Funktion in den Differenzialgleichungen der Bewegung in einem freien Störglied auftritt, spricht man von erzwungenen Schwingungen (z. B. im Fall mq¨ + kq = F cos Ωt). Wenn sie nur in den physikalischen Parametern auftritt, spricht man von parametererregten Schwingungen (z. B. im Fall m(t) q¨ + k(t) q = 0). Je nachdem, ob die zu beschreibenden Differenzialgleichungen linear oder nichtlinear sind, spricht man von linearen oder nichtlinearen Schwingungen. Nur freie, erzwungene und parametererregte Schwingungen können linear sein. Schwingungen von Systemen mit mehr als einem Freiheitsgrad werden Koppelschwingungen genannt. Phasenkurven. Phasenporträt. Die Differenzialgleichung eines Schwingers mit einem Freiheitsgrad und mit der Koordinate q hat zu gegebenen ˙ 0 ) eine eindeuAnfangsbedingungen q(t0 ) und q(t tige Lösung q(t), q˙ (t). Ihre Darstellung in einem q, q˙ -Diagramm heißt Phasenkurve, und die Gesamtheit aller Phasenkurven eines Schwingers für verschiedene Anfangsbedingungen heißt Phasenporträt des Schwingers (Bilder 4-1, 4-14, 4-15). Oberhalb der q-Achse werden Phasenkurven von links nach rechts und unterhalb von rechts nach links durchlaufen. Bei autonomen Schwingungen ist das Phasenporträt mit Ausnahme singulärer Punkte auf der q-Achse schnittpunktfrei. Die sin-
Bild 4-1. Phasenkurven mit einer stabilen (a), einer asym-
ptotisch stabilen (b) und einer instabilen Gleichgewichtslage (c)
gulären Punkte gehören zu Gleichgewichtslagen. Bild 4-1 zeigt Phasenkurven in der Umgebung von stabilen, asymptotisch stabilen und instabilen Gleichgewichtslagen. Periodische Schwingungen haben eine Periodendauer T derart, dass q(t + T ) ≡ q(t)
für alle t
gilt. Ihre Phasenkurven sind geschlossen. Alle Phasenkurven mit Ausnahme von sog. Separatrizen schneiden die q-Achse rechtwinklig (Bild 4-14).
4.1 Lineare Eigenschwingungen 4.1.1 Systeme mit einem Freiheitsgrad
Die Differenzialgleichung für die schwingende Größe q lautet mq¨ + bq˙ + kq = 0
(4-1)
mit konstanten Trägheits-, Dämpfungs- und Steifig keitsparametern m, b bzw. k. Bei freien Schwingungen ohne Dämpfung ist q¨ + ω20 q = 0
mit ω20 = k/m .
(4-2)
ω0 heißt Eigenkreisfrequenz des Schwingers. Die Lösung von (4-2) ist eine harmonische Schwingung. Sie kann in jeder der folgenden drei Formen angegeben werden: ⎫ q(t) = A1 exp( jω0 t) + B1 exp(−jω0 t) ⎪ ⎪ ⎪ ⎪ ⎬ (4-3) = A cos ω0 t + B sin ω0 t ⎪ ⎪ ⎪ ⎪ ⎭ = C cos(ω0 t − ϕ) . Die Integrationskonstanten C und ϕ heißen Amplitude bzw. Nullphasenwinkel oder kurz Phase. Zwischen
4 Schwingungen
den Integrationskonstanten der drei Formen gelten die Beziehungen ' A = A1 + B1 , B = j(A1 − B1 ) , C 2 = A2 + B2 , tan ϕ = B/A , A = C cos ϕ , B = C sin ϕ . (4-4) Die Periodendauer T = 2π/ω0 ist unabhängig von der Amplitude C. Phasenkurven sind die Ellipsen q2 + q˙ 2 /ω20 = C 2 bzw. bei geeigneter Maßstabswahl die Kreise in Bild 4-1a. Im Fall mit Dämpfung wird in (4-1) die normierte Zeit τ = ω0 t eingeführt. Für dq/dτ wird q geschrieben. Mit den Beziehungen ' ω20 = k/m , τ = ω0 t , (4-5) q˙ = (dq/dτ)(dτ/dt) = ω0 q , q¨ = ω20 q und mit dem dimensionslosen Dämpfungsgrad (auch Lehr’sches Dämpfungsmaß) b b D= = √ (4-6) 2mω0 2 mk entsteht aus (4-1) die Gleichung q + 2Dq + q = 0 . (4-7) Sie hat die Lösungen (siehe auch B 5) ⎧ ⎪ exp(−Dτ)(A cos ντ + B sin ντ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (ν = (1 − D2 )1/2 , |D| < 1) , ⎪ ⎪ ⎪ ⎪ ⎨ q(τ) = ⎪ A exp(λ1 τ) + B exp(λ2 τ) ⎪ ⎪ ⎪ ⎪ ⎪ (λ1,2 = −D ± (D2 − 1)1/2 , |D| > 1) , ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ exp(Dτ)(A + Bτ) (|D| = 1) . (4-8) Die Bilder 4-2 zeigen alle Lösungstypen außer für |D| = 1. Im Fall 0 < D < 1 liegen aufeinander folgende gleichsinnige Maxima qi und qi+1 im selben zeitlichen Abstand Δt = Δτ/ω0 = 2π/(νω0 ), wie gleichsinnig durchlaufene Nullstellen. Wenn ein Meßschrieb in Form von Bild 4-2d vorliegt, können ω0 und D aus Messwerten für Δt und qi /qi+n (bei fehlender Nulllinie wird Li /Li+n abgelesen) aus den Gleichungen berechnet werden: ⎫ D ln(qi /qi+n ) ln(Li /Li+n ) ⎪ ⎪ ⎪ = , = ⎬ (4-9) 2πn 2πn (1 − D2 )1/2 ⎪ ⎪ ⎪ 2 1/2 ⎭ ω0 = 2π/[Δt(1 − D ) ] . Λ = ln(qi /qi+1 ) heißt logarithmisches Dekrement. Zu den Zahlenwerten qi /qi+1 = 2, 4, 8 und 16 gehören die Dämpfungsgrade D ≈ 0, 11 bzw. 0, 22 bzw. 0, 31 bzw. 0, 40.
Bild 4-2. Ausschlag-Zeit-Diagramme für Schwinger mit der Bewegungsgleichung (4-7); siehe (4-8)
4.1.2 Eigenschwingungen bei endlich vielen Freiheitsgraden
Hierzu siehe auch 5.14 Übertragungsmatrizen. Aufstellung von Bewegungsgleichungen
Eigenschwingungen eines ungedämpften Systems mit n Freiheitsgraden haben Differenzialgleichungen der Form M q¨ + K q = 0
(4-10)
E53
E54
E Technische Mechanik / Mechanik fester Körper
mit symmetrischen (n × n)-Matrizen M und K (M Massenmatrix, K Steifigkeitsmatrix). M ist positiv definit und damit nichtsingulär. Zur Bestimmung von M und K für einen gegebenen Schwinger formuliert man seine kinetische Energie T und seine potenzielle Energie V und schreibt sie in der Form T = 12 q˙ T M q˙ bzw. V = 12 qT K q mit symmetrischen Matrizen M und K. Diese sind die gesuchten Matrizen.
1 2 1 2 V = kx − m2 gl 1 − ϕ + . . . . 2 2 Damit ist
m1 + m2 m2 l cos α , M= m2 l cos α J S + m2 l2 k 0 . K= 0 m2 gl
Beispiel 4-1: Für den Schwinger in Bild 4-3 ist 1 m1 q˙ 21 + m2 (q˙ 1 + q˙2 )2 + m3 q˙ 23 2 ⎤⎡ ⎤ ⎡ ⎢⎢⎢⎢ m1 + m2 m2 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ q˙ 1 ⎥⎥⎥⎥ 1 = [q˙ 1 q˙ 2 q˙ 3 ] ⎢⎢⎢⎢⎢ m2 m2 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ q˙ 2 ⎥⎥⎥⎥⎥ , 2 ⎦⎣ ⎦ ⎣ 0 0 m3 q˙ 3 1 V = [k1 q21 + k2 q22 + k3 (q3 − q1 )2 ] 2 ⎤⎡ ⎤ ⎡ ⎢ k + k3 0 −k3 ⎥⎥⎥ ⎢⎢⎢ q1 ⎥⎥⎥ 3 ⎢⎢⎢⎢⎢ 1 12 ⎥⎢ ⎥ = q1 q2 q3 ⎢⎢⎢ 0 k2 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ q2 ⎥⎥⎥⎥⎥ . 2 ⎦⎣ ⎦ ⎣ −k3 0 k3 q3 T=
Wenn der Schwinger nichtlinear ist, dann ist ˙ und V(q1 , . . . , qn ) hat T = 12 q˙ T M(q1 , . . . , qn ) q, 1 T nicht die Form 2 q Kq. In diesem Fall gewinnt man linearisierte Bewegungsgleichungen wie folgt. Man bestimmt zunächst aus ∂V/∂qi = 0 (i = 1, . . . , n) die Gleichgewichtslage qi = qi0 (i = 1, . . . , n) des Systems und entwickelt dann V um diese Lage in eine Taylorreihe nach den Variablen q∗i = qi − qi0 , d. h. nach den Abweichungen von der Gleichgewichtslage. Die Reihe beginnt mit Gliedern 2. Grades in q∗i . Diese Glieder werden in die Form 12 q∗T Kq∗ mit symmetrischem K gebracht. Außerdem wird M(q10 , . . . , qn0 ) gebildet. K und diese Matrix M sind die gesuchten Matrizen. Beispiel 4-2: Das System von Bild 3-14a ohne die Kraft F ist konservativ, hat die Gleichgewichtslage x = ϕ = 0 (voraussetzungsgemäß) und hat die Energien T und V nach (3-33). Die Taylorreihe für V ist
Lösung der Bewegungsgleichungen
Man löst das Eigenwertproblem (K − λM)Q = 0 .
(4-11)
Alle Eigenwerte λi und alle Eigenvektoren Q i (i = 1, . . . , n) sind reell. Bei einfachen und bei mehrfachen Eigenwerten gibt es n Eigenvektoren mit den Orthogonalitätseigenschaften QiT MQ j = QTi KQ j = 0 (i, j = 1, . . . , n; i j). Die Eigenvektoren werden so normiert, dass QTi MQi = c2 (i = 1, . . . , n) ist. c2 ist willkürlich wählbar. Man bildet die (n × n)Modalmatrix Φ mit den Spalten Q1 , . . . , Qn . Sie hat die Eigenschaften (E Einheitsmatrix, diag Diagonalmatrix) ' ΦT M Φ = c2 E , ΦT K Φ = c2 diag(λi ) , (4-12) Φ−1 = (1/c2 )ΦT M . Man definiert Hauptkoordinaten x durch die Gleichung q = Φ x. Einsetzen in (4-10) und Linksmultiplikation mit ΦT erzeugt die entkoppelten Gleichungen x¨i + λi xi = 0
(i = 1, . . . , n) .
(4-13)
Wenn K positiv definit ist, dann ist die Gleichgewichtslage q = 0, x = 0 stabil und λi = ω20i > 0 (i = 1, . . . , n). Zu (4-13) gehören die Anfangsbedingungen x(0) = Φ−1 q(0) und x˙(0) = Φ−1 q(0). ˙ Aus der Lösung x(t) ergibt sich q(t) = Φ x(t).
4.2 Erzwungene lineare Schwingungen 4.2.1 Systeme mit einem Freiheitsgrad Harmonische Erregung
Bild 4-3. Linearer Schwinger mit drei Freiheitsgraden
Vergrößerungsfunktionen. Bild 4-4 zeigt einige Beispiele für Schwinger, die durch eine vorgegebene
4 Schwingungen
Die Konstanten D, q0 und ψ und die Funktion fi (η, D) sind von Fall zu Fall verschieden. Tabelle 4-1 gibt sie für die Schwinger von Bild 4-4 an. Die vollständige Lösung q(τ) von (4-15) ist die Summe aus der Lösung (4-8) der homogenen Gleichung und einer speziellen Lösung der inhomogenen. Im Fall D > 0 klingt q(t) in (4-8) ab, sodass die spezielle Lösung das stationäre Verhalten beschreibt. Sie lautet q(τ) = q0 Vi (η, D) cos(ητ − ψ − ϕ)
(4-16)
mit der sog. Vergrößerungsfunktion Bild 4-4. Schwinger mit harmonischer Erregung a durch ei-
ne äußere Kraft, b und d durch Fußpunktbewegungen und c durch einen umlaufenden, unwuchtigen Rotor (m1 Rotormasse, u0 Schwerpunktabstand von der Drehachse)
Bewegung u(t) = u0 cos Ωt eines Systempunktes oder durch eine vorgegebene Kraft F(t) = F0 cos Ωt zwangserregt werden. Diese Form der Erregung heißt harmonische Erregung. u0 bzw. F0 heißen Erregeramplitude und Ω Erregerkreisfrequenz. Die Bewegungsgleichung für die Koordinate q lautet für Bild 4-4a mq¨ + bq˙ + kq = F(t) .
(4-14)
Für alle linearen Ein-Freiheitsgrad-Schwinger (z. B. auch bei erzwungenen Torsionsschwingungen) ist sie von diesem Typ. Die Gleichung wird durch Einführung der normierten Zeit τ = ω0 t mithilfe von (4-5) umgeformt. Das Ergebnis ist q + 2Dq + q = q0 fi (η, D) cos(ητ − ψ) (4-15) mit η = Ω/ω0 .
Vi (η, D) =
fi (η, D) [(1 − η2 )2 + 4D2 η2 ]1/2
(i = 1, . . . , 4) . (4-17)
Für den Phasenwinkel ϕ(η, D) gilt stets tan ϕ = 2Dη/(1 − η2 ). Die Vergrößerungsfunktionen V2 , V3 und V4 zu f2 , f3 und f4 von Tabelle 4-1 sowie ϕ(η, D) sind in Bild 4-5 dargestellt. Für V1 gilt V1 (η, D) ≡ V3 (1/η, D). Man sagt, dass q in Resonanz mit der Erregung ist, wenn η = 1 ist. Die Maxima der Vergrößerungsfunktionen bei gegebenem Dämpfungsgrad D liegen für V1 bei η = (1 − 2D2 )1/2 , für V2 bei η = 1, für V3 bei η = (1 − 2D2 )−1/2 und für V4 bei η = [(1 + 8D2 )1/2 − 1]1/2 /(2D). Die Maxima sind V1 max = V3 max = (1 − D2 )−1/2 /(2D) , V2 max = 1 , ⎡ ⎞2 ⎤−1/2 ⎛√ ⎢⎢⎢ ⎜⎜⎜ 1 + 8D2 − 1 ⎟⎟⎟ ⎥⎥⎥ ⎢ ⎟⎟⎠ ⎥⎥⎥ V4 max = ⎢⎢⎣1 − ⎜⎜⎝ . ⎦ 4D2
Tabelle 4-1. Bedeutung der Größen ω0 , D, q0 , ψ und fi (η, D) in (4-15) für die Schwinger von Bild 4-4. Für Bild 4-4d liefert die obere Zeile die Gleichung für die Koordinate q und die untere die Gleichung für die
Koordinate q∗ Bild 4-4 a b c % d
ω20 k/m k/m k/(m + m1 ) k/m k/m
2D √ b/ mk √ b/ mk √ b/ (m + m1 )k √ b/ mk √ b/ mk
q0 F0 /k u0 u0 m1 /(m + m1 ) u0 u0
ψ 0 −π/2 0 − arctan(2Dη) 0
fi (η, D) f1 = 1 f2 = 2Dη f 3 = η2 f4 = 1 + 4D2 η2 f 3 = η2
E55
E56
E Technische Mechanik / Mechanik fester Körper
Bild 4-5. a–c Vergrößerungsfunktionen V3 , V4 und V2 für die Schwinger von Bild 4-4. d Phasenwinkel ϕ(η, D) in (4-16) für alle Schwinger von Bild 4-4
Im Fall D 1 treten die Maxima aller vier Funktionen bei η ≈ 1 auf, und alle außer V2 max haben angenähert den Wert 1/(2D). Periodische Erregung
Wenn die Erregerfunktion (z. B. u(t) in Bild 4-4) nichtharmonisch periodisch mit der Periodendauer T
ist, definiert man Ω = 2π/T und η = Ω/ω0 und entwickelt die Störfunktion der Differenzialgleichung in eine Fourierreihe. An die Stelle der rechten Seite von (4-15) tritt dann der Ausdruck ∞ k=1
[ak cos(kητ) + bk sin(kητ)] =
∞
ck cos(kητ − ψk )
k=1
(4-18)
4 Schwingungen
mit c2k = a2k + b2k und tan ψk = bk /ak , wobei die ck und ψk i. Allg. von η und D abhängen. Die Lösung q(τ) der Differenzialgleichung ergibt sich aus (4-16) nach dem Superpositionsprinzip zu ⎫ ∞ ⎪ ⎪ ⎪ q(τ) = ck V1 (kη, D) cos(kητ − ψk − ϕk ) , ⎪ ⎬ ⎪ ⎪ k=1 ⎪ ⎪ ⎭ tan ϕk = 2Dkη/(1 − k2 η2 ) . (4-19) Das k-te Glied dieser Reihe ist mit der Erregung in Resonanz, wenn kη = 1 ist. Nichtperiodische Erregung
Bei Anlaufvorgängen und anderen nichtperiodischen Erregungen tritt an die Stelle von (4-15) q + 2Dq + q = f (τ) mit einer nichtperiodischen Störfunktion f (τ). Die vollständige Lösung q(τ) ist die Summe aus der Lösung (4-8) der homogenen Gleichung und einer partikulären Lösung zur Störfunktion f (τ). Die partikuläre Lösung zur Störfunktion f (τ) = (am τm + am−1 τm−1 + . . . + a1 τ + a0 ) cos βτ mit beliebigen Konstanten m ≥ 0, am , . . . , a0 und β (statt cos βτ kann auch sin βτ stehen) ist qpart (τ) = bm τm + bm−1 τm−1 + . . . + b1 τ + b0 cos βτ + cm τm + cm−1 τm−1 + . . . + c1 τ + c0 sin βτ . Im Sonderfall D = 0, β = 1 muss der gesamte Ausdruck mit τ multipliziert werden. Die Konstanten bi , ci (i = 0, . . . , m) werden bestimmt, indem man qpart in die Dgl. einsetzt und einen Koeffizientenvergleich vornimmt. Bei komplizierten Störfunktionen f (τ) berechnet man die vollständige Lösung q(τ) zu Anfangswerten q0 = q(0), q0 = q (0) mit dem Faltungsintegral "τ 1 q(τ) = f (¯τ)e−D(τ−¯τ) sin ν(τ − τ¯ ) d¯τ ν
simal kurzzeitig wirkender Kraftstoß Fˆ auf einen anfangs ruhenden, gedämpften Schwinger mit der Differenzialgleichung mq¨ + bq˙ + kq = 0 verursacht die Schwingung q(τ) = B exp (−Dτ) sin ντ mit B = ˆ F/(νmω 0 ). Zur Bedeutung der Symbole siehe (4-5) bis (4-8). Wenn auf denselben Schwinger gleichgerichtete und gleich große Kraftstöße Fˆ periodisch im zeitlichen Abstand T s wirken, stellt sich asymptotisch eine stationäre Schwingung ein, bei der sich zwischen je zwei Stößen periodisch der Verlauf q(τ) = VI (η, D) × B exp (−Dτ) sin (ντ + ψ) wiederholt (0 τ Δτ = ω0 T s ). Darin ist B dieselbe Größe wie oben, η = T s ω0 /(2π) das Verhältnis aus Stoßzeitintervall und Periodendauer der freien ungedämpften Schwingung, ψ ein von η und D abhängiger Nullphasenwinkel und VI (η, D) die Vergrößerungsfunktion (siehe [1]) VI (η, D) =
exp(πDη) . (4-20) {2[cosh(2πDη) − cos(2πνη)]}1/2
Sie ist in Bild 4-6 dargestellt. Die Resonanzspitzen bei η = n (ganzzahlig) sind im Fall D 1 VI (η, D) ≈ [1 − exp (−2πnD)]−1 .
0
+ e−Dτ [q0 cos ντ + (1/ν)(q0 + Dq0 ) sin ντ] mit ν = (1 − D2 )1/2 . Das Integral ist entweder in geschlossener Form oder numerisch auswertbar (siehe A 36.3). Periodische Erregung durch Stöße
Bei einem Stoß wirkt auf den Schwinger . kurzzeitig eine große Kraft F(t). Das Integral Fˆ = F(t) dt über die Stoßdauer heißt Kraftstoß. Ein einzelner, infinite-
Bild 4-6. Vergrößerungsfunktion V1 nach (4-20) für
Schwingungserregung durch periodische Kraftstöße
E57
E58
E Technische Mechanik / Mechanik fester Körper
4.2.2 Erzwungene Schwingungen bei endlich vielen Freiheitsgraden
Hierzu siehe auch 5.14 Übertragungsmatrizen. Im Fall ohne Dämpfung tritt an die Stelle von (4-10) die Differenzialgleichung M q¨ + K q = F(t)
(4-21)
mit einer Spaltenmatrix F(t) von Erregerfunktionen. Bei harmonischer Erregung F(t) = F 0 cos Ωt mit einer einzigen Erregerkreisfrequenz Ω und mit F 0 = const ist die stationäre Lösung q(t) = A cos Ωt. Die konstante Spaltenmatrix A ist die Lösung des inhomogenen Gleichungssystems (K − Ω2 M)A = F 0 .
blem (4-11) gelöst. Das Ergebnis sind die Eigenwerte λi (i = 1, . . . , n), die Modalmatrix Φ und die Hauptkoordinaten x. Einsetzen von q = Φ x in (4-21) und Linksmultiplikation mit ΦT erzeugt die entkoppelten Gleichungen x¨i + λi xi = (1/c2 )[ΦT F(t)]i
(i = 1, . . . , n) . (4-23)
Für die Eigenwerte λi und die Anfangsbedingungen gelten die Aussagen im Anschluss an (4-13). Die Gleichungen (4-23) werden mit den Methoden von 4.2.1 gelöst. Aus x(t) ergibt sich q(t) = Φ x(t). Schwingungen mit Dämpfung: Zum Thema Dämpfung siehe [2–4]. Bei linearer Dämpfung tritt an die Stelle von (4-21) die Gleichung
(4-22)
Resonanz tritt ein, wenn Ω mit einer Eigenkreisfrequenz ωi des Systems, d. h. einer Lösung der Gleichung det (K − ω2 M) = 0, übereinstimmt (das ist (4-11) mit λ = ω2 ). Durch geeignete Parameterabstimmung kann man u. U. erreichen, dass die aus (4-22) berechnete Amplitude Ai einer Koordinate qi oder einiger Koordinaten bei einer bestimmten, im Normalbetrieb des Systems auftretenden Erregerkreisfrequenz Ω gleich null ist. Dieser Effekt heißt Schwingungstilgung. Beispiel 4-3: Für das System in Bild 4-7 hat (4-22) die Form k1 0 mges m2 A1 mΩ2 r . − Ω2 = 0 k2 0 m2 m2 A2 A1 = 0 bei der Parameterabstimmung Ω2 = k2 /m2 . Bei nichtharmonischer periodischer Erregung in (4-21) wird F(t) in eine Fourierreihe entwickelt. Die Lösung von (4-21) ist die Summe der Lösungen zu den einzelnen Reihengliedern. Bei nichtperiodischer Erregung wird das Eigenwertpro-
Bild 4-7. Schwingungstilger. Bei geeigneter Parameterwahl m2 , k2 bleibt m1 in Ruhe
M q¨ + D q˙ + K q = F(t)
(4-24)
mit einer symmetrischen Dämpfungsmatrix D. Bei harmonischer Erregung F(t) = F 0 cos Ωt mit einer einzigen Erregerkreisfrequenz Ω und mit F 0 = const ist die stationäre Lösung q(t) = A cos Ωt + B sin Ωt. Die konstanten Spaltenmatrizen A und B sind die Lösungen des inhomogenen Gleichungssystems ⎡ ⎤⎡ ⎤ ⎢⎢⎢ K − Ω2 M ΩD ⎥⎥⎥ ⎢⎢⎢ A ⎥⎥⎥ F ⎢⎢⎣ ⎥⎥⎦ ⎢⎢⎣ ⎥⎥⎦ = 0 . 2 0 −ΩD K−Ω M B Wenn F(t) eine Summe periodischer Funktionen ist, wird das Superpositionsprinzip angewandt. Bei nichtperiodischer Erregung ist F(t) als Summe von höchstens n Ausdrücken der Form F 0 f (t) mit F 0 = const darstellbar. Da das Superpositionsprinzip gilt, wird die Lösung nur für diese Form angegeben. Die folgenden Rechenschritte liefern die Lösung für z(t) = [q1 (t) . . . qn (t)q˙ 1 (t) . . .˙qn (t)]T zu gegebenen Anfangswerten z(0) (siehe[1]). 1. Schritt: Man bildet eine konstante Spaltenmatrix B mit 2n Elementen, in der oben n Nullelemente und darunter das Produkt M −1 F 0 stehen. 2. Schritt: Man berechnet die 2n Eigenwerte λi und Eigenvektoren Qi (i = 1, . . . , 2n) des Eigenwertproblems (λ2 M + λD + K)Q = 0. Die Normierung der Eigenwerte ist beliebig. Das Ergebnis sind p ≤ n Paare konjugiert komplexer Eigenwerte λi = i ± jσi und Eigenvektoren Qi = u i ± jvi (i = 1, . . . , p) sowie 2n − 2p reelle Eigenwerte λi und Eigenvektoren Qi
4 Schwingungen
(i = 2p + 1, . . . , 2n). Zu jedem Paar komplexer Eigenvektoren werden u∗i = i ui − σi vi und v∗i = σi ui + i vi (i = 1, . . . , p) und zu jedem reellen Eigenvektor Qi wird Q∗i = λi Qi (i = 2p + 1, . . . , 2n) berechnet. Dann bildet man die reelle (2n × 2n)-Matrix ⎡ ⎤ ⎢⎢ u 1 v 1 . . . u p v p Q 2p+1 . . . Q 2n ⎥⎥⎥ ⎥⎦ . Ψ = ⎢⎢⎣ ∗ u 1 v ∗1 . . . u ∗p v ∗p Q ∗2p+1 . . . Q ∗2n 3. Schritt: Man löst das Gleichungssystem Ψ Y = B nach Y auf. 4. Schritt: Man löst (mit einem der Verfahren von 4.2.1) die p Differenzialgleichungen 2. Ordnung x¨i − 2 i x˙i + 2i + σ2i xi = f (t) (i = 1, . . . , p) (4-25) und die 2n − 2p Differenzialgleichungen 1. Ordnung y˙ i − λi yi = Yi f (t)
(i = 2p + 1, . . . , 2n) .
Anfangswerte xi (0), x˙i (0) und yi (0) siehe unten. Zu jeder Lösung xi (t) berechnet man x˙i (t). 5. Schritt: Zu jedem Paar xi (t), x˙i (t) berechnet man Funktionen y2i−1 (t) und y2i (t) aus der Gleichung y2i−1 (t) − i Y2i−1 + σi Y2i Y2i−1 = y2i (t) −σi Y2i−1 − i Y2i Y2i xi (t) (4-26) × (i = 1, . . . , p) . x˙i (t) Im Fall f (t) ≡ 0 setze man in (4-26) Y2i−1 = 1, Y2i = 0. Im Sonderfall f (t) 0, Y2i−1 = Y2i = 0 setze man in (4-25) f (t) ≡ 0 und in (4-26) Y2i−1 = 1, Y2i = 0. Anfangswerte y(0) werden aus dem Gleichungssystem Ψ y(0) = z(0) berechnet. Anfangswerte für (4-25) werden mit y(0) aus (4-26) berechnet. 6. Schritt: Man bildet die Spaltenmatrix y(t) = [y1 (t) . . . y2p (t) y2p+1 (t) . . . y2n (t)]T . Die gesuchte Lösung ist z(t) = Ψ y(t).
4.3 Lineare parametererregte Schwingungen Lineare parametererregte Schwingungen eines Systems mit einem Freiheitsgrad werden durch die Differenzialgleichung q¨ + p1 (t)q˙ + p2 (t)q = 0
(4-27)
beschrieben. Sie besitzt die spezielle Lösung q(t) ≡ 0. Die Koeffizienten p1 (t) und p2 (t) entscheiden darüber, ob die allgemeine Lösung q(t) asymptotisch stabil, grenzstabil oder instabil ist. Beispiel 4-4: Das Pendel mit linear von t abhängiger Länge l(t) = l0 + vt (z. B. ein Förderkorb am Seil mit konstanter Geschwindigkeit v > 0 oder v < 0). Die horizontale Auslenkung q des Pendelkörpers aus der Vertikalen (nicht der Pendelwinkel) wird durch (4-27) mit p1 (t) ≡ 0 und p2 (t) = g/(l0 + vt) beschrieben. Im Fall v > 0 schwingt q(t) angefacht und im Fall v < 0 gedämpft. Der Pendelwinkel schwingt dagegen im Fall v > 0 gedämpft und im Fall v < 0 angefacht. Von besonderer technischer Bedeutung sind parametererregte Schwingungen, bei denen die Koeffizienten p1 (t) und p2 (t) in (4-27) periodische Funktionen gleicher Periode T sind. Nach dem Satz von Floquet hat die allgemeine Lösung q(t) in diesem Fall die Form ⎧ μ1 t μ2 t ⎪ ⎪ ⎨ C1 u1 (t)e + C2 u2 (t)e q(t) = ⎪ ⎪ ⎩ [C1 (t/T )u1 (t) + C2 u2 (t)]eμt
(allg. Fall) (Sonderfall)
(C1 , C2 Integrationskonstanten, u1 , u2 sind T periodische Funktionen, μ1 , μ2 und μ Konstanten). Die Größen exp (μi T ) = si (i = 1, 2) und exp (μT ) = s sind die Wurzeln bzw. die Doppelwurzel der charakteristischen quadratischen Gleichung, die (4-27) zugeordnet ist. Sie bestimmen das Stabilitätsverhalten der Lösung. Sie werden durch numerische Integration von (4-27) über eine einzige Periode T berechnet, und zwar in den folgenden Schritten. 1. Schritt: Man führt die normierte Zeit τ = 2πt/T und die normierte Variable y = q/q0 ein, wobei q0 eine beliebige konstante Bezugsgröße der Dimension von q ist. Dann nimmt (4-27) die normierte Form y + p∗1 (τ)y + p∗2 (τ)y = 0
(4-28)
mit = d/dτ und mit 2π-periodischen Funktionen p∗1 (τ) und p∗2 (τ) an. 2. Schritt: Die normierte Differenzialgleichung wird numerisch von τ = 0 bis τ = 2π integriert, und zwar einmal mit den Anfangsbedingungen y(0) = 1, y (0) = 0 und einmal mit den Anfangsbedingungen y(0) = 0, y (0) = 1. Für y(2π) und y (2π) ergeben sich im 1. Fall bestimmte Zahlen y1 und y1 und im 2. Fall
E59
E60
E Technische Mechanik / Mechanik fester Körper
bestimmte Zahlen y2 und y2 . Mit diesen erhält man die charakteristische quadratische Gleichung 6 7 6 7 (4-29) s2 − y1 + y2 s + y1 y2 − y2 y1 = 0 . Die Beträge ihrer (reellen oder konjugiert komplexen) Wurzeln s1 und s2 entscheiden nach Tabelle 4-2, ob die allgemeine Lösung y(τ) und damit auch die allgemeine Lösung q(t) von (4-27) asymptotisch stabil, grenzstabil oder instabil ist. Stabilitätskarten. Die Koeffizienten p∗1 (τ) und p∗2 (τ) in (4-28) hängen i. Allg. von Parametern ab. Eine Stabilitätskarte entsteht, wenn man zwei Parameter P1 und P2 auswählt und in einem Koordinatensystem mit den Achsen P1 und P2 die Grenze zwischen Gebieten mit stabilen Lösungen und Gebieten mit instabilen Lösungen einzeichnet. Beispiel 4-5: Sei (4-28) die Gleichung y + 2cy + (λ + γ cos τ)y = 0. Im Fall c = 0 heißt sie Mathieu’sche Differenzialgleichung (siehe A 28). Die beiden Parameter seien λ und γ. Bild 4-8 zeigt die Stabilitätskarten für c = 0 und für verschiedene Dämpfungskonstanten c > 0. Ein System mit Parametererregung kann zusätzlich fremderregt sein. Dann tritt an die Stelle von (4-27) die Gleichung q¨ + p1 (t)q˙ + p2 (t)q = F(t). Bei periodischer Fremderregung kann man sich auf den Sonderfall F(t) = F0 cos Ωt (ein einzelnes Glied der Fourierreihe) beschränken, weil das Superpositionsprinzip gilt. Wenn das System ohne Fremderregung stabil ist, gibt es Erregerkreisfrequenzen Ω, bei denen Resonanz auftritt. Systeme mit mehreren Freiheitsgraden werden durch Differenzialgleichungssysteme mit von t abhängigen Koeffizienten beschrieben. Ausführliche Darstellungen vieler Probleme mit Beispielen siehe in [5].
Bild 4-8. Stabilitätskarten für die Differenzialgleichung y +
2cy + (λ + γ cos τ) y = 0 für verschiedene Werte von c. Für c = 0 (Mathieu-Gleichung) sind die Lösungen q(t) für Parameterkombinationen λ, γ im schattierten Bereich stabil. Mit zunehmender Dämpfung c werden die Stabilitätsbereiche größer
4.4 Freie Schwingungen eindimensionaler Kontinua 4.4.1 Saite. Zugstab. Torsionsstab
Freie Transversalschwingungen u(x, t) einer gespannten Saite (Bild 4-9a; u Auslenkung, S Vorspannkraft, μ lineare Massenbelegung), freie Longitudinalschwingungen u(x, t) eines geraden Stabes (Bild 4-9b; u Längsverschiebung, EA Längssteifigkeit,
Dichte) und freie Torsionsschwingungen u(x, t) eines Stabes (Bild 4-9c; u Drehwinkel, GIT Torsi-
Tabelle 4-2. Stabilitätskriterien für Gl. (4-28) mit periodi-
schen Koeffizienten p∗1 (τ) und p∗2 (τ). s1 und s2 sind die Wurzeln von (4-29). |s1 | < 1 |s1 | = 1
|s1 | > 1
|s2 | < 1 asympt. stabil grenzstabil
instabil
|s2 | = 1 grenzstabil y1 = y2 = 0? ja: grenzstabil nein: instabil instabil
|s2 | > 1 instabil instabil instabil
Bild 4-9. Systemparameter und Koordinaten u(x, t) für die schwingende Saite (a), den longitudinal schwingenden Stab (b) und den Torsionsstab (c)
4 Schwingungen
onssteifigkeit, Ip polares Flächenmoment, Dichte) werden durch die Wellengleichung beschrieben: ∂2 u ∂2 u = c2 2 2 ∂t ∂x
(4-30)
mit c2 = S /μ bzw. c2 = E/ bzw. c2 = GIT /( Ip ). c heißt Ausbreitungsgeschwindigkeit der Welle. Werte von E/ sind ≈ 5100 m/s in Stahl, Aluminium und Glas (fast gleich), ≈ 4000 m/s in Beton, ≈ 1450 m/s in Wasser und ≈ 350 m/s in Kork. Zu (4-30) gehören Anfangsbedingungen für u(x, t0 ) und für [∂u/∂t](x,t0) . Außerdem müssen Randbedingungen formuliert werden, und zwar für Lagerpunkte, für Endpunkte und für Punkte, in denen andere Systeme (Stäbe, Saiten oder anderes) angekoppelt sind. Beispiel: Zwei longitudinal schwingende Stäbe 1 und 2 sind mit ihren Enden bei x = 0 zu einem durchgehenden Stab verbunden. Randbedingungen schreiben vor, dass die Verschiebungen und die Längskräfte beider Stäbe bei x = 0 jeweils gleich sind:
(u1 − u2 )|(0,t) ≡ 0 , ∂u1 ∂u2 − E 2 A2 ≡0. E 1 A1 ∂x ∂x (0,t)
(4-31)
Wellen. Reflexion. Transmission
Jede Funktion u(x, t) = f (x − ct) + g(x + ct) mit beliebigen stückweise zweimal differenzierbaren Funktionen f und g ist Lösung von (4-30). f (x − ct) stellt eine in positiver x-Richtung mit der Geschwindigkeit c fortlaufende Welle gleichbleibenden Profils dar und g(x + ct) eine andere in negativer Richtung laufende Welle (Bild 4-10a). Die spezielle Funktion 2π (x − ct) f (x − ct) = A cos λ 2πx = A cos − ωt λ mit ω = 2πc/λ ist für t = const eine harmonische Funktion von x mit der Wellenlänge λ und bei x = const eine harmonische Funktion von t mit der Kreisfrequenz ω, wobei ωλ = 2πc = const ist (Bild 4-10b). Diese Welle heißt harmonische Welle. Eine Welle, die einen Punkt mit Randbedingungen erreicht, löst dort i. Allg. eine reflektierte Welle aus,
Bild 4-10. (a) Nichtharmonische Welle und (b) harmoni-
sche Welle mit der Wellenlänge λ
die mit derselben Ausbreitungsgeschwindigkeit in die Gegenrichtung läuft. Wenn die Randbedingungen die Kopplung mit einem anderen Stab (einer anderen Saite) ausdrücken, dann löst die ankommende Welle in diesem (in dieser) eine transmittierte Welle aus. Für Wellen gilt das Superpositionsprinzip. Daraus folgt, dass reflektierte und transmittierte Wellen, die durch eine Summe von ankommenden Wellen ausgelöst werden, so berechnet werden, dass man zu jeder einzelnen ankommenden Welle die reflektierte und die transmittierte Welle berechnet und diese dann summiert. Reflektierte und transmittierte Wellen sind durch Randbedingungen eindeutig bestimmt, wenn die ankommende Welle gegeben ist. Beispiel: Zwei longitudinal schwingende Stäbe 1 und 2 sind mit ihren Enden bei x = 0 so gekoppelt, dass die Randbedingungen (4-31) gelten. Stab 1 ist der Stab im Bereich x < 0. In Stab 1 läuft die gegebene Welle f (x − c1 t) auf die Koppelstelle zu. Sie löst in Stab 1 die unbekannte reflektierte Welle gr (x + c1 t) und in Stab 2 die unbekannte transmittierte Welle ft (x − c2 t) aus. Mit dem Ansatz u1 (x, t) = f + gr , u2 (x, t) = ft ergeben sich aus (4-31) die Wellen 1−α 2 c1 (x − c2 t) gr = f (−x − c1 t) , ft = f 1+α 1 + α c2 mit α = (A2 /A1 )[E2 2 /(E1 1 )]1/2 . Dieselben Gleichungen gelten mit α = [G2 2 IT2 Ip 2 /(G1 1 IT1 Ip 1 )]1/2
E61
E62
E Technische Mechanik / Mechanik fester Körper
für gekoppelte Torsionsstäbe und mit α = c1 /c2 = (μ2 /μ1 )1/2 für gekoppelte Saiten. Wenn Stab 1 bei x = 0 ein festes Ende (ein freies Ende) hat, ist α = ∞ (bzw. α = 0). Wenn dann f die harmonische Welle f = A cos[2π/λ(x − c1 t)] ist, bildet sich die stehende Welle aus (Bild 4-11): 2A sin(2πx/λ) sin ωt (festes Ende) u(x, t) = 2A cos(2πx/λ) cos ωt (freies Ende) (4-32) mit ω = 2πc1 /λ . Erzwungene Schwingungen von Stäben und Saiten sind die Folge von Fremderregung. Sie kann die Form von zusätzlichen Erregerfunktionen in (4-30) haben (z. B. im Fall von zeitlich vorgeschriebenen Streckenlasten an den Systemen in Bild 4-9). Sie kann auch die Form von gegebenen Erregerfunktionen in Randbedingungen haben (z. B. bei zeitlich vorgeschriebenen Lagerbewegungen). Wenn sie nur diese letztere Form hat, dann ist der Lösungsansatz für (4-30) u(x, t) = f (x − ct) + g(x + ct). Für die Wellen f und g ergibt sich aus den Randbedingungen ein System von linearen, inhomogenen, gewöhnlichen Differenzialgleichungen. Weiteres zur Wellenausbreitung siehe in [9–13]. Eigenkreisfrequenzen. Eigenformen
Auch der Bernoulli’sche Separationsansatz u(x, t) = f (t) · g(x) mit
f (t) = A cos ωt + B sin ωt , g(x) = a cos(ωx/c) + b sin(ωx/c)
A, B, a, b und ω werden wie folgt bestimmt. Randbedingungen für u und für ∂u/∂x liefern ein System homogener linearer Gleichungen für die Koeffizienten a und b (bei mehrfeldrigen Problemen zwei Koeffizienten je Feld). Das System hat nur für die abzählbar unendlich vielen Eigenwerte ωk (k = 1, 2, . . .) seiner transzendenten charakteristischen Frequenzgleichung (das ist die Gleichung: Koeffizientendeterminante = 0) nichttriviale Lösungen ak , bk und damit Eigenformen gk (x) = ak cos(ωk x/c) + bk sin(ωk x/c) . Die Eigenformen erfüllen die Orthogonalitätsbeziehungen (Integration über den ganzen Bereich) " gi (x)g j (x) dx = 0 (i j) . (4-35) Beispiel 4-6: Für den Torsionsstab mit Endscheibe in Bild 4-12a liest man aus Bild 4-12b die Randbedingungen g(0) = 0 und GIT (∂u/∂x)|(l,t) = −J(∂2 u/∂t2 )|(l,t) oder GIT (dg/dx)|l − ω2 Jg(l) = 0 ab. Daraus folgt mit (4-34) a = 0 und GIT ω ωl ωl b cos − ω2 J sin =0. c c c Das liefert die Frequenzgleichung ωl GIT l lIp ωl tan = . = c c J Jc2 Sie hat unendlich viele Eigenwerte ωk (k = 1, 2, . . .). Zu ωk gehören die Konstanten ak = 0 und bk = 1
(4-33) (4-34)
löst die Wellengleichung (4-30). g(x) heißt Eigenform und ω Eigenkreisfrequenz. Die Konstanten
Bild 4-11. Hüllkurven von stehenden Wellen bei festem Ende (a) und bei freiem Ende (b) an der Stelle x = 0
Bild 4-12. a Massebehafteter Torsionsstab mit Endscheibe. b Die Schnittmomente an der Verbindungsstelle von Stab und Scheibe sind mithilfe von (5-68) und (3-17) durch den Drehwinkel u ausgedrückt
4 Schwingungen
(willkürliche Normierung) und damit die Eigenform gk (x) = sin(ωk x/c). In der allgemeinen Lösung (4-33) u(x, t) =
∞
(Ak cos ωk t + Bk sin ωk t)gk (x)
(4-36)
k=1
werden die Ak und Bk zu gegebenen Anfangsbedingungen u(x, 0) = U(x) und ∂u/∂t|(x,0) = V(x) mithilfe von (4-35) ermittelt (Integrationen über den ganzen Bereich): " " U(x)gi (x) dx = Ai g2i (x) dx , " " V(x)gi (x) dx = ωi Bi g2i (x) dx (i = 1, 2, . . .) . (4-37) 4.4.2 Biegeschwingungen von Stäben
Hierzu siehe auch 5.13 Finite Elemente und 5.14 Übertragungsmatrizen. Bei Vernachlässigung von Schubverformung und Drehträgheit der Stabelemente lautet die Differenzialgleichung der Biegeschwingung ∂2 [EIy ∂2 w/∂x2 ] ∂2 w +
A = q(x, t) ∂x2 ∂t2
(4-38)
(w(x, t) Durchbiegung, EIy (x) Biegesteifigkeit, A(x) Querschnittsfläche, Dichte, q(x, t) Streckenlast). Sobald w(x, t) bekannt ist, ergibt sich das Biegemoment My (x, t) = −EIy ∂2 w/∂x2 . Bei konstantem Stabquerschnitt mit q ≡ 0 vereinfacht sich (4-38) zu 4 ∂2 w 2 ∂ w = −C ∂t2 ∂x4
mit C 2 =
EIy .
A
(4-39)
Diese Gleichung wird durch Bernoullis Separationsansatz gelöst: w(x, t) = f (t) · g(x) mit
(4-40)
f (t) = A cos ωt + B sin ωt ,
g(x) = a cosh(x/λ) + b sinh(x/λ) + c cos(x/λ) + d sin(x/λ) ,
(λ = (C/ω)1/2 ) .
(4-41)
g(x) heißt Eigenform und ω Eigenkreisfrequenz des Stabes. Die Konstanten A, B, a, b, c, d und λ werden
wie folgt bestimmt. Randbedingungen für w, ∂w/∂x, das Biegemoment My ∼ ∂2 w/∂x2 und die Querkraft Qz ∼ ∂3 w/∂x3 liefern ein System homogener linearer Gleichungen für die Koeffizienten von g(x) (4n Gleichungen und Koeffizienten bei einem nfeldrigen Stab). Es hat nur für die abzählbar unendlich vielen Eigenwerte (Eigenkreisfrequenzen) ωk (k = 1, 2, . . .) seiner transzendenten charakteristischen Frequenzgleichung (Koeffizientendeterminante = 0) nichttriviale Lösungen ak , bk , ck , dk und damit Eigenformen gk (x). Die Eigenformen erfüllen die Orthogonalitätsbeziehungen (Integration über den ganzen Stab) " gi (x)g j (x) dx = 0 (i j) . (4-42) Tabelle 4-3 gibt Eigenkreisfrequenzen und Eigenformen für verschieden gelagerte Stäbe an. In der allgemeinen Lösung (4-40) ∞ (Ak cos ωk t + Bk sin ωk t)gk (x) (4-43) w(x, t) = k=1
mit beliebig normierten Eigenformen gk (x) werden die Ak und Bk zu gegebenen Anfangsbedingungen w(x, 0) = W(x), ∂w/∂t|(x,0) = V(x) mithilfe von (4-42) ermittelt (Integrationen über den ganzen Stab): " " W(x)gi (x) dx = Ai g2i (x) dx , (4-44) "
" V(x)gi (x) dx = ωi Bi
g2i (x) dx
(i = 1, 2, . . .) .
Bei Biegeschwingungen von Laufradturbinenschaufeln wirkt sich die Fliehkraft versteifend aus (vgl. das Beispiel zu Bild 3-4). Die Abhängigkeit einer Eigenkreisfrequenz ωi von der Winkelgeschwindigkeit Ω des Laufrades hat die Form ωi (Ω) = ωi0 (1 + ai Ω2 )1/2 mit ωi0 = ωi (0) und ai = const. Einzelheiten siehe in [14,15].
4.5 Näherungsverfahren zur Bestimmung von Eigenkreisfrequenzen 4.5.1 Rayleigh-Quotient
Wenn ein aus Punktmassen, starren Körpern, masselosen Federn und massebehafteten Kontinua bestehendes konservatives System in einer Eigenform mit
E63
Tabelle 4-3. Eigenkreisfrequenzen ωk = C/λ2k und Eigenformen gk (x) von Biegestäben. Bezeichnungen wie im Text. gk ist so normiert, dass 0
.l
g2k (x/λk )dx = l
E64 E Technische Mechanik / Mechanik fester Körper
0
(4-47)
Als Näherungen für die erste Eigenform werden die Biegelinien des Kragträgers mit Einzellast am Ende, w1 (x) = 3(x/l)2 − (x/l)3 , und mit konstanter Streckenlast, w2 (x) = 6(x/l)2 − 4(x/l)3 + (x/l)4 , verwendet. w1 und w2 liefern die Rayleigh-Quotienten R1 = 9,30EIy/( Al4 ) bzw. R2 = 9,32EIy/( Al4 ). Der kleinere ist die bessere Näherung für ω21 .
Bild 4-13. Massebehafteter Biegestab mit Endscheibe und
Feder
(5-104)
(3-19)
w2 (r) dr
− m(x2 + y2 + z2 ) + Jϕ2
" π h
A(x)w2 (x) dx (5-83) " "
h w2 (x, y) dx dy (5-103)
Ip (x)ϕ2 (x) dx "
"
A(x)u2 (x) dx
4.1.2
∗ 2T˜ max qT Mq "
Schwingendes System und Näherung für Eigenform 2V˜ max T n-Freiheitsgrad-System; q = [q1 . . . qn ]T q " Kq EA(x)u 2 (x) dx Stab bei Longitudinalschwingung; u(x) " GIT (x)ϕ 2 (x) dx Stab bei Torsionsschwingung; ϕ(x) " EIy (x)w2 (x) dx Stab bei Biegeschwingung; w(x) ⎛ 2 2 ⎞⎤ 2 " " ⎡⎢ ⎜⎜⎜ ∂2 w ∂2 w ∂ w ⎟⎟⎟⎥⎥⎥ ⎢⎢⎢ ∂w ∂2 w ⎜ Platte kartesisch; w(x, y) D ⎣⎢ ∂x2 + ∂y2 − 2(1 − v) ⎜⎝ ∂x2 · ∂y2 − ∂x∂y ⎟⎟⎠⎥⎥⎦ dx dy ⎤ 2 " ⎡⎢ 2 dw d2 w ⎥⎥⎥⎥ ⎢ d w 1 dw Platte rotationssymmetrisch; w(r) πD ⎢⎢⎢⎣r + − 2(1 − v) · · ⎥ dr r dr dr dr 2 ⎦ dr 2 masselose (Dreh-)Feder; Auslenkung x bzw. ϕ kx2 bzw. kϕ2 Starrkörper; Translation x, y, z; Drehwinkel ϕ −
Beispiel 4-7: Für den Biegestab mit Starrkörper und Feder in Bild 4-13 liefert Tabelle 4-4 als Summen von Größen für die drei Komponenten Stab, Körper und Feder ⎫ .l ⎪ ⎪ 2 2 ⎪ ˜ ⎪ 2Vmax = EIy w (x) dx + kw (l) , ⎪ ⎪ ⎪ ⎬ 0 ⎪ l ⎪ . ⎪ ⎪ ⎪ ∗ 2T˜ max = A w2 (x) dx + mw2 (l) + Jw 2 (l) . ⎪ ⎪ ⎭
Tabelle 4-4. Energieausdrücke zur Berechnung von Eigenkreisfrequenzen mit dem Rayleigh-Quotienten (4-46) und dem Ritz-Verfahren (4-48)
der Eigenkreisfrequenz ω schwingt, sind die maximale potenzielle Energie Vmax bei Richtungsumkehr und die maximale kinetische Energie T max beim Durchgang durch die Ruhelage gleich, und T max ist propor∗ tional zu ω2 . Also ist mit T max = ω2 T max ∗ ω2 = Vmax /T max . (4-45) ∗ Vmax und T max sind nur von der Eigenform abhängig. Tabelle 4-4 gibt Formeln zur Berechnung für einige Systeme bzw. Systemkomponenten an. Für ein Sys∗ tem aus mehreren Komponenten sind Vmax und T max jeweils die Summen der Ausdrücke für die einzelnen ∗ Näherungen für Komponenten. Seien V˜ max und T˜ max ∗ Vmax bzw. T max , die aus Näherungen für die Eigenform zur kleinsten Eigenkreisfrequenz ω1 berechnet werden. Dann gilt ∗ ω21 R mit R = V˜ max /T˜ max . (4-46) R heißt Rayleigh-Quotient (vgl. A 27). Das Gleichheitszeichen gilt nur, wenn R mit der tatsächlichen Eigenform berechnet wird. Näherungen für Eigenformen müssen alle geometrischen Randbedingungen (für Randverschiebungen und Neigungen) erfüllen.
Hinweise
4 Schwingungen
E65
E66
E Technische Mechanik / Mechanik fester Körper
4.5.2 Ritz-Verfahren
Wenn die erste Eigenform für den RayleighQuotienten nicht gut geschätzt werden kann, wird sie als Linearkombination w(x) = c1 w1 (x) + . . .+ cn wn (x) von n sinnvoll erscheinenden, alle geometrischen Randbedingungen erfüllenden Näherungen w1 (x), . . . , wn (x) mit unbekannten Koeffizienten c1 , . . . , cn angesetzt. Häufig genügt n = 2. Mit diesem Ansatz ist R in (4-46) eine homogenquadratische Funktion von c1 , . . . , cn . Das kleinste R (die beste Näherung für ω21 ) ist der kleinste Eigenwert R des homogenen linearen Gleichungssystems für c1 , . . . , cn ∂T˜ ∗ ∂V˜ max − R max = 0 (i = 1, . . . , n) . ∂ci ∂ci
(4-48)
Beispiel 4-8: Für Bild 4-13 wird w(x) = c1 w1 (x) + c2 w2 (x) mit den Funktionen w1 und w2 von Beispiel 4-7 angesetzt. Mit denselben Ausdrücken V˜ max und ∗ T˜ max wie dort ergibt sich für (4-48) 20 EIy /( Al4 ) − 2,15 R 18EIy/( Al4 ) − 3,28 R 18 EIy /( Al4 ) − 3,28 R 46,8 EIy/( Al4 ) − 5,02 R c1 × =0. c2 Die Bedingung „Koeffizientendeterminante = 0“ liefert als kleineren von zwei Eigenwerten R = 9,24 EIy/( Al4 ). Diese Näherung für ω21 ist wesentlich besser als die in Beispiel 4-7.
4.6 Autonome nichtlineare Schwingungen mit einem Freiheitsgrad
q˙ = ±[2(E − V(q))/m(q)]1/2 und bei weiterer Integration −1/2 " 2(E − V(q)) dq . t − t0 = m(q) Beispiel 4-9: Beim ebenen Pendel ist g(q, q˙ ) = ω20 sin q. Die Gleichung der Phasenkurve der freien Schwingung mit der Amplitude A ist q˙ = ±ω0 [2(cos q − cos A)]1/2 . Im Phasenporträt von Bild 4-14 sind die geschlossenen Kurven zu periodischen Schwingungen um die stabilen Gleichgewichtslagen q = 0, ± 2π usw. von den offenen Kurven zu Bewegungen mit Überschlag durch eine Separatrix getrennt. Sie gehört zur Bewegung aus der Ruhe heraus aus der instabilen Gleichgewichtslage q = π und hat die Gleichung q˙ = ±ω0 [2(1 + cos q)]1/2 = ±2ω0 cos(q/2) . Die Periodendauer der freien Schwingung mit der Amplitude A ist 2π A2 11A4 4K(k) + + ... ≈ 1+ T= ω0 ω0 16 3 072 mit dem vollständigen elliptischen Integral K und dem Modul k = sin(A/2). Die exakte Lösung q(t) der Differenzialgleichung ist sin(q/2) = k sn(ω0 t, k) . Wenn es zu (4-49) keinen Energieerhaltungssatz gibt, dann bedeutet das Auftreten von q˙ Dämpfung oder
Sie werden durch eine Differenzialgleichung q¨ + g(q, q˙ ) = 0
Aus T + V = E folgt stets die Gleichung der Phasenkurven
(4-49)
beschrieben. Wenn es zu (4-49) einen Energieerhaltungssatz T + V = E = const mit einer kinetischen Energie T = m(q)q˙ 2/2 und einer potenziellen Energie V(q) gibt, dann beschreibt (4-49) freie Schwingungen eines konservativen Systems (Beispiel: Das System von Bild 3-8). Wenn g(q, q˙ ) nur von q abhängt, dann lautet der Energieerhaltungssatz " 2 q˙ /2 + g(q) dq = const .
Bild 4-14. Phasenporträt des ebenen Pendels
4 Schwingungen
Näherung für (4-50). Das ist die Form von (4-1) mit dem Dämpfungsgrad D = εb/(2ω0) nach (4-6) und mit der Lösung (4-8). Diese Näherung ist nur brauchbar, wenn q und q˙ dauernd so klein sind, dass der Abbruch der Taylorreihe sinnvoll ist. Sie liefert z. B. keine Aussagen über Grenzzyklen. 4.6.2 Harmonische Balance Bild 4-15. Phasenporträt eines Van-der-Pol-Schwingers
Anfachung oder eine Kombination von beidem. Bei einer Klasse von Schwingern, den sog. selbsterregten, kann es dennoch periodische Lösungen geben. Sie erscheinen im Phasenporträt (Bild 4-15) als einzelne geschlossene Kurven, sog. Grenzzyklen, in die andere Phasenkurven entweder asymptotisch einmünden oder aus denen sie herauslaufen. Beispiele für selbsterregte Schwingungen sind das Flattern von Flugzeugkonstruktionen, Brücken, Türmen und Wasserbaukonstruktionen in Luft- bzw. Wasserströmungen und das Rattern von Werkzeugen in Drehmaschinen (vgl. den Text zu Bild 2-32). Die im Folgenden geschilderten Näherungsmethoden setzen voraus, dass (4-49) die Form q¨ + ω20 q + ε f (q, q˙ ) = 0
(4-50)
hat. Dabei soll f (q, q) ˙ eine nichtlineare Funktion mit f (0, 0) = 0 sein, deren Taylorentwicklung um den Punkt q = 0, q˙ = 0 kein lineares Glied mit q enthält. ε ist ein kleiner dimensionsloser Parameter, der ggf. künstlich eingeführt wird. Beispiele für (4-50) sind der Duffing-Schwinger mit q¨ + ω20 q + εμq3 = 0
(4-51)
(konservatives System; Feder-Masse-Schwinger mit je nach Vorzeichen von εμ progressiver oder degressiver Federkennlinie) und der Van-der-Pol-Schwinger (ein selbsterregter Schwinger) mit q¨ + ω20 q − εμ(α2 − q2 )q˙ = 0 .
(4-52)
4.6.1 Methode der kleinen Schwingungen
Die Taylorentwicklung von f (q, q) ˙ in (4-50) um den Punkt (0,0) hat die Form bq˙ + Glieder höherer Ordnung in q und q. ˙ Also ist q¨ + εbq˙ + ω20 q = 0 eine
Diese Methode liefert Näherungen für periodische Lösungen von (4-50) bei konservativen und bei selbsterregten Schwingern. Für die periodische Lösung wird der Ansatz q = A cos ωt mit Konstanten A und ω gemacht. A muss nicht klein sein. Die Funktion f (q, q) ˙ = f (A cos ωt, −ωA sin ωt) = F(t) ist periodisch in t und hat folglich eine Fourierreihe F(t) = a0 + a1 (A) cos ωt + b1 (A) sin ωt + . . . = a0 + a∗ q + b∗ q˙ + . . . mit a∗ (A) = a1 /A und b∗ (A) = −b1 /(Aω). Sei a0 = 0. Das ist bei gewissen Symmetrieeigenschaften von f (q, q) ˙ erfüllt, z. B. wenn f nur von q abhängt und f (−q) = − f (q) gilt. Dann lautet (4-50) näherungsweise q¨ + εb∗ q˙ + (ω20 + εa∗ )q = 0. Beim konservativen Schwinger ist b∗ = 0, und 1/2 a∗ (A) ω(A) = ω20 + εa∗ (A) ≈ ω0 + ε 2ω0 ist die vom Maximalausschlag A abhängige Kreisfrequenz. Beispiel 4-10: Beim Duffing-Schwinger (4-51) ist μA3 3μA3 F(t) = μA3 cos3 ωt = cos ωt + cos 3 ωt . 4 4 Das ist bereits die Fourierreihe mit b∗ = 0 und a∗ = 3 μA2 /4. Man erhält ω(A) = ω0 +
3 εμA2 . 8ω0
Beim Schwinger mit Selbsterregung liefert die Bedingung b∗ (A) = 0 die Maximalausschläge von Grenzzyklen. Beispiel 4-11: Van-der-Pol-Schwinger (4-52). Die Fourierreihe liefert a0 = 0, a∗ = 0, b∗ = μ(A2 /4 − α2 ) und damit einen Grenzzyklus mit dem Maximalausschlag A = 2α und mit der Kreisfrequenz ω0 .
E67
E68
E Technische Mechanik / Mechanik fester Körper
4.6.3 Störungsrechnung nach Lindstedt
Die Störungsrechnung nach Lindstedt liefert Näherungen für periodische Lösungen von (4-50) bei konservativen und bei selbsterregten Schwingern. Der Lösungsansatz ist q(t) = A cos ωt + εq1 (t) + ε2 q2 (t) + . . .
(4-53)
Das ist bereits die Fourierreihe. Der Koeffizient von cos ωt ist null für ω1 = 3μA2 /(8ω0 ), sodass in erster Näherung ω = ω0 +3εμA2 /(8ω0 ) den Zusammenhang zwischen Kreisfrequenz ω und Amplitude A angibt. Die partikuläre Lösung zum Rest von f1 ist q1 (t) = μA3 /(32ω2 ) cos 3ωt. Beispiel 4-13: Mit (4-56) ist
mit unbekannten periodischen Funktionen qi (t) und mit einer von A abhängigen Kreisfrequenz ω = ω0 + εω1 + ε2 ω2 + . . .
q¨ i + ω2 qi = fi (A cos ωt, q1 (t), . . . , qi−1 (t), ω1 , . . . , ωi ) (i = 1, 2, . . .)
(4-55)
mit Funktionen fi , die sich dabei aus f (q, q˙ ) ergeben. Insbesondere ist f1 = 2ω0 ω1 A cos ωt − f (A cos ωt, −Aω sin ωt) . (4-56) Die Gleichungen (4-55) werden nacheinander in jeweils drei Schritten gelöst. 1. Schritt: Entwicklung von fi in eine Fourierreihe; sie enthält Glieder mit cos ωt und bei selbsterregten Schwingern auch mit sin ωt, die zu säkularen Gliedern der Form t cos ωt und t sin ωt in der Lösung qi (t) führen. 2. Schritt: Bei konservativen Systemen wird aus der Bedingung, dass der Koeffizient von cos ωt verschwindet, ωi bestimmt; bei selbsterregten Schwingern werden aus der Bedingung, dass die Koeffizienten von cos ωt und von sin ωt verschwinden, ωi und A bestimmt. 3. Schritt: Zum verbleibenden Rest von fi wird die partikuläre Lösung qi (t) bestimmt. Beispiel 4-12: Duffing-Schwinger (4-51): Mit (4-56) ist f1 = 2ω0 ω1 A cos ωt − μA3 cos3 ωt 3μA3 μA3 = 2ω0 ω1 A − cos 3 ωt . cos ωt − 4 4
(4-52):
f1 = 2ω0 ω1 A cos ωt + μ(α2 − A2 cos2 ωt)(−Aω sin ωt) A2 2 = 2ω0 ω1 A cos ωt − μ α − Aω sin ωt 4
(4-54)
mit unbekannten ωi (A) für i = 1, 2, . . . Einsetzen von (4-53) und von ω0 aus (4-54) in (4-50), Ordnen nach Potenzen von ε und Nullsetzen der Koeffizienten aller Potenzen liefert
Van-der-Pol-Schwinger
+
μA3 ω sin 3 ωt . 4
Die Koeffizienten von cos ωt und von sin ωt sind null für ω1 = 0, A = 2α, und die partikuläre Lösung von (4-55) zum Rest von f1 ist q1 (t) = −μA3 /(32ω) sin 3ωt . Damit ist q(t) = 2α cos ω0 t −
εμα3 sin 3ω0 t 4ω0
die erste Näherung für den Grenzzyklus in Bild 4-15.
4.6.4 Methode der multiplen Skalen
Die Methode der multiplen Skalen ist eine Form der Störungsrechnung, die Näherungen für periodische und für nichtperiodische Lösungen von (4-50) bei konservativen und bei nichtkonservativen Schwingern liefert. Einzelheiten siehe in [17]. Die Größen ti = εi t (i = 0, 1, . . . , n) werden als voneinander unabhängige, im Fall ε 1 sehr verschieden schnell ablaufende Zeitvariablen eingeführt (daher die Bezeichnung multiple Skalen). Der Ansatz für die n-te Näherung der Lösung von (4-50) ist q(t) = q0 (t0 , . . . , tn ) + εq1 (t0 , . . . , tn ) + . . . (4-57) + εn qn (t0 , . . . , tn ) mit q0 = A(t1 , . . . , tn ) cos[ω0 t0 + ϕ(t1 , . . . , tn )]
(4-58)
4 Schwingungen
mit unbekannten Funktionen q1 , . . . , qn , A und ϕ. Amplitude A und Phase ϕ sind als von t0 unabhängig, d. h. als allenfalls langsam veränderlich vorausgesetzt. Für die absoluten Zeitableitungen von qi erhält man ⎫ n n ∂qi dtk k ∂qi ⎪ ⎪ ⎪ = · ε ,⎪ q˙ i = ⎪ ⎪ ⎪ ∂t dt ∂t ⎪ k k ⎪ k=0 k=0 ⎬ (4-59) ⎪ n n ⎪ 2 ⎪ ⎪ ∂ qi ⎪ ⎪ ⎪ q¨ i = εk+ j . ⎪ ⎪ ⎭ ∂tk ∂t j k=0 j=0 Einsetzen von (4-57) bis (4-59) in (4-50), Ordnen nach Potenzen von ε und Nullsetzen der Koeffizienten aller Potenzen liefert ∂2 qi + ω20 qi = fi (q0 , . . . , qi−1 ) (i = 1, . . . , n) ∂t02 (4-60) mit Funktionen fi , die sich dabei aus f (q, q˙ ) ergeben. Insbesondere ist ∂2 q0 ∂q0 − f q0 , (4-61) . f1 = −2 ∂t0 ∂t1 ∂t0 Die Gleichungen (4-60) werden nacheinander in jeweils drei Schritten gelöst. 1. Schritt: Entwicklung von fi in eine Fourierreihe; sie enthält cos(ω0 t0 + ϕ) und bei nichtkonservativen Schwingern auch sin(ω0 t0 + ϕ). 2. Schritt: Bei konservativen Schwingern wird aus der Bedingung, dass der Koeffizient von cos(ω0 t0 + ϕ) verschwindet, eine Differenzialgleichung für ϕ als Funktion von ti = εi t gewonnen; bei nichtkonservativen Schwingern werden aus der Bedingung, dass die Koeffizienten von cos(ω0 t0 + ϕ) und von sin(ω0 t0 + ϕ) verschwinden, zwei Differenzialgleichungen für A und ϕ in Abhängigkeit von ti gewonnen. 3. Schritt: Zum verbleibenden Rest von fi wird die partikuläre Lösung qi in Abhängigkeit von t0 bestimmt. Beispiel 4-14: Van-der-Pol-Schwinger (4-52) in der Näherung n = 1: Mit (4-61) ist f1 = 2ω0 (∂A/∂t1) sin(ω0 t0 + ϕ) + 2Aω0 (∂ϕ/∂t1) cos(ω0 t0 + ϕ) + μ[α − A cos (ω0 t0 + ϕ)][−Aω0 sin(ω0 t0 + ϕ)] 2
2
Die Koeffizienten von cos(ω0 t0 + ϕ) und von sin(ω0 t0 + ϕ) sind null, wenn ∂ϕ/∂t1 = 0, ∂A/∂t1 = μA(α2 − A2 /4)/2 ist. Aus der ersten Gleichung folgt, dass ϕ allenfalls von t2 , t3 usw. abhängig sein kann, in erster Näherung also konstant und willkürlich gleich null ist. Die zweite Gleichung hat die stationäre Lösung A = 2α (Grenzzyklus) und instationäre Lösungen A(t1 ) = A(εt) −1/2 , = 2α 1 − 1 − 4α2 /A20 exp(−εμα2 t) die für jeden Anfangswert A0 = A(0) asymptotisch gegen A = 2α streben. Für die stationäre Lösung A = 2α liefert (4-61) mit dem Rest von f1 die partikuläre Lösung q1 (t0 , t1 ) = −μA3 /(32ω0 ) sin 3ω0 t ,
sodass
q(t) = 2α cos ω0 t − εμα /(4ω0 ) sin 3 ω0 t 3
eine Näherung für den Grenzzyklus ist. Bild 4-15 zeigt das Phasenporträt eines Van-der-Pol-Schwingers mit dem Grenzzyklus und mit asymptotisch in ihn einlaufenden Phasenkurven.
4.7 Erzwungene nichtlineare Schwingungen Ein schwach nichtlinearer Schwinger mit Dämpfung hat bei harmonischer Zwangserregung die Differenzialgleichung ˙ = K cos Ωt q¨ + 2Dω0 q˙ + ω20 q + ε f (q, q)
(4-62)
(D Dämpfungsgrad, K Erregeramplitude, Ω Erregerkreisfrequenz). Näherungslösungen für stationäre Bewegungen im eingeschwungenen Zustand können mit folgenden Verfahren bestimmt werden. 4.7.1 Harmonische Balance
Für die stationäre Lösung wird der Ansatz
2
= 2Aω0 (∂ϕ/∂t1 ) cos(ω0 t0 + ϕ) + [2ω0 (∂A/∂t1 ) − μ(α2 − A2 /4)Aω0 ] × sin(ω0 t0 + ϕ) + (μA3 ω0 /4) sin[3(ω0 t0 + ϕ)] .
q(t) = A cos (Ωt − ϕ)
(4-63)
gemacht. Mit derselben Begründung wie bei autonomen Schwingungen (siehe 4.6.2) und mit denselben Größen a∗ (A) und b∗ (A) gilt dann die Näherung
E69
E70
E Technische Mechanik / Mechanik fester Körper
f (q, q) ˙ ≈ a∗ (A)q + b∗ (A)q, ˙ sodass die Näherung für (4-62) lautet: q¨ + (2Dω0 + εb∗ )q˙ + ω20 + εa∗ q = K cos Ωt (4-64) oder nach der Umformung mithilfe von (4-5) q + 2DA q + η2A q = q0 cos ητ
(4-65)
mit τ = ω0 t, η = Ω/ω0 , η2A = 1 + εa∗ /ω20 , 2DA = 2D + εb∗ /ω0 , q0 = K/ω20 . Die stationäre Lösung hat (vgl. (4-17)) die Form (4-63) mit 4 51/2 ⎫ 2 ⎪ ⎪ A = q0 / η2A − η2 + 4D2A η2 ,⎪ ⎬ (4-66) ⎪ ⎪ ⎪ 2 2 ⎭ tan ϕ = 2DA η/ η − η . A
∗
Darin sind mit a und b∗ auch ηA und DA von A abhängig, sodass die Resonanzkurven A(η, D) nur implizit vorliegen. Beispiel 4-15: Beim gedämpften Duffing-Schwinger ˙ = μq3 . Man erhält b∗ = 0, ist in (4-62) f (q, q) ∗ 2 a = 3μA /4 (vgl. 4.6.2). Bild 4-16 zeigt die Abhängigkeit A(η, D) für εμ < 0 und für εμ > 0. Bei quasistatischem Hoch- bzw. Herunterfahren von Ω tritt das Sprungphänomen auf. Die Kurvenäste werden in der Richtung der eingezeichneten Pfeile mit den gestrichelten Sprüngen durchlaufen. Im Fall εμ < 0 treten bei hinreichend kleinen D > 0 weitere, in Bild 4-16a nicht dargestellte Phänomene auf (siehe [16]). 4.7.2 Methode der multiplen Skalen
Dieselben Rechenschritte wie bei autonomen Schwingungen (vgl. 4.6.4) sind auch auf (4-62) anwendbar. Beispiel 4-16: Wenn man das Resonanzverhalten des Schwingers mit der Differenzialgleichung (4-62) im Fall Ω ≈ ω0 und bei schwacher Dämpfung untersuchen will, setzt man Ω = ω0 + εσ, Ωt = ω0 t0 + σt1 , D = εd und K = εk (kleine Verstimmung εσ, kleine Dämpfung εd, kleine Erregeramplitude εk) und definiert f ∗ = f (q, q˙ ) + 2dω0 q˙ − k cos (ω0 t0 + σt1 ) . Mit f ∗ anstelle von f (q, q) ˙ sind (4-62) und (4-50) formal gleich. Alle Rechenschritte im Anschluss an (4-57) werden mit f ∗ anstelle von f durchgeführt. Einzelheiten siehe in [17].
Bild 4-16. Die stationäre Amplitude A eines Duffing-
Schwingers (vgl. (4-51)) bei harmonischer Erregung in Abhängigkeit von der Erregerkreisfrequenz (η = Ω/ω0 ) für εμ < 0 (a) und für εμ > 0 (b). Pfeile bezeichnen den Verlauf der Amplitude, wenn die Erregerkreisfrequenz quasistatisch zu- bzw. abnimmt
4.7.3 Subharmonische, superharmonische und Kombinationsresonanzen
Die Nichtlinearität f (q, q) ˙ in (4-62) kann bewirken, dass sog. subharmonische Resonanzen, superharmonische Resonanzen und Kombinationsresonanzen auftreten. Von subharmonischen Resonanzen oder Untertönen spricht man, wenn die stationäre Antwort des Schwingers auf eine Erregerkreisfrequenz Ω Schwingungen mit Kreisfrequenzen Ω/n (n > 1 ganzzahlig) enthält. Von superharmonischen Resonanzen oder Obertönen spricht man, wenn sie Schwingungen mit Kreisfrequenzen nΩ (n > 1 ganzzahlig) enthält. Von Kombinationsresonanzen spricht man, wenn bei gleichzeitiger Erregung mit mehreren Kreisfrequenzen Ω1 , Ω2 , . . . die stationäre Antwort Schwingungen mit Kreisfrequenzen n1 Ω1 +n2 Ω2 +. . . enthält (n1 , n2 , . . . ganzzahlig). Mit der Methode der multiplen Skalen können sowohl Bedingungen für das Auftreten derartiger Resonanzen als auch deren Amplituden bestimmt werden (siehe [17]). Die Amplituden können so groß werden, dass Schäden an technischen Systemen auftreten.
5 Festigkeitslehre. Elastizitätstheorie
Beispiel 4-17: Beim Duffing-Schwinger und beim Van-der-Pol-Schwinger treten ein Unterton mit Ω/3 und ein Oberton mit 3Ω auf, wenn Ω ≈ 3ω0 bzw. Ω ≈ ω0 /3 ist. Bei zwei gleichzeitig vorhandenen Erregerkreisfrequenzen Ω1 und Ω2 treten Kombinationsresonanzen mit den Kreisfrequenzen (±Ωi ± Ω j ) und (±2Ωi ± Ω j ) für i, j = 1, 2 auf, wenn | ± Ωi ± Ω j | ≈ ω0 bzw. | ± 2Ωi ± Ω j | ≈ ω0 ist.
x, y, z-System heißen u, v und w. In Bild 5-1 sind u(r) und u(r + Δr) die Verschiebungen zweier materieller Punkte des Körpers als Resultat einer beliebig großen Starrkörperverschiebung (Translation und Rotation) und einer beliebig großen Deformation. Auf die Differenz der Abstandsquadrate beider Punkte in der End- bzw. Anfangslage,
5 Festigkeitslehre. Elastizitätstheorie
hat nur die Deformation Einfluss. Taylorentwicklung, Grenzübergang von Δr zu dr und Zerlegung der Vektoren im x, y, z-System liefern für die Differenz den Ausdruck 2dr T εdr mit einer dimensionslosen, symmetrischen Matrix ε, die in der Form
Körper und Bauteile sind unterschiedlichen äußeren Beanspruchungen ausgesetzt (vgl. D 8). Ihr Verhalten bei Beanspruchungen wird durch mechanische Werkstoffeigenschaften gekennzeichnet (vgl. D 9.2). Gegenstand der Festigkeitslehre und der Elastizitätstheorie sind Spannungen, Verzerrungen und Verschiebungen von ein-, zwei- und dreidimensionalen, linear elastischen Körpern im statischen Gleichgewicht unter Kräften und Temperatureinflüssen.
5.1 Kinematik des deformierbaren Körpers 5.1.1 Verschiebungen. Verzerrungen. Verzerrungstensor
Verschiebungen und Verzerrungen eines Körpers werden nach Bild 5-1 in einem raumfesten x, y, z-System beschrieben. Ein materieller Punkt des Körpers befindet sich vor der Verschiebung und Verzerrung am Ort r mit den Koordinaten x, y, z. Der Punkt wird um den Vektor u = u(x, y, z) oder u(r) verschoben. Die von x, y und z abhängigen Koordinaten von u im
Bild 5-1. Körper vor und nach beliebig großer Verschie-
bung, Drehung und Deformation. Ursprüngliche Ortsvektoren r und Verschiebungen u zweier Körperpunkte
[Δr + u(r + Δr) − u(r)]2 − (Δr)2 ,
ε=
1 (F + F T + F F T ) 2
(5-1)
mit einer anderen Matrix F gebildet wird. Deren Element Fi j (i, j = 1, 2, 3) ist die partielle Ableitung der i-ten Koordinate von u nach der j-ten Ortskoordinate, z. B. F13 = ∂u/∂z und F21 = ∂v/∂x. ε heißt Koordinatenmatrix des Euler’schen Deformations- oder Verzerrungstensors im Punkt (x, y, z). Das nichtlineare Glied F F T in (5-1) ist vernachlässigbar, wenn die Deformation des Körpers klein, die Starrkörperdrehung gleich null und die Starrkörpertranslation beliebig groß ist. Dann ist ⎫ ⎡ 1 1 ⎤⎥ ⎪ ⎪ ⎢⎢⎢ ε ⎪ γ xy γ xz ⎥⎥⎥ ⎪ x ⎪ ⎢⎢⎢ ⎪ ⎥ 2 2 ⎪ ⎥⎥⎥ ⎪ ⎢⎢⎢ ⎪ ⎪ ⎥ ⎪ ⎢⎢⎢ 1 1 ⎥⎥⎥ ⎪ ⎪ ⎪ ε = ⎢⎢⎢ γ xy γyz ⎥⎥⎥ , εy ⎪ ⎪ ⎪ ⎢⎢⎢ 2 ⎥ 2 ⎥⎥ ⎪ ⎪ ⎪ ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ 1 ⎢⎣ 1 ⎥⎦ ⎪ ⎪ ⎪ γ xz γyz εz ⎪ ⎪ ⎪ 2 2 ⎬ (5-2) ⎪ ⎪ ∂u ∂u ∂v ⎪ ⎪ ⎪ ⎪ , γ xy = γyx = + εx = ⎪ ⎪ ∂x ∂y ∂x ⎪ ⎪ ⎪ ⎪ ⎪ ∂v ∂v ∂w ⎪ ⎪ ⎪ ⎪ , γyz = γzy = + εy = ⎪ ⎪ ∂y ∂z ∂y ⎪ ⎪ ⎪ ⎪ ⎪ ∂w ∂w ∂u ⎪ ⎪ ⎪ , γzx = γ xz = + .⎪ εz = ⎭ ∂z ∂x ∂z ε x , εy und εz heißen Dehnungen, und γ xy , γyz und γzx heißen Scherungen des Körpers im betrachteten Punkt und im x, y, z-System. Sowohl Dehnungen als auch Scherungen werden Verzerrungen genannt. Die symmetrische Matrix ε beschreibt den Verzerrungszustand im betrachteten Körperpunkt vollständig.
E71
E72
E Technische Mechanik / Mechanik fester Körper
Verschiebungs-Verzerrungs-Beziehungen in Polarkoordinaten siehe in (5-95). Geometrische Bedeutung von Dehnungen und Scherungen. Ein infinitesimales Körperelement um den betrachteten Punkt, das in der Ausgangslage ein Würfel mit Kanten parallel zu den x-, y- und zAchsen ist, ist nach Verschiebung und Deformation des Körpers ein Parallelepiped (Bild 5-2). ε x ist das Verhältnis Verlängerung/Ausgangslänge der Würfelkante parallel zur x-Achse, und γ xy ist die Abnahme des ursprünglich rechten Winkels zwischen den Würfelkanten in Richtung der positiven x- und der positiven y-Achse. Entsprechendes gilt nach Buchstabenvertauschung für die anderen Dehnungen und Scherungen. 5.1.2 Kompatibilitätsbedingungen
Die sechs Verzerrungen ε x , εy , εz , γ xy , γyz und γzx können nicht willkürlich als Funktionen von x, y, z vorgegeben werden, weil sie aus nur drei stetigen Funktionen u(x, y, z), v(x, y, z) und w(x, y, z) ableitbar sein müssen. Sie müssen sechs Kompatibilitätsoder Verträglichkeitsbedingungen erfüllen. Zwei von ihnen lauten: ∂2 ε x ∂2 εy ∂2 γ xy = 0 , (5-3a) + − ∂x∂y ∂y2 ∂x2 ∂γyz ∂γzx ∂γ xy ∂2 ε x ∂ −2 + − + + = 0 . (5-3b) ∂y∂z ∂x ∂x ∂y ∂z Zu jeder von ihnen gehören zwei weitere, die man erhält, wenn man alle Indizes (x, y, z) zyklisch, d. h. durch (y, z, x) und durch (z, x, y) ersetzt. Die
Bild 5-2. Verschiebungen u, v, w und Verzerrungen ε und γ
eines Würfels im Punkt x = y = z = 0. Vorn der unverzerrte Würfel
Minuszeichen in (3b) stehen immer bei ε und bei dem γ, das zweimal nach derselben Koordinate abgeleitet wird. Im Sonderfall des ebenen Verzerrungszustands existieren nur die von z unabhängigen Funktionen u, v, ε x , εy und γ xy . Dann gibt es nur eine Bedingung, und zwar (3a). 5.1.3 Koordinatentransformation
Sei die Koordinatenmatrix ε1 des Verzerrungstensors in (5-2) in einem Körperpunkt in einer Basis e1 (einem x, y, z-System) gegeben, und sei e2 = A e1 eine gegen e1 gedrehte Basis im selben Punkt (zur Bedeutung von A siehe 1.2.1). Die Koordinatenmatrix ε2 des Verzerrungstensors im Achsensystem e2 ist ε2 = A ε1 A T .
(5-4)
5.1.4 Hauptdehnungen. Dehnungshauptachsen
Die Eigenwerte ε1 , ε2 und ε3 und die orthogonalen Eigenvektoren der Matrix ε heißen Hauptdehnungen bzw. Dehnungshauptachsen im betrachteten Körperpunkt. Im Hauptachsensystem sind alle Scherungen null. Das bedeutet, dass sich der Würfel in Bild 5-2 zu einem Quader verformt, wenn seine Kanten parallel zu den Hauptachsen sind. 5.1.5 Mohr’scher Dehnungskreis
Sei die z-Achse eine Dehnungshauptachse, sodass in (5-2) γ xz und γyz null sind. Das ist z. B. in einer in der x, y-Ebene liegenden und nur in dieser Ebene belasteten, dünnen Scheibe der Fall. Es ist auch an jeder freien Körperoberfläche mit z als Normalenrichtung der Fall. Im ξ, η-System nach Bild 5-3 (ϕ ist positiv bei Drehung im Rechtsschraubensinn um die z-Achse) sind 1 1 εξ (ϕ) = (ε x + εy ) + (ε x − εy ) cos 2ϕ 2 2 1 + γ xy sin 2ϕ , (5-5a) 2 1 1 1 γξη (ϕ) = − (ε x − εy ) sin 2ϕ + γ xy cos 2ϕ . 2 2 2 (5-5b) Die Hauptdehnungen ε1 , ε2 und die Winkel ϕ1 , ϕ2 der Dehnungshauptachsen gegen die x-Achse werden durch die Gleichungen bestimmt:
5 Festigkeitslehre. Elastizitätstheorie
kannten Winkel α gemessen (Bild 5-4), vgl. H 3.3.3. Daraus werden die Hauptdehnungen ε1 und ε2 und der Winkel ϕ zwischen der Hauptachse mit der Hauptdehnung ε1 und der mittleren Messachse aus den folgenden Gleichungen berechnet: ⎫ (1 − cos 2α)(ε−α − ε+α ) ⎪ ⎪ ⎪ tan 2ϕ = , ⎪ ⎪ ⎪ (2ε0 − ε−α − ε+α ) sin 2α ⎬ ⎪ ε−α − ε+α ⎪ ε−α + ε+α − 2ε0 cos 2α ⎪ ⎪ 2ε1,2 = ± .⎪ ⎪ 1 − cos 2α sin 2α sin 2ϕ ⎭ (5-7)
Von den zwei Lösungen für ϕ wird eine beliebig gewählt. Das positive Vorzeichen in der zweiten Gleichung gehört zu ε1 . Bild 5-3. Mohr’scher Dehnungskreis
1/2 & ⎫ ⎪ 1% ⎪ ⎪ ε1,2 = ,⎪ ε x + εy ± (ε x − εy )2 + γ2xy ⎬ 2 (5-6) ⎪ ⎪ ⎪ ⎪ ⎭ tan 2ϕ1,2 = γ xy /(ε x − εy ) .
5.2 Spannungen 5.2.1 Normal- und Schubspannungen. Spannungstensor
Dehnungsmessstreifenrosette. Mit einer Dehnungsmessstreifenrosette (Bild 5-4) werden drei Dehnungen ε−α , ε0 und ε+α in drei Messachsen unter dem be-
Jedem Punkt P eines Körpers und jeder ebenen oder gekrümmten Schnittfläche oder Oberfläche durch den Punkt ist ein Spannungsvektor σi zugeordnet, wobei i der Index des Normaleneinheitsvektors ei ist, der die Orientierung der Fläche in dem Punkt kennzeichnet (Bild 5-5). Zur Definition von σi in P werden ein Flächenelement ΔA um P und die Schnittkraft ΔF betrachtet, die an ΔA angreift. σi ist der Grenzwert von ΔF/ΔA im Fall, dass ΔA auf den Punkt P zusammenschrumpft. Die Dimension von σi ist Kraft/Fläche, die SIEinheit ist das Pascal: 1 Pa = 1 N/m2 . Die Koordinate von σi in der Richtung von ei heißt Normalspannung σi , und die Koordinate in der Richtung eines beliebigen Einheitsvektors e j in der Tangentialebene heißt Schubspannung τi j . σi und τi j sind positiv, wenn sie
Bild 5-4. Dehnungsmessstreifenrosette. Rechts im Bild die gemessenen Dehnungen ε−α , ε0 , ε+α entlang den Messachsen und der gesuchte Winkel ϕ der dick gezeichneten Dehnungshauptachsen gegen die mittlere Messachse
Bild 5-5. Spannungsvektor σi , Normalspannung σi , resultierende Schubspannung τi und Schubspannungskoordinate τi j im Punkt P einer Fläche mit dem Normalenvektor ei
Welcher Winkel zu welcher Hauptdehnung gehört, wird dadurch festgestellt, dass man einen der beiden Winkel in (5a) einsetzt. Im Achsensystem von Bild 5-3 liegt der Punkt mit den Koordinaten εξ (ϕ) und (1/2) γξη (ϕ) auf dem gezeichneten sog. Mohr’schen Dehnungskreis. Der Mittelpunkt bei (ε x + εy )/2 und der Kreispunkt (ε x , γ xy /2) für ϕ = 0 bestimmen den Kreis. Der Kreispunkt unter dem Winkel 2ϕ (von ϕ = 0 positiv im Uhrzeigersinn angetragen) hat die Koordinaten εξ (ϕ), γξη (ϕ)/2.
E73
E74
E Technische Mechanik / Mechanik fester Körper
am positiven Schnittufer die Richtung von ei bzw. von e j haben. Das positive Schnittufer ist dasjenige, aus dem ei herausweist. Die Schubspannungen in einem Punkt in drei Ebenen normal zu den Basisvektoren e x , ey und ez eines kartesischen x, y, z-Systems (einer Basis) haben aus Gleichgewichtsgründen die Eigenschaft τi j = τ ji
(i, j = x, y, z)
(5-8)
(Gleichheit zugeordneter Schubspannungen). Die Matrix aller neun Normal- und Schubspannungen in diesen Ebenen ist deshalb symmetrisch: ⎤ ⎡ ⎢⎢⎢ σ x τ xy τ xz ⎥⎥⎥ ⎥ ⎢⎢⎢ σ = ⎢⎢⎢ τ xy σy τyz ⎥⎥⎥⎥⎥ . (5-9) ⎦ ⎣ τ xz τyz σz Sie heißt Koordinatenmatrix des Spannungstensors. Sie bestimmt den Spannungszustand im betrachteten Punkt vollständig. 5.2.2 Koordinatentransformation
Sei die Koordinatenmatrix σ des Spannungstensors in einem Körperpunkt in einer Basis e1 (einem x, y, zSystem) gegeben, und sei e2 = A e1 eine gegen e1 gedrehte Basis im selben Punkt (zur Bedeutung von A siehe 1.2.1). Die Koordinatenmatrix σ2 des Spannungstensors in e2 , d. h. die Matrix der Spannungen in den drei Ebenen normal zu ihren Basisvektoren, ist 1
σ2 = A σ1 AT .
(5-10)
5.2.3 Hauptnormalspannungen. Spannungshauptachsen
Die Eigenwerte σ1 , σ2 und σ3 und die orthogonalen Eigenvektoren der Matrix σ heißen Hauptnormalspannungen bzw. Spannungshauptachsen. Im Hauptachsensystem sind alle Schubspannungen null. Die Eigenwerte sind die Wurzeln des Polynoms −σ3 + I1 σ2 + I2 σ + I3 = 0 mit ⎫ ⎪ I1 = σ x + σy + σz = σ1 + σ2 + σ3 , ⎪ ⎪ ⎪ ⎪ ⎪ I2 = −(σ x σy + σy σz + σz σ x ) + τ2xy + τ2yz + τ2zx ⎪ ⎪ ⎪ ⎪ ⎬ = −(σ1 σ2 + σ2 σ3 + σ3 σ1 ) , ⎪ ⎪ ⎪ ⎪ ⎪ I3 = σ xσy σz + 2τ xy τyz τzx ⎪ ⎪ ⎪ ⎪ 2 2 2 ⎭ − σ x τyz + σy τzx + σz τ xy = σ1 σ2 σ3 . ⎪ (5-11)
I1 , I2 und I3 sind Invarianten des Spannungstensors, d. h. sie sind für ein und denselben Körperpunkt unabhängig von der Richtung des x, y, z-Systems, in dem σ gegeben ist. 5.2.4 Hauptschubspannungen
In einem Punkt mit den Hauptnormalspannungen σ1 , σ2 und σ3 sind die Schubspannungen extremalen Betrages ⎫ ⎪ τ1 = |σ2 − σ3 |/2 , τ2 = |σ3 − σ1 |/2 , ⎪ ⎬ (5-12) ⎪ ⎪ ⎭ τ3 = |σ1 − σ2 |/2 . Sie heißen Hauptschubspannungen. τi (i = 1, 2, 3) tritt in den beiden Ebenen auf, die die Hauptachse i enthalten und gegen die beiden anderen Hauptachsen um 45◦ geneigt sind. Bild 5-6 zeigt als Beispiel τ3 . 5.2.5 Kugeltensor. Spannungsdeviator
Die Matrix σ in (5-9) wird in die Koordinatenmatrizen σm und σ∗ eines Kugeltensors bzw. eines Spannungsdeviators aufgespalten: σ = σm + σ∗ ⎤ ⎡ ⎢⎢⎢ σm 0 0 ⎥⎥⎥ ⎥ ⎢ = ⎢⎢⎢⎢⎢ 0 σm 0 ⎥⎥⎥⎥⎥ ⎦ ⎣ 0 0 σm ⎤ ⎡ ⎢⎢⎢ σ x − σm τ xy τ xz ⎥⎥⎥ ⎥ ⎢ + ⎢⎢⎢⎢⎢ τ xy σy − σm τyz ⎥⎥⎥⎥⎥ ⎦ ⎣ τ xz τyz σz − σm 1 1 mit σm = (σ x + σy + σz ) = (σ1 + σ2 + σ3 ) . 3 3 (5-13)
Bild 5-6. Richtungen der Hauptschubspannung τ3 relativ zu den Spannungshauptachsen
5 Festigkeitslehre. Elastizitätstheorie
σm beschreibt einen hydrostatischen Spannungszustand. σ∗ hat dieselben Hauptachsen wie σ und um σm kleinere Hauptnormalspannungen. 5.2.6 Ebener Spannungszustand. Mohr’scher Spannungskreis
Seien in (5-9) alle Spannungen außer σ x , σy und τ xy null, wie das z. B. in einer in der x, y-Ebene liegenden und nur in dieser Ebene belasteten Scheibe der Fall ist. In einer Schnittebene normal zu einer ξ-Achse (Bild 5-7; ϕ ist positiv bei Drehung im Rechtsschraubensinn um die z-Achse) sind 1 (σ x + σy ) 2 1 + (σ x − σy ) cos 2ϕ + τ xy sin 2ϕ , (5-14a) 2 1 τξη (ϕ) = − (σ x − σy ) sin 2ϕ + τ xy cos 2ϕ . (5-14b) 2 σξ (ϕ) =
Die Hauptnormalspannungen σ1 , σ2 und die Winkel ϕ1 , ϕ2 der Spannungshauptachsen gegen die x-Achse werden durch die Gleichungen bestimmt: 1/2 & ⎫ 1% ⎪ ⎪ σ1,2 = ,⎪ σ x + σy ± (σ x − σy )2 + 4τ2xy ⎪ ⎬ 2 ⎪ ⎪ ⎪ ⎪ ⎭ tan 2ϕ1,2 = 2τ xy /(σ x − σy ) . (5-15) Welcher Winkel zu welcher Hauptspannung gehört, wird dadurch festgestellt, dass man einen der beiden Winkel in (5-14a) einsetzt. Im Achsensystem von Bild 5-7 liegt der Punkt mit den Koordinaten σξ (ϕ) und τξη (ϕ) auf dem gezeichneten sog. Mohr’schen Spannungskreis. Der Mittelpunkt bei (σ x + σy )/2 und der Kreispunkt (σ x , τ xy ) für ϕ = 0 bestimmen den Kreis. Der Kreispunkt unter dem Winkel 2ϕ (von ϕ = 0 positiv im Uhrzeigersinn angetragen) hat die Koordinaten σξ (ϕ), τξη (ϕ). 5.2.7 Volumenkraft. Gleichgewichtsbedingungen
Das Gewicht, die Zentrifugalkraft und einige andere eingeprägte Kräfte sind stetig auf das gesamte Volumen eines Körpers verteilt. Die auf das Volumen bezogene Kraftdichte ΔF/ΔV bzw. ihr Grenzwert für ΔV → 0 hat die irreführende Bezeichnung Volumenkraft. Zum Beispiel ist die Volumenkraft zum
Bild 5-7. Mohr’scher Spannungskreis
Gewicht das spezifische Gewicht g multipliziert mit dem Einheitsvektor in vertikaler Richtung. Seien X(x, y, z), Y(x, y, z) und Z(x, y, z) ganz allgemein die ortsabhängigen Koordinaten der Volumenkraft in einem x, y, z-System. Damit ein Körper im Gleichgewicht ist, müssen die Spannungen in jedem Körperpunkt die Gleichgewichtsbedingungen erfüllen: ⎫ ∂σ x ∂τ xy ∂τ xz ⎪ ⎪ + + + X = 0,⎪ ⎪ ⎪ ⎪ ∂x ∂y ∂z ⎪ ⎪ ⎪ ⎪ ∂τ xy ∂σy ∂τyz ⎬ (5-16) + + + Y = 0, ⎪ ⎪ ⎪ ∂x ∂y ∂z ⎪ ⎪ ⎪ ⎪ ∂τ xz ∂τyz ∂σz ⎪ ⎪ + + +Z = 0. ⎪ ⎭ ∂x ∂y ∂z Im Sonderfall des ebenen Spannungszustandes in der x, y-Ebene lauten sie ∂σ x ∂τ xy + + X = 0, ∂x ∂y
∂τ xy ∂σy + +Y =0. ∂x ∂y (5-17)
Die entsprechenden Gleichungen in Polarkoordinaten siehe in (5-94).
5.3 Hooke’sches Gesetz Die lineare Elastizitätstheorie behandelt Werkstoffe mit linearen Spannungs-Verzerrungs-Beziehungen,
E75
E76
E Technische Mechanik / Mechanik fester Körper
bei denen die zur Erzeugung eines Verzerrungszustandes nötige Arbeit (bei konstanter Temperatur) nur vom Verzerrungszustand selbst und nicht von der Art seines Zustandekommens abhängt (Potenzialeigenschaft; siehe 5.8.1). Wenn der Körper außerdem isotrop, d. h. in allen Richtungen gleich beschaffen ist, bestehen zwischen Spannungen, Verzerrungen und Temperaturänderung ΔT die sechs Beziehungen σi − ν (σ j + σk ) + αΔT, εi = E
τi j γi j = G
(5-18)
(i, j, k = x, y, z verschieden) , bzw. bei Auflösung nach den Spannungen 5⎫ E 4 ν ⎪ ⎪ (ε x + εy + εz ) ⎪ σi = εi + ⎪ ⎪ ⎪ 1+ν 1 − 2ν ⎪ ⎪ ⎪ ⎪ ⎬ E ⎪ ⎪ αΔT (i = x, y, z) , − ⎪ ⎪ ⎪ 1 − 2ν ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ τi j = Gγi j (i, j = x, y, z; i j) .
γyz = γzx = 0 . (5-23b)
(5-19)
(5-20)
sodass außer α nur zwei unabhängige Werkstoffkonstanten auftreten. Werte von E, ν und α siehe in Tabelle 5-1, Werte von E und α auch in Tabelle D 9-2 bzw. Tabelle D 9-6. Aus (5-19) folgt, dass Dehnungshauptachsen und Spannungshauptachsen zusammenfallen. In einem Körperpunkt mit beliebigen Scherungen und mit den Dehnungen ε x , εy und εz ist die Volumendilatation e, das ist der Quotient Volumenzunahme/Ausgangsvolumen, e = ε x + εy + εz = (1 − 2ν)(σ x + σy + σz )/E + 3αΔT .
Der ebene Spannungszustand mit σ x 0, σy 0, τ xy 0 und σz = τ xz = τyz = 0 verursacht nach (5-18) den dreiachsigen Verzerrungszustand ⎫ σ x − νσy ⎪ ⎪ ⎪ + αΔT , εx = ⎪ ⎪ ⎬ E (5-23a) σy − νσ x τ xy ⎪ ⎪ ⎪ ⎪ εy = + αΔT , γ xy = ,⎪ ⎭ E G ν εz = − (σ x + σy ) + αΔT , E
Diese Beziehungen heißen Hooke’sches Gesetz. Zur werkstoffmechanischen Bedeutung siehe D 9.2.1. Zur Formulierung mit Deviatorspannungen und Deviatorverzerrungen siehe (6-2). Im Hooke’schen Gesetz treten der Elastizitätsmodul E, der Schubmodul G (E und G haben die Dimension einer Spannung), die Poisson-Zahl ν und der thermische Längenausdehnungskoeffizient α (Dimension einer Temperatur−1) auf. ν liegt im Bereich 0 ν 1/2. Zwischen E, G und ν besteht die Beziehung E = 2(1 + ν)G ,
Der einachsige Spannungszustand mit σ x 0, σy = σz = τ xy = τyz = τzx = 0 verursacht nach (5-18) den dreiachsigen Verzerrungszustand ⎫ σx σx ⎪ + αΔT , εy = εz = −ν + αΔT , ⎪ εx = ⎬ E E ⎪ ⎪ ⎭ γ xy = γyz = γzx = 0 . (5-22)
Die Darstellung der Spannungen durch ε x und εy ist in diesem Fall ⎫ E ⎪ ⎪ ⎪ σx = [ε + νε − (1 + ν)αΔT ] , ⎪ x y ⎪ ⎪ 1 − ν2 ⎪ ⎪ ⎪ ⎪ ⎬ E (5-24) ⎪ ⎪ [ε + νε − (1 + ν)αΔT ] , σy = y x ⎪ ⎪ ⎪ 1 − ν2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ τ xy = Gγ xy , σz = τ xz = τyz = 0 .
5.4 Geometrische Größen für Stabund Balkenquerschnitte Im Zusammenhang mit der Biegung und Torsion von Stäben und Balken spielen außer der Querschnittsfläche A und dem Flächenschwerpunkt S die folgenden geometrischen Querschnittsgrößen eine Rolle. 5.4.1 Flächenmomente 2. Grades
In einem y, z-System mit beliebigem Ursprung in der Querschnittsfläche sind die axialen Flächenmomente 2. Grades Iy und Iz und das biaxiale Flächenmoment 2. Grades (Deviationsmoment) Iyz der Querschnittsfläche definiert (vgl. B 7.2): " " " z2 dA , Iz = y2 dA , Iyz = − yz dA . Iy = A
(5-21)
A
A
(5-25)
5 Festigkeitslehre. Elastizitätstheorie
Tabelle 5-1. Elastizitätsmodul E, Poisson-Zahl ν und thermischer Längenausdehnungskoeffizient α von Werkstoffen. (Siehe auch die Tabellen D 9-2 für E und D 9-6 für α) Werkstoff Metalle: Aluminium Aluminiumlegierungen Bronze Blei Duralumin 681B Eisen Gusseisen Kupfer Magnesium Messing Messing (CuZn40) Nickel Nickellegierungen Silber Silicium Stahl legiert (s. [1]) Baustahl V2A-Stahl Titan Zink Zinn
Anorganisch-nichtmetallische Werkstoffe: Beton (s. [2], DIN 1045) Eis (s. [5]) −4◦ C, polykristallin Glas, allgemein Bau-, Sicherheitsglas Quarzglas Granit
E kN/mm2
ν
α 10−6 /K
71 59· · · 78 108· · · 124 19 74 206 64· · · 181 125 44 78· · · 123 100 206 158· · · 213 80 100 186· · · 216 215 190 108 128 44
0,34
23,9 18,5· · · 24,0 16,8· · · 18,8 29 23 11,7 9· · · 12 16,8 26 17,5· · · 19,1 18 13,3 11· · · 14 19,7 7,8 9· · · 19 12 16 8,5 30 23
0,35 0,44 0,34 0,28 0,34
0,36 0,31 0,38 0,45 0,2· · · 0,3 0,28 0,27 0,36 0,29 0,33
22· · · 39
0,15· · · 0,22
9,8 39· · · 98 62· · · 86 62· · · 75 50· · · 60
0,33 0,10· · · 0,28 0,25 0,17· · · 0,25 0,13· · · 0,26
5,4· · · 14,2
3,5· · · 5,5 9 0,5· · · 0,6 3· · · 8
Wenn Missverständnisse ausgeschlossen sind, wird vom Flächenmoment statt vom Flächenmoment 2. Grades gesprochen. Eine andere, noch gebräuchliche Bezeichnung ist Flächenträgheitsmoment. Flächenmomente 2. Grades haben die Dimension Länge4 . Iy , Iz und Iyz sind mit den Flächenmomenten Iy , Iz und Iy z im parallel ausgerichteten y , z System mit dem Ursprung im Schwerpunkt S durch die Formeln von Huygens und Steiner verknüpft (Bild 5-8): ' Iy = Iy + z2S A , Iz = Iz + y2S A , (5-26) Iyz = Iy z − yS zS A .
Werkstoff Anorganisch-nichtmetallische Werkstoffe – Forts. Kalkstein Marmor Porzellan Ziegelstein Al2 O3 (hochdicht) ZrO2 (hochdicht) SiC (hochdicht) Si3 N4 (dicht) Si3 N4 (20% Poren) Organische Werkstoffe: Epoxidharz (EP, ,Araldit‘) glasfaserverstärkte Kunststoffe (GFK) Holz (s. [3,4]): faserparallel: Buche Eiche Fichte Kiefer radial: Buche Eiche Fichte Kiefer kohlenstofffaserverstärkte Kunststoffe (CFK) Polymethylmethacrylat (PMMA, ,Plexiglas‘) Polyamid(,Nylon‘) Polyethylen (PE-HD) Polyvinylchlorid (PVC)
E kN/mm2
ν
40· · · 90 60· · · 90 60· · · 90 10· · · 40 380 220 440 320 180
0,28 0,25· · · 0,30
3,2
α 10−6 /K
0,20· · · 0,35 0,23 0,23 0,16 0,3 0,23
5· · · 16 3· · · 6,5 8· · · 10 8 10 5 3,3 3
0,33
50· · · 70
7· · · 45
25
14 13 10 11 2,3 1,6 0,8 1,0
4,9 5,4
54,4 34,1
70· · · 200 2,7· · · 3,2 2· · · 4 0,15· · · 1,65 1· · · 3
0,35
70· · · 100 70· · · 100 150· · · 200 70· · · 100
In einem η, ζ-System, das nach Bild 5-8 gegen das y, z-System um den Winkel ϕ gedreht ist (ϕ ist positiv bei Drehung im Rechtsschraubensinn um die x-Achse) ist 1 1 (Iy + Iz ) + (Iy − Iz ) cos 2ϕ 2 2 + Iyz sin 2ϕ , 1 Iηζ (ϕ) = − (Iy − Iz ) sin 2ϕ + Iyz cos 2ϕ . 2 Iη (ϕ) =
(5-27a) (5-27b)
Diese Beziehungen werden im (Iη (ϕ), Iηζ (ϕ))Achsensystem von Bild 5-9 durch den Mohr’schen Kreis abgebildet. Der Mittelpunkt bei (Iy + Iz )/2 und
E77
E78
E Technische Mechanik / Mechanik fester Körper
Bild 5-8. Zur Definition von Flächenmomenten 2. Grades
die Lage der Achse i. Allg. gut schätzen. Symmetrieachsen sind zentrale, d. h. auf den Schwerpunkt als Ursprung bezogene Hauptachsen. Wenn die axialen Flächenmomente für zwei oder mehr Achsen durch S gleich sind, dann sind sie für alle Achsen durch S gleich. Das ist z. B. der Fall, wenn mehr als zwei Symmetrieachsen existieren (z. B. beim regelmäßigen n-Eck). Flächenmomente für zusammengesetzte Querschnitte
Bild 5-9. Mohr’scher Kreis für Flächenmomente 2. Grades
der Kreispunkt (Iy , Iyz ) für ϕ = 0 bestimmen den Kreis. Der Kreispunkt unter dem Winkel 2ϕ (von ϕ = 0 positiv im Uhrzeigersinn angetragen) hat die Koordinaten Iη (ϕ) und Iηζ (ϕ). Hauptflächenmomente. Hauptachsen
Der Mohr’sche Kreis liefert zwei orthogonale Hauptachsen der Fläche unter Winkeln ϕ1 und ϕ2 mit zugehörigen extremalen Hauptflächenmomenten I1 und I2 und mit dem biaxialen Flächenmoment I12 = 0. Die ablesbaren Formeln & ⎫ 1% ⎪ 2 1/2 ⎪ I1,2 = ,⎪ Iy + Iz ± (Iy − Iz )2 + 4Iyz ⎬ (5-28) 2 ⎪ ⎪ ⎪ ⎭ tan 2ϕ1,2 = 2Iyz/(Iy − Iz ) lassen die Zuordnung zwischen den Winkeln und den Hauptflächenmomenten erst erkennen, wenn man einen der beiden Winkel wieder in (5-27a) einsetzt. Die Achse des kleineren Hauptflächenmoments liegt so, dass sich die Querschnittsfläche möglichst eng um sie lagert. Wegen dieser Eigenschaft kann man
Für einen aus Teilflächen zusammengesetzten Querschnitt sollen die Flächenmomente Iη , Iζ und Iηζ in einem η, ζ-System mit dem Gesamtschwerpunkt S als Ursprung berechnet werden. Bild 5-10a zeigt nur eine Teilfläche Ai mit ihrem eigenen Schwerpunkt S i und ihre Lage im η, ζ-System. Für die Teilfläche werden die Flächenmomente für irgendein y, z-System aus Tabellen entnommen und mit (5-26) und (5-27) in drei Schritten in Flächenmomente im y , z -System (1. Schritt), im η , ζ -System oder im y , z -System (2. Schritt) und im η, ζ-System (3. Schritt) umgerechnet. Die letzteren seien Iηi , Iζi und Iηζi für die Teilfläche i (i = 1, . . . , n). Die drei Summen dieser Größen über i = 1, . . . , n liefern Iη , Iζ und Iηζ für den gesamten Querschnitt. Ausschnitte und Löcher können als Teilflächen mit negativem Flächeninhalt behandelt werden, was eine Umkehrung der Vorzeichen aller ihrer Flächenmomente bedeutet. Der Querschnitt in Bild 5-10b kann z. B. als Summe zweier Rechtecke und eines Dreiecks mit negativer Fläche behandelt werden. Für Flächenmomente einfacher Flächen siehe Tabelle 5-2. Flächenmomente genormter Walzprofile siehe in [1, 2]
Bild 5-10. a Teilfläche Ai eines zusammengesetzten Querschnitts mit dem Gesamtschwerpunkt S . b Aus zwei Rechtecken und einem Dreieck mit negativer Fläche zusammengesetzter Querschnitt
5 Festigkeitslehre. Elastizitätstheorie
5.4.2 Statische Flächenmomente
Im Folgenden sind die y- und z-Achsen zentrale Hauptachsen. Bei einfach berandeten Querschnitten mit einem oder mehreren Stegen (Bild 5-11) ist s die Bogenlänge von einem beliebig gewählten Stegende s = 0 entlang Stegmittellinien zu einem Punkt mit der Koordinate s. A0 (s) und A1 (s) sind die einander zu A ergänzenden Teilflächen, die durch einen Schnitt bei s quer zur Stegmittellinie entstehen, wobei A0 (s) den Punkt s = 0 enthält. zS 0 (s) und zS 1 (s) sind die z-Koordinaten der Flächenschwerpunkte S0 von A0 (s) bzw. S1 von A1 (s). Das statische Flächenmoment Sy (s) hat die Dimension Länge3 . Es wird nach einer der folgenden Formeln berechnet: " zdA = −zS 0 (s)A0 (s) S y (s) = −
Beispiel 5-1: Für den Stabquerschnitt in Bild 5-12a ist im Bereich 0 s b zS 0 (s) = −h/2, A0 (s) = ts, also S y (s) = hts/2. Bei einem Schnitt durch den vertikalen Steg an einer Stelle z besteht A0 aus der Fläche bt des horizontalen Stegs mit der Schwerpunktkoordinate −h/2 und der Fläche (h/2 + z)t mit der Schwerpunktkoordinate 1 1 1 1 1 h+z = − h+z . − h+ 2 2 2 2 2 Damit ist
1 1 1 1 htb − h + z t · − h+z 2 2 2 2 1 1 = hb + h2 − z2 t . 2 4
S y (z) =
A0 (s)
"
zdA = zS 1 (s)A1 (s) .
=
(5-29)
A1 (s)
Entsprechend ergibt sich, wenn man überall z und y vertauscht: " S z (s) = − y dA = −yS 0 (s)A0 (s) A0 (s)
"
y dA = yS 1 (s)A1 (s) .
=
(5-30)
A1 (s)
Bild 5-11. Einfach berandeter Querschnitt mit dünnen Ste-
gen. Die Teilflächen A0 (s) und A1 (s) mit ihren Schwerpunkten S 0 bzw. S 1 beziehen sich auf (5-29) und (5-30). Die y-
und z-Achsen sind zentrale Hauptachsen. Die dazu parallelen η- und ζ-Achsen und die Lotlänge r(s) beziehen sich auf (5-33) und (5-37) und τ(s) auf (5-56). P ist der Mittelpunkt des Viertelkreisbogens
Bild 5-12. a – ™-Profil. Quer zur Wandmittellinie ist Sy (s) aufgetragen. Zur Bedeutung des η, ζ-Systems und des Schubmittelpunkts M siehe 5.4.4 b Hilfsfunktionen r(s), ω(s) und z(s) des Profils von a für (5-32) und (5-33).
c Hilfsfunktionen r(s) und ω∗ (s) desselben Profils für (5-37)
E79
E80
E Technische Mechanik / Mechanik fester Körper
Tabelle 5-2. Flächenmomente 2. Grades Iy , Iz , Iyz und Biegewiderstandsmomente Wy . Der Ursprung des y, z-Systems ist der Flächenschwerpunkt. Seine Lage ist in Tabelle 2-2 angegeben. Wenn Iyz nicht angegeben ist, sind die y- und z-Achsen
Hauptachsen
5 Festigkeitslehre. Elastizitätstheorie
5.4.3 Querschubzahlen
Für einfach berandete Querschnitte aus dünnen Stegen der Breite t(s) sind die dimensionslosen Querschubzahlen κy und κz wie folgt definiert (Integration über alle Stege): " 2 " 2 S y (s) S z (s) A A κy = 2 ds , κz = 2 ds . t(s) t(s) Iz Iy (5-31) Zahlenwerte siehe in Tabelle 5-3. 5.4.4 Schubmittelpunkt oder Querkraftmittelpunkt
Wenn der Stabquerschnitt Symmetrieachsen besitzt, dann liegt der Schubmittelpunkt M auf diesen. Bei ™- und œ-Profilen und allgemeiner bei Querschnitten aus geraden, dünnen Stegen, die alle von einem Punkt ausgehen, liegt M in diesem Punkt. Bei beliebigen einfach berandeten Querschnitten aus dünnen Stegen (Bild 5-11) hat M in einem beliebig gewählten, zum y, z-System parallelen η, ζ-System die Koordinaten (Integration über alle Stege) . ⎫ ηM = −(1/Iy) ω(s)z(s)t(s) ds , ⎪ ⎪ ⎬ . (5-32) ⎪ ⎪ ζM = (1/Iz ) ω(s)y(s)t(s) ds . ⎭ Darin sind y(s) und z(s) die y- und z-Koordinaten des Punktes an der Stelle s und " ω(s) = − r( s¯) d s¯ + ω0 (5-33) (Integration über alle Stege von A0 (s)). r(s) ist die vorzeichenbehaftete Länge des Lotvektors r(s) vom Ursprung 0 des η, ζ-Systems auf die Tangente an die Tabelle 5-3. Querschubzahlen κz für Stabquerschnitte
Stegmittellinie an der Stelle s. r(s) ist positiv (negativ), wenn r × ds die Richtung der positiven (der negativen) x-Achse hat. Die Konstante ω0 kann beliebig gewählt werden. Eine zweckmäßige Wahl von 0 und von ω0 vereinfacht die Rechnung. Beispiel 5-2: In Bild 5-11 ist der Punkt P die beste Wahl, weil dann r(s) für den horizontalen Steg null und für alle anderen Stege konstant ist. Für den Stabquerschnitt in Bild 5-12a und den gewählten Punkt 0 haben r(s) und z(s) die in Bild 5-12b gezeichneten Verläufe. ω0 wurde so gewählt, dass ω(s) im Mittelteil null ist. Damit liefert (5-32) ηM = −
h2 b2 t 3b2 , =− 4Iy 6b + h
falls t b, h gilt .
Tabelle 5-4 gibt für einige Querschnitte die Lage des Schubmittelpunkts an. 5.4.5 Torsionsflächenmoment
Die Dimension des Torsionsflächenmoments IT ist Länge4. Für Kreis- und Kreisringquerschnitte vom Innenradius Ri und Außenradius. Ra ist IT das polare Flächenmoment 2. Grades Ip = r2 dA = π2 (R4a − R4i ). A
Für einfach. berandete Querschnitte beliebiger Form ist IT = 2 Φ(y, z) dA (Integration über die gesamte Querschnittsfläche), wobei Φ( y, z) die Lösung des Randwertproblems ∂2 Φ ∂2 Φ + 2 = −2 , ∂y2 ∂z
Φ ≡ 0 am ganzen Rand , (5-34)
ist. Tabelle 5-5 gibt Lösungen an. Weitere Lösungsformeln siehe in [5-6]. Zahlenwerte für genormte Walzprofile siehe in [7, 8]. Für einfach berandete Querschnitte kann IT experimentell wie folgt bestimmt werden. Nach Prandtls Membrananalogie [5-6] hat eine Seifenhaut über einer Öffnung von der Form des Stabquerschnitts bei kleiner Druckdifferenz die Höhenverteilung const × Φ(y, z) mit der Lösung Φ(y, z) von (5-34). Man erzeugt bei gleicher Druckdifferenz zwei Seifenhäute, eine über dem zu untersuchenden Querschnitt und die andere über einem Kreis vom Radius R. Aus Messwerten für die Volumina V und VKreis der Seifenhauthügel ergibt sich für den untersuchten Querschnitt IT = (V/VKreis)πR4 /2.
E81
E82
E Technische Mechanik / Mechanik fester Körper
Tabelle 5-4. Schubmittelpunktkoordinaten d und Wölbwiderstände C M für symmetrische Stabprofile mit dünnen Stegen
5 Festigkeitslehre. Elastizitätstheorie
Tabelle 5-5. Torsionsflächenmomente IT und Torsionswiderstandsmomente WT ;
τmax = MT /WT
E83
E84
E Technische Mechanik / Mechanik fester Körper
Bild 5-13. Dünnwandiger Hohlquerschnitt mit n = 3 Zellen. Zu den umlaufenden Pfeilen siehe 5.6.8
Für einzellige, dünnwandige Hohlquerschnitte gilt die zweite Bredt’sche Formel (siehe Tabelle 5-5; Fläche Am innerhalb der Wandmittellinie; Integration über die ganze Wandmittellinie) ? " ds 2 . (5-35) IT = 4 Am t(s) Bei n-zelligen, dünnwandigen Hohlquerschnitten nach Bild 5-13 muss zur Berechnung von IT das lineare Gleichungssystem für λ1 , . . . , λn und 1/IT mit symmetrischer Koeffizientenmatrix gelöst werden: ⎫ n ⎪ ⎪ ⎪ Pii λi − Pi j λ j − 2Ai /IT = 0 (i = 1, . . . , n) ⎪ ⎪ ⎪ ⎪ ⎪ j=1 ⎪ ⎪ ⎬ i ⎪ ⎪ ⎪ n ⎪ ⎪ ⎪ ⎪ ⎪ − 2 Ai λi = −1 . ⎪ ⎪ ⎭ i=1
(5-36)
Zur Bedeutung von λ1 , . . . , λn siehe 5.6.8; Ai Fläche innerhalb der Wandmittellinie von Zelle i; . Pii = (ds/t(s)) bei Integration über die. geschlossene Wandmittellinie von Zelle i; Pi j = (ds/t(s)) bei si j
Integration über die den Zellen i und j gemeinsame Wandmittellinie si j . Im Sonderfall n = 2 mit überall gleicher Wanddicke t ist 4t A21 U2 + A22 U1 + 2A1 A2 s12 IT = U1 U2 − s212
schnitte aus geraden, dünnen Stegen, die von einem Punkt ausgehen, ist CM = 0. Für beliebige einfach berandete Querschnitte aus dünnen Stegen nach Bild 5-11 ist (Integration über alle Stege) " CM = ω∗2 (s)t(s) ds . (5-37) Für ω∗ (s) gilt (5-33) mit der Besonderheit, dass erstens der Vektor r(s) in Bild 5-11 nicht von einem beliebigen Punkt 0, sondern vom Schubmittelpunkt M ausgeht, und dass zweitens die Konstante ω∗0 nicht be.liebig ist, sondern so bestimmt wird, dass das Integral ω∗ (s) ds über alle Stege gleich null ist. Beispiel 5-3: Für den Querschnitt in Bild 5-12a hat r(s) den in Bild 5-12c gestrichelten und ω∗ (s) den durchgezogenen Verlauf. Mit ηM = −3b2 /(6b + h) ergibt sich mithilfe von Tabelle 5-8 CM = tb3 h2
3b + 2h . 12(6b + h)
Tabelle 5-4 gibt Formeln für CM für einige Querschnitte an. Zahlenwerte für genormte Walzprofile siehe in [7, 8].
5.5 Schnittgrößen in Stäben und Balken 5.5.1 Definition der Schnittgrößen für gerade Stäbe
Schnittgrößen eines geraden Stabes werden im x, y, zSystem von Bild 5-14 beschrieben. Im unverformten Stab fällt die x-Achse mit der Verbindungslinie der Flächenschwerpunkte aller Stabquerschnitte (das ist die sog. Stabachse) und die y- sowie die z-Achse mit den Hauptachsen der Querschnittsfläche zusammen. Ein Schnitt quer zur x-Achse an der Stelle x erzeugt
mit den Teilflächen A1 , A2 und Umfängen U1 , U2 der Zellen 1 bzw. 2 und der gemeinsamen Steglänge s12 . 5.4.6 Wölbwiderstand
Die Dimension des Wölbwiderstandes CM ist Länge6 . Für ™- und œ-Profile und allgemeiner für alle Quer-
Bild 5-14. Schnittufer und Schnittgrößen eines Stabes oder
Balkens
5 Festigkeitslehre. Elastizitätstheorie
zwei Stabteile mit je einem Schnittufer. Das positive Schnittufer ist dasjenige, aus dem die x-Achse herausweist. Über den Querschnitt verteilte Schnittkräfte werden nach Bild 5-14 zu einem äquivalenten Kräftesystem zusammengefasst, das aus einer Längskraft N(x) im Flächenschwerpunkt, Querkräften Qy (x) und Qz (x) im Schubmittelpunkt M, Biegemomenten My (x) und Mz (x) und einem Torsionsmoment MT (x) besteht. Diese sechs Kraft- und Momentenkomponenten sind die sog. Schnittgröβen des Stabes. Sie greifen mit entgegengesetzten Richtungen an beiden Schnittufern an. Eine Schnittgröße ist positiv, wenn sie am positiven Schnittufer die Richtung der positiven Koordinatenachse hat. Im Sonderfall der ebenen Belastung in der zur x, z-Ebene parallelen Ebene durch den Schubmittelpunkt M sind nur N(x), Qz (x) und My (x) vorhanden. Zu den Spannungen σ(x, y, z), τ xy (x, y, z) und τ xz (x, y, z) im Querschnitt bei x (σ steht für σ x ) bestehen die Beziehungen (alle Integrationen über die gesamte Querschnittfläche): . . ⎫ ⎪ N(x) = σ dA , Qy (x) = τ xy dA , ⎪ ⎪ ⎪ ⎪ . ⎪ ⎪ ⎪ ⎪ Qz (x) = τ xz dA , ⎪ ⎪ ⎪ . ⎪ ⎪ ⎬ MT (x) = [−(z − zM )τ xy + (y − yM )τ xz ] dA ⎪ (5-38) . ⎪ ⎪ ⎪ ⎪ = (−zτ xy + yτ xz ) dA ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ + z Q (x) − yM Qz (x) , ⎪ ⎪ ⎪ . M y . ⎪ M (x) = zσ dA , M (x) = − yσ dA . ⎭ y
z
5.5.2 Berechnung von Schnittgrößen für gerade Stäbe
Gleichgewichtsbedingungen an freigeschnittenen Stabteilen liefern Beziehungen zwischen den Schnittgrößen eines Stabes und den äußeren eingeprägten Kräften und Momenten am Stab. Für die hier behandelte sog. Theorie 1. Ordnung werden Gleichgewichtsbedingungen am unverformten Stab formuliert. Ein Stab heißt statisch bestimmt, wenn die Gleichgewichtsbedingungen ausreichen, um alle Schnittgrößen explizit durch eingeprägte äußere Kräfte und Momente auszudrücken. Statisch unbestimmte Stäbe siehe in 5.8.6. Die Abhängigkeit der Schnittgrößen von der Koordinate x wird nach Bild 5-16 in Diagrammen unter dem Stab darge-
stellt. Die Kurven in den Diagrammen nennt man Querkraftlinie, Biegemomentenlinie usw. Gleichgewichtsbedingungen. Um Schnittgrößen an einer Stelle x zu berechnen, wird der Stab bei x in zwei Stücke geschnitten. Das einfacher zu untersuchende Stück wird an allen Lagern freigeschnitten. An den Schnittstellen werden die unbekannten Schnittgrößen und die (vorher berechneten) Lagerreaktionen angebracht. Gleichgewichtsbedingungen (sechs im räumlichen, drei im ebenen Fall) liefern die Schnittgrößen. Schnittstellen beiderseits des Angriffspunktes einer Einzelkraft oder eines Einzelmoments liefern unterschiedliche Schnittgrößenfunktionen. Man muss also beiderseits jedes derartigen Punktes einen Schnitt untersuchen. Prinzip der virtuellen Arbeit. Statt Gleichgewichtsbedingungen kann das Prinzip der virtuellen Arbeit verwendet werden, und zwar besonders vorteilhaft, wenn nur eine einzige Schnittgröße als Funktion von x gesucht wird. Im Fall einer Kraftschnittgröße wird bei x eine Schiebehülse in Richtung der gesuchten Schnittgröße eingeführt. Im Fall einer Momentenschnittgröße wird bei x ein Gelenk mit der Achse in Richtung der gesuchten Schnittgröße eingeführt. Beiderseits der Schiebehülse bzw. des Gelenks wird die betreffende Schnittgröße mit entgegengesetzten Vorzeichen als äußere Last angebracht. An dem so gewonnenen Ein-Freiheitsgrad-Mechanismus wird die in 2.1.16 geschilderte Rechnung durchgeführt. Als Beispiel siehe Bild 2-14c. Hilfssätze. Die Anwendung der Gleichgewichtsbedingungen und des Prinzips der virtuellen Arbeit wird teilweise oder ganz überflüssig, wenn man die folgenden Hilfsmittel einsetzt. a) Das Superpositionsprinzip. Es sagt aus, dass eine Schnittgröße, z. B. My (x), für eine Kombination von Lasten gleich der Summe der Schnittgrößen My (x) für die einzelnen Lasten ist. b) Am Angriffspunkt einer Einzelkraft F (eines Einzelmoments M) in x- oder y- oder z-Richtung macht die entsprechende Kraft- bzw. Momentenschnittgröße gleicher Richtung einen Sprung. Der Sprung hat die Größe –F bzw. –M, wenn man die x-Achse in positiver Richtung durchläuft.
E85
E86
E Technische Mechanik / Mechanik fester Körper
c) Zwischen Streckenlast qz (x), Querkraft Qz (x) und Biegemoment My (x) gilt überall außer an Angriffspunkten von Einzelkräften in z-Richtung ⎫ dMy dQz ⎪ ⎪ = −qz (x) , = Qz (x) , ⎪ ⎪ ⎪ ⎪ dx dx ⎬ ⎪ ⎪ 2 ⎪ ⎪ d My ⎪ ⎪ ⎭ = −q (x) . z 2 dx
(5-39)
Entsprechend gilt ⎫ dQy dMz ⎪ ⎪ = −qy (x) , = Qy (x) , ⎪ ⎪ ⎪ ⎪ dx dx ⎬ ⎪ ⎪ 2 ⎪ ⎪ d Mz ⎪ ⎪ ⎭ = −q (x) . y 2 dx
(5-40)
Hieraus folgt: In Bereichen ohne Streckenlast qz ist Qz (x) konstant und My (x) linear mit x veränderlich. In Bereichen mit konstanter Streckenlast qz (x) = const 0 ist Qz (x) linear und My (x) quadratisch von x abhängig. Die Biegemomentenlinie My (x) hat Knicke an den Angriffspunkten von Einzelkräften mit z-Richtung. Das Biegemoment My (x) hat stationäre Werte (Maxima, Minima oder Sattelpunkte) an allen Stellen, an denen Qz (x) = 0 ist. Für Extrema von My kommen nur diese Stellen und die Angriffspunkte von Einzelkräften und Einzelmomenten in Betracht. Stückweise konstante Streckenlasten werden häufig nach Bild 5-15 durch äquivalente Einzelkräfte ersetzt. Die Biegemomentenlinie für die Streckenlasten (gekrümmte Linie) und die Biegemomentenlinie für die Einzelkräfte (Polygonzug) haben an den Rändern der durch Einzelkräfte ersetzten Streckenlastabschnitte gleiche Funktionswerte und gleiche Steigungen. d) Randbedingungen: An einem freien Stabende ohne Einzelkraft (bzw. ohne Einzelmoment) in x-
oder y- oder z-Richtung ist die Kraftschnittgröße (bzw. Momentenschnittgröße) gleicher Richtung null. An der Stelle einer Schiebehülse in x- oder yoder z-Richtung ist die Kraftschnittgröße gleicher Richtung null. An der Stelle eines Gelenks um die xoder y- oder z-Achse ist die Momentenschnittgröße gleicher Richtung null. Beispiel 5-4: Bild 5-16 demonstriert, wie man allein mit den Hilfsmitteln (a) bis (d) Querkraftund Biegemomentenlinien bestimmt. Die Kraft F an der Stütze hat auf den horizontalen Stab dieselbe Wirkung, wie F und das Moment Fh im Diagramm darunter. Die Lagerreaktion Dv = 3ql/2 wird zuerst berechnet (Momentengleichgewicht um C für die bei C und D freigeschnittene rechte Stabhälfte). Qz (x) ist durch die Randbedingung bei E, durch die Steigung −q zwischen D und E, durch die Steigung null zwischen A und D und durch den Sprung bei D um – Dv = −3ql/2 festgelegt. My (x) ist zwischen A und D durch die Randbedingung am Gelenk C, durch die konstante Steigung Qz = −ql/2 und durch den Sprung um Fh bei B festgelegt.
Bild 5-16. Statisch bestimmter Träger (oben), der horizontaBild 5-15. Biegemomentenlinien für eine Streckenlast (ge-
krümmte Linie) und für äquivalente Einzelkräfte (Polygonzug)
le Teil des Trägers mit derselben Belastung (darunter) und die Funktionsverläufe von Querkraft Qz (x) und Biegemoment My (x) (darunter)
5 Festigkeitslehre. Elastizitätstheorie
Zwischen D und E gilt dMy /dx = Qz = q(4l − x), also My (x) = −q(4l − x)2 /2 + const. Die Konstante ist wegen der Randbedingung bei E gleich null. Schnittgrößen in abgewinkelten Stäben. Bild 5-17 ist ein Beispiel für stückweise gerade Stäbe, die abgewinkelt miteinander verbunden sind. Für jedes einzelne gerade Stabstück mit der Nummer i werden Schnittgrößen wie in Bild 5-14 in einem individuellen xi , yi , zi -System des betreffenden Stabes definiert und berechnet. Schnittgrößen in gekrümmten Stäben. Der Kreisring in Bild 5-18a und die Wendel einer Schraubenfeder sind Beispiele für Stäbe, die schon im unbelasteten Zustand eben oder räumlich gekrümmt sind. Die Schnittgrößen an einer Stelle des Stabes sind wie beim geraden Stab und mit denselben Definitionen eine Längskraft, Querkräfte, Biegemomente und ein Torsionsmoment. Ihre Richtungen sind die der Tangente an die Stabachse bzw. der Hauptachsen im Querschnitt an der betrachteten Stelle. Beispiel 5-5: In Bild 5-18a sind nur die Längskraft N(ϕ), die Querkraft Qr (ϕ) und das Biegemoment Mz (ϕ) vorhanden (Bild 5-18b). Kräftegleichgewichtsbedingungen in radialer und in tangentialer Richtung und eine Momentengleichgewichtsbedingung um die Schnittstelle ergeben Qr (ϕ) = −F sin ϕ , N(ϕ) = −F cos ϕ , Mz (ϕ) = Fr(1 − cos ϕ) .
5.6 Spannungen in Stäben und Balken Für Spannungen gilt im Gültigkeitsbereich des Hooke’schen Gesetzes das Superpositionsprinzip. Es macht die Aussage: Zwei Lastfälle 1 und 2, die jeder für sich in einem Körperpunkt die Spannungen σ x1 , σy1 , τ xy1 usw. bzw. σ x2 , σy2 , τ xy2 usw. verursachen, verursachen gemeinsam die Spannungen σ x1 + σ x2 , σy1 + σy2 , τ xy1 + τ xy2 usw. 5.6.1 Zug und Druck
Im Querschnitt an der Stelle x tritt nur die Längsspannung (Normalspannung) auf N(x) . σ(x) = (5-41) A(x) 5.6.2 Gerade Biegung
Von gerader Biegung spricht man, wenn nur Schnittgrößen Qz (x) und My (x) oder nur Qy (x) und Mz (x) vorhanden sind. Ein Biegemoment My (x) verursacht im Querschnitt bei x die Längsspannung (Normalspannung) My (x) σ(x, z) = z. (5-42) Iy (x) Sie ist nach Bild 5-19 linear über den Querschnitt verteilt. Sie hat bei z = 0 den Wert null (spannungslose oder neutrale Fasern) und im größten Abstand |z|max von der neutralen Faser das Betragsmaximum |σ|max =
Bild 5-17. Abgewinkelter Stab mit individuellen Koordinatensystemen für alle Abschnitte
|My (x)| Wy (x)
mit Wy (x) =
Iy (x) . |z|max
(5-43)
Wy heißt Biegewiderstandsmoment. Bei Biegung um die z-Achse durch ein Biegemoment Mz (x) tritt an die
Bild 5-18. Gekrümmter Stab (a) und seine Schnittgrö-
Bild 5-19. Spannungsverlauf σ(z) in einem Stabquerschnitt
ßen (b)
bei gerader Biegung um die y-Hauptachse
E87
E88
E Technische Mechanik / Mechanik fester Körper
Stelle von (5-42) σ(x, y) = −yMz (x)/Iz (x). Im Fall My (x) = const bzw. Mz (x) = const spricht man von reiner Biegung, weil dann Qz (x) ≡ 0 bzw. Qy (x) ≡ 0 ist. Tabelle 5-2 gibt Biegewiderstandsmomente Wy für zahlreiche Querschnitte an. 5.6.3 Schiefe Biegung
Bei gemeinsamer Wirkung von Biegemomenten My (x) und Mz (x) spricht man von schiefer Biegung. Sie erzeugt die Längsspannung σ(x, y, z) =
My (x) Mz (x) z− y. Iy (x) Iz (x)
(5-44)
Linien gleicher Spannung im Querschnitt an der Stelle x sind Parallelen zur Spannungsnulllinie σ = 0, die die Gleichung z=
Mz (x)Iy (x) y My (x)Iz (x)
(5-45)
hat (Bild 5-20). Die betragsgrößte Spannung |σ|max im Querschnitt tritt im Punkt oder in den Punkten mit dem größten Abstand von der Spannungsnulllinie auf. Man zeichnet die Spannungsnulllinie, liest die Koordinaten des Punktes bzw. der Punkte ab und berechnet mit ihnen die Spannung aus (5-44). 5.6.4 Druck und Biegung. Kern eines Querschnitts
Eine auf der Stirnseite des Stabes im Punkt (y0 , z0 ) eingeprägte Kraft F parallel zur Stabachse verursacht nach Bild 5-21 die Schnittgrößen N = F/A, My = Fz0 und Mz = −Fy0 und damit nach (5-41) und (5-44) Längsspannungen σ(y, z) =
Bild 5-21. Die Kraft F verursacht eine Längskraft N und Biegemomente My und Mz im Stab
Die Spannungsnulllinie im Querschnitt hat die Gleichung z = −y
Iy y0 I y · − . z0 Iz Az0
(5-46)
Der Kern eines Querschnitts ist derjenige Bereich des Querschnitts, in dem der Kraftangriffspunkt (y0 , z0 ) liegen muss, damit im gesamten Querschnitt nur Spannungen eines Vorzeichens auftreten. Zulässige Spannungsnulllinien sind also Geraden z = my + n, die die Querschnittskontur berühren (Bild 5-22). Der Koeffizientenvergleich mit (5-46) liefert für jede Gerade einen Punkt der Kernkontur mit den Koordinaten y0 =
mIz , nA
z0 =
−Iy . nA
(5-47)
Wenn ein Querschnitt durch ein Polygon eingehüllt wird (Bild 5-22), dann ist die Kernkontur das Polygon mit den Ecken (y0 , z0 ) zu den Seiten des einhüllenden Polygons.
F zz0 F yy0 F + + . A Iy Iz
Bild 5-20. Spannungsverlauf σ(y, z) in einem Stabquer-
schnitt bei schiefer Biegung. Spannungsnulllinie σ = 0
Bild 5-22. Der Stabquerschnitt wird von den Geraden
1, . . . , 5 eingehüllt. Jede Gerade bestimmt einen Eckpunkt des schraffierten Kernquerschnitts
5 Festigkeitslehre. Elastizitätstheorie
Der Kern eines Rechteckquerschnitts ist ein Rhombus mit den y- und z-Achsen als Diagonalen. Jede Diagonale ist ein Drittel so lang wie die gleichgerichtete Rechteckseite. Der Kern eines Kreis- oder Kreisringquerschnitts vom Innenradius Ri und Außenradius Ra ist der Kreis mit dem Radius R = 14 Ra [1 + (Ri /Ra )2 ]. 5.6.5 Biegung von Stäben aus Verbundwerkstoff
Betrachtet werden Stabquerschnitte, die aus n zur z-Achse symmetrischen Teilquerschnitten mit verschiedenen Werkstoffen zusammengesetzt sind (Bild 5-23a). Der Flächenschwerpunkt des Gesamtquerschnitts ist Ursprung des x, y, z-Systems. Ein Biegemoment My (x) verursacht Längsspannungen σ(x, y, z) = E( y, z)
z − z0 (x)
(x)
(5-48)
mit My (x)ΣEi Ai 1 = ,
(x) (ΣEi Iyi )(ΣEi Ai ) − (ΣEi zSi Ai )2 ΣEi zSi Ai z0 (x) = . ΣEi Ai
(5-49) (5-50)
Darin bezeichnet E(y, z) den ortsabhängigen E-Modul. Ei , Ai , Iyi , zSi sind für den i-ten Teilquerschnitt der E-Modul, die Querschnittsfläche, das Flächenmoment 2. Grades um die y-Achse bzw. die z-Koordinate des Flächenschwerpunkts. Alle Summen erstrecken sich über i = 1, . . . , n. Bei z = z0 liegt die neutrale Faser mit der Krümmung 1/ (x). Bild 5-23b zeigt qualitativ den Spannungsverlauf im Querschnitt mit Sprüngen an den Werkstoffgrenzen und mit der Möglichkeit von Maxima im Stabinneren.
Spannbeton mit Verbund
Zur Herstellung eines Stabes aus Spannbeton mit Verbund wird Beton in eine Form um Stähle gegossen, die in ein Spannbett eingespannt sind (Bild 5-24a). Nach dem Aushärten des Betons werden die Stähle aus dem Spannbett befreit. Danach hat der Spannbetonstab einen Eigenspannungszustand und eine Krümmung (Bild 5-24b). Wenn zusätzlich das Biegemoment My (x) infolge einer äußeren Last wirkt, ist die Längsspannung z − z0 (x) + σ0 (y, z) mit (5-51)
(x) Δ 1 = , (5-52)
(x) (ΣEi Iyi )(ΣEi Ai ) − (ΣEi zS i Ai )2
σ(x, y, z) = E( y, z)
1 [(My (x) − Σσ0i zS i Ai )(ΣEi zS i Ai ) Δ (5-53) + (Σσ0i Ai )(ΣEi Iyi )] ,
z0 (x) =
Δ = (My (x) − Σσ0i zS i Ai )(ΣEi Ai ) + (Σσ0i Ai )(ΣEi zS i Ai ) .
(5-54)
Alle Summen erstrecken sich über i = 1, . . . , n. Die Formeln setzen n zur z-Achse symmetrische Teilquerschnitte i = 1, . . . , n voraus, und zwar Beton (i = 1, σ01 = 0) und n − 1 Gruppen von Spannstählen mit den Vorspannungen σ0i . Alle anderen Bezeichnungen sind wie in (5-48) bis (5-50) definiert. Bei z = z0 liegt die Spannungsnulllinie mit der Krümmung 1/ (x). Im Fall My = 0 ergibt sich der Eigenspannungszustand von Bild 5-24b. 5.6.6 Biegung vorgekrümmter Stäbe
Der Stab in Bild 5-25 hat an der betrachteten Stelle im unbelasteten Zustand den Krümmungsradius 0 der Schwerpunktachse. 0 < 0 bedeutet Krümmung nach der anderen Seite. Die y- und z-Achsen sind Haupt-
Bild 5-23. Ein Verbundquerschnitt mit zur z-Achse symmetrischen Teilquerschnitten (a) und ein möglicher Spannungsverlauf bei Biegung um die y-Achse (b)
Bild 5-24. Stab aus Spannbeton mit Verbund während der
Herstellung (a) und im Eigenspannungszustand ohne äußere Belastung (b)
E89
E90
E Technische Mechanik / Mechanik fester Körper
5.6.7 Reiner Schub
Bild 5-25. Stark vorgekrümmter Stab mit Spannungsvertei-
lung σ(z) bei Biegung um die y-Achse
achsen der Fläche. Schnittgrößen N und My erzeugen im Querschnitt an dieser Stelle die Längsspannung My N z σ(z) = + 1+ A 0 A κ( 0 + z) " z −1 dA . (5-55) mit κ = A A 0 + z Die neutrale Faser liegt bei z0 = − 0 κ[κ + (1 + 0 N/My )−1 ]−1 . Bild 5-25 zeigt den Spannungsverlauf qualitativ. κ ist eine Zahl. Im Fall 0 > 0 ist 0 < κ < 1. Für einen Rechteckquerschnitt (Höhe h in z-Richtung, beliebige Breite; α = h/(2 0 )) ist κ=
1 1+α ln −1. 2α 1 − α
Für einen Kreis- oder Ellipsenquerschnitt (Halbachse a in z-Richtung; α = a/ 0 ) ist κ=
1/2 2 1 2 − − 1 −1. α2 α α2
Für ein gleichschenkliges Dreieck (Höhe h in zRichtung; h > 0 im Fall der Spitze bei z > 0, sonst h < 0; α = h/(3 0)) ist 2 2 1 1 + 2α − −1. κ= 2+ ln 9α α 1−α 3α
Eine durch den Schubmittelpunkt gerichtete Querkraft Qz (x) verursacht im Querschnitt eines geraden Stabes an der Stelle x nur Schubspannungen. Am ganzen Rand des Querschnitts ist die Schubspannung tangential zum Rand gerichtet. In einfach berandeten Querschnitten aus dünnen Stegen nach Bild 5-11 ist sie überall annähernd tangential zur Stegmittellinie gerichtet und nur von der Koordinate s entlang der Stegmittellinie abhängig, und zwar nach der Gleichung τ(x, s) =
Qz (x) S y (s) . t(s)Iy
(5-56)
Die Bogenlänge s ist wie in Bild 5-11 definiert, und τ > 0 bedeutet, dass die Schubspannung am positiven Schnittufer positive s-Richtung hat. Tabelle 5-6 gibt die Richtungen und Größen von Schubspannungen für einige technische Querschnitte an. Die Anwendung von (5-56) auf nicht dünnstegige Querschnitte liefert nur grobe Näherungen. Die Anwendung auf den Kreisquerschnitt und den Rechteckquerschnitt liefert für z = 0 als brauchbare Näherungen für die Maximalspannung τmax = (4/3)Qz/A bzw. τmax = (3/2)Qz/A. Nach dem Satz von der Gleichheit zugeordneter Schubspannungen (5-8) herrscht die Schubspannung τ(s) auch in der Schnittebene parallel zur Stabachse und normal zum Steg bei s (Bild 5-26a). Auf einem Stabstück der Länge l wird in dieser Schnittebene die Schubkraft τ(s)t(s)l übertragen. Wenn die Schnittebene eine Niet- oder Schweißverbindung ist (Bild 5-26b), dann ist der tragende Querschnitt i. Allg. kleiner, also λt(s)l mit λ < 1. Die Spannung im tragenden Querschnitt ist deshalb τ(s)/λ.
Bei schwach gekrümmten Stäben ist | 0 | |z|. Dann ist κ ≈ Iy /( 20 A) und σ(z) ≈
Iy /A − z2 My My z, z+ ≈ Iy
0 Iy
wie beim geraden Stab.
Bild 5-26. Schubspannung in einer Klebverbindung (a) und
in den Nieten eines Deckbandes (b)
5 Festigkeitslehre. Elastizitätstheorie
Tabelle 5-6. Schubspannungen τ in dünnstegigen Stabquerschnitten infolge einer vertikalen Querkraft Qz . Pfeile geben die Richtung von τ an.
5.6.8 Torsion ohne Wölbbehinderung (Saint-Venant-Torsion)
Die Schnittgröße MT (x) verursacht im Stabquerschnitt nur Schubspannungen. Die maximale Schubspannung ist τmax = MT /WT . WT ist das nur von der Querschnittsform abhängige Torsionswiderstandsmoment (Dimension: Länge3). Tabelle 5-5 gibt Werte von WT für verschiedene Querschnittsformen an. Die Schubspannung im Stabquerschnitt ist am ganzen Rand tangential zum Rand gerichtet. Bei einfach berandeten Querschnitten beliebiger Form liefert der in 5.4.5 geschilderte Seifenhauthügel über dem Querschnitt in jedem Punkt Größe und Richtung der Schubspannung. Die Größe ist proportional zur maximalen Steigung des Hügels im betrachteten Punkt, und die Richtung ist tangential zur Höhenlinie des Hügels im betrachteten Punkt. In einem schmalen Rechteckquerschnitt (Höhe h, Breite b h) tritt die größte Schubspannung τmax ≈ 3MT /(hb2 ) am Außenrand in der Mitte der langen Seiten auf. Weitere Lösungen siehe in [6]. Da die Form des Seifenhauthügels ohne Experiment leicht vorstellbar ist, können Stellen mit Spannungskonzentrationen vorhergesagt werden, z. B. in einspringenden Ecken einer Querschnittskontur. In Kreis- und Kreisringquerschnitten (Innenradius Ri , Außenradius Ra , polares Flächenmoment 2. Grades Ip = π(R4a − R4i )/2) hat die Spannung am Radius r die Größe MT (x) r (5-57) τ(x, r) = Ip (x)
und die Richtung der Tangente an den Kreis (Bild 5-27). In einzelligen, dünnwandigen Hohlquerschnitten ist die Schubspannung überall tangential zur Wandmittellinie gerichtet. Ihre Größe wird durch die 1. Bredt’sche Formel angegeben (Bezeichnungen wie in (5-35)) MT . (5-58) τ(s) = 2Am t(s) Bei n-zelligen, dünnwandigen Hohlquerschnitten (Bild 5-13) ist an der Stelle s in der Wand zwischen zwei beliebigen Zellen i und j τ(s) = MT (λi −λ j )/t(s) mit λ1 , . . . , λn aus (5-36). Wenn die Wand nur einer Zelle i anliegt, wird λ j = 0 gesetzt. Vorzeichenregel: Ein λk > 0 für Zelle k bedeutet, dass MT λk /t(s) eine Schubspannung ist, die am positiven Schnittufer die Zelle k im Drehsinn von MT umkreist. 5.6.9 Torsion mit Wölbbehinderung
Nur Querschnitte mit einem Wölbwiderstand CM 0 werden bei Torsion verwölbt. Wölbbehinderungen
Bild 5-27. Schubspannungsverteilung im Kreisringquer-
schnitt bei Torsion
E91
E92
E Technische Mechanik / Mechanik fester Körper
verursachen im Querschnitt Schubspannungen τ∗ zusätzlich zu den ohne Wölbbehinderung vorhandenen Schubspannungen und außerdem Längsspannungen σ∗ . In einfach berandeten Querschnitten aus dünnen Stegen gilt mit den Bezeichnungen von Bild 5-11 mit derselben Funktion ω∗ (s) wie in (5-37) und mit ϕ(x) aus (5-70) " ⎫ ⎪ Eϕ (x) ∗ ∗ ⎪ ⎪ τ (x, s) = − ω (s)t (s) d s¯ , ⎪ ⎪ ⎬ t(s) (5-59) ⎪ ⎪ ⎪ ⎪ ⎪ ∗ ∗ ⎭ σ (x, s) = Eϕ (x) ω (s) . Die Integration erstreckt sich über alle Stege von A0 (s). σ∗ kann Werte annehmen, die nicht vernachlässigbar sind. Weitere Einzelheiten siehe in [9, 10].
5.7 Verformungen von Stäben und Balken Verformungen eines geraden Stabes werden in dem ortsfesten x, y, z-System von Bild 5-14 beschrieben. Für alle Verformungen gilt das Superpositionsprinzip, d. h. Verformungen für mehrere Lastfälle beliebiger Art können einzeln berechnet und linear überlagert werden. Energiemethoden zur Berechnung von Verformungen siehe in 5.8. Statisch unbestimmte Systeme siehe in 5.8.6.
vom Ebenbleiben der Querschnitte ergibt den Zusammenhang (w = dw/dx) −My (x) w (x) 1 = . = (5-61) 2 3/2
(x) [1 + w (x)] EIy (x) Für sehr kleine Neigungen |w (x)| 1 lautet die Differenzialgleichung der Biegelinie also −My (x) . w (x) = (5-62) EIy (x) EIy heißt Biegesteifigkeit des Stabes. Wenn die rechte Seite bekannt ist, ergeben sich w (x) und w(x) durch zweifache Integration. Die dabei auftretenden Integrationskonstanten werden aus Randbedingungen für w und für w ermittelt. Bei einem n-feldrigen Stab mit n verschiedenen Funktionen My (x)/(EIy(x)) wird (5-62) für jedes Feld gesondert aufgestellt und integriert, wobei die Durchbiegung in Feld i mit wi (x) bezeichnet wird. Bei der Integration fallen 2n Integrationskonstanten an. Zu ihrer Bestimmung stehen bei statisch bestimmten Systemen 2n Randbedingungen zur Verfügung. Statisch unbestimmte Systeme siehe in 5.8.6. Beispiel 5-6: Für den Stab in Bild 5-28 wird die Rechnung am einfachsten, wenn man x = 0 am Gelenk definiert. Dann ist im linken Feld Qz (x) = ql/2, My (x) = xql/2 und im rechten Feld Qz (x) = (ql/2)(1 − 2x/l),
5.7.1 Zug und Druck
Die Längenänderung eines geraden Stabes der Länge l infolge einer Längskraft N(x) und einer Temperaturänderung ΔT (x) ist (Integrationen über die gesamte Länge) " " " 1 Δl = ε(x) dx = σ(x) dx + α ΔT (x) dx E " " N(x) 1 dx + α ΔT (x) dx . (5-60) = E A(x) Im Sonderfall N = const, A = const, ΔT = const ist Δl = Nl/(EA) + α ΔT l. EA heißt Dehnsteifigkeit oder Längssteifigkeit des Stabes.
My (x) = (ql2 /2)(−x2/l2 + x/l) . Damit lautet (5-62) w1 (x)
x = −12 C , l
x2 x = 12 C 2 − l l
mit C = ql2 /(24EIy). Zwei Integrationen ergeben w1 (x) = C(−6x2 /l + a1 ) , w2 (x) = C(4x3 /l2 − 6x2 /l + b1 ) , w1 (x) = C(−2x3 /l + a1 x + a2 ) , w2 (x) = C(x4 /l2 − 2x3 /l + b1 x + b2 ) .
5.7.2 Gerade Biegung
Ein Biegemoment My (x) verursacht eine Krümmung 1/ (x) des Stabes um die y-Achse und eine Durchbiegung w(x) in z-Richtung. Die Bernoulli-Hypothese
w2 (x)
Bild 5-28. Biegestab
5 Festigkeitslehre. Elastizitätstheorie
Die Randbedingungen w1 (−l ) = 0, w1 (−l ) = 0, w1 (0) = w2 (0) und w2 (l) = 0 ergeben a1 = 6l, a2 = 4l2 , b1 = −3l, b2 = 4l2 und damit # $3 x ql4 x +6 +4 w1 (x) = −2 24EIy l l # x $3 ql4 # x $4 x w2 (x) = −2 −3 +4 . 24EIy l l l Tabelle 5-7 gibt Durchbiegungen und Neigungen für Standardfälle an. Viele andere Fälle siehe in [11]. Zwischen dem Biegemoment Mz (x) und der Durchbiegung v(x) in y-Richtung gilt entsprechend (5-62) die Gleichung Mz (x) . v (x) = (5-63) EIz (x) Ihre Integration liefert mit denselben Rechenschritten v (x) und v(x). 5.7.3 Schiefe Biegung
Schiefe Biegung ist die Superposition von My (x) und Mz (x). Die Durchbiegungen w(x) und v(x) werden aus (5-62) bzw. (5-63) berechnet. Anmerkung: Die Geometrie eines Systems kann eine Kopplung der Randbedingungen für w(x) und für v(x) herstellen. Beispiel 5-7: Wenn der Stab in Bild 5-28 den Querschnitt nach Bild 5-29 hat, dann heißt das Biegemoment My (x) von Beispiel 5-6 jetzt Mη (x). Daraus ergibt sich für die gedrehten Hauptachsen My (x) = Mη (x) cos α, Mz (x) = −Mη (x) sin α. Das Lager am rechten Ende erlaubt keine vertikale Verschiebung. Also lautet die Randbedingung v(l) sin α + w(l) cos α = 0.
tung ausgeübte Streckenlast qB (x) als proportional zur örtlichen Durchbiegung w(x) an, qB (x) = −Kw(x). Unter einer äußeren eingeprägten Streckenlast q(x) ergibt sich für w(x) die Differenzialgleichung (EIy w ) = −My = q(x) − Kw(x) und im Fall EIy = const die Gleichung w(4) + 4λ4 w =
q(x) EIy
mit der Abkürzung 4λ4 = K/(EIy ). Die allgemeine Lösung ist die Summe aus der Lösung der homogenen Gleichung, w(x) = (c1 cos λx + c2 sin λx) exp(−λx) + (c3 cos λx + c4 sin λx) exp(λx) ,
(5-64)
und der partikulären Lösung der inhomogenen Gleichung. Es gilt das Superpositionsprinzip. Die Integrationskonstanten c1 , . . . , c4 werden aus Randbedingungen für w, w , w (Biegemoment) und w (Querkraft) bestimmt. Beispiel 5-8: Bei einer beidseitig unendlich langen Eisenbahnschiene mit einer Einzelkraft F an der Stelle x = 0 ist w(−x) = w(x), und im Bereich x 0 ist # π$ Fλ . w(x) = √ exp(−λx) sin λx + 4 K 2 Das bei x = 0 maximale Biegemoment ist My max = F/(4λ). Zahlreiche andere spezielle Lösungen siehe in [12– 14].
5.7.4 Stab auf elastischer Bettung (Winkler-Bettung)
5.7.5 Biegung von Stäben aus Verbundwerkstoff
Bei Eisenbahnschienen und anderen elastisch gebetteten Stäben nimmt man nach Winkler die von der Bet-
Stäbe mit Querschnitten nach Bild 5-23 haben die Differenzialgleichung der Biegelinie w (x) =
Bild 5-29. Lagerung, die eine Kopplung der Durchbiegungen v und w in den Randbedingungen verursacht
−M(x)ΣEi Ai . (ΣEi Iyi )(ΣEi Ai ) − (ΣEi zSi Ai )2
(5-65)
Der Ausdruck auf der rechten Seite ist die mit –1 multiplizierte Krümmung 1/ (x) von (5-49). Die Gleichung hat dieselbe Form wie (5-62) und wird mit denselben Rechenschritten gelöst.
E93
Tabelle 5-7. Biegelinien und Neigungen von statisch bestimmten und statisch unbestimmten Stäben. Bei den statisch unbestimmten Stäben sind Auflagerre↑ weist auf aktionen FB und MB angegeben. Abkürzungen: ξ = x/l, ξ1 = x1 /l, α = a/l, β = b/l; W ist jeweils unter der Abbildung erklärt. Das Symbol extremale Durchbiegungen wm hin, die in der Tabelle angegeben sind
E94 E Technische Mechanik / Mechanik fester Körper
Tabelle 5-7. (Fortsetzung)
5 Festigkeitslehre. Elastizitätstheorie
E95
E Technische Mechanik / Mechanik fester Körper
Tabelle 5-7. (Fortsetzung)
E96
Tabelle 5-7. (Fortsetzung)
5 Festigkeitslehre. Elastizitätstheorie
E97
E Technische Mechanik / Mechanik fester Körper
Tabelle 5-7. (Fortsetzung)
E98
5 Festigkeitslehre. Elastizitätstheorie
Spannbeton mit Verbund. Bei Spannbetonstäben nach Bild 5-24 lautet die Differenzialgleichung der Biegelinie: w (x) = −[(My (x) − Σσ0i zSi Ai )(ΣEi Ai ) + (Σσ0i Ai )(ΣEi zSi Ai )]/ [(ΣEi Iyi )(ΣEi Ai ) − (ΣEi zSi Ai )2 ] .
(5-66)
Der Ausdruck auf der rechten Seite ist die mit –1 multiplizierte Krümmung 1/ (x) von (5-49). Die Gleichung hat dieselbe Form wie (5-62) und wird mit denselben Rechenschritten gelöst. Für My (x) ≡ 0 erhält man die Durchbiegung im Zustand von Bild 5-24b. 5.7.6 Querkraftbiegung
Der Beitrag der Querkraft Qz (x) zur Durchbiegung eines Stabes wird wQ (x) genannt. Bei gleichmäßiger Verteilung der Schubspannung im Stabquerschnitt wäre wQ = Qz /(GA). Wegen der tatsächlich ungleichmäßigen Verteilung nach (5-56) gilt mit der Querschubzahl κz von (5-31) wQ (x) = κz
Qz (x) . GA(x)
(5-67)
Entsprechend gilt für die Verschiebung vQ in y-Richtung vQ (x) = κy
Qy (x) . GA(x)
Im Fall GA = const sind die Verschiebungen selbst wegen (5-39) und (5-40) My (x) + const, wQ (x) = κz GA Mz (x) vQ (x) = −κy + const . GA Die gesamte Durchbiegung in z-Richtung infolge My (x) und Qz (x) ist wges (x) = w(x) + wQ (x) mit w(x) aus (5-62). Bei langen, dünnen Stäben ist wQ gegen w vernachlässigbar klein. Zum Beispiel ist das Verhältnis wQ /w am freien Ende eines einseitig eingespannten und am freien Ende belasteten Stabes der Länge l mit Rechteckquerschnitt der Höhe h gleich 0,3E h2 h2 ≈ 2 . G l2 l
5.7.7 Torsion ohne Wölbbehinderung (Saint-Venant-Torsion)
Der Drehwinkel des Stabquerschnitts an der Stelle x heißt ϕ(x). Die Drehung erfolgt um den Schubmittelpunkt. Die Ableitung ϕ (x) = dϕ/dx heißt Drillung des Stabes. Zum Torsionsmoment MT (x) besteht die Beziehung ϕ (x) =
MT (x) . GIT (x)
(5-68)
GIT heißt Torsionssteifigkeit des Stabes. Die Gleichung ist gültig für Stäbe, deren Querschnitte bei Torsion eben bleiben (Wölbwiderstand CM = 0). Für Stäbe mit CM 0 gilt sie nur, wenn die Querschnittverwölbung nicht behindert wird. Das setzt Gabellager und MT (x) = const voraus. Die Wölbbehinderung durch Lager ist ein lokaler, mit wachsender Entfernung vom Lager schnell abklingender Effekt. Bei langen, dünnen Stäben kann sie häufig vernachlässigt werden. Ein Stab der Länge l mit MT /(GIT ) = const hat den Verdrehwinkel ϕ = MT l/(GIT ) der Endquerschnitte. Sehr lange Stäbe, wie z. B. Bohrstangen bei Tiefbohrungen, können um mehrere Umdrehungen tordiert sein. Angaben über Torsionsflächenmomente IT von Stabquerschnitten siehe in 5.4.5 und in Tabelle 5-5. 5.7.8 Torsion mit Wölbbehinderung
Bei Stäben mit einem Wölbwiderstand CM 0 entstehen Wölbbehinderungen lokal durch Lager und im Fall MT (x) const im ganzen Stab durch gegenseitige Beeinflussung benachbarter Querschnitte. Mit x veränderliche Torsionsmomente treten z. B. an Fahrbahnen von Brücken auf, wenn Eigengewicht und Verkehrslasten ein Moment um den Schubmittelpunkt des Fahrbahnquerschnitts erzeugen. Für die Drillung ϕ (x) und den Verdrehwinkel ϕ(x) gilt −ϕ + λ2 ϕ =
MT (x) , ECM
λ2 =
GIT . ECM
(5-69)
Die Lösung hat die allgemeine Form ϕ(x) = c1 cosh λx + c2 sinh λx + c3 + ϕpart (x) (5-70)
E99
E100
E Technische Mechanik / Mechanik fester Körper
mit Integrationskonstanten c1 , c2 und c3 und mit der partikulären Lösung ϕpart (x). Für MT (x) = MT0 und für MT (x) = mx + MT0 mit Konstanten MT0 und m ist ϕpart (x) = xMT0 /(GIT ) bzw. ϕpart (x) =
x2 m xMT0 + . 2GIT GIT
Die Integrationskonstanten in (5-70) werden aus Randbedingungen bestimmt. Randbedingungen betreffen ϕ, ϕ und ϕ . Die wichtigsten Randbedingungen sind ϕ = 0 an festen Einspannungen und an Gabellagern, ϕ = 0 an Stellen mit ganz unterdrückter Verwölbung (feste Einspannungen und aufgeschweißte starre Platten an freien Enden) und ϕ = 0 an Stellen ohne Längsspannung (freie Enden und Gabellager). Beispiel 5-9: Für einen Stab mit fester Einspannung bei x = 0 und freiem Ende bei x = l ist im Fall MT = const ' MT 1 ϕ(x) = x + [tanh λl (cosh λx − 1) − sinh λx] . GIT λ Bei mehrfeldrigen Stäben mit verschiedenen Lösungen (5-70) in verschiedenen Feldern hat jedes Feld Randbedingungen (z. B. die Bedingung, dass ϕ(x) beiderseits einer Feldgrenze gleich ist). Lösungen zu vielen praktischen Fällen siehe in [9, 10]. Bei Stäben mit einfach berandeten Querschnitten aus dünnen Stegen (siehe Bild 5-11) ist die axiale Verschiebung u(x, s) = ϕ (x)ω∗ (s) mit der Drillung ϕ (x) und derselben Funktion ω∗ (s), wie in (5-37). Beispiel 5-10: Bei einem dünnwandigen Kreisrohr mit Längsschlitz (Radius r, Wanddicke t r) und mit ϕ = const verschieben sich die Schlitzufer axial gegeneinander um 2πr2 ϕ .
5.8 Energiemethoden der Elastostatik Die allgemeinen Sätze und Methoden dieses Abschnitts sind auf elastische Systeme anwendbar, die in beliebiger Weise aus Stäben, Balken, Scheiben, Platten, Schalen und dreidimensionalen Körpern zusammengesetzt sind. Kräfte und Momente werden unter dem Oberbegriff generalisierte Kraft F zusammengefasst; ebenso Verschiebungen und Drehwinkel unter dem Oberbegriff generalisierte Verschiebung w.
5.8.1 Formänderungsenergie. Äußere Arbeit
Formänderungsenergie. In einem ruhenden, linear elastischen System ist Energie gespeichert. Bei konstanter Temperatur ist die Energie nur vom Spannungszustand abhängig und nicht davon, wie der Zustand entstanden ist. Sie ist also eine potenzielle Energie. Sie heißt Formänderungsenergie U des Körpers. Durch Spannungen und Verzerrungen ausgedrückt ist (Integration über " das gesamte Volumen V) 1 (σ x ε x + σy εy + σz εz U= 2 V
+ τ xy γ xy + τyz γyz + τzx γzx ) dV " 1 2 1 [σ x + σ2y + σ2z = 2 E
(5-71)
V
− 2ν(σx σy + σy σz + σz σ x )] ' 1 2 2 2 + (τ xy + τyz + τzx ) dV G " 4 ν E = (ε x + εy + εz )2 2(1 + ν) 1 − 2ν +
ε2x
V 2 εy +
+ ε2z 1 2 2 2 + γ + γyz + γzx dV . 2 xy Daraus folgt U 0; U = 0 nur bei völlig spannungsfreiem Körper. Für Stabsysteme ist U als Funktion der Schnittgrößen "li ⎡ 2 1 ⎢⎢⎢⎢ N 2 (x) My (x) Mz2 (x) + + U= ⎢⎣ 2 i EA(x) EIy (x) EIz (x) 0 ⎤ Q2y (x) MT2 (x) ⎥⎥⎥ Q2z (x) + κz (x) + + κy (x) ⎥⎥ dx GA(x) GA(x) GIT (x) ⎦ (5-72) (Summation über alle Stäbe; Integration über die Stablängen). Ein Sonderfall hiervon sind Fachwerke (siehe 2.3) mit Ni = const, Ei Ai = const in Stab i. In einem Fachwerk aus n Stäben ist die Formänderungsenergie n 1 Ni2 li . (5-73) U= 2 i=1 Ei Ai In Biegestäben und Platten kann U als Funktion von Durchbiegungen ausgedrückt werden (siehe 5.8.8 und 5.10.2).
5 Festigkeitslehre. Elastizitätstheorie
Äußere Arbeit. Wenn äußere eingeprägte Kräfte ein anfangs spannungsfreies elastisches System bei konstanter Temperatur quasistatisch verformen, dann ist die äußere Arbeit Wa der Kräfte gleich der Formänderungsenergie U. Daraus folgt u. a., dass der Spannungszustand und der Verzerrungszustand am Ende der Belastung unabhängig von der Reihenfolge ist, in der die Kräfte aufgebracht werden. Im Fall von generalisierten Einzelkräften F1 , . . . , Fn (äußere eingeprägte Kräfte oder Momente) ist n 1 Wa = U = Fi wi , (5-74) 2 i=1 wobei wi die durch F1 , . . . , Fn verursachte Komponente der generalisierten Verschiebung am Ort und in Richtung von Fi ist (ein Drehwinkel, wenn Fi ein Moment ist).
Bild 5-30. Druckstab zwischen starren Lagern
Πa = 0 (weil die Lager starr sind). Mit der Nebenbedingung f = Δl1 + Δl2 − Δl = 0 und mit einem Lagrange’schen Multiplikator λ lauten die Stationaritätsbedingungen ∂(U + λ f )/∂(Δli ) = ki Δli + λ = 0 (i = 1, 2). Daraus folgt Δl1 = Δlk2 /(k1 + k2 ), Δl2 = Δlk1 /(k1 + k2 ). Weitere Anwendungen siehe in 5.8.8.
5.8.2 Prinzip der virtuellen Arbeit
5.8.3 Arbeitsgleichung oder Verfahren mit einer Hilfskraft
Das Prinzip der virtuellen Arbeit lautet: Bei einer virtuellen Verschiebung eines ideal elastischen Systems aus einer Gleichgewichtslage (das ist der deformierte Zustand unter äußeren eingeprägten Kräften) ist die virtuelle Arbeit δWa der äußeren eingeprägten Kräfte gleich der virtuellen Änderung δU von U,
Bei einem statisch bestimmten oder unbestimmten Stabsystem wird die generalisierte Verschiebung w (an einer beliebigen Stelle und in beliebiger Richtung) infolge einer gegebenen äußeren Belastung und einer gegebenen Temperaturänderung aus der Arbeitsgleichung berechnet:
δWa = δU .
(5-75)
Aus diesem Prinzip folgen u. a. die Sätze in 5.8.3, 5.8.4 und 5.8.7 sowie der folgende Satz vom stationären Wert der potenziellen Energie. Im Sonderfall eines konservativen Systems haben die äußeren Kräfte ein Potenzial Πa , sodass δWa = −δΠa und folglich δ(Πa + U) = 0
(5-76)
ist. Also hat das Gesamtpotenzial Πa + U in Gleichgewichtslagen einen stationären Wert (Minimum, Maximum oder Sattelpunkt). In stabilen Gleichgewichtslagen hat es ein Minimum (siehe 2.6). Beispiel 5-11: Zwei Stäbe (Längen l1 und l2 , Längsfederkonstanten k1 = E1 A1 /l1 und k2 = E2 A2 /l2 ) werden nach Bild 5-30 zwischen starre Lager im Abstand l = l1 + l2 − Δl mit Δl > 0 gezwängt. Ihre Verkürzungen Δl1 und Δl2 werden aus dem Satz vom stationären Wert der potenziellen Energie wie folgt berechnet. U = k1 (Δl1 )2 + k2 (Δl2 )2 /2 ,
wF¯ =
l " i N(x)N(x) ¯ y (x) ¯ My (x) M + EA(x) EIy (x) i 0
+
¯ z (x) Qy (x)Q¯ y (x) Mz (x) M + κy (x) EIz (x) GA(x)
¯ T (x) Qz (x)Q¯ z (x) MT (x) M + GA(x) GIT (x) ¯ + αΔT (x)N(x) dx . (5-77)
+ κz (x)
F¯ ist eine generalisierte Hilfskraft beliebiger Größe am Ort und in Richtung von w (ein Hilfsmoment, wenn w ein Drehwinkel ist); die quergestrichenen ¯ ¯ y (x) usw. sind die Schnittgrößen Funktionen N(x), M bei Belastung durch F¯ allein, und die nicht gestrichenen N(x), My (x) usw. sind diejenigen unter der tatsächlichen äußeren Belastung durch Einzelkräfte, Streckenlasten usw.; ΔT (x) ist die gegebene Temperaturänderung; an der Stelle x muss sie über den Stabquerschnitt konstant sein.
E101
E102
E Technische Mechanik / Mechanik fester Körper
Bei konstanten Nennerfunktionen sind alle Integrale .s in (5-77) vom Typ P(x)K(x) dx. Tabelle 5-8 gibt das 0
Integral für verschiedene grafisch dargestellte Funktionen P(x) und K(x) an. Beispiel 5-12: In einem statisch bestimmten Fachwerk aus n Stäben mit Stabkräften N1 , . . . , Nn infolge gegebener Knotenlasten ist die Verschiebung w eines beliebig gewählten Knotens in einer beliebig gewählten Richtung n 1 Ni N¯ i li w= . F¯ i=1 Ei Ai Darin sind N¯ 1 , . . . , N¯ n die Stabkräfte infolge einer Hilfskraft F¯ am Ort und in Richtung von w. Zur Verwendung von (5-77) bei statisch unbestimmten Systemen siehe 5.8.6. Eine relative generalisierte Verschiebung wrel zweier Punkte ein und desselben Systems kann entweder in zwei Schritten als Summe zweier entgegengesetzt gerichteter absoluter Verschiebungen berechnet werden oder wie folgt in einem Schritt. Man bringt an den sich relativ zueinander verschiebenden Stellen entgegengesetzt gerichtete, gleich große generalisier¯ ¯ y (x) M te Hilfskräfte an und setzt in (5-77) für N(x), usw. die Schnittgrößen infolge beider Hilfskräfte ein. Dann ist w = wrel . Beispiel 5-13: In Bild 5-31a wird der relative Drehwinkel ϕ der beiden Stabtangenten am Gelenk infolge der gegebenen Last q mit den Hilfsmomenten M¯ von Bild 5-31b berechnet. Mit den angegebenen Funktio-
Bild 5-31. a,b. Biegestab
nen My (x) (vgl. Beispiel 5-6) und M¯ y (x) liefert (5-77) ϕ = 3ql3 /(8EIy). Schwach gekrümmte Stäbe. Bei schwach gekrümmten Stäben ist die Biegespannung nach 5.6.6 angenähert so, wie bei geraden Stäben. Folglich gilt auch (5-77), wenn man dx durch das Element ds der Bogenlänge ersetzt. Beispiel 5-14: Bei dem halbkreisförmigen Stab in Bild 5-32 ist ds = R dϕ. Wenn z. B. der Drehwinkel α am freien Ende unter der Last F gesucht ist, werden das Biegemoment My (ϕ) = FR sin ϕ ¯ infolge ¯ y (ϕ) ≡ M infolge F und das Biegemoment M des Hilfsmoments M¯ in (5-77) eingesetzt. Das liefert FR α= EIy
"π sin ϕ dϕ = 2
FR . EIy
0
Lösungen vieler Probleme an Kreisbogenstäben siehe in [22], Rechenmethoden bei gekrümmten Durchlaufträgern siehe in [15]. 5.8.4 Sätze von Castigliano
Der 1. Satz von Castigliano lautet: wi =
∂UF . ∂Fi
(5-78)
Darin ist UF (F1 , . . . , Fn ) die Formänderungsenergie eines beliebigen linear elastischen Systems, ausgedrückt als explizite Funktion der äußeren eingeprägten generalisierten Kräfte. wi ist die generalisierte Verschiebung am Angriffspunkt und in Richtung von Fi (ein Winkel im Fall eines Moments). Für statisch bestimmte Stabsysteme stellt der Ausdruck in (5-72) die Funktion UF dar, sobald man die Schnittgrößen durch die äußeren eingeprägten Lasten ausgedrückt hat. Statisch unbestimmte Systeme siehe in 5.8.6. Gleichung (5-78) dient zur Berechnung von Verschiebungen. Wenn die Verschiebung w eines Punktes gesucht ist, an dem keine Einzelkraft
Bild 5-32. Schwach gekrümmter Biegestab
5 Festigkeitslehre. Elastizitätstheorie
Tabelle 5-8. Werte von Integralen
.s
P(x)K(x) dx. Die Punkte ◦ sind Scheitel von quadratischen Parabeln.
0
angreift, dann führt man dort in Richtung von w eine Hilfskraft F¯ als zusätzliche äußere Kraft ein, ¯ bestimmt UF für alle äußeren Kräfte einschließlich F, bildet die Ableitung nach F¯ und setzt dann F¯ = 0 ein. Der 2. Satz von Castigliano lautet: Fi =
∂Uw . ∂wi
(5-79)
Darin ist Uw (w1 , . . . , wn ) die Formänderungsenergie eines beliebigen linear oder nichtlinear elastischen Systems, ausgedrückt als Funktion von n generalisierten Verschiebungen. Fi ist die generalisierte Kraft am Ort und in Richtung von wi (ein Moment, wenn wi ein Drehwinkel ist). Systeme aus Hooke’schem Material können aus geometrischen Gründen nichtlinear sein. Beispiel 5-15: Zwischen zwei Haken im Abstand 2l ist ein biegeschlaffes Seil (Längssteifigkeit EA) mit
der Kraft S vorgespannt. In Seilmitte greift quer zum Seil eine Kraft F an und verursacht dort eine Auslenkung w. Welche Beziehung besteht zwischen F und w? Lösung: Das halbe Seil hat die Federkonstante k = EA/l, die Vorverlängerung Δl0 = S l/(EA) infolge S und die Gesamtverlängerung Δl = Δl0 + (w2 + l2 )1/2 − l infolge S und F. Für das ganze Seil ist damit 2 EA S l (Δl)2 2 2 1/2 = + (w + l ) − l . Uw (w) = 2k 2 l EA (5-79) liefert den gewünschten Zusammenhang F= =
∂Uw ∂w
2EA S l + (w2 + l2 )1/2 − l w(w2 + l2 )−1/2 . l EA
E103
E104
E Technische Mechanik / Mechanik fester Körper
Die Taylorentwicklung dieses Ausdrucks nach w ist 3 w w 3 w5 F = 2S + (EA − S ) 3 − + ... l 4 l5 l 5.8.5 Steifigkeitsmatrix. Nachgiebigkeitsmatrix. Satz von Maxwell und Betti
In einem beliebigen linear elastischen System mit generalisierten Kräften (d. h. Kräften oder Momenten) F1 , . . . , Fn seien w1 , . . . , wn die generalisierten Verschiebungen (d. h. Verschiebungen oder Verdrehwinkel) am Ort und in Richtung der Kräfte. Im Gleichgewicht besteht zwischen den Matrizen F = [F1 . . . Fn ]T und w = [w1 . . . wn ]T eine lineare Beziehung F = K w mit einer Steifigkeitsmatrix K. Der Satz von Maxwell und Betti sagt aus, dass K symmetrisch ist. Wenn F1 , . . . , Fn eingeprägte Kräfte an einem unbeweglich gelagerten System sind, dann hat K eine ebenfalls symmetrische Inverse K −1 = H. Sie heißt Nachgiebigkeitsmatrix. Beispiel 5-16: Für den Zugstab und den Biegestab in Bild 5-33a, b gilt EA 1 −1 u1 F1 = , F2 l −1 1 u2 bzw.
2EIy 6 −3l w F . = 3 −3l 2l2 ϕ M l
Die erste Steifigkeitsmatrix ist singulär, die zweite hat eine Inverse, und zwar ⎡ 2 ⎤ ⎢⎢⎢ l l ⎥⎥⎥ ⎢ l ⎢⎢⎢ 3 2 ⎥⎥⎥⎥ F w = . ⎢ ⎥⎥⎥ ϕ EIy ⎢⎢⎢⎣ l ⎥ M 1⎦ 2 Zur Aufstellung von Steifigkeitsmatrizen siehe 5.13.1.
Bild 5-33. a Zugstab und b Biegestab zur Erläuterung von Steifigkeitsmatrizen
5.8.6 Statisch unbestimmte Systeme. Kraftgrößenverfahren
In statisch unbestimmten Systemen entstehen Auflagerreaktionen und Schnittgrößen nicht nur durch äußere eingeprägte Lasten, sondern auch bei Temperaturänderungen und bei erzwungenen generalisierten Verschiebungen (Lagersetzungen, Stabverkürzungen durch Anziehen von Spannschlössern, durch Einbau falsch bemessener Stäbe u. dgl.). In einem n-fach statisch unbestimmten System sind insgesamt n Verschiebungen oder relative Verschiebungen entweder vorgeschrieben oder gesuchte Unbekannte. An diesen Stellen werden durch Schnitte n innere generalisierte Kräfte K1 , . . . , Kn zu äußeren Kräften an einem dadurch erzeugten, statisch bestimmten Hauptsystem gemacht. An diesem Hauptsystem werden mithilfe der Arbeitsgleichung (5-77) oder des 1. Satzes von Castigliano (5-78) oder der Dgl. (5-62) der Biegelinie oder mit Tabellenwerken die n ausgezeichneten Verschiebungen durch die äußere Belastung einschließlich K1 , . . . , Kn ausgedrückt. Das Ergebnis sind n Gleichungen für die n Unbekannten (je nach Aufgabenstellung Kraftgrößen oder Verschiebungen). Nach Auflösung der Gleichungen werden alle weiteren Rechnungen ebenfalls am Hauptsystem durchgeführt. Beispiel 5-17: Am zweifach unbestimmten Fachwerk links in Bild 5-34 werden nach spiel- und spannungsfreier Montage die Last F, die Lagersenkung wB , die Verkürzung Δw von Stab 6 durch ein Spannschloss und die gleichmäßige Erwärmung der Stäbe 4, 5 und 6 um ΔT vorgegeben. Schnitte am Lager B und durch Stab 6 erzeugen das statisch bestimmte Hauptsystem rechts in Bild 5-34 mit den unbekannten Kraftgrößen K1 und K2 . Am Hauptsystem werden Δw und wB mit
Bild 5-34. Statisch unbestimmtes Fachwerk mit Spann-
schloss und Lagerabsenkung wB
5 Festigkeitslehre. Elastizitätstheorie
Tabelle 5-9. Stabkräfte im Fachwerk von Bild 5-34
i 1 2 3 4, 5, 6
Ni √ F/2 − K1 / 3 + K2 √ −F − K1 / 3 √ F − K1 / 3 K1
N¯ i (nur K¯ 1 ) √ − K¯ 1 / 3 √ − K¯ 1 / 3 √ − K¯ 1 / 3 K¯ 1
N¯ i (nur K¯ 2 ) K¯ 2 – – –
li l l l √ l/ 3
ΔT i – – – ΔT
Hilfskräften K¯ 1 anstelle von K1 bzw. K¯ 2 anstelle von K2 aus (5-77) berechnet. Dazu werden zuerst die Stabkräfte in allen Stäben infolge F, K1 und K2 , infolge K¯ 1 allein und infolge K¯ 2 allein berechnet. Das Ergebnis ist die Tabelle 5-9. Einsetzen in (5-77) liefert für K1 und K2 die Gleichungen √ √ ⎫ Δw = l/(EA)[K1 (1 + 3) − K2 / 3 ⎪ ⎪ ⎪ ⎪ ⎪ √ √ ⎬ (5-80) −F 3/6] + αΔT l 3 ⎪ ⎪ ⎪ ⎪ √ ⎪ ⎭ wB = l/(EA)(−K1/ 3 + K2 + F/2).
gemomentenlinie ist die Überlagerung der Biegemomentenlinie infolge Mi−1 , Mi und Mi+1 (nicht dargestellt) und der Biegemomentenlinie zu den gegebenen äußeren Lasten (My (x) in Bild 5-35 unten rechts). Der Knickwinkel am Gelenk i infolge der Lasten wird mit ¯ i in Bild 5-35 unten links und dem Hilfsmoment M mit der zugehörigen Biegemomentenlinie M¯ y (x) berechnet. Der Knickwinkel infolge Lagerabsenkung ist
Dreimomentengleichung für Durchlaufträger. Der Durchlaufträger oben in Bild 5-35 mit Lagern i = 0, . . . , n + 1 und Feldern i = 1, . . . , n + 1 (li , EIi ) wird spannungsfrei montiert. Anschließend treten Lagerabsenkungen w0 , . . . , wn+1 und beliebige äußere Lasten auf. Das System ist n-fach statisch unbestimmt. Ein statisch bestimmtes Hauptsystem entsteht durch Einbau von Gelenken in die Lager i = 1, . . . , n. Unbekannte Kraftgrößen sind Momente M1 , . . . , Mn , wobei Mi (i = 1, . . . , n) unmittelbar rechts und links vom Gelenk i mit entgegengesetzten Vorzeichen am Träger angreift (siehe Bild 5-35 unten Mitte). Die Momente werden aus der Bedingung bestimmt, dass an keinem Gelenk ein Knick auftritt. Zur Formulierung der Bedingung für Gelenk i werden die Felder i und i + 1 mit ihrer äußeren Last einschließlich Mi−1 , Mi und Mi+1 betrachtet (Bild 5-35 unten Mitte). Die Bie-
Damit der gesamte Knickwinkel am Gelenk i gleich null ist, muss die sog. Dreimomentengleichung erfüllt sein: li li+1 li li+1 + Mi+1 + Mi−1 + 2Mi Ii I I I i+1 i+1 ⎡ i ⎢⎢⎢ " 6 ⎢⎢⎢ 1 ¯ y (x) dx = 6Eϕi − My (x) M ⎢ M¯ i ⎢⎢⎣ Ii li ⎤ " ⎥⎥⎥ 1 ¯ y (x) dx⎥⎥⎥⎥⎥ ,+ My (x) M ⎥⎦ Ii+1
ϕi =
wi−1 − wi wi+1 − wi + . li li+1
li+1
(i = 1, . . . , n; M0 = Mn+1 = 0) .
(5-81)
Die Integrale werden mit Tabelle 5-8 ausgewertet. Aus (5-81) werden M1 , . . . ,Mn bestimmt. Damit sind
Bild 5-35. n-fach statisch unbestimmter Durchlaufträger (oben) und ein statisch bestimmtes Hauptsystem (unten Mitte) mit Biegemomentenlinien (links und rechts daneben)
E105
E106
E Technische Mechanik / Mechanik fester Körper
auch die Biegemomentenlinien bekannt. Lagerreaktionen werden an den Systemen in Bild 5-35 unten Mitte bestimmt. Tabellen mit Lösungen für verschiedene Zahlen n und für verschiedene Lastfälle siehe in [2, 16]. Im Sonderfall identischer Feldparameter li /Ii ≡ l/I hat (5-81) nach Multiplikation mit I/l eine Koeffizientenmatrix A mit den Nichtnullelementen Aii = 4 (i = 1, . . . , n) und Ai,i+1 = Ai+1,i = 1 (i = 1, . . . , n − 1). Ihre Inverse hat die Elemente √ √ (A−1 )i j = ( 3/6)( 3 − 2)i− j × mit r = (2 −
(1 − r j )(1 − rn+i−1 ) 1 − rn+1
(i ≥ j)
5.8.8 Verfahren von Ritz für Durchbiegungen
In dem Stab von Bild 5-36 ist in der gebogenen Gleichgewichtslage die potenzielle Energie " 1 U= EIy (x)w 2 (x) dx 2 gespeichert. Das folgt aus (5-72) und (5-62). Wenn F und q(x) Gewichtskräfte sind, dann haben sie in der Gleichgewichtslage die potenzielle Energie " Πa = −Fw(x1 ) − q(x)w(x) dx .
√ 2 3) ≈ 0,072.
5.8.7 Satz von Menabrea
In einem n-fach statisch unbestimmten System, das ohne äußere Belastung spannungsfrei ist, sind bei beliebiger äußerer Belastung die Verschiebungen und Relativverschiebungen an den Angriffspunkten der unbekannten Kraftgrößen K1 , . . . , Kn gleich null (zur Bedeutung von K1 , . . . , Kn siehe 5.8.6). Aus (5-78) folgt deshalb ∂UF = 0 (i = 1, . . . , n) . ∂Ki
Wenn man hiervon die partiellen Ableitungen nach K1 und nach K2 bildet und zu null setzt, ergeben sich die Bestimmungsgleichungen (5-80) für K1 und K2 für den betrachteten Sonderfall.
(5-82)
Darin ist UF die Formänderungsenergie des statisch bestimmten Hauptsystems als Funktion der äußeren Belastung einschließlich K1 , . . . , Kn . Sie wird mit den Schnittgrößen des Hauptsystems für allgemeine Stabsysteme aus (5-72) und für Fachwerke aus (5-73) gewonnen. Gleichung (5-82) stellt n lineare Gleichungen zur Bestimmung von K1 , . . . , Kn dar. Beispiel 5-18: In Beispiel 5-17 sei wB = 0, Δw = 0, ΔT = 0, sodass das Fachwerk in Bild 5-34a ohne die Last F spannungsfrei ist. Unter der Last F hat das statisch bestimmte Hauptsystem von Bild 5-34b mit den Kraftgrößen K1 und K2 die Stabkräfte N1 , . . . , N6 nach Tabelle 5-9. Damit erhält man aus (5-73) ⎡ 2 K1 l ⎢⎢⎢⎢ 1 UF = ⎢ F − √ + K2 2EA ⎣ 2 3 ⎤ 2 2 K12 ⎥⎥⎥ K1 K1 + −F − √ + F− √ + 3 √ ⎥⎥⎦ . 3 3 3
Entsprechendes gilt für andere Belastungen und andere Lagerungen. Das Gesamtpotenzial (5-76) des Systems ist " Π = Πa + U = −Fw(x1 ) − q(x)w(x) dx " 1 EIy (x)w 2 (x) dx . + (5-83) 2 Aus dem Satz, dass Π in der Gleichgewichtslage einen stationären Wert hat (siehe 5.8.2), wird nach Ritz eine Näherung für die Funktion w(x) wie folgt berechnet. Man wählt n (häufig genügen n = 2) vernünftig erscheinende Ansatzfunktionen w1 (x), . . . , wn (x), die die sog. wesentlichen oder geometrischen Randbedingungen (das sind die für w und w ) erfüllen und bildet die Funktionenklasse w(x) = c1 w1 (x) + . . . + cn wn (x) mit unbestimmten Koeffizienten c1 , . . . , cn . Die beste Näherung an die
Bild 5-36. Biegestab zur Erläuterung des Ritz’schen Verfah-
rens
5 Festigkeitslehre. Elastizitätstheorie
tatsächliche Biegelinie wird mit den Werten c1 , . . . , cn erreicht, die die Stationaritätsbedingungen ∂Π = 0 (i = 1, . . . , n) ∂ci
(5-84)
erfüllen. Sie liefern das lineare Gleichungssystem A[c1 . . . cn ]T = B mit einer symmetrischen Matrix A und einer Spaltenmatrix B mit den Elementen . ⎫ Ai j = EIy (x)wi (x)wj (x) dx , ⎪ ⎪ ⎬ . (5-85) ⎪ ⎪ Bi = Fwi (x1 ) + q(x)wi (x) dx ⎭ (i, j = 1, . . . , n) . Die Bi sind für andere äußere Lasten sinngemäß zu berechnen.
5.9 Rotierende Stäbe und Ringe Stäbe. Bei der Anordnung nach Bild 5-37 und mit den dort erklärten Größen m(r) und rS (r) sind die Radialspannung und die Radialverschiebung ⎤ ⎡ "ra ⎥⎥⎥ ? ⎢⎢⎢ ⎥ 2⎢ σ(r) = ω ⎢⎢⎢⎢m0 r0 + r¯ A(¯r) d¯r⎥⎥⎥⎥ A(r) ⎦ ⎣
Damit in einem Stab überall die Spannung σa ≡ σ(ra ) = ω2 m0 r0 /A(ra ) herrscht, muss die Querschnittsfläche den Verlauf A(r) = A(ra ) exp ω2 ra2 − r2 /(2σa ) haben. Ringe. Der dünnwandige Ring oder Hohlzylinder in Bild 5-38 rotiert um die z-Achse. Dabei treten die Umfangsspannung σϕ = ω2 r2 und die radiale Aufweitung Δr = ω2 r3 /E auf ( Dichte, r Ringradius). Die dünnwandigen Ringe in den Bildern 5-39a bis d rotieren um die vertikale Achse. Der oberste Punkt ist in Bild d axial gelagert und sonst axial frei verschiebbar. Die radiale Verschiebung u bei ϕ = 90◦ und die axiale Verschiebung v bei ϕ = 0 sind in Tabelle 5-10 als Vielfache von Aω2 r5 /(12EI) angegeben. Außerdem sind der Ort ϕ des maximalen Biegemoments und dessen Größe als Vielfaches von
Aω2 r3 angegeben ( Dichte, A Ringquerschnittsfläche, r Ringradius).
r
= ω m(r)rS (r)/A(r) , "r u(r) = (1/E) σ(¯r) d¯r . 2
(5-86)
Bild 5-38. Dünnwandiger Ring oder Hohlzylinder in Rotation um die z-Achse
(5-87)
ri
Im Sonderfall A(r) ≡ A = const ist mit der Stabmasse m = Al σmax = σ(ri ) = ω2 [m0 r0 + m(ri + ra )/2]/A , (5-88) Δl = u(ra ) = ω2 l[m0 r0 + m(ri /2 + l/3)]/(EA) . (5-89)
Bild 5-39. a–d. Verschieden gelagerte dünne Ringe mit und ohne Gelenke bei Rotation um den vertikalen Durchmesser Tabelle 5-10. Verschiebungen u und v, maximale Biegemomente Mmax und Orte ϕ des maximalen Biegemoments für rotierende Ringe nach Bild 5-39a bis d
Bild 5-37. Stab an rotierender Scheibe unter Fliehkraftbe-
lastung. rS (r) in (5-86) ist der Radius, an dem sich der
Schwerpunkt von m(r) befindet
a b
Aω2 r5 u= 2,71 π/2 × 12EI
Aω2 r5 × v= 8 4 12EI Mmax = Aω2 r3 × 1/2 25/72 ϕ
c
d
1
0,08
2
0
1/4
0,107
π/2 arc cos(1/6) 0 und π/2 0
E107
E108
E Technische Mechanik / Mechanik fester Körper
5.10 Flächentragwerke
sich (5-90) zur Bipotenzialgleichung
5.10.1 Scheiben
ΔΔF = 0 .
Scheiben sind ebene Tragwerke, die nur in ihrer Ebene (x, y-Ebene) durch Kräfte belastet werden (Kräfte am Rand und im Innern der Scheibe, Eigengewicht bei lotrechten Scheiben, Fliehkraft bei rotierenden Scheiben usw.). Spannungen werden außer durch Kräfte auch durch Temperaturfelder und erzwungene Verschiebungen erzeugt. In dünnen Scheiben konstanter Dicke h treten nur Spannungen σx , σy und τxy auf, und diese sind nur von x und y abhängig (ebener Spannungszustand). Für die acht unbekannten Funktionen σ x , σy , τ xy , ε x , εy , γ xy , u und v – jeweils von x und y – stehen acht Gleichungen zur Verfügung, nämlich die Gleichgewichtsbedingungen (5-17), die Gleichungen (5-2) für ε x , εy und γ xy und das Hooke’sche Gesetz (5-23a). Die Lösungen müssen Randbedingungen erfüllen. Man unterscheidet das erste Randwertproblem (Spannungen am ganzen Rand vorgegeben), das zweite Randwertproblem (Verschiebungen am ganzen Rand vorgegeben) und das gemischte Randwertproblem (Spannungen und Verschiebungen auf je einem Teil des Randes vorgegeben). Beim ersten Randwertproblem ist die Reduktion der acht Gleichungen auf die eine Gleichung ΔΔF = −Δ[(1 − ν)V + EαΔT ]
(5-90)
für die unbekannte Airy’sche Spannungsfunktion F(x, y) möglich. Sie ist durch σx =
∂2 F +V, ∂y2
σy =
∂2 F +V, ∂x2
τ xy = −
∂2 F ∂x∂y (5-91)
(5-93)
Für diese sind viele Lösungen bekannt, die keine technisch interessanten Randbedingungen erfüllen (z. B. F = ax2 + bxy + cy2 ). Es gibt aber technische Probleme, bei denen die Randbedingungen durch eine Linearkombination solcher spezieller Lösungen erfüllt werden, wenn man die Koeffizienten geeignet anpasst (semiinverse Lösungsmethode; siehe [17]). Wenn die Spannungen in einer Koordinatenrichtung (x-Richtung) periodisch sind, wird für F(x, y) eine Fourierreihe nach x mit von y abhängigen Koeffizienten angesetzt. Damit entstehen aus (5-93) gewöhnliche Differenzialgleichungen [17]. Gleichung (5-93) kann auch mit komplexen Funktionen gelöst werden [18, 19]. Beispiel 5-19: Für die hohe Wandscheibe in Bild 5-40 mit der Streckenlast q und mit periodisch angeordneten Lagern liefert die Methode der Fourierzerlegung für die Spannungen σx (y) entlang den Geraden über und mittig zwischen den Lagern die dargestellten Ergebnisse. Weitere Lösungen für Rechteckscheiben siehe in [17, 20]. Gleichungen in Polarkoordinaten. Für nicht rotationssymmetrische Scheibenprobleme sind die acht Größen σr , σϕ , τrϕ , εr , εϕ , γrϕ , u und v (Verschiebungen in radialer bzw. in Umfangsrichtung) unbekannte Funktionen von r und ϕ. Wenn die Volumenkraft R∗ (r, ϕ) radial gerichtet ist, lauten die acht Bestimmungsgleichungen
definiert, wobei V(x, y) das Potenzial der Volumenkraft ist (X = −∂V/∂x, Y = −∂V/∂y). Gleichung (5-91) liefert auch Randbedingungen für F. In (5-90) sind das erste Δ rechts und ΔΔ die Operatoren Δ=
∂2 ∂2 + 2, 2 ∂x ∂y
ΔΔ =
∂4 ∂4 ∂4 +2 2 2 + 4 . 4 ∂x ∂x ∂y ∂y (5-92)
Wenn V(x, y) und die Erwärmung ΔT (x, y) lineare Funktionen vom Typ c0 + c1 x + c2 y sind (z. B. das Potenzial für Eigengewicht), dann vereinfacht
Bild 5-40. Längsspannungen σ x (y) über und mittig zwischen den Stützen in einer sehr hohen Wandscheibe mit periodisch angeordneten Stützen. Scheibendicke h
5 Festigkeitslehre. Elastizitätstheorie
⎫ ∂τrϕ ⎪ ∂σr 1 ⎪ ∗ ⎪ + σr − σϕ + +R =0 ⎪ ⎪ ⎪ ⎪ ∂r r ∂ϕ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ∂τrϕ 1 ∂σϕ ⎪ ⎪ + 2τrϕ + = 0,⎪ ⎪ ⎭ r ∂ϕ ∂r ⎫ ∂u ⎪ ⎪ ⎪ , ⎪ ⎪ ⎪ ∂r ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 1 ∂v ⎪ ⎬ εϕ = u+ , ⎪ ⎪ r ∂ϕ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ∂v ⎪ 1 ∂u ⎪ ⎪ −v + ,⎪ γrϕ = r ∂ϕ ∂r ⎭
(5-94)
εr =
⎫ εr = (σr − νσϕ )/E + αΔT , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ εϕ = (σϕ − νσr )/E + αΔT , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ γrϕ = τrϕ /G.
(5-95)
σr (r, ϕ) =
2(P sin ϕ + Q cos ϕ) 2R cos(ϕ − α) = , πhr πhr
σϕ ≡ 0 ,
τrϕ ≡ 0 .
In Bild 5-41b ist M ein Kräftepaar mit zwei Kräften P und −P im Abstand l mit Pl = M, sodass man das Ergebnis durch Überlagerung zweier Spannungsfelder zu Bild 5-41a im Grenzfall l → 0 erhält: −2M sin 2ϕ , σϕ ≡ 0 , πhr2 −2M sin2 ϕ = . πhr2
σr (r, ϕ) = τrϕ (5-96)
Im Fall R∗ ≡ 0, ΔT ≡ 0 wird beim ersten Randwertproblem die Airy’sche Spannungsfunktion F(r, ϕ) definiert durch ⎫ 1 ∂2 F ⎪ 1 ∂F ⎪ ⎪ + 2 · 2 ,⎪ σr = · ⎪ ⎪ r ∂r r ∂ϕ ⎪ ⎪ ⎪ ⎪ 2 ⎪ ∂ F ⎬ (5-97) σϕ = 2 , ⎪ ⎪ ⎪ ∂r ⎪ ⎪ ⎪ ⎪ ⎪ ∂ 1 ∂F ⎪ ⎪ · τrϕ = − . ⎪ ⎭ ∂r r ∂ϕ Für F ergibt sich wieder die Bipotenzialgleichung ΔΔF = 0 mit Δ =
Beispiel 5-20: Scheibe in unendlicher Halbebene mit Einzelkräften P und Q (Bild 5-41a) und mit einem Moment M (Bild 5-41b) am Rand. In Bild 5-41a ist
1 ∂2 ∂2 1 ∂ + 2· 2 . + · 2 r ∂r r ∂ϕ ∂r (5-98)
Bild 5-41. Spannungen σr (r, ϕ) und τrϕ (r, ϕ) bei r = const in
Scheiben, die die unendliche Halbebene über der horizontalen Geraden einnehmen und die am Rand durch Kräfte P und Q (a) und durch ein Moment M (b) belastet werden
Spannungsfelder für normale und für tangentiale Streckenlasten q = const auf endlichen Bereichen des Scheibenrandes siehe in [17]. Beispiel 5-21: Die keilförmige Scheibe in Bild 5-42a mit den Eckkräften F1 und F2 entsteht, wenn man in Bild 5-41a einen Schnitt entlang ϕ = 2β macht. Auch im Keil ist σϕ ≡ 0, τrϕ ≡ 0. σr (r, ϕ) ist in der Bildunterschrift angegeben. Technisch wichtig ist die Rechteckscheibe mit Einzellast F nach Bild 5-42b: √ F 2 sin(ϕ + 12,5◦) , σr (r, ϕ) = hr σr = τrϕ ≡ 0 . Es entstehen ein Druck- und ein Zugfeld mit der Gefahr des Eckenabrisses.
Bild 5-42. a Keilförmige Scheibe der Dicke h mit Eckkräften. σr (r, ϕ) = 2F1 cos ϕ/[rh(2β + sin 2β)] + 2F2 sin ϕ/[rh(2β − sin 2β)]. b Zug- und Druckfelder in der 90◦ -Ecke einer Scheibe
E109
E110
E Technische Mechanik / Mechanik fester Körper
Bei rotationssymmetrisch gelagerten und belasteten Scheiben sind τrϕ ≡ 0, γrϕ ≡ 0 und v ≡ 0, und σr , σϕ , εr , εϕ und u hängen nur von r ab. Damit vereinfachen sich (5-94) und (5-95) zu
Dichte ist in (5-99) R∗ (r) = ω2 r. Die Lösung für die Vollscheibe lautet
dσr σr − σϕ + + R∗ = 0 dr r du u , εϕ = . εr = dr r
σϕ (r) = σr (R) + ω2 (β1 R2 − β2 r2 ) ,
(5-99) (5-100)
u(r) = r(σϕ (r) − νσr (r))/E und speziell u(R) = (1 − ν)(σr (R) + ω2 R2 /4)R/E .
Beispiel 5-22: (a) In einer Vollkreisscheibe vom Radius R mit nach außen gerichteter, radialer Streckenlast q = const am ganzen Rand ist σr (r) = σϕ (r) ≡ q/h ,
τrϕ ≡ 0 ,
u(R) = (1 − ν)qR/(Eh) . Daraus folgt, dass eine erzwungene radiale Randverschiebung u(R) die Spannungen σr (r) = σϕ (r) ≡
σr (r) = σr (R) + β1 ω2 (R2 − r2 ) ,
Eu(R) R(1 − ν)
und τrϕ ≡ 0
erzeugt. (b) Wenn zusätzlich zu u(R) eine konstante Erwärmung ΔT der ganzen Scheibe vorgegeben ist, ist E[u(R) − RαΔT ] , σr (r) = σϕ (r) ≡ R(1 − ν)
τrϕ ≡ 0 .
(c) Wenn u(R) und ein nicht konstantes Erwärmungsfeld ΔT (r) vorgegeben sind, wird das Verschiebungsfeld aus der Gleichung u(r) = [u(R) − up (R)]r/R + up (r) mit der partikulären Lösung up (r) zu der Euler’schen Differenzialgleichung d2 u 1 du u d(ΔT ) − + · = (1 + ν)α dr dr2 r dr r2 berechnet. Mit u(r) werden aus (5-100) εr und εϕ und damit aus (5-96) die Spannungen berechnet. [21] gibt Lösungen für symmetrisch belastete Kreisund Kreisringscheiben für viele Belastungsfälle an. Rotierende Scheiben. Bei einer mit ω = const rotierenden Scheibe konstanter Dicke mit Radius R und
Darin sind β1 = (3 + ν)/8 und β2 = (1 + 3ν)/8. Die radiale Randspannung σr (R) kann z. B. durch aufgesetzte Turbinenschaufeln (vgl. (5.9)) oder durch einen aufgeschrumpften Ring (vgl. 5.10.3) verursacht werden. Bei einer Scheibe konstanter Dicke mit mittigem Loch vom Radius Ri sind die Spannungen als Funktionen des Parameters z0 = Ri /R und der normierten Ortsvariablen z = r/R: ⎛ ⎞ z2 ⎟⎟ ⎜⎜ σr (z) = ω2 R2 β1 ⎜⎜⎝1 − 02 ⎟⎟⎠ (1 − z2 ) , z ⎡ ⎛ ⎞ ⎤ z20 ⎟⎟⎟ ⎢⎢ ⎜⎜⎜ 1 + ν 2 ⎥⎥⎥ 2 2⎢ 2 z ⎦⎥ . σϕ (z) = ω R ⎣⎢β1 ⎝⎜1 + 2 ⎠⎟ (1 + z ) − 2 z σϕ (z) nimmt von innen nach außen monoton ab und ist an jeder Stelle z größer als σr (z). Am Innenrand ist σϕ größer als im Zentrum einer Scheibe ohne Loch (im Grenzfall Ri → 0 zweimal so groß). Geschlossene Lösungen bei Kreisscheiben mit speziellen Dickenverläufen h = h(r) siehe in [22]. Numerische Verfahren bei Scheiben veränderlicher Dicke siehe in 5.14.2 5.10.2 Platten
Platten sind ebene Flächentragwerke, die normal zu ihrer Ebene (der x, y-Ebene) belastet werden. Bei dünnen Platten konstanter Dicke h (h Plattenbreite) gilt für die Durchbiegung w im Fall w h die Kirchhoff‘sche Plattengleichung ΔΔw =
∂4 w ∂4 w p(x, y) ∂4 w + 2 + = D ∂x4 ∂x2 ∂y2 ∂y4
(5-101)
mit der Plattensteifigkeit D = Eh3 /[12(1 − ν2 )] und der Flächenlast p(x, y).
5 Festigkeitslehre. Elastizitätstheorie
Randbedingungen: An einem freien Rand bei x = const ist ∂2 w ∂2 w +ν 2 = 0, 2 ∂x ∂y
∂3 w ∂3 w + (2 − ν) =0. 3 ∂x ∂x∂y2
An einem drehbar gelagerten Rand bei x = const ist w = 0,
∂2 w ∂2 w + ν =0. ∂x2 ∂y2
" Π = −2πr1 qw(r1 ) − 2π rp(r)w(r) dr 2 " ⎧ ⎪ ⎪ πD ⎨ d2 w 1 dw + + · r ⎪ ⎪ ⎩ dr2 2 r dr ⎫ ⎪ dw d2 w ⎪ ⎬ · 2⎪ −2(1 − ν) (5-104) dr . ⎭ dr dr ⎪ Für (5-103) wird eine Funktionenklasse
An einem fest eingespannten Rand bei x = const ist w = 0 und ∂w/∂x = 0. Aus Lösungen w(x, y) von (5-101) werden die Spannungen σ x , σy und τ xy berechnet. Sie sind proportional zu z (also null in der Plattenmittelebene). An der Plattenoberfläche bei z = h/2 ist mit W = h2 /6 ⎫ ⎪ D ∂2 w ∂2 w ⎪ ⎪ +ν 2 , ⎪ σ x (x, y) = − ⎪ ⎪ ⎪ W ∂x2 ∂y ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ 2 ⎪ D ∂ w ∂ w ⎬ (5-102) , + ν σy (x, y) = − ⎪ ⎪ 2 2 ⎪ W ∂y ∂x ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ∂2 w D ⎪ ⎪ ⎪ . τ xy (x, y) = − (1 − ν) ⎭ W ∂x∂y Exakte Lösungen von (5-101) durch unendliche Reihen siehe in [17]. Näherungslösungen für w(x, y) werden bei einfachen Plattenformen mit dem Verfahren von Ritz gewonnen. Zur Begründung, zu den Bezeichnungen und zu den Rechenschritten siehe 5.8.8. An die Stelle von (5-83) tritt dabei (Integration über die gesamte Fläche) "" p(x, y)w(x, y) dx dy Π = −Fw(x1 , y1 ) − ⎧ 2 "" ⎪ 2 ⎪ D ⎨ ∂ w ∂2 w + 2 + ⎪ ⎪ ⎩ ∂x2 2 ∂y ⎤⎫ ⎡ ⎢⎢⎢ ∂2 w 2 ∂2 w ∂2 w ⎥⎥⎥⎪ ⎪ ⎬ + 2(1 − ν) ⎢⎢⎣ − 2 · 2 ⎥⎥⎦⎪ ⎪ dx dy . ∂x∂y ∂x ∂y ⎭ (5-103)
Die ersten beiden Glieder berücksichtigen eine Einzelkraft F bei (x1 , y1 ) und eine Flächenlast p(x, y) mit der Dimension einer Spannung. Entsprechendes gilt bei anderen Lasten. Bei Kreis- und Kreisringplatten mit rotationssymmetrischer Belastung durch eine Linienlast q am Radius r1 und eine Flächenlast p(r) ist (Integrationen über den ganzen Radienbereich)
w(x, y) = c1 w1 (x, y) + . . . + cn wn (x, y) und für (5-104) eine Funktionenklasse w(r) = c1 w1 (r) + . . . + cn wn (r) mit Ansatzfunktionen wi (x, y) bzw. wi (r) gebildet, die alle wesentlichen Randbedingungen erfüllen. Gleichung (5-84) liefert wie bei Stäben ein lineares Gleichungssystem für c1 , . . . , cn , dessen Lösung in w(x, y) bzw. in w(r) eingesetzt eine Näherungslösung für die Durchbiegung ergibt. Bei der Durchführung wird erst nach ci differenziert und dann über x, y bzw. r integriert. Beispiel 5-23: Für eine quadratische, auf zwei benachbarten Seiten fest eingespannte, an den anderen Seiten freie und in der freien Ecke mit F belastete Platte (Seitenlänge a) wird die Funktionenklasse w(x, y) = c1 x2 y2 gewählt (also n = 1); die x- und die y-Achse liegen entlang den eingespannten Seiten. In (5-103) ist w(x1 , y1 ) = c1 a4 und p(x, y) ≡ 0. Gleichung (5-84) liefert c1 = 3F/[8Da2(29/15 − ν)]. Bei rotationssymmetrisch belasteten Kreis- und Kreisringplatten mit Polarkoordinaten r, ϕ sind τrϕ ≡ 0 und w, σr und σϕ nur von r abhängig. An die Stelle von (5-101) und (5-102) treten die Euler’sche Differenzialgleichung ( = d/dr) w w w p (r) − 2 + 3 = (5-105) r D r r und für die Spannungen an der Plattenoberfläche bei z = h/2 die Beziehungen τrϕ ≡ 0 und mit W = h2 /6 ⎫ D w ⎪ ⎪ ⎪ σr (r) = w +ν ,⎪ ⎪ ⎪ W r ⎪ ⎬ (5-106) ⎪ ⎪ D w ⎪ ⎪ ⎪ σϕ (r) = νw + .⎪ ⎪ W r ⎭ w(4) + 2
Exakte Lösungen siehe in [17, 21]. Als Nachschlagewerke für Lösungen zu Platten mit Rechteck-,
E111
E112
E Technische Mechanik / Mechanik fester Körper
Kreis- und anderen Formen bei technisch wichtigen Lagerungs- und Lastfällen siehe [20, 23, 24]. Numerische Lösungen werden mit Finite-ElementeMethoden gewonnen (5.13 und [25]). 5.10.3 Schalen
Schalen sind räumlich gekrümmte Flächentragwerke, die tangential und normal zur Fläche belastet werden. Wenn keine Biegung auftritt, spricht man von Membranen. Membranen. Notwendige Voraussetzungen für einen Membranspannungszustand sind stetige Flächenkrümmungen, stetige Verteilung von Lasten normal zur Fläche (also keine Einzelkräfte) und an den Rändern tangentiale Einleitung von eingeprägten und Lagerkräften. Bei rotationssymmetrisch geformten und belasteten Membranen werden nach Bild 5-43 die Koordinaten r, ϕ, ϑ verwendet. Bei gegebener Form r = r(ϑ) und gegebenen Flächenlasten pn (ϑ) und pϑ (ϑ) normal bzw. tangential zur Membran (Dimension einer Spannung; positiv in den gezeichneten Richtungen) gelten für die Meridianspannung σϑ (ϑ) und die Umfangsspannung σϕ (ϑ) die Gleichungen ⎫ ⎪ σϑ (ϑ) = −F(ϑ)/[2πhr(ϑ) sin ϑ] , ⎪ ⎪ ⎪ ⎪ ⎪ σϕ (ϑ)/R1 (ϑ) = −pn (ϑ)/h − σϑ (ϑ)/R2(ϑ) , ⎪ ⎪ ⎪ ⎪ ⎬ ϑ . ⎪ ⎪ ¯ cos ϑ¯ + pϑ (ϑ) ¯ sin ϑ] ¯ ⎪ F(ϑ) = 2π [pn (ϑ) ⎪ ⎪ ⎪ ⎪ 0 ⎪ ⎪ ⎪ ⎭ ¯ 2 (ϑ) ¯ dϑ¯ . × r(ϑ)R (5-107)
Bild 5-43. Rotationssymmetrische Membran mit rotations-
symmetrischen Flächenlasten pn (ϑ) und pϑ (ϑ). Freikörperbild des Winkelbereichs ϑ. Spannungen σϕ (ϑ) in Umfangsrichtung und σϑ (ϑ). F (ϑ) ist die aus pn und pϑ nach (5-107) berechnete Resultierende Kraft am freige-
schnittenen Bereich
Bild 5-44. Lagerung einer Membran auf einem Zugring
Darin sind h = const die Membrandicke, R1 (ϑ) = r(ϑ)/sin ϑ und R2 (ϑ) die Hauptkrümmungsradien am Kreis bei ϑ und F(ϑ) die resultierende eingeprägte Kraft am Membranstück zwischen ϑ = 0 und ϑ. Bei Eigengewicht ist F(ϑ) = G(ϑ) (Gewicht des Membranstücks) und pn (ϑ) = γh cos ϑ. Bei konstantem Innendruck pn (ϑ) = −p = const ist F(ϑ) = −pπr2 (ϑ). Ein freier Rand bei ϑ0 muss im Fall ϑ0 π/2 drehbar auf einem Ring gelagert werden (Bild 5-44). Die Zugkraft im Ring ist S = F(ϑ0 ) cot ϑ0 /(2π). Geschlossene Lösungen für viele technische Beispiele sind in [17, 21] zu finden. Zur Theorie dünner biegesteifer Schalen siehe [26, 27]. Schrumpfsitz. Schrumpfsitz ist die Bezeichnung für die kraftschlüssige Verbindung zweier koaxialer zylindrischer Bauteile (Welle w und Hülse h genannt) durch eine Schrumpfpressung p und durch Coulomb’sche Ruhereibungskräfte in der Fügefläche. Riw und Rih sind die Innenradien und Raw und Rah die Außenradien bei der Fertigungstemperatur vor dem Fügen. Δd = 2(Raw − Rih ) > 0 ist das die Pressung verursachende Übermaß des Wellendurchmessers. Es wird vorausgesetzt, dass Welle und Hülse gleich lang sind und sich beim Fügevorgang axial unbehindert ausdehnen können (ebener Spannungszustand). In einer Hohlwelle und in einer Hülse hat das radiale Verschiebungsfeld u(r) als Funktion von Innendruck pi , Außendruck pa (beide als positive Größen aufgefasst) und Erwärmung ΔT = const die Form u(r) = −(1/E)[(1 − ν) pa R2a − pi R2i r − (1 + ν)(pi − pa )R2i R2a /r]/ R2a − R2i + αΔT r .
(5-108)
5 Festigkeitslehre. Elastizitätstheorie
Darin sind die Größen u, Ri , Ra , pi , pa , ΔT , E, ν und α mit dem Index w für Welle bzw. h für Hülse zu versehen. Insbesondere ist paw = pih = p die Flächenpressung und piw = pah = 0. Gleichung (5-108) gilt auch im Fall Ri = 0 (Vollwelle; u(r) = −(1 − ν)pa r/E + αΔT r) und im Grenzfall Ra → ∞ (unendlich ausgedehnte Hülse; u(r) = (1 + ν)pi R2i /(Er) + αΔT r). Die Schrumpfpressung p bei gegebenen Erwärmungen ΔT w und ΔT h wird aus der Gleichung uh (Rih ) − uw (Raw ) = Δd/2 = Raw − Rih
(5-109)
berechnet. Dieselbe Gleichung liefert mit paw = pih = p = 0 eine Beziehung zwischen der minimalen Erwärmung ΔT h der Hülse und der minimalen Abkühlung ΔT w der Welle, die erforderlich sind, um beide Teile ohne Pressung übereinanderschieben zu können. Nach Berechnung von p werden die Felder der Radialspannung σr (r) und der Umfangsspannung σϕ (r) für Welle und Hülse aus ⎫ ⎪ σr (r) = − pa R2a − pi R2i ⎪ ⎪ ⎪ ⎪ ⎪ 2 2 2 2 2 ⎪ ⎪ +(pi − pa )Ri Ra /r / Ra − Ri , ⎪ ⎪ ⎬ (5-110) ⎪ ⎪ 2 2 ⎪ ⎪ σϕ (r) = −[pa Ra − pi Ri ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ −(pi − pa )R2i R2a /r2 ]/ R2a − R2i ⎭ berechnet. Für eine Vollwelle ist σrw (r) = σϕw (r) ≡ −p. Für eine unendlich ausgedehnte Hülse ist σrh (r) = −σϕh (r) = −pR2ih /r2 . Ein Schrumpfsitz der Länge l mit der Schrumpfpressung p und mit der Ruhereibungszahl μ0 in der Fügefläche kann das Torsionsmoment 2μ0 πR2aw lp übertragen. Fliehkräfte am rotierenden System haben beim Werkstoff Stahl bis zu Umfangsgeschwindigkeiten von 700 m/s keinen nennenswerten Einfluss auf die berechneten Größen [22].
5.11 Dreidimensionale Probleme 5.11.1 Einzelkraft auf Halbraumoberfläche (Boussinesq-Problem)
Eine Normalkraft F auf der Oberfläche eines unendlich ausgedehnten Halbraums (Bild 5-45) verursacht die rotationssymmetrischen Spannungs- und
Verschiebungsfelder (Zylinderkoordinaten , ϕ, z; r = ( 2 + z2 )1/2 ) ⎫ ⎪ 3 2 z F r ⎪ ⎪ ⎪ σ = − 3 , (1 − 2ν) ⎪ 2 ⎪ ⎪ r+z 2πr r ⎪ ⎪ ⎪ ⎪ 3 ⎪ ⎪ −F 3z ⎪ ⎪ · , σz = ⎪ ⎪ ⎪ ⎪ 2πr2 r3 ⎪ ⎪ # $ ⎪ ⎪ z r F ⎪ ⎪ ⎪ − (1 − 2ν) σϕ = , ⎪ 2 ⎪ ⎬ r r+z 2πr (5-111) ⎪ 2 ⎪ ⎪ −F 3 z ⎪ ⎪ ⎪ · , τ ϕ = τϕz ≡ 0 , τ z = ⎪ ⎪ ⎪ 2πr2 r3 ⎪ ⎪ 4 5 ⎪ ⎪ ⎪
z F
⎪ ⎪ ⎪ u = − (1 − 2ν) , ⎪ 2 ⎪ ⎪ 4πGr r r + z ⎪ ⎪ ⎪ ⎪ ⎪ z2 F ⎪ ⎪ ⎪ + 2(1 − ν) , u ≡ 0 . uz = ϕ ⎭ 2 4πGr r Zur Herleitung und zu entsprechenden Lösungen für eine tangentiale Einzelkraft und für eine Einzelkraft im Innern des Halbraums siehe [18, 28]. 5.11.2 Einzelkraft im Vollraum (Kelvin-Problem)
Eine Einzelkraft F in einem allseitig unendlich ausgedehnten Körper (sog. Vollraum; Bild 5-46) verursacht die rotationssymmetrischen Spannungs- und Verschiebungsfelder (siehe [18, 28, 29]; Bezeichnungen wie in 5.11.1) ⎫ F z 3 2 z ⎪ ⎪ − σ = (1 − 2ν) ,⎪ ⎪ ⎪ ⎪ r 8π(1 − ν)r2 r3 ⎪ ⎪ ⎪ ⎪ ⎪ F z ⎪ ⎪ ⎪ , σϕ = (1 − 2ν) ⎪ ⎪ ⎪ r 8π(1 − ν)r2 ⎪ ⎪ ⎪ ⎪ ⎪ 3 ⎪ ⎪ −F z 3z ⎪ ⎪ ⎪ + σz = (1 − 2ν) , ⎪ ⎪ ⎪ r 8π(1 − ν)r2 r3 ⎪ ⎪ ⎪ 2 ⎬ −F
3 z ⎪ (5-112) ⎪ + (1 − 2ν) , τ z = ⎪ ⎪ 2 3 ⎪ r 8π(1 − ν)r r ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ τ ϕ = τϕz ≡ 0 , uϕ ≡ 0 , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪
z F ⎪ ⎪ ⎪ · 2, u = ⎪ ⎪ ⎪ 16π(1 − ν)Gr r ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ F z ⎪ ⎪ uz = 3 − 4ν + 2 . ⎪ ⎭ 16π(1 − ν)Gr r 5.11.3 Druckbehälter. Kesselformeln
In einem homogenen dickwandigen, kugelförmigen Druckbehälter (Radien und Drücke Ri , pi innen
E113
E114
E Technische Mechanik / Mechanik fester Körper
Ein dickwandiger zylindrischer Druckbehälter (Radius und Druck Ri , pi innen und Ra , pa außen) hat im Mittelteil (mehr als 2Ra von den Enden entfernt) die Radialspannung σr (r) und die Umfangsspannung σϕ (r) nach (5-110) und die von r unabhängige Längsspannung σ x = pi R2i − pa R2a / R2a − R2i . Für den dünnwandigen Behälter (Radius R, Wanddicke h R) entstehen daraus die Kesselformeln
Bild 5-45. Einzelkraft auf Halbraumoberfläche.
σϕ = (pi − pa )R/h ,
Boussinesq-Problem
σ x = σϕ /2 .
Weitere Einzelheiten der Theorie von Druckbehältern siehe in [30] und Bemessungsvorschriften in [31, 32]. 5.11.4 Kontaktprobleme. Hertz’sche Formeln
Bild 5-46. Einzelkraft im Vollraum. Kelvin-Problem
und Ra , pa außen) treten die Radial- und Tangentialspannungen und die Radialverschiebung auf (siehe [18, 29, 30]):
Zwei sich in einem Punkt oder längs einer Linie berührende Körper verformen sich, wenn sie gegeneinandergedrückt werden, und bilden eine kleine Druckfläche. Hertz hat die Verformungen und die Spannungen für homogen-isotrope Körper aus Hooke’schem Material berechnet. Seine Formeln setzen voraus, dass in der Druckfläche nur Normalspannungen wirken. Außerdem muss die Druckfläche im Vergleich zu den Körperabmessungen so klein sein, dass man jeden Körper als unendlichen Halbraum auffassen und seine Spannungsverteilung als Überlagerung von Boussinesq-Spannungsverteilungen
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ R3a − R3i ⎪ ⎪ ⎪ ⎪ pi R3i − pa R3a + (pi − pa )R3i R3a /(2r3 ) ⎪ ⎪ ⎪ ⎪ ⎪ , σϕ (r) = ⎪ ⎪ 3 3 ⎪ Ra − Ri ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (im Fall pi > pa ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ist σϕ maximal bei r = Ri ) , ⎪ ⎪ ⎪ ⎪ ⎡ ⎪ 3 3 ⎪ ⎪ ⎢⎢⎢ (1 − 2ν)(pi Ri − pa Ra ) r ⎪ ⎪ ⎪ ⎢ ur (r) = 3 ⎪ ⎣ ⎪ 3 ⎪ E Ra − Ri ⎪ ⎪ ⎪ ⎤ ⎪ 3 3 ⎪ (pi − pa )Ri Ra ⎥⎥⎥ ⎪ ⎪ ⎪ ⎪ ⎥ + . ⎭ ⎦ 4Gr3 (5-113)
σr (r) =
pi R3i − pa R3a − (pi − pa )R3i R3a /r3
,
Bei einem dünnwandigen Kugelbehälter (Radius R, Wanddicke h R) ist σϕ = (pi − pa ) R/(2h). σr (r) fällt in der Wand linear von pi auf pa ab.
Bild 5-47. Kontakt zweier kugelförmiger oder zylindrischer Körper mit Radien r1 und r2 im Fall (a) r2 > 0, (b) r2 < 0 und (c) r2 = ∞
5 Festigkeitslehre. Elastizitätstheorie
(5-111) berechnen kann. Für zwei Körper mit EModuln E1 und E2 und Poisson-Zahlen ν1 und ν2 wird E ∗ = 2E1 E2 / 1 − ν21 E2 + 1 − ν22 E1 definiert. Kontakt zweier Kugeln. Zwei Kugeln mit den Radien r1 und r2 berühren sich in der Anordnung von Bild 5-47a im Fall r2 > 0 oder von Bild 5-47b im Fall r2 < 0 oder von Bild 5-47c im Sonderfall r2 = ∞. Sei r = r1 r2 /(r1 + r2 ). Die gegenseitige Anpresskraft F der Körper erzeugt eine Änderung der Mittelpunktsentfernung beider Körper von der Größe 1/3 9F 2 . w= 4rE ∗2 Der durch Deformation entstehende Druckkreis hat den Radius 1/3 3Fr . a= 2E ∗ Die nur in Bild 5-47b über dem Druckkreis gezeichnete Halbkugel gibt die Verteilung der Druckspannung in der Druckfläche an. Die maximale Druckspannung hat den Betrag σmax
und r2 längs einer Mantellinie mit der Streckenlast q gegeneinandergedrückt. In axialer Projektion entstehen je nach Kombination der Krümmungen die Bilder 5-47a, b oder c. Die halbe Breite a des Druckstreifens ist a = [8qr/(πE ∗)]1/2 mit r = r1 r2 /(r1 + r2 ). Der nur in Bild 5-47b gezeichnete Halbkreis über dem Druckstreifen gibt die Verteilung der Normalspannung im Druckstreifen an. Die größte Druckspannung ist σmax = 2q/(πa). Die maximale Schubspannung im Körperinneren ist ungefähr 0,3 σmax . Kontakt zweier beliebig geformter Körper. Im allgemeinen Fall punktförmiger Berührung zweier Körper hat jeder Körper i (i = 1,2) im Kontaktpunkt zwei verschiedene Hauptkrümmungsradien ri und ri∗ , und die Krümmungshauptachsensysteme beider Körper sind gegeneinander gedreht. Ein Krümmungsradius ist positiv, wenn der Krümmungsmittelpunkt auf der Seite zum Körperinnern hin liegt, andernfalls negativ. Zum Beispiel sind für die Kugel und den Innenring eines Rillenkugellagers drei Radien positiv und einer negativ. Ein oder mehrere Radien können unendlich groß sein, z. B. bei der Paarung Radkranz/ Schiene (Kegel/Zylinder) und bei der Paarung Ellipsoid/Ebene. Die Druckfläche ist stets eine Ellipse. Ihre Halbachsen a1 und a2 sind
1/3 3Fr a i = ci (i = 1,2) mit 2E ∗ ? 1 1 1 1 + + + r=2 r1 r1∗ r2 r2∗
3F = . 2πa2
In den Körpern tritt die größte Zugspannung am Umfang des Druckkreises auf. Ihre Größe ist (1 − 2νi )σmax /3 in Körper i (i = 1,2). Sie ist für spröde Werkstoffe maßgebend. Für duktile Werkstoffe ist die größte Schubspannung maßgebend. Sie tritt in beiden Körpern in der Tiefe a/2 unter dem Mittelpunkt des Druckkreises auf. Für ν = 0,3 hat sie ungefähr den Wert 0,3 σmax . Kontakt zweier achsenparalleler Zylinder. In Rollenlagern werden zwei Zylinder mit den Radien r1
und mit Hilfsgrößen c1 und c2 . Diese werden Tabelle 5-11 als Funktionen von ⎧ ⎡ 2 2 ⎪ ⎪ 1 1 1 ⎨ 1 ⎢⎢⎢⎢ 1 β = arccos ⎪ ⎪ 2 r ⎢⎣ r1 − r∗ + r2 − r∗ ⎩ 1 2 1/2 ⎫ ⎪ ⎪ 1 1 1 1 ⎬ +2 − ∗ − ∗ cos 2α ⎪ (5-114) ⎪ ⎭ r1 r1 r2 r2
Tabelle 5-11. Hilfsfunktionen für Kontaktprobleme
β c1 c2 c3
0◦ ∞ 0 ∞
10◦ 6,612 0,319 2,80
20◦ 3,778 0,408 2,30
30◦ 2,731 0,493 1,98
40◦ 2,136 0,567 1,74
50◦ 1,754 0,641 1,55
60◦ 1,486 0,717 1,39
70◦ 1,284 0,802 1,25
80◦ 1,128 0,893 1,12
90◦ 1 1 1
E115
E116
E Technische Mechanik / Mechanik fester Körper
entnommen. Darin ist α der Winkel zwischen der Hauptkrümmungsebene mit r1 in Körper 1 und der Hauptkrümmungsebene mit r2 in Körper 2. Als r1 und r2 müssen Hauptkrümmungsradien verwendet werden, die ein reelles β liefern. Die maximale Druckspannung in der Druckfläche ist σmax = 3F/(2πa1a2 ). Die Änderung des Körperabstandes infolge Deformation ist w = 3c3 F/(2E ∗ a1 ) mit c3 nach Tabelle 5-11. Weiteres siehe in [29, 52]. 5.11.5 Kerbspannungen
Ebene und räumliche Spannungsfelder in der Umgebung von Rissen und Kerben an Körperoberflächen und von Rissen und Hohlräumen im Körperinnern siehe (5-16) in [18, 33–35].
5.12 Stabilitätsprobleme 5.12.1 Knicken von Stäben
Wenn an einem im unbelasteten Zustand ideal geraden Stab Druckkräfte entlang der Stabachse angreifen, dann ist unterhalb einer kritischen Last die gerade Lage stabil, während oberhalb dieser Last nur gekrümmte stabile Gleichgewichtslagen existieren. Die Kenntnis der kritischen Last ist wichtig, weil schon geringe Überschreitungen zur Zerstörung des Stabes führen. Man spricht von Knicken, wenn die gekrümmte Gleichgewichtslage eine Biegelinie ist und von Biegedrillknicken, wenn eine Torsion überlagert ist. Biegedrillknicken tritt nur bei Stäben auf, bei denen Schubmittelpunkt und Flächenschwerpunkt nicht zusammenfallen (siehe 5.12.2). Die kritische Last für solche Stäbe ist kleiner als die, die sich aus Formeln für Knicken ergibt! Um welche Achse ein knickender Stab gebogen wird, hängt von den i. Allg. für beide Achsen unterschiedlichen Randbedingungen ab. Bei gleichen Randbedingungen für beide Achsen tritt Biegung um die Achse mit Imin ein. Im Folgenden wird das Flächenmoment immer Iy genannt. Kritische Lasten werden mit der sog. Theorie 2. Ordnung berechnet, bei der Gleichgewichtsbedingungen am verformten Stabelement formuliert werden. Im ausgeknickten Zustand verursachen Lager Schnittkräfte Qz (x). Bei Stäben, in denen Qz (x), N(x) und EIy bereichsweise konstant sind,
Bild 5-48. Freigeschnittener Teil eines Knickstabes
hat ein herausgeschnittenes Stabstück der Länge Δx Durchbiegungen und Schnittgrößen nach Bild 5-48. Momentengleichgewicht erfordert My (x + Δx) − My (x) − Qz Δx − N[w(x + Δx) − w(x)] = 0 und im Grenzfall Δx → 0 My − Nw = Qz . Substitution von My = −EIy w (vgl. (5-62)) und eine weitere Differenziation nach x erzeugen für w(x) die Differenzialgleichung w(4) + β2 w = 0
mit β2 = N/(EIy ) .
(5-115)
Ihre allgemeine Lösung ist mit Integrationskonstanten A, B, C und D w(x) = A cos βx + B sin βx + Cx + D .
(5-116)
Im Allgemeinen hat ein Stab mehrere Bereiche i = 1, . . . , n mit verschiedenen Konstanten βi und verschiedenen Biegelinien wi (x) mit Integrationskonstanten Ai , Bi , Ci und Di . Stets existieren 4n Randbedingungen für wi , wi , My = −EIy wi und 2 Qz = −EIy w i − Nwi = −EIy βi Ci ,
sodass 4n Gleichungen für die Integrationskonstanten angebbar sind. Da diese Gleichungen homogen sind, liegt ein Eigenwertproblem vor. Der Eigenwert ist die in β1 , . . . , βn vorkommende äußere Belastung des Stabes. Der kleinste positive Eigenwert ist die kritische Last. Die zugehörigen Integrationskonstanten sind bis auf eine bestimmt, sodass von der Biegelinie bei der kritischen Last die Form (die sog. Eigenform zum ersten Eigenwert), aber nicht die absolute Größe bestimmbar ist.
5 Festigkeitslehre. Elastizitätstheorie
Beispiel 5-24. In Bild 5-49 sind zwei Bereiche mit β22 = β2 = F/(EIy) und β21 = 2β2 und mit wi (x) = Ai cos βi x + Bi sin βi x + Ci x + Di (i = 1,2) zu unterscheiden. Die fünf Randbedingungen w1 (0) = w2 (0), w1 (0) = w2 (0), w1 (0) = w2 (0) und Qz1 ≡ √ Qz2 ≡ 0 liefern A2 = 2A1 , B2 = B1 2, C1 = C2 = 0, D2 = D1 − A1 . Die übrigen drei Randbedingungen w1 (−l) = 0, w1 (−l) = 0 und w2 (l) = 0 liefern für A1 , B1 und D1 die homogenen Gleichungen √ √ A1 cos(βl 2) − B1 sin(βl 2) + D1 = 0 , √ √ A1 sin(βl 2) + B1 cos(βl 2) = 0, √ =0. A1 2 cos βl + B1 sin βl
Bild 5-50. Euler’sche Knickfälle mit kritischen Lasten Fk
und Eigenformen we (x). Die Eigenformen sind exakt gezeichnet we (x)
Fall
Fk
Die Bedingung „Koeffizientendeterminante √ = √0“ führt zur Eigenwertgleichung tan βl tan(βl 2) = 2 mit dem kleinsten Eigenwert βl ≈ 0,719. Das ergibt die kritische Last
I II III
0,25π EIy /l π2 EIy /l2 2,04π2 EIy /l2
Fk = β2 EIy ≈ 0,517 EIy /l2 .
IV
4π2 EIy /l2
Bild 5-50 zeigt die sog. Euler’schen Knickfälle mit Knicklasten und Eigenformen. Knicklasten für Stäbe und Stabsysteme bei vielen anderen Lagerungsfällen sind [36, 37] zu entnehmen. Rayleigh-Quotient
Bild 5-51 zeigt einen Knickstab mit veränderlichem Querschnitt (Querschnittsfläche A(x), Biegesteifigkeit EIy (x), spezifisches Gewicht γ = g), mit einer Federstütze und einer Drehfederstütze (Federkonstanten k bzw. kD ) bei x = xS bzw. x = xD und mit zwei Einzelkräften F1 = F und F2 = a2 F bei x = x1 bzw. x = x2 . Der Stab wird durch sein Eigengewicht und durch die
Bild 5-49. Knickstab mit zwei Kräften
2
2
1 − cos[πx/(2l)] sin(πx/l) βl(1 − cos βx) + sin βx − βx , β = 4,493/l 1 − cos(2πx/l)
beiden Kräfte auf Knickung belastet. Für die kritische Größe Fk von F gilt die Ungleichung ⎡l ⎢⎢⎢. ⎢⎣ EIy (x)w 2 (x) dx + kw2 (xS )+ 0 ⎤ .l .x ⎥⎥ +kD w 2 (xD ) − γ A(x) w 2 (ξ) dξ dx⎥⎥⎦ Fk
0
.x1 0
w 2 (x) dx
+ a2
0
.x2
.
w 2 (x) dx
0
(5-117)
Der Quotient heißt Rayleigh-Quotient. Im Zähler steht die potenzielle Energie des Stabes und der Federn. Das Produkt Fk mal Nennerausdruck ist die Arbeit der Kräfte F1 und F2 längs der Absenkung ihrer Angriffspunkte. Die Integrale im Nenner erstrecken sich über die Stabbereiche, die den Druckkräften F1 bzw. F2 ausgesetzt sind. Jede zusätzliche Einzelkraft vermehrt den Nenner um ein entsprechendes Glied. Das Gleichheitszeichen gilt, wenn für w(x) die Eigenform we (x) des Stabes für die gegebenen (in Bild 5-51 willkürlich angenommenen) Randbedingungen eingesetzt wird. Eine
E117
E118
E Technische Mechanik / Mechanik fester Körper
III und Fk Fk0 − 0,5 G in den Fällen II und IV (jeweilige Knicklast Fk0 ohne Eigengewicht, Stabgewicht G = γAl). Wenn F fehlt, knickt der Stab infolge Eigengewicht bei einer kritischen Länge lk , für die sich im Fall I aus 0 π2 EIy /(4l2k ) − 0,3γAlk die Formel lk 2,02(EIy/(γA))1/3 ergibt. In den Fällen II, III und IV ist der Faktor 2,02 zu ersetzen durch 2,70 bzw. 3,88 bzw. 4,29.
Bild 5-51. Knickstab mit veränderlichem Querschnitt, Fe-
derstützen, Einzellasten und Eigengewicht (spezifisches Gewicht γ)
geringfügig von we (x) abweichende Ansatzfunktion w(x) liefert eine brauchbare obere Schranke für Fk . Ansatzfunktionen müssen die sog. wesentlichen oder geometrischen Randbedingungen erfüllen (das sind die für w und w ). Gleichung (5-117) vereinfacht sich, wenn EIy oder A konstant ist oder wenn das Eigengewicht vernachlässigt wird (γ = 0) oder wenn die Federstützen fehlen (k = 0 oder kD = 0). Jede zusätzliche Federstütze vermehrt den Zähler um ein Glied. Wenn der Stab auf ganzer Länge eine Winkler-Bettung hat (siehe 5.7.4), .l muss im Zähler der Ausdruck K w2 (x) dx addiert 0
werden. Beispiel 5-25: Für die Euler-Knickfälle von Bild 5-50 lautet (5-117) bei Berücksichtigung des Eigengewichts EI y Fk ≤
.l
w 2 (x) dx − γA
0
.l .x 0 0
.l
w 2 (ξ) dξ dx .
w 2 (x) dx
0
(5-118)
Wenn man für w(x) jeweils die Eigenform des Stabes ohne Eigengewicht einsetzt, erhält man Fk Fk0 − 0,3 G im Fall I, Fk Fk0 − 0,35 G im Fall
Verfahren von Ritz. Für Stäbe mit komplizierten Randbedingungen ist die Wahl einer guten Näherung der Eigenform für den Rayleigh-Quotienten schwierig. Stattdessen wählt man n vernünftig erscheinende Ansatzfunktionen w1 (x), . . . , wn (x) (häufig genügen n = 2) und bildet die Funktionenklasse w(x) = c1 w1 (x) + . . . + cn wn (x) mit unbestimmten Koeffizienten c1 , . . . , cn . Mit ihr wird der Rayleigh-Quotient eine Funktion von c1 , . . . , cn . Das Minimum dieser Funktion ist die beste mit der Funktionenklasse mögliche Schranke für Fk . Man berechnet das Minimum als den kleinsten Eigenwert λ der Gleichung det (Z − λN) = 0. Darin sind Z und N symmetrische Matrizen, deren Elemente aus dem Zähler und dem Nenner des Rayleigh-Quotienten (5-117) nach der Vorschrift berechnet werden ⎫ .l ⎪ ⎪ ⎪ ⎪ Zi j = EIy (x)wi (x)w j (x) dx ⎪ ⎪ ⎪ ⎪ 0 ⎪ ⎪ ⎪ ⎪ + kwi (xS)w j (xS) + kD wi (xD )w j (xD ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ .l .x ⎪ ⎪ ⎪ ⎪ −γ A(x) wi (ξ)w j (ξ) dξ dx , ⎪ ⎪ ⎬ 0 0 (5-119) ⎪ ⎪ ⎪ .x1 ⎪ ⎪ ⎪ Ni j = wi (x)w j (x) dx ⎪ ⎪ ⎪ ⎪ ⎪ 0 ⎪ ⎪ x 2 ⎪ . ⎪ ⎪ ⎪ ⎪ +a2 wi (x)w j (x) dx ⎪ ⎪ ⎪ ⎪ 0 ⎪ ⎪ ⎭ (i, j = 1, . . . , n) . Schlankheitsgrad. Die bisher geschilderten Methoden zur Berechnung kritischer Lasten setzen elastisches Stabverhalten voraus. Die kritische Last hat dabei stets die Form Fk = π2 EIy /l2k mit einer geeignet berechneten Länge lk . Sie ist die Länge eines Stabes nach Bild 5-50, Fall II, mit demselben Fk . Die Spannung im Stab ist σk = Fk /A = Eπ2 /λ2 mit dem dimensionslosen Schlankheitsgrad λ = lk (Iy /A)−1/2 . Aus der Forderung σk Rp0,2 (0,2%-Dehngrenze) folgt λ π(E/Rp0,2 )1/2 = λ0 . Für die Stähle S235 und S335 ist λ0 = 94 bzw. 79. Stäbe mit λ < λ0 kni-
5 Festigkeitslehre. Elastizitätstheorie
cken unelastisch. Nach Tetmajer wird in diesem Bereich σk nach Bild 5-52 durch eine Gerade bestimmt, die durch den Punkt (λ0 , Rp0,2 ) verläuft und bei λ = 0 einen experimentell ermittelten Wert liefert. Für den Stahlbau schreibt DIN 18 800 Teil 2 ein Verfahren zur Bemessung von knicksicheren Druckstäben vor, das λ als Parameter verwendet. 5.12.2 Biegedrillknicken
Wenn die Koordinaten yM und zM des Schubmittelpunktes ungleich null sind, kann bei der kritischen Last eine Gleichgewichtslage entstehen, bei der schiefe Biegung mit Auslenkungen vM (x) und wM (x) des Schubmittelpunktes im Querschnitt bei x und Torsion mit dem Torsionswinkel ϕ(x) gekoppelt auftreten. Man spricht von Biegedrillknicken. Bei Belastung in der Stabachse durch eine Druckkraft F lauten die gekoppelten Differenzialgleichungen ⎫ ⎪ EIz v(4) ⎪ M + FvM + FzM ϕ = 0 , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (4) ⎪ EIy wM + FwM − FyM ϕ = 0 , ⎪ ⎪ ⎪ ⎪ ⎬ (5-120) ⎪ (4) 2 ⎪ ⎪ ECM ϕ + FiM − GIT ϕ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ + FzM vM − FyM wM = 0 ⎪ ⎪ ⎭ mit i2M = y2M + z2M + (Iy + Iz )/A . Beispiel 5-26: Beim beidseitig gabelgelagerten Stab der Länge l wird die Eigenform bei der kritischen Last durch vM = A1 sin(πx/l), wM = A2 sin(πx/l) und ϕ = A3 sin(πx/l) angenähert. Einsetzen in (5-120) liefert für A1 , A2 , A3 die homogenen Gleichungen
Bild 5-52. Kritische Spannung σk eines Knickstabes als
Funktion des Schlankheitsgrades λ im elastischen Bereich (λ > λ0 ) und nach Tetmajer im unelastischen Bereich
A1 π2 EIz /l2 − F − A3 FzM = 0 , A2 π2 EIy /l2 − F − A3 FyM = 0 , A3 π2 ECM /l2 − Fi2M + GIT − A1 FzM + A2 FyM = 0 . Die Bedingung „Koeffizientendeterminante = 0“ ist eine Gleichung 3. Grades für den Eigenwert F. Ihre kleinste Lösung ist eine Näherung für die kritische Last Fk . Sie ist kleiner als die Knicklast π2 EImin /l2 des Stabes. Stäbe mit anderen Randbedingungen siehe in [9, 36]. 5.12.3 Kippen
Unter Kippen versteht man die Erscheinung, dass ein Stab mit zur z-Achse symmetrischem Querschnitt bei Belastung entlang der z-Achse oberhalb einer kritischen Last in y-Richtung ausweicht und dabei verdreht wird (Bild 5-53). Die Differenzialgleichungen für die Auslenkung vM des Schubmittelpunkts M in yRichtung und für den Verdrehwinkel ϕ lauten ⎫ ⎪ ⎪ EIz v(4) ⎪ M + (My(x)ϕ) = 0 , ⎪ ⎪ ⎪ ⎬ (4) (5-121) ECM ϕ − GIT ϕ − c0 (My (x)ϕ ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ +My (x)v + qz (x)zM ϕ = 0 . ⎪ M
q
Darin sind zM und zM die in Bild 5-53 erklärten .q Größen und c0 = A z(y2 + z2 ) dA/Iy − 2zM . Für doppeltsymmetrische Querschnitte ist c0 = 0. Außer für einfachste Fälle ist die kritische Last aus (5-121) nicht bestimmbar. In [9] sind mit Energiemethoden gewonnene Näherungslösungen für kritische Lasten für viele technisch wichtige Lagerungs- und Belastungsfälle zusammengestellt. Dort werden auch unsymmetrische Querschnitte und die Überlagerung von Kippen und Biegedrillknicken behandelt. Kritische Lasten für Stäbe mit Rechteckquerschnitt nach Bild 5-54a, b: im Folgenden ist
Bild 5-53. Kippen eines Stabes. zM = z-Koordinate des Schubmittelpunkts M. Im Bild ist zM < 0, zM q > 0
E119
E120
E Technische Mechanik / Mechanik fester Körper
const, σy = τ xy ≡ 0 hat nach [50] die kritische Spannung σxk =
π2 D [1 + (b/a)2]2 . b2 h ν + (b/a)2
Für kompliziertere Fälle ist das Ritz’sche Verfahren geeignet. Zu den Bezeichnungen und zur Methodik vgl. das Verfahren bei Stäben in 5.12.1. Man setzt eine Klasse von Ansatzfunktionen w(x, y) = c1 w1 (x, y) + . . . + cn wn (x, y) Bild 5-54. Kippen eines Kragträgers (a) und eines beidseitig
gelenkig gelagerten Stabes (b) unter verschiedenen Lasten (nur F, nur q oder nur M)
K = (EIzGIT )1/2 , c = [EIz /(GIT )]1/2 .
⎫ ⎪ Bild 5-54a : ⎪ ⎪ ⎪ ⎪ 2 ⎪ ⎪ Fk = 4,02(1 − cH/l)K/l , ⎪ ⎪ ⎪ ⎪ 2 −1/2 3 ⎪ qk = 12,85(1 − ν ) K/l ⎪ ⎪ ⎪ ⎬ Bild 5-54b : ⎪ ⎪ ⎪ ⎪ ⎪ Fk = 16,9(1 − 3,48cH/l)K/l2 , ⎪ ⎪ ⎪ ⎪ 2 −1/2 3 ⎪ ⎪ K/l , ⎪ qk = 28,3(1 − ν ) ⎪ ⎪ ⎪ ⎭ 2 −1/2 Mk = π(1 − ν ) K/l .
(5-122)
5.12.4 Plattenbeulung
Wenn in einer ebenen Platte (Dicke h = const, Plattensteifigkeit D = Eh3 /[12(1 − ν2 )]) in der Mittelebene wirkende Kräfte einen ebenen Spannungszustand σ x (x, y), σy (x, y) und τ xy (x, y) verursachen, dann wird bei Überschreiten einer kritischen Last Fk die ebene Form instabil. An ihre Stelle tritt eine stabile Beuleigenform mit einer Durchbiegung w(x, y). Bei Platten mit einfacher Form und Belastung kann man die kritische Last aus der Differenzialgleichung für w, ∂2 w ∂2 w ∂2 w h + σy 2 = 0 , σ x 2 + 2τ xy ΔΔw + D ∂x∂y ∂x ∂y (5-123) als kleinsten Eigenwert eines Eigenwertproblems bestimmen (siehe [17]). Beispiel 5-27: Die allseitig gelenkig gelagerte Rechteckplatte (Länge a in x-Richtung, Breite b) mit σ x =
in den Energieausdruck " " ⎡⎢ 2 ∂w ∂w ∂w ⎢⎢⎢ · + 2τ xy ⎢⎣σ x ∂x ∂x ∂y 2 ⎤ ∂w ⎥⎥⎥⎥ + σy ⎥ dx dy ∂y ⎦ 2 "" ⎧ ⎪ ⎪ D ⎨ ∂2 w ∂2 w + (5-124) + ⎪ ⎪ ⎩ ∂x2 2 ∂y2 ⎤⎫ ⎡ ⎢⎢⎢ ∂2 w 2 ∂2 w ∂2 w ⎥⎥⎥⎪ ⎪ ⎬ ⎢ + 2(1 − ν) ⎢⎣ − 2 · 2 ⎥⎥⎦⎪ dx dy ⎭ ∂x ∂y ∂x ∂y ⎪
h Π= 2
ein (siehe [17]) und bildet für c1 , . . ., cn das homogene lineare Gleichungssystem ∂Π/∂ci = 0 (i = 1, . . . , n). Die Koeffizientendeterminante wird gleich null gesetzt. In ihr steht als Eigenwert die Last, die σ x , σy und τ xy verursacht. Der kleinste Eigenwert ist eine obere Schranke für die kritische Last Fk . [36, 37] sind Nachschlagewerke für kritische Lasten von Platten unterschiedlicher Form, Lagerung und Belastung. 5.12.5 Schalenbeulung
Für kritische Lasten von Schalen werden wesentlich zu große Werte berechnet, wenn man geometrische Imperfektionen der Schale vernachlässigt. Die Berücksichtigung von Imperfektionen ist i. Allg. nur in numerischen Rechnungen möglich [38, 39]. Die klassische Theorie für geometrisch perfekte Schalen berechnet Beullasten aus Energieausdrücken und aus Ansatzfunktionen für die Beulform [26, 36].
5 Festigkeitslehre. Elastizitätstheorie
Beispiel 5-28: Die dünne Kreiszylinderschale mit gelenkiger Lagerung des Mantels auf starren Endscheiben. Bild 5-55 unterscheidet Belastungen durch einen konstanten Außendruck p auf dem Schalenmantel, durch eine konstante axiale Streckenlast q auf den Mantelrändern und durch Kombinationen von p und q. Zum Beispiel gilt bei Außendruck p auf Mantel und Endscheiben 2πRq = πR2 p, also q = 12 pR. Der Ansatz w(x, ϕ) = sin(mπx/l) cos nϕ für die Radialverschiebung erfüllt bei ganzzahligen m, n > 0 die Randbedingungen. Er stellt ein Beulmuster mit m Halbwellen in axialer und mit 2n Halbwellen in Umfangsrichtung dar (siehe Bild 5-55 mit m = 1 und n = 2). Mit den normierten Größen ⎫ λ = mπR/l , β = (h/R)2/12 , ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ∗ 2 (5-125) p = (1 − ν )pR/(Eh) , ⎪ ⎪ ⎪ ⎪ ⎪ ∗ 2 ⎭ q = (1 − ν )q/(Eh) führt der Ansatz auf die Gleichung p∗ n2 [(λ2 + n2 )2 − 3λ2 − n2 ] + q∗ λ2 [(λ2 + n2 )2 + n2 ] = (1 − ν2 )λ4 + β{(λ2 + n2 )4 − 2[νλ6 + 3λ4 n2 + (4 − ν)λ2 n4 + n6 ] + 2(2 − ν)λ2 n2 + n4 } .
p∗ (l/R) bzw. q∗ (l/(mR)) für gegebene β und ν. Gleichung (5-126) setzt die Gültigkeit des Hooke’schen Gesetzes voraus. Nur bei sehr dünnwandigen Schalen ist die Spannung bei der kritischen Last hinreichend klein. Der Nachweis ist erforderlich. Wenn im kritischen Lastfall m > 1 Halbwellen auf die Zylinderlänge verteilt sind, dann ändert sich an der kritischen Last nichts, wenn man die Schale in den Knoten der Halbwellen ringförmig versteift.
5.13 Finite Elemente Finite-Elemente-Methoden werden bei geometrisch komplizierten Systemen angewandt. Sie sind Näherungsmethoden zur Berechnung von Spannungen und Verformungen bei statischer Belastung, von Eigenfrequenzen und Eigenformen bei Eigenschwingungen, von erzwungenen Schwingungen u. a. Man stellt sich das System nach den Beispielen von Bild 5-57a, b aus geometrisch einfachen Teilen von endlicher Größe – den finiten Elementen – zusammengesetzt vor. Typische Elemente sind Zugstäbe, Stücke von Biegestäben, Scheibenstücke, Plattenstücke, Schalenstücke, Tetraeder usw. Die Punkte in Bild 5-57 sind die sog. Knoten der Elemente und des Elementenetzes. Das Elementenetz wird so angelegt, dass alle Lagerreaktionen in Knoten angreifen. Alle
(5-126)
Die normierte kritische Last – je nach Lastfall entweder p∗ oder q∗ – ist die kleinste für ganzzahlige m, n > 0 existierende Lösung dieser Gleichung. Im Lastfall Manteldruck ist stets m = 1, sodass Lösungen p∗ für verschiedene Größen von n verglichen werden müssen. Bei anderen Lastfällen müssen Lösungen für verschiedene m und n verglichen werden. Die Bilder 5-56a und b zeigen qualitativ die Abhängigkeit
Bild 5-56. Der normierte kritische Manteldruck p∗ im Fall Bild 5-55. Dünne Kreiszylinderschale mit Manteldruck p
und axialer Streckenlast q auf dem Mantel. Gestrichelte Linien stellen eine Beulform mit m = 1 und n = 2 dar
q = 0 (a) und die normierte kritische Streckenlast q∗ im Fall p = 0 (b) für die Schale von Bild 5-55 in doppelt-
logarithmischer Darstellung
E121
E122
E Technische Mechanik / Mechanik fester Körper
Bild 5-58. Finites Zugstabelement mit Knotenverschiebun-
gen q¯ = [¯ui1 u¯ i2 ]T im individuellen xi , yi -System und mit i Knotenverschiebungen q = [ui1 vi1 ui2 vi2 ]T im globalen x, yi System
Bild 5-57. a Drei finite Elemente mit sechs Knoten. b Netz aus dreieckigen Scheibenelementen für einen Zugstab mit Loch. Wegen der Symmetrie genügt ein Viertel mit den gezeichneten Knotenlagern. Die Knotenkräfte am rechten Rand sind einer konstanten Streckenlast äquivalent. Außer dem globalen x, y-System werden u. U. für die Elemente anders gerichtete, individuelle xi , yi -Systeme verwendet (vgl. Bild 5-58)
eingeprägten Kräfte und Momente werden durch äquivalente Kräfte und Momente ersetzt, die in Knoten angreifen. Vereinfachend wird vorausgesetzt, dass benachbarte Elemente nur an Knoten mit Kräften und Momenten aufeinander wirken. 5.13.1 Elementmatrizen. Formfunktionen
Knotenverschiebungen und Knotenkräfte. Für ein einzelnes, durch Schnitte isoliertes finites Element i werden in einem individuellen xi , yi , zi -System für die Elementknoten generalisierte Knotenverschiebungen q¯ i j und Knotenkräfte F¯ i j definiert. Beispiel 5-29: Für einen Knoten eines Zugstabelementes werden eine Längsverschiebung und eine Längskraft definiert (Bild 5-58); für einen Knoten eines Biegestabelementes werden Durchbiegung und Neigung als generalisierte Verschiebungen und eine Kraft und ein Moment als generalisierte Kräfte definiert (Bild 5-59).
Bild 5-59. Knotenverschiebungen q¯ = [w0 w0 w1 w1 ]T und i
Knotenkräfte F¯ i = [F0 M0 F1 M1 ]T an einem finiten Biegestabelement.
Massenmatrix und Steifigkeitsmatrix. Alle q¯ i j und alle F¯ i j an Element i werden in Spaltenmatrizen q¯ i bzw. F¯ i zusammengefasst. Bei linearem Werkstoffgesetz besteht im dynamischen Fall die Beziehung ¯ q¨¯ + K¯ q¯ = F¯ M i i i i
(5-127)
i
und im Sonderfall der Statik die Beziehung K¯ i q¯ = F¯ i
(5-128)
i
¯ und mit einer symmetrischen Massenmatrix M i einer symmetrischen Steifigkeitsmatrix K¯ i . Näherungen für die Matrizen werden wie folgt aus dem d’Alembert‘schen Prinzip (3-34) entwickelt. Es lautet " " δu · F = 0
δu · u¨ dV + δεT σ dV − V
V
(V)
(5-129)
( Dichte, menelements ε = [ε x εy und σ = [σ x
u Verschiebungsvektor des VoludV bzw. der äußeren Kraft F, εz γ xy γyz γzx ]T Verzerrungszustand σy σz τ xy τyz τzx ]T Spannungszustand
5 Festigkeitslehre. Elastizitätstheorie
des Volumenelements dV, das im spannungsfreien Ausgangszustand des finiten Elements an der Stelle xi , yi , zi liegt). Die Summe ist die virtuelle Arbeit aller am gesamten Volumen V eingeprägten Kräfte. Jede Kraft F wird mit der virtuellen Verschiebung δu ihres Angriffspunkts multipliziert. Das zweite Integral ist die virtuelle Änderung δU der Formänderungsenergie U von (5-71). Mit den Spaltenmatrizen u¨ und F der xi -, yi - und zi -Komponenten von u¨ bzw. F ist δu · u¨ = δuT u¨ und δu · F = δuT F. Formfunktionen. Das unbekannte Verschiebungsfeld u(xi , yi , zi ) in (5-129) wird als Linearkombination der Knotenverschiebungen q¯ approximiert: ij
u(xi , yi , zi ) = N(xi , yi , zi )¯q . i
(5-130)
Darin ist N(xi , yi , zi ) eine Matrix von sog. Formfunktionen. Diese sind frei wählbar mit den Einschränkungen, dass erstens u(xi , yi , zi ) für die Koordinaten xi , yi , zi der Knoten die Knotenverschiebungen selbst liefert, dass zweitens für Knotenverschiebungen q¯ , die eine Starrkörperbewegung beschreiben, i u(xi , yi , zi ) das Verschiebungsfeld derselben Starrkörperbewegung darstellt, und dass drittens die Verschiebungen u(xi , yi , zi ) benachbarter Elemente an den gemeinsamen Kanten konform sind (siehe [25, 40]). Gleichung (5-130) stellt einen Ritz-Ansatz dar. Man kann die Ordnung des Ansatzes erhöhen, indem man die Zahl der Knoten des finiten Elements vergrößert. Ein dreieckiges Scheibenelement kann z. B. außer an den Ecken weitere Knoten auf den Kanten und im Innern haben. Aus (5-130) und (5-2) folgt ε = B(xi , yi , zi )¯q mit einer i Matrix B, die partielle Ableitungen von N enthält. Bei Gültigkeit des Hooke’schen Gesetzes (5-19) ist σ(xi , yi , zi ) = D ε = D B¯q
i
i
V
@ABC ¯ M i
i
(V)
@ABC F¯
V
@ABC K¯ i
i
(5-133)
¯ , Das ist (5-127) mit Berechnungsvorschriften für M i K¯ i und F¯ i . Die Summe erstreckt sich über alle Kräfte am Volumen V, und N ist bei jeder Kraft der Funktionswert für den Angriffspunkt. Beispiel 5-30: Für das Biegestabelement in Bild 5-59 werden die Knotenverschiebungen q¯ = [w0 w0 w1 w1 ]Ti gewählt. Die Durchbiei gung w(x) wird approximiert durch x2 x3 x x2 x3 w(x) = 1 − 3 2 + 2 3 ; l −2 2 + 3 ; l l l l l x3 x2 x3 x2 3 2 − 2 3 ; l − 2 + 3 q¯ = N q¯ . i i l l l l Das ist (5-130). Jedes Element von N gibt die Biegelinie für den Fall an, dass das entsprechende Element von q¯ gleich eins und die anderen gleich null sind. i Beim Biegestab ist ε = ε x = −w z = −N q¯ z , i
σ = σ x = Eε x = −EN q¯ z , i
δεT σ = δε x σ x . Damit liefert (5-133) " K¯ i = E
(5-131)
mit einer symmetrischen Matrix D, die die Stoffkonstanten E, G und ν enthält. Einsetzen aller Beziehungen in (5-129) liefert ⎡ " ⎢⎢⎢ " T⎢ T ⎢ ¨ BT D B dV q¯ δ¯q ⎢⎢⎢ N N dV q¯ + i i i ⎣ V V ⎤ ⎥⎥⎥ ⎥ − N T F ⎥⎥⎥⎥ = 0 (5-132) ⎦ (V)
oder, da die Elemente von δ¯q unabhängig sind, i " " BT D B dV q¯ − NT F = 0 .
N T N dV q¨¯ +
N
T
"l
2
N z dV = E
V
N
T
N
x=0
"l = EIy
" z2 dA dx A
N T N dx ,
0
" ¯ =
M i
"l N N dV = A
N T N dx .
T
V
0
Die Kräfte F0 und F1 , die Momente M0 und M1 und die Streckenlast q von Bild 5-59 liefern nach (5-133)
E123
E124
E Technische Mechanik / Mechanik fester Körper F¯ i = N T (0)F0 + N T (l)F1 − N T (0)M0
"l
− N (l)M1 + T
N T (x)q dx 0
= [F0 + ql/2; −M0 + ql2 /12; F1 + ql/2 ; − M1 − ql2 /12]T . Koordinatentransformation. Wenn das individuelle xi , yi , zi -System des Elements i nicht parallel zum sog. globalen x, y, z-System liegt, müssen (5-127) und (5-128) ins globale System transformiert werden. Das Ergebnis sind die Gleichungen M i q¨ + K i q = F i i
i
bzw.
Kiq = F i i
(5-134a,b)
¯ T und K = T T K¯ i T i . Darin sind q mit M i = T Ti M i i i i i und F i die Spaltenmatrizen aller generalisierten Knotenverschiebungen bzw. Knotenkräfte von Element i im globalen System, und T i ist durch die Gleichung q¯ = T i q definiert. i
i
Beispiel 5-31: Für das Zugstabelement in Bild 5-58 ist q¯ = [u¯ i1 u¯ i2 ]T , i
q = [ui1 vi1 ui2 vi2 ]T . i
Man liest ab
cos α sin α 0 0 Ti = . 0 0 cos α sin α
Sei q die Spaltenmatrix der generalisierten Knotenverschiebungen aller Knoten des gesamten Elementenetzes im globalen x,y,z-System. Jedes Element jeder Matrix q ist mit einem Element von q identisch. Desi halb kann man beide Gleichungen (5-134) durch Hinzufügen von Identitäten 0 = 0 in eine Gleichung der Form bzw.
K ∗i q = F ∗i
Aus den Matrizen M ∗i und K ∗i aller finiten Elemente i = 1, . . ., e eines Elementenetzes werden die Gleichungen der Dynamik und Statik des Gesamtsystems gebildet. Sie lauten M q¨ + K q = F
Kq= F (5-136a,b) ∗ mit der Massenmatrix M = M i und der Steifig keitsmatrix K = K ∗i (Summation über i = 1, . . . , e). M und K sind symmetrisch und schwach besetzt. Bei günstiger Knotennummerierung ist nur ein schmales Band um die Hauptdiagonale besetzt. Finite-Elemente-Programmsysteme enthalten die ¯ und K¯ für Massen- und Steifigkeitsmatrizen M i i einen ganzen Katalog von Elementtypen. Sie bilden die Matrizen M und K eines ganzen Elementenetzes, sobald die Lage aller Knoten im globalen Koordinatensystem, die Nummerierung der Elemente und Knoten und die Elementtypen durch Eingabedaten festgelegt sind. bzw.
5.13.3 Aufgabenstellungen bei Finite-Elemente-Rechnungen
5.13.2 Matrizen für das Gesamtsystem
M ∗i q¨ + K ∗i q = F ∗i
Die Zahlen sind Knotennummern. Schwarze Felder sind Untermatrizen von M 2 , K 2 bzw. F 2 , und weiße Felder sind mit Nullen besetzt.
(5-135a,b)
mit symmetrischen Matrizen M ∗i und K ∗i einbetten. Beispiel 5-32: Für das Element i = 2 in Bild 5-57a lautet (5-135a)
Statik. Bei statisch bestimmten und bei statisch unbestimmten Systemen ist in (5-136b) von jedem Paar (Knotenkraft, Knotenverschiebung) eine Größe gegeben und eine unbekannt. Also ist die Zahl der Gleichungen ebenso groß, wie die Zahl der Unbekannten. Man löst (5-136b) nach den Unbekannten auf. Aus q werden anschließend mit (5-131) Spannungen in den finiten Elementen berechnet. Kinetik. Bei Eigenschwingungen sind keine eingeprägten Kräfte vorhanden. In (5-136a) enthält F also nur Nullen und unbekannte zeitlich veränderliche Lagerreaktionen. Jeder Nullkraft entspricht in q
5 Festigkeitslehre. Elastizitätstheorie
eine unbekannte zeitlich veränderliche Verschiebung und jeder Lagerreaktion eine Verschiebung Null. Also hat (5-136a) im Prinzip die Form ⎤⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎢⎢⎢ M 11 M 12 ⎥⎥⎥ ⎢⎢⎢ q¨ ∗ ⎥⎥⎥ ⎢⎢⎢ K 11 K 12 ⎥⎥⎥ ⎢⎢⎢ q∗ ⎥⎥⎥ ⎥⎥⎦ ⎢⎢⎣ ⎥⎥⎦ + ⎢⎢⎣ ⎥⎥⎦ ⎢⎢⎣ ⎥⎥⎦ = 0 ∗ ⎢⎢⎣ F M T12 M 22 0 K T12 K 22 0 (5-137) oder ausmultipliziert M 11 q¨ ∗ + K 11 q∗ = 0,
F ∗ = M T12 q¨ ∗ + K T12 q∗ , (5-138)
wobei q∗ und F ∗ die zeitlich veränderlichen Größen sind. Die erste Gleichung (5-138) liefert die Eigenkreisfrequenzen und Eigenformen (siehe 4.1.2) und die zweite die zugehörigen Lagerreaktionen. Bei erzwungenen Schwingungen sind entweder periodisch veränderliche, eingeprägte Erregerkräfte oder periodisch veränderliche eingeprägte Lagerverschiebungen vorhanden. Im Fall von Erregerkräften steht in (5-137) anstelle der Null-Untermatrix auf der rechten Seite eine Spaltenmatrix der Form A cos Ωt mit bekanntem A und bekanntem Ω. An die Stelle der ersten Gleichung (5-138) tritt M 11 q¨ ∗ + K 11 q∗ = A cos Ωt. Für die Lösung q∗ (t) siehe 4.2.2. Matrizenkondensation. Bei statischen Problemen an Systemen mit mehrfach auftretenden, identischen Substrukturen (Bild 5-60) verkleinert Matrizenkondensation die Steifigkeitsmatrix. Sei K die Steifigkeitsmatrix der Gleichung Kq = F für die markierte Substruktur. Nur für die dick markierten Randknoten existieren Randbedingungen für Knotenverschiebungen. Mit den Indizes r für Randknoten und i für die restlichen, inneren Knoten wird die Gleichung der Substruktur in der partitionierten Form geschrieben ⎡ ⎤ K 11 K 12 ⎢⎢⎢⎢ qi ⎥⎥⎥⎥ F (5-139) ⎢ ⎥= i KT K ⎣ q ⎦ F 12
22
r
r
oder ausmultipliziert K 11 q + K 12 q = F i ,
K T12 q + K 22 q = F r . i r (5-140) Auflösung der ersten Gleichung nach q und Einseti zen in die zweite Gleichung liefert ⎫ ⎪ q = K −1 ⎪ 11 (−K 12 qr + F i ) , ⎪ i ⎬ (5-141) ⎪ ⎪ T −1 ⎭ K q =F −K K F ⎪ i
r
r r
r
12
11
i
Bild 5-60. System mit drei identischen Substrukturen mit Randknoten (dick gezeichnet) und inneren Knoten (alle übrigen)
mit der wesentlich kleineren kondensierten Steifigkeitsmatrix K r = K 22 − K T12 K −1 11 K 12 . Sie wird nur einmal berechnet. Aus K r wird die Matrix des Gesamtsystems (d. h. nur für die Randknoten des Gesamtsystems) nach dem Schema gebildet, das im Zusammenhang mit (5-135b) erläutert wurde. Die Gleichung des Gesamtsystems liefert zu gegebenen eingeprägten Kräften F i an den inneren Knoten alle Verschiebungen und Kräfte an den Randknoten. Mit q ergibt (5-141) dann auch q . r
i
Ergänzende Bemerkungen. Für rotationssymmetrische Probleme werden ringförmige Elemente definiert. Bild 5-61 zeigt ein Ringelement mit Dreiecksquerschnitt mit drei Knoten und mit Knotenverschiebungen in radialer und in axialer Richtung. Für Einzelheiten siehe [25]. Für krummlinig berandete Körper werden krummlinig berandete finite Elemente benötigt. Sie entstehen mit isoparametrischen Ansätzen [25, 40]. Für Gebiete mit Spannungskonzentrationen können finite Elemente mit speziellen, dem Problem angepassten Ritz-Ansätzen verwendet werden [41]. Finite-Elemente-Methoden existieren auch für nichtlineare Stoffgesetze. Zum Beispiel kann man in (5-131) statt einer konstanten Matrix D eine Matrix einsetzen, deren Stoffparameter von der
E125
E126
E Technische Mechanik / Mechanik fester Körper
gilt. Die Spaltenmatrix Qi enthält generalisierte Kräfte und Verschiebungen. Im Sonderfall Qi = 0 gilt zi = U i zi−1
Bild 5-61. Ringelement mit dreieckigem Querschnitt für Systeme mit rotationssymmetrischer Form und Belastung. Die Knotenverschiebungen sind ui , u j , uk in radialer und vi , v j , vk in axialer Richtung. Die Knotenkräfte sind radiale und axiale Streckenlasten auf den Kreisen i, j und k
Verformung abhängig sind. Damit lassen sich statische Probleme durch inkrementelle Laststeigerung berechnen. Anwendungen in der Plastizitätstheorie siehe in [42].
5.14 Übertragungsmatrizen Viele elastische Systeme lassen sich nach dem Schema von Bild 5-62 als Aneinanderreihung von einfachen Systembereichen i = 1, . . . , n mit Bereichsgrenzen 0, . . . , n auffassen. Für die Bereichsgrenze i (i = 0, . . . , n) wird ein Zustandsvektor (eine Spaltenmatrix) zi definiert. zi enthält generalisierte Verschiebungen von ausgewählten Punkten der Bereichsgrenze i und die diesen Verschiebungen zugeordneten Schnittgrößen (das Produkt einer Verschiebung und der zugeordneten Schnittgröße hat die Dimension einer Arbeit). Für den Bereich i zwischen den Bereichsgrenzen i − 1 und i wird eine Übertragungsmatrix U i so definiert, dass zi = U i zi−1 + Qi
(i = 1, . . . , n)
(5-142)
(i = 1, . . . , n) .
Im Fall Qi 0 wird (5-142) in der mit (5-143) formal gleichen Form ⎤ ⎡ ⎤ ⎡ ⎤⎡ ⎢⎢⎢ zi ⎥⎥⎥ ⎢⎢⎢ U i Q ⎥⎥⎥ ⎢⎢⎢ zi−1 ⎥⎥⎥ i⎥ ⎥⎥⎥ (i = 1, . . . , n) (5-144) ⎢⎢⎢ ⎥⎥⎥ = ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢⎢ ⎥⎦ ⎢⎣ ⎥⎦ ⎢⎣ ⎦⎣ 1 0 1 1 @ABC @ABC @ABC z∗i z∗i−1 U ∗i geschrieben. z∗i und U ∗i heißen erweiterter Zustandsvektor bzw. erweiterte Übertragungsmatrix. An den äußersten Bereichsgrenzen 0 und n schreiben Randbedingungen jeweils die Hälfte aller Zustandsgrößen in z∗0 und in z∗n vor. Die jeweils andere Hälfte ist unbekannt. Die Grundidee des Übertragungsmatrizenverfahrens besteht darin, die aus (5-143) und (5-144) folgenden Gleichungen ⎫ zn = U n U n−1 · . . . · U 2 U 1 z0 ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ (5-145) ⎪ bzw. ⎪ ⎪ ⎪ ∗ ∗ ∗ ∗ ∗⎪ ∗ ⎭ zn = U n U n−1 · . . . · U 2 U 1 z0 zur Bestimmung der Unbekannten zu verwenden. Aus (5-145) werden Eigenschwingungen, stationäre erzwungene Schwingungen und statische Lastzustände berechnet. 5.14.1 Übertragungsmatrizen für Stabsysteme
Durchlaufträger und Maschinenwellen werden nach Bild 5-63 als Systeme aus masselosen Stabfeldern, Punktmassen und starren Körpern modelliert. Bereichsgrenzen i = 0, . . . , n werden an beiden Enden jedes Stabfeldes, jeder Punktmasse, jedes starren Körpers, jeder elastischen Stütze (auch wenn sie
Bild 5-62. System mit Bereichen 1, . . . , n und mit erwei-
terten Zustandsvektoren z∗0 , . . . , z∗n an den Bereichsgrenzen 0, . . . , n. Sehr schematische Darstellung
(5-143)
Bild 5-63. Durchlaufträger mit Bereichsgrenzen
0, . . . , n = 9
5 Festigkeitslehre. Elastizitätstheorie
am Stabende liegt) und jedes inneren Lagers und Gelenks definiert. Zur Untersuchung von Vorgängen mit Längsdehnung und Biegung in der x, z-Ebene wird der Zustandsvektor zi = [ ui Ni wi ψi Myi Qzi ]T
(5-146)
benötigt (u axiale Verschiebung, N Längskraft, w Durchbiegung, ψ = −w Drehung, My Biegemoment, Qz Querkraft; Reihenfolge beliebig). Wenn Längsdehnung oder Biegung nicht auftritt, entfallen die entsprechenden Größen. Im Fall von Biegung um die z-Achse und von Torsion treten entsprechende Größen zusätzlich auf. Erweiterte Übertragungsmatrix des masselosen Stabfeldes. Bild 5-64 zeigt ein masseloses Stabfeld mit seinen Zustandsgrößen an den Feldgrenzen i − 1 und i und mit eingeprägten Lasten Fxi , Fzi und qzi = const. Man formuliert drei Gleichgewichtsbedingungen und mithilfe von Tabelle 5-7 drei Kraft-Verschiebungs-Beziehungen. Zwei von ihnen lauten z. B. Myi = Myi−1 + Qzi−1 li − Fzi bi − qzi l2i /2 , ψi = ψi−1 +
Myi li − Qzi l2i /2 − Fzi a2i /2 − qzi l3i /6 . Ei Iyi (5-147)
Die Auflösung aller sechs Gleichungen in der Form (5-144) liefert für U i und Qi die Ausdrücke unten. Mit diesen Matrizen gilt (5-144) sowohl für statische Lastzustände als auch für die Amplituden von stationären erzwungenen Schwingungen der Form ⎡ ⎢⎢⎢ 1 l/(EA) ⎢⎢⎢ 1 ⎢⎢⎢ 0 ⎢⎢⎢ ⎢ 0 U i = ⎢⎢⎢⎢⎢ 0 ⎢⎢⎢ 0 0 ⎢⎢⎢ ⎢⎢⎢ 0 0 ⎣ 0 0 −F x b , −F x Qi = EA
Bild 5-64. Masseloses Stabfeld i mit Zustandsgrößen an den Grenzen i − 1 und i und mit eingeprägten Kräften
Qi (t) = Qi cos Ωt , zi−1 (t) = zi−1 cos Ωt,
als auch für die Amplituden von freien Schwingungen in irgendeiner Eigenform (Qi (t) = 0, zi−1 (t) = zi−1 cos ωt, zi (t) = zi cos ωt). Erweiterte Übertragungsmatrix für starre Körper und Punktmassen. Bild 5-65 zeigt einen starren Körper i mit seinen Zustandsgrößen an den Bereichsgrenzen i − 1 und i und mit eingeprägten Kräften Fxi und Fzi . Man formuliert drei Bewegungsgleichungen und drei geometrische Beziehungen. Zwei von ihnen lauten z. B. Myi − Myi−1 − Qzi bi − Qzi−1 ai − Fzi ci = Jyi ψ¨ i−1 , ψi = ψi−1 .
0 0
0 0
0 0
(5-149)
Bei erzwungenen Schwingungen mit der Erregerkreisfrequenz Ω ist im stationären Zustand ψ¨ i−1 = −Ω2 ψi−1 . Nach dieser Substitution ist (5-149) eine Gleichung für die Amplituden der Erregerkräfte und der Zustandsgrößen. Bei freien Schwingungen in einer Eigenform gilt das gleiche mit der Eigenkreisfrequenz ω anstelle von Ω. Die Auflösung aller sechs
⎤ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥ 2 3 1 −l −l /(2EIy ) −l /(6EIy) ⎥⎥⎥⎥ , ⎥⎥ 0 1 l/(EIy ) l2 /(2EIy) ⎥⎥⎥⎥ ⎥⎥⎥⎥ 0 0 1 l ⎥⎥⎦ 0 0 0 1 i qz l4 F z b3 −Fz b2 qz l3 qz l2 , − , −Fz b − + , 6EIy 24EIy 2EIy 6EIy 2 0 0
zi (t) = zi cos Ωt ,
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ (148) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ T ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ −Fz − qz l . ⎪ ⎪ ⎭ i
E127
E128
E Technische Mechanik / Mechanik fester Körper
Bild 5-65. Starrer Körper i mit Zustandsgrößen an den
Bild 5-66. Elastische Stütze i mit Bereichsgrenzen i−1 und i des Stabes infinitesimal dicht neben der Stütze
Grenzen i − 1 und i und mit eingeprägten Kräften
Gleichungen in der Form (5-144) liefert für U i und Qi die Ausdrücke ⎤ ⎡ 0 0 0 0 ⎥⎥ ⎢⎢⎢ 1 0 ⎥⎥ ⎢⎢⎢⎢ −Ω2 m 1 0 0 0 0 ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ 0 0 1 −l 0 0 ⎢ ⎥⎥⎥ , U i = ⎢⎢⎢⎢ ⎢⎢⎢ 0 0 0 1 0 0 ⎥⎥⎥⎥ ⎥⎥ ⎢⎢⎢⎢ 2 2 ⎢⎢⎣ 0 0 −Ω mb Ω (mab − Jy ) 1 l ⎥⎥⎥⎥⎦ Ω2 ma 0 1 i 0 0 −Ω2 m ⎤ ⎡ 0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ −F x ⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥ . Qi = ⎢⎢⎢⎢⎢ (5-150) ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ −Fz (b − c) ⎥⎥⎥⎥⎥ ⎦ ⎣ −Fz i Diese Matrizen sind im Sonderfall a = b = c = l = 0, Jy = 0 auch für eine Punktmasse gültig. Erweiterte Übertragungsmatrizen für elastische Stützen. Für die elastische Stütze von Bild 5-66 gelten die Gleichungen ui = ui−1 , wi = wi−1 , ψi = ψi−1 und Ni = Ni−1 + k xi ui , Myi = Myi−1 + kyi ψi , Qzi = Qzi−1 + kzi wi . Die Schreibweise dieser Gleichungen in der Form (5-144) liefert die Ausdrücke ⎤ ⎡ ⎢⎢⎢ 1 0 0 0 0 0 ⎥⎥⎥ ⎥ ⎢⎢⎢ ⎢⎢⎢ k x 1 0 0 0 0 ⎥⎥⎥⎥⎥ ⎥⎥⎥⎥ ⎢⎢⎢⎢ U i = ⎢⎢⎢⎢⎢ 0 0 1 0 0 0 ⎥⎥⎥⎥⎥ , Qi = 0 . (5-151) ⎢⎢⎢ 0 0 0 1 0 0 ⎥⎥⎥ ⎥⎥ ⎢⎢⎢⎢ ⎢⎢⎣ 0 0 0 ky 1 0 ⎥⎥⎥⎥⎦ 0 0 kz 0 0 1 i Innere Lager und Gelenke. An jedem Lager und an jedem Gelenk im Innern eines Trägers (Drehgelenk,
Schiebehülse usw.) sind einige Zustandsgrößen unmittelbar beiderseits gleich null (z. B. w an einem Gelenklager und My an einem Drehgelenk). Die diesen Nullgrößen zugeordneten Zustandsgrößen machen Sprünge unbekannter Größe (z. B. Qz an einem Gelenklager und ψ an einem Drehgelenk). Alle anderen Zustandsgrößen sind beiderseits gleich (aber i. Allg. nicht gleich null). Alle Gleichungen werden in der Form (5-144) mit den folgenden Ausdrücken für U i und Qi zusammengefasst: ⎫ ⎪ ⎪ U i = Einheitsmatrix , ⎪ ⎬ (5-152) ⎪ T ⎪ ⎭ Q = [Sprunggrößen und Nullen] . ⎪ i
Jeder unbekannten Sprunggröße in Qi entspricht die zusätzliche Bestimmungsgleichung, dass die zugeordnete Zustandsgröße gleich null ist. Erzwungene Schwingungen. Bei Durchlaufträgern nach Bild 5-63 sind in (5-45) die Matrizen U i und U ∗i (i = 1, . . . , n) vom Typ (5-148), (5-150), (5-151) oder (5-152) mit gegebenen Erregerkraftamplituden und mit einer gegebenen Erregerkreisfrequenz Ω. Jeder unbekannten Sprunggröße in (5-152) ist eine zusätzliche Bestimmungsgleichung zugeordnet. Mit den Randbedingungen z0 und zn sind insgesamt ebenso viele Gleichungen wie Unbekannte vorhanden. Die Gleichungen (5-145) sind inhomogen. Sie bestimmen alle unbekannten Schwingungsamplituden als Funktionen von Ω. Nach der Bestimmung von z0∗ liefert (5-144) nacheinander z1∗ , . . . , z∗n−1 . Ω = 0 ist der statische Sonderfall. Literatur siehe [43, 44]. Eigenschwingungen. Bei Eigenschwingungen in einer Eigenform sind keine Erregerkräfte vorhanden. Das für erzwungene Schwingungen erläuterte Gleichungssystem ist dann homogen mit Koeffizienten, die statt einer Erregerkreisfrequenz Ω die unbekannte
5 Festigkeitslehre. Elastizitätstheorie
Bild 5-67. Stabverzweigung mit Bereichsgrenzen k − 1, k und m und mit verschiedenen Koordinatensystemen x, y, z
und x , y , z
Eigenkreisfrequenz ω enthalten. Die Bedingung „Koeffizientendeterminante = 0“ liefert alle Eigenkreisfrequenzen (wegen der gewählten Modellierung endlich viele). Zu jeder Eigenkreisfrequenz liefern (5-144) und (5-145) die zugehörige Eigenform. Literatur siehe [43, 44]. Verzweigte Stabsysteme. Bild 5-67 zeigt schematisch einen Stabbereich mit den Bereichsgrenzen k − 1 und k, dem ein anderer Stab derselben Art starr angeschlossen ist. Dieser Stab hat an seiner Bereichsgrenze m und in seinem eigenen x , y , z -System einen Zustandsvektor zm = [ um Nm wm ψm My m Qz m ]T entsprechend (5-146). Für diesen Stab gilt entsprechend (5-145) zm = U m · . . . · U 1 z0
bzw.
z ∗m = U ∗m · . . . · U ∗1 z ∗0 . (5-153)
Für den Stabknoten in Bild 5-67 sind drei Gleichgewichtsbedingungen (z. B. Nk − Nk−1 − Nm sin α − Qz m cos α = 0) und die drei Gleichungen uk = uk−1 , wk = wk−1 , ψk = ψk−1 gültig. Sie werden in der Gleichung z∗k = z∗k−1 + T ∗k z ∗m
(5-154)
zusammengefasst. T ∗k ist eine nur von α abhängige Koordinatentransformationsmatrix. Außerdem liefert Bild 5-67 die geometrischen Beziehungen
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ wk = −um sin α + wm cos α , ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ ψk = ψ .
uk = um cos α + wm sin α ,
(5-155)
m
Mit (5-154) und (5-144) erhält man für das gesamte System aus zwei Stäben statt (5-145 b) die Gleichung z∗n = U ∗n U ∗n−1 · . . . · U ∗k+1 U ∗k−1 · . . . · U ∗1 z∗0 + T ∗k U ∗m · . . . · U ∗1 z ∗0 . (5-156) Mit Randbedingungen für z0∗ , z ∗0 und z∗n und mit (5-155) ist die Zahl der Gleichungen und der Unbekannten wieder gleich groß, sodass die Berechnung von freien und von erzwungenen Schwingungen demselben Schema folgt, wie bei unverzweigten Systemen (siehe [43, 45, 46]). 5.14.2 Übertragungsmatrizen für rotierende Scheiben
Zur Berechnung von Spannungen und Verschiebungen in einer mit ω rotierenden Scheibe veränderlicher Dicke h(r) und mit vom Radius abhängiger Temperaturerhöhung ΔT (r) (Bild 5-68a) wird das Ersatzsystem von Bild 5-68b mit Scheibenringen i = 1, . . . , n mit jeweils konstanter Dicke Hi und konstanter Temperaturerhöhung ΔT i gebildet. Am Radius Ri wird der erweiterte Zustandsvektor z∗i = [σr H u 1]Ti aus Radialspannung σr und Radialverschiebung u gebildet. Aus der exakten Lösung σr (r) und u(r) für den Scheibenring (siehe 5.10.1 und [22]) werden für die Matrizen U i und Qi in (5-144) die folgenden Ausdrücke gewonnen. Darin ist a = 1 − (Ri−1 /Ri )2 .
E129
E130
E Technische Mechanik / Mechanik fester Körper
Übertragungsmatrizen können wie folgt aus Steifigkeitsmatrizen berechnet werden und umgekehrt. Wenn man an den Bereichsgrenzen i − 1 und i die Spaltenmatrizen aller Verschiebungen mit ui−1 bzw. ui und die Spaltenmatrizen aller zugeordneten Schnittgrößen mit S i−1 bzw. S i bezeichnet, dann stellt die Übertragungsmatrix U i die Beziehung her: Bild 5-68. Rotierende Scheibe (a) und Ersatzsystem (b). Bei
einer Scheibe ohne Loch (mit Loch vom Radius R1 ) sind Randbedingungen für z∗0 (bzw. für z∗1 ) vorgeschrieben
⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ 1 − (1 − ν)a/2 EHi a/(2Ri−1 ) ⎥⎥⎦ , U i = ⎢⎢⎣ 2 (1 − ν )Ri a/(2EHi ) [1 − (1 + ν)a/2]Ri/Ri−1 ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ −(Hi a/2){( ω2 R2i /2) ⎥⎥ ⎢⎢⎢⎢ ⎢⎢⎢ ×[1 + ν + (1 − ν)(2 − a)/2] + EαΔT i } ⎥⎥⎥⎥⎥ Qi = ⎢⎢⎢ ⎥⎥⎥ . ⎥⎥⎥ ⎢⎢⎢ −(Ri a/2){(1 − ν2 ) ω2 R2i a/(4E) ⎥⎦ ⎢⎣ −(1 + ν)αΔT i } (5-157) Für den Scheibenbereich zwischen z0∗ und z∗1 ist ⎡ ⎢⎢ U 1 = ⎢⎢⎢⎣
⎤ 0 ⎥⎥⎥ ⎥⎥⎦ , (1 − ν)R1 /(EH1 ) 0
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎤ ⎡ ⎪ ⎪ 2 2 ⎪ ⎥ ⎢⎢⎢ −(3 + ν) ω R1 H1 /8 ⎪ ⎥⎥⎥ ⎪ ⎪ ⎢ .⎪ Q1 = ⎢⎣ ⎪ ⎥ ⎪ ⎦ 2 2 3 −(1 − ν ) ω R1 /(8E) + R1 αΔT 1 ⎭ (5-158) 1
Bei Scheiben ohne Loch ist die Randbedingung u0 = 0 gegeben. Bei Scheiben mit Loch vom Radius R1 ist bei R1 eine Randbedingung gegeben. Die mittlere Umfangsspannung σϕi im Bereich i (i = 1, . . . , n) wird aus der Gleichung σϕi = [ν/Hi Ehi /(Hi Ri ) 0]z∗i berechnet. 5.14.3 Ergänzende Bemerkungen
In [43, 44, 47] sind Kataloge von Übertragungsmatrizen für gebettete Stäbe, kontinuierlich mit Masse behaftete Stäbe, gekrümmte Stäbe, Scheiben, Platten und für viele andere spezielle Systeme zusammengestellt.
U 11 U 12 ui−1 ui = Si U 21 U 22 S i−1
oder
zi = U i zi−1 .
(5-159)
Die stets symmetrische Steifigkeitsmatrix K i desselben Systembereichs stellt die Beziehung her: −S i−1 K 11 K 12 ui−1 = oder Si K T12 K 22 ui F = K u.
(5-160)
Darin steht −S i−1 , weil Steifigkeitsmatrizen nicht mit Schnittgrößen, sondern mit eingeprägten Kräften definiert werden, die an beiden Schnittufern in derselben Richtung als positiv erklärt sind. Der Vergleich von (5-159) und (5-160) liefert die Beziehungen U 11 = −K −1 12 K 11 ,
U 12 = −K −1 12 ,
K 11 = U −1 12 U 11 ,
K 12 = −U −1 12 ,
−1 U 21 = K T12 − K 22 K −1 12 K 11 , U 22 = −K 22 K 12
K 22 = U 22 U −1 12 .
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ,⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
(5-161)
Bei dem schematisch dargestellten System in Bild 5-69 mit den radialen Bereichsgrenzen i = 0, . . . , n lautet die Randbedingung zn = z0 . Damit nimmt (5-145a) die Form (U n · . . . · U 1 − E)z0 = 0 an. Das ergibt für Eigenschwingungen die charakteristische Frequenzgleichung det[U n · . . . · U 1 − E] = 0 . Wenn n durch 2m (m = 1, 2, . . .) teilbar ist, zeichnen sich alle Eigenformen mit m Knotendurchmessern durch die Randbedingung zn/m = z0 aus. Die Frequenzgleichung dieser Eigenformen lautet det[U n/m · . . . · U 1 − E] = 0 .
5 Festigkeitslehre. Elastizitätstheorie
= σ2x + σ2y + σ2z − (σ x σy + σy σz + σz σ x ) 1/2 +3(τ2xy + τ2yz + τ2zx ) . (5-164) Beim ebenen Spannungszustand ist σV = (σ21 + σ22 − σ1 σ2 )1/2 = (σ2x + σ2y − σ x σy + 3τ2xy )1/2 . Bild 5-69. Bereichsgrenzen für ein zyklisches System
Das Huber/Mises-Fließkriterium ist (σ1 − σ2 )2 + (σ2 − σ3 )2 + (σ3 − σ1 )2 = 2R2e . (5-166)
5.15 Festigkeitshypothesen Zur Beurteilung der Frage, ob ein durch Hauptnormalspannnungen σ1 , σ2 , σ3 gekennzeichneter Spannungszustand in einem Punkt eines Werkstoffs zum Versagen führt, werden mit Festigkeitshypothesen aus den Hauptspannungen Vergleichsspannungen σV (σ1 , σ2 , σ3 ) berechnet. Je nach Werkstoffart (Metall, Kunststoff, Faserverbundstoff usw.), je nach Beanspruchungsart (statisch, stoßartig, schwingend) und je nach Versagensart (bei Metallen Fließen oder Sprödbruch) wird σV nach verschiedenen Hypothesen berechnet. Der Werkstoff versagt, wenn σV (σ1 , σ2 , σ3 ) einen jeweils zutreffenden Werkstoffkennwert σkrit erreicht. Die Gleichung σV (σ1 , σ2 , σ3 ) = σkrit ist ein Versagenskriterium. In einem kartesischen Koordinatensystem mit den Achsenbezeichnungen σ1 , σ2 , σ3 definiert die Gleichung eine Fläche, auf der der betreffende Versagensfall eintritt, während in dem Raum σV < σkrit das Versagen nicht eintritt. Vergleichsspannungen für das Fließen von Metallen bei statischer Belastung: Jeder metallische Werkstoff kann fließen (spröde Werkstoffe z. B. bei der Rockwellprüfung). Nach Tresca ist die Vergleichsspannung σV = 2τmax = σmax − σmin .
(5-165)
Die durch (5-163) und (5-166) definierten Versagensflächen im σ1 , σ2 , σ3 -Koordinatensystem heißen Fließflächen. Beide sind Zylinder (mit einem Sechseck- bzw. einem Kreisquerschnitt), dessen Achse die Raumdiagonale σ1 = σ2 = σ3 ist (Bild 5-70). Vergleichsspannungen für den Bruch von Metallen bei statischer Belastung: Jeder metallische Werkstoff kann brechen (duktile Werkstoffe z. B. bei einem hinreichend starken hydrostatischen Spannungszustand σ1 = σ2 = σ3 > 0). Nach der sog. logarithmischen Dehnungshypothese [51] ist die Vergleichsspannung σV (σ1 , σ2 , σ3 ) implizit durch die Gleichung bestimmt: b[σ1 −ν(σ2 +σ3 )]/K + b[σ2 −ν(σ3 +σ1 )]/K + b[σ3 −ν(σ1 +σ2 )]/K = bσV /K + 2b−νσV /K ,
b = [(1 − ν)/ν]1/(1+ν) . (5-167)
K ist die lineare Trennfestigkeit. Wenn der Werkstoff im Zugversuch ohne Einschnürung bricht, ist K = Rm . Das Bruchkriterium lautet σV = K. Die
(5-162)
Das Tresca-Kriterium für Fließen ist 2τmax = σmax − σmin = Re .
(5-163)
Zur Definition von Re siehe D 9.2.3. Nach Huber und von Mises ist die Vergleichsspannung 1 σV = (σ1 − σ2 )2 + (σ2 − σ3 )2 2 + (σ3 − σ1 )2
'1/2
Bild 5-70. Fließflächen nach Huber/v. Mises und Tresca in
der Projektion entlang der Diagonale σ1 = σ2 = σ3 im Spannungshauptachsensystem
E131
E132
E Technische Mechanik / Mechanik fester Körper
dadurch definierte Versagensfläche im σ1 , σ2 , σ3 Koordinatensystem (die Bruchfläche) hat die in Bild 5-71 dargestellte Form. Die Bilder 5-72a und b zeigen (am Beispiel ν = 0,3) Schnittkurven mit Ebenen normal zur Raumdiagonale σ1 = σ2 = σ3 bzw. die Schnittkurve mit der Ebene σ3 = 0 (ebener Spannungszustand). Wenn der Spannungszustand σ1 , σ2 , σ3 in einem Werkstoff proportional zu einer einzigen Lastgröße F ist, dann läuft er bei Steigerung von F auf einem vom Ursprung ausgehenden Strahl. Ob der Werkstoff dabei durch Bruch oder durch Fließen versagt, hängt davon ab, welche der beiden Versagensflächen der Strahl zuerst schneidet. Bild 5-71. Die Bruchfläche für einen Werkstoff mit ν = 0, 3
nach der logarithmischen Dehnungshypothese
5.16 Kerbspannungen. Kerbwirkung Unter Spannungskonzentration oder Kerbwirkung versteht man in der Elastizitätstheorie das Auftreten örtlicher Spannungsspitzen in gekerbten, mechanisch beanspruchten Bauteilen. Der Begriff Kerbe umfasst die eigentlichen Kerben (Einkerbungen), Löcher und Bohrungen, Querschnittsübergänge bei abgesetzten Stäben und Wellen sowie Nuten und Rillen. Kerben können dementsprechend als Unstetigkeiten (Diskontinuitäten) der Geometrie aufgefasst werden. Beispiele sind in Bild 5-73 dargestellt. Kerben bewirken i. Allg. eine Umlenkung des Kraftflusses, eine Spannungserhöhung bzw. Spannungskonzentration, einen mehrachsigen Spannnungszustand in der Kerbumgebung,
Bild 5-72. Schnittkurven der Bruchfläche von Bild 5-71
(a) mit Ebenen normal zur Raumdiagonale σ1 = σ2 = σ3 und (b) mit der Ebene σ3 = 0
Bild 5-73. Beispiele für Kerben und Kerbwirkung: (a) Einkerbung beim Biegebalken, (b) Loch oder Bohrung in einem Zugstab, (c) abgesetzte Welle unter Torsionsbelastung
5 Festigkeitslehre. Elastizitätstheorie
eine Veränderung der Tragfähigkeit von Bauteilen und Strukturen, eine Verminderung der Verformungsfähigkeit (Versprödung) von Bauteilen und eine Verminderung der Ermüdungs- bzw. Dauerfestigkeit und der Lebensdauer von zyklisch belasteten Strukturen. 5.16.1 Spannungsverteilungen an Kerben
Kerben in belasteten Bauteilen führen in der Regel zu einer Spannungserhöhung und zu einem mehrachsigen Spannungszustand in der Kerbumgebung. Dies ist sowohl bei ebenen als auch bei räumlichen Kerbproblemen der Fall. Bei einem beidseitig gekerbten Zugstab, Bild 5-74, tritt in der Kerbumgebung ein ebener Spannungszustand mit den Spannungen σ x , σy und τ xy auf. Im Kerbquerschnitt steigt die Spannung σy (x) zur Kerbe hin an mit der Maximalspannung σmax im Kerbgrund. Zudem existiert im Kerbquerschnitt noch eine Normalspannung σ x (x). Entlang des Kerbrandes (lastfreier Rand) wirkt eine Tangentialspannung σt = σϕ . Bei Stäben und Scheiben unterscheidet man die Sonderfälle Ebener Spannungszustand (ESZ) und Ebener Verzerrungszustand (EVZ) mit den Spannungen σz = 0 für den ESZ und σz = ν(σ x +σy ) für den EVZ.
Bild 5-74. Prinzipielle Spannungsverteilung bei einem ebe-
nen Kerbproblem
Bei räumlichen Kerbproblemen tritt bei entsprechenden Geometrie- und Belastungsverhältnissen ein räumlicher Spannungszustand mit sechs Spannungskomponenten auf. In Symmetrieebenen und an freien Oberflächen reduziert sich die Anzahl der Spannungskomponenten. In Symmetrieebenen wirken keine Schubspannungen, an lastfreien Oberflächen treten lediglich ebene oder zweiachsige Spannungszustände auf. Liegt bzgl. der Belastung und der Geometrie eine Rotationssymmetrie vor, Bild 5-75, so treten im Kerbquerschnitt Normalspannungen σy in Längsrichtung, σr in radialer Richtung und σϑ in Umfangsrichtung und somit ein dreiachsiger Spannungszustand auf. An der lastfreien Kerboberfläche stellt sich ein zweiachsiger Spannungszustand mit den Spannungen σϕ und σϑ ein. Die maximale Kerbspannung σmax ergibt sich auch hier im Kerbgrund. Grundsätzlich sind die Spannungsverteilungen in der Umgebung von Kerben von der Belastung des Bauteils und von der Kerb- und Bauteilgeometrie abhängig.
Bild 5-75. Kerbspannungen bei einem rotationssymmetri-
schen Kerbproblem
E133
E134
E Technische Mechanik / Mechanik fester Körper
ermitteln. Für den Lochrand, d. h. für r = a, gilt
5.16.2 Elastizitätstheoretische Lösungen grundlegender Kerbprobleme
σϕ = σ(1 − 2 cos 2ϕ)
Die Ermittlung der Kerbspannungen kann mit elastizitätstheoretischen Methoden (siehe auch 5.2, 5.3, 5.10.1 und 5.11.1), numerischen Verfahren, z. B. der Finite-ElementeMethode (siehe 5.13), und experimentellen Methoden, wie z. B. der Dehnmessstreifentechnik oder der Spannungsoptik (siehe z. B. D 11.4 und H 3.3) erfolgen. Grundlegende Kerbprobleme, die mit der Elastizitätstheorie gelöst wurden, stellen z. B. das Kreisloch in einer Scheibe und der Kugelhohlraum in einem Körper bei einachsiger Zugbelastung dar. Für das Kreisloch mit einem Radius a, das sich in einer unendlich ausgedehnten, durch die Spannung σ belasteten Scheibe befindet, Bild 5-76, lassen sich mit den Polarkoordinaten r, ϕ die Spannungen in der Umgebung der Kerbe mit den Beziehungen ⎫ ⎪ σ a4 a2 a2 ⎪ ⎪ σr = 1 − 2 + 1 − 4 2 + 3 4 cos 2ϕ , ⎪ ⎪ ⎪ ⎪ 2 r r r ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 4 ⎪ σ a a ⎬ σϕ = 1 + 2 − 1 + 3 4 cos 2ϕ , ⎪ ⎪ ⎪ 2 r r ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ 2 4 ⎪ ⎪ σ a a ⎪ ⎪ τrϕ = − 1 + 2 2 − 3 4 sin 2ϕ ⎪ ⎭ 2 r r
(5-169)
und σr = τrϕ = 0 (Bild 5-76). Die maximale Kerbspannung tritt jeweils im Kerbgrund, d. h. bei ϕ = 90◦ und ϕ = 270◦ auf und beträgt σmax = 3σ .
(5-170)
Beim Kugelhohlraum in einem unendlich ausgedehnten Körper, der durch eine Zugspannung σ belastet ist, Bild 5-77, wirkt an der Kerboberfläche ein zweiachsiger Spannungszustand mit den Spannungen σϕ und σϑ . Diese lassen sich wie folgt errechnen: ⎫ 3σ ⎪ (9 − 5ν − 10 cos2 ϕ) , ⎪ ⎪ ⎪ ⎪ 2(7 − 5ν) ⎬ (5-171) ⎪ ⎪ ⎪ 3σ 2 ⎪ (−1 + 5ν − 10ν cos ϕ) , ⎪ σϑ = ⎭ 2(7 − 5ν) σϕ =
wobei ν die Poisson-Zahl des Materials (siehe z. B. 5.3 und Tabelle 5-1) darstellt. Die maximale Kerbspannung σmax = σϕmax tritt bei ϕ = 90◦ , d. h. am Äquator des Kugelhohlraums auf und beträgt σmax =
3(9 − 5ν) σ. 2(7 − 5ν)
(5-172)
(5-168)
Bild 5-76. Kreisloch in unendlich ausgedehnter Scheibe mit den Kerbspannungen σr , σϕ und τrϕ in der Kerbumgebung und σmax im Kerbgrund
Bild 5-77. Kugelhohlraum in einem zugbelasteten Körper mit den Spannungen σϕ und σϑ an der Kerboberfläche
5 Festigkeitslehre. Elastizitätstheorie
Für ν = 0,3, d. h. für viele Metalle, ergibt sich somit σmax = 2,045σ .
(5-173)
Weitere Kerblösungen sind in [18, 33, 53] angegeben. 5.16.3 Kerbfaktoren
In der technischen Praxis werden die maximalen Kerbspannungen häufig durch Kerbfaktoren beschrieben. Dabei wird σmax auf eine Nennspannung, z. B. die mittlere Spannung im Kerbquerschnitt, bezogen. Für einen Zugstab, siehe z. B. Bild 5-78, ergibt sich der Kerbfaktor σmax , (5-174) α= σN wobei für die Nennspannung z. B. σN = F/Amin gilt. Bei Biegebelastung eines Balkens oder einer Welle durch ein Biegemoment MB gilt häufig die Nennspannungsdefinition σN = MB /Wmin , wobei Wmin = Wy das Widerstandsmoment gegen Biegung für den Kerbquerschnitt (den engsten Querschnitt im Bauteil) darstellt. Bei Torsionsbelastung einer gekerbten oder abgesetzten Welle ergibt sich der Kerbfaktor τmax , (5-175) α= τN
Bild 5-79. Kerbfaktordiagramm für einen Zugstab bzw. eine
zugbelastete Welle mit Umdrehungsaußenkerbe
wobei die an der Kerbe auftretende maximale Schubspannung τmax auf die Nennschubspannung τN bezogen wird. Ist die Welle durch ein Torsionsmoment MT belastet, so gilt i. Allg. die Nennschubspannung τN = MT /Wp min mit Wp min als dem polaren Widerstandmoment im engsten Querschnitt. Kerbfaktoren können somit als dimensionslose Darstellung der maximalen Kerbspannung eines Kerbproblems aufgefasst werden. Sie werden für einfache Bauteile und Strukturen i. Allg. in so genannten Kerbfaktordiagrammen dargestellt. Beispielhaft zeigt Bild 5-79 ein Kerbfaktordiagramm für einen Zugstab mit Umdrehungsaußenkerbe. Weitere Kerbfaktordiagramme findet man z. B. in [49, 54–56]. 5.16.4 Kerbwirkung
Bild 5-78. Zur Definition der Kerbfaktoren bei einem Zug-
stab
Neben der Umlenkung des Kraftflusses (Kraftdurchfluss durch das Bauteil), der Spannungserhöhung bzw. Spannungskonzentration an der Kerbe und dem Auftreten eines mehrachsigen Spannungszustands
E135
E136
E Technische Mechanik / Mechanik fester Körper
Bild 5-80. Einfluss von Kerben auf die Traglast und die Verformungsfähigkeit von Bauteilen. (a) Kerbwirkung bei Zugbelastung von Strukturen aus zähen Materialien und (b) Kerbwirkung bei Bauteilen aus hochfesten Materialien
in der Kerbumgebung, bewirken Kerben auch eine Veränderung der Tragfähigkeit und eine Verminderung der Verformungsfähigkeit von Bauteilen und Strukturen sowie eine Verminderung der Zeit- und Dauerfestigkeit bei zyklisch belasteten Strukturen. Bei Zugversuchen mit Stäben aus zähen Materialien zeigt sich infolge der Kerbwirkung eine Veränderung der Tragfähigkeit und eine wesentliche Verminderung der Verformungsfähigkeit, Bild 5-80a. Unter bestimmten Voraussetzungen kann bei statischer Belastung die Tragfähigkeit durch die Kerbe leicht gesteigert werden. Eine erhebliche Verminderung der Tragfähigkeit bzw. der Traglast (siehe Kapitel 6.3) tritt jedoch bei gekerbten Bauteilen aus hochfestem oder sprödem Material ein, Bild 5-80b. Auch hier wird die Verformungsfähigkeit bzw. die Bruchdehnung εB durch die Kerbe erheblich vermindert. Dies bedeutet, dass bei gekerbten Bauteilen die Sprödbruchgefahr steigt. Kerben wirken sich auch negativ auf die Zeit- bzw. Dauerfestigkeit einer zyklisch (schwingend) belasteten Struktur aus. Dies wird u. a. aus dem Wöhlerdiagramm deutlich, Bild 5-81. So ist die Dauerfestigkeit σAK für eine gekerbte Probe erheblich geringer als die Dauerfestigkeit σA für eine ungekerbte Probe. Dieser Abfall der Dauerfestigkeit wird durch die Kerbwirkungszahl βK ausgedrückt, die wie folgt definiert ist:
βK =
σA . σAK
(5-176)
Die Werte für βK sind infolge der Stützwirkung des Materials kleiner als der Kerbfaktor α. Die Stützwirkung ist dabei abhängig von dem Spannungsgefälle an der Kerbe und von Materialeigenschaften. Mit einer Stützziffer nχ , die z. B. nach einem Verfahren von Siebel bestimmt werden kann, lässt sich die Kerbwirkungszahl aus dem Kerbfaktor α errechnen: βK =
α nχ
(5-177)
(siehe auch [49, 54, 55]).
Bild 5-81. Einfluss von Kerben auf die Zeit- und Dauerfestigkeit von zyklisch belasteten Bauteilen. Darstellung im Wöhlerdiagramm
6 Plastizitätstheorie. Bruchmechanik
6 Plastizitätstheorie. Bruchmechanik
von e bei Kaltumformung und eine lineare Funktion von e˙ bei Warmumformung. Außerdem ist Y temperaturabhängig.
6.1 Grundlagen der Plastizitätstheorie
6.1.2 Fließregeln
Die Plastizitätstheorie beschreibt das Verhalten von (vornehmlich metallischen) Werkstoffen unter Spannungen an der Fließgrenze. Ein plastifiziertes Werkstoffvolumen fließt je nach seinen Randbedingungen entweder unbeschränkt (z. B. beim Fließpressen) oder eingeschränkt (z. B. in der Umgebung einer Rissspitze mit umgebendem elastischem Werkstoff) oder gar nicht (z. B. bei starrer Einschließung). Stoffgesetze für den plastischen Bereich setzen Spannungen σi j mit Verzerrungsinkrementen dεi j in Beziehung. Es ist üblich, mit der Zeit t als Parameter durch die Gleichung dεi j = ε˙ i j dt Verzerrungsgeschwindigkeiten ε˙ i j einzuführen, obwohl die Spannungen geschwindigkeitsunabhängig sind (siehe (6-4) und (6-6)). ε˙ i j ist analog zu (5-2) mit den Fließgeschwindigkeitskomponenten v1 , v2 und v3 definiert als ε˙ i j =
1 ∂vi ∂v j + 2 ∂x j ∂xi
(i, j = 1, 2, 3)
(6-1)
(in diesem Kapitel werden kartesische Koordinaten x1 , x2 , x3 genannt, Spannungen nicht σ x , τ xy usw., sondern σ11 , σ12 usw. und Verzerrungen nicht ε x , γ xy usw., sondern ε11 , 2ε12 usw.; vgl. (5-2)). Trägheitskräfte spielen allenfalls bei extrem schnellen Umformvorgängen eine Rolle (Explosivumformung, Hochgeschwindigkeitshämmern; siehe [1]).
Wenn das Fließkriterium erfüllt ist, finden Spannungsumlagerungen und den Randbedingungen entsprechend Fließvorgänge statt, die durch Fließregeln beschrieben werden. Die wichtigsten Fließregeln sind die von Prandtl/Reuß [5] und von St.-Venant/Levy/von Mises [3, 5] und die Fließregel zum Tresca-Kriterium (5-163). Weitere Fließregeln werden in [3] diskutiert. Prandtl-Reuß-Gleichungen. Diese Theorie berücksichtigt den elastischen Verzerrungsanteil im plastischen Bereich. Sie eignet sich deshalb besonders für Vorgänge mit eingeschränkter plastischer Verformung. Die Grundannahmen der Theorie sind (a) das Hooke’sche Gesetz für den elastischen Verzerrungsanteil, (b) Inkompressibilität für den plastischen Anteil und (c) Proportionalität zwischen dem Spannungsdeviator σ∗ (siehe 5-13) und dem Inkrement des plastischen Anteils des Verzerrungsdeviators ε∗ (analog zu (5-13) wird in (5-2) ε = εm + ε∗ mit εm = (ε11 + ε22 + ε33 )/3 geschrieben). Daraus folgen die Prandtl-Reuß’schen Gleichungen ⎡ ⎤⎫ 3 ⎢⎢⎢ ⎥⎥⎥ ⎪ ⎪ ⎪ ∗ ∗ 2 ∗ ∗ ∗ ⎢ ⎪ σkl ε˙ kl /(2Y )⎥⎥⎥⎦ ⎪ σ˙ i j = 2G ⎢⎢⎣ε˙ i j − 3σi j ⎪ ⎪ ⎪ ⎬ k,l=1 (6-2) ⎪ ⎪ ⎪ ⎪ (i, j = 1, 2, 3) ⎪ ⎪ ⎪ ⎪ ⎭ σ˙ = ε˙ E/(1 − 2ν) . m
6.1.1 Fließkriterien
In (5-163) und (5-166) wurden die Fließkriterien von Tresca bzw. von Huber/v. Mises angegeben (siehe auch Bild 5-70). Weitere Fließkriterien werden in [2–4] diskutiert. In der Plastizitätstheorie wird die Fließspannung nicht mit Re bezeichnet, sondern mit Y (yield stress) und manchmal mit kf . Sie wird auch Formänderungsfestigkeit genannt. Werkstoffe mit Y = const heißen ideal-plastisch. Bei Werkstoffen mit Verfestigung wird Y als Funktion einer Vergleichsformänderungsgeschwindigkeit e˙ und . der Vergleichsformänderung e = e˙ dt angesetzt. Übliche Annahmen sind eine lineare Funktion
m
Sie gelten, wenn das Fließkriterium (5-166) erfüllt 3 und außerdem σ∗kl ε˙ ∗kl > 0 ist. Andernfalls gilt k,l=1
das Hooke’sche Gesetz, das man auch in der Form σ∗i j = 2Gε∗i j (i, j = 1, 2, 3) schreiben kann. Aus (6-2) folgt, dass die Spannungen von der Geschwindigkeit eines Fließvorgangs unabhängig sind, und dass der Spannungszustandspunkt in Bild 5-70 auf oder in dem Kreiszylinder bleibt. Gleichungen (6-1), (6-2), die Gleichgewichtsbedingungen (5-16), 3 ∂σi j j=1
∂x j
=0
(i = 1, 2, 3) ,
(6-3)
E137
E138
E Technische Mechanik / Mechanik fester Körper
und Randbedingungen legen in plastischen Zonen die 15 Funktionen σi j , ε˙ i j und vi (i, j = 1, 2, 3) eindeutig fest [3]. Fließregel von Saint-Venant/Levy/von Mises. Diese Theorie macht dieselben Annahmen (b) und (c), wie die Theorie von Prandtl/Reuß und darüber hinaus die Annahme, dass der elastische Verzerrungsanteil im plastischen Bereich gleich null ist (starr-plastisches Werkstoffverhalten). Die Theorie ist deshalb besonders für Vorgänge mit unbeschränktem plastischem Fließen geeignet. Sie führt auf die Fließregel (siehe [3]) Y ε˙ i j =
σ∗i j
⎡ 3 ⎤1/2 ⎢⎢⎢ 3 ⎥⎥⎥ 2⎥ ⎢⎢⎢ ε˙ kl ⎥⎥⎦ ⎣2 k,l=1
(i, j = 1, 2, 3) .
(6-4)
⎤1/2 ⎡ 3 ⎢⎢⎢ 2 ⎥⎥⎥ ε˙ 2 ⎥⎥⎥ e˙ = ⎢⎢⎢⎣ 3 k,l=1 kl ⎦
(6-5)
(ein einachsiger plastischer Spannungszustand mit den Hauptverzerrungsgeschwindigkeiten ε˙ 1 = e˙ , ε˙ 2 = ε˙ 3 = −˙e/2 hat dieselbe Leistungsdichte). Aus e˙ , e und der Temperatur wird bei Werkstoffen mit Verfestigung Y berechnet. Die Gleichungen (6-1), (6-3), (6-4) und Randbedingungen legen in plastischen Zonen die 15 Funktionen σi j , ε˙ i j und vi (i, j = 1, 2, 3) eindeutig fest [3]. Numerische Lösungsverfahren mit finiten Elementen siehe in [3, 6, 7]. Die Fließregel zum Tresca-Kriterium (5-163) lautet ε˙ mittel = 0 ,
Im Sonderfall des ebenen Spannungsproblems mit Y = const führt sowohl (5-166) als auch (5-163) zusammen mit (6-3) auf zwei hyperbolische Differenzialgleichungen für σ11 und σ12 , deren Charakteristiken ein orthogonales Netz von sog. Gleitlinien (Linien extremaler Schubspannung von überall gleichem Betrag Y/2) bestimmen. Geschlossene Lösungen sind nur für einige spezielle Fälle bekannt, z. B. für ebenes Fließpressen ohne Wandreibung und mit 50% Dickenabnahme (Bild 6-1, siehe [3, 5, 7]).
6.2 Elementare Theorie technischer Umformprozesse 6.2.1 Schrankensatz für Umformleistung
Sie gilt, solange das Fließkriterium (5-166) erfüllt ist. Aus (5-166) und (6-4) folgt, dass die Spannungen von der Geschwindigkeit eines Fließvorgangs unabhängig sind, und dass der Spannungszustandspunkt in Bild 5-70 auf oder in dem Kreiszylinder bleibt. Aus den ε˙ i j ergibt sich die Vergleichsformänderungsgeschwindigkeit
ε˙ max = −ε˙ min ,
6.1.3 Gleitlinien
e˙ = ε˙ max .
Bei technischen Umformprozessen in Werkzeugen bilden sich in der Umformzone unter dem Einfluss von Spannungs- und Fließgeschwindigkeitsrandbedingungen Spannungsfelder σi j (x1 , x2 , x3 ) und Fließgeschwindigkeitsfelder v(x1 , x2 , x3 ), die durch Fließkriterium und Fließregel bestimmt sind. In der elementaren Umformtheorie wird die Fließregel durch den Ansatz einer Näherungslösung v∗ (x1 , x2 , x3 ) für das wahre Geschwindigkeitsfeld v(x1 , x2 , x3 ) überflüssig gemacht. Der Ansatz v∗ (x1 , x2 , x3 ) muss alle Geschwindigkeitsrandbedingungen erfüllen, d. h. kinematisch zulässig sein. Aus v∗ ergibt sich mit (6-1) ε˙ ∗ i j (x1 , x2 , x3 ) und damit aus (6-5) oder (6-6) die Vergleichsformänderungsgeschwindigkeit e˙ ∗ (x1 , x2 , x3 ). Mit e˙ ∗ (x1 , x2 , x3 )
(6-6)
Auch sie bedeutet Volumenkonstanz und in Bild 5-70, dass der Spannungszustandspunkt auf oder in dem Sechskantzylinder bleibt. Die Fließregel (6-6) lässt im Gegensatz zu (6-4) die Hauptverzerrungsgeschwindigkeiten ε˙ 1 , ε˙ 2 und ε˙ 3 unbestimmt.
Bild 6-1. Gleitlinienfeld beim ebenen Fließpressen mit 50%
Dickenabnahme. Im Fächer OAB wird der Werkstoff plastisch umgeformt. Die Zone OBC ist plastifiziert, aber starr. Die anderen Zonen oberhalb der Symmetrieachse sind nicht plastifiziert
6 Plastizitätstheorie. Bruchmechanik
wird bei bekannter Formänderungsfestigkeit Y die Umformleistung P∗V im Volumen V der Umformzone berechnet: " Y e˙∗ (x1 , x2 , x3 ) dV . P∗V = V
Dieser Ausdruck liefert eine obere Schranke für die erforderlichen Umformkräfte und damit für die Leistung der Maschine. Es gilt nämlich der Schrankensatz: Die Leistung P∗ der unbekannten, wahren Oberflächenkräfte σ dA am Volumen V bei den angenommenen, kinematisch zulässigen Geschwindigkeiten v∗ an der Oberfläche ist kleiner oder gleich P∗V : " " σ · v∗ dA Y e˙∗ dV . (6-7) P∗ = A
V
Zur Begründung und zu Anwendungsbeispielen des Satzes siehe [1, 3]. Beispiel 6-1: Beim Drahtziehen durch eine Düse ohne Wandreibung ist P∗ = FA v∗A (FA Zugkraft, v∗A Austrittsgeschwindigkeit). Damit liefert (6-7) eine obere Schranke für FA . 6.2.2 Streifen-, Scheiben- und Röhrenmodell
Bei ebener Umformung nach Bild 6-2a zwischen ruhenden oder bewegten Werkzeughälften mit der gegebenen Spalthöhe h(x1 , t) und mit gegebenen Winkeln α1 (x1 ) 1 und α2 (x1 ) 1 besteht der Ansatz für das Geschwindigkeitsfeld v∗ in der Annahme, dass der schraffierte, infinitesimal schmale Streifen bei der Bewegung durch den Spalt eben bleibt und homogen umgeformt wird. Bei axialsymmetrischer Umformung nach Bild 6-2b durch eine Düse mit dem Radius R(x1 ) wird dieselbe Annahme für die schraffierte Kreisscheibe getroffen. Bei axialsymmetrischem Schmieden nach Bild 6-2c zwischen zwei Gesenken mit der gegebenen Höhe h(r, t) wird angenommen, dass die schraffierte Zylinderröhre bei ihrer Stauchung und Aufweitung zylindrisch bleibt und homogen umgeformt wird. Alle drei Modelle führen auf eine gewöhnliche Differenzialgleichung vom Typ dσ1 + σ1 f (x1 , t) = Yg(x1 , t) dx1
(6-8)
Bild 6-2. a Streifenmodell, b Scheibenmodell und c Röhrenmodell der elementaren Umformtheorie
für eine Spannung σ1 . Begründung am Streifenmodell von Bild 6-2a: x1 und x2 sind Hauptachsen für σi j und ε˙ i j . σ1 und σ2 hängen nur von x1 ab. Wegen (5-163) gilt σ1 − σ2 = Y. Gleichung (6-8) drückt das Kräftegleichgewicht am Streifen von Bild 6-2a mit Wandreibungskräften aus. Dabei ist μ1 + μ2 , h(x1 , t) μ1 + μ2 + α1 (x1 ) + α2 (x2 ) . g(x1 , t) = h(x1 , t) f (x1 , t) =
Beim Scheibenmodell von Bild 6-2b ist 2μ , R(x1 ) 2[μ + α(x1 )] . g(x1 ) = R(x1 ) f (x1 ) =
Beim Röhrenmodell von Bild 6-2c sind f und g dieselben Funktionen wie für Bild 6-2a. Die Variablen sind aber x1 = r und σ1 = σr . Bei der Integration von (6-8) sind folgende Umstände zu beachten:
E139
E140
E Technische Mechanik / Mechanik fester Körper
– Die Randbedingungen enthalten bei Bild 6-2a und b die Zugkräfte FE und FA am Werkstoffein- bzw. Auslauf, von denen eine unbekannt ist. – An Stellen x1 in Bild 6-2a, b oder c, wo h(x1 , t) oder R(x1 ) einen Knick hat, macht σ1 einen endlichen Sprung Δσ1 , weil dort eine unendlich große Schergeschwindigkeit auftritt. Beim Scheibenmodell ist dieser Sprung Δσ1 = σ1 (x1 +) − σ1 (x1 −) = −(Y/3)Δα sgn v1 . Beim Streifen- und beim Röhrenmodell steht Y/4 statt Y/3 in der Formel. – Umkehrpunkte der Werkstoffgeschwindigkeit relativ zum Werkzeug heißen Fließscheiden. Beiderseits einer Fließscheide gelten verschiedene Gleichungen (6-8) mit entgegengesetzten Vorzeichen der Reibbeiwerte μ. – Gleichung (6-8) gilt nur, wenn der Werkstoff nicht am Werkzeug haftet. – Bei Werkstoff mit Verfestigung ist Y = Y(˙e, e). In Bild 6-2b erfordert die Kontinuitätsgleichung v1 (x1 ) = v1E R2E /R2 (x1 ). Daraus folgt mit (6-1) und (6-6) e˙ (x1 ) = und
" e(x1 ) =
2|v1E |R2E tan α(x1 ) R3 (x1 ) "
e˙ dx1 v1
e˙ dt = " tan α(x1 ) R(x1 ) dx1 = 2 ln =2 . R(x1 ) RE
Damit ist Y als Funktion von x1 bekannt. In Bild 6-2 a und c ist |dh/dt| ∂h/∂t + v1 (tan α1 − tan α2 ) e˙ = = , h h und im Sonderfall α1 (x1 ) ≡ α2 (x1 ) ist hE ∂h/∂t , e = ln . e˙ = h h Beispiel 6-2: Beim Drahtziehen durch eine konische Düse mit α = const ist (6-8) in geschlossener Form integrierbar. Für die erforderliche Zugkraft FA erhält man für Y = const die Siebel’sche Formel FA = πR2A Y[2(1 + μ/α) ln(RE /RA ) + 2α/3] . Weitere Anwendungen auf das Ziehen, Schmieden und Walzen siehe in [1, 3, 8].
6.3 Traglast Statisch unbestimmte Systeme können, wenn sie nicht durch Knicken, Kippen oder Beulen versagen, bei monotoner Laststeigerung über ihre Elastizitätsgrenze hinaus belastet werden, ohne zusammenzubrechen. Bei elastisch-ideal-plastischem Werkstoff erfolgt der Zusammenbruch erst bei der sog. Traglast, bei der das System durch Ausbildung von ausreichend vielen Fließzonen zu einem Mechanismus wird. Das Verhältnis von Traglast zu Last an der Elastizitätsgrenze heißt plastischer Formfaktor α des Systems und α − 1 plastische Lastreserve. Die Definition setzt voraus, dass alle Lasten am System monoton und proportional zueinander anwachsen. Bei einem Werkstoff mit Verfestigung existiert keine ausgeprägte Traglast. Versagen tritt vielmehr durch unzulässig große Deformationen ein. 6.3.1 Fließgelenke. Fließschnittgrößen
Die Traglast eines Systems bleibt unverändert, wenn man die E-Module aller Systemteile mit derselben, beliebig großen Zahl multipliziert, sodass man bei der Berechnung auch starr-plastisches Verhalten annehmen kann (wenn gesichert ist, dass die tatsächlichen Deformationen eine Theorie 1. Ordnung erlauben). Bei Erreichen der Traglast wird das System ein Mechanismus aus starren Gliedern, die durch Fließzonen mit darin wirkenden Fließschnittgrößen „gelenkig“ verbunden sind. Zugstäbe werden auf ganzer Länge plastisch. Ihre Fließschnittgröße ist die Längskraft NF = AY. Biegestäbe bilden am Ort des maximalen Biegemoments eine plastische Zone aus, die man sich für Traglastrechnungen punktförmig als sog. Fließgelenk mit Fließschnittgrößen NF , QF und MF vorstellt. Wenn man QF vernachlässigt, liegt ein einachsiges Spannungsproblem vor. Der vollplastische Querschnitt ist dann nach Bild 6-3a durch eine Gerade in zwei Teilflächen A1 und A2 mit Schwerpunkten S1 bzw. S2 und mit Spannungen +Y bzw. −Y geteilt. Bei gerader und bei schiefer Biegung erfordert das Momentengleichgewicht, dass S 1 und S 2 auf der zu MF orthogonalen ζ-Achse liegen, sodass nur eine bestimmte Geradenschar zulässig ist. Außerdem muss gelten: MF = 2A1 ζS1 Y und NF = (A1 − A2 )Y. Für ein vorgeschriebenes Verhältnis MF /NF muss die passende Gerade bestimmt werden.
6 Plastizitätstheorie. Bruchmechanik
Aus den Traglastsätzen folgt, dass die Traglast eines Systems durch Einbau von zusätzlichen Versteifungen (z. B. von Knotenblechen in Gelenkfachwerke) nicht kleiner wird. 6.3.3 Traglasten für Durchlaufträger Bild 6-3. Bereiche mit positiver und negativer Fließspannung im vollplastifizierten Querschnitt eines Stabes bei vorgegebener Richtung von MF und vorgegebenem Verhältnis NF : MF . Der allgemeine Fall (a) und der doppeltsymmetrische Querschnitt mit NF = 0 und mit MF in y-Richtung (b)
Die Schnittgrößen Me und Ne an der Elastizitätsgrenze werden nach 5.6.4 berechnet. Damit ist der plastische Formfaktor α bekannt. Beispiel 6-3: Für einen doppeltsymmetrischen Querschnitt ist bei gerader Biegung die Gerade aus Symmetriegründen z = 0 (Bild 6-3b). Damit ist MF = 2A1 zS1 Y = 2S y (0)Y. Mit Me = 2YIy /h ist α = hS y (0)/Iy. Zum Einfluss von Schubspannungen auf Fließgelenke und Traglasten siehe [9]. 6.3.2 Traglastsätze
Die Traglastsätze von Drucker/Prager/Greenberg liefern untere und obere Schranken für Traglasten (siehe [10, 11]). Satz 1: Die Traglast ist größer als jede Last, für die im System eine Schnittgrößenverteilung angebbar ist, die die Gleichgewichtsbedingungen erfüllt und die an keiner Stelle Fließen verursacht. Satz 2: Die Traglast ist kleiner als jede Last, zu der ein starr-plastischer Ein-Freiheitsgrad-Mechanismus mit Fließschnittgrößen in den Gelenken existiert, der im Gleichgewicht ist und der an wenigstens einer Stelle außerhalb der Gelenke Schnittgrößen größer als die dortigen Fließschnittgrößen hat. Hilfssatz: Wenn der Ein-Freiheitsgrad-Mechanismus, der nach Satz 2 eine bestimmte obere Schranke F für die Traglast FT liefert, statisch bestimmt ist, dann kann man das größte in ihm auftretende Verhältnis μ = max (Schnittgröße/Fließschnittgröße) berechnen. Nach Satz 1 und 2 gilt dann für die Traglast FT F/μ FT F .
(6-9)
Ein Durchlaufträger mit Lasten gleicher Richtung (Bild 6-4a) versagt, indem ein einzelnes Feld an seinen Enden A und B und an einer Stelle x0 im Feld Fließgelenke ausbildet. Man muss für jedes Feld einzeln seine Traglast berechnen. Die kleinste dieser Traglasten ist die Traglast des gesamten Trägers. Für das Einzelfeld in Bild 6-4b ist das Fließmoment MAF im Gelenk bei A das kleinere der beiden Fließmomente der bei A verbundenen Trägerfelder. Entsprechendes gilt für MBF . Wenn im Feld nur Einzelkräfte angreifen, liegt das innere Gelenk unter einer Einzelkraft. Im Fall mehrerer Einzelkräfte sind entsprechend viele Lagen möglich. Für jede Lage wird auf den entsprechenden Mechanismus das Prinzip der virtuellen Arbeit (2.1.16) angewandt. Es liefert nach dem zweiten Traglastsatz (6.3.2) eine obere Schranke für die Traglast des Feldes. Beispiel 6-4: Der in Bild 6-4b dick gezeichnete Mechanismus wird virtuell verschoben (δϕ, δψ = δϕ/2). Das Prinzip der virtuellen Arbeit lautet 2F(l/3)δϕ + F(l/3)δψ − MAF δϕ − MF (δϕ + δψ) − MBF δψ = 0
Bild 6-4. a Durchlaufträger mit eingeprägten Kräften, deren Verhältnisse zueinander vorgeschrieben sind, sodass eine Traglast angebbar ist. b Die einzigen möglichen Fließgelenkmechanismen in einem Trägerfeld mit zwei Einzelkräften
E141
E142
E Technische Mechanik / Mechanik fester Körper
mit der Lösung F = (33/10)MF/l . Der gestrichelt gezeichnete Mechanismus liefert in derselben Weise F = (15/4)MF/l. Die kleinere obere Schranke (33/10) MF /l ist der exakte Wert für die Traglast des Feldes, weil andere Fließgelenklagen nicht möglich sind.
Bild 6-5. Rahmen mit möglichen Fließgelenken (markierte
Punkte)
Bei Streckenlasten q(x) – evtl. kombiniert mit Einzellasten – wird die Lage x0 des Fließgelenks als Unbekannte eingeführt. Mit dem Prinzip der virtuellen Arbeit wird die obere Schranke der Traglast als Funktion von x0 berechnet. Das Minimum dieser Funktion ist der exakte Wert für die Traglast des Feldes. Beispiel 6-5: Im Sonderfall q(x) ≡ q = const auf der ganzen Länge l eines Trägerfeldes ist die obere Schranke der Traglast qT als Funktion von x0 (siehe [11]) q(x0 ) = 2 ·
MAF (l − x0 ) + MF l + MBF x0 . lx0 (l − x0 )
q(x0 ) nimmt sein Minimum an für ⎧ ⎪ l/2 (MBF = MAF ) , ⎪ ⎪ ⎪ ⎪ ⎪ ⎡ ⎤ ⎪ 1/2 ⎪ ⎪ ⎪ ⎨ ⎢⎢⎢⎢ MBF + MF ⎥⎥ MAF + MF x0 = ⎪ l ⎢⎣ − 1⎥⎥⎥⎦ ⎪ ⎪ M + M MBF − MAF ⎪ AF F ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ (MBF MAF ) . Mit diesem x0 ist q(x0 ) die exakte Traglast qT . Wenn die exakte Berechnung von x0 zu aufwändig ist, schätzt man x0 , berechnet dazu die obere Schranke der Traglast (im Folgenden q∗ genannt) und berechnet dann den Biegemomentenverlauf und insbesondere das maximale im Feld auftretende Biegemoment Mmax MF . Nach dem Hilfssatz in 6.3.2 ist q∗ MF /Mmax eine untere Schranke für die Traglast. 6.3.4 Traglasten für Rahmen
Für einen Rahmen mit gegebener Belastung kann man die Anzahl m aller möglichen Fließgelenke ohne Rechnung angeben. Beispiel 6-6: In Bild 6-5 sind nur die m = 12 durch Punkte markierten Fließgelenke möglich. Dabei ist
Bild 6-6. a Balkenmechanismus, b Rahmenmechanismus, c Eckenmechanismus und d kombinierter Mechanismus für den Rahmen von Bild 6-5
noch ungeklärt, welche von ihnen sich tatsächlich ausbilden und wo sich die im Innern von Stabfeldern liegenden ausbilden. Bei einem n-fach statisch unbestimmten System mit m möglichen Fließgelenken kann man sämtliche möglichen Ein-Freiheitsgrad-Mechanismen durch Linearkombination von m − n Elementarmechanismen erzeugen. Elementarmechanismen sind vom Typ Balkenmechanismus (Bild 6-6a), Rahmenmechanismus (Bild 6-6b) oder Eckenmechanismus (Bild 6-6c). Bild 6-6d zeigt einen kombinierten EinFreiheitsgrad-Mechanismus. Für jeden Mechanismus wird mit dem Prinzip der virtuellen Arbeit eine obere Schranke für die Traglast bestimmt. Die kleinste berechnete Schranke ist die genaueste. Einzelheiten des Verfahrens siehe in [10, 11]. Traglasten von Rechteck- und Kreisplatten, von Schalen, rotierenden Scheiben und dickwandigen Behältern bei Innendruck siehe in [10].
6.4 Grundlagen der Bruchmechanik Die Bruchmechanik geht von dem Vorhandensein von Rissen oder kleinen Fehlern, d. h. von lokalen Trennungen des Materials, in Bauteilen aus. Risse können in der Struktur bereits vorhanden sein (z. B. Materialoder Fertigungsfehler) oder im Verlauf der Betriebs-
6 Plastizitätstheorie. Bruchmechanik
belastung erst entstehen (z. B. Ermüdungsrisse, Wärmespannungsrisse). Risse bewirken eine scharfe Kraftflussumlenkung, ein lokales singuläres Spannungsfeld, eine Verminderung der Tragfähigkeit einer Struktur, eine Erhöhung der Bruchgefahr, eine Verminderung der Lebensdauer von Bauteilen und Strukturen, möglicherweise katastrophale Schäden. Da ein totales Versagen einer Konstruktion weit unterhalb der Festigkeitsgrenzen des Materials erfolgen kann, ist eine spezielle Betrachtung der Gegebenheiten am Riss von großer Bedeutung. 6.4.1 Spannungsverteilungen an Rissen. Spannungsintensitätsfaktoren
Für die ingenieurmäßige Behandlung von Rissproblemen wird der Riss als mathematischer Schnitt (Kerbe mit dem Radius ρ = 0) betrachtet. An der Rissspitze tritt daher eine Singularität bei den Spannungen auf. Mit den Polarkoordinaten r und ϕ, ausgehend von der Rissspitze, Bild 6-7, lassen sich für alle Risse, bei denen infolge der Bauteilbelastung ein Öffnen des Risses entsteht (Rissbeanspruchungsart I), die Spannungen in der Rissumgebung wie folgt beschreiben: ⎫ 3ϕ ⎪ KI ϕ ϕ ⎪ cos σx = √ 1 − sin sin ,⎪ ⎪ ⎪ ⎪ 2 2 2 ⎪ 2πr ⎪ ⎪ ⎪ ⎪ ϕ KI ϕ 3ϕ ⎪ ⎬ (6-10) cos 1 + sin sin ,⎪ σy = √ ⎪ ⎪ 2 2 2 ⎪ 2πr ⎪ ⎪ ⎪ ⎪ ⎪ ϕ 3ϕ ϕ KI ⎪ ⎪ ⎪ . sin cos cos τ xy = √ ⎭ 2 2 2 2πr
KI ist hierbei der Spannungsintensitätsfaktor, der sich mit der ins Bauteil eingeleiteten Spannung σ, der Risslänge a und dem Geometriefaktor Y wie folgt errechnen lässt: √ KI = σ πa Y . (6-11) Der Y-Faktor kann z. B. mit der Formel ; < < a < < < A+B KI 1 = d − a Y= √ = a 2 a a σ πa 1 − + D( ) 1+C d d−a d−a (6-12) für verschiedene Geometrie- und Belastungssituationen ermittelt werden. Je nach Rissart folgen die Konstanten A, B, C und D aus Tabelle 6-1. 6.4.2 Bruchmechanische Bewertung der Bruchgefahr
Die Gefährlichkeit eines Risses wird bei Rissbeanspruchungsart I durch den Spannungsintensitätsfaktor KI definiert. Ein kritischer Zustand, d. h. instabile Rissausbreitung, tritt ein, wenn der Spannungsintensitätsfaktor KI (siehe 6.4.1) durch Belastungserhöhung oder Risswachstum die Risszähigkeit KIc des Materials erreicht. Als Bruchkriterium gilt somit KI = KIc .
(6-13)
Werte für KIc = Kc sind z. B. in D 9.2.6 und [15] angegeben. Will man Bruch vermeiden, so muss der Spannungsintensitätsfaktor stets kleiner als die Risszähigkeit sein. Für Risse mit dreidimensionaler Rissbeanspruchung (Überlagerung der Rissbeanspruchungsarten I, II und III, siehe D 9.2.6), gelten andere Gesetzmäßigkeiten, [13–15]. 6.4.3 Ermüdungsrissausbreitung
Bild 6-7. Spannungen in der Rissumgebung und Polarkoordinaten vor der Rissspitze
Bei zeitlich veränderlicher Belastung wächst der Riss unter bestimmten Bedingungen stabil. Die Rissgeschwindigkeit da/dN, ermittelt aus der Risslänge a und der Lastwechselzahl (Zyklenzahl) N, charakterisiert das Wachstum von Ermüdungsrissen. Bei zyklischer Belastung mit konstanter Amplitude
E143
E144
E Technische Mechanik / Mechanik fester Körper
Tabelle 6-1. Konstanten zur Bestimmung der Geometriefaktoren/Spannungsintensitätsfaktoren von Rissproblemen (sie-
he (6-12) und [12])
6 Plastizitätstheorie. Bruchmechanik
und vom Verhältnis R=
σmin Kmin = σmax Kmax
(6-15)
ab, siehe Bild 6-8. Der Zusammenhang kann z. B. durch die Formel da C(ΔK − ΔKth )m = dN (1 − R)Kc − ΔK
Bild 6-8. Rissgeschwindigkeit da/dN in Abhängigkeit vom zyklischen Spannungsintensitätsfaktor ΔK
hängt die Rissgeschwindigkeit insbesondere vom zyklischen Spannungsintensitätsfaktor √ ΔK = Δσ πa Y (6-14)
(6-16)
nach Erdogan und Ratwani von [16] beschrieben werden. In Bild 6-8 und in (6-16) stellen ΔKth den Schwellenwert gegen Ermüdungsrissausbreitung, ΔKc = (1 − R)Kc die zyklische Spannungsintensität, bei der instabile Rissausbreitung einsetzt, und C und m Materialparameter dar. Kennt man die Rissgeschwindigkeitskurve eines Materials, so kann man die Gefährlichkeit des Ermüdungsrisses und die Restlebensdauer des Bauteils abschätzen sowie auf diese Weise Inspektionsintervalle festlegen. Das Ermüdungsrisswachstum bei beliebiger zyklischer Belastung (Betriebsbelastung) erfolgt unter anderen Gesetzmäßigkeiten. Näheres siehe z. B. in [17, 18].
Bild 6-9. Zusammenwirken von Festigkeitsberechnung und Bruchmechanik bei statischer Belastung
E145
E146
E Technische Mechanik / Mechanik fester Körper
6.5 Zusammenwirken von Festigkeitsberechnung und Bruchmechanik Um Brüche von Bauteilen und Strukturen sicher zu vermeiden, sind die Konzepte der Festigkeitsberechnung und der Bruchmechanik in Kombination anzuwenden, Bild 6-9. Sowohl mit der Festigkeitsberechnung als auch mit der Bruchmechanik erhält man Aussagen über die zulässige oder kritische Belastung, den erforderlichen Werkstoff und die vorhandene Sicherheit gegen das Bauteilversagen, wobei der jeweils ungünstigere Wert ausschlaggebend ist. Mit der
Festigkeitsberechnung lassen sich zudem die erforderlichen Bauteilabmessungen ermitteln und mit der Bruchmechanik die kritischen Rissabmessungen bestimmen. Bei zyklischer Belastung ist ebenfalls ein Zusammenwirken von Festigkeitsberechnung und Bruchmechanik sinnvoll. Hierbei werden die zulässige zyklische Belastung, der erforderliche Werkstoff und die Sicherheit gegen Ermüdungsbruch durch beide Konzepte bestimmt, die Ermittlung der Risswachstumslebensdauer und der erforderlichen Inspektionsintervalle erfolgt über bruchmechanische Konzepte.
Strömungsmechanik J. Zierep, K. Bühler 7 Einführung in die Strömungsmechanik 7.1 Eigenschaften von Fluiden Strömungsvorgänge werden allgemein durch die Geschwindigkeit w = (u, v, w), Druck p, Dichte und Temperatur T als Funktion von (x, y, z, t) beschrieben. Die Bestimmung dieser Größen geschieht mit den Erhaltungssätzen für Masse, Impuls und Energie sowie mit einer Zustandsgleichung für den thermodynamischen Zusammenhang zwischen p, und T des Strömungsmediums (Fluids). Vier ausgezeichnete Zustandsänderungen sind in Bild 7-1 dargestellt. Welche Zustandsänderung eintritt, hängt von den Stoffeigenschaften und dem Verlauf der Strömung ab. Dichte
Bei Gasen ist die Dichte = (p, T ) von Druck und Temperatur abhängig. Für ideale Gase gilt die thermische Zustandsgleichung p = Ri T , wobei Ri die spezielle Gaskonstante des Stoffes i ist. Sind p0 , 0 , T 0 als Bezugswerte bekannt, so gilt der Zusammenhang
p T0 . = ·
0 p0 T
(7-1)
Bild 7-1. Thermodynamische Zustandsänderungen in der (p, 1/ )-Ebene
Die Dichte ändert sich bei Gasen also proportional zum Druck und umgekehrt proportional zur Temperatur. Für Luft gelten die Werte p0 = 1 bar, T 0 = 273,16 K,
0 = 1,275 kg/m3. Für die Abhängigkeit von der Strömungsgeschwindigkeit folgt aus der Beziehung (9-31) der Zusammenhang Δ M 2 ≈ .
2
(7-2)
Die Mach-Zahl M = w/a ist der Quotient aus Strömungs- und Schallgeschwindigkeit eines Mediums. Nach der Beziehung (9-8) ergibt sich die Schallgeschwindigkeit in Luft zu a = 347 m/s bei T = 300 K. Damit folgt die relative Dichteänderung
7 Einführung in die Strömungsmechanik
Δ / 0,01 für M 0,14 und w 49 m/s. Bei geringen Geschwindigkeiten können deshalb Strömungsvorgänge in Gasen als inkompressibel betrachtet werden. Bei Flüssigkeiten ist die Dichte nur wenig von der Temperatur abhängig und der Druckeinfluss ist vernachlässigbar klein. Es gilt damit
≈ const .
0
(7-3)
Flüssigkeiten sind damit als inkompressibel zu betrachten. Inkompressible Strömungsvorgänge entsprechen in Bild 7-1 einer isochoren Zustandsänderung. In der Tabelle 7-1 sind Zahlenwerte für die Dichte von Luft und Wasser für verschiedene Temperaturen zusammengestellt [1, 2]. Viskosität
Flüssigkeiten und Gase haben die Eigenschaft, dass bei Formänderungen durch Verschieben von Fluidelementen ein Widerstand zu überwinden ist. Die Reibungskraft durch die Schubspannungen zwischen den Fluidelementen ist nach Newton direkt proportional dem Geschwindigkeitsgradienten. Für die in Bild 7-2 dargestellte ebene laminare Scherströmung ergibt sich mit der auf die Fläche A bezogenen Kraft F die Schubspannung τ=
du U F =η =η . A dy h
(7-4)
Der Proportionalitätsfaktor wird als dynamische Viskosität η bezeichnet. η ist stark von der Temperatur abhängig, während der Druckeinfluss vernachlässigbar gering ist, d. h., η(T, p) ≈ η(T ). Als abgeleitete
Bild 7-2. Scherströmung im ebenen Spalt
Stoffgröße ergibt sich die kinematische Viskosität ν=
η .
(7-5)
Bei Gasen steigt die Viskosität mit der Temperatur an, während bei Flüssigkeiten die Viskosität mit steigender Temperatur abnimmt. Für diese Abhängigkeiten gelten formelmäßige Zusammenhänge [1]. Für Gase gilt die Beziehung: 3/2 ω T η T0 + TS T = ≈ . (7-6) η0 T + TS T0 T0 Die Bezugswerte für Luft bei p0 = 1 bar sind T 0 = 273,16 K, η0 = 17,10 μPa · s, und T S = 122 K ist die Sutherland-Konstante. Für Flüssigkeiten gilt im Bereich 0 < ϑ < 100 ◦ C die Beziehung TA η TA = exp − (7-7) . η0 T + TB TB + T0 Für Wasser gelten die Konstanten T A = 506 K, T B = −150 K und beim Druck p0 = 1 bar die Bezugswerte T 0 = 273,16 K und η0 = 1,793 mPa · s.
Tabelle 7-1. Stoffdaten für Luft und Wasser als Funktion der Temperatur beim Bezugsdruck p0 = 1 bar [1, 2]
Luft: ϑ in ◦ C
in kg/m3 η in μPa · s ν in mm2 /s Wasser: ϑ in ◦ C
in kg/m3 η in mPa · s ν in mm2 /s
−20 1,376 16,07 11,68
0 1,275 17,10 13,41
0 999,8 1,793 1,793
20 1,188 18,10 15,23
10 999,8 1,317 1,317
40 1,112 19,06 17,14 20 998,4 1,010 1,012
60 1,045 20,00 19,13
80 0,986 20,91 21,20
40 992,3 0,655 0,660
100 0,933 21,79 23,35
200 0,736 25,88 35,16
60 80 983,1 971,5 0,467 0,356 0,475 0,366
500 0,451 35,95 79,80 90 965,0 0,316 0,328
E147
E148
E Technische Mechanik / Mechanik fester Körper
In Tabelle 7-1 sind für Luft und Wasser Zahlenwerte für , η und ν in Abhängigkeit von der Temperatur ϑ zusammengestellt. Für andere Medien sind Daten der Stoffeigenschaften einschlägigen Tabellenwerken [3, 4] zu entnehmen. Die Verallgemeinerung des nach Newton benannten Ansatzes (7-4) auf mehrdimensionale Strömungen führt zum allgemeinen Spannungstensor [5].
7.2 Newton’sche und nichtnewton’sche Medien Newton’sche Medien sind dadurch ausgezeichnet, dass die Viskosität unabhängig von der Schergeschwindigkeit ist. In Bild 7-3 ist dieses Verhalten durch einen linearen Zusammenhang zwischen der Schubspannung τ und der Schergeschwindigkeit D = du/dy gekennzeichnet. Bei nichtnewton’schen Medien besteht dagegen ein nichtlinearer Zusammenhang zwischen der Schubspannung und der Schergeschwindigkeit. Die dynamische Viskosität η ist dann von der Schergeschwindigkeit D abhängig. Der Zusammenhang η(D) wird als Fließkurve bezeichnet. Steigt die Viskosität mit der Schergeschwindigkeit an, so wird das Verhalten als dilatant bezeichnet, während ein Abfall der Viskosität als pseudoplastisches Verhalten bezeichnet wird. Ändert sich bei einer konstanten Scherbeanspruchung die Viskosität mit der Zeit, dann wird das Verhalten mit steigender Viskosität als rheopex und bei abfallender Viskosität als thixotrop bezeichnet. Das Strömungsverhalten nichtnewton’scher Medien ist in [6, 7] umfassend dargestellt. Die rheologischen Begriffe sind in [8] definiert.
7.3 Hydrostatik und Aerostatik Das Verhalten der Zustandsgrößen im Ruhezustand ist der Gegenstand der Hydrostatik und der Aerostatik. Der Druck p ist eine skalare Größe. In Kraftfeldern gilt für die Druckverteilung die hydrostatische Grundgleichung [9] grad p = f
mit ∂p/∂x = f x , ∂p/∂y = fy und ∂p/∂z = fz . Die Änderung des Druckes ist damit gleich der angreifenden Massenkraft. Hydrostatische Druckverteilung im Schwerefeld. Es wirkt die Massenkraft f = (0, 0, −g). Die Integration der hydrostatischen Grundgleichung dp/dz = − g liefert für Medien mit konstanter Dichte eine lineare Abhängigkeit für den Druckverlauf: p(z) = p1 − gz .
Bild 7-3. Schubspannung als Funktion der Schergeschwin-
(7-9)
Der Druck nimmt ausgehend von p1 bei z = 0 linear mit zunehmender Höhe z ab. Archimedisches Prinzip. Ein im Schwerefeld in Flüssigkeit eingetauchter Körper erfährt einen Auftrieb, der gleich dem Gewicht der verdrängten Flüssigkeit ist. Druckverteilung in geschichteten Medien. Ändert sich die Dichte (z) mit der Höhe, so lautet für ein ideales Gas mit p/ = Ri T die Bestimmungsgleichung (7-8) für den Druck: dp g dz =− · . (7-10) p Ri T Für eine isotherme Gasschicht T = T 0 = const folgen mit den Anfangswerten p(z = 0) = p0 , (z = 0) = 0 die Druck- und Dichteverteilungen zu g p(z) = p0 exp − z (7-11) Ri T 0 g
(z) = 0 exp − z Ri T 0
digkeit
(7-8)
(7-12)
In einer isothermen Atmosphäre nehmen Druck und Dichte mit zunehmender Höhe exponentiell ab. Bild 7-4 zeigt den Druckverlauf als Funktion der Höhe z für ein inkompressibles Medium und für ein kompressibles Medium mit veränderlicher Dichte
(z) bei isothermer Atmosphäre.
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
dr = w, dt
d2 r dw =a. = dt dt2
(8-1)
Nach der Euler’schen Methode wird die Änderung der Strömungsgrößen an einem festen Ort betrachtet. Die zeitliche Änderung des Teilchenzustandes f (x, y, z, t) ergibt sich zu
Bild 7-4. Druckverlauf in inkompressiblen und kompressi-
blen Medien
7.4 Gliederung der Darstellung: Nach Viskositäts- und Kompressibilitätseinflüssen Die in der Realität auftretenden Strömungserscheinungen sind sehr vielfältig. Verschiedenartige physikalische Effekte erfordern unterschiedliche Beschreibungs- und Berechnungsmethoden. Wir betrachten hier zunächst Strömungen inkompressibler Medien mit und ohne Reibung (Kapitel 8), sodann untersuchen wir den Einfluss der Kompressibilität bei reibungsfreien Strömungen (Kapitel 9). In Kapitel 10 werden schließlich Vorgänge behandelt, bei denen Reibungs- und Kompressibilitätseffekte gleichzeitig bedeutsam sind. Begonnen wird jeweils mit eindimensionalen Modellen, die dann auf mehrere Dimensionen erweitert werden.
∂f df = + w · grad f . dt ∂t
(8-2)
Die substantielle Änderung setzt sich aus dem lokalen und dem konvektiven Anteil zusammen. Teilchenbahnen werden von den Fluidteilchen durchlaufen. Für bekannte Geschwindigkeitsfelder w folgen die Teilchenbahnen aus (8-1) durch Integration. Stromlinien sind Kurven, die in jedem festen Zeitpunkt auf das Geschwindigkeitsfeld passen. Die Differenzialgleichungen der Stromlinien lauten dx : dy : dz = u(x, y, z, t) : v(x, y, z, t) : w(x, y, z, t) .
(8-3)
Bei stationären Strömungen ist die lokale Beschleunigung null. Das Strömungsfeld ändert sich nur mit dem Ort, nicht jedoch mit der Zeit. Stromlinien und Teilchenbahnen sind dann identisch.
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss 8.1 Eindimensionale reibungsfreie Strömungen 8.1.1 Grundbegriffe
Man unterscheidet zwei Möglichkeiten zur Beschreibung von Stromfeldern. Mit der teilchen- oder massenfesten Betrachtung nach Lagrange folgen die Geschwindigkeit w und Beschleunigung a aus der substantiellen Ableitung des Ortsvektors r nach der Zeit t:
Bild 8-1. Zylinderumströmung. a Bewegter Zylinder: instationäre Strömung; b ruhender Zylinder: stationäre Strömung
E149
E150
E Technische Mechanik / Mechanik fester Körper
Bei instationären Strömungen ändert sich das Strömungsfeld mit dem Ort und der Zeit. Stromlinien und Teilchenbahnen sind im Allgemeinen verschieden. Durch die Wahl eines geeigneten Bezugssystems können instationäre Strömungen oft in stationäre Strömungen überführt werden. Zum Beispiel ist die Strömung eines in ruhender Umgebung bewegten Körpers in Bild 8-1a instationär. Wird dagegen der Körper festgehalten und mit konstanter Geschwindigkeit angeströmt, dann ist die Umströmung in Bild 8-1b stationär. 8.1.2 Grundgleichungen der Stromfadentheorie
Ausgehend von der zentralen Stromlinie 1 → 2 in Bild 8-2 hüllen die Stromlinien durch den Rand der Flächen A1 und A2 eine Stromröhre ein. Ein Stromfaden ergibt sich aus der Umgebung einer Stromlinie, für die die Änderungen aller Zustandsgrößen quer zum Stromfaden sehr viel kleiner sind als in Längsrichtung. Die Zustandsgrößen sind dann nur eine Funktion der Bogenlänge s und der Zeit t [1]. Kontinuitätsgleichung. Der Massenstrom durch den von Stromlinien begrenzten Stromfaden in Bild 8-2 ist bei stationärer Strömung konstant. m ˙ = V˙ = 1 w1 A1 = 2 w2 A2 = const .
(8-4)
Für inkompressible Medien ( = const) folgt hieraus ˙ die Konstanz des Volumenstromes V. Bewegungsgleichung. Mit dem Newton’schen Grundgesetz folgt aus dem Kräftegleichgewicht in Stromfadenrichtung s nach Bild 8-3 die Euler’sche Differenzialgleichung dw ∂w ∂w 1 ∂p ∂z = +w =− · −g . dt ∂t ∂s
∂s ∂s
(8-5)
Bild 8-3. Kräftegleichgewicht in Stromfadenrichtung
Die Integration längs des Stromfadens 1 → 2 ergibt für inkompressible Strömungen die BernoulliGleichung "2 1
w2 − w21 p2 − p1 ∂w ds + 2 + + g(z2 − z1 ) = 0 . ∂t 2
(8-6)
Das Integral ist für instationäre Strömungen bei festem t längs des Stromfadens 1 → 2 auszuführen. Ändert sich die Geschwindigkeit mit der Zeit nicht, so ist ∂w/∂t = 0, und es folgt aus (8-6) die BernoulliGleichung für stationäre Strömungen: w2 p + + gz = const . 2
(8-7)
Bei stationärer Strömung entlang einem gekrümmten Stromfaden folgt für das Kräftegleichgewicht normal zur Strömungsrichtung s in Bild 8-4: w2 1 ∂p ∂z dwn =− =− · −g . dt r
∂n ∂n
(8-8)
Hierbei ist r der lokale Krümmungsradius in Normalrichtung n. Erfolgt die Bewegung in konstanter Höhe z, so folgt aus (8-8) das Gleichgewicht zwischen Fliehkraft und Druckkraft. Hierbei steigt der Druck in radialer Richtung an. Energiesatz. Wir betrachten ein reibungsbehaftetes Fluid im Kontrollraum zwischen den Querschnitten A1 und A2 des Stromfadens nach Bild 8-2. Die Energiebilanz bezogen auf den Massenstrom m ˙ lautet für das stationär durchströmte System [2]:
Bild 8-2. Stromfadendefinition
1 1 h1 + w21 + gz1 + q12 + a12 = h2 + w22 + gz2 . 2 2 (8-9)
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Bild 8-4. Kräftegleichgewicht senkrecht zum Stromfaden
Hierbei ist h = e + p/ die spezifische Enthalpie, q12 die spezifische zugeführte Wärmeleistung und a12 die durch Reibung und mechanische Arbeit dem System von außen zugeführte spezifische Leistung. Für Arbeitsmaschinen (Pumpen) ist a12 > 0 und für Kraftmaschinen (Turbinen) ist a12 < 0 definiert. Im Fall verschwindender Energiezufuhr über den Kontrollraum ist q12 = 0 und a12 = 0. Die innere Energie e ändert sich dann nur durch den irreversiblen Übergang von mechanischer Energie in innere Energie. Diese Dissipation bewirkt zugleich eine Temperaturerhöhung und kann als zusätzlicher Druckabfall (Druckverlust) interpretiert werden. Mit (e2 − e1 ) =
cv (T 2 −T 1 ) = Δpv , wobei für inkompressible Medien cv = c p = c ist, lautet dann die Energiebilanz (8-9): w21
w22
p1 p2 Δpv + + gz1 = + + gz2 + .
2
2
(8-10)
Für den Sonderfall reibungsfreier Strömungen ist Δpv = 0 und die Energiebilanz unter den entsprechenden Voraussetzungen identisch mit der Bernoulli-Gleichung. 8.1.3 Anwendungsbeispiele Bewegung auf konzentrischen Bahnen (Wirbel)
Die Bewegung verläuft nach Bild 8-5 mit kreisförmigen Stromlinien in der horizontalen Ebene. Bei rotationssymmetrischer Strömung sind Geschwindigkeit w und Druck p nur vom Radius r abhängig. Aus den Kräftebilanzen (8-7) und (8-8) folgen die Bestimmungsgleichungen
Bild 8-5. Bewegung auf Kreisbahnen (Stromlinien s), Geschwindigkeits- und Druckverteilung
w2 p + = const , 2
(8-11)
w2 1 dp = · . r
dr
(8-12)
Ist die Konstante in (8-11) für jede Stromlinie gleich, so liegt eine isoenergetische Strömung vor. Damit verknüpft die Bernoulli-Gleichung auch die Zustände der Stromlinien mit verschiedenen Radien. Mit der Vorgabe der Strömungszustände w1 und p1 auf dem Radius r1 folgt aus (8-11) und (8-12) für die Geschwindigkeits- und Druckverteilung: w1 r1 , w(r) = r ⎛ ⎞ r12 ⎟⎟⎟
2 ⎜⎜⎜ p(r) = p1 + w1 ⎝⎜1 − 2 ⎠⎟ . (8-13) 2 r Diese Bewegung mit der hyperbolischen Geschwindigkeitsverteilung wird als Potenzialwirbel bezeichnet. Druck und Geschwindigkeit variieren entgegengesetzt, was das Kennzeichen einer isoenergetischen Strömung ist. Um ein unbegrenztes Anwachsen der Geschwindigkeit zu vermeiden, beschränken wir die Lösung (13) auf den Bereich r r1 .
E151
E152
E Technische Mechanik / Mechanik fester Körper
Im Bereich r r1 rotiert das Medium stattdessen wie ein starrer Körper. Die Geschwindigkeitsverteilung und die dazugehörige Druckverteilung aus (8-12) ergeben sich mit der Winkelgeschwindigkeit ω = const zu w1 r, w(r) = ωr = r1 ⎛ ⎞ (8-14) ⎟⎟
2 ⎜⎜⎜ r2 p(r) = p1 + w1 ⎜⎝ 2 − 1⎟⎟⎠ . 2 r1 Bei dieser Starrkörperrotation variieren Geschwindigkeit und Druck gleichsinnig. In Bild 8-5 ist die Geschwindigkeitsverteilung und die dazugehörige Druckverteilung für den Starrkörperwirbel im Bereich r r1 und für den Potenzialwirbel im Bereich r r1 dargestellt. Im Wirbelzentrum bei r = 0 kann ein erheblicher Unterdruck auftreten. Druckbegriffe und Druckmessung
Aus der Bernoulli-Gleichung (8-7) folgen die Druckbegriffe statischer Druck , p = pstat 1 2
w = pdyn dynamischer Druck . 2 Bei der Umströmung des Körpers in Bild 8-6a ohne Fallbeschleunigung gilt längs der Staustromlinie 1 1 p∞ + w2∞ = p + w2 = p0 . 2 2
(8-15)
Der Druck p0 im Staupunkt wird als Ruhedruck oder Gesamtdruck bezeichnet, womit der Zusammenhang pstat + pdyn = ptot gültig ist. Die Messung des statischen Druckes p kann mit einer Wandanbohrung senkrecht zur Strömungsrichtung nach Bild 8-6b erfolgen. Aus der Steighöhe im Manometer folgt mit dem Außendruck p1 der statische Druck p = p1 + M gh unter der Voraussetzung, dass die Dichte des Strömungsmediums sehr viel kleiner als die Dichte M der Messflüssigkeit ist. Mit dem Pitotrohr (Bild 8-6c) wird durch den Aufstau der Strömung der Gesamt- oder Ruhedruck p0 = p1 + M gh gemessen. Der dynamische Druck pdyn lässt sich aus der Differenz zwischen dem Gesamtdruck und dem statischen Druck mit dem Prandtl’schen Staurohr (Bild 8-6d) ermitteln. Aus
Bild 8-6. Druckmessung. a Körperumströmung, b Wandanbohrung, c Pitotrohr, d Prandtl’sches Staurohr
der Messung von pdyn = ptot − pstat = M gh folgt die Strömungsgeschwindigkeit
w = 2pdyn / . Venturirohr
Mit dem Venturirohr nach Bild 8-7 lassen sich Strömungsgeschwindigkeiten und Volumenströme in Rohrleitungen bestimmen. Aus der Kontinuitätsgleichung (8-4) und der Bernoulli-Gleichung (8-7) folgen die Beziehungen m ˙ = w1 A1 = w2 A2 , V˙ =
w21 p1 w22 p2 + = + . 2
2
Bild 8-7. Venturirohr
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Die Geschwindigkeit im Querschnitt 2 folgt hieraus zu 8 2 1 w2 = 8 (p − p2 ) 2 1 A2 1− A1 8 2 =α (p1 − p2 ) .
(8-16)
Aus der Hydrostatik ergibt sich die Druckdifferenz p1 − p2 = M gh unter der Voraussetzung M . Die Konstante α ist hier nur vom Flächenverhältnis A2 /A1 abhängig. Bei realen Fluiden wird neben dem Flächenverhältnis auch der Reibungseinfluss durch diese als Durchflusszahl α bezeichnete Größe berücksichtigt. Experimentell ermittelte Werte von α sind für genormte Düsen in [3] enthalten. Ausströmen aus einem Gefäß
Wir betrachten den Ausfluss einer Flüssigkeit der Dichte aus dem Behälter in Bild 8-8 im Schwerefeld. Die Bernoulli-Gleichung (8-7) lautet für den Stromfaden von der Flüssigkeitsoberfläche 1 bis zum Austritt : 2 w21 p1 w2 p2 + + gz1 = 2 + + gz2 . 2
2
Unter der Voraussetzung A1 A2 folgt aus der Kontinuitätsbedingung, dass die Geschwindigkeit w1 = w2 · A2 /A1 vernachlässigbar klein ist. Die Ausflussgeschwindigkeit ergibt sich damit zu 8 2 w2 = (p1 − p2 ) + 2gh . (8-17)
Es sind zwei Sonderfälle interessant.Für p1 = p2 ist die Ausflussgeschwindigkeit w2 = 2gh. Diese Beziehung wird als Torricelli’sche Formel bezeichnet. Für h = 0 erfolgt der Ausfluss durch den Überdruck im Behälter gegenüber der Umgebung. Es folgt die Geschwindigkeit w2 = (2/ )(p1 − p2 ). Beispiel: Atmosphärische Bewegung. Bei einer Druckdifferenz von p1 − p2 = 10 hPa folgt für Luft mit der konstanten Dichte = 1,205 kg/m3 die Geschwindigkeit w2 = 40,7 m/s = 146,6 km/h. Schwingende Flüssigkeitssäule
Eine instationäre Strömung liegt bei der schwingenden Flüssigkeitssäule in einem U-Rohr nach Bild 8-9 vor. Bei konstantem Querschnitt A folgt aus der Kontinuitätsbedingung, dass die Geschwindigkeit w1 = w2 = w(t) in der Flüssigkeit nur von der Zeit t, aber nicht vom Ort s abhängt. Die Auslenkung x der Flüssigkeitsoberflächen ist auf beiden Seiten gleich groß. Die Bernoulli-Gleichung (8-6) lautet dann für den Stromfaden s zwischen 1 und : 2 "2 w21 p1 w22 p2 ∂w + + gz1 = + + gz2 + ds . 2
2
∂t 1
(8-18)
Mit der Druckgleichheit p1 = p2 auf den beiden Flüssigkeitsoberflächen folgt dw dt
"2 ds + g(h2 − h1 ) = 0 .
(8-19)
1
Die Länge des Stromfadens ist L =
.2
ds ≈ h1 + l + h2
1
und die Geschwindigkeit folgt aus der zeitlichen Än-
Bild 8-8. Ausströmen aus einem Behälter
Bild 8-9. Schwingende Flüssigkeitssäule
E153
E154
E Technische Mechanik / Mechanik fester Körper
derung der Oberflächenlage zu w = dx/dt. Aus (8-19) ergibt sich die Differenzialgleichung d2 x x + 2g = 0 . L dt2
dt = (8-20)
Die Lösung x = x0 cos ωt stellt eine harmonische Schwingungmit der Amplitude x0 und der Kreisfrequenz ω = 2g/L dar. Einströmen in einen Tauchbehälter
Der in Bild 8-10 dargestellte Tauchbehälter füllt sich langsam durch die Öffnung im Boden. Bei kleinem Querschnittsverhältnis, A2 A3 , ist die zeitliche Änderung der Geschwindigkeit längs des Stromfadens s 1 → 2 ebenfalls klein, sodass der Beschleunigungsterm in der Bernoulli-Gleichung (8-6) vernachlässigbar ist. Die Zeitabhängigkeit wird allein durch die zeitlich veränderlichen Randbedingungen berücksichtigt. Diese Strömung wird als quasistationär bezeichnet. Von 1 nach 2 gilt die BernoulliGleichung (8-7). Bei 2 strömt das Medium als Freistrahl in den Behälter. Der Druck im Strahl entspricht dem hydrostatischen Druck in der Umgebung: p2 (t) = p1 + gz(t). Aus der Bernoulli-Gleichung folgt nun bei einer ruhenden Oberfläche mit w1 = 0 die Geschwindigkeit im Eintrittsquerschnitt: w2 (t) = 2g[h − z(t)] . (8-21) Mit der Kontinuität des Volumenstromes zwischen 2 und , 3 w2 (t)A2 dt = A3 dz ,
folgt die Differenzialgleichung A3 A3 dz dz = . · · A2 w2 (t) A2 2g[h − z(t)]
(8-22)
Aus der Integration ergibt sich mit der Anfangsbedingung z = 0 für t = 0: ⎞ ⎛ A3 2h ⎜⎜⎜⎜ z(t) ⎟⎟⎟⎟ t= · (8-23) ⎟ . ⎜⎝1 − 1 − A2 h ⎠ 2gh Für z = h folgt die Auffüllzeit Δt =
A3 2h · . A2 2gh
(8-24)
Die zeitliche Änderung der Spiegelhöhe z(t) ist dann # z(t) t $2 = 1− 1− , h Δt
(8-25)
und für die Eintrittsgeschwindigkeit w2 (t) folgt # t $ w2 (t) = 2gh 1 − (8-26) . Δt Diese Geschwindigkeit nimmt linear mit der Zeit ab.
8.2 Zweidimensionale reibungsfreie, inkompressible Strömungen 8.2.1 Kontinuität
Aus der allgemeinen Massenerhaltung ∂
d
+ div( w) = + · div w = 0 ∂t dt folgt für inkompressible Medien mit = const die Divergenzfreiheit des Strömungsfeldes: div w =
∂u ∂v + =0. ∂x ∂y
(8-27)
8.2.2 Euler’sche Bewegungsgleichungen
Aus dem Kräftegleichgewicht am Massenelement folgen die Bewegungsgleichungen
Bild 8-10. Einströmen in einen Tauchbehälter
1 dw ∂w = + w · grad w = − grad p + f dt ∂t
(8-28)
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
mit der spezifischen Massenkraft f , wobei alle Glieder auf die Masse des Elementes bezogen sind. Charakteristische Größen der Strömungen sind die Rotation und die Zirkulation. Die Rotation (Wirbelstärke) rot w = 2ω ist gleich der doppelten Winkelgeschwindigkeit eines Fluidteilchens. Die Zirkulation 0 w · ds Γ= C
ist gleich dem Linienintegral über das Skalarprodukt aus Geschwindigkeitsvektor w und Wegelement ds längs einer geschlossenen Kurve C. Über den Satz von Stokes besteht zwischen Zirkulation und Rotation der Zusammenhang: " 0 w · ds = rot w · dA , Γ= C
A
wobei A die von der Kurve C berandete Fläche darstellt. Für die Zirkulation und die Rotation gelten allgemeine Erhaltungssätze, die auf Helmholtz und Thomson zurückgehen [4].
Die Funktionen Φ und Ψ lassen sich physikalisch deuten. Für die Kurven Ψ = const als Höhenlinien der Ψ -Fläche gilt: dΨ = −v dx + u dy = 0 , dy v = . dx Ψ =const u
Damit sind nach (8-3) die Kurven Ψ = const Stromlinien. Für die Kurven Φ = const folgt analog: dΦ = u dx + v dy = 0 , dy u =− . dx Φ=const v
"2 V˙ = Ψ2 − Ψ1 =
(8-34)
Längs der Stromlinien gilt auch hier die BernoulliGleichung (8-7). Aufgrund der Wirbelfreiheit sind Potenzialströmungen isoenergetisch, sodass für alle Stromlinien die Bernoulli-Konstante gleich ist. Bei bekannten Anströmdaten wird das Druckfeld über das Geschwindigkeitsfeld ermittelt:
(8-29)
1 1 p∞ + w2∞ = p + (u2 + v2 ) = p0 . 2 2
Mit den Geschwindigkeitskomponenten u = ∂Φ/∂x und v = ∂Φ/∂y folgt aus der Kontinuitätsgleichung (8-27) für das Geschwindigkeitspotenzial Φ die Laplace-Gleichung: ∂2 Φ ∂2 Φ + 2 = ΔΦ = 0 . ∂x2 ∂y
(u dy − v dx) . 1
Wir betrachten ebene Strömungen ohne Massenkraft. Verlaufen diese Strömungen wirbelfrei mit rot w = 0, dann existiert für das Geschwindigkeitsfeld w ein Potenzial Φ mit w = grad Φ. Damit gilt für das Geschwindigkeitsfeld: ∂v ∂u − =0. ∂x ∂y
(8-33)
Die Kurven Φ = const sind Potenziallinien, die mit den Stromlinien ein orthogonales Netz bilden, siehe Bild 8-11. Der auf die Tiefe bezogene Volumenstrom zwischen zwei Stromlinien folgt aus der Differenz der Stromfunktionswerte:
8.2.3 Stationäre ebene Potenzialströmungen
rot w =
(8-32)
(8-35)
(8-30)
Wird die Kontinuitätsgleichung (8-27) mit u = ∂Ψ/∂y und v = −∂Ψ/∂x durch eine Stromfunktion Ψ erfüllt, so gilt aufgrund der Wirbelfreiheit (8-29) für diese Stromfunktion Ψ ebenfalls die Laplace-Gleichung: ∂2 Ψ ∂2 Ψ + 2 = ΔΨ = 0 . ∂x2 ∂y
(8-31)
Bild 8-11. Orthogonales Netz der Potenzial- und Stromlini-
en
E155
E156
E Technische Mechanik / Mechanik fester Körper
Der normierte Druckkoeffizient Cp =
2 w p − p∞ =1− 1 2 w∞
w 2 ∞
(8-36)
besitzt die ausgezeichneten Werte C p∞ = 0 in der Anströmung und C p0 = 1 in den Staupunkten. Lösungseigenschaften der Potenzialgleichung (Laplace-Gleichung). Jede differenzierbare komplexe Funktion X(z) = Φ(x, y) + iΨ (x, y) ist eine Lösung der Potenzialgleichung, wobei der Realteil dem Potenzial Φ und der Imaginärteil der Stromfunktion Ψ entspricht. Eine wesentliche Eigenschaft der Potenzialgleichung ist ihre Linearität. Damit lassen sich einzelne Teillösungen zu einer Gesamtlösung überlagern. Jede Stromlinie kann als Begrenzung des Stromfeldes oder als Körperkontur interpretiert werden. Als Randbedingung ist dann die wandparallele Strömung mit verschwindender Geschwindigkeit in Normalenrichtung erfüllt. 8.2.4 Anwendungen elementarer und zusammengesetzter Potenzialströmungen
Beispiele von Potenzialströmungen sind in der Tabelle 8-1 zusammengestellt. Durch geeignete Überlagerung lassen sich unterschiedliche Umströmungsaufgaben konstruieren. Zwei Fälle werden betrachtet. Umströmung einer geschlossenen Körperkontur
Die Überlagerung einer Parallelströmung mit einer Quelle und einer Senke der Stärke Q bzw. – Q ergibt die in Bild 8-12 dargestellte Strömungssituation. Die Quelle ist bei x = −a angeordnet, sodass sich bei x = −l ein Staupunkt bildet. Ebenso führt die Senke bei x = a an der Stelle x = l zu einem Staupunkt. Die durch die Staupunkte führende Stromlinie Ψ = 0 entspricht der Körperkontur mit der Länge 2l und der Dicke 2h. Die Werte des normierten Druckkoeffizienten C p und der Geschwindigkeit w/u∞ auf der Körperkontur sowie auf der Staustromlinie sind in Bild 8-12 längs der x-Achse aufgezeichnet. Druck und Geschwindigkeit variieren entgegengesetzt. Aus der Stromfunktion
Bild 8-12. Umströmung einer geschlossenen Körperkontur
Ψ = u∞ y −
2ay Q arctan 2 2π x + y2 − a 2
(8-37)
resultieren in Abhängigkeit des dimensionslosen Parameters Q/(2πu∞a) für die Geometrie und die Maximalgeschwindigkeit auf der y-Achse die Beziehungen [2] h/a h = cot , a Q/(πu∞a) 1/2 Q l = 1+ a πu∞ a u(0, ±h) Q/(πu∞a) =1+ . u∞ 1 + h2 /a2
(8-38)
(8-39)
Im Folgenden sind Resultate für spezielle Werte von Q/(2πu∞a) zusammengestellt. Der Grenzfall Q(2πu∞a) → 0 entspricht der Parallelströmung um eine unendlich dünne Platte und im Grenzfall Q/(2πu∞a) → ∞ geht der Körper in einen Kreiszylinder über. Ist nun die Körperkontur vorgegeben, so lässt sich das Geschwindigkeits- und Druckfeld mit Singularititenverfahren durch die kontinuierliche Anordnung von
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Tabelle 8-1. Elementare und überlagerte Potenzialströmungen [1]
E157
E158
E Technische Mechanik / Mechanik fester Körper
Tabelle 8-1. Fortsetzung
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Q 2πu∞ a 0 1,0 ∞
h a 0 1,307 ∞
l a 1,0 1,732 ∞
l h ∞ 1,326 1,0
u(0, ±h) u∞ 1,0 1,739 2,0
Quellen und Senken unterschiedlicher Stärke berechnen. Diese allgemeinen Verfahren und deren Anwendung sind in [1, 5, 6] beschrieben. Zylinderumströmung mit Wirbel
In Bild 8-13 ist diese Strömung mit einem rechts im Uhrzeigersinn drehenden Wirbel der Zirkulation Γ > 0 dargestellt. Das Strömungsfeld ist bezüglich der x-Achse unsymmetrisch. Der Zylinder entspricht der Stromlinie mit dem Wert Ψ = (Γ/2π) · ln R. Die Staupunkte liegen für Γ < 4πu∞R auf dem Zylinder und fallen für Γ = 4πu∞R bei x = 0 und y = −R zusammen, sodass für größere Werte Γ der gemeinsame Staupunkt auf der y- Achse im Strömungsfeld liegt. Aus der Geschwindigkeitsverteilung nach Tabelle 8-1 folgt die Druckverteilung auf dem Zylinder in normierter Form: 2 w p − p∞ Cp = =1− 1 2 u∞
w 2 ∞ 2 Γ = 1 − 2 sin ϕ + R . (8-40) 2πu∞ Aus dieser bezüglich der x-Achse unsymmetrischen Druckverteilung ergibt sich für einen Zylinder mit der Breite b folgende Kraft in y-Richtung: Fy = −bR
"2π (p − p∞ ) sin ϕ dϕ = u∞ bΓ .
Dieses Ergebnis, wonach diese Auftriebskraft Fy direkt proportional der Zirkulation Γ ist, wird als Kutta-Joukowski-Formel für den Auftrieb bezeichnet. Durch eine entsprechende Rechnung folgt, dass eine Kraft in x-Richtung, die als Widerstand bezeichnet wird, nicht auftritt. Für Potenzialströmungen gilt dieses als d’Alembert’sches Paradoxon bezeichnete Ergebnis allgemein. Eine experimentelle Realisierung dieser Potenzialströmung ist näherungsweise durch die Anströmung eines rotierenden Zylinders gegeben. Die von der Strömung auf den Zylinder ausgeübten Kräfte werden in dimensionsloser Form durch den Auftriebsbeiwert cA und den Widerstandsbeiwert cW gekennzeichnet. In Bild 8-14 ist die Abhängigkeit dieser Beiwerte vom Verhältnis aus Umfangsgeschwindigkeit Rω und Anströmgeschwindigkeit u∞ aufgetragen. Mit dem Resultat (8-41) folgt mit der Bezugsfläche A = 2Rb als theoretischer Auftriebsbeiwert Fy
u∞ bΓ = cA = 1 2 1 2
u A
u 2Rb 2 ∞ 2 ∞ Γ Rω = = 2π . (8-42) u∞ R u∞ Die in Bild 8-14 dargestellten Werte wurden im Experiment mit einem Zylinder endlicher Breite L/D = 12 ermittelt [7]. Die Ursache für die Abweichung liegt im Wesentlichen an der Randbedingung am Zylinder. Die Umfangsgeschwindigkeit ist konstant, während bei der Potenzialströmung eine vom Umfangswin-
(8-41)
0
Bild 8-14. Auftrieb und Widerstand beim rotierenden ZyBild 8-13. Zylinderumströmung mit Zirkulation
linder
E159
E160
E Technische Mechanik / Mechanik fester Körper
kel ϕ abhängige Geschwindigkeit vorliegt. Deshalb tritt im Experiment auch eine Kraft in x-Richtung auf, die durch den Widerstandsbeiwert Fx Fx = 2 cW = (8-43) 1 2
u∞ bR
u∞ A 2 charakterisiert wird. Das experimentelle Ergebnis ist in Bild 8-14 ebenfalls eingetragen. 8.2.5 Stationäre räumliche Potenzialströmungen
Bei räumlichen Potenzialströmungen sind die rotationssymmetrischen Stromfelder besonders ausgezeichnet. Beispiele sind in dem umfassenden Werk [8] enthalten.
8.3 Reibungsbehaftete inkompressible Strömungen 8.3.1 Grundgleichungen für Masse, Impuls und Energie
Die Massenerhaltung (8-27) gilt unabhängig vom Reibungseinfluss. Bei einer allgemeinen Kräftebilanz am Volumenelement treten durch die Reibung Zusatzspannungen auf. Bei Newton’schen Medien besteht zwischen diesen Spannungen und den Deformationsgeschwindigkeiten ein linearer Zusammenhang. Die dynamische Viskosität η = ν ist der Proportionalitätsfaktor und charakterisiert als Fluideigenschaft den Reibungseinfluss des Strömungsmediums. Die thermischen Eigenschaften des Mediums sind durch die Temperaturleitfähigkeit a = λ/ c p gegeben, wo λ die Wärmeleitfähigkeit und c p die spezifische Wärmekapazität ist. Für inkompressible Strömungen mit
= const und konstanten Stoffwerten η und a lauten die Erhaltungsgleichungen für Masse, Impuls und thermische Energie [9] div w = 0 1 ∂w + w · grad w = f − grad p + νΔw ∂t
1 ∂T ν + w · grad T = − div q + Φv . ∂t
c p cp
(8-44) (8-45) (8-46)
Äußere Kraftfelder sind durch die spezifische Massenkraft f charakterisiert. Die Wärmestromdichte ist durch q = −λ grad T gegeben [10]. In kartesischen
Koordinaten lauten damit diese Bilanzgleichungen (Navier-Stokes’sche Gleichungen): ∂u ∂v ∂w + + = 0, ∂x ∂y ∂z ∂u ∂u ∂u ∂u +u +v +w ∂t ∂x ∂y ∂z 2 ∂ u ∂2 u ∂2 u 1 ∂p = fx − · +ν + + ,
∂x ∂x2 ∂y2 ∂z2 ∂v ∂v ∂v ∂v +u +v +w ∂t ∂x ∂y ∂z 2 ∂ v ∂2 v ∂2 v 1 ∂p = fy − · +ν + + ,
∂y ∂x2 ∂y2 ∂z2 ∂w ∂v ∂w ∂w +u +v +w ∂t ∂x ∂y ∂z 2 ∂ w ∂2 w ∂2 w 1 ∂p = fz − · +ν + 2 + 2 ,
∂z ∂x2 ∂y ∂z ∂T ∂T ∂T ∂T +u +v +w ∂t ∂x ∂y ∂z 2 2 2 ν ∂T ∂ T ∂ T + 2 + 2 + Φv =a 2 ∂x ∂y ∂z cp
(8-47)
(8-48)
(8-49)
(8-50)
(8-51)
mit der Dissipationsfunktion ⎡ 2 2 2 ⎤ ⎢⎢ ∂u ∂v ∂w ⎥⎥⎥⎥ + + Φv = 2 ⎢⎢⎢⎣ ⎥ ∂x ∂y ∂z ⎦ 2 2 ∂w ∂v ∂v ∂u + + + + ∂x ∂y ∂y ∂z 2 ∂u ∂w + + . ∂z ∂x
(8-52)
Diese 5 nichtlinearen partiellen Differenzialgleichungen genügen zur Bestimmung von w = (u, v, w), p und T . Bei den hier betrachteten inkompressiblen Strömungen ist das Stromfeld vom Temperaturfeld entkoppelt. In der Energiegleichung zeigt sich der Einfluss der Reibung durch die Dissipationsfunktion Φv . 8.3.2 Kennzahlen
Werden nun diese Gleichungen im Schwerefeld mit charakteristischen Größen des Strömungsfeldes, der Geschwindigkeit w, der Zeit t, der Länge l und dem
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Druck p normiert, dann lassen sich folgende Kennzahlen bilden: p Eu =
w2
Euler-Zahl (Druck- durch Trägheitskraft)
(8-53)
Fr =
w2 lg
Froude-Zahl (Trägheits- durch Schwerkraft)
(8-54)
Sr =
l tw
Strouhal-Zahl (lokale durch konvektive Beschleunigung)
(8-55)
Re =
wl ν
Reynolds-Zahl (Trägheits- durch Reibungskraft) .
(8-56)
Aus der Energiegleichung folgen mit T 2 − T 1 als charakteristischer Temperaturdifferenz die Kennzahlen: l2 Fo = at
Fourier-Zahl (instationäre Wärmeleitung)
(8-57)
Péclet-Zahl (konvektiver Wärmetransport)
(8-58)
Pe =
wl a
Ec =
w2 c p (T 2 − T 1 )
Eckert-Zahl (kinetische Energie durch Enthalpie) .
ν a
Zu den Navier-Stokes’schen Gleichungen (8-47) bis (8-50) kommen die aus der Problemstellung resultierenden Anfangs- und Randbedingungen hinzu. Analytische Lösungen lassen sich nur unter bestimmten Voraussetzungen angeben. Der entscheidende Parameter ist dabei die Reynolds-Zahl (8-56). Ist die Stromlinienform von der Reynolds-Zahl unabhängig, lassen sich oft analytische Lösungen angeben. Damit sind alle Potenzialströmungen Lösungen der Navier-Stokes’schen Gleichungen, wobei allerdings die entsprechenden Geschwindigkeitsverteilungen auf den Rändern zu erfüllen sind. Ähnlichkeitslösungen lassen sich dann finden, wenn keine ausgezeichnete Länge im Strömungsfeld auftritt. Durch Approximationen können diese Gleichungen weiter vereinfacht werden. Im Grenzfall sehr kleiner Reynolds-Zahlen Re < 1 können die Trägheitskräfte gegenüber den Reibungskräften vernachlässigt werden. Diese Strömungen werden als Stokes’sche Schichtenströmungen bezeichnet. Bei sehr großen Reynolds-Zahlen Re 1 spielt die Reibung im Bereich fester Wände die entscheidende Rolle und die Strömungen werden als Grenzschichtströmungen bezeichnet [12]. 8.3.4 Spezielle Lösungen für laminare Strömungen
(8-59)
Aus Kombinationen lassen sich nun weitere Kennzahlen ableiten. Aus dem Quotienten von Péclet-Zahl und Reynolds-Zahl folgt die Prandtl-Zahl Pr =
8.3.3 Lösungseigenschaften der Navier-Stokes’schen Gleichungen
Kartesische Koordinaten
Für eine stationäre, eindimensionale, ebene und ausgebildete Spaltströmung ohne äußeres Kraftfeld mit u = u(y), v = w = 0, p = p(x) folgt aus den NavierStokes’schen Gleichungen d2 u 1 dp . = · η dx dy2
(8-60)
als Verhältnis der molekularen Transportkoeffizienten für Impuls und Wärme. Der Auftriebsbeiwert (8-42) und der Widerstandsbeiwert (8-43) bei Umströmungsproblemen sind ebenfalls dimensionslose Größen. Die Kennzahlen bilden die Grundlage der Ähnlichkeitsgesetze und Modellregeln der Strömungsmechanik. In der Regel wird man sich auf die jeweils dominierenden Kennzahlen beschränken. Grundlagen und Anwendungen sind in [11] ausführlich dargestellt.
(8-61)
Die allgemeine Lösung dieser Gleichung lautet u(y) =
1 dp y2 · + C1 y + C2 . η dx 2
(8-62)
Couette-Strömung. Mit den Randbedingungen u(0) = 0, u(h) = U und p = const folgt die lineare Geschwindigkeitsverteilung in Bild 8-15a zu u(y) y = . (8-63) U h
E161
E162
E Technische Mechanik / Mechanik fester Körper
Aus der Energiegleichung (8-51) folgt die Lösung für die Temperaturverteilung T (y) = −
U 2 y2 η + C1 y + C2 . · 2 · a c p h 2
(8-64)
Mit den Randbedingungen T (0) = T 1 , T (h) = T 2 resultiert die Temperaturverteilung νU 2 y # T (y) − T 1 y y$ · = + 1− T2 − T1 h ac p (T 2 − T 1 ) 2h h y # y$ y 1− . = + Pr · Ec · (8-65) h 2h h Bild 8-15b zeigt Temperaturverteilungen für verschiedene Werte Pr · Ec [12]. Poiseuille-Strömung. Mit den Randbedingungen u(0) = 0, u(h) = 0 und dem Druckverlauf dp/dx = −Δp/l folgt die Geschwindigkeitsverteilung in Bild 8-16 zu u(y) −1 Δp 1 h2 y2 y = · · · − U η l U 2 h2 h # y y$ (8-66) =4 1− . h h U ist die Geschwindigkeit in Spaltmitte bei y = h/2. Der Volumenstrom V˙ ist für einen Kanal mit der Breite b "h 2 ˙ (8-67) V = b u(y) dy = bhU = bhum , 3 0
mit um = (2/3)U als mittlerer Geschwindigkeit. Der Druckabfall Δp ist bei einem Kanal der Länge l und der Reynolds-Zahl Re = um h/ν: Δp =
2 l 24 u · . 2 m h Re
(8-68)
Bild 8-16. Poiseuille-Strömung, Geschwindigkeitsvertei-
lung
Die Geschwindigkeitsverteilungen der Couette- und Poiseuille-Strömung lassen sich direkt superponieren, da die zugrunde liegende Bewegungsgleichung (8-61) linear ist. Stokes’sches Problem. Für eine plötzlich bewegte, in der x-Ebene unendlich ausgedehnte Platte lässt sich eine zeitabhängige Ähnlichkeitslösung angeben. Mit den Voraussetzungen u = u(y, t), v = w = 0 und damit p = const sowie den Anfangs- und Randbedingungen t 0: u(y, t) = 0 t > 0: u(0, t) = U
u(∞, t) = 0
√ lautet die Lösung: y/ " νt 1 u(y, t) 1 =1− √ exp − ξ2 dξ U 4 π 0 y = 1 − erf √ (8-69) . 2 νt In Bild 8-17 ist diese Geschwindigkeitsverteilung dargestellt. Die Dicke der mitgenommenen Schicht √ bis u/U = 0,01 ist y = δ ≈ 4 νt, sie wächst mit der Wurzel aus der Zeit.
Zylinderkoordinaten
Wir legen die Navier-Stokes’schen Gleichungen mit den Geschwindigkeitskomponenten u, v, w in r-, ϕund z-Richtung zugrunde [9].
Bild 8-15. Couette-Strömung. a Geschwindigkeitsvertei-
lung, b Temperaturverteilung
Rohrströmung. Für die eindimensionale Strömung folgt mit w(r), u = v = 0 und dp/dz = −Δp/l = const die Geschwindigkeitsverteilung r2 Δp R2 · 1− 2 w(r) = l 4η R 2 r =W 1− 2 . (8-70) R
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Bild 8-18. Rohrströmung, Verteilung der Geschwindigkeit
und Schubspannung
Bild 8-17. Stokes’sches Problem, Geschwindigkeitsvertei-
lung
A=
Für den Volumenstrom V˙ folgt damit "R V˙ = 2π 0 2
(8-71)
wobei die mittlere Geschwindigkeit wm = (1/2)W der halben Maximalgeschwindigkeit entspricht. Der Druckabfall Δp ist Δp =
8ηlwm 2 l = wm λ 2 2R R2
mit wm D 64 , Re = . (8-72) Re ν Aus (8-70) folgt für die Schubspannungsverteilung λ=
τ(r) = −η
W dw = 2 2r . dr R
ω2 R22 − ω1 R21 R22 − R21
,
B=
R21 R22 (ω1 − ω2 ) R22 − R21
Die Schubspannungsverteilung ist dabei dv v 2B τ(r) = −η − =η 2 . dr r r
π Δp R4 · w(r) · r · dr = · 8 l η
= πR wm ,
Mit den Randbedingungen v(R1 ) = ω1 R1 und v(R2 ) = ω2 R2 ergeben sich die Konstanten A und B zu .
(8-75)
Die Verteilung der Geschwindigkeit und der Schubspannung im Spalt ist in Bild 8-19 bei gegebenen Randbedingungen dargestellt. In radialer Richtung gilt die Beziehung dp/dr = · v2 /r, aus der durch Integration die Druckverteilung p(r) folgt: 2 A 2 r p(r) = p(R1 ) +
(r − R21 ) + 2AB ln 2 R1 ⎞⎤ ⎛ 2 ⎜ ⎟ ⎥ B ⎜1 1 ⎟⎥ + ⎜⎜⎝ 2 − 2 ⎟⎟⎠⎥⎥⎦ . (8-76) 2 R1 r
(8-73)
In Bild 8-18 ist die Verteilung der Geschwindigkeit w(r) und der Schubspannung τ(r) dargestellt. Strömung zwischen zwei rotierenden Zylindern. Für die stationäre rotationssymmetrische Zylinderspaltströmung mit v(r), u = w = 0, p(r) folgt die allgemeine Lösung für die Geschwindigkeitsverteilung in Umfangsrichtung: v(r) = Ar +
B . r
(8-74)
Bild 8-19. Zylinderspaltströmung, Geschwindigkeits- und Schubspannungsverteilung
E163
E164
E Technische Mechanik / Mechanik fester Körper
Für das längenbezogene Drehmoment am inneren Zylinder gilt: M1 = 4πηB .
(8-77)
Das am äußeren Zylinder angreifende Drehmoment ist gleich groß und wirkt in der entgegengesetzten Richtung. Als Grenzfälle ergeben sich aus (8-74) für R2 → ∞, v(r → ∞) = 0 der Potenzialwirbel mit v(r) = B/r und für R1 → 0 folgt die Starrkörperrotation mit v(r) = Ar. Bild 8-21. Fallende Kugel im Schwerefeld
Kugelkoordinaten
Die folgenden Lösungen gelten nur für den Grenzfall kleiner Reynolds-Zahlen Re < 1. Stokes’sche Kugelumströmung. Für die translatorische Bewegung einer festen Kugel durch ein viskoses Medium mit der Geschwindigkeit U ergibt sich aus dem Geschwindigkeits- und Druckfeld die Widerstandskraft [12] FW = 6πηRU.
(8-78)
Für die Umströmung einer Fluidkugel nach Bild 8-20 mit der Dichte und der Viskosität η gilt nach [13] die erweiterte Beziehung für die Widerstandskraft: FW = 6πηRU
2η + 3η . 3η + 3η
(8-79)
Beispiel: Fallgeschwindigkeit einer Kugel. Im Schwerefeld stehen nach Bild 8-21 Auftriebskraft, Gewichtskraft und Widerstandskraft bei einer stationären Bewegung im Gleichgewicht: FA − FG + FW = 0. Mit FA = (4/3)πR3 g, FG = (4/3)πR3 g und FW = 6πηRw nach (8-78) folgt die Fallgeschwindigkeit w = (2/9)( − )R2 g/η.
Sind die Dichten der Kugel und der Flüssigkeit bekannt, so lässt sich über die Messung dieser Fallgeschwindigkeit w die Viskosität η ermitteln. Beispiel: Steiggeschwindigkeit einer Gasblase. Unter der Voraussetzung und η η folgt über das Gleichgewicht zwischen Auftriebskraft FA und Widerstandskraft FW nach (8-79) die Steiggeschwindigkeit w = (1/3)gR2/ν. 8.3.5 Turbulente Strömungen
Mit wachsender Reynolds-Zahl gehen die wohlgeordneten laminaren Schichtenströmungen in irreguläre turbulente Strömungen über. Dem molekularen Impulsaustausch überlagert sich ein zusätzlicher Transportprozess durch die makroskopische Turbulenzbewegung. Bei der Rohrströmung in Bild 8-18 vollzieht sich dieser Umschlag für Reynolds-Zahlen Re 2320. Die Beschreibung turbulenter Strömungen geschieht nach Reynolds mit der Zerlegung der instationären Geschwindigkeitskomponenten, z. B. u(x, y, z, t) in einen zeitlichen Mittelwert u¯ (x, y, z) und eine Schwankungsgröße u (x, y, z, t) nach Bild 8-22: u(x, y, z, t) = u¯ (x, y, z) + u (x, y, z, t) .
(8-80)
Der zeitliche Mittelwert am festen Ort ist definiert durch "T 1 u¯ (x, y, z) = u(x, y, z, t) dt , (8-81) T 0
Bild 8-20. Stromfeld einer umströmten Fluidkugel
Dabei ist T so groß gewählt, dass die Zeitabhängigkeit für u¯ entfällt. Damit sind die zeitlichen Mittel-
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Bild 8-22. Turbulente Strömung, zeitabhängiger Geschwindigkeitsverlauf Bild 8-23. Mischungswegkonzept nach Prandtl
werte der Schwankungsgeschwindigkeiten Null. u = v = w = 0 . Die Intensität der Turbulenz wird durch den Turbulenzgrad T u charakterisiert. 1 2 (u + v 2 + w 2 ) 3 Tu = . (8-82) u2 + v2 + w2 Das Einsetzen von (8-80) in die Navier-Stokes’schen Gleichungen führt zu den Reynolds’schen Gleichungen. Die Kontinuitätsgleichung ist auch für die Mittelwerte gültig: ∂u ∂v ∂w + + = 0. ∂x ∂y ∂z
(8-83)
Die Impulsbilanz liefert in x-Richtung ohne Massenkraft f x nach [14]: du ∂p ∂ ∂u
=− + η − u 2 dt ∂x ∂x ∂x ∂ ∂u + η − u v ∂y ∂y ∂ ∂u + (8-84) η − u w . ∂z ∂z Die Schwankungsgrößen führen dabei zu den turbulenten Scheinspannungen − u 2 , − u v , − u w .
(8-85)
Die allgemeine Betrachtung ergibt den Reynolds’schen Spannungstensor. Diese Größen werden
über Turbulenzmodelle und Transportgleichungen für die Turbulenzbewegung ermittelt [15]. Als einfaches Turbulenzmodell gilt der Prandtl’sche Mischungswegansatz. Das Konzept ist in Bild 8-23 für eine turbulente Hauptströmung in x-Richtung dargestellt. In positiver y-Richtung erfährt ein Fluidelement bei einem Mischungsweg l1 eine Schwankungsgeschwindigkeit u = −l1 · du/dy. Aus Kontinuitätsgründen gilt v = l2 · du/dy. Für die Bewegung in negativer y-Richtung gilt ein analoges Verhalten. Die Reynolds’sche scheinbare Schubspannung folgt damit zu 2 2 du 2 du τ = − u v = l1 l2 = l . (8-86) dy dy Für die gesamte Schubspannung gilt 2 du du τtot = η + l2 . dy dy
(8-87)
Die Integration von (8-87) führt zur Geschwindigkeitsverteilung turbulenter Strömungen in der Nähe fester Wände. Mit der Wandschubspannungsgeschwindigkeit uτ = τW / folgt für die viskose Unterschicht mit l → 0 u(y) yuτ = y+ , = uτ ν
y+ < 5 .
(8-88)
Außerhalb dieser Schicht dominiert der Anteil (8-86). Mit der Annahme von Prandtl, dass τtot = τW = const und l = κy mit κ = const ist, erhält man durch Integration u(y) 1 = ln y+ + C . uτ κ
(8-89)
E165
E166
E Technische Mechanik / Mechanik fester Körper
mittelten Geschwindigkeit wm und der maximalen Geschwindigkeit w gilt der Zusammenhang wm = 0,816W. Der Gültigkeitsbereich von (8-90) wird für Re > 105 verlassen, da n im Exponenten mit wachsender Reynolds-Zahl zunimmt. 8.3.6 Grenzschichttheorie
Bild 8-24. Geschwindigkeitsverteilung nahe fester Wände
Aus dem Experiment folgen für die Konstanten die sog. universellen Werte κ = 0,4 und C = 5,5. Diese Gesetzmäßigkeit gilt für y+ > 30 außerhalb der viskosen Unterschicht und einem Übergangsbereich. In Bild 8-24 ist die Geschwindigkeitsverteilung in halblogarithmischer Darstellung über dem Wandabstand aufgetragen. Bei sehr großen Wandabständen y+ > 103 schließt sich die freie Turbulenz an. Turbulente Rohrströmung. Mit zunehmender Reynolds-Zahl Re = wm D/ν > 2320 wird die Verteilung der zeitlich gemittelten Geschwindigkeit w(r) rechteckförmiger (Bild 8-25). Folgender Potenzansatz hat sich zur Beschreibung bewährt: # r $1/n = 1− R W
w(r)
mit n = 7 .
Bei sehr großen Reynolds-Zahlen, Re = u∞ l/ν 1, ist der Reibungseinfluss in der Grenzschicht dominant. Aufgrund der Haftbedingung an der Körperoberfläche erfolgt der Geschwindigkeitsanstieg von Null auf den Wert der Außenströmung in dieser Grenzschicht der Dicke δ. Für eine stationäre ebene Strömung ohne Massenkraft folgen aus der Kontinuitätsgleichung und den Navier-Stokes’schen Gleichungen für δ l die Prandtl’schen Grenzschichtgleichungen [12]: ∂u ∂v + =0, ∂x ∂y ∂u 1 dp ∂2 u ∂u =− · +ν 2 . u +v ∂x ∂y
dx ∂y
(8-92)
Der Druck p(x) in der Grenzschicht wird durch die Außenströmung aufgeprägt. Über die BernoulliGleichung folgt der Zusammenhang mit der Geschwindigkeit U der Außenströmung zu dU 1 dp =U . − ·
dx dx
(8-90)
Bei diesem Gesetz ist die Wandschubspannung vom Rohrradius unabhängig. Die turbulente Strömung ist durch die lokalen Eigenschaften des Stromfeldes bestimmt. Zwischen der über den Rohrquerschnitt ge-
(8-91)
Impulssatz der Grenzschichttheorie
Die integrale Erfüllung der Grenzschichtgleichungen im Bereich 0 y δ führt zu dem Impulssatz d 2 τW dU (U δ2 ) + δ1 U = . dx dx
Dabei ist δ1 = cke, δ2 =
.∞ 0
Bild 8-25. Geschwindigkeitsverteilung in turbulenter Rohr-
strömung
.∞ (1 − u/U) dy die Verdrängungsdi0
u/U(1 − u/U) dy die Impulsverlustdicke
und τW die Wandschubspannung. Analog dazu lässt sich ein Energiesatz für die Grenzschicht herleiten. Der Impulssatz bildet die Grundlage von Näherungsverfahren zur Berechnung von Grenzschichten [16].
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Reibungswiderstand der Plattengrenzschicht
Bei der Umströmung einer ebenen Platte ist der Druck p = const und damit ohne Einfluss. Es stellt sich bei laminarer Strömung die in Bild 8-26 dargestellte Grenzschicht ein. Aus der analytischen Lösung der Gleichungen (8-91), (8-92) folgt für die Platte der Länge l die Grenzschichtdicke mit Re = u∞ l/ν: δ 3,46 = √ . l Re
(8-93)
Der lokale Reibungsbeiwert cf ist mit Re x = u∞ x/ν cf =
τW 0,664 = √ . 1 2 Re x
u 2 ∞
(8-94)
Bei einfacher Benetzung folgt durch Integration der Reibungswiderstand in normierter Form für die Platte der Länge l und Breite b: 1,328 FW cF = 1 2 = √
u bl Re ∞ 2
(Blasius).
(8-95)
Für sehr große Reynolds-Zahlen, Re > 5 · 105 , liegt eine turbulente Grenzschichtströmung vor. Mit dem Potenzgesetz (8-90) für die Geschwindigkeitsverteilung ergeben sich für die turbulente Plattengrenzschicht bei einfacher Benetzung für hydraulisch glatte Oberflächen 0,37 δ = 1/5 , l Re τW 0,0577 cf = = , 1 2 Re1/5 x
u∞ 2 FW 0,074 cF = = 1 2 Re1/5
u∞ bl 2 (5 · 105 < Re < 107 ) (Prandtl) .
Bild 8-26. Laminare Plattengrenzschicht
(8-96) (8-97)
(8-98)
Auf der Basis des logarithmischen Wandgesetzes gilt für einen größeren Reynoldszahlenbereich [12]: cF =
0,455 1,700 − 2,58 Re (lg Re)
(8-99)
(Prandtl-Schichtung) Der zweite Anteil berücksichtigt den laminarturbulenten Übergang mit der kritischen ReynoldsZahl Rekrit = 5 · 105 . Für die vollkommen turbulent raue Plattenströmung gilt −2,5 l cF = 1,89 + 1,62 lg kS l 2 6 < 10 . 10 < kS
(8-100)
Die Rauheit ist dabei durch die äquivalente Sandkornrauheit kS charakterisiert. Strömungsablösung
Bei der Umströmung von Körpern wird der Grenzschicht im Bereich verzögerter Strömung ein positiver Druckgradient dp/dx > 0 aufgeprägt. Mit der Grenzschichtgleichung (8-92) ergibt sich auf dem Profil der Zusammenhang zwischen Druckgradient und Krümmung des Geschwindigkeitsprofils: 2 ∂ u 1 dp · =ν .
dx ∂y2 w Bild 8-28 zeigt eine laminare Profilumströmung mit Ablösung und den dazugehörigen Druckverlauf. Im Dickenmaximum ist dp/dx = 0, und auf der Oberfläche tritt ein Wendepunkt im Geschwindigkeitsprofil auf. Mit steigendem Druckgradienten wandert dieser Wendepunkt in die Grenzschicht, bis an der Wand eine vertikale Tangente im Geschwindigkeitsprofil auftritt. In diesem Ablösepunkt ist die Wandschubspannung τW = 0. Es kommt stromab zu einer Rückströmung. Die der Potenzialtheorie entsprechende Druckverteilung in Bild 8-27 wird dabei erheblich verändert. Hierdurch tritt neben dem Reibungswiderstand durch die unsymmetrische Druckverteilung ein Druckwiderstand auf.
E167
E168
E Technische Mechanik / Mechanik fester Körper
Bild 8-28. Durchströmter Kontrollraum
Werten für p und w über den Querschnitten folgt für den Kontrollraum nach Bild 8-29 in x-Richtung ( = const): Bild 8-27. Profilumströmung mit Ablösung
w21 A1 + p1 A1 − w22 A2 − pa A1 + FH = 0 . (8-103)
8.3.7 Impulssatz
Mit dem Impulssatz sind globale Aussagen über Strömungsvorgänge in einem Kontrollraum nach Bild 8-28 möglich. Die zeitliche Änderung des Impulses ist gleich der Resultierenden der äußeren Kräfte: " d dI =
w dV dt dt " = V
=
V
∂ w dV + ∂t
Mit der Kontinuitätsbedingung w1 A1 = w2 A2 wird ⎛ ⎞ A22 ⎟⎟⎟ ⎜⎜ 2⎜ (8-104) FH = w2 ⎝⎜A2 − ⎠⎟ + (pa − p1 )A1 . A1 Aus der Bernoulli-Gleichung folgt bei reibungsfreier Strömung 1 2
w2 − w21 2 ⎛ ⎞ A22 ⎟⎟⎟ 1 2 ⎜⎜⎜ = w2 ⎜⎝1 − 2 ⎟⎠ . 2 A1
p1 − pa =
"
w(w · n) dA A
FA .
(8-101)
Diese Bilanzaussage ist für reibungsfreie und reibungsbehaftete Strömungsvorgänge gültig. Mit der Beschränkung auf stationäre Strömungen braucht die Integration nur über die Oberfläche A des Kontrollraumes ausgeführt werden. Der Impulssatz beschreibt das Gleichgewicht zwischen Impuls-, Oberflächenund Massenkräften: FA = 0 . (8-102) FI + . Die Impulskraft ist hierin FI = − w(w · n) dA A . und die Druckkraft FD = − pn dA.
Die Haltekraft ergibt sich dann zu 2 A1 1 FH = − w21 A1 −1 . 2 A2
(8-105)
(8-106)
Die Haltekraft FH ist in negative x-Richtung gerichtet. Die Schrauben werden auf Zug beansprucht. Die Kraft von der Strömung auf den Diffusor wirkt in Strömungsrichtung. Dieses Resultat ist für den Diffusor mit A2 > A1 und für die Düse mit A2 < A1 gültig.
A
8.3.8 Anwendungsbeispiele Haltekraft von Diffusor und Düse
Gesucht ist die Haltekraft FH , die am Diffusor über die Schrauben angreift. Mit p2 = pa und konstant
Bild 8-29. Diffusorströmung. a Kontrollraum, b Kräftebi-
lanz
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Durchströmen eines Krümmers
Schubkraft eines Strahltriebwerkes
Gesucht ist die Haltekraft FH am frei ausblasenden Krümmer in Bild 8-30a. Ohne Massenkraft wird aus dem Impulssatz (8-102):
Die Impulsbilanz wird auf den Kontrollraum in Bild 8-31 angewandt. Auf den Kontrollflächen vor und hinter dem Triebwerk ist der Druck p = p∞ . Der Fangquerschnitt A∞ wird durch den Antrieb auf den Strahlquerschnitt AS verringert. Die Geschwindigkeit im Strahl wird von w∞ auf wS erhöht. Aus der Massenstrombilanz außerhalb des Triebwerkes folgt die Massenzufuhr durch die seitlichen Kontrollflächen
F11 + F12 + FD1 + FD2 + FD3,4 + FH = 0 . (8-107) Mit konstanten Geschwindigkeiten in den beiden Querschnitten folgen die Impulskräfte FI1 = −n1 w21 A1 ,
FI2 = −n2 w22 A2 .
(8-108)
Die Druckkräfte lassen sich mit der Tatsache, dass ein konstanter Druck auf eine geschlossene Fläche keine resultierende Kraft ausübt, vereinfachend zusammenfassen. Mit p2 = pa folgt FD = FD1 + FD2 + FD3,4 ⎧ " " ⎪ ⎪ ⎪ ⎨ = −⎪ (p − p ) n dA + pa n dA 1 a ⎪ ⎪ ⎩ A1 A1 ⎫ ⎪ " " ⎪ ⎪ ⎪ ⎬ + pa n dA + pa n dA⎪ ⎪ ⎪ ⎪ ⎭ A2
"
A3,4
(p1 − pa ) n dA .
=−
m ˙ = ∞ w∞ (A∞ − AS ) .
(8-110)
Damit verbunden ist eine Impulskraft in x-Richtung (M = Mantelfläche): " FI,x = − wx (w · n) dA M
˙ = ∞ w2∞ (A∞ − AS ) . = w∞ m
(8-111)
Die Impulsbilanz ergibt damit
∞ w2∞ A + ∞ w2∞ (A∞ − AS ) − S w2S AS − ∞ w2∞ (A − AS ) + FH = 0.
(8-112)
Im Gleichgewicht folgt für die Haltekraft
(8-109)
FH = S w2S AS − ∞ w2∞ A∞ = m ˙ T (wS − w∞ ) . (8-113)
Aus dem Kräftedreieck in Bild 8-30b resultiert die Haltekraft FH durch vektorielle Addition der beiden Impulskräfte FI1 und FI2 sowie der resultierenden Druckkraft FD . Die Haltekraft FH wird von den Schrauben durch Zug- und Schubkräfte aufgenommen.
Der Massenstrom im Triebwerk ist m ˙ T = S wS AS =
∞ w∞ A∞ . Der Schub S ist der Haltekraft FH entgegengerichtet: S = −FH . Aus der Beziehung (113) sind die Möglichkeiten zur Schubsteigerung zu erkennen.
A1
Leistung einer Windenergieanlage
Durch Verzögerung der Geschwindigkeit wird mit dem Windrad in Bild 8-32 dem Luftstrom Energie
Bild 8-30. Durchströmter Krümmer. a Kräfte am Kontrollraum, b Kräftedreieck
Bild 8-31. Kontrollraum beim Flugtriebwerk
E169
E170
E Technische Mechanik / Mechanik fester Körper
entzogen. Die Massenbilanz für die den Propeller einschließende Stromröhre liefert
w∞ A1 = w3 A3 = wS A5 = m ˙
(8-114)
Zwischen den Querschnitten 1 und 2 sowie 4 und 5 ist die Bernoulli-Gleichung gültig. Mit der Voraussetzung A2 ≈ A3 ≈ A4 folgt w2 ≈ w3 ≈ w4 und damit die Druckdifferenz
(8-115) p2 − p4 = Δp = (w2∞ − w2S ). 2 Für den Kontrollraum zwischen den Querschnitten A1 und A5 folgt mit dem Impulssatz: FH = w2∞ A1 − w2S A5 = m(w ˙ ∞ − wS ) .
(8-116)
Für den Kontrollraum zwischen A2 und A4 gilt nach dem Impulssatz:
2 (8-117) FH = (p2 − p4 )A3 = w∞ − w2S A3 . 2 Durch Gleichsetzen der Ergebnisse für die Haltekraft folgt die Geschwindigkeit im Querschnitt A3 zu 1 w3 = (w∞ + wS ) . 2
(8-118)
Die Leistung der Anlage ergibt sich zu 1 P = FH w3 = A3 w2∞ − w2S (w∞ + wS ) (8-119) 4 1 mit dem Maximalwert für wS = w∞ : 3 8 Pmax =
A3 w3∞ . (8-120) 27 Bezogen auf den Energiestrom durch den Propeller folgt die Leistungskennzahl (Betz-Zahl) Pmax 16 = 0,593 . = (8-121) 1 27
A3 w3∞ 2 Diese Betz-Zahl cB dient zur Charakterisierung von Windenergieanlagen. cB =
Beispiel: Welche Leistung liefert eine Windenergieanlage mit einem Rotor mit D = 82 m bei einer Windgeschwindigkeit w∞ = 10 m/s = 36 km/h? Aus (8-121) folgt mit der Dichte von Luft
= 1,05 kg/m3 Pmax =
πD2 3 · w cB = 1887 kW . 2 4 ∞
Diese maximale Leistung variiert also mit der 3. Potenz der Windgeschwindigkeit. Ist die Windgeschwindigkeit nur halb so hoch, so ist Pmax = 1887/23 = 236 kW. Bei ausgeführten Anlagen werden diese Werte je nach Geschwindigkeitsbereich bis zu 85% erreicht.
8.4 Druckverlust und Strömungswiderstand 8.4.1 Durchströmungsprobleme
Bei hydraulischen Problemen besteht die Hauptaufgabe in der Ermittlung des Druckverlustes durchströmter Leitungselemente wie gerader Rohre, Krümmer und Diffusoren. Aus Dimensionsbetrachtungen folgt für den Druckverlust bei ausgebildeter Strömung in geraden Rohren: Δpv =
1 2 l
w λ. 2 mD
(8-122)
Der Koeffizient λ ist die sog. Rohrwiderstandszahl. Für die weiteren Rohrleitungselemente gilt Bild 8-32. Windenergieanlage, Kontrollflächen sowie Druck- und Geschwindigkeitsverlauf
Δpv =
1 2
w ζ . 2 m
(8-123)
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Mit der Druckverlustzahl ζ werden die durch Sekundärströmungen hervorgerufenen Zusatzdruckverluste erfasst. Bei turbulenter Strömung ist ζ = const und der Druckverlust proportional zum Quadrat der mittleren Geschwindigkeit wm . Strömungen in Rohren mit Kreisquerschnitt
Die Strömungsform in Kreisrohren ist von der Reynolds-Zahl Re = wm D/ν abhängig, wobei für Re < 2320 laminare und für Re > 2320 turbulente Strömung auftritt. Der Reibungseinfluss wird durch die Rohrwiderstandszahl λ erfasst, die von der Reynolds-Zahl Re und der relativen Wandrauheit k/D abhängen kann. Es gelten die Beziehungen [2]: Laminare Strömung: 64 (Re < 2 320) Re (Hagen-Poiseuille) .
λ=
(8-124)
Turbulente Strömung: a) hydraulisch glatt λ = λ(Re) 0,3164 (2,320 < Re < 105 ) λ = √4 Re (Blasius) √ 1 √ = 2,0 lg(Re λ) − 0,8 λ (105 < Re < 3 · 106 ) (Prandtl) b Übergangsgebiet λ = λ(Re, k/D) k 2,51 1 + √ = −2,0 lg √ D · 3,715 Re λ λ (Colebrook)
(8-125)
für das globale Strömungsverhalten wichtig. Bei einer hydraulisch glatten Wand werden die Wandrauheiten von der viskosen Unterschicht überdeckt. Im Übergangsbereich sind beide von gleicher Größenordnung. Bei vollkommen rauer Wand sind die Rauheitserhebungen wesentlich größer als die Dicke der viskosen Unterschicht und bestimmen damit die Reibung der turbulenten Strömung. In Bild 8-33, dem sog. Moody-Colebrook-Diagramm, ist die Rohrwiderstandszahl λ(Re, k/D) für alle Bereiche der Rohrströmung als Diagramm dargestellt. Anhaltswerte für technische Rauheiten k sind in Bild 8-34 für verschiedene Werkstoffe angegeben. Genaue Daten sind von der Bearbeitung und dem Betriebszustand des Rohres abhängig. Mit dem Rohrdurchmesser lässt sich dann die relative Rauheit k/D bestimmen. Strömungen in Leitungen mit nichtkreisförmigen Querschnitten
Die verschiedenen Querschnittsformen werden durch den hydraulischen Durchmesser dh charakterisiert, der sich aus der Querschnittsfläche A und dem benetzten Umfang U ergibt: dh =
(8-126)
4A . U
(8-129)
In Bild 8-35 sind einige Beispiele zusammengestellt [17].
(8-127)
c) vollkommen rau λ = λ(k/D) 0,25 λ= # 3,715 D $2 lg k # D $$ D # Re > 400 lg 3,715 . k k
(8-128)
Bei der turbulenten Rohrströmung ist die Dicke der viskosen Unterschicht und die Rauheit der Rohrwand
Bild 8-34. Wandrauheiten verschiedener Materialien
E171
E172
E Technische Mechanik / Mechanik fester Körper
Bild 8-33. Rohrwiderstandszahl nach Moody/Colebrook [2]
Bei laminarer Strömung ist die Rohrwiderstandszahl λ von der Geometrie abhängig. Die Geometrie beeinflusst die Geschwindigkeitsverteilung und damit die Wandreibung und den Druckverlust. Die analytische Berechnung von λ ist für elementare Geometrien möglich [2, 18]. In Bild 8-36 ist für laminare Strömung das Produkt λ · Re mit Re = wm dh /ν für verschiedene Querschnittsformen dargestellt. Bei turbulenter Strömung in nichtkreisförmigen Querschnitten wird durch den turbulenten Austausch die Geschwindigkeitsverteilung vergleichmäßigt [19]. Der Reibungseinfluss ist damit auf den Wandbereich beschränkt und die Form der Geometrie deshalb für den Druckverlust von untergeordneter Bedeutung. Die kritische Reynolds-Zahl ist jedoch kleiner als beim Kreisrohr. Mit dem hydraulischen Durchmesser dh lassen sich die Verluste auf die Rohrströmung mit Kreisquerschnitt zurückführen. Für die Rohrwiderstandszahl λ gelten bei turbulenter Strömung damit die Beziehungen (8-125) bis (8-128) und das
Diagramm von Moody-Colebrook [2] in Bild 8-33. In einigen Fällen, wie z. B. beim Kreisring, genügt der hydraulische Durchmesser dh allein nicht zur Charakterisierung der Querschnittsform. Bei exzentrischer Anordnung kann sich der Widerstandsbeiwert erheblich ändern, bei maximaler Exzentrizität ergibt sich eine Abnahme von λ um ca. 60% [46]. Druckverluste bei der Rohreinlaufströmung
Durch die Umformung des Geschwindigkeitsprofiles tritt in der Einlaufstrecke ein erhöhter Druckabfall auf. In Bild 8-37 ist zu sehen, dass die Strömung in Rohrmitte beschleunigt werden muss und zusätzlich an der Wand über die Länge l ein größerer Geschwindigkeitsgradient vorliegt. Strenggenommen besteht die Einlaufstrecke aus zwei Abschnitten. Im ersten wachsen die Grenzschichten bis zur Achse, im zweiten wird anschließend das ausgebildete Geschwindigkeitsprofil erzeugt.
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Bei laminarer Strömung folgt für die Zusatzdruckverlustzahl und die Länge der Einlaufstrecke [20]: ζ = 1,08,
l = 0,06 Re . D
(8-130)
Bei turbulenter Strömung gleicht das Geschwindigkeitsprofil bei ausgebildeter Strömung mehr der Rechteckform, sodass nur ein geringer Zusatzverlust auftritt. Hierbei gilt nach [20]: ζ = 0,07,
l = 0,6 Re1/4 . D
(8-131)
Druckverluste bei unstetigen Querschnittsänderungen
Eine plötzliche Rohrerweiterung nach Bild 8-38a wird als Carnot-Diffusor bezeichnet. Mit der Kontinuitätsbedingung und dem Impulssatz folgt für die Druckerhöhung von 1 → 2 [1]: p2 − p1 A1 A1 =2 (8-132) 1− . Cp = 1 2 A2 A2
w 2 1
Bild 8-36. Rohrwiderstandszahl für verschiedene Quer-
schnitte bei laminarer Strömung
Im Idealfall liefert die Bernoulli-Gleichung von 1 → : 2 2 A1 p2 id − p1 C p id = =1− . (8-133) 1 2 A2
w1 2 Die Druckverlustzahl folgt aus der Differenz zwischen idealem und realem Druckanstieg zu ζ1 =
2 Δpv A1 = C p id − C p = 1 − . 1 A2 2
w1 2
(8-134)
Der Maximalwert ζ1 = 1 wird beim Austritt ins Freie, A2 → ∞ erreicht. Die verlustbehaftete Energieumsetzung ist bei l/D = 4 nahezu abgeschlossen. Bei der plötzlichen Rohrverengung in Bild 8-38b kommt es zu einer Strahleinschnürung, die auch als Strahlkontraktion bezeichnet wird. Die wesentlichen Verluste treten durch die Verzögerung der Geschwindigkeit zwischen den Querschnitten S und 2 auf. Mit
Bild 8-35. Querschnittsform und hydraulischer Durchmes-
ser
Bild 8-37. Rohreinlaufströmung
E173
E174
E Technische Mechanik / Mechanik fester Körper
Bild 8-38. Querschnittsänderung. b Rohrverengung
a Carnot-Diffusor,
der Kontinuitätsbedingung, dem Impulssatz und der Bernoulli-Gleichung von S → 2 folgt die Druckverlustzahl bezogen auf Querschnitt : 1 2 2 w22 ws A21 A2 Δpv ζ1 = = 2 −1 = 2 −1 . 1 w1 w2 A2 As
w21 2 (8-135) Bezogen auf den Querschnitt 2 ist die Druckverlustzahl 2 A2 Δpv = −1 . (8-136) ζ2 = 1 2 AS
w2 2 Das Flächenverhältnis AS /A2 = μ wird als Kontraktionszahl bezeichnet. Bild 8-39a zeigt die Abhängigkeit der Strahlkontraktion μ vom Flächenverhältnis A2 /A1 für die scharfkantige Rohrverengung [21]. Damit ist die Druckverlustzahl ζ2 = ζ2 (μ) bekannt. In Bild 8-39b sind die Druckverlustzahlen ζ1 der Rohrerweiterung und ζ2 der Rohrverengung in Abhängigkeit vom Durchmesserverhältnis d/D aufgetragen. Die Rohreinlaufgeometrie ergibt sich aus der Rohrverengung im Grenzfall d/D → 0. Die Strahlkontraktion μ ist nun allein von der Geometrie des Rohranschlusses abhängig. Bild 8-40 zeigt drei typische Fälle, wobei in Bild 8-40a durch die scharfe Kante Kontraktion durch Ablösung auftritt, in Bild 8-40b die Ablösung durch Abrundung verhindert wird und in Bild 8-40c die Strahlkontraktion durch den vorste-
Bild 8-39. Unstetige Querschnittsänderungen. a Strahlkon-
traktion μ, b Druckverlustzahlen ζ
Bild 8-40. Rohreinlaufgeometrien. a Scharfkantig, b abge-
rundet, c vorstehend
henden Einlauf verstärkt wird. Für die Kontraktion μ und die Druckverlustzahl ζ2 gilt [17]: Fall a b c
μ 0,6 0,99 0,5
ζ2 0,45 ≈0 ≈1
Druckverluste bei stetigen Querschnittsänderungen
Die primäre Aufgabe von Diffusoren ist die Druckerhöhung durch Verzögerung der Strömung. Die
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Strömungseigenschaften in einem Diffusor nach Bild 8-41a hängen von der Geometrie (Flächenverhältnis A2 /A1 , Öffnungswinkel α) und von der Geschwindigkeitsverteilung der Zuströmung ab [22]. Die reale normierte Druckerhöhung p2 − p1 (8-137) Cp = 1
w21 2 wird als Druckrückgewinnungsfaktor bezeichnet. Die Druckverlustzahl ergibt sich aus der Differenz zwischen idealer (8-133) und realer (8-137) Druckerhöhung zu: 2 Δpv A1 = C p id − C p = 1 − − Cp . ζ1 = 1 A2
w21 2 (8-138) Die Druckverlustzahl ζ1 resultiert bei Trennung von Öffnungswinkel und Querschnittsverhältnis aus der Beziehung 2 A1 . (8-139) ζ1 = k(α) 1 − A2 Für den Faktor k gelten nach experimentellen Untersuchungen [1, 2, 22, 23] als Mittelwerte: α k
5◦ 0,13
7,5◦ 0,14
10◦ 0,16
15◦ 0,27
20◦ 0,43
40◦ 1,0
180◦ 1,0
Grenzwerte der Druckverlustzahl sind durch die Rohrstömung (α = 0, ζ1 = 0) und den Austritt ins Freie (α = 180◦ , ζ1 = 1) gegeben. Bei einem Öffnungswinkel α = 40◦ wird bereits der Wert des entsprechenden Carnot-Diffusors erreicht. Im
Bereich 40◦ < α < 180◦ treten sogar noch höhere Verluste ζ1 > 1 auf, sodass hier der unstetige Übergang des Carnot-Diffusors mit geringeren Verlusten vorzuziehen ist. Optimale Diffusoren ergeben sich bei Öffnungswinkeln α von 5◦ bis 8◦ . In einer Düse (Bild 8-41b) ist die Umsetzung von Druckenergie in kinetische Energie nahezu verlustfrei möglich. Die Zusatzdruckverluste sind deshalb mit ζ1 = (0 . . . 0,075)
(8-140)
gering [20]. Druckverluste bei Strömungsumlenkung
Der Krümmer ist ein wesentliches Element zur Richtungsänderung von Rohrströmungen. In Bild 8-42a sind die Bezeichnungen der geometrischen Größen eingetragen. Zusatzdruckverluste sind auf Sekundärströmungen, Ablösungserscheinungen und Vermischungsvorgänge zum Geschwindigkeitsausgleich zurückzuführen. Der Einfluss der Krümmung und der Oberflächenbeschaffenheit auf die Druckverlustzahl ζ ist in Bild 8-42b für einen Rohrkrümmer mit ϕ = 90◦ dargestellt [23]. Bei kleinen Radienverhältnissen R/D steigen die Verluste stark an. Der Einfluss des Umlenkwinkels ϕ lässt sich über den Proportionalitätsfaktor k ϕ k
30◦ 0,4
60◦ 0,7
90◦ 1,0
120◦ 1,25
150◦ 1,5
180◦ 1,7
Bild 8-41. Stetige Querschnittsänderungen. a Diffusor,
Bild 8-42. Kreisrohrkrümmer. a Geometrie, b Druckver-
b Düse
lustzahlen
E175
E176
E Technische Mechanik / Mechanik fester Körper
Bild 8-43. Bauformen von Rechteckkrümmern
Bild 8-44. Kombinationen von Krümmern
mit ζ = kζ90◦ aus den Werten in Bild 8-42b ermitteln. Den Einfluss unterschiedlicher Bauarten zeigt Bild 8-43 für Krümmer mit Rechteckquerschnitt [24]. Die Druckverlustzahlen ζ gelten für Flachkantkrümmer mit dem Seitenverhältnis h/b = 0,5 und der Reynolds-Zahl Re = wm dh /ν = 105 . Die Strömung im Krümmer und damit die Umlenkverluste sind stark von der Bauform abhängig. Bei mehrfacher Umlenkung mit Krümmerkombinationen (Bild 8-44) treten erhebliche Abweichungen auf [24]. Je nach der Anordnung der Hochkantkrümmer (h/b = 2) sind die Gesamtverluste kleiner oder größer als die Summe der Einzelverluste mit ζ = 2 · 1,3 = 2,6. Wird zwischen beide Krümmer ein Rohr mit der Länge l > 6 dh zwischengeschaltet, werden die Kombinationseffekte vernachlässigbar. Druckverluste von Absperr- und Regelorganen
Bei Formteilen zur Durchflussänderung ändert sich der Widerstand je nach Bauform und Öffnungszustand um mehrere Größenordnungen [25]. Im Öffnungszustand ist die Druckverlustzahl ζ = (0,2 . . . 0,3) bei Drosselklappen und Schiebern, während bei Regelventilen bei entsprechender strömungstechnischer Ausführung Werte von ζ = 50 erreicht werden. Bei teilweiser Öffnung steigen die Verluste erheblich an, wie die Diagramme in Bild 8-45 zeigen. Druckverluste bei Durchflussmessgeräten
Normblenden, Normdüsen und Venturirohre in Bild 8-46a dienen zur Durchflussmessung [3]. Die
Bild 8-45. Druckverlustzahlen von Regelorganen. a Dros-
selklappe, b Ventil und Schieber
Druckverlustzahlen ζ2 bezogen auf den engsten Querschnitt D2 sind in Bild 8-46b über dem Durchmesserverhältnis D2 /D1 aufgetragen [2, 23]. Mit der Kontinuitätsbedingung folgt für die Druckverlustzahl ζ1 bezogen auf den Rohrquerschnitt: ζ1 = (A1 /A2 )2 · ζ2 . Für weitere Rohrleitungselemente wie Dehnungsausgleicher, Rohrverzweigungen und Rohrvereinigungen sowie Gitter und Siebe sind Druckverlustzahlen in [26, 27] angegeben.
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Bild 8-47. Strömungsanlage mit Rohrleitung
Bild 8-46. Durchflussmessgeräte. a Bauformen der Norm-
blende, Normdüse und Venturirohr; b Druckverlustzahlen
Beispiel: Rohrhydraulik. Welche Druckdifferenz p1 − p6 ist notwendig, damit sich in der Anlage nach Bild 8-47 ein Volumenstrom V˙ = 2 · 10−3 m3 /s einstellt? Gegeben: Strömungsmedium Wasser bei 20 ◦ C, = 998,4 kg/m3 , v = 1,012 · 10−6 m2 /s, Anlagengeometrie h = 7 m, Rohre hydraulisch glatt D1 = 30 mm, D2 = 60 mm, l1 = 50 m, l2 = 10. Zwei unterschiedliche Lösungswege sind durch eine mechanische auf Kräftebilanzen basierenden sowie einer energetischen Betrachtungsweise entlang der Stromfadenkoordinate s möglich. a) Mechanische Betrachtung: 1 → 2 reibungsfreie Strömung, Bernoulli-Glei1 1 chung p1 + w21 + g z1 = p2 + w22 + gz2 mit 2 2 den Voraussetzungen w1 = 0, z2 = 0 folgt die Druck1 differenz p1 − p2 = w22 − gz1 , 2 2 → 5 reibungsbehaftete Rohrströmung mit Verlustelementen, Impulssatz, Kontinuität, Hydrostatik, Reynolds-Zahlen: w2 D1 = 8,39 · 1040 ν 4 V˙ mit w2 = · 2 = 2,83 m/s , π D1 Re1 =
Re2 =
w4 D2 = 4,20 · 104 ν
mit w4 = w2
D21 D22
= 0,71 m/s .
In beiden Rohrabschnitten ist die Strömung turbulent. Die Rohrwiderstandszahlen folgen aus (8-125) 0,3164 zu: λ1 = √4 = 0,0186, λ2 = 0,022 1, DruckRe1 verlustzahlen für Rohreinlauf nach (8-131) ζE = 0,07, Krümmer mit R/D = 2 nach Bild 8-42 ζK = 0,14, Druckerhöhung im Carnot-Diffusor nach (8-132): 1 2 l1 p2 − p3 = w2 λ1 + ζE + 2 ζK + gz5 2 D1 1
w22 · 31,35 + gz5 2 1 A1 A1 2 p3 − p4 = − w2 · 2 1− 2 A2 A2 =
1 = − w22 · 0,375 2 p4 − p5 =
A2 l2 1 2 l2 1
w4 λ2 = w22 12 · λ2 2 D2 2 A 2 D2
1
w22 · 0,230 . 2 5 → 6 Freistrahl, Hydrostatik =
p5 − p6 = g (z6 − z5 ) . Zusammenfassung der Druckdifferenzen zwischen 1 und 6 ergibt mit z6 − z1 = h: p1 − p6 =
1
w22 · 31,20 + gh = 1,933 bar . 2
b) Energetische Betrachtung: Energiegleichung (10) für stationär durchströmtes System von 1 → : 6 1 1 p1 + w21 + gz1 = p6 + w26 + gz6 + Δpv . 2 2
E177
E178
E Technische Mechanik / Mechanik fester Körper
Mit der Voraussetzung konstanter Spiegelhöhe, d. h. w1 = 0, w6 = 0 folgt: p1 − p6 = g(z6 − z1 ) + Δpv . Die Druckverluste Δpv längs der Koordinate s setzen sich zusammen aus: Rohreinlauf
ΔpE =
Rohr mit l1
ΔpR1 =
Krümmer
ΔpK =
Carnot-Diffusor
1 l1
w22 λ1 2 D1 1
w22 2ζK 2
1
w22 ζ1 2 2 A1 mit ζ1 = 1 − nach (134) A2 ΔpC =
ΔpR2 =
Rohr mit l2
1
w22 ζE 2
Austritt in Behälter ΔpA =
1 l2
w24 λ2 2 D2 1
w24 ζA 2
mit ζA = 1 nach (134) ⎛ ⎜⎜ 1 l1 λ1 + 2 ζK + ζ1 Δpv = w22 ⎜⎝⎜ζE + 2 D1 ⎞ A21 ⎟⎟⎟ 1 2 l2 + 2· λ2 + 2 ζA ⎟⎠ = w2 · 31,20 . 2 A 2 D2 A2 A21
Damit folgt für die Druckdifferenz: p1 − p6 = gh +
1
w22 · 31,20 = 1,933 bar . 2
8.4.2 Umströmungsprobleme
Bei der Umströmung von Körpern, Fahrzeugen und Bauwerken tritt ein Strömungswiderstand auf. Der Gesamtwiderstand setzt sich aus Druck- und Reibungskräften zusammen, deren Anteile je nach Strömungsproblem variieren. Bild 8-48 zeigt die beiden Grenzfälle. Bei der quergestellten Platte (Bild 8-48a) tritt nur Druckwiderstand (Formwiderstand) auf. Die Strömung löst an den Plattenkanten
Bild 8-48. Plattenumströmung. a Druckwiderstand, b Rei-
bungswiderstand
ab, sodass sich hinter der Platte ein Rückströmgebiet bildet. Zur Struktur von Rückströmgebieten hinter Körpern unterschiedlicher Form gibt es neuere Untersuchungen [28]. Der Widerstand wird allein durch die Druckkräfte auf die Platte bestimmt. Bei der längs angeströmten Platte (Bild 8-48b) tritt nur Reibungswiderstand (Flächenwiderstand) auf. Bei allgemeinen Strömungsproblemen treten beide Anteile gleichzeitig auf, sodass der Widerstand von der Reynolds-Zahl der Anströmung abhängt. Berechnungsmöglichkeiten beschränken sich auf Stokes’sche Schichtenströmungen mit kleinen Reynolds-Zahlen und auf Grenzschichtprobleme, wobei die Grenzschichttheorie nur bis zur Ablösung gültig ist. Numerische Lösungsverfahren ermöglichen die Lösung spezieller Aufgaben. Für größere Reynolds-Zahlen sind experimentelle Untersuchungen unumgänglich. Neben dem Strömungswiderstand FW in Strömungsrichtung tritt oft eine durch Anstellung oder asymmetrische Körperform verursachte Auftriebskraft FA auf. Auch bei symmetrischen Querschnitten können im Bereich der kritischen Reynolds-Zahl durch Ablöseerscheinungen zeitlich veränderliche Auftriebskräfte auftreten [29]. Für die dimensionslosen Widerstands- und Auftriebsbeiwerte gilt: FW FA (8-141) cW = , cA = . 1 1 2 2
w A
w A 2 2 Hierbei ist ( /2)w2 = pdyn der dynamische Druck der Anströmung und A eine geeignete Bezugsfläche des umströmten Körpers in Strömungsrichtung bzw. senkrecht dazu. Eine umfangreiche Zusammenstellung von Widerstandsbeiwerten ist in [30] enthalten.
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Ebene Strömung um prismatische Körper
Bei der Umströmung des Kreiszylinders ist für kleine Reynolds-Zahlen, Re = wD/ν < 1, eine analytische Lösung bekannt [31]: cW =
8π , Re(2,002 − ln Re)
Re =
wD . ν
(8-142)
Für größere Reynolds-Zahlen liegen Resultate aus Messungen vor [7, 32]. In Bild 8-49 sind die Widerstandsbeiwerte cW bezogen auf die Fläche A = DL über der Reynolds-Zahl Re aufgetragen. Im Bereich der kritischen Reynolds-Zahl, Rekrit ≈ 4 · 105 , findet ein Widerstandsabfall statt, da beim laminarturbulenten Umschlag der Druckwiderstand stärker abnimmt als der Reibungswiderstand ansteigt. Eine Erhöhung der Rauheit bewirkt eine Verringerung der kritischen Reynolds-Zahl und hat damit einen starken Einfluss auf den Widerstandsbeiwert. Eine endliche Länge des Zylinders bringt durch die seitliche Umströmung einen geringeren Widerstand, wie das Beispiel mit L/D = 5 in Bild 8-49 zeigt. Die quergestellte unendlich lange Platte hat durch die festen Ablösestellen einen konstanten Wert cW = 2,0. Beim quadratischen Zylinder bilden die Kanten der Stirnfläche die Ablöselinien, sodass sich nahezu gleiche Wi-
Bild 8-49. Widerstandsbeiwerte prismatischer Körper
derstandswerte wie bei der Platte ergeben. Für die ebene, längs angeströmte Platte sind für laminare und turbulente Strömung theoretische Werte bekannt. Die Reynolds-Zahl ist mit der Plattenlänge l gebildet, Re = wl/ν. Als Bezugsfläche A = bl dient die Querschnittsfläche, sodass die Widerstandsbeiwerte (8-98), (8-99), (8-100) für die hier beidseitig umströmte Platte zu verdoppeln sind. Zwischen Theorie und Experiment besteht gute Übereinstimmung bis auf den Bereich kleinerer Reynolds-Zahlen, Re < 104 , wo sich Hinterkanteneffekte aufgrund der endlichen Plattenlänge durch eine Widerstandserhöhung bemerkbar machen. Die Widerstandsbeiwerte für das Normalprofil NACA 4415 (National Advisory Committee for Aeronautics, USA) liegen oberhalb der turbulenten Plattengrenzschicht. Für das Laminarprofil NACA 66-009 liegen die Widerstandsbeiwerte dagegen unterhalb der Werte für die turbulente Plattengrenzschicht. Durch eine geeignete Profilform wird der laminar-turbulente Umschlag möglichst weit stromab verlagert, wodurch mit Laminarprofilen ein möglichst geringer Widerstand erreicht wird. Umströmung von Rotationskörpern
Für die Kugelumströmung sind analytische Lösungen für kleine Reynolds-Zahlen Re = wD/ν bekannt [12].
E179
E180
E Technische Mechanik / Mechanik fester Körper
Mit der Querschnittsfläche A = πD2 /4 als Bezugsfläche folgen die Widerstandsbeiwerte: 24 , Re < 1 (Stokes) , Re 24 3 cW = 1 + Re , Re 5 Re 16 cW =
(8-143)
(Oseen) , (8-144)
√ 24 (1 + 0,11 Re)2 , Re Re 6000 (Abraham) .
cW =
(8-145)
Der Widerstand nach Stokes (8-143) setzt sich aus 1/3 Druckwiderstand und 2/3 Reibungswiderstand zusammen. In (8-144) wurde von Oseen in erster Näherung der Trägheitseinfluss mitberücksichtigt. Die Beziehung (8-145) ist empirisch auf der Basis von Grenzschichtüberlegungen gewonnen [33]. Als Sonderfälle folgen für Re < 1 gemäß [34] für die quer angeströmte Kreisscheibe 20,4 64 = πRe Re und für die längs angeströmte Kreisscheibe cW =
(8-146)
13,6 128 = . (8-147) 3πRe Re Bei der quergestellten Scheibe (8-146) tritt nur Druckwiderstand und bei der längs angeströmten Scheibe (8-147) nur Reibungswiderstand auf. cW =
Bild 8-50. Widerstandsbeiwerte von Rotationskörpern
In Bild 8-50 sind gemessene Widerstandsbeiwerte [7, 35, 36] über der Reynolds-Zahl aufgetragen. Die analytischen Lösungen stellen Asymptoten für kleine Reynolds-Zahlen dar. Der Kugelwiderstand fällt sehr stark im Bereich des laminar-turbulenten Umschlages und steigt danach wieder an. Für ein in Strömungsrichtung gestrecktes Ellipsoid ergeben sich gegenüber der Kugel größtenteils niedrigere Widerstandsbeiwerte. Optimale Widerstandsbeiwerte lassen sich mit Stromlinienkörpern erreichen [37]. Die quer angeströmte Scheibe hat bei größeren Reynolds-Zahlen eine feste Ablöselinie am äußeren Rand, sodass sich ein konstanter Widerstandsbeiwert einstellt. Kennzahlunabhängige Widerstandsbeiwerte [7, 21]
Für größere Reynolds-Zahlen, Re > 104 , sind bei Körpern mit festen Ablöselinien die Widerstandsbeiwerte nahezu unabhängig von der Reynolds-Zahl. Die Widerstandskraft ist dann proportional zum Quadrat der Anströmgeschwindigkeit. In der Tabelle 8-2 sind einige Beispiele zusammengestellt. Interessant ist das Widerstandsverhalten der beiden hintereinander angeordneten Kreisscheiben, deren Gesamtwiderstand kleiner als der Widerstand einer Scheibe werden kann (Windschattenproblem). Durch eine Variation von Abstand und Durchmesser können erhebliche Widerstandsreduzierungen erreicht werden [38]. Die Widerstands- und Auftriebsbeiwerte der Profilstäbe entsprechen den Messungen in [7]. Lastannahmen für
8 Hydrodynamik: Inkompressible Strömungen mit und ohne Viskositätseinfluss
Tabelle 8-2. Widerstands- und Auftriebsbeiwerte kennzahlunabhängiger Körperformen
Profilstäbe sind in [39] zusammengestellt. Aerodynamische Eigenschaften von Bauwerken sind in [40] umfassend dargestellt. Über die Zusammensetzung des Widerstandes von kraftfahrzeugähnlichen Körpern und Möglichkeiten zur Widerstandsreduzierung sind interessante Aspekte in [41] enthalten. Beispiel: Welche Kräfte belasten eine Verkehrszeichentafel bei normaler und tangentialer Anströmung? Gegeben: Breite b = 1,5 m, Höhe h = 3 m, Windgeschwindigkeit w = 20 m/s = 72 km/h, Dichte und kinematische Viskosität der Luft = 1,188 kg/m3 , ν = 15,24 · 10−6 m2 /s. Lösung: Anströmung normal zur Oberfläche A = bh mit cW = 1,15 nach Tabelle 8-2, FW = ( /2)w2 AcW = 1230 kg m/s2 = 1230 N. Anströmung tangential zur Oberfläche, Reynolds-Zahl Re = wb/ν = 1,97 · 106 , Widerstandsbeiwert der turbulenten Plattengrenzschicht aus Bild 8-49 bzw. nach (8-99) mit dem Faktor 2, da beide Seiten überströmt werden. 0,455 1700 cW = 2cF = 2 = 0,0062 , − Re (lg Re)2,58 1 FW = w2 bhcW = 6,63 N . 2 Die Belastung durch Druckkräfte ist erheblich größer als durch Reibungskräfte. Beispiel: Wie groß ist die Geschwindigkeit eines Fallschirmspringers bei stationärer Bewegung im freien Fall? Gegeben sind: Schirmdurchmesser D = 8 m, Masse von Person und Schirm m = 90 kg, Dichte der Luft = 1,188 kg/m3. Lösung: Entspricht die Schirmform einer offenen Halbkugel, so folgt aus Tabelle 8-2 der Widerstandsbeiwert cW = 1,33. Mit (8-141): FW = mg = ( /2)w2 AcW ergibt sich die Fallgeschwindigkeit zu w=
8mg πD2 cW
1/2
8 · 90 kg · 9,81 m/s2 ≈ π · 82 m2 · 1,188 kg/m3 · 1,33
1/2
≈ 4,7 m/s ≈ 17 km/h . In Wirklichkeit ist der Widerstandsbeiwert cW durch die Porösität des Schirmes geringer und die Geschwindigkeit damit höher.
E181
E182
E Technische Mechanik / Mechanik fester Körper
Aus dimensionsanalytischen Betrachtungen folgt der allgemeine Zusammenhang [11] cM = F(Re) mit cM =
1 5 2
R ω 2
und Re =
R2 ω . ν
(8-150)
Für die schleichende Strömung, die laminare und turbulente Grenzschichtströmung resultieren aus der Theorie die Beziehungen [12,18]:
Bild 8-51. Geschwindigkeiten im Turbinenlaufrad
8.5 Strömungen in rotierenden Systemen Beim Durchströmen rotierender Strömungskanäle wird dem Medium in Kraftmaschinen (Turbinen) Energie entzogen und in Arbeitsmaschinen (Pumpen) zugeführt. Für das in Bild 8-51 dargestellte Turbinenlaufrad folgt aus dem Erhaltungssatz für den Drehimpuls die Euler’sche Turbinengleichung [1]: P = MT ω = m(u ˙ 1 c1u − u2 c2u ) .
M
(8-148)
Die Leistung P des Turbinenrades als Produkt aus Drehmoment MT und Winkelgeschwindigkeit ω ist vom Massenstrom m ˙ sowie den Geschwindigkeitsverhältnissen am Ein- und Austritt abhängig.
cM =
64 1 · (Re < 30 , laminar) , 3 Re
(8-151)
3,87 (30 < Re < 3 · 105 , laminar) , (8-152) cM = √ Re 0,146 cM = √5 (8-153) (Re > 3 · 105 , turbulent) . Re In Bild 8-53 sind die theoretischen Lösungen und Messergebnisse aus [42] aufgetragen. Die Grenzen für die Anwendung der Beziehungen (8-151) bis (8-153) sind diesem Diagramm entnommen. Ist die rotierende Scheibe von einem geschlossenen Gehäuse umgeben (Bild 8-54), dann ist die normierte Spaltweite σ = s/R ein weiterer Parameter. Der Einfluss von σ auf das Drehmoment zeigt sich für kleine Werte, σ < 0,3, im Bereich der laminaren Schichten-
Drehmoment rotierender Körper
In viskosen Medien erfahren rotierende Körper ein Reibmoment. Für die frei rotierende Scheibe in Bild 8-52 gilt die Abhängigkeit M = f (R, ω, , η) .
Bild 8-52. Frei rotierende Scheibe
(8-149)
Bild 8-53. Momentenbeiwert der frei rotierenden Scheibe
9 Gasdynamik
strömung. Für den Momentenbeiwert gelten die Beziehungen [43]: 2π 1 (Re < 104 , laminar) , (8-154) cM = · σ Re 2,67 cM = √ Re
(104 < Re < 3 · 105 , laminar) ,
M = 12 R5 ω2 cM = 1,537 Nm. Die erforderliche Leistung ist P = Mω = 0,482 kW. Würde dagegen das Laufrad frei ohne Gehäuse im Wasser rotieren, wäre der Momentenbeiwert √5 cM = 0,146/ Re = 0,00733, das Drehmoment M = 3,61 N m und die Leistung P = 1,134 kW.
(8-155)
0,062 2 (Re > 3 · 105 , turbulent) . (8-156) cM = √5 Re Interessant ist die Feststellung, dass die rotierende Scheibe im Gehäuse für Re > 104 ein kleineres Drehmoment erfordert als die im unendlich ausgedehnten Medium rotierende Scheibe. Dieser Effekt ist auf die dreidimensionale Grenzschichtströmung im abgeschlossenen Gehäuse zurückzuführen. Für Kugeln in einem Gehäuse mit abgeschlossenem Spalt sind entsprechende Ergebnisse in [44] dargestellt. Tritt neben der Rotation noch eine überlagerte Durchströmung des Kugelspaltes auf, so wird das Drehmomentverhalten zusätzlich vom Volumenstrom abhängig. Eine umfassende Darstellung der theoretischen und experimentellen Resultate zu diesem Strömungsproblem ist in [45] enthalten. Beispiel: Ein scheibenförmiges Laufrad rotiert in einem mit Wasser gefüllten Gehäuse (Bild 8-54) mit der Drehzahl n = 3000 min−1 = 50 s−1 . Wie groß sind Drehmoment und Leistung des Antriebs? Radius R = 0,1 m, Wasser = 998 kg/m3, ν = 1004 · 10−6 m2 /s, Winkelgeschwindigkeit ω = 2πn = 314,16 s−1 , Reynolds-Zahl Re = R2 ω/ν = 3,13 · 106 (turbulente Grenzschichtströmung). Nach √(8-155) 5 folgt der Momentenbeiwert cM = 0,062/ Re = 0,00312 und mit (8-150) das Drehmoment
Bild 8-54. Rotierende Scheibe im Gehäuse
9 Gasdynamik 9.1 Erhaltungssätze für Masse, Impuls und Energie Die Strömung eines kompressiblen Mediums wird in jedem Punkt (x, y, z) des betrachteten Feldes zu jeder Zeit t durch diese Größen beschrieben: Geschwindigkeit w = (u, v, w) , Dichte , Temperatur T .
Druck p ,
Zur Bestimmung dieser 6 abhängigen Zustandsgrößen werden 6 physikalische Grundgleichungen sowie Rand- und/oder Anfangsbedingungen der speziellen Aufgabe benötigt. Diese Grundgesetze sind die physikalischen Erhaltungssätze für Masse m, Impuls I und Energie E sowie eine thermodynamische Zustandsgleichung (das sind insgesamt 6 Gleichungen) in Integralform. Die Integralform der Gesetze führt zu den Kräften im Strömungsfeld (Auftrieb, Widerstand; siehe auch in 8.3.7 den Impulssatz) und zu den Verdichtungsstoßgleichungen. Die später zusätzlich gemachten Differenzierbarkeitsannahmen ergeben die Differenzialgleichungen (Kontinuitätsgleichung, Euler- oder Navier-Stokes-Gleichung und Energiesatz). Die Herleitung der integralen Sätze erfolgt am einfachsten im massenfesten, d. h. im mitschwimmenden
Bild 9-1. Kontrollbereich für integrale Erhaltungssätze. V
Volumen, A Oberfläche, n äußere Normale
E183
E184
E Technische Mechanik / Mechanik fester Körper
Kontrollraum. Das Endergebnis gilt massenfest wie raumfest (Bild 9-1). Massenerhaltung " " " d ∂
dm = dV + w · n dA = 0 .
dV = dt dt ∂t V
V
A
(9-1)
Das Volumenintegral über ∂ /∂t erfasst die zeitliche lokale Massenänderung im Volumen V, das Oberflächenintegral liefert den zugehörigen Massenzu- oder -abfluss durch die Oberfläche A. Impulssatz
" d dI =
w dV (9-2) dt dt V " " ∂ w dV + w(w · n)dA = FM + FA . = ∂t V
A
Rechts treten alle am Kontrollbereich angreifenden Massenkräfte (Schwerkraft, Zentrifugalkraft, elektrische und magnetische Kraft usw.) = FM sowie Oberflächenkräfte (Druckkraft, Reibungskraft usw.) = FA auf. Für die statische Druckkraft gilt " (9-2a) FD = − p n dA . A
Energiesatz (Leistungsbilanz): " d dE 1 =
e + w2 dV dt dt 2 V " 1 2 ∂
e + w dV = ∂t 2 V " 1 + e + w2 (w · n) dA 2 (9-3a)
e ist die spezifische innere Energie. Rechts stehen die Leistungen der Massenkräfte (PM ), der Oberflächenkräfte (PA ) sowie die übrigen Energieströme, z. B. durch Wärmeleitung (PW ), am Kontrollbereich. Für die Leistung der Druckkraft gilt " (9-3a) PD = − p(w · n) dA . A
Die Deutung der jeweils in (9-2) und (9-3) rechts auftretenden Integrale, lokale Änderung im Volumen V sowie zugehöriger Strom durch die Oberfläche A, ist analog zu der bei (9-1).
9.2 Allgemeine Stoßgleichungen Die Erhaltungssätze liefern die Sprungrelationen für die Zustandsgrößen über Stoßflächen. Dies ist eine zweckmäßige Idealisierung der Tatsache, dass in sehr dünnen Schichten (von der Größenordnung der mittleren freien Weglänge des Gases) die Gradienten von Zustandsgrößen und Stoffparametern hohe Werte annehmen können. Im Rahmen der Kontinuumsmechanik sprechen wir daher von Unstetigkeiten (Verdichtungsstößen). Die integralen Erhaltungssätze (9-1) bis (9-3) geben für stationäre Strömung, ohne Massenkräfte, Reibung und Wärmeleitung (Bild 9-2):
vn = ˆ ˆ vn ,
v2n + p = ˆ ˆ v2n + pˆ ,
A
= PM + PA + PW .
Bild 9-2. Geschwindigkeitskomponenten normal (vn , vˆ n ) und tangential (vt , vˆ t ) vor und nach dem Stoß
vt vn = ˆ ˆ vt vˆ n , 1 2 1 2 2 2 ˆ ˆ vn h + (ˆvn + vˆ t ) .
vn h + (vn + vt ) = ˆ 2 2 Die Indizes n, t bezeichnen Normal- und Tangentialkomponenten, das Zeichen ˆ die Werte hinter dem Stoß, h = e+p/ die spezifische Enthalpie. Ist vn = 0 – kein Massenfluss über A – so kann vt vˆ t sein, dann liegt eine Wirbelfläche vor. Für Verdichtungsstöße ist
vn 0 und damit vt = vˆ t , also ˆ vn ,
vn = ˆ
v2n
ˆ ˆ v2n
+p= + pˆ , vt = vˆ t 1 2 ˆ 1 2 h + vn = h + vˆ n . 2 2
(9-4a) (9-4b) (9-4c) (9-4d)
9 Gasdynamik
9.2.1 Rankine-Hugoniot-Relation
Elimination der Geschwindigkeitskomponenten in (9-4a) bis (9-4d) ergibt die allgemeinen RankineHugoniot-Relationen [1, 2]: 1 1 1 + (9-5a) ( pˆ − p) , hˆ − h = 2 ˆ 1 1 pˆ + p eˆ − e = (9-5b) − .
ˆ 2 Der Zusammenhang mit dem 1. Hauptsatz im adiabaten Fall ist offensichtlich. Die Änderung der inneren Energie beim Stoß ist nach (9-5b) gleich der Arbeit, die der mittlere Druck bei der Volumenänderung leistet. Für ideale Gase konstanten Verhältnisses κ der spezifischen Wärmen kommt die spezielle Form (RH) [3, 4] pˆ (κ + 1) ˆ − (κ − 1)
= . p (κ + 1) − (κ − 1) ˆ
folgt wegen sˆ − s 0 κ κ
ˆ sˆ − s pˆ
ˆ exp , = p
cv
d. h., die RH-Kurve muss stets oberhalb der Isentropen liegen. Dies ist (Bild 9-3) nur für κ−1
< 1, κ + 1 ˆ d. h. bei Verdichtung, möglich. 9.2.2 Rayleigh-Gerade
Die so genannten mechanischen Stoßgleichungen Massenerhaltung (9-4a) und Impulssatz (9-4b) führen zur Rayleigh-Geraden (R) [5] pˆ
− 1 = κMn2 1 − (9-7a) p
ˆ mit der Abkürzung
(9-6)
Die RH-Kurve und die Isentrope (Bild 9-3) haben im Ausgangspunkt p/p ˆ = 1, / ˆ = 1 Tangente und Krümmung gemeinsam. Das heißt, schwache Stöße verlaufen isentrop. Für starke Stöße, p/p ˆ 1, gilt dagegen /
ˆ → (κ + 1)/(κ − 1), während die Isentrope beliebig anwächst. Allerdings sind bei diesen extremen Zustandsänderungen reale Gaseffekte zu berücksichtigen. Es sind nur Verdichtungsstöße thermodynamisch möglich. Mit s, der spezifischen Entropie,
Mn2 =
v2n v2n p = a2 . κ
(9-7b)
Diese Gerade (R) muss mit der (RH)-Kurve geschnitten werden (Bild 9-3) und führt damit im Allgemeinen zu den zwei Lösungen (1) und (2) der Erhaltungssätze beim Verdichtungsstoß. (1) ist die Identität, sie ist aufgrund des Aufbaus der Gleichungen (9-4a) bis (9-4d) enthalten, (2) ist der Verdichtungsstoß. Das System der Erhaltungssätze ist also nicht eindeutig lösbar. Zusätzliche Bedingungen müssen hier eine Entscheidung herbeiführen. Im Grenzfall, dass beide Lösungen zusammenfallen, (R) also tangential zu (RH) und zur Isentropen im Ausgangspunkt (1, 1) verläuft, gilt Mn = 1. 9.2.3 Schallgeschwindigkeit
Bild 9-3. Rankine-Hugoniot-Kurve (RH), Rayleigh-Gerade
(R) und Isentrope
Die in (9-7b) formal vorgenommene Abkürzung führt zur Schallgeschwindigkeit a. Mit Ri als individueller und R = 8,31447 J/(mol · K) als universeller (molarer) Gaskonstante und Mi als molarer Masse des Stoffes i gilt für ideale Gase 8 ∂p p R a= = κ = κ T = κRi T . (9-8) ∂ s
Mi
E185
E186
E Technische Mechanik / Mechanik fester Körper
Für T = 300 K wird Gas O2 Mi in g/mol 32 a in m/s
N2 H2 Luft 28,016 2,016 ≈ 29
330 353
1316
347
Diese Schallgeschwindigkeit ist die Ausbreitungsgeschwindigkeit kleiner Störungen der Zustandsgrößen in einem ruhenden kompressiblen Medium. Sie ist eine Signalgeschwindigkeit, zum Unterschied von der Strömungsgeschwindigkeit. Betrachten wir die Ausbreitung einer Schallwelle in ruhendem Medium und wenden auf die Zustandsänderung in der Wellenfront Kontinuitätsbedingung sowie Impulssatz an, so erhalten wir (9-8) (siehe z. B. [6]). Die Schallgeschwindigkeit hängt von der Druckund Dichtestörung in der Front ab. Führt eine Drucksteigerung in der Welle nur zu einer geringen Dichteänderung (inkompressibles Medium), so ist die Schallgeschwindigkeit groß. Kommt es zu einer beträchtlichen Dichtezunahme (kompressibles Medium), so ist a klein. Beim idealen √ Gas gelten √ die typischen Proportionalitäten a ∼ T , a∼1/ Mi , womit Möglichkeiten der Variation von a gegeben sind. a ist eine wichtige Bezugsgeschwindigkeit für alle kompressiblen Strömungen. Ackeret führte 1928 zu Ehren von Ernst Mach die folgende Bezeichnung ein: Strömungsgeschwindigkeit Schallgeschwindigkeit w = = M Mach’sche Zahl oder Mach-Zahl . a (9-9) Statt M schreibt man auch Ma. Man unterscheidet danach Unterschallströmungen mit M < 1 und Überschallströmungen mit M > 1. Die wichtigsten Eigenschaften solcher Strömungen werden im Folgenden behandelt. 9.2.4 Senkrechter Stoß
Steht die Stoßfront senkrecht zur Anströmung (Bild 9-4), so ist vn = w, vt = 0. Für das ideale
Bild 9-5. Die bezogenen Stoßgrößen beim senkrechten Ver-
dichtungsstoß als Funktion von M (κ = 1,40)
Gas konstanter spezifischer Wärmekapazität wird aus (9-4a) bis (9-4d)
w = ˆ wˆ , κ p · + κ−1
(9-10)
Bei gegebener Zuströmung ( , p, w) kommen für die Zustandswerte die Identität oder die folgende Lösung für den senkrechten Stoß:
2 wˆ 1 = =1− 1− 2 , w ˆ κ+1 M pˆ 2κ =1+ (M 2 − 1) , p κ+1 aˆ 2 pˆ
Tˆ = 2 = · (9-11) T p ˆ a 2κ 2 1 2 (M − 1) 1 − = 1+ 1− 2 κ+1 κ+1 M κ pˆ
sˆ − s = ln cV p ˆ =
2 κ(κ − 1) 2 · (M − 1)3 + . . . , 3 (κ + 1)2
(M ≈ 1) ,
κ−1 2 (M − 1) κ+1 M = . 2κ 2 (M − 1) 1+ κ+1 Alle normierten Stoßgrößen hängen nur von M ab und zeigen einen charakteristischen Verlauf (Bild 9-5 ˆ2
Bild 9-4. Senkrechter Verdichtungsstoß
w2 + p = ˆ wˆ 2 + pˆ , 1 2 pˆ 1 κ w = · + wˆ 2 . 2 κ − 1 ˆ 2
1+
9 Gasdynamik
und 9-6). Ein senkrechter Stoß kann nur in Überschallströmung M > 1 auftreten (Entropiezunahme!), dahinter herrscht Unterschallgeschwindigkeit Mˆ < 1. Die Zunahme der Entropie erfolgt im Stoß – in der Nähe von M = 1 – erst mit der dritten Potenz der Stoßstärke p/p ˆ − 1, d. h., schwache Stöße verlaufen isentrop. Für M 2 1, den sog. Hyperschall, erhält man die Grenzwerte κ+1 pˆ 2κ
ˆ w = → , → M2 ,
wˆ κ−1 p κ+1 2κ(κ − 1) 2 κ−1 wˆ Tˆ ˆ → → . M , Mmin = 2 T aˆ 2κ (κ + 1) (9-12) Diese Zustandsgrößen treten z. B. bei der Umströmung eines stumpfen Körpers mit abgelöster Kopfwelle hinter dem Stoß auf. Die Dichte strebt gegen einen endlichen Wert, während Druck und Temperatur stark ansteigen. Die Mach-Zahl Mˆ erreicht ein Minimum. Charakteristisch verhalten sich die Ruhegrößen. Denken wir uns das Medium vor und nach dem Stoß in den Ruhezustand überführt, so lautet der Energiesatz über den Stoß hinweg cpT0 = cpT +
wˆ 2 w2 = c p Tˆ + = c p Tˆ 0 , 2 2
d. h., T 0 = Tˆ 0 ,
a0 = aˆ 0 .
(9-13)
Bei Druck und Dichte wird jeweils eine isentrope Abbremsung vor und nach dem Stoß vorgenommen. Verwendet man weiterhin wegen (9-13) einen isothermen
Vergleichsprozess, so erhält man die sog. RayleighFormel − 1 2κ pˆ 0 ˆ 0 κ−1 (M 2 − 1) = = 1+ p0 0 κ+1 − κ 2 1 κ−1 × 1− (9-14) . 1− 2 κ+1 M Die Ruhedruckabnahme ist in Schallnähe gering, denn es gilt pˆ 0 sˆ − s = −(κ − 1) − 1 + ... cV p0 Für starke Stöße, d. h. hohe Mach-Zahlen, ist der Ruhedruckabfall dagegen beträchtlich (Bild 9-7). Beim Pitotrohr in Überschallströmung finden diese Beziehungen Anwendung. Gemessen wird pˆ 0 . Kennt man M, so kann mit (9-14) p0 berechnet werden. Falls jedoch p oder pˆ und pˆ 0 gemessen werden, kann M ermittelt werden. Hierzu wird der nachfolgend angegebene isentrope Zusammenhang zwischen p, p0 und M benutzt (31). Der Ruhedruckverlust in Überschallströmungen hat wichtige praktische Konsequenzen. Ist der Einlauf eines Staustrahltriebwerkes wie ein Pitotdiffusor ausgebildet, d. h., steht vor der Öffnung ein starker senkrechter Stoß, so tritt ein hoher Ruhedruckverlust auf, der nachteilig für den Antrieb ist; denn stromab kann durch Aufstau nur pˆ 0 wieder erreicht werden. Dies führte zur Entwicklung des Stoßdiffusors von Oswatitsch [7]. Hier wird in den Pitotdiffusor ein kegelförmiger Zentralkörper eingeführt. Die Abbremsung der Überschallströmung geschieht über ein System schiefer Stöße mit abschließendem schwachen senkrechten Stoß zwischen Kegel und Pitotrohr. Dieses Stoßsystem führt im Endeffekt zu einer erheblich geringeren Gesamtdruckabnahme als bei einem einzigen senkrechten Stoß. 9.2.5 Schiefer Stoß
Bild 9-6. Die normierte Entropie ( sˆ − s)/cV beim senkrechten Verdichtungsstoß als Funktion von M (κ = 1,40)
Ein schiefer Stoß tritt in Überschallströmungen z. B. an der Körperspitze (Kopfwelle) und am Heck (Schwanzwelle) auf. Die Gleichungen erhält man am einfachsten aus denen des senkrechten Stoßes (Bild 9-4) in einem Koordinatensystem, das entlang der Stoßfront mit vt = vˆ t 0 bewegt wird (Bild 9-2).
E187
E188
E Technische Mechanik / Mechanik fester Körper
Bild 9-9. Bereichsgrenzen für Θ bei festem M Bild 9-7. Ruhedruck- und Ruhedichteabnahme beim senk-
rechten Stoß als Funktion von M (κ = 1,40)
Mit Θ = Neigungswinkel des Stoßes gegen die Anströmung = Stoßwinkel ergibt sich die Ersetzung (Bild 9-8) entsprechend folgender Tabelle: Senkrechter Stoß w wˆ w M = a
Schiefer Stoß vn vˆ n vn w = sin Θ = M sin Θ a a
In allen Gleichungen des senkrechten Stoßes (9-11) und (9-14) ist also lediglich M durch M sin Θ zu ersetzen. Es wird vˆ n
2 1 = = 1− , 1− vn ˆ κ+1 M 2 sin2 Θ 2κ pˆ = 1+ (M 2 sin2 Θ − 1) , (9-15) p κ+1 κ pˆ
aˆ 2 sˆ − s pˆ
Tˆ = 2 = , = ln . T p ˆ cv p ˆ a
verschwindendem Drucksprung durch M sin Θ = 1 gegeben, die obere Grenze dagegen durch den größtmöglichen Druckanstieg im senkrechten Stoß (Bild 9-9): α = arcsin
π 1 Θ . M 2
α heißt Mach’scher Winkel. Er begrenzt den Einflussbereich kleiner Störungen in Überschallströmungen. 9.2.6 Busemann-Polare
Wir drehen das Koordinatensystem in Bild 9-8 so, dass die Anströmung in die x-Richtung fällt (Bild 9-10). Führt man diese Drehung in den Stoßrelationen durch und benutzt die Bezeichnungen von Bild 9-10, so erhält man die Busemann-Polare [8] (uuˆ − a∗2 )(u − uˆ )2 2 2 u − uuˆ . = vˆ 2 a∗2 + κ+1
(9-16)
Die Bedingung M 1 beim senkrechten Stoß führt hier zu M sin Θ 1, d. h., M 1/ sin Θ 1. Ein schiefer Stoß ist auch nur in Überschallströmung möglich. Bei festem M ist die untere Grenze für Θ bei
√ a∗ = a0 2/(κ + 1) bezeichnet hierin die sog. kritische Schallgeschwindigkeit. Gleichung (9-16) stellt in der Form vˆ = f (uˆ , u) die Parameterdarstellung einer Kurve in der uˆ , vˆ -Hodografenebene dar. Mit der Anströmungsgeschwindigkeit u als Parameter enthält sie alle möglichen Strömungszustände (uˆ , vˆ ) hinter dem schiefen Stoß an der Körperspitze. Es handelt sich
Bild 9-8. Übergang vom senkrechten zum schiefen Stoß
Bild 9-10. Schiefer Stoß bei horizontaler Anströmung
9 Gasdynamik
Im ersten Fall zieht sich der geschlossene Teil der Stoßpolaren auf den Schallpunkt uˆ → a∗ , vˆ → 0 zusammen, im zweiten Fall entsteht der Kreis 2 a∗2 κa∗ + vˆ 2 = 2 (9-17) , uˆ − √ κ −1 κ2 − 1 in dessen Innern alle anderen Stoßpolaren liegen. Beide Grenzfälle sind wichtig, und zwar im ersten Fall für sogenannte schallnahe (transsonische) Strömungen, im zweiten Fall für Hyperschallströmungen. 9.2.7 Herzkurve Bild 9-11. Busemann’sche Stoßpolare in der Hodografen-
ebene. Stoßkonstruktion
um ein Kartesisches Blatt mit Doppelpunkt P(u, 0) und einer vertikalen Asymptote bei uˆ = (a∗2 + 2/ (κ + 1)u2 )/u. Der senkrechte Stoß ist mit vˆ = 0 enthalten. Es ergibt sich uu ˆ = a∗2 (Prandtl-Relation) oder uˆ = u (Identität). Ist der Abströmwinkel ϑˆ (z. B. Keilwinkel) gegeben, so gibt es drei Lösungen (Bild 9-11): (1) starke Lösung, führt für ϑˆ → 0 auf den senkrechten Stoß; (2) schwache Lösung, liefert mit ϑˆ → 0 die Identität (Machsche Welle); (3) Schwanzwellenlösung. (3) löst das sogenannte inverse Problem. (u, 0) ist der Zustand hinter der Schwanzwelle, (u, ˆ vˆ ) derjenige davor. (3) ist nur sinnvoll, solange w < wmax . Die Stoßneigung Θ ergibt sich durch das Lot vom Ursprung auf die Verbindungslinie P→ 1, P→ 2, P→ 3. Bei gegebener Anströmung gibt es ein ϑˆ max . Für ϑˆ > ϑˆ max löst der Stoß von der Körperspitze ab und steht vor dem Hindernis. Der Schallkreis teilt die Stoßpolare in einen Unter- und einen Überschallteil. Eine genaue Analyse zeigt, dass hinter einem schiefen Stoß in Abhängigkeit von ϑˆ Über- oder Unterschall herrschen kann. Hinter dem Stoß muss jeweils eine der Größen gegeben sein. Die Lösung ist bei Vorgabe von ϑˆ oder vˆ mehrdeutig, dagegen bei Θ oder uˆ eindeutig. Interessante Grenzfälle ergeben sich für die Stoßpolare für u → a∗ und u → wmax = a∗ (κ + 1)/(κ − 1) = a0 2/(κ − 1) .
In den Anwendungen ist oft der Druck eine bevorzugte Größe, z. B. wenn eine Diskontinuitätsfläche in Form einer Wirbelschicht oder einer freien Strahlgrenze im Stromfeld auftritt. Dazu muss die Stoßpolare nicht nur in der uˆ , vˆ -Ebene, sondern auch in der ˆ p, ˆ ϑ-Ebene verwendet werden. In der letzteren Ebene kommt die sog. Herzkurve [9] pˆ −1 p ˆ tan ϑ = pˆ −1 κM 2 − p ; < < < < pˆ 2κ < 2 < < < < κ + 1 (M − 1) − p − 1 = × . pˆ κ − 1 + p κ+1
(9-18)
Es handelt sich um eine der Busemann’schen Stoßpolaren ähnliche Kurve (Bild 9-12) pˆ ˆ M) , = F(ϑ, p
ˆ Bild 9-12. Herzkurve in der p, ˆ ϑ-Ebene
E189
E190
E Technische Mechanik / Mechanik fester Körper
wobei M als Kurvenparameter fungiert. Bei bekanntem ϑˆ ergeben sich in der Regel die drei Lösungen (1), (2), (3). (1) ist die starke, (2) die schwache Lösung, (3) löst wie oben das inverse Problem. An der Körperspitze tritt in der Regel die schwache Lösung (2) auf. Dies lässt sich anhand der Herzkurve plausibel machen [10]. Bild 9-12 entnimmt man ˆ 1 < 0, und (∂ pˆ /∂ϑ) ˆ 2 > 0. Wir für ϑˆ > 0 : (∂ pˆ /∂ϑ) betrachten einen symmetrischen Keil (ϑˆ < ϑˆ max ) in Überschallströmung. Drehen wir ihn um die Keilspitze um den kleinen Anstellwinkel ε > 0, so führt dies bei der starken Lösung (1) an der Keiloberseite zu einer Druckabnahme und an der Keilunterseite zu einer Druckzunahme. Dies würde zu einer Vergrößerung der ursprünglichen Drehung, d. h. zu einer Instabilität, führen. Der schwache Stoß (2) entspricht dagegen der stabilen Lösung, d. h., die vorgenommene Drehung würde rückgängig gemacht. Diese Eigenschaft weist auf eine Bevorzugung der schwachen Lösung an der Körperspitze hin. Da hinter der schwachen Lösung stets Überschall herrscht, liegt hier ein lokales Strömungsphänomen vor. Die starke Lösung führt dagegen in der Regel auf Unterschall. Hier können sich Störungen auch stromauf fortpflanzen. Das liefert eine globale Abhängigkeit der starken Lösung von Randbedingungen stromab, die häufig die starke Lösung erzwingen. Mit der Busemann-Polaren und der Herzkurve können die in den Anwendungen auftretenden Stoßprobleme behandelt werden, z. B. die Stoßreflektion an der festen Wand sowie am Strahlrand und das Durchkreuzen zweier Stöße. Im letzteren Fall geht vom Kreuzungspunkt außer den reflektierten Stößen eine Diskontinuitätsfläche ab. Die Stetigkeit des Druckes über diese Fläche führt im Herzkurvendiagramm zur Neigung dieser Schicht und mit der Busemann-Polaren zu allen Zustandswerten.
9.3 Kräfte auf umströmte Körper Der Impulssatz (9-2) liefert für stationäre Strömungen ohne Massenkräfte (Bild 9-13) " FK = −
"
w(w · n) dA −
A
pn dA .
(9-19)
A
FK ist hierin die dem Körper K insgesamt übertragene Kraft. Die Kontrollfläche A umschließt den Körper in hinreichendem Abstand, sodass dort die Reibung vernachlässigt werden kann. Bezüglich einer horizontalen Anströmung mit u∞ gilt FK,x = FW Widerstand, FK,y = FA Auftrieb, FK,z Querkraft. Ist die Strömung generell reibungsfrei, so bestimmt sich FK allein durch das Druckintegral über die Körperoberfläche. Gleichung (9-19) kann durch geeignete Wahl der Kontrollfläche A oft sehr vereinfacht werden. Wir nehmen z. B. die Parallelen zur y, z-Ebene in der Anströmung und weit hinter dem Körper x = x0 = const l (Bild 9-14) ""
FW = −
u2 + p − ∞ u2∞ + p∞ dy dz| x=x0 (9-20a)
"" FA = − FK,z = −
""
( uv − ∞ u∞ v∞ )dy dz| x=x0 ,
(9-20b)
( uw − ∞ u∞ w∞ )dy dz| x=x0 . (9-20c)
Integriert wird hierin jetzt nur noch hinter dem Körper, in der so genannten Trefftz-Ebene.
Bild 9-13. Kontrollfläche mit angeströmtem Körper für den
Bild 9-14. Spezielle Kontrollflächen vor und hinter dem
Impulssatz
Körper
9 Gasdynamik
Mit der Massenerhaltung im Zu- und Abstrom wird aus (9-20a) "" FW = − { u(u − u∞ ) + p − p∞ }dy dz| x=x0 . (9-21)
Die Geschwindigkeits- und die Druckstörungen im Nachlauf des Körpers bestimmen den Widerstand. Dies kann zur Messung oder Berechnung desselben benutzt werden. Entwickelt man den Integranden in (9-21) für kleine Abweichungen vom Anströmzustand: u∞ , v∞ = w∞ = 0, p∞, ∞ , T ∞ , s∞ unter Benutzung des Energiesatzes, so erhält man den Widerstandssatz von Oswatitsch [11,12]: "" 1 2 FW u∞ = ∞ u∞ T ∞ (s − s∞ ) + − 1 − M∞ 2 ' ×(u − u∞ )2 + v2 + w2 ] dy dz x=x0 . (9-22) Hierin sind von den Störungen jeweils die ersten – tragenden – Terme berücksichtigt (M∞ ≷ 1). Der unterstrichene Anteil liefert den Entropiestrom durch die Kontrollfläche. Abgesehen von den Geschwindigkeitsbeiträgen wird die erforderliche Schleppleistung des Körpers also durch diesen Entropiestrom bestimmt. Alle dissipativen – entropieerzeugenden – Effekte (Verdichtungsstöße, Reibung, Wärmeleitung usw.) liefern hier Beiträge. Im Unterschall beschreibt der Geschwindigkeitsanteil in (9-22) den induzierten Widerstand [12], im Überschall den Wellenwiderstand. In Schallnähe kommt anstelle von (9-22) die Darstellung ([13], S. 157) "" 1 ∗ ∗ ∗ FW a = a T ∗ (s − s∗ ) + (κ + 1) 3 ' (u − a∗ )3 1 2 2 × + (v + w ) dy dz x=x0 . (9-23) a∗ 2 Im linearen Überschall (s = s∞ ) gilt im zweidimensionalen Fall (Bild 9-14) mit der Ackeret-Formel "
∞ b 2 2 2 FW = M∞ − 1 (u − u∞ ) + v dy x=x0 2
"
2 ∞ u2∞ b v dy = 2 −1 M∞
= ∞ b
"1
2
dh dx
2
dx x=x0 ,
0
also für das Parabelzweieck (Dickenparameter τ = 2hmax /l) der Widerstandsbeiwert τ2 FW 16 · cW =
. = ∞ 2 2 −1 3 M∞ u∞ bl 2
(9-24)
Desselben folgt aus (9-20b) für die um ε > 0 angestellte Platte " ( uv − ∞ u∞ v∞ ) dy FA = −b x=x0
"
= − ∞ b
" u∞ (v − v∞ ) dy = ∞ b
x=x0
u2∞ ε dy
x=x0
der Auftriebsbeiwert FA 4ε cA =
. = ∞ 2 2 −1 M∞ u∞ bl 2
(9-25)
9.4 Stromfadentheorie Für p(x), (x) und w(x) benutzen wir hier die Kontinuitätsbedingung (8-4), die Euler-Gleichung ohne Massenkräfte (8-5) sowie die Isentropie. Integration ergibt die Ausströmgeschwindigkeit bei Isentropie (Bild 9-15) ; < < < < = "p0 dp w1 = 2
p1
=
; < < < < < < =
⎤ ⎡ ⎢⎢⎢ κ − 1 ⎥⎥⎥ ⎢ κ p0 ⎢⎢⎢ p1 κ ⎥⎥⎥⎥ 2 · ⎥⎥⎥ . ⎢⎢⎢1 − κ − 1 0 ⎢⎣ p0 ⎥⎦
Bild 9-15. Ausströmen aus einem Kessel
(9-26)
E191
E192
E Technische Mechanik / Mechanik fester Körper
Sie hängt maßgeblich vom Druckverhältnis p1 /p0 ab und erreicht für p1 /p0 → 0 den Maximalwert p0 2 κ w1 max = 2 · a0 = κ − 1 0 κ−1 κ R = 2 T0 · κ − 1 Mi
κ Ri T 0 = 2c p T 0 = 2 κ−1 = 750 m/s für Luft unter Normalbedingungen . (9-27) Die Existenz einer maximalen Ausströmgeschwindigkeit ist eine typische Eigenschaft kompressibler Medien. Gleichung (9-27) zeigt dieselben charakteristischen Abhängigkeiten √ wie die Schallgeschwindig√ keit (9-8): w1 max ∼ T 0 , w1 max ∼ 1/ Mi und damit Möglichkeiten der Veränderung dieser Maximalgeschwindigkeit. 9.4.1 Lavaldüse
Die Euler-Gleichung liefert für isentrope Strömung mit der Schallgeschwindigkeit (9-8) sowie der MachZahl (9-9) 1 dw 1 d
· = −M 2 · .
dx w dx
(9-28)
Die relative Dichteänderung ist damit der relativen Geschwindigkeitsänderung längs des Stromfadens proportional. Der Proportionalitätsfaktor M 2 bestimmt das gegenseitige Größenverhältnis. Für inkompressible Strömung, M 2 1, überwiegt die Änderung der Geschwindigkeit die der Zustandsgrößen , p, T bei weitem. Im Hyperschall, M 2 1, ist es umgekehrt. In Schallnähe, M ≈ 1, sind alle Änderungen von gleicher Größenordnung. Berücksichtigen wir in (9-28) die Kontinuität mit dem Stromfadenquerschnitt A(x), so wird 1 dw 1 1 dA · = 2 · · w dx M − 1 A dx oder umgeschrieben auf die Mach-Zahl κ−1 2 1 dM 1 + 2 M 1 dA · = . · · M dx A dx M2 − 1
(9-29)
Für beschleunigte Strömung für
M1
dA < 0, dx
für
dM > 0 verlangt dies dx M=1
dA = 0 und für dx
dA > 0. dx
Diese gewöhnliche Differenzialgleichung lässt sich geschlossen integrieren: κ+1 A 1 κ−1 2 2(κ − 1) (M − 1) = 1+ A∗ M κ+1 1 = , 1 κ − 1 ∗2 κ−1 (M − 1) M∗ 1 − 2
(9-30)
mit A∗ als kritischem (engsten) Querschnitt bei M = 1 und M ∗ = w/a∗ als kritischer Mach-Zahl. Eine Übersicht über alle möglichen Düsenströmungen in Abhängigkeit vom jeweiligen Gegendruck erhält man aus einer Richtungsfelddiskussion von (9-29). Eine Beschleunigung der Strömung, dM/dx > 0, erfordert im Unterschall eine Querschnittsverengung (dA/dx < 0) und im Überschall eine Erweiterung (dA/dx > 0). Schallgeschwindigkeit (M = 1) ist nur am engsten Querschnitt (dA/dx = 0) möglich. Diese ideale Lavaldüse lässt sich nur bei einem ganz bestimmten Druck am Düsenende realisieren (Bild 9-16). Alle Kurven gehen durch den linken Eckpunkt, der dem Kesselzustand entspricht. Wir senken den Ge-
Bild 9-16. Machzahlverlauf in der Lavaldüse bei verschiedenen Gegendrücken
9 Gasdynamik
gendruck kontinuierlich ab und erhalten der Reihe nach reine Unterschallströmungen, bis die Schallgeschwindigkeit am engsten Querschnitt erreicht, aber nicht überschritten wird. Eine weitere Druckabsenkung macht zunächst einen senkrechten Stoß – von Überschall auf Unterschall – erforderlich, dann sogar einen schiefen Stoß, bis wir den zur idealen Lavaldüse passenden Druck erreichen. Wird der Druck noch weiter abgesenkt, kommt es anschließend zu einer Expansion am Düsenende, die im Extremfall bis zur Maximalgeschwindigkeit (9-27) führt. Die quantitative Ermittlung einer Lavaldüsenströmung benutzt neben (9-30) die aus dem Energiesatz und der Isentropie folgenden Beziehungen (Bild 9-17): T 1 κ − 1 ∗2 M , = =1− κ−1 2 T0 κ+1 M 1+ 2
1 , = (9-31)
0 1 κ−1 2 κ−1 M 1+ 2 1 p . = p0 κ κ−1 2 κ−1 M 1+ 2 Dadurch ergeben sich insbesondere die Proportionalitäten zwischen kritischen Größen und Ruhewerten (Zahlenwerte für Luft) ∗ 2 a T∗ 2 = 0,833 , = = a0 T0 κ+1 1 2 κ−1
∗ (9-32) = = 0,634 ,
0 κ+1 κ 2 κ−1 p∗ = = 0,528 . p0 κ+1
Bild 9-17. T, , p als Funktion der Mach-Zahl
Schreibt man (9-30) mit (31) als Funktion von p, so wird κ−1
∗ a∗ A κ+1 = ∗ = 8 1 κ−1
w A 2 p κ p κ 1 − p∗ κ + 1 p∗ κ κ−1 2 κ−1 κ+1 κ+1 = (9-33) 8 1 κ−1 κ p κ p 1− p0 p0 Mit den Gleichungen (11) kann ein senkrechter Verdichtungsstoß eingearbeitet werden. Beispiel: Gegeben sind bei einer Lavaldüse die Stoß-Mach-Zahl MS = 2 und das Flächenverhältnis A1 /A∗ = 3. Erfragt ist das erforderliche Druckverhältnis p1 /p0 und AS /A∗ , d. h. die Stoßlage (Bild 9-18). Aus (9-30) folgt mit MS = 2, AS /A∗ = 1,686 und da∗ mit die Stoßlage. Weiter kommt aus (9-14) A∗ /Aˆ =
ˆ 0 / 0 p∗ /p0 = 0,528, entsteht die Frage, wie diese Strömung zustande kommt (Anlaufen!). Am einfachsten denkt man sich am Düsenende den Druck abgesenkt, bis kritische Zustände eintreten. Sodann wird p1 /p0 quasistationär auf 0,68 angehoben, und die oben betrachtete Strömung stellt sich
Bild 9-18. Beispiel einer Lavaldüsenrechnung
.
E193
E194
E Technische Mechanik / Mechanik fester Körper
ein. In der Praxis handelt es sich beim Starten um einen komplizierten instationären Vorgang, bei dem Wellen stromauf und stromab laufen, bis der stationäre Endzustand erreicht ist. Oft treten bei technischen Anwendungen mehrere Einschnürungen in der Düse auf. Der Fall von zwei engsten (A1 , A3 ) und einem weitesten Querschnitt (A2 ) enthält alles Wesentliche. Ist A1 = A3 (Bild 9-19), so herrschen in 1 und 3 gleichzeitig kritische Verhältnisse. Dort liegt jeweils ein Sattelpunkt der Integralkurven vor, während es sich bei 2 um einen Wirbelpunkt handelt. Das entnimmt man der aus (9-29) folgenden Beziehung in den singulären Punkten 8 2 ∗ d A κ+1 1 dM =± · ∗· . dx 4 A dx2 Ein Verdichtungsstoß zwischen 1 und 3 ist nicht möglich. Die Strömung würde sonst bereits vor dem zweiten engsten Querschnitt 3 auf Schall führen (Blockierung!). Die Abnahme der Ruhegrößen (9-14) und damit der kritischen Werte (9-32) reduziert den Massenstrom. Der Querschnitt 3 ist zu gering, um die Kontinuität zu gewährleisten. Falls A1 < A3 (Bild 9-20), so liegt das Modell eines Überschallkanales vor. Die Integralkurve mit Schalldurchgang in 1 führt auf Überschall in der Messstrecke, 3 eingeschlossen. Ein Stoß zwischen 1 und 3 ist möglich, wenn der Verstelldiffusor in 3 gerade um so viel geöffnet wird, wie die Abnahme der Ruhegrößen vorschreibt. Mit der Stoß-Mach-Zahl MS und der durch (9-14) gegebenen Funktion f (M) gilt A1 ˆ ∗ aˆ ∗ ˆ 0 pˆ 0 = ∗ ∗ = = = f (MS ) . A3 a
0 p0 Beispiel. Wie weit muss bei den Daten des obigen Beispiels der Verstelldiffusor (3 in Bild 9-20) geöffnet werden, um dort mindestens auf kritische Verhältnisse zu führen? A3 /A1 Aˆ ∗ /A∗ = 1,387. Im Prinzip sind zwei Stoßlösungen s, s möglich, s entspricht einem stabilen, s einem instabilen Zustand. Im Fall A1 > A3 handelt es sich um eine mit Unterschall durchströmte Messstrecke, die frühestens in 3 auf Schall führen kann.
Bild 9-19. Lavaldüse mit zwei Einschnürungen A1 = A3
Bild 9-20. Lavaldüse
mit A1 < A3 , s, s Stoßlösungen
zwei
Einschnürungen
Liegen mehrere engste Querschnitte vor, so schreibt der absolut kleinste das Auftreten kritischer Werte vor. Ob im weiteren Verlauf Stöße möglich sind, hängt vom Öffnungsverhältnis der engsten Querschnitte ab.
9.5 Zweidimensionale Strömungen Unter der Voraussetzung differenziierbarer Strömungsgrößen, d. h. in Gebieten ohne Stöße, folgen aus den Erhaltungssätzen in Integralform die zugehörigen Differenzialgleichungen. Im stationären Fall ohne Massenkräfte, Reibung und Wärmeleitung kommen aus (9-1) die Kontinuitätsgleichung ∂( u) ∂( v) + =0, ∂x ∂y
(9-34)
9 Gasdynamik
9.5.1 Kleine Störungen, M∞ ≶ 1
aus (9-2), (9-2a) die Euler-Gleichungen u
∂u 1 ∂p ∂u +v =− · , ∂x ∂y
∂x
(9-35a)
u
∂v 1 ∂p ∂v +v =− · , ∂x ∂y
∂y
(9-35b)
und aus (3), (3a) die Aussage, dass die Entropie längs Stromlinien konstant ist. Elimination von p und
führt zur gasdynamischen Grundgleichung v2 ∂v u2 ∂u + 1− 2 1− 2 a ∂x a ∂y uv ∂u ∂v + (9-36) − 2 = 0. a ∂y ∂x Diese Gleichung gilt auch dann, wenn die Entropie von Stromlinie zu Stromlinie variiert, was z. B. bei Hyperschallströmungen hinter stark gekrümmten Kopfwellen der Fall ist. Schließen wir dies im Augenblick aus, d. h. setzen wir Isentropie voraus, so gilt die Wirbelfreiheit (8-29). Mit dem Geschwindigkeitspotenzial Φ wird wegen u = ∂Φ/∂x, v = ∂Φ/∂y aus (9-36) ⎞ ⎛ ⎜⎜⎜ Φ2y ⎟⎟⎟ Φ x Φy Φ2x 1 − 2 Φ xx + ⎜⎜⎝1 − 2 ⎟⎟⎠ Φyy − 2 2 Φ xy = 0, a a a (9-37a) κ−1 2 a2 = a2∞ + (9-37b) w∞ − Φ2x + Φ2y . 2 Der Index ∞ bezeichnet den Anströmzustand. Gleichung (9-37a,b) ist eine quasilineare partielle Differenzialgleichung 2. Ordnung. Der Typ hängt von der jeweiligen Lösung ab. Er ist für ⎧ ⎪ < a elliptisch ⎪ ⎪ ⎪ ⎪ ⎪ (Unterschall) , ⎪ ⎪ ⎪ ⎪
⎪ ⎪ ⎨ = a parabolisch w = Φ2x + Φ2y ⎪ ⎪ ⎪ (Schall) , ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ > a hyperbolisch ⎪ ⎪ ⎪ ⎩ (Überschall) .
(38a) (38b)
Verursacht ein Körper nur eine geringe Abweichung der wenig angestellten Parallelströmung (u∞ , v∞ ≈ εu∞ ), so machen wir den Störansatz Φ(x, y) = u∞ [x + ϕ(x, y)] + u∞ [εy + ϕ(x, y)] (9-39) @ABC @ABC I
II
I beschreibt hierin den nichtangestellten Fall, d. h. den Dickeneinfluss, II dagegen den Anstellungseffekt. Trägt man (9-39) in (9-37a,b) ein und linearisiert bezüglich Dicke und Anstellung, so erhält man die für ϕ und ϕ gültige lineare Differenzialgleichung 2 1 − M∞ (9-40a) ϕ xx + ϕyy = 0 . Die Randbedingung der tangentialen Strömung z. B. am schlanken nichtangestellten Körper (Dicke τ, Profilklasse q(x)) ist (Bild 9-21) dq v(x, 0) dh =τ . = ϕy (x, 0) = u∞ dx dx
(9-40b)
Die Charakteristiken (Mach’sche Linien) für (9-40a) lauten ξ = x− η= x+
2 − 1 y = const , M∞ 2 M∞ − 1 y = const .
Die allgemeine – sog. d’Alembert’sche – Lösung ist
2 2 ϕ = F1 x − M∞ − 1 y + F2 x + M∞ − 1 y . Da für M∞ > 1 die Strömung an der Profiloberseite unabhängig ist von der an der Unterseite, gilt die Ackeret-Formel [14] v u − u∞ y>0 u∞ =∓ . 2 u∞ M∞ − 1 y < 0
(9-41)
(38c)
Die Charakteristiken im Fall (38c) heißen Mach’sche Linien und begrenzen den Einflussbereich kleiner Störungen im Stromfeld.
Bei Anstellung tritt rechts die Differenz v − v∞ auf. In jedem Fall hängt die u-Störung in einem Punkt eines Überschallfeldes nur vom lokalen Strömungswinkel ab. Für M∞ < 1 liegt dagegen stets eine glo-
E195
E196
E Technische Mechanik / Mechanik fester Körper
verteilungen, lassen sich allgemeinere Umströmungsprobleme erfassen. Die in
2| , cA ∼ ε , cA ∼ f , cA ∼ 1/ |1 − M∞
2 −1 cW ∼ τ2 , cW ∼ ε2 , cW ∼ f 2 , cW ∼ 1/ M∞ (9-43)
Bild 9-21. Mach’sche Linien bei der Überschallumströmung eines schlanken Profiles
bale Abhängigkeit vor (Kapitel 8). Bei einer Ablenkung in die Anströmung (ϑ > 0) liefert (9-41) eine Untergeschwindigkeit (Eckenkompression), bei ϑ < 0 eine Übergeschwindigkeit (Eckenexpansion). Für den Druck führt die Linearisierung der BernoulliGleichung zu p − p∞ u − u∞ = −2 . (9-42) Cp =
∞ 2 u∞ u∞ 2 Die Untergeschwindigkeit an der Profilvorderseite gibt damit einen Überdruck, die Übergeschwindigkeit auf der Rückseite einen Sog. Beides liefert eine Kraft in Strömungsrichtung, den sog. Wellenwiderstand (siehe z. B. (9-24)). Mit den Definitionen (9-24) und (9-25) für Auftriebs- und Widerstandsbeiwerte ergeben sich die drei elementaren Effekte (Dicke, Anstellung und Wölbung), die für das Verständnis der wirkenden Kräfte wichtig sind. Durch lineare Überlagerung dieser drei Effekte, gegebenenfalls bei komplizierten Dicken- und Wölbungs-
Dickeneffekt Parabelzweieck τ 0
0
0
cA
0
4
τ2 16 · 2 −1 3 M∞ h(x) = 2τx(1 − x)
∂ϑ + ∂ξ
√
M 2 − 1 ∂w · =0 w ∂ξ
auf η = const ,
dy = tan(ϑ − α) , dx
0
cW
cW
Die gasdynamische Grundgleichung (9-36) und die Wirbelfreiheit (8-29) nehmen eine besonders einfache Form an, wenn man anstelle von x, y die charakteristischen Koordinaten ξ, η verwendet und von u, v auf w, ϑ übergeht. ξ = const, η = const beschreiben die links- bzw. rechtsläufige Mach’sche Linie, die mit der Stromlinie den Mach’schen Winkel α(sin α = 1/M) einschließt (Bild 9-22). Es gelten auf den Charakteristiken:
Wölbungseffekt gewölbte Platte f 0 f 4π 2 1 − M∞
0
M∞ > 1
9.5.2 Transformation auf Charakteristiken
Anstellungseffekt angestellte Platte ε 0 ε 2π 2 1 − M∞
cA M∞ < 1
enthaltenen Ähnlichkeitsaussagen gelten im Rahmen der Linearisierung allgemein und entsprechen der Prandtl-Glauert’schen Regel. Bei komplizierten Profilen ändern sich die Werte der Koeffizienten, die Abhängigkeiten von den Parametern τ, ε, M∞ bleiben unverändert. Man kann damit leicht innerhalb einer Profilklasse Geschwindigkeits- und Druckverteilungen sowie cA , cW bei Änderung von τ, ε, f, M∞ ermitteln.
4
ε 2 −1 M∞
ε2 2 −1 M∞
0 f2 64 · 2 −1 3 M∞ h(x) = 4 f x(1 − x)
(9-44a)
9 Gasdynamik
∂ϑ − ∂η
√
M 2 − 1 ∂w · =0 w ∂η
auf ξ = const ,
dy = tan(ϑ + α) , dx
(9-44b)
oder in Differenzialform zusammengefasst: dϑ ±
√
M2 − 1
dw = 0. w
(9-44)
Längs der Mach’schen Linien sind damit die Änderungen von Strömungswinkel ϑ und Geschwindigkeit w einander proportional. Bei kleinen Störungen (Linearisierung) kommt man zur Ackeret-Formel (9-41) zurück:
√ dw 2 − 1 Δw ≈ Δϑ ± M∞ dϑ ± M 2 − 1 w w
v u − u∞ 2 −1 ≈ ± M∞ =0 . u∞ u∞ Entscheidend ist, dass in jeder Gleichung (45a,b) nur noch Ableitungen nach einer unabhängigen Variablen ξ oder η auftreten. Dies gestattet eine allgemeine Integration in der Hodografenebene. Mit der Normierung M = 1, ϑ = ϑ∗ wird ⎧ ⎪ ⎪ κ−1 2 ⎨ κ+1 ∗ arctan (M − 1) ϑ −ϑ = ∓⎪ ⎪ ⎩ κ−1 κ+1 ' √ 2 (45) − arctan M − 1 , =∓
2 (M 2 − 1)3/2 + ..., 3 κ+1
(M ≈ 1) . (9-45a)
Es handelt sich um eine Epizykloide zwischen dem
Schallkreis w = a∗ und dem mit der Maximalgeschwindigkeit (9-27) w = wmax = (κ + 1)/(κ − 1) a∗ . In Schallnähe (M ≈ 1) tritt eine Spitze auf (9-45a). Im 2 , M 2 1) gilt mit der Normierung Hyperschall (M∞ M = M∞ , ϑ = ϑ∞ : 2 1 1 ϑ − ϑ∞ = ∓ − (9-46a) + ... κ − 1 M∞ M Die Epizykloide läuft tangential in w = wmax ein. Aus (45) ergibt sich der maximale Umlenkwinkel ϑmax bei Expansion eines Schallparallelstrahles ins Vakuum (M → ∞): ⎛ ⎞ ⎟⎟ π ⎜⎜⎜⎜ κ + 1 ∗ − 1⎟⎟⎟⎠ ϑmax − ϑ = ∓ ⎜⎝ 2 κ−1 ⎧ ⎪ 90◦ κ = 5/3 = 1,66 ⎪ ⎪ ⎪ ⎨ (9-46) = ∓⎪ 130,5◦, κ = 7/5 = 1,40 ⎪ ⎪ ⎪ ⎩ 148,1◦, κ = 4/3 = 1,33 . Durch Drehung um den Ursprung entsteht das Epizykloidendiagramm (Bild 9-23), das zusammen mit dem Busemann’schen Stoßpolarendiagramm (Bild 9-11) zur Berechnung von Überschallströmungsfeldern benutzt wird. Im Ausgangspunkt stimmen Epizykloide und Stoßpolaren in Tangente und Krümmung überein [15], d. h., schwache Stöße verlaufen näherungsweise isentrop. Siehe hierzu die frühere Anmerkung über die RH-Kurve und die Isentrope (Bild 9-3). Die Tangente an die Epizykloide und die Stoßpolare wird durch die Ackeret-Formel (9-41) gegeben. Die Integration von (45a,b) ist in der Hodografenebene allgemein durchgeführt. Wichtig ist die Übertragung in die Strömungsebene und gegebenenfalls die Einarbeitung von Verdichtungsstößen. Dies erfolgt meistens auf numerischem Wege durch Differenzenapproximation der Charakteristikengleichungen. 9.5.3 Prandtl-Meyer-Expansion [16, 17]
Bild 9-22. Mach’sche Linien ξ = const und η = const
durch P
Für die zentrierte Eckenexpansion eines Schallparallelstrahles (Bild 9-24) ist auch in der Strömungsebene eine explizite Lösung möglich. Auf allen Strahlen
E197
E198
E Technische Mechanik / Mechanik fester Körper
Bild 9-23. Epizykloiden in der Hodografenebene
durch die Ecke sind die Strömungsgrößen konstant, d. h., sie sind nur von ϕ abhängig. Für die Radial- (wr ) und die Umfangskomponente wϕ der Geschwindigkeit gilt [18] κ−1 wr = wmax sin ϕ, κ+1 κ−1 ϕ . (9-47) wϕ = a = a∗ cos κ+1 Bei der Expansion 0 ϕ ϕmax = (κ + 1)/(κ − 1) · π/2 wächst wr von 0 auf wmax an, während wϕ von a = a∗ auf 0 abfällt. Der Grenzwinkel ϕmax entspricht (46). Für die Stromlinie durch den Punkt ϕ = 0, r = r0 gilt r0 r= . κ+1 ⎞ ⎛ ⎜⎜⎜ κ − 1 ⎟⎟⎟ κ − 1 ⎜⎝cos ϕ⎟⎠ κ+1
Bild 9-25. Überschallexpansion in der Strömungsebene und im Hodografen
Für ϕ → ϕmax geht r → ∞. Der ganzen Strömungsebene entspricht im Hodografen der Epizykloidenast von ∗ = (κ + 1)/(κ − 1) M = M ∗ = 1 bis Mmax bei der Umlenkung (9-46). Die Abbildung entartet also. Bei der Expansion eines Überschallparallelstrahles (M1 > 1, ϑ1 = 0) längs einer gekrümmten Wandkontur (Bild 9-25) ist die Darstellung analog. Die (ξ = const)-Charakteristiken sind geradlinig, da die Expansion an ein Gebiet konstanten Zustandes anschließt, sog. einfache Welle. Die (η = const)-Kurven sind zur Wand gekrümmt. Im Hodografen entspricht der Expansion das Stück auf der Epizykloide von P1 → P6 . 9.5.4 Düsenströmungen
Bild 9-24. Prandtl-Meyer-Expansion in der Strömungsebe-
ne
Mit den Charakteristikengleichungen (45a,b) kann man das zweidimensionale Strömungsfeld im Überschallteil von Lavaldüsen (9.4.1) berechnen. Dazu schreibt man (45a,b) in Differenzenapproximation und diskretisiert gleichzeitig die Anfangs- oder Randvorgaben. Sind w und ϑ auf der Anfangskurve A bekannt, z. B. in den Punkten P und Q (Bild 9-26), so kann man im jeweiligen Schnittpunkt der Charakteristikenrichtungen, z. B. R, wR und ϑR , aus dem
9 Gasdynamik
aus (45a,b) folgenden linearen Gleichungssystem bestimmen:
wR − wP ϑR − ϑP − MP2 − 1 = 0 , ζ = const . wP (9-48a)
− w w R Q ϑR − ϑQ + MQ2 − 1 = 0 , ζ = const . wQ (9-48b) Durch wiederholte Anwendung derselben Operationen kann man alle Strömungsdaten im Einflussbereich der Anfangswerte berechnen. Dasselbe Verfahren kann in der Hodografenebene mithilfe der Epizykloiden durch die Bildpunkte von P und Q durchgeführt werden. Liegt in R ein Rand vor, so führt nur eine Charakteristik zu ihm (z. B. η = const) und es gilt (48b). Im Fall der festen Wand ist ϑR dort vorgeschrieben, und wir erhalten wR . Handelt es sich um einen freien Strahlrand (z. B. am Düsenaustritt), so
kennen wir dort den Druck und damit wR . Gleichung (48b) liefert dann die Strahlrichtung ϑR . Bei einer Lavaldüse ist die Kontur vorgegeben (Bild 9-27a). Hinter dem engsten Querschnitt seien die Überschallanfangswerte (transsonische Lösung) z. B. für 1, 2, 3 und 4 bekannt, 5, 6, 7, 9, 10 ergeben sich durch Lösung des Anfangswertproblems, 8 und 11 aus dem Randwertproblem. So kann das gesamte Überschallstromfeld zwischen Düsenkontur und Symmetrieachse sukzessive bestimmt werden. Handelt es sich dagegen um die Bestimmung einer Parallelstrahldüse, wie sie z. B. in der Messstrecke eines Überschallkanales benötigt wird, so ist die Kontur nur bis zum Anfangsquerschnitt gegeben (Bild 9-27b). Die Expansion am Rand (9-8) erfolgt soweit, bis auf der Achse A die gewünschte Austrittsgeschwindigkeit wA erreicht ist. Die durch A gehende (ξ = const)-Charakteristik (wA , ϑA = 0) ist geradlinig. Nun werden in dem durch die beiden Charakteristiken ξ = const und η = const begrenzten Winkelbereich mit Spitze in A die Strömungsdaten (w, ϑ) berechnet. Die gewünschte Düsenkontur ergibt sich als Stromlinie, die auf das Richtungsfeld passt (Bild 9-28). 9.5.5 Profilumströmungen
Bild 9-26. Zur Lösung der Anfangswertaufgabe
Bild 9-27. Lavaldüse. a Charakteristikenverfahren, b Kon-
struktion der Parallelstrahldüse
An der Profilspitze soll für M∞ > 1 ein anliegender Stoß auftreten. Wir erläutern das Wesentliche zunächst an der Keilströmung (Bild 9-29). Eingetragen sind neben dem Stoß die Mach’schen Linien, die hier geradlinig sind. Bei geringer Überschallanströmung (M∞ = 1,20) handelt es sich um einen schwachen, steilen Stoß, der winkelhalbierend zwischen den linksläufigen Mach’schen Linien vor und hinter dem Stoß verläuft. Je größer M∞ ist, desto mehr neigt sich der Stoß zur Keiloberfläche, seine Intensität nimmt dabei zu. Die Beeinflussung der Strömung durch den Keil beschränkt sich bei solchen Hyperschallströmungen auf den schmalen Sektor zwischen Stoß und Keiloberfläche. Liegt anstelle eines Keiles ein gekrümmtes Profil vor, so muss die Rechnung in Differenzenform unter Verwendung der Charakteristiken- und der Stoßgleichungen erfolgen. An der Körperspitze beginnen wir lokal mit der Keillösung. Sodann rechnen wir (Bild 9-29) längs ξ = const mit (44b) vom Körper an den Stoß heran (Stoßrandwertaufgabe). Im Hodografen führt dies
E199
E200
E Technische Mechanik / Mechanik fester Körper
Bild 9-28. Berechnete Lavaldüsen, Austrittsmachzahl M = 3, κ = 1,4. a Keildüse, b ebene Parallelstrahldüse [25]
auf den Schnitt einer Epizykloiden mit der Stoßpolaren. Dadurch ergeben sich alle Strömungsdaten hinter dem Stoß sowie eine abgeänderte Neigung Θ desselben. Damit kann die Rechnung im Feld zwischen Stoß und Körper fortgesetzt werden. Bild 9-30 zeigt den Stoß sowie das Charakteristikennetz für ein Parabelzweieck (τ = 0,10) bei M∞ = 2.
9.5.6 Transsonische Strömungen
In transsonischen – schallnahen – Strömungen ist im ganzen Strömungsfeld die Teilchengeschwindigkeit etwa gleich der Schallgeschwindigkeit (Signalgeschwindigkeit). Der Körper bewegt sich also nahezu mit der Geschwindigkeit, mit der von ihm Störungen
9 Gasdynamik
Bild 9-29. Zur Überschallströmung am Keil
die Kopfwelle in der Regel ab. Zwischen Stoß und Körper liegt ein lokales Unterschallgebiet. Durch die Verdrängung am Körper kommt es anschließend zu einer Beschleunigung auf Überschall bis zur Schwanzwelle. Die Grenz-Machlinie ist die letzte vom Körper ausgehende Charakteristik, die das Unterschallgebiet trifft, während die Einflussgrenze die vom Unterschallgebiet ausgehenden Störungen stromabwärts berandet. M∞ → 1 führt zum Grenzfall der Schallanströmung (Bild 9-31b). Die Schalllinie geht bis zum Unendlichen und die Strömung wird am Körper bis zur Schwanzwelle beschleunigt. Vergleicht man die Machzahlverteilungen auf dem Körper, so ändern sie sich in Schallnähe wenig, die sog. Einfrierungseigenschaft. Die Begründung ist die folgende: Ist M∞ 1 sehr wenig über 1, so steht die Kopfwelle als nahezu senkrechter Stoß in ˆ ∞ 1. Damit registriert das großer Entfernung mit M Profil die schallnahe Überschallanströmung quasi als Unterschallanströmung, d. h., die Strömungsdaten
Bild 9-30. Überschallströmung (M∞ = 2) um ein 10% dickes Parabelzweieck
ausgesandt werden. Die typischen Eigenschaften solcher Felder erkennt man bereits bei der Umströmung schlanker Profile (Bild 9-31a–c). Bei schallnaher Unterschallanströmung M∞ 1 (Bild 9-31a) entsteht in der Umgebung des Dickenmaximums ein lokales Überschallgebiet, das stromabwärts in der Regel durch einen Verdichtungsstoß abgeschlossen wird. Die lokale Machzahlverteilung auf der Profilstromlinie veranschaulicht die Strömung. Vor dem Körper erfolgt ein Abbremsen bis zum Staupunkt, danach Beschleunigung auf Überschall; im Stoß Sprung auf Unterschall mit anschließender Nachexpansion; dann Verzögerung zum hinteren Staupunkt mit nachfolgender Annäherung an die Zuströmung. Im schallnahen Überschall M∞ 1 (Bild 9-31c) löst
Bild 9-31. Stromfelder und Machzahlverteilungen. a M∞ 1, b M∞ = 1, c M∞ 1
E201
E202
E Technische Mechanik / Mechanik fester Körper
auf dem Profil ändern sich von M∞ 1 nach M∞ 1 nur noch unwesentlich. Für schlanke Profile, die nur kleine Störungen der Parallelströmung hervorrufen, gilt jetzt statt (9-40a) 2 1 − M∞ (9-49a) ϕ xx + ϕyy = f (M∞ , κ)ϕ x ϕ xx ,
2 2 f (M∞ , κ) = M∞ 2 + (κ − 1)M∞ → κ + 1 für M∞ → 1 ; dq dh =τ . ϕy (x, 0) = dx dx
(9-49b)
Der rechts in (9-49a) auftretende nichtlineare Term ist der erste in einer Entwicklung und muss berücksichtigt werden, weil in Schallnähe durchaus 1−
2 M∞
gelten kann. Insbesondere im Grenzfall M∞ → 1 wird ϕy (x, 0) = τ
dq . dx
(9-50)
Es handelt sich um quasilineare partielle Differenzialgleichungen. Die Schwierigkeiten bei der Lösung derselben (numerisch oder analytisch) entsprechen der physikalischen Problematik (Bild 9-31a bis c). Allerdings sind Ähnlichkeitsaussagen möglich. Die Prandtl-Glauert-Transformationen der linearen Theorie gelten auch hier, wenn Profile betrachtet werden, für die der schallnahe Kármán’sche Parameter [19] konstant ist: χ=
2 | |1 − M∞ . 2/3 (κ + 1) τ2/3
Bild 9-33. Zur Reflektion der Mach’schen Linien an der Ka-
nalwand
≈ f (M∞ , κ)ϕ x ≈ (κ + 1)ϕ x
ϕyy = (κ + 1)ϕ x ϕ xx ,
Bild 9-32. Zur Strömung im blockierten Kanal
(9-51)
Vergleicht man Profile verschiedener Dicke τ miteinander, so müssen die Machzahlen M∞ dementsprechend gewählt werden. Die PrandtlMeyer-Expansion (45a) enthält sofort die Aussage χ = const, wenn man die Umlenkung als Maß für die Dicke betrachtet. Dem Parameter (9-51) kommt eine Schlüsselrolle zu. Aus (9-49a) und (9-41) folgt z. B. als Abgrenzung χ 1 lineare Theorie , χ 1 transsonische, nichtlineare Theorie . Das heißt, der Gültigkeitsbereich der jeweiligen Theorie hängt sowohl von τ als auch von M∞
ab. Viele charakteristische Eigenschaften bei der Profilumströmung sind durch (9-51) bestimmt. Für die Stoßlage (Bild 9-31a) gilt xs /l = g(χ), wobei g allein durch die Profilklasse gegeben ist. Für den Stoßabstand von der Körperspitze (Bild 9-31c) ergibt sich d/l = f (χ). Hier kann für alle Profile die asymptotische Aussage f ∼1/χ2 gemacht werden [20]. Wann zum ersten Mal am Dickenmaximum Schall erreicht wird (kritische Mach-Zahl), wann der abschließende Stoß in die Schwanzwelle übergeht, wann die Kopfwelle ablöst, ist allein durch einen charakteristischen χ-Wert bestimmt. Die experimentelle Realisierung transsonischer Strömungen bereitet Schwierigkeiten. Im schallnahen Unterschall kommt es zur Blockierung (vgl. 9.4.1), wenn die Schallinie vom Körper bis zur Gegenwand reicht (Bild 9-32). Die Stromfadentheorie liefert ⎧ ⎪ κ + 1 hmax ⎪ ⎪ ⎪ · 1− zweidimensional , ⎪ ⎪ ⎨ b 2 M∞ Block = ⎪ ⎪ ⎪ κ + 1 hmax rotations⎪ ⎪ ⎪ · , ⎩1 − 2 b symmetrisch
hmax b M∞ Block
zweidimensional rotationssymmetrisch
0,01
0,05
0,89 0,99
0,75 0,95
9 Gasdynamik
Der Einfluss ist im ebenen Fall gravierend. Eine Steigerung von M∞ Block über die angegebenen Werte hinaus ist nur durch Änderung der Randbedingungen an der Gegenwand möglich (Absaugen, Adaption, usw.). Der Blockierungszustand dient häufig der Simulation der Schallanströmung. Bei M∞ > 1 werden die Mach’schen Wellen an der Kanalwand reflektiert (Bild 9-33). Für 1 b = tan α∞ 2 −1 l M∞ treffen sie nicht mehr auf den Körper und haben keinen Einfluss auf die Strömungswerte. Profilströmungen und Lavaldüsen-Lösung
Mit der transsonischen Lavaldüsen-Lösung kann man die Eigenschaften der Profilströmungen (Bild 9-31) bestätigen und die Ausgangswerte für das Charakteristikenverfahren (Bild 9-27 und 9-28) berechnen. Gleichung (9-50) hat die Polynomlösung ϕ(x, y) = Ax2 + 2A2 (κ + 1) xy2 +
A3 (κ + 1)2 4 y , 3 (9-52a)
u − a∗ = 2Ax + 2A2 (κ + 1)y2 , (9-52b) a∗ v 4 ϕy = ∗ = 4A2 (κ + 1) xy + A3 (κ + 1)2 y3 . (9-52c) a 3 Für A > 0 ist dies eine längs der x-Achse (Symmetrieachse der Düse) von Unterschall auf Überschall beschleunigte Strömung. Die Schalllinie (ϕ x = 0) ist eine Parabel (Bild 9-34) x . y=± − A(κ + 1) ϕx =
Die Wandstromlinie (y(0) = y∗ ) folgt durch Integration aus (9-52c) 4 y − y∗ = 2A2 (κ + 1)y∗ x2 + A3 (κ + 1)2 y∗3 x , 3 mit dem Scheitel bei xs = −A(κ + 1)/3 · y∗2 . Für die Charakteristiken (44a,b) kommt mit |ϑ| α und M∞ → 1 dy 1 = tan(ϑ ∓ α) = ∓ tan α = ∓ √ dx M2 − 1
Bild 9-34. Lavaldüsenströmung
1
=∓
2 − 1 + f (M , κ) M∞ ∞
=∓
u − u∞ u∞
1
(κ + 1)
u − a∗ a∗
die gewöhnliche Differenzialgleichung 1. Ordnung 1 dy =∓ . dx 2A(κ + 1)[x + A(κ + 1)y2 ] Alle Mach’schen Linien besitzen Spitzen mit vertikaler Tangente √ auf der Schallinie. Grenz(−2x)/(A(κ + 1)), Einflussgrenze: Machlinie: y = ± √ y = ± x/(A(κ + 1)). Die Schalllinie und die GrenzMachlinie (Bild 9-34) treffen (A, B) bereits vor dem engsten Querschnitt (Scheitel S) auf die Düsenwand, die Einflussgrenze danach. Dies entspricht völlig der Profilströmung (Bild 9-31c). Die Ergebnisse können mit (R∗ Krümmungsradius) 1 A= 2 (κ + 1)R∗ y∗ auf eine vorgegebene Düse umgerechnet werden. Für den Massenstrom m ˙ ergibt sich (Düsenbreite b [21]: 2 m ˙ κ + 1 y∗ = 1 − ,
∗ a∗ y∗ b 90 R∗ eine in der Regel kleine Abnahme gegenüber dem Stromfadenwert. Im achsensymmetrischen Fall ist lediglich rechts im Nenner 90 durch 96 zu ersetzen. Einordnung der transsonischen Strömungen
Zur Einordnung stellen wir die Größenordnungen der Geschwindigkeitsstörungen auf schlanken nichtangestellten Körpern (τ 1) zusammen [22]:
E203
E204
E Technische Mechanik / Mechanik fester Körper
M∞ u − u∞ u∞ v u∞ u − u∞ u∞
1
1
τ
allein im Impulssatz über die Wandschubspannung τw = (λ/4)(ρ/2)w2 eingeht. Für die Widerstandszahl λ gilt hierin im Allgemeinen wdh w · 4A = . (10-1) λ = f (Re, M) , Re = ν ηU
zweidimensional
τ2
————–τ————– τ2 ln τ
τ2
τ2 ln τ
achsensymmetrisch
τ2
Während also für M∞ ≶ 1 im zweidimensionalen Fall u- und v-Störungen stets von gleicher Größenordnung sind, ist in Schallnähe die u-Störung größer und im Hyperschall kleiner als die v-Störung. Das liegt an den unterschiedlichen physikalischen Strukturen dieser Strömungsfelder. Auftriebs- und Widerstandsbeiwerte
dh = 4A/U bezeichnet den hydraulischen Durchmesser des Rohres. Kontinuitätsbedingung: 1 dw 1 d
· + · =0, w dx dx Impulssatz: 1 λ 1 1 dw 1 dp · + =− · · · , w dx κM 2 p dx 2 dh
1
cA
2πε
ε = 5◦
0,55
1
0,84
0,35 √ (M∞ = 2)
cW τ = 0, 10
≈1 5, 47τ5/3 (κ + 1)1/3
>1
2 −1 M∞
0,088
0,04 √ (M∞ = 2)
2 −1 M∞
(10-2c)
(κ + 1)ε2 0,018
1 4τ2
1 d 1 dT 1 dp · + · − · =0,
dx T dx p dx
1 4ε
Der Wert bei Schall ist bemerkenswert groß [23]. Der Widerstandsbeiwert cW für das Rhombusprofil [24]: M∞
(10-2b)
Zustandsgleichung:
Wichtig für die Anwendungen ist der Auftriebsbeiwert cA der ebenen Platte bei geringer Anstellung (ε 1): M∞
(10-2a)
2τ3 0,002
10 Gleichzeitiger Viskositätsund Kompressibilitätseinfluss 10.1 Eindimenionale Rohrströmung mit Reibung In diesem Kapitel werden Kompressibilität und Reibung in einfacher Form gleichzeitig berücksichtigt. Wir benutzen ein Modell, bei dem die Reibung
Machzahlgleichung: 1 dT 1 dM 1 dw · − · − · =0. (10-2d) w dx 2T dx M dx Bei adiabater Strömung – gute Isolation des Rohres – benutzen wir w2 /2 + c p T = const, d. h. Energiesatz: 1 1 1 dT 1 dw · + · 2 · · =0. (10-2e) w dx κ − 1 M T dx Gleichungen (10-2a) bis (10-2e) beschreiben als gewöhnliche Differenzialgleichungen die Änderungen von p, , T, w, M mit der Rohrlänge x. Elimination ergibt 1 dM κ λ 1 − M2 = · · · . (10-3) κ − 1 2 M 3 dx 2 dh M 1+ 2 Durch Rohrreibung werden also Unterschallströmungen beschleunigt (dM/dx > 0), Überschallströmungen dagegen verzögert (dM/dx < 0). Ein Schalldurchgang ist dabei jedoch nicht möglich. Der Reibungs-
10 Gleichzeitiger Viskositäts- und Kompressibilitätseinfluss
einfluss wirkt hier ähnlich wie eine Querschnittsverengung bei reibungsloser Strömung (9-29). Integration von (10-3) bei λ = const und M = 1 bei x = 0 gibt 1 1 1− 2 κ M 2 κ+1 λ 1 ln 1 − + 1 − 2 = x . (10-4) 2κ κ+1 dh M Alle (stoßfreien) Strömungen im Rohr werden in normierter Form durch (10-4) beschrieben. Andere Randbedingungen erfordern eine Translation in xRichtung. Das zugehörige Diagramm von Koppe und Oswatitsch [1, 2] gestattet, den gleichzeitigen Einfluss von Reibung und Kompressibilität zu erfassen (Bild 10-1). Durch Messungen werden diese Kurve und damit das benutzte Modell gut bestätigt [3]. (10-4) entspricht qualitativ völlig dem Zusammenhang A/A∗ = f (M) bei der Lavaldüsenströmung (9-30). Für die Anwendungen ist die Umrechnung von M auf p an der Ordinate zweckmäßig: κ 2 κ−1 κ+1 p m ˙ max = · p0 m ˙ κ−1 2 (M − 1) M 1+ κ+1 0,528 (10-5) = , κ−1 2 (M − 1) M 1+ κ+1 mit m ˙ max = ∗ a∗ A als maximalem Massenstrom ohne Reibung und m ˙ = 1 w1 A als effektivem, durch die Reibung reduziertem Massenstrom. Eine Unterschallströmung wird im Rohr höchstens bis M2 = 1 beschleunigt, sofern (p2 /p0 ) · (m ˙ max /m) ˙ p∗0 /p0 = 0,528 ist. Die hierzu erforderliche Rohrlänge in Vielfachen von dh liefert (10-4). Eine Überschallströmung wird im Rohr verzögert. Hierbei kann, wenn die Rohrlänge nicht passt, d. h., wenn es im Rohr zu einer Reibungsblockierung (M = 1) kommt, ein Stoß auftreten (Bild 10-2). Die Stoßkurve genügt (9-11). Hinter dem Stoß liegt der oben besprochene Unterschallfall vor. Am Rohrende kommt es dann zur Schallgeschwindigkeit, wenn der Gegendruck genügend abgesenkt ist [4, 5]. Messungen zeigen, dass λ von M weitgehend unabhängig ist.
Bild 10-1. Druck- und Machzahlverteilung in Rohren mit
Reibung
Für die Re-Abhängigkeit gilt das Moody-ColebrookDiagramm (Bild 8-33). Die Reynolds-Zahl kann sich längs x durch η = η(T ) ändern. Meistens reicht es, einen konstanten Mittelwert zu nehmen. Beispiel: In den Anwendungen (Bild 10-1) sind häufig gegeben: p2; p0 , 0 , T 0 ;A, dh , l; κ, η; gefragt ist der einsetzende Massenstrom m. ˙ Am einfachsten ist das folgende Rechenverfahren [4], bei dem m ˙ zunächst als freier Parameter betrachtet wird. m ˙ max ist bekannt, Re = 1 w1 dh /η = md ˙ h /(Aη) und damit λ = F(Re).
1 w1 = m/A ˙ führt mit (9-33) zu p1 /p0 . Gleichung (10-5) gibt M1 . Mit l ergibt (10-4) M2 . Bild 10-1 führt zu p2 . Ist dies der vorgegebene Wert, so ist die Rechnung beendet. Ansonsten ist sie mit verändertem m ˙ erneut durchzuführen. Einfacher ist natürlich der Fall, dass m ˙ bekannt ist und z. B. nach der Rohrlänge l mit M2 = 1 gefragt wird.
Bild 10-2. Rohrströmung mit Reibung und Verdichtungs-
stoß
E205
E206
E Technische Mechanik / Mechanik fester Körper
Mach- und Reynoldszahlabhängigkeit tritt auch bei Verzögerungsgittern auf [8].
10.3 Grundsätzliches über die laminare Plattengrenzschicht Für Pr = ηc p /λ = 1 und (∂T/∂y)w = 0 gilt T w = 2 T 0 = T ∞ (1 + (κ − 1)M∞ /2). Die Ruhetemperatur T 0 stimmt hier mit der adiabaten Wandtemperatur T w überein. Bild 10-4 enthält auch den Fall anderer Temperaturrandbedingungen. Ist Pr 1, so gilt für die adiabate Wandtemperatur (Eigentemperatur) 2 /2). Der sog. RecoveryT w = T ∞ (1 √+ r(κ − 1) M∞ Faktor r = Pr gibt das Verhältnis der Erwärmung durch Reibung zu derjenigen durch adiabate Kompression an Bild 10-3. Kugelwiderstand
r=
als Funktion von M∞
√
Pr =
und Re∞ [6]
Zahlenbeispiel: p0 = 2 bar, 0 = 2,18 kg/m3, T 0 = 320 K; dh = 0,2 m, κ = 1,40, η = 19,4 · 10−6 Pa · s, m ˙ = 10 kg/s. Wir erhalten der Reihe nach: m ˙ max = 14,2 kg/s, Re = 3,3 · 106 , λ = 0,0096, p1 = 1,728 bar, 1 = 1,964 kg/m3 , T 1 = 306,88 K, M1 = 0,46, l = 30,2 m, p2 = 0,74 bar, M2 = 1.
10.2 Kugelumströmung, Naumann-Diagramm für cW [6]
Für Pr 1 unterscheidet sich also die Wandtemperatur T w von der Ruhetemperatur T 0 . Dies ist bei der Temperaturmessung in strömenden Gasen zu beachten. 2 1 führt die starke Erwärmung der GrenzBei M∞ schicht (p = const), / ∞ = T ∞ /T 1, zu einer Massenstromreduktion und damit zu einer Zunahme der Verdrängungsdicke δ1 (Bild 10-5) [9]. Mit dem Viskositätsansatz ω T η = ηw Tw sowie
Charakteristische Einflüsse von Kompressibilität (M∞ ) und Reibung (Re∞ ) zeigen sich bei der Kugelumströmung (Bild 10-3). Für M∞ 0,3 tritt kein wesentlicher Einfluss der Mach-Zahl auf. Dort liegt, insbesondere im kritischen Bereich (Re∞ = 4 · 105 ), die typische Abhängigkeit von der Reynolds-Zahl vor (Bild 8-50). Bei Steigerung der Mach-Zahl nimmt der Druckwiderstand erheblich zu (Newton’sches Modell, cW = 1). Jetzt tritt der Einfluss der ReynoldsZahl und damit verbunden der des Umschlages mit dem rapiden Abfall von cW zurück. Nun dominiert 2 die Mach-Zahl. Für M∞ 1 (Hyperschall) hängt cW weder von M∞ noch von Re∞ ab, es gilt die Einfrierungseigenschaft [7]. Ein ganz entsprechendes Verhalten bezüglich der
Tw − T∞ . T0 − T∞
mit
der
Newton’schen
Schubspannung
Bild 10-4. Temperaturprofile in der Grenzschicht bei er-
wärmter oder gekühlter Wand
10 Gleichzeitiger Viskositäts- und Kompressibilitätseinfluss
τ = η · ∂u/∂y gilt für den lokalen Reibungskoeffizienten ([10], S. 468) τw k cf =
= √ , ∞ 2 Re x u∞ 2 # T $1−ω
η w k2 ≈ = .
w ηw T
(10-6)
Durch Integration erhält man Bild 10-6 [11]. ω = 1 gibt den Wert der inkompressiblen Strömung. Der Machzahleinfluss ist generell relativ gering. Das liegt daran, dass durch die Aufheizung η zwar ansteigt, aber gleichzeitig ∂u/∂y abfällt (Bild 10-5). Dadurch ist eine Kompensation bei der Schubspannung und im Reibungskoeffizienten möglich. Für δ1 ergibt sich bei Pr = 1, (∂T/∂y)w = 0, ω = 1 M2 1 δ1 κ−1 2 ≈ √ M∞ ∼ √ ∞ , (10-7) 1+ l 2 k Re∞ k Re∞ woraus die starke Zunahme von δ1 mit M∞ ersichtlich ist. Stoß-Grenzschicht-Interferenz
Bei der Plattengrenzschicht tritt bei Überschallanströ2 mung ein schiefer Stoß auf, der für M∞ 1 am Rand der relativ dicken Grenzschicht verläuft (Bild 10-7). Stoßlage (Θ) und Stoßstärke ( pˆ /p) hängen von den Grenzschichtdaten ab. Diese wiederum werden von
Bild 10-6. Gesamtreibungsbeiwert für die Plattengrenzschicht beim Thermometerproblem (Pr = 1, κ = 1,40)
den Stoßgrößen beeinflusst. Das führt zum Phänomen der Stoß-Grenzschicht-Interferenz, das durch den folgenden Parameter K beschrieben wird: M3 1 schwache Interferenz , (10-8) K= √ ∞ Re∞ 1 starke Interferenz . K kann oft gedeutet werden als Tsien-Parameter [12] mit der Verdrängungsdicke δ1 anstelle der Körperdicke τ, K = M∞ τ. Ihm kommt eine ähnliche Bedeutung zu wie dem schallnahen (Kármán’schen) Parameter (9-51). Aus (9-46a) folgt z. B. eine entsprechende Aussage, falls bis ins Vakuum expandiert wird M∞ |ϑ − ϑ∞ | = 2/(κ − 1). Ist der Stoß weit stromab, so herrscht schwache Interferenz. Für den normierten Druck am Grenzschichtrand kommt mit der Ackeret-Formel (9-41): Cp =
p − p∞ u − u∞ v/u∞ = −2 =+2 , 1 2 −1 u ∞ M∞
∞ u2∞ 2
2 also mit M∞ 1 und (10-8) p 1 v/u∞ 2 − 1 = κM∞ 2 = κM∞ ϑ p∞ 2 M∞ M3 δ1 = κM∞ ∼ √ ∞ = K 0 . (1-12) ∂U α V,n
womit das Gesamtpotenzial μi,tot der Teilchenart i definiert ist. Wie in der Thermodynamik üblich, sind die Variablen, die beim Differenzieren konstant zu halten sind, als Indizes an den Ableitungen vermerkt.
S = Sα + Sβ + . . . + S ω .
(1-11)
F3
F4
F Technische Thermodynamik
Dabei ist T α die mit dem Gasthermometer messbare thermodynamische Temperatur der Phase, vgl. 1.4. Die Entropie hat somit die Dimension einer auf die Temperatur bezogenen Energie. 3. Entropie kann nicht vernichtet werden, aber es wird bei allen ablaufenden Vorgängen Entropie erzeugt. Gleichgewichtszustände geschlossener Systeme sind bei einem festen Wert der Energie durch ein Maximum der Entropie gekennzeichnet. Dies ist gleichbedeutend mit einem Minimum der Energie bei einem festen Wert der Entropie [1]. Als Nebenbedingung sind dabei alle Arbeitskoordinaten, d. h. alle zur Abgabe von Arbeit geeigneten Variablen des Gesamtsystems, konstant zu halten. Ein weiteres, oft als dritter Hauptsatz bezeichnetes Postulat lautet: 4. Die Entropie einer aus einem Reinstoff bestehenden Phase verschwindet in allen Gleichgewichtszuständen im Grenzfall T → 0. Die Entropie eines Systems kann durch Übergang von Wärme über die Systemgrenze, durch Übergang von Materie über die Systemgrenze sowie durch Erzeugung von Entropie im Inneren des Systems verändert werden. Die mit der Wärme über die Systemgrenze transportierte Entropie ist dS Q = dQ/T . T ist die immer positive thermodynamische Temperatur des Systems an der Stelle, wo die Wärme die Systemgrenze überquert. Die mit der Materie zu- oder abfließende Entropie S˙ ist eine Zustandsgröße, die anhand einer Zustandsgleichung für die Entropie z. B. in Abhängigkeit der Temperatur, des Druckes und der Zusammensetzung der Materie berechnet werden kann, vgl. Abschnitt 2. Die im Inneren des Systems erzeugte Entropie wird im Folgenden mit S irr bezeichnet, diese Größe ist niemals negativ.
1.2 Fundamentalgleichungen Die Summe der unabhängigen Energieformen einer Phase ist das totale Differenzial ihrer Energie dE = c dI + mg dz + T dS − p dV K 1 2 − Mi c + Mi gz + μi dni . + 2 i=1
gie, der alle Prozesse genügen, die eine Phase überhaupt ausführen kann. 1.2.1 Innere Energie
Substrahiert man von (1-13) die Differenziale der kinetischen und potenziellen Energie dEk = cdI − (1/2)c2 dm und dEp = mg dz + gz dm, so erhält man mit (1-2) die Gibbs’sche Fundamentalform der inneren Energie dU = T dS − p dV +
K
μi dni .
Die Zerlegung der Energie nach (1-2) trennt eine Phase somit formal in zwei unabhängige Teilsysteme, von denen das äußere bei konstanter Masse von den Variablen I und z, das innere, für die Thermodynamik besonders interessante, von den Variablen S , V und ni abhängt. Das Verhalten einer Phase bei inneren Zustandsänderungen, also z. B. bei einem ruhenden System, wird durch die Funktion U = U(S , V, ni) ,
(1-15)
der Fundamentalgleichung für die innere Energie, vollständig beschrieben. Alle thermodynamischen Eigenschaften lassen sich auf diese Funktion und ihre Ableitungen zurückführen. Aus (1-15) folgen durch Differenzieren zunächst die Zustandsgleichungen (∂U/∂S )V, ni = T (S , V, ni ) ,
(1 i K) , (1-16)
(∂U/∂V)S , ni = p(S , V, ni ) ,
(1 i K) , (1-17)
(∂U/∂ni)S , V, n ji = μi (S , V, n j ) ,
(1 j K) . (1-18)
Die explizite Form dieser Gleichungen ist stoffabhängig. Eliminiert man z. B. aus (1-16) und (1-17) die Entropie, erhält man die thermische Zustandsgleichung einer Phase, p = p(T, V, ni ) ,
(1-13)
Jeder Energieform entspricht eine unabhängige Variable in dieser Gibbs’schen Fundamentalform der Ener-
(1-14)
i=1
(1-19)
die ebenso der Messung zugänglich ist wie – vgl. 1.5.2 – die Wärmekapazität bei konstantem Volumen CV ≡ (∂U/∂T )V, ni = T (∂S /∂T )V, ni .
(1-20)
1 Grundlagen
Nach (1-16) bis (1-18) hängen die intensiven Zustandsgrößen des inneren Teilsystems nicht allein von den konjugierten extensiven Variablen ab. Die Integrale über die Energieformen bei einer Zustandsänderung von 1 nach 2 sind daher keine Zustandsgrößen, sondern wegabhängige Prozessgrößen, d. h. das innere Teilsystem speichert seine Energie nicht in den Energieformen Wärme oder Arbeit, sondern allein als innere Energie. Denkt man sich eine Phase aus λ gleichen Teilen zusammengesetzt, dann sind die mengenartigen extensiven Zustandsgrößen das λ-fache der Zustandsgrößen der Teile. Die Fundamentalgleichung (1-15) ist daher wie jede Beziehung zwischen mengenartigen Variablen eine homogene Funktion erster Ordnung U(λS , λV, λni ) = λU(S , V, ni ) .
(1-21)
Nach einem Satz von Euler [2] erfüllt eine in den Variablen X1 , X2 , . . . homogene Funktion der Ordnung k y(x1 , x2 , . . . , λX1 , λX2 , . . .) = λk y(x1 , x2 , . . . , X1 , X2 , . . .)
(1-22)
die Identität ky(x1 , x2 , . . . , X1 , X2 , . . .) = X1
K
μi ni .
(1-24)
i=1
Die Kenntnis der Fundamentalgleichung (1-15) ist danach der Kenntnis von K + 2 Zustandsgleichungen (1-16) bis (1-18) äquivalent. Eine weitere Konsequenz der Homogenität der Fundamentalgleichung (1-15) ist die Gleichung von Gibbs-Duhem, die sich aus dem Differenzial von (1-24) in Verbindung mit (1-15) ergibt: S dT − V dp +
K
Die intensiven Zustandsgrößen (1-16), (1-17), (1-18) hängen nicht von der Systemgröße ab und sind homogene Funktionen nullter Ordnung der extensiven Variablen. Dies gilt auch für die Massen- und Stoffmengenanteile der Substanzen: mj , (1-26) ξ˜i ≡ mi /m mit m = j
xi ≡ ni /n mit n =
ni dμi = 0 .
(1-25)
i=1
Sie besagt, dass sich nur K +1 intensive Variable einer Phase unabhängig voneinander verändern lassen.
nj ,
(1-27)
j
die nach ξ˜i = xi Mi /
xjMj
(1-28)
j
und
xi = (ξ˜i /Mi )/
(ξ˜ j /M j )
(1-29)
j
ineinander umzurechnen sind. Unabhängig von der Systemgröße sind auch die durch die folgenden Gleichungen definierten spezifischen, molaren und partiellen molaren Zustandsgrößen, die sich – ohne Massen und Stoffmengen – aus jeder mengenartigen extensiven Zustandsgröße Z bilden lassen:
∂y ∂y + X2 +... ∂X1 ∂X2 (1-23)
Wendet man diese Beziehung auf (1-21) an, so folgt mit (1-16) bis (1-18) die Euler’sche Gleichung U = T S − pV +
1.2.2 Spezifische, molare und partielle molare Größen
z ≡ Z/m ,
(1-30)
Zm ≡ Z/n , Zi ≡ (∂Z/∂ni)T, p, n ji .
(1-31) (1-32)
Sie können daher in erweitertem Sinn als intensive Zustandsgrößen angesehen werden. Nach dem Euler’schen Satz (1-24) gilt für die partiellen molaren Größen ni Zi , (1-33) Z(T, p, ni ) = i
woraus sich durch Differenzieren der linken und rechten Seite ni dZi = 0 für T, p = const (1-34) i
herleiten lässt. Zwischen den molaren und den partiellen molaren Zustandsgrößen besteht der Zusammenhang [3] ZK = Zm −
K−1
xi ∂Zm (T, p, x1 , x2 , . . . , xK−1 )/∂xi .
i=1
(1-35)
F5
F6
F Technische Thermodynamik
Die Zahl der unabhängigen Variablen ist in homogenen Funktionen nullter Ordnung der extensiven Zustandsgrößen auf K + 1 reduziert. Für die Funktion Zm = Zm (T, p, ni ) z. B. folgt mit λ = 1/n aus (1-22)
auf die Funktion U [ j] bezüglich der Variablen ζ j unter Beachtung der aus (1-39) folgenden Beziehung
Zm = Zm (T, p, ni /n) ,
anzuwenden. Keine Fundamentalgleichungen entstehen dagegen, wenn in (1-15) eine extensive Variable mithilfe einer Zustandsgleichung (1-16), (1-17), (1-18) durch die konjugierte intensive Zustandsgröße ersetzt wird. Die resultierenden Zustandsgleichungen sind Differenzialgleichungen für die Funktion (1-15), aus denen diese nicht vollständig wiederzugewinnen ist [4]. Diese Transformation wird nun auf die innere Energie U angewendet, um eine gleichwertige Funktion mit anderen unabhängigen Variablen zu erhalten. Wird die innere Energie (1-15) getrennt oder gleichzeitig einer Legendre-Transformation in Bezug auf das Volumen und die Entropie unterworfen, gelangt man zu den Fundamentalgleichungen für die Enthalpie H = H(S , p, ni ), die freie Energie F = F(T, V, ni ) und die freie Enthalpie G = G(T, p, ni ). Wegen (1-16), (1-17), (1-24) und (1-39) gilt für diese extensiven, energieartigen Größen μi ni , (1-41) H ≡ U + pV = TS +
(1-36)
d. h., an die Stelle von K Stoffmengen treten wegen K−1 xk = 1 − xi K − 1 unabhängige Stoffmengenani=1
teile. Die Verminderung der Zahl der unabhängigen Variablen der intensiven Zustandsgrößen auf K + 1 spiegelt sich auch in der Gibbs’schen Fundamentalform für die spezifische innere Energie wider: du = T ds − p dv +
K−1 μi i=1
Mi
−
μK dξ¯i , MK
(1-37)
die aus (1-11), (1-15), (1-25) und (1-31) abzuleiten ist. Für Systeme konstanter Zusammensetzung entfällt der letzte Term. 1.2.3 Legendre-Transformierte der inneren Energie
In der Praxis ist es häufig einfacher, anstelle von (1-15) mit den Veränderlichen S und V eine auf die gut messbaren Variablen Druck und Temperatur transformierte Fundamentalgleichung zu benutzen. Die Transformation, welche in der Funktion (1-15) U = U(X1 , . . . , XK+2 ) die extensive Größe X j durch die konjugierte intensive Zustandsgröße ζ j = ∂U/∂X j ersetzt, ist nach der Regel U [ j] = U − X j (∂U/∂X j)Xk j
(1-38)
auszuführen und heißt Legendre-Transformation [4]. Eliminiert man in (1-38) die Größen U und X j mithilfe von (1-15) und einer Zustandsgleichung (1-16), (1-17) bzw. (1-18), so erhält man die LegendreTransformierte von U bezüglich der Variablen X j in der gewünschten Form
∂U [ j] /∂ζ j = −X j
(1-40)
i
F ≡ U + TS
= −pV +
G ≡ U + pV − T S =
μi ni ,
(1-42)
i
μi ni .
(1-43)
i
Bildet man die totalen Differenziale, so folgen mit (1-15) die Gibbs’schen Fundamentalformen für die Enthalpie, die freie Energie und die freie Enthalpie: dH = T dS + V dp + μi dni , (1-44) i
dF = −S dT − p dV +
μi dni ,
(1-45)
μi dni .
(1-46)
i
U [ j] = U [ j] (X1, ..., x j−1 , ζ j , X j+1, ...) .
(1-39)
Diese Funktion ist deshalb ebenfalls eine Fundamentalgleichung, weil sich die Ausgangsgleichung (1-15), welche die gesamte thermodynamische Information über eine Phase enthält, aus ihr rekonstruieren lässt. Hierzu ist die Legendre-Transformation nur erneut
d G = −S d T + Vd p +
i
Für die spezifischen Größen gelten zu (1-38) analoge Formulierungen. Nach (1-44), (1-45), (1-46) haben die partiellen Ableitungen der Fundamentalgleichungen nach „ihren“ Variablen eine konkrete
1 Grundlagen
physikalische Bedeutung. Insbesondere sind die partiellen molaren freien Enthalpien Gi , vgl. (1-33), gleich den chemischen Potenzialen μi = μi (T, p, xi ), welche nach (1-44) die Fundamentalgleichung G = G(T, p, ni ) vollständig bestimmen. Die Ableitung C p ≡ (∂H/∂T ) p, ni = T (∂S /∂T ) p, ni
(1-47)
heißt analog zu (1-20) Wärmekapazität bei konstantem Druck und ist wie CV (vgl. 1.5.2) eine messbare Größe. Die Zustandsgrößen, die in den Fundamentalformen (1-15), (1-44), (1-45) und (1-46) als Koeffizienten der Differenziale der unabhängigen Variablen auftreten, sind durch die Bedingung verknüpft, dass die gemischten partiellen Ableitungen zweiter Ordnung von Funktionen mehrerer Veränderlicher nicht von der Reihenfolge der Differentiation abhängen [5]. Die wichtigsten Zusammenhänge dieser Art, die als Maxwell-Beziehungen bekannt sind, können aus (1-45) und (1-46) abgelesen werden: (∂S /∂V)T, ni = (∂p/∂T )V, ni , (∂S /∂p)T, ni = −(∂V/∂T ) p, ni ,
(1-48)
Vi = (∂μi /∂p)T, x j , S i = −(∂μi /∂T ) p, x j .
(1-50)
(1-49) (1-51)
Hierin bedeuten Vi und S i das partielle molare Volumen und die partielle molare Entropie der Substanz i, vgl. (1-33). Aus G = H − T S nach (1-41) und (1-43) folgt mit Hi als der partiellen molaren Enthalpie des Stoffes i μi = Hi − T S i ,
(1-52)
was in Verbindung mit (1-52) auf Hi /T 2 = −(∂(μi /T )/∂T ) p, x j .
(1-53)
führt. Obwohl Fundamentalgleichungen selten explizit bekannt sind, vgl. Kapitel 2, schafft ihre bloße Existenz ein Ordnungsschema, das Sätze experimentell bestimmbarer, unabhängiger Stoffeigenschaften aufzufinden gestattet, auf die sich alle weiteren thermodynamischen Größen zurückführen lassen. Für ein System konstanter Zusammensetzung können hierfür
Tabelle 1-1. Ableitungen thermodynamischer Funktionen
bei konstanter Zusammensetzung, dargestellt durch spezifische Wärmen und die thermische Zustandsgleichung. Herleitung aus den Definitionen der spezifischen Wärmen cv und c p , den Gibbs’schen Fundamentalformen für u und h und den Maxwell-Beziehungen für s (∂u/∂T )v = cv (T, v) (∂h/∂T ) p = c p (T, p) (∂s/∂T )v = cv (T, v)/T (∂s/∂T ) p = c p (T, p)/T
(∂u/∂v)T = T (∂p/∂T )v − p (∂h/∂p)T = v − T (∂v/∂T ) p (∂s/∂v)T = (∂p/∂T )v (∂s/∂p)T = −(∂v/∂T ) p
die zweiten Ableitungen der spezifischen freien Enthalpie ∂2 g/∂T 2 = −c p /T, ∂2 g/∂p∂T = (∂v/∂T ) p und ∂2 g/∂p2 = (∂v/∂p)T , d. h. die isobare spezifische Wärmekapazität c p und die thermische Zustandsgleichung (1-19), benutzt werden. Die systematische Reduktion thermodynamischer Eigenschaften auf diese Größen ist in [6] gezeigt und ergibt für die isochore, d. h. bei konstantem Volumen zu nehmende spezifische Wärmekapazität cv = c p + T (∂v/∂)2p /(∂v/∂p)T .
(1-54)
Einige häufig gebrauchte Beziehungen sind in Tabelle 1-1 zusammengestellt.
1.3 Gleichgewichte Nicht immer sind die intensiven Zustandsgrößen in Fluiden räumlich homogen, d. h. sie können nicht mehr als eine einheitliche Phase betrachtet werden. Die Medien müssen dann im Sinne der Thermodynamik als aus mehreren, im einfachsten Fall aus zwei Phasen zusammengesetzte Systeme aufgefasst werden. Dieses gilt z. B. für eine siedende Flüssigkeit, wo die sich bildenden Dampfblasen als eine zweite Phase zu betrachten sind. Wenn es die inneren Beschränkungen erlauben, können die Phasen α und β über ihβ re gleichartigen extensiven Variablen X αj und X j in Wechselwirkung treten, was in der Regel in Form eines Austauschprozesses β
X αj + X j = const ,
α Xk j = const ,
β
Xk j = const (1-55)
geschieht. Eine Phase gewinnt dann so viel an der Größe X j , z. B. an Masse, wie die andere abgibt. Die Zustandsmannigfaltigkeit, die durch die Prozessbe-
F7
F8
F Technische Thermodynamik
dingungen (1-55) gegeben ist, enthält als ausgezeichneten Punkt den Gleichgewichtszustand, auf den der Austausch zwischen den Phasen α und β hinführt. 1.3.1 Extremalbedingungen
Eine grundlegende Erkenntnis aus dem zweiten Hauptsatz ist, dass das Gleichgewicht hinsichtlich der möglichen Austauschprozesse in einem geschlossenen System durch ein Maximum der Entropie bei einem festen Wert der Energie bzw. durch ein Minimum der Energie bei einem festen Wert der Entropie des Systems gekennzeichnet ist. Dabei sind die Arbeitskoordinaten, insbesondere das Volumen des Systems, konstant zu halten. Die an die Energie gestellten Forderungen übertragen sich bei ruhenden, geschlossenen Systemen geringer Höhenausdehnung auf die innere Energie. Aus diesem Gleichgewichtskriterium lassen sich weitere Minimalprinzipen herleiten [7]: Wird einem ruhenden, geschlossenen System von dem als Umgebung wirkenden Reservoir R der konstante Druck pR aufgeprägt, hat seine Enthalpie bei einem vorgegebenen Wert der Entropie im Gleichgewicht ein Minimum. Denn aus U + U R = Min unter den Nebenbedingungen des freien Volumenaustausches V + V R = const bei und
nRi
pR = const
= const
folgt wegen (1-15) mit V als unabhängiger Variabler d(U + U R ) = dU + pR dV = d(U + pR V) = dH = 0 und
bei einem vorgegebenen Wert des Volumens ein Minimum seiner freien Energie. Schließlich nimmt in einem ruhenden, geschlossenen System, dem von der Umgebung die festen Werte pR und T R von Druck und Temperatur vorgeschrieben werden, die freie Enthalpie im Gleichgewicht ein Minimum an. Die genannten vier Funktionen U = U(S , V, ni ), H = H(S , p, ni ) sowie F = F(T, V, n j ) und G = G(T, p, ni ) heißen aufgrund der Minimalprinzipe thermodynamische Potenziale. Vorteilhaft anzuwenden ist das Extremalprinzip für die Funktion, mit deren Variablen die Prozessbedingungen für die Einstellung des Gleichgewichts formuliert sind. Unterschiedliche Prozessbedingungen führen auf unterschiedliche Gleichgewichtszustände. Mit den Werten der Variablen im Gleichgewicht sind aber alle Gleichgewichtskriterien gleichermaßen erfüllt. Es spielt keine Rolle, ob die Werte aufgezwungen oder frei eingestellt sind. 1.3.2 Notwendige Gleichgewichtsbedingungen
Aus den oben genannten Extremalprinzipien ergeben sich nach den Regeln der Differenzialrechnung die notwendigen Bedingungen für das Gleichgewicht. Für ein ruhendes, geschlossenes Zweiphasensystem mit starren äußeren Wänden verlangt das Minimumprinzip für die Energie wegen (1-1) und (1-2) dU = dU α + dU β = 0 .
Ist die Phasengrenze zwischen den Phasen α und β verschieblich, wärme- und stoffdurchlässig und werden keine Substanzen durch chemische Reaktionen erzeugt oder verbraucht, lauten die Nebenbedingungen für das Minimum: ' S α + S β = const , (1-57) V α + V β = const , β
nαi + ni = const (1 i K) . d (U + U ) = d U + d (U + p V) 2
R
2
2
R
= d2 H > 0 . Entsprechend besitzt ein ruhendes, geschlossenes System, das von der Umgebung auf der konstanten Temperatur T R gehalten wird, im Gleichgewicht
(1-56)
(1-58)
Aus (1-15), (1-56), (1-57), (1-58) folgt dU = (T α − T β )dS α − (pα − pβ )dV α +
K i=1
β μαi − μi dni = 0 ,
(1-59)
1 Grundlagen
d. h., notwendig für das Phasengleichgewicht bei freiem Entropie-, Volumen- und Stoffaustausch ohne chemische Reaktionen sind das thermische, mechanische und stoffliche Gleichgewicht: ' Tα = Tβ = T , (1-60) pα = pβ = p , μαi
=
β μi
= μi
(1 i K) .
(1-61)
Eine Modifizierung dieser Bedingungen ergibt sich für chemisch reaktionsfähige Systeme, die im Folgenden betrachtet werden. In den Phasen α und β können dann verschiedene Reaktionen r der Gestalt K
ν jr A j = 0
(1-62)
j=1
mit ν jr als den stöchiometrischen Zahlen der Substanzen A j ablaufen. Vereinbarungsgemäß sind die ν jr für die Reaktionsprodukte positiv und für die Ausgangsstoffe negativ. Für die Synthesereaktion CO + 2H2 → CH3 OH z. B. ist νCO = −1, νH2 = −2 und νCH3 OH = 1. Die ν jr unterliegen der stöchiometrischen Bedingung, dass auf der linken und rechten Seite einer Reaktionsgleichung die Menge jedes Elements gleich groß sein muss. Bezeichnet man mit ai j die Stoffmenge des Elementes i bezogen auf die Stoffmenge der Verbindung j und mit L die Anzahl der Elemente im System, so gilt K
ai j ν jr = 0 mit 1 i L .
(1-63)
j=1
Für NH3 z. B. ist aN, NH3 = 1 und aH, NH3 = 3. Das homogene lineare Gleichungssystem (1-63) besitzt mit R als Rang der Matrix (ai j ) K − R linear unabhängige Lösungen für die stöchiometrischen Koeffizienten ν ji [8]. Häufig stimmt R mit der Zahl L der Elemente im System überein. In einer Phase gibt es somit nur K − R unabhängige Reaktionen; alle anderen sind als Linearkombinationen der unabhängigen Reaktionen darstellbar. Aufgrund des Stoffumsatzes wird in reagierenden Systemen die Austauschbedingung (1-59) ungültig. An ihre Stelle tritt die Forderung nach der Konstanz der Mengen n0i der Elemente im System unabhängig von ihrer Verteilung auf die einzelnen Verbindungen,
β
die mit den Mengen nαj und n j im System enthalten sind: K
ai j nαj
j=1
+
K
β
ai j n j = n0i
1iL
(1-64)
1 jK.
(1-65)
j=1 β
mit nαj 0 und n j 0
Äquivalent hierzu sind Erhaltungssätze für die Mengen von R Basiskomponenten c, aus denen sich stöchiometrisch gesehen das reagierende Stoffgemisch herstellen lässt. Die notwendigen Bedingungen für das Energieminimum der Phasen α und β unter den Beschränkungen (1-58) und (1-65) lassen sich vorteilhaft nach der Methode der Lagrangeschen Multiplikatoren [9] bestimmen. Das Ergebnis sind neben den Relationen (1-60) und (1-61) Gleichgewichtsbedingungen für die unabhängigen Reaktionen (1-62) einer Phase, z. B. α: K
μαj ν jr = 0 für 1 r K − R .
(1-66)
j=1
Mit (1-61) und (1-66) sind entsprechende Gleichgewichtsbedingungen für alle homogenen und heterogenen Reaktionen erfüllt, die zwischen Stoffen einer oder beider Phasen ablaufen können. Sind die im Gleichgewicht vorhandenen Phasen richtig angesetzt, trifft (1-66) von selbst zu. Wie sich mithilfe der Erhaltungssätze für die Basiskomponenten und der Gleichgewichtsbedingungen für die Bildung der Nichtbasis- aus Basiskomponenten zeigen lässt, reduziert sich für alle Zustände des chemischen Gleichgewichts die Gibbssche Fundamentalform (1-15) einer Phase auf dU α = T α dS α − pα dV α +
R
μαc dn0α c .
(1-67)
c=1
Unabhängige Stoffmengen sind dann nur die rechnerisch-stöchiometrisch vorhandenen Mengen n0α c der Basiskomponenten. Die einzelnen im Gleichgewicht vorhandenen Teilchenarten brauchen nicht bekannt zu sein. Für das Phasengleichgewicht gilt die Austauschbedingung (1-59). Teilchenarten und Basiskomponenten werden häufig gemeinsam als Komponenten bezeichnet. Die in diesem Ab-
F9
F10
F Technische Thermodynamik
schnitt dargestellten Gleichgewichtsbedingungen ermöglichen die Berechnung z. B. von Phasengleichgewichten oder von Reaktionsgleichgewichten, wie sie im Kapitel II vorgestellt werden. 1.3.3 Stabilitätsbedingungen und Phasenzerfall
In einem Zustand, in dem die notwendigen Gleichgewichtsbedingungen (1-60) und (1-61) erfüllt sind, hat die innere Energie eines aus den Phasen α und β zusammengesetzten Systems ein Minimum, wenn die Funktion (1-15) für die innere Energie jeder Phase in der Umgebung dieses Zustands konvex ist [10]. Eine notwendige Bedingung hierfür ist d U = (1/2) 2
N
(∂ U/∂Xi ∂X j )dXi dX j 0 , (1-68) 2
i, j
wobei für die Xi die N extensiven Variablen S , V und ni der Phasen einzusetzen sind. Die quadratische Form (1-68) ist positiv semidefinit, wenn für die innere Energie und ihre Legendre-Transformierten ∂2 U [1] ∂2 U [1, ..., N−2] ∂2 U 0 , 0, . . . , 0 2 ∂X12 ∂X22 ∂XN−1 (1-69) gilt [11]. Die Indizierung der Variablen ist dabei beliebig. Für ein Zweikomponentensystem mit der Variablenfolge (S , V, n1 , n2 ) erhält man daraus 2 2 ∂ U ∂ F 0 ; 0; ∂S 2 V, n1 , n2 ∂V 2 T, n1 , n2 2 ∂G 0. (1-70) ∂n21 p,T,n2 Dies geht mit (1-20), (1-45) und (1-46) in Cv 0 ;
(∂p/∂v)T 0 ;
(∂μi /∂xi )T, p 0 (1-71)
über, was weitere Relationen, z. B. c p cv nach (1-55) einschließt. Die Bedingungen (1-69) und (1-70) heißen Stabilitätsbedingungen. Denn kehrt eine der Ableitungen in (1-69) das Vorzeichen um, ändert ein zusammengesetztes System trotz Gültigkeit der Gleichgewichtsbedingungen (1-60) und (1-61) spontan seinen Zustand.
Dies soll am Beispiel eines Einstoffsystems aus zwei identischen Phasen mit (∂p/∂v)T > 0 an Bild 1-2 erläutert werden. Der Zustandspunkt beider Phasen soll anfänglich bei A0 zwischen den Wendepunkten W1 und W2 der mit T < T k bezeichneten Isotherme im f, v-Diagramm liegen. Dem Minimumprinzip für die freie Energie folgend verlässt das System jedoch diesen Zustand und bildet bei konstantem Volumen zwei neue Phasen, deren Zustandspunkte Aα und Aβ die Berührungspunkte der Doppeltangente sind, die an die Isotherme gelegt werden kann. Dabei nimmt die spezifische freie Energie des Systems von fA0 auf fA ab, wie aus den Bedingungen F = mα f α + mβ f β ;
V = mα vα + mβ vβ ;
m = mα + mβ f = F/m
und v = V/m
herzuleiten ist. Die neuen Phasen sind im Gleichgewicht, denn neben T α = T β = T ist wegen p = −(∂ f /∂v)T auch pα = pβ = p s , und der geometrische Zusammenhang f α − f β = p s (vβ −vα ) sichert μα = μβ . Daraus folgt unmittelbar das Maxwell-Kriterium für das Phasengleichgewicht reiner Stoffe p s (vβ − vα ) =
"vβ p(v, T )dv ,
(1-72)
vα
das die Gleichheit der schraffierten Flächen im p, vDiagramm im unteren Teil von Bild 1-2 verlangt. Der instabile Zustandsbereich, in dem jede Schwankung des spezifischen Volumens in Teilen des Systems zur Abnahme der freien Energie und damit zum Phasenzerfall führt, ist durch die Wendepunkte der Isothermen mit (∂2 f /∂v2 )T = 0 begrenzt. Hierin spiegelt sich das allgemeine Gesetz wider, dass beim Instabilwerden eines Systems die letzte der Bedingungen (1-70) zuerst verletzt wird und das Verschwinden der entsprechenden Ableitung die Stabilitätsgrenze markiert. Diese Bedingung lässt sich auf andere thermodynamische Potenziale umrechnen. Für ein Mehrstoffsystem erhält man in der Formulierung mit der molaren freien Enthalpie als Stabilitätsgrenze [11] 2 . . . ∂2Gm /∂x1 ∂xK−1 ∂ Gm /∂x21 .. .. D1 ≡ = 0 . . . ∂2Gm /∂xK−1 ∂x1 . . . ∂2Gm /∂x2 K−1
(1-73)
1 Grundlagen
samen Punkt haben. Im Gegensatz zu den anderen Punkten der Stabilitätsgrenze repräsentiert der kritische Punkt einen stabilen Zustand, in dem die koexistierenden Phasen identisch werden [11]. Kritische Zustände in Mehrstoffsystemen zeichnen sich durch dieselben Eigenschaften aus, sind aber eine höherdimensionale Zustandsmannigfaltigkeit. Diese ist in der Darstellung mit der molaren freien Enthalpie durch D1 = 0 und
D2 = 0
(1-75)
gegeben, wobei D1 nach (1-73) zu berechnen ist und 2 . . . ∂2Gm /∂x1 ∂xK−1 ∂ Gm /∂x21 . .. .. . D2 ≡ ∂2Gm /∂xK−2 ∂x1 . . . ∂2Gm /∂xK−2 ∂xK−1 ∂D1 /∂x1 . . . ∂D1 /∂xK−1 (1-76) bedeutet [11]. Statt (1-76) ist eine Formulierung mit der molaren freien Energie möglich, die mit (1-76) korrespondiert, aber weniger praktisch ist.
1.4 Messung der thermodynamischen Temperatur
Bild 1-2. Phasenzerfall eines Einstoffsystems
Bemerkenswert ist, dass in dem Gebiet zwischen der Stabilitätsgrenze und der Koexistenzkurve, die von den Punkten Aα und Aβ gebildet wird, trotz (∂2 f /∂v2 )T > 0 bei hinreichend großen Störungen des inneren Gleichgewichts Phasenzerfall möglich ist. Die Existenz dieses metastabilen Gebietes zeigt, dass die lokale Konvexität nach (1-69) zur Kennzeichnung stabiler, auch bei großen Störungen unveränderlicher Zustände nicht ausreicht. Metastabile Zustände sind im Gegensatz zu instabilen experimentell realisierbar. Die Wendepunkte der Isothermen der f, v, T -Fläche fallen für die kritische Temperatur T = T k im Punkt K, dem kritischen Punkt, zusammen und verschwinden für T > T k ganz. In K ist (∂2 f /∂v2 )T = 0 und (∂3 f /∂v3 )T = 0, sodass die kritische Isotherme an dieser Stelle im p, v-Diagramm eine horizontale Wendetangente besitzt, vgl. Bild 1-2: (∂p/∂v)T = 0 und (∂2 p/∂v2 )T = 0 .
(1-74)
Diese berührt dort gleichzeitig die Stabilitätsgrenze und die Koexistenzkurve, die in K einen gemein-
Nach diesen grundlegenden Betrachtungen soll in diesem Abschnitt eine wichtige Anwendung der Stabilitätsbeziehungen nach (1-60) in Bezug auf die thermodynamische Temperatur T erfolgen. Grundlegend für die Temperaturmessung ist, dass zwei Systeme im thermischen Gleichgewicht nach (1-60) dieselbe thermodynamische Temperatur haben. Bei der Messung wird ein System mit einem zweiten, als Thermometer dienenden System durch Energieaustausch über die Entropievariable ins thermische Gleichgewicht gebracht, wobei die Wärmekapazität des Thermometers so klein sein muss, dass der Meßprozeß den Zustand des Systems nicht merklich verändert. Da die Relation, im thermischen Gleichgewicht zu sein, transitiv und symmetrisch ist, sind zwei Systeme A und B im thermischen Gleichgewicht, wenn zwischen ihnen und einem dritten, als Thermometer benutzten System thermisches Gleichgewicht vorhanden ist. Diese Tatsache wird manchmal als nullter Hauptsatz der Thermodynamik bezeichnet und erlaubt zusammen mit der Reflexivität des thermischen
F11
F12
F Technische Thermodynamik
Gleichgewichts, Systeme in zueinander fremde Äquivalenzklassen gleicher und ungleicher thermodynamischer Temperatur einzuteilen. Jeder Klasse gleicher thermodynamischer Temperatur lässt sich eine willkürliche empirische Temperatur Θ zuordnen, die durch die Ablesevariable des Thermometers bestimmt ist. Hierzu eignet sich im Prinzip jede Größe wie die Länge eines Flüssigkeitsfadens oder der elektrische Widerstand eines Leiters [12], die umkehrbar eindeutig von der thermodynamischen Temperatur T abhängt. Unter den empirischen Temperaturen nimmt die Temperatur Θ des Gasthermometers eine Sonderstellung ein. Hierbei handelt es sich um ein mit gasförmiger Materie kleiner Stoffmengenkonzentration c¯ ≡ n/V gefülltes System konstanten Drucks oder konstanten Volumens, aus dessen Zustandsgrößen die Ablesevariable Θ = Θtr lim(pVm )/ lim(pVm )Θtr c¯→0
c¯→0
(1-77)
gebildet wird. Sie bezieht sich auf den Grenzzustand des idealen Gases und ist unabhängig von der Natur der Füllsubstanz. Die Nennergröße ist bei der Tripelpunkttemperatur Θtr des Wassers zu bestimmen, d. h. der einzigen Temperatur, bei der nach 3.1 Eis, flüssiges Wasser und Wasserdampf im Gleichgewicht nebeneinander bestehen können. Durch internationale Vereinbarung wurde dieser Temperatur der Wert Θtr = 273,16 K
(1-78)
zugewiesen, wobei das Einheitenzeichen K die Temperatureinheit Kelvin bedeutet. Im Rahmen der Meßgenauigkeit findet man damit für den Eis und Siedepunkt des Wassers beim Normdruck pn = 101 325 Pa Θ0 = 273,15 K und Θ1 = 373,15 K. Für die aus den Konstanten von (1-78) zusammengesetzte universelle Gaskonstante erhält man als derzeit besten Wert [13] Rm ≡ (1/Θtr ) lim(pVm )Θtr c¯→0
= (8,314472 ± 0,0000070)J/(mol · K) . (1-79) Der Zusammenhang zwischen der Temperatur Θ des Gasthermometers und der thermodynamischen Temperatur T lässt sich aus einem Ergebnis der statistischen Mechanik herleiten, wonach die molare innere Energie der Materie im idealen Gaszustand bei kon-
stanter Zusammensetzung allein von der Temperatur, nicht aber vom Molvolumen abhängt: (∂Um /∂Vm )T, xi = (∂Um /∂Vm )Θ, xi = 0 .
(1-80)
Mit (1-15) und (1-48) folgt daraus T (∂p/∂Θ)Vm, xi · (dΘ/dT ) − p = 0 .
(1-81)
Andererseits ist nach (1-77) und (1-79) für den Grenzzustand des idealen Gases p = R0 Θ/Vm , sodass aus (1-81) die Differenzialgleichung dΘ/Θ = dT/T mit der Lösung T (Θ) = (T tr /Θtr )Θ
(1-82)
resultiert. Da die Entropie nach (1-22) gegenüber der Transformation S = S /λ und T = λT invariant ist, darf T tr gesetzt werden. Die thermodynamische Temperatur ist danach identisch mit der Temperatur des Gasthermometers und wird durch diese realisiert. Die thermodynamische Temperatur ist eine universelle intensive Zustandsgröße, die somit unabhängig von einer willkürlichen abzulesenden Variablen ist. Sie hat einen absoluten Nullpunkt und die Einheit Kelvin. Ein Kelvin ist über den Tripelpunkt des Wassers definiert. Von der thermodynamischen Temperatur abgeleitet ist die Celsius-Temperatur t ≡ T − 273,15 K .
(1-83)
Der Gradschritt auf der Celsiusskala ist das Kelvin, das in Verbindung mit Celsius-Temperaturen aber Grad Celsius (Einheitenzeichen ◦ C) genannt wird, um auf den verschobenen Nullpunkt der Celsius-Temperatur hinzuweisen. In angelsächsischen Ländern wird neben dem Kelvin die Temperatureinheit Rankine 1 R = (5/9) K
(1-84)
benutzt. Ferner ist dort die Fahrenheitsskala in Gebrauch tF ≡ T − 459,67 R ,
(1-85)
deren Temperaturen in Analogie zur CelsiusTemperatur in Grad Fahrenheit (Einheitszeichen ◦ F mit 1 ◦ F = 1 R) angegeben werden. Der Eispunkt des Wassers liegt exakt bei 32 ◦ F, sodass für die Umrech-
1 Grundlagen
nung von Fahrenheit- in Celsius-Temperaturen die zugeschnittene Größengleichung t/◦ C = (5/9)(tF/◦ F − 32)
(1-86)
gilt.
1.5 Bilanzgleichungen der Thermodynamik Für jede mengenartige Zustandsgröße X j , die über die Grenzen eines Systems transportiert werden kann, lassen sich Bilanzen aufstellen. Sie beziehen sich auf das von der Systemgrenze eingeschlossene Kontrollgebiet, das frei nach Gesichtspunkten der Zweckmäßigkeit definierbar ist, und haben die Form Geschwindigkeit der Änderung des Bestands = der Größe X j im System oder
dnαi /dτ = (˙nαi )z + (˙nαi )t + (˙nαi )r .
aus
+ (X˙ j, Quell − X˙ j, Senk ) .
(1-88)
Der Strom der Größe X j ist dabei als X˙ j = lim ΔX j /Δτ Δτ→0
(1-89)
erklärt, wobei ΔX j die Menge der Größe X j bedeutet, die im Zeitintervall Δτ die Systemgrenze überschreitet. Sind die Systeme stationär, d. h. hängen ihre Zustandsgrößen nicht von der Zeit ab, verschwindet die linke Seite von (1-88) und alle Ströme X˙ j sind zeitlich konstant. Die Systemgrenzen sind bei offenen Systemen oftmals fest im Raum stehende Flächen; sog. Kontrollräume. Bei geschlossenen Systemen entfällt der materiegebundene Transport von X j über die Systemgrenze. Die Quell- und Senkenströme in (1-88) werden null, wenn für X j ein Erhaltungssatz gilt. Nachfolgend werden einige in der Thermodynamik wichtige Bilanzgleichungen vorgestellt. 1.5.1 Stoffmengen- und Massenbilanzen
Mit X j als der Menge ni der Teilchenart i in der Phase α eines Mehrphasensystems folgt aus (1-88) für das
(1-90)
Hierin bedeutet (˙nαi )z den Nettostrom des Stoffes i, welcher der Phase α extern aus der Umgebung des Mehrphasensystems zugeführt wird, und (˙nαi )t den Nettostrom von i, der aus anderen Teilen des Mehrphasensystems intern in die Phase α transportiert wird. (˙nαi )r ist die Differenz der Quell- und Senkenströme, die von Erzeugung und Verbrauch des Stoffes i bei chemischen Reaktionen in der Phase α herrühren.
Differenz der über die Differenz der Quell- und Systemgrenze zu- und + Senkenströme der Größe X j abfließenden Ströme im System . der Größe X j
⎞ ⎛ ⎟⎟ ⎜⎜⎜ ˙ ˙ ⎜ dX j /dτ = ⎜⎝ X j, e − X j, a ⎟⎟⎟⎠ ein
Bilanzgebiet α [14], in welchem die Bilanzgrenze die Phasengrenze der Phase α sei:
(1-87)
Multipliziert man (1-90) mit der Molmasse Mi des Stoffes i und summiert über alle Stoffe und Phasen, erhält man die Massenbilanz des Gesamtsystems, das auch Maschinen und Anlagen umfassen kann. Die Bilanz lautet mit m als der Systemmasse sowie m ˙e und m ˙ a als den an der Grenze des Mehrphasensystems zu der externen Umgebung ein- und ausfließenden Massenströmen dm/dτ = m ˙e − m ˙a . (1-92) aus
ein
Denn die zwischen den Phasen übertragenen Stoffströme heben sich in der Summe heraus, und chemische Reaktionen verändern die Masse einer Phase nicht. Jeder Massenstrom in (1-92) lässt sich als Produkt der mittleren Strömungsgeschwindigkeit c, dem zu c senkrechten Strömungsquerschnitt A und der über A konstant vorausgesetzten Dichte = 1/v an der Systemgrenze darstellen: m ˙ = cA .
(1-93)
Der Quotient V˙ = m/
˙ = cA ist der zu m ˙ gehörende Volumenstrom. Die Integration von (1-92) über die Zeit ergibt m2 − m1 = me12 − ma12 . (1-94) ein
aus
F13
F14
F Technische Thermodynamik
Dabei sind m2 −m1 die Massenänderung des Systems, me12 und ma12 die ein- und ausströmenden Massen während der Zeit Δτ = τ2 − τ1 . 1.5.2 Energiebilanzen
Auch für die Energie lassen sich gemäß (1-88) Bilanzen aufstellen, die oft als erster Hauptsatz für die zugrundeliegenden Systeme bezeichnet werden und als Energiebilanzgleichungen einen zentralen Platz in der angewandten Thermodynamik einnehmen. Zunächst soll eine offene Phase α, die Teil eines Mehrphasensystems ist, als Bilanzgebiet gewählt werden. Die Änderungen der kinetischen und potenziellen Energie seien vernachlässigbar. Die Bilanzgrenze wird dann von Wärmeströmen, Leistungen angreifender Kräfte, elektrischer Leistung und von Strömen innerer Energie überschritten, die an übertragene Materie gekoppelt sind. Quell- und Senkenströme treten nach dem ersten Hauptsatz nicht auf, die Energie ist eine Erhaltungsgröße. Die der Phase α zugeführten Wärmeströme werden analog zu den Komponentenmengenströmen in die Anteile Q˙ αz aus der externen Umgebung und Q˙ αt aus benachbarten Teilen des Mehrphasensystems aufgeteilt, vgl. Bild 1-3. Abgeführte Wärmeströme sind vereinbarungsgemäß negativ. Die Ströme der inneren Energie und die Leistung der Normalkräfte an der Bilanzgrenze lassen sich als Summe der Enthalpieströme H˙ zα und H˙ tα , die aus der externen Umgebung und aus benachbarten Phasen stammen, und einer mit der Bewegung der Bilanzgrenzen verknüpften Leistung darstellen. Diese ist wegen der Vernachlässigung der kinetischen und potenziellen Energie als Volumenänderungsleistung (Pv )α zu deuten. Die Wellenleistung ergibt zusammen mit der elektrischen Leistung Pα . Damit erhält man, vgl. [15], für die Änderung der Inneren Energie der bilanzierten Phase α dU α /dτ = Q˙ αz + Q˙ αt − pα dV α /dτ + Pα +
k
Hiα (˙nαi )z + (˙nαi )t ,
(1-95)
i=1
wobei (PV )α nach (1-5) und H˙ α nach (1-33) mit Hiα als der partiellen molaren Enthalpie des Stoffes i in der Phase α berechnet ist. Unter denselben Voraussetzungen lässt sich für das aus mehreren Phasen α, β . . .
Bild 1-3. Zur Energiebilanz einer ruhenden, offenen Phase. a zufließende Energieströme; b Zusammenfassung des Stroms U˙ der inneren Energie und der Leistung PN der Nor˙ = (c − b)A(u + p/ ) malkräfte zu dem Enthalpiestrom H und der Volumenänderungsleistung Pv = bpA
bestehende heterogene Gesamtsystem, das nur eine Grenze zu der externen Umgebung besitzt, folgende Energiebilanz aufstellen: dU α /dτ = pα dV α /dτ Q˙ αz − α
α
+
α
Pα +
α
K α
Hiα (˙nαi )z . (1-96)
i=1
Der Vergleich von (1-95) und (1-96) liefert für ein aus den zwei Phasen α und β zusammengesetztes System β wegen (˙nαi )t = −(˙ni )t β Q˙ αt + Q˙ t +
K
β
Hiα − Hi
6 7 n˙ αi t = 0 .
(1-97)
i=1
Dieses Ergebnis, das unabhängig von den Vorgängen an der externen Systemgrenze ist, vereinfacht sich für β geschlossene Phasen zu Q˙ αt = −Q˙ t . Letzteres bleibt auch in bewegten Systemen gültig. Integriert man (1-96) für eine einzige, geschlossene Phase über die Zeit und lässt den Phasenindex α fort, so folgt "2 U2 − U1 = Q12 −
p dV + W12 . 1
(1-98)
1 Grundlagen
Dabei ist U2 − U1 die Änderung der inneren Energie zwischen dem Anfangszustand 1 und dem Endzustand 2 des Systems. Die Wärme Q12 , die Volumen.2 änderungsarbeit − p dV und die Arbeit W12 sind die 1
bei der Realisierung der Zustandsänderung, d. h. dem Prozess 12, zugeführten Energien. So lassen sich z. B. durch Messung der mit der Disel in einem adiabaten sipation elektrischer Arbeit W12 Prozess verbundenen Temperaturerhöhung ΔT die isochore und isobare Wärmekapazität einer Phase mithilfe von (1-98) bestimmen, siehe Bild 1-4. Vernachlässigt man die Energieänderung des elektrischen Leiters, so gilt el /ΔT )V, ni , CV ≡ lim (ΔU/ΔT )V, ni = lim (W12 ΔT →0
Kontrollraums mit starren Grenzen. Von der Turbine abgegebene Leistung P < 0. Im Kondensator abgeführter Wärmestrom Q˙ < 0
ΔT →0
(1-99)
C p ≡ lim (ΔH/ΔT ) p, ni = lim ΔT →0
Bild 1-5. Teil einer Dampfkraftanlage als Beispiel eines
ΔT →0
el (W12 /ΔT ) p, ni
.
(1-100)
Von besonderer technischer Bedeutung sind Energiebilanzen für Kontrollräume mit feststehenden Grenzen, die Maschinen und Anlagen einschließen, vgl. Bild 1-5. In das System fließen der Nettowärmestrom Q˙ sowie die mechanische und elektrische Nettoleistung P, die durch Wellen oder Kabel übertragen wird. Wellen- und elektrische Leistung können bei dem betrachteten Systemtyp auch abgegeben werden und sind dann negativ. Die Stoffströme transportieren wie bei der offenen Phase Enthalpie über die Systemgrenze. Im Allgemeinen muss in der Bilanz aber auch die mitgeführte kinetische und potenzielle Energie berücksichtigt werden. Die Leistung der Schubkräfte ist in den Ein- und Austrittsquerschnitten vernachlässigbar und an den
festen Wänden null. Damit folgt aus (1-88) dE/dτ = Q˙ + P + m ˙ e he + c2e /2 + gze −
ein
m ˙ a ha + c2a /2 + gza .
(1-101)
aus
Die materiegebundenen Energieströme sind dabei als Produkt der Massenströme m ˙ und der spezifischen Enthalpie h, der spezifischen kinetischen Energie c2 /2 und der spezifischen potenziellen Energie gz dargestellt. Die Indizes e und a beziehen sich auf die Einund Austrittsquerschnitte an der Systemgrenze. Die spezifische Enthalpie h kann anhand einer kalorischen Zustandsgleichung für die strömende Materie berechnet werden, vgl. 2.1. Ein wichtiger Sonderfall, dem viele technische Anlagen genügen, ist das stationäre Fließsystem mit dm/dτ = 0 und dE/dτ = 0. Ist nur ein zu- und abfließender Massenstrom vorhanden, gilt nach (1-92) ˙ a = m. ˙ In diesem Fall werden die Ein- und m ˙e = m Austrittsquerschnitte durch die Indizes 1 und 2, bei einer Folge von durchströmten Kontrollräumen durch i und i + 1 gekennzeichnet. Nach Division durch m ˙ vereinfacht sich (1-101) zu q12 + wt12 = h2 − h1 + (1/2)(c22 − c21 ) + g(z2 − z1 ) (1-102)
Bild 1-4. Messung der Wärmekapazität einer Phase. a Bei
konstantem Volumen, b bei konstantem Druck
˙ m mit q12 ≡ Q/ ˙ und wt12 ≡ P/m ˙ als der spezifischen technischen Arbeit zwischen den Querschnitten 1 und 2.
F15
F16
F Technische Thermodynamik
Ein weiterer Sonderfall, der häufig beim Füllen von Behältern auftritt, sind zeitlich konstante Zustandsgrößen h + c2 /2 + gz in den Ein- und Austrittsquerschnitten des Kontrollraums. Dann kann (1-101) in geschlossener Form über die Zeit integriert werden. Gibt es nur einen zu- und abfließenden Massenstrom und ist die Änderung der kinetischen und potenziellen Energie innerhalb des Kontrollraums vernachlässigbar, erhält man U2 − U1 = Q12 + Wt12 + me12 (he + c2e /2 + gze ) − ma12 (ha + c2a /2 + gza ) .
(1-103)
Besteht der Kontrollraum aus einer endlichen Zahl von Phasen, ist die innere Energie in den Anfangs und Endzuständen 1 und 2 des Systems aus U = U α α
zu berechnen. Q12 ist die Wärme und Wt12 die Wellenund elektrische Arbeit, die dem Kontrollraum während der Zeit Δτ zugeführt werden; me12 und ma12 sind die während dieser Zeit ein- und ausfließenden Massen. 1.5.3 Entropiebilanzen. Bernoulli’sche Gleichung
Die zeitliche Änderung dS /dτ =
α
dS α /dτ der Entro-
pie eines aus mehreren ruhenden, offenen Phasen zusammengesetzten Systems lässt sich durch Verknüpfung der Energiebilanz (1-95) mit der Gibbs’schen Fundamentalform (1-14) der einzelnen Phasen unter Berücksichtigung von (1-52) und (1-90) darstellen [16]. Das Ergebnis ist eine Entropiebilanzgleichung der Form (1-88) dS /dτ = S˙ z + S˙ irr mit S˙ z =
Q˙ αz /T α +
α
und S˙ irr 0 .
(1-104) K α
S iα (˙nαi )z
(1-105)
i=1
(1-106)
Der aus der Umgebung zufließende Nettoentropiestrom S˙ z ist dadurch gekennzeichnet, dass beide Vorzeichen möglich sind. Er ist an Wärme- und Stoffströme gekoppelt, die sich als Träger von Entropieströmen erweisen. Mechanische oder elektrische Leistung führen dagegen keine Entropie mit sich, sie sind entropiefrei. Für geschlossene adiabate Systeme ist S˙ z = 0.
Der Strom S˙ irr der erzeugten Entropie ist ein positives Quellglied. Bei unterbundenem Entropiefluss zur Umgebung S˙ z = 0 kann die Entropie eines Systems nicht abnehmen, weil nach dem zweiten Hauptsatz Entropievernichtung unmöglich ist. Ursachen der Entropieerzeugung sind die Dissipation mechanischer und elektrischer Leistung sowie der Wärmeund Stoffaustausch einschließlich chemischer Reaktionen im Inneren des Systems. Diese Beiträge verschwinden, wenn das System die Gleichgewichtsbedingungen von 1.3.2 erfüllt. Alle in der Natur ablaufenden Prozesse sind mit Erzeugung von Entropie verbunden und wegen der Unmöglichkeit der Entropievernichtung irreversibel. Die beteiligten Systeme können danach nicht wieder in ihren Ausgangszustand gelangen, ohne dass Änderungen in der Umgebung zurückbleiben. Reversible Prozesse, bei denen dies möglich wäre, sind als Grenzfall verschwindender Entropieerzeugung denkbar. Sie müssen dissipationsfrei ablaufen und die Systeme durch eine Folge von Gleichgewichtszuständen bezüglich der jeweils möglichen Austauschvorgänge führen. Aus (1-106) lässt sich ableiten, dass natürliche, von selbst ablaufende Prozesse in abgeschlossenen Systemen auf den Zustand des thermischen, mechanischen und stofflichen Gleichgewichts hingerichtet sind. Für ein aus den starren Phasen α und β ohne Stoffaustausch und chemische Reaktionen zusammengesetztes, abgeschlossenes System folgt mit (1-97) zunächst S˙ irr = (T β − T α )Q˙ αt /(T α T β ) 0 .
(1-107)
Die Wärme fließt danach in Richtung fallender Temperatur, sodass der Temperaturunterschied zwischen den Phasen abgebaut wird. Gibt man für das isotherme System mit T α = T β = T die Bedingung starrer Phasen auf, erhält man mit (1-96) S˙ irr = (1/T )(pα − pβ )dV α /dτ 0 .
(1-108)
Die Phase mit dem höheren Druck vergrößert ihr Volumen auf Kosten der anderen und führt so den Druckausgleich herbei. Erlaubt man im isothermen System gleichförmigen Drucks den Übergang einer einzigen Komponente i von einer Phase zur anderen, ergibt sich β (1-109) S˙ irr = (1/T ) μi − μαi d˙nαi 0 . T
1 Grundlagen
Die Komponente wandert in Richtung abnehmenden chemischen Potenzials μi und bewirkt den Ausgleich dieser Größe zwischen den Phasen. Das chemische Potenzial μαi ist ein Maß für die Unbeliebtheit der Komponente i in der Phase α. Auf die Berechnung des chemischen Potenzials wird in Kap. 2 eingegangen. Bei nichtisothermem Stoffübergang mehrerer Komponenten gelten kompliziertere Bedingungen. Schließlich erhält man für den Ablauf chemischer Reaktionen in einer Phase α K > (1-110) S˙ irr = − (μαi T α )(d˙nαi )r 0 . i=1
Integriert man (1-104) für eine einzige, geschlossene Phase über die Zeit und lässt die Indizes α und z fort, so folgt "2 dQ/T + (S irr )12 mit (S irr )12 0 , S2 − S1 = 1
(1-111)
"2 T dS = Q12 + Ψ 12
bzw. 1
"2
mit Ψ 12 ≡
T dS irr 0 .
(1-112)
1
In diesen manchmal als zweiter Hauptsatz bezeichneten Gleichungen ist dQ die im Zeitintervall dτ vom System bei der Temperatur T aufgenommene Wärme. Sie addiert sich für den gesamten Prozess zwischen den Zuständen 1 und 2 zu Q12 . Die Größe (S irr ) ist die bei dem Prozess erzeugte Entropie und Ψ12 die Dissipationsenergie des Prozesses. Ist die Zusammensetzung des Systems konstant, oder ist es stets im chemischen Gleichgewicht, gilt nach (1-14) bzw. (1-67) "2 "2 T dS = U2 − U1 + p dV . (1-113) 1
sind. Nach Übergang zu spezifischen Größen lassen sich (1-112) und (1-114) durch Flächen unter den Zustandslinien im T, s- und p, v-Diagramm veranschaulichen, vgl. Bild 1-6a und b. Dabei ist q12 ≡ Q12 /m, ψ12 ≡ Ψ 12 /m und w12 = W12 /m mit m als der Systemmasse gesetzt. Generell wird Entropie durch Wärme und Stoffströme über die Systemgrenze getragen, daher lassen sich auch für Kontrollräume, die nicht aus einer endlichen Zahl ruhender Phasen bestehen, Entropiebilanzen aufstellen. Auf die Aufschlüsselung des Stroms der erzeugten Entropie muss dabei jedoch verzichtet werden. Nach (1-88) gilt " dS /dτ = (q/T ˙ )dA + m ˙ e se − m ˙ a sa + S˙ irr ein
A
aus
mit S˙ irr 0 . (1-115) ˙ wobei q˙ ≡ dQ/dA die Wärmestromdichte auf einem Oberflächenelement dA des Kontrollraums bedeutet, an dem der Wärmestrom dQ˙ bei der Temperatur T übertragen wird. Die materiegebundenen Entropieströme sind als Produkt von Massenströmen m ˙ und spezifischen Entropien s dargestellt. Für stationäre Fließsysteme ist dS /dτ = 0. Gibt es darüber hinaus nur einen zu- und abfließenden Massenstrom m, ˙ vgl. (1-92), vereinfacht sich (1-115) zu " s2 − s1 = (1/m) ˙ (q/T ˙ )dA + (S irr )12 A
mit (sirr )12
≡ S˙ irr /m ˙ 0.
(1-116)
1
Aus (1-112), (1-113) und der Energiebilanz (1-98) folgt dann "2 (1-114) − p dV = W12 − Ψ 12 , 1
wobei die Volumenänderungs- und die dissipierte Arbeit zur Gesamtarbeit W12 zusammengefaßt
Bild 1-6. Bedeutung von Flächen in Zustandsdiagrammen. a T, s-Diagramm; b und c p, v-Diagramm
F17
F18
F Technische Thermodynamik
schen Größen. Zur Auswertung genügen aber im Gegensatz zu (1-102) die Zustandsgrößen an den Grenzen des Kontrollraums nicht. Sind die Änderungen der kinetischen und potenziellen Energie vernachlässigbar, folgt aus (1-119) "2 v dp = wt12 − ψ12 ,
Bild 1-7. Stationäre Kanalströmung mit Zustandsänderung
zwischen zwei benachbarten Querschnitten
(1-120)
1
was nach Bild 1-6c im p, v-Diagramm darstellbar ist. Die Indizes 1 und 2 kennzeichnen wieder die Einund Austrittsquerschnitte des Kontrollraums. Ist dieser nach Bild 1-7 ein Kanal, und ist in eindimensionaler Betrachtungsweise die Zustandsänderung der Materie längs der Kanalachse bekannt, kann (1-116) in Analogie zu (1-112) in "2
"2 T ds = q12 + ψ12
mit ψ12 ≡
1
T dsirr 0 1
(1-117)
umgeformt werden. Die Differenziale der spezifischen Entropie sind Inkremente auf der Kanalachse; ˙ m ˙ ist der auf den Massenstrom bezogene q12 ≡ Q/ Wärmestrom und ψ12 die spezifische Dissipationsenergie für den Kontrollraum. Das Ergebnis (1-117) lässt sich wieder im T, s-Diagramm, vgl. Bild 1-6a, veranschaulichen. Ändert das strömende Medium seine Zusammensetzung im Kanal nicht, oder ist es im chemischen Gleichgewicht, folgt aus (1-44) "2
1.6 Energieumwandlung Die wechselseitige Umwandelbarkeit von Energieformen wird durch ihre jeweils unterschiedliche Beladung mit Entropie bestimmt. Energieumwandlungen mit Entropievernichtung sind gemäß des zweiten Hauptsatzes unmöglich. 1.6.1 Beispiele stationärer Energiewandler. Kreisprozesse
Elektrische Maschinen wandeln nach Bild 1-8a mechanische und elektrische Leistung, Pmech und Pel , ineinander um. Sie geben dabei einen Abwärmestrom Q˙ 0 ≤ 0 bei einer als einheitlich angenommenen Tem-
"2 T ds = h2 − h1 −
v dp .
(1-118)
Die Integrale sind dabei wieder standsänderung längs des Kanals Verknüpft man (1-117) und (1-118) giebilanz (1-102), erhält man die Gleichung
für die Zuzu berechnen. mit der EnerBernoulli’sche
1
1
"2 wt12 − ψ12 =
v dp +
1 2 c2 − c21 + g(z2 − z1 ) 2
1
mit ψ12 0 .
(1-119)
Diese Energiegleichung für eine stationäre Kanalströmung enthält mit Ausnahme von ψ12 keine kalori-
Bild 1-8. Energiewandler. a Elektrische Maschine EM;
b Wärmekraftmaschine WKM; c Wärmepumpe WP; d Kältemaschine KM
1 Grundlagen
peratur T 0 an die Umgebung ab. Aus den Energie- und Entropiebilanzen (1-101) und (1-115) für den stationären Betrieb dieser geschlossenen Systeme Pel + Pmech + Q˙ 0 = 0
und
Q˙ 0 /T 0 + S˙ irr = 0
folgt, dass im reversiblen Grenzfall mit S˙ irr = 0 mechanische und elektrische Leistung vollständig ineinander überführbar sind. Entropieerzeugung z. B. durch mechanische Reibung oder durch Ohm’sche Widerstände schmälert die gewünschte Nutzleistung, der hierdurch bedingte Wärmestrom kann nur abgegeben werden, in der Regel an die Umgebung als Wärmesenke. Wärmekraftmaschinen gewinnen nach Bild 1-8b mechanische oder elektrische Leistung P < 0 aus einem Wärmestrom Q˙ > 0. Sie sind nicht funktionsfähig, ohne einen Abwärmestrom Q˙ 0 < 0 auf Kosten der Nutzleistung an die Umgebung als Wärmesenke abzuführen. Wärmezu- und -abfuhr sollen bei jeweils einheitlichen thermodynamischen Temperaturen T und T 0 < T erfolgen. Die Bilanzen (1-101) und (1-115) für den stationären Betrieb, P + Q˙ + Q˙ 0 = 0 ˙ + Q˙ 0 /T 0 + S˙ irr = 0 , und Q/T
(1-121)
liefern als thermischen Wirkungsgrad der Maschine ηth ≡ −P/Q˙ = ηC − T 0 S˙ irr /Q˙ ηC mit ηC ≡ 1 − T 0 /T .
(1-122) (1-123)
Der Maximalwert ηC , der von einer reversiblen Wärmekraftmaschine erreicht wird, heißt Carnot’scher Wirkungsgrad. Die Umgebung ist das Wärmereservoir mit der niedrigsten Temperatur, sodass T 0 nicht unter die Temperatur T u der natürlichen Umgebung auf der Erde sinken kann. Die obere Prozesstemperatur T ist in der Regel durch die Temperatur der Wärmequelle und die Festigkeit von Bauteilen nach oben begrenzt, so gilt stets ηC < 1. Ein Wärmestrom kann daher prinzipiell nicht vollständig in mechanische Leistung umgewandelt werden. Der umwandelbare Anteil steigt mit wachsender Temperatur T und wird bei T = T 0 zu Null. Die abgegebene Leistung ist entropiefrei. Der Abwärmestrom |Q˙ 0 | = (1 − ηC )Q˙ + T 0 S˙ irr
(1-124)
führt den mit dem Wärmestrom Q˙ eingebrachten sowie den zusätzlich erzeugten Entropiestrom aus der Maschine in die Umgebung ab. Der erste Summand ist nach dem zweiten Hauptsatz unumgänglich, der zweite bedeutet einen im Prinzip vermeidbaren Leistungsverlust. Wärmepumpen, die zur Heizung dienen, nehmen nach Bild 1-8c einen Wärmestrom Q˙ 0 > 0 bei einer tiefen Temperatur, z. B. aus der natürlichen Umgebung, auf und wandeln ihn in einen Wärmestrom Q˙ < 0 um, der bei höherer Temperatur an den zu heizenden Raum abgegeben wird. Dazu benötigen sie eine mechanische oder elektrische Antriebsleistung P > 0. Die Temperaturen der Wärmezu- und -abfuhr sollen wieder einheitliche Werte T 0 und T > T 0 besitzen, und der Betrieb sei stationär. Die Energieund Entropiebilanzen lauten dann wie (1-121) und ergeben für die Leistungszahl ˙ = εrev (1 − T 0 S˙ irr /P) εrev ε ≡ −Q/P (1-125) mit εrev ≡ T/(T − T 0 ) .
(1-126)
Eine Sonderform der Wärmepumpe ist die Kältemaschine, siehe Bild 1-8d. Sie entzieht einem Kühlraum den Wärmestrom Q˙ 0 > 0 bei einer Temperatur T 0 unterhalb der Temperatur T u der natürlichen Umgebung und führt den Wärmestrom Q˙ > 0 bei T = T u an diese Umgebung ab. Aus den Energie- und Entropiebilanzen (1-121) erhält man für die Leistungszahl der Kältemaschine εK ≡ Q˙ 0 /P = (εK )rev (1 − T u S˙ irr /P) (εK )rev (1-127) mit (εK )rev ≡ T 0 /(T u − T 0 ) .
(1-128)
Beide Verhältnisse von Nutzen zu Aufwand, ε und εK , nehmen für den reversiblen Grenzfall einen temperaturabhängigen Maximalwert an und werden durch Entropieerzeugung gemindert. Wegen −Q˙ = Q˙ 0 + P ist stets ε 1, während εK Werte größer oder kleiner als eins annehmen kann. Die Ergebnisse (1-122), (1-125) und (1-127) lassen sich auf den Fall der Wärmezu- und -abfuhr bei nicht einheitlicher Temperatur übertragen, wenn anstelle von T und T 0 thermodynamische Mitteltemperaturen benutzt werden. Diese sind als Q˙ (1-129) Tm ≡ . ˙ dQ/T definiert, wobei dQ˙ der auf dem Flächenelement dA der Systemgrenze bei der Temperatur T übertragene
F19
F20
F Technische Thermodynamik
Wärmestrom ist, der sich für die Gesamtfläche zu Q˙ summiert. Die Nennergröße bedeutet den von Q˙ mitgeführten Entropiestrom. Mit (1-129) bleiben alle Entropiebilanzen formal unverändert. Wird die Wärme über die Wände eines Kanals an ein reversibel und isobar strömendes Fluid konstanter Zusammensetzung übertragen, folgt mit (1-116), (1-117) und (1-118) aus (1-129) T m = (h2 − h1 )/(s2 − s1 ) .
(1-130)
Damit ist T m auf die Zustandsänderung des wärmeabgebenden bzw. wärmeaufnehmenden Fluids zurückgeführt. Im Allgemeinen durchläuft in den energiewandelnden Maschinen von Bild 1-8b bis d ein fluides Arbeitsmittel konstanter Zusammensetzung einen Kreisprozess. Dieser ist so erklärt, dass in der Folge der Zustandsänderungen der Endzustand des Arbeitsmittels mit dem Anfangszustand übereinstimmt. In technischen Ausführungen strömt das Arbeitsmittel meist nach Bild 1-9 durch eine in sich geschlossene Kette stationärer Maschinen und Apparate, die zusammen die energiewandelnde Maschine darstellen. Aber auch periodische Zustandsänderungen des Arbeitsmittels im Zylinder einer Kolbenmaschine sind denkbar. Obwohl in diesem Fall ein stationärer Zustand nur im zeitlichen Mittel möglich ist, gelten die Bilanzen (1-121) und ihre Folgerungen aufgrund von (1-98) und (1-111) auch hier.
Bild 1-10. Eingeschlossene Flächen in Zustandsdiagram-
men und Umlaufsinn der Kreisprozesse für Wärmekraftmaschine WKM und Wärmepumpe WP. a T, s-Diagramm; b p, v-Diagramm
Summiert man (1-117) und (1-120) über alle Teile einer in sich geschlossenen Reihenschaltung stationärer ψik und Fließsysteme, folgt mit q ≡ qik , ψ ≡ wt ≡ wt,ik 0 0 T ds = q + ψ und v dp = wt − ψ . (1-131) Danach ist die von den Zustandslinien im T, sDiagramm, siehe Bild 1-10a, eingeschlossene Fläche gleich dem Betrag der Wärme q und der Dissipationsenergie ψ des Kreisprozesses. Die entsprechende Fläche im p, v-Diagramm, siehe Bild 1-10b, ist der Betrag der um die Dissipationsenergie verminderten technischen Arbeit wt . Beide Flächen sind nach (1-118) betragsgleich: 0 0 q+ψ= T ds = − v dp = −(wt − ψ) , (1-132) worin sich die Energiebilanz des Kreisprozesses widerspiegelt. Aufgrund der Vorzeichen von q und wt sind Wärmekraftmaschinenprozesse in beiden Diagrammen rechtsläufig und Wärmepumpenprozesse linksläufig. Für Kreisprozesse mit periodisch arbeitenden Maschinen erhält man auf der Grundlage von (1-112), (1-113) und (1-114) identische Ergebnisse. 1.6.2 Wertigkeit von Energieformen
Bild 1-9. Ausführung eines Kreisprozesses als stationärer Fließprozess in einer geschlossenen Kette von Kontrollräumen KR1 bis KR4
Für die thermodynamische Analyse zur Umwandelbarkeit von Energieformen hat sich neben der Darstellung aus dem vorhergehenden Abschnitt ein weiterer, gleichwertiger Ansatz etabliert. Hierzu wird jede Energieform formal in die Anteile Energie = Exergie + Anergie
(1-133)
1 Grundlagen
zerlegt. Die Exergie ist dabei – nach Maßgabe der jeweils zugelassenen Austauschprozesse mit der Umgebung – der in jede Energieform, insbesondere in Nutzarbeit umwandelbare Teil der Energie. Die Anergie ist der nicht in Nutzarbeit umwandelbare Rest. In dieser Definition ist die Umgebung als Reservoir im inneren Gleichgewicht idealisiert, das bei konstanten Werten der Temperatur T u , der Drucks pu und der chemischen Potenziale μiu seiner Komponenten Entropie, Volumen und Stoffmengen aufnehmen und abgeben kann. Zur Anwendung auf Verbrennungsprozesse hat Baehr [17] eine Umgebung aus gesättigter feuchter Luft, vgl. 2.2.2, sowie den Mineralien Kalkspat und Gips vorgeschlagen. Ein komplizierteres Umgebungsmodell zur Quantifizierung der Werte T u , pu und μiu findet man in [18] oder [19]. Wellen- und elektrische Arbeit sind in jede andere Energieform umwandelbar und bestehen somit aus reiner Exergie. Dies lässt sich auch für die kinetische und potenzielle Energie in einer ruhenden Umgebung der Höhe zu = 0 zeigen. Von der VolumenänV eines Systems ist dagegen der an derungsarbeit W12 der Umgebung verrichtete Anteil −pu ΔV nicht technisch nutzbar und muss als Anergie gerechnet werden. Damit ergibt sich für die Exergie und Anergie der Volumenänderungsarbeit
und hat seine Arbeitsfähigkeit verloren. Aus den Bilanzen (1-96) und (1-104) für das zusammengesetzte System dW n = dU α + dU U
lässt sich die maximale Nutzarbeit berechnen, die bei einem reversiblen Prozess anfällt. Es folgt für die Exergie E α und die Anergie Bα der Inneren Energie der Phase α: E α = U1α −Uuα −T u (S 1α −S uα )+ pu (V1α −Vuα ) , (1-138) Bα = Uuα + T u (S 1α − S uα ) − pu (V1α − Vuα ) .
(1-139)
Der Index 1 bezieht sich auf den Anfangszustand, der Index u auf das Gleichgewicht der Phase α mit der Umgebung. Wird außer dem thermischen und mechanischen auch das stoffliche Gleichgewicht mit der Umgebung hergestellt, gilt Uuα =
K
6 7 Uiu nαi ,
i=1
S uα =
K
6 7 S iu nαi
(1-140)
i=1
und Vuα =
K
6 7 Viu nαi ,
i=1
"2 E WV = −
und dS α + dS U = dS irr
(p − pu )dV ,
(1-134)
1
BWV = −pu (V2 − V1 ) . (1-135) Die Exergie E˙ Q und Anergie B˙ Q eines Wärmestroms Q˙ mit der thermodynamischen Mitteltemperatur T m ist durch die Leistung und den Abwärmestrom einer reversiblen Wärmekraftmaschine gegeben. Nach (1-122) und (1-123) gilt E˙ Q = (1 − T u /T m )Q˙ , B˙ Q = (T u /T m )Q˙ .
(1-136) (1-137)
Für T m < T u ist 1 − T u/T m < 0, sodass die zugehörige Exergie entgegengesetzt zur Wärme strömt. Die Exergie einer Phase α mit der inneren Energie U α findet man als maximale Nutzarbeit (−W n )max eines Prozesses, der die Phase ins Gleichgewicht mit der Umgebung U bringt. In diesem Zustand besitzt das Gesamtsystem aus α und Umgebung nach dem zweiten Hauptsatz ein Minimum seiner inneren Energie
wobei Xiu die partiellen molaren Zustandsgrößen der Stoffe i in der Umgebung sind. Für isothermisobare Prozesse bei T u und pu wird (1-138) gleich der Abnahme der freien Enthalpie. Die spezifische Exergie eines Stoffstroms m ˙ mit der spezifischen Enthalpie h und der spezifischen Entropie s lässt sich als maximale Nutzarbeit (−wt )max einer stationären Maschine bestimmen, die den Stoffstrom ins Gleichgewicht mit der Umgebung setzt. Die Bilanzen (1-101) und (1-115) für das aus der Umgebung und der Maschine zusammengesetzte System ˙ t + mh ˙ dU U /dτ = mw
und dS U /dτ = ms ˙ + S˙ irr
zeigen, dass die maximale Nutzarbeit von einer reversiblen Maschine geliefert wird, und ergeben für die spezifische Exergie e und die spezifische Anergie b der Enthalpie e = h − hu − T u (s − su ) ,
(1-141)
b = hu + T u (s − su ) .
(1-142)
F21
F22
F Technische Thermodynamik
Der Index u kennzeichnet wieder den Gleichgewichtszustand des Stoffstroms mit der Umgebung. Besteht neben dem thermischen und mechanischen auch stoffliches Gleichgewicht, ist analog zu (1-139) hu =
K
Hiu ξ¯i /Mi
und
su =
i=1
K
S iu ξ¯i /Mi (1-143)
i=1
zu setzen. Dabei sind ξ¯i die Massenanteile der Komponenten i des Stoffstroms und Mi ihre Molmassen. Im Gegensatz zur Exergie der inneren Energie kann die Exergie der Enthalpie auch negativ werden, sodass Arbeit aufzuwenden ist, um den Stoffstrom in die Umgebung zu fördern. Wie Wärme bei Umgebungstemperatur sind die innere Energie einer Phase und die Enthalpie eines Stoffstroms im Gleichgewichtszustand mit der Umgebung reine Anergie. Für Exergie und Anergie lassen sich Bilanzen der Form (1-88) aufstellen: |E˙ a | − E˙ v , (1-144) dE/dτ = E˙ e − aus
ein
dB/dτ =
B˙ e −
ein
| B˙ a| + E˙ v ,
(1-145)
aus
deren Summe den Energieerhaltungssatz ergibt. Der Exergieverluststrom E˙ v ist stets positiv, denn aus dem Vergleich der Anergiebilanz mit der Entropiebilanz (1-115) für einen beliebigen Kontrollraum folgt E˙ v = T u S˙ irr 0 .
(1-146)
Alle Lebens- und Produktionsprozesse benötigen Exergie, die durch Entropieerzeugung unwiderbringlich in Anergie verwandelt wird. Diese Entwertung von Energie ist in der Sprache der Energiewirtschaft der Energieverbrauch. Exergiebilanzen zeigen, wo Exergie verloren geht, und bilden die Grundlage für die Definition exergetischer Wirkungsgrade [20].
2 Stoffmodelle Für die praktische Anwendung der allgemeingültigen thermodynamischen Beziehungen fluider Phasen von Kapitel 1 müssen zusätzlich Stoffmodelle für die jeweils betrachteten Substanzen hinzugezogen werden. Diese individuellen Stoffmodelle werden durch Zustandsgleichungen bereitgestellt, die durch Messung
von Zustandsgrößen, in Teilen ergänzt durch molekulartheoretische Berechnungen für die verschiedenen Substanzen abgeleitet werden. Das Zustandsverhalten einer fluiden Phase kann gemäß (1-15) durch eine Fundamentalgleichung der Form U = U(S , V, ni ) oder deren Legendre-Transformierte vollständig beschrieben werden. Da nur für wenige Substanzen derartige Fundamentalgleichungen bekannt sind, vgl. Kapitel 2.1.4, werden vielfach einfach zu handhabende spezielle Zustandsgleichungen verwendet; die thermische Zustandsgleichung p = p (T, V, ni ), die kalorische Zustandsgleichung U = U(T, V, ni ) bzw. H = H(T, p, ni ) und die Entropie-Zustandsgleichung z. B. in der Form S = S (T, V, ni ), vgl. (1-16) bis (1-18) in Kapitel 1.2.1. Die thermische Zustandsgleichung ist von Bedeutung, da die thermischen Zustandsgrößen p, T und v = V/m gut messbar sind und auf deren Basis das Realverhalten von Fluiden beschrieben werden kann. Die kalorischen Zustandsgleichungen sind zur Auswertung der Energiebilanzgleichung (1-98) bzw. (1-101) notwendig, die Entropie-Zustandsgleichung zur Auswertung der Entropiebilanzgleichung (1-115). Weder die Innere Energie U noch die Enthalpie H oder die Entropie S sind einer direkten Messung zugänglich, sie müssen über die entsprechenden Zustandsgleichungen anhand messbarer Zustandsgrößen, z. B. p und T , für den jeweiligen Zustand und das jeweilige Fluid berechnet werden. Die Stoffmodelle für Gemische basieren auf den Zustandsgleichungen der beteiligten reinen Komponenten, die durch Mischungsregeln verknüpft und durch Korrekturterme ergänzt werden. Die Zustandsgleichungen für reine Stoffe basieren in der Regel auf dem theoretisch fundierten Modellfluid des idealen Gases, ergänzt mit Abweichungsfunktionen für das durch molekulare Wechselwirkungen bedingte Realverhalten.
2.1 Reine Stoffe In Bild 2-1 ist die p, v, T -Zustandsfläche eines Reinstoffes dargestellt [1]. Es wird deutlich, dass bereits die thermische Zustandsgleichung für ein reales reines Fluid keine einfache analytische Funktion sein kann. Im Grenzzustand niedriger Dichte verhalten sich reale Gase annähernd wie ein ideales Gas. Das ideale Gas ist ein Modellfluid, welches über besonders einfache,
2 Stoffmodelle
Bild 2-1. p, v, T -Fläche eines reinen Stoffes
theoretisch belastbare Zustandsgleichungen definiert ist. Analoges gilt für den Grenzzustand hoher Dichte, wo sich reale Stoffe annähernd wie ein inkompressibles Fluid verhalten. 2.1.1 Ideale Gase
Aus der Sicht der Statischen Mechanik, vgl. B 8, ist ein ideales Gas ein System punktförmiger Teilchen, die keine Kräfte aufeinander ausüben. Dieses Modell gibt das Grenzverhalten der Materie bei verschwindender Dichte wieder und kann näherungsweise auf Gase mit Drücken bis zu 1 MPa (10 bar) angewendet werden. Jedes reine ideale Gas genügt der thermischen Zustandsgleichung
pV = nRm T = mRT
(2-1)
mit Rm = (8,314472 ± 0,0000070 J/(mol · K) (2-2) und R = Rm /M . (2-3) Dabei ist Rm nach (1-79) die universelle und R die spezielle Gaskonstante; M ist die molare Masse des Gases. Die Zustandsgrößen des idealen Gases werden durch den Index iG gekennzeichnet. Im Normzustand mit tn = 0 ◦ C und pn = 1,01325 bar beträgt das Molvolumen eines idealen Gases einheitiG = 22,41410 m3 /kmol. Gleichungen für die lich Vmn Isothermen (T = const), Isobaren (p = const) und Isochoren (v = const) eines idealen Gases lassen sich unmittelbar aus (2-1) ablesen, vgl. B 8.7. Aus (∂u/∂v)T (∂p/∂T )v − p nach Tabelle 1-1 folgt mit (2-1)
F23
F24
F Technische Thermodynamik
(∂u/∂v)T = 0, d. h. die kalorische Zustandsgleichung u(T, v) = uiG (T ) für die spezifische innere Energie des idealen Gases ist eine reine Temperaturfunktion. Wegen h = u + pv nach (1-41) überträgt sich diese Eigenschaft auf die kalorische Zustandsgleichung h(T, p) = uiG (T ) + RT = hiG (T ) für die Enthalpie sowie auf die spezifischen Wärmen cv (T, v) = (∂u/∂T )v = duiG (T )/dT = ciG v (T ) , (2-4) c p (T, p) = (∂h/∂T ) p = dhiG (T )/dT = ciG p (T ) , (2-5) iG mit ciG p (T ) − cv (T ) = R ,
=
12
iG κ(T ) = ciG p (T )/c p (T ) ,
(2-8)
ist der Isentropenexponent des idealen Gases. Die Integration von (2-4) und (2-5) über die Temperatur liefert für die spezifische innere Energie und die spezifische Enthalpie des idealen Gases "T u (T ) = u(T 0 ) + iG
ciG v (T ) dT T0
(2-6)
vgl. (1-20), (1-47) und (1-54). Im Gegensatz zu (2-1) iG ist ciG v (T ) bzw. c p (T ) nach Bild 2-2 eine individuelle, von den molekularen Freiheitsgraden abhängige Eigenschaft jedes Gases. Für Edelgase ist ciG v = (3/2)R. Eine Näherungsgleichung zur Berechnung der spezifischen Wärmekapazität idealer Gase in Abhängigkeit von Temperatur lautet ciG p (T )
Wärmekapazitäten,
= u(T 0 ) + (h − h0 ) − R(t − t0 ) ,
(2-9)
"T h (T ) = h(T 0 ) + iG
ciG p (T ) dT T0
= h(T 0 ) + c¯ iG ¯ iG p (t)t − c p (t0 )t0 t " mit c¯ iG (t) ≡ (1/t) ciG p p (t) dt ,
(2-10) (2-11)
0 ∗ k−8
ck (T/T )
,
(2-7)
k=1
wobei die Koeffizienten ck für einige Gase in Tabelle 2-1 angegeben sind. Die Bezugstemperatur ist T ∗ = 1000 K [2]. Das Verhältnis der spezifischen
wobei t die Celsius-Temperatur bedeutet. Zustandsgleichungen für die spezifische Entropie lassen sich unter Berücksichtigung der speziellen Eigenschaften (2-1), (2-4) und (2-5) idealer Gase durch Integration der Beziehungen ds = du/T + (p/T ) dv
iG Bild 2-2. Verhältnis ciG v /R = c p /R − 1 für verschiedene ideale Gase als Funktion der Temperatur T [1]
2 Stoffmodelle
Tabelle 2-1. Gaskonstante R, spezifische konventionelle (absolute) Entropie s im Standardzustand, Koeffizienten c1 bis c12
der Gl.(2-7), der Koeffizient c0 und d0 in (2-17) bzw. (2-18) für fünf ideale Gase. Alle Angaben in kJ/kg K R s c0 c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 d0
N2 0,296803 6,83991 −1,376336638 −0,0000797270 0,0023227098 −0,029183817 0,20640159 −0,89792462 2,4588600 −4,149474 5,082928 −2,102458 0,722736 −0,1381195 0,01126722 6,7561483
O2 0,259837 6,41124 −1,097473175 0,0000152385 −0,0003952036 0,004000136 −0,01804445 0,01378745 0,2108220 −0,908682 2,389091 −0,909577 0,375736 −0,0721146 0,00535447 7,554335
CO2 0,188922 4,8576 −1,120840650 −0,0000481280 0,0013119490 −0,015483339 0,10362701 −0,43314776 1,1831570 −2,186309 3,292046 −0,963963 0,300080 −0,0506986 0,00361903 5,301110
und ds = dh/T − (v/T ) dp
(2-12)
gewinnen, die bei konstanter Zusammensetzung aus (1-37) und (1-41) folgen. Das Ergebnis ist
+
ciG v (T )/T dT + R ln(v/v0 ) ,
(2-13)
T0
+
⎤ ⎥⎥⎥ 12 ⎥ ck ∗ k−7 ⎥ + (T/T ) ⎥⎥⎥⎥ ⎥⎦ k−7 k=1
(2-17)
k7
siG (T ) = d0 + c8 ln(T/T ∗ ) +
12 ck (T/T ∗ )k−8 k − 8 k=1
(2-18)
ciG p (T )/T dT − R ln(p/p0 ) ,
(2-14)
T0
= siG (T ) − R ln(p/p0 ) , mit
⎡ ⎢⎢⎢ ⎢⎢ hiG (T ) = T ∗ ⎢⎢⎢⎢c0 + c7 ln(T/T ∗ ) ⎣⎢
k8
s(T, p) = s(T 0 , p0 ) "T
CH4 0,518294 11,6101 −0,405923627 −0,000425411 0,010275063 −0,10429816 0,580986652 −1,9602634 4,1914281645 −5,4207437 3,91323688 5,7457815673 −3,147775574 0,8111713164 −0,08104304 7,1806396
und die Temperaturfunktion der spezifischen Entropie gemäß
s(T, v) = s(T 0 , v0 ) "T
H2 O 0,461523 10,48192 3,759590061 0,0000685451 −0,0024292033 0,035937090 −0,29186010 1,43739067 −4,4771600 8,965501 −9,730609 9,294361 −3,621326 0,7448079 −0,06278425 12,342754
"T s (T ) ≡ s0 + ciG p (T )/T dT . iG
(2-15) (2-16)
T0
Für die in der Tabelle 2-1 aufgeführten Gase kann die spezifische Enthalpie im idealen Gaszustand gemäß
berechnet werden. Die Integrationskonstante c0 wurde so bestimmt, dass die spezifische Enthalpie hiG (T ) für T = 273,15 K (t = 0 ◦ C) gleich null wird. Die Integrationskonstante d0 für die spezifische Entropie siG (T ) wurde so angepasst, dass bei der thermochemischen Standardtemperatur T 0 = 298,15 K (t = 25 ◦ C) der Wert der spezifischen Standardentropie s erreicht wird. Für die technisch wichtigen Gase Luft (trocken) und Wasser (gasförmig) sind diese Werte für den idealen Gaszustand in Tabelle 2-2 als Funktion der Temperatur zusammengestellt [2].
F25
F26
F Technische Thermodynamik
iG Tabelle 2-2. Die spez. Wärmekapazität ciG in kJ/kg sowie die spez. Entropie siG p in kJ/kg K, die spez. Enthalpie h
in kJ/kg K als Funktion der Celsius-Temperatur [57]. Bezugswerte siehe Text ◦
t in C −50 −25 0 25 50 75 100 125 150 175 200 225 250 275 300 350 400 450 500 550 600 650 700 750 800 900
ciG p (t) Luft H2 O 1,0026 1,8515 1,0030 1,8546 1,0037 1,8589 1,0047 1,8644 1,0061 1,8713 1,0080 1,8799 1,0104 1,8899 1,0132 1,9011 1,0165 1,9134 1,0203 1,9264 1,0245 1,9401 1,0292 1,9544 1,0341 1,9690 1,0394 1,9840 1,0449 1,9993 1,0565 2,0309 1,0685 2,0634 1,0805 2,0969 1,0924 2,1311 1,1040 2,1660 1,1152 2,2013 1,1258 2,2370 1,1359 2,2727 1,1454 2,3084 1,1544 2,3438 1,1706 2,4133
hiG (t) Luft −50,1543 −25,0838 0,0000 25,1046 50,2396 75,4158 100,6447 125,9383 151,3088 176,7682 202,3277 227,9979 253,7882 279,7066 305,7600 358,2924 411,4147 465,1390 519,4636 574,3766 629,8588 685,8863 742,4321 799,4680 856,9655 973,2336
H2 O −92,7405 −46,4171 0,0000 46,5385 93,2318 140,1187 187,2375 234,6222 282,3012 330,2973 378,6283 427,3087 476,3500 525,7622 575,5536 676,3042 778,6567 882,6594 988,3551 1095,7795 1204,9605 1315,9172 1428,6595 1543,1880 1659,4948 1897,3706
siG (t) Luft H2 O 6,5736 9,9439 6,6801 10,1407 6,7764 10,3189 6,8644 10,4819 6,9453 10,6323 7,0203 10,7721 7,0903 10,9028 7,1559 11,0257 7,2177 11,1418 7,2762 11,2520 7,3317 11,3569 7,3846 11,4572 7,4351 11,5533 7,4835 11,6455 7,5299 11,7343 7,6178 11,9029 7,6998 12,0608 7,7768 12,2098 7,8494 12,3512 7,9182 12,4858 7,9837 12,6145 8,0461 12,7381 8,1057 12,8570 8,1629 12,9718 8,2177 13,0828 8,3213 13,2937
Ist ciG p (T ) in einem Temperaturbereich näherungsweise konstant, kann die Entropie nach (2-12) und (2-6) auch in der Form iG s = s0 + ciG v ln(p/p0 ) + c p ln(v/v0 )
(2-19)
dargestellt werden. Die Isentropengleichungen eines idealen Gases, welche Zustandsänderungen bei konstanter Entropie s = const beschreiben, folgen unmittelbar aus (2-13), (2-14) und (2-19). Bei konstanter spezifischer Wärmekapazität lauten sie T/T 0 = (p/p0 )R/c p = (p/p0 )κ−1/κ iG
(2-20)
sowie p/p0 = (v0 /v)c p /cv = (v0 /v)κ iG
iG
(2-21)
mit dem Isentropenexponenten κ(T ) = ciG p (T )/ iG cv (T ), vgl. (2-8). Die isentrope Enthalpiedifferenz "2 Δh s ≡ h(p2 , s1 ) − h(p1 , s1 ) =
v(p, s1 ) dp , 1
(2-22)
lässt sich bei näherungsweiser konstanten Wärmekapazität zu Δh s =
κ R T 1 [(p2 /p1 )(κ−1)/κ − 1] κ−1
(2-23)
bestimmen. Für das chemische Potenzial eines reinen idealen Gases folgt aus (1-9) mit (1-46)
2 Stoffmodelle
∂U iG μ (T, p) = ∂n
iG
s, v
∂GiG = ∂n
und die in (2-22) definierte isentrope Enthalpiedifferenz wird
T, p
= μ (T ) + Rm T ln(p/p0 ) . iG
(2-24)
Dabei ist μiG (T ) das chemische Potenzial beim Standarddruck p0 und der Temperatur T , in das über die molare isobare Wärmekapazität C p, m die individuellen Stoffeigenschaften eingehen "T μ (T ) = iG
μiG 0 (T 0 ,
p0 ) +
−T
C iG p, m (T ) T
dT
(2-25)
T0
und iG iG μiG 0 (T 0 , p0 ) = H0, m (T 0 ) − T 0 · S 0, m (T 0 , p0 ) .
Neben dem Modellfluid des idealen Gases kann ein weiteres vereinfachtes Stoffmodell eingeführt werden. In begrenzten Temperatur- und Druckbereichen haben Flüssigkeiten näherungsweise konstante Dichte ρ und folgen der thermischen Zustandsgleichung (2-26)
Dies führt nach Tabelle 1-1 zu (∂s/∂p)T = 0, d. h., die spezifische Entropie s und die spezifische Wärmekapazität c p (T, p) = c(T ) des inkompressiblen Fluids hängen allein von der Temperatur ab. Innerhalb des Gültigkeitsbereichs von (2-26) ist es zulässig, c(T ) = c = const zu setzen. Dann folgt mit du = dh−vdp− pdv nach (1-41) und dh = c dT +v0 dp nach Tabelle 1-1 sowie durch Integration für die innere Energie und die Enthalpie u = u0 + c(T − T 0 ) ,
(2-27)
h = h0 + c(T − T 0 ) + v0 (p − p0 ) .
(2-28)
Wegen cv = (∂u/∂T )v = c besitzt das inkompressible Fluid nur eine einzige spezifische Wärmekapazität c p = cv = c. Für die Entropie findet man aus ds = (c/T )dT nach Tabelle 1-1 s = s0 + c ln(T/T 0) ,
Der Herleitung entsprechend gelten (2-26) bis (2-29) auch für Gemische, wenn für die Parameter c und v0 die entsprechenden Gemischgrößen eingesetzt werden.
Die vorgehend beschriebenen einfachen Stoffmodelle sind nur für eingeschränkte Zustandsbereiche näherungsweise gültig. Der sinnvolle Anwendungsbereich der thermischen Zustandsgleichung des idealen Gases kann durch eine Reihenentwicklung erweitert werden. Diese führt auf die theoretisch begründete Virialzustandsgleichung, welche man durch die Reihenentwicklung des Realgasfaktors z :=
2.1.2 Inkompressible Fluide
v(T, p) = v0 = 1/ρ0 = const .
(2-30)
2.1.3 Reale Fluide
C iG p, m (T ) dT T0
"T
Δh s = v0 (p2 − p1 ) .
(2-29)
p · Vm p·v = R·T Rm · T
(2-31)
nach der Stoffmengenkonzentration c¯ = 1/Vm z = 1 + B(T )/Vm + C(T )/Vm2 + . . .
(2-32)
bzw. nach dem Druck z = 1 + B (T )p + C (T )p2 + . . .
(2-33)
erhält. Die stoffabhängigen Temperaturfunktionen B(T ) und B (T ) heißen zweite, C(T ) und C (T ) dritte Virialkoeffizienten. Beide Koeffizientensätze sind ineinander umrechenbar; insbesondere ist [8] B = B/(Rm T ) und C = (C − B2 )/(RmT )2 .
(2-34)
Die Größen B und C lassen sich anhand gemessener p, v, T -Daten auf einer Isotherme B = lim[(z − 1)Vm ]T c¯ →0 C = lim (z − 1 − B/Vm )Vm2 c¯ →0
(2-35) T
(2-36)
bestimmen. Werte für den zweiten Virialkoeffizienten einzelner Gase sind in [10] zusammengestellt. Für nicht stark polare und nicht assoziierende oder dimerisierende Stoffe wurde von Tsonopoulos [11] die
F27
F28
F Technische Thermodynamik
Tabelle 2-3. Temperatur T k , Druck pk , Molvolumen Vmk und Realgasfaktor zk im kritischen Zustand sowie azentrischer Faktor ω ausgewählter Substanzen [6], [21]
Einfache Gase Argon Ar Brom Br2 Chlor Cl2 Helium 4 He Wasserstoff H2 Krypton Kr Neon Ne Stickstoff N2 Sauerstoff O2 Xenon Xe Verschiedene anorganische Substanzen Ammoniak NH3 Kohlendioxid CO2 Schwefelkohlenstoff CS2 Kohlenmonoxid CO Tetrachlorkohlenstoff CCl4 Chloroform CHCl3 Hydrazin N2 H4 Chlorwasserstoff HCl Cyanwasserstoff HCN Schwefelwasserstoff H2 S Stickstoffoxid NO Distickstoffoxid N2 O Schwefeldioxid SO2 Schwefeltrioxid SO3 Wasser H2 O Verschiedene organische Substanzen Methan CH4 Ethan C2 H6 Propan C3 H8 n-Butan C4 H10 Isobutan C4 H10 n-Pentan C5 H12 Isopentan C5 H12 Neopentan C5 H12 n-Hexan C6 H14 n-Heptan C7 H16 n-Oktan C8 H18 Ethylen C2 H4 Propylen C3 H6 1-Buten C4 H8 1-Penten C5 H10 Essigsäure CH3 COOH Aceton CH3 COCH3 Acetonitril CH3 CN Acetylen C2 H2
T k /K
pk /MPa
Vmk /(dm3 /mol)
zk
ω
150,8 584 417 5,2 33,1 209,4 44,4 126,3 154,6 289,7
4,87 10,3 7,7 0,227 1,31 5,50 2,76 3,40 5,04 5,84
0,0749 0,127 0,124 0,0573 0,0650 0,0912 0,0417 0,0895 0,0734 0,118
0,291 0,270 0,275 0,301 0,305 0,288 0,311 0,290 0,288 0,286
0,0 0,132 0,073 −0,387 −0,22 0,0 0,0 0,036 0,023 0,0
405,6 304,3 552 132,9 556,4 536,4 653 324,6 456,8 373,2 180 309,6 430,8 491,0 647,1
11,28 7,38 7,9 3,50 4,56 5,5 14,7 8,3 5,39 8,94 6,5 7,24 7,88 8,2 22,06
0,0725 0,0940 0,170 0,0931 0,276 0,239 0,0961 0,081 0,139 0,0985 0,058 0,0974 0,122 0,130 0,056
0,242 0,274 0,293 0,295 0,272 0,293 0,260 0,249 0,197 0,284 0,25 0,274 0,268 0,26 0,229
0,250 0,224 0,115 0,048 0,194 0,216 0,328 0,12 0,407 0,100 0,607 0,160 0,251 0,41 0,345
190,6 305,4 369,8 425,1 408,1 469,6 460,4 433,8 507,4 540,2 568,8 282,4 365,0 419,6 464,7 594,4 508,1 547,9 308,3
4,60 4,88 4,25 3,80 3,65 3,37 3,38 3,20 2,97 2,74 2,48 5,04 4,62 4,02 4,05 5,79 4,70 4,83 6,14
0,099 0,148 0,203 0,255 0,263 0,304 0,306 0,303 0,370 0,432 0,492 0,129 0,181 0,240 0,300 0,171 0,209 0,173 0,113
0,288 0,285 0,281 0,274 0,283 0,262 0,271 0,269 0,260 0,263 0,259 0,276 0,275 0,277 0,31 0,200 0,232 0,184 0,271
0,012 0,099 0,152 0,200 0,176 0,251 0,227 0,197 0,301 0,351 0,398 0,085 0,148 0,187 0,245 0,454 0,309 0,321 0,184
2 Stoffmodelle
Tabelle 2-3. Fortsetzung
T k /K 562,1 425,0 632,4 553,4 466,7 516,2 469 512,6 416,3 535,6 591,7 369,3 374,2
Benzol C6 H6 1,3-Butadien C4 H6 Chlorbenzol C6 H5 Cl Cyclohexan C6 H12 Diethylether C2 H5 OC2 H5 Ethanol C2 H5 OH Ethylenoxid C2 H4 O Methanol CH3 OH Methylchlorid CH3 Cl Methylethylketon CH3 COC2 H5 Toluol C6 H5 CH3 Monochlordifluormethan (R22) CHClF2 Tetrafluorethan (R134a) CF3 CH2 F
nach dem Korrespondenzprinzip generalisierte Darstellung B · pk /(Rm T k ) = f (0) (T r ) + ω f (1) (T r ) mit und
(2-37)
f = 0,1445 − 0,330/T r − 0,1385/T r2 − 0,0121/T r3 − 0,000607/T r8 (2-38) f1(0) = 0,0637 + 0,331/T r2 − 0,423/T r3 − 0,008/T r8 (2-39) (0)
gefunden. Neben den kritischen Größen pk und T k tritt hier als weiterer stoffspezifischer Parameter der azentrische Faktor nach Pitzer [4] 2 3 ω = − lg p s (T r = 0,7)/pk − 1 auf. Beschränkt man sich auf Gaszustände bis zur halben kritischen Dichte, darf die Virialentwicklung nach dem 2. Glied abgebrochen werden. Aus (2-31) und (2-32) folgt dann die nach dem Druck und Molvolumen auflösbare Beziehung pVm = Rm T + Bp .
(2-40)
Das sehr einfache Modell des inkompressiblen Fluids aus Kapitel 2.1.2 kann durch den in T und p linearen Ansatz 3 2 (2-41) v(T, p) = v0 1 + β0 (T − T 0 ) − 0 (p − p0 ) erweitert werden. Hierbei sind β0 und 0 die Werte des Volumen-Ausdehnungskoeffizienten bzw. des isothermen Kompressibilitätskoeffizienten
pk /MPa 4,89 4,33 4,52 4,07 3,64 6,38 7,19 8,10 6,68 4,15 4,11 4,989 4,056
Vmk /(dm3 /mol) 0,259 0,221 0,308 0,308 0,280 0,167 0,140 0,118 0,139 0,267 0,316 0,166 0,197
1 ∂v ; β0 := v ∂T p
0
zk 0,271 0,270 0,265 0,273 0,262 0,248 0,258 0,224 0,268 0,249 0,264 0,270 0,257
1 ∂v := − v ∂p T
ω 0,212 0,195 0,249 0,213 0,281 0,635 0,200 0,559 0,156 0,329 0,257 0,220 0,327
(2-42)
in dem durch den Index 0 gekennzeichneten, frei wählbaren Bezugszustand. Werte von β0 und 0 sind z. B. im Tabellenwerk Landolt-Börnstein [58] enthalten. Thermische Zustandsgleichungen, die das ganze fluide Zustandsgebiet einschließlich der hier möglichen Aufspaltung in eine flüssige und eine dampfförmige Phase (Nassdampfgebiet in Bild 2-1) beschreiben können, müssen nach Kapitel 1.3.3 bereichsweise auch (∂p/∂v)T > 0 zulassen. Die halbempirischen sogenannten kubischen Zustandsgleichungen fassen die Reihenglieder von (2-32) in wenigen Termen zusammen. Praktisch bewährt hat sich für unpolare und schwach polare Stoffe die Gleichung von Redlich-Kwong-Soave [16] p = Rm T/(Vm − b) − a/[Vm (Vm + b)]
(2-43)
mit a = ak α(T r , ω) , 2 α= 1+m ¯ 1 − T r0,5
(2-44) (2-45)
und m ¯ = 0,480 + 1,574 ω − 0,176 ω2 ,
(2-46)
in der a(T r = 1) = ak ist. Die Koeffizienten ak und b sind aus der Bedingung zu ermitteln, dass die kritische Isotherme im kritischen Punkt eine horizontale Wendetangente besitzt, vgl. Bild 1-2 unten. Die Auswertung von (1-74) und (2-43) am kritischen Punkt [17] liefert für das kritische molare Volumen
F29
F30
F Technische Thermodynamik
Vmk = (1/3)Rm T k /pk
(2-47)
und für die beiden Koeffizienten 2 ak = (1/9)R2mT k2 /(br pk ) = Vmk pk /br b = (1/3)brRm T k /pk = br Vmk
(2-48)
mit br = 21/3 − 1 = 0,2599 ,
(2-50)
(2-49)
die sämtlich durch Vorgabe von pk und T k festgelegt sind. Mit diesem Ergebnis lässt sich (2-43) in eine dimensionslose Form bringen, sodass das Korrespondenzprinzip erfüllt ist. Eine äquivalente Schreibweise ist die kubische Gleichung v3r − 3(T r /pr )v2r + [(α − 3T r b2r )/(br pr ) − b2r ]vr − α/pr = 0 , (2-51) aus der bei gegebenen Werten von pr und T r das reduzierte Volumen vr = v/vk = Vm /Vmk ohne Iteration mithilfe der Cardanischen Formeln [18] zu berechnen ist. Vergleichbar mit dem unteren Teil von Bild 1-2 erhält man für T < T k drei reelle Wurzeln, von denen die größte dem gasförmigen Zustand und die kleinste dem flüssigen Zustand zuzuordnen ist, während die mittlere zu einem instabilen, unphysikalischen Zustand gehört. Die größten Fehler in der Vorhersage des reduzierten Volumens treten im Flüssigkeitsgebiet auf und betragen bis zu 10%. Dieser Fehler kann durch eine Volumentranslation nach Peneloux [59] vermindert werden. Hierbei wird das mit der kubischen Zustandsgleichung berechnete molare Volumen durch eine Konstante c korrigiert:
Entropie s, lassen sich aus einem Beitrag xiG des hypothetischen idealen Gases bei den Werten der Variablen (T, v) bzw. (T, p) des Fluids und einem Realanteil ΔxRv bzw. ΔxRp zusammensetzen x(T, v) = xiG (T, v) + ΔxRv (T, v) ,
(2-52)
x(T, p) = x (T, p) + Δx (T, p) .
(2-53)
iG
Der Beitrag des idealen Gases ist dabei durch (2-9), (2-10), (2-13) und (2-14) gegeben. Zu beachten ist, dass für einen Zustand im Allgemeinen xiG (T, v) = xiG (T, piG = RT/v) xiG (T, p) ist, weil das reale Fluid die thermische Zustandsgleichung des idealen Gases nicht erfüllt. Für die Realanteile gilt ΔxRv (T, v) = (x − xiG )T, v=∞ "v + [∂(x − xiG )/∂v]T dv ,
(2-54)
∞
ΔxRp (T, p) = (x − xiG )T, p=0 "p +
[∂(x − xiG )/∂p]T dp .
(2-55)
0
Da sich jede Substanz bei v = ∞ bzw. p = 0 wie ein ideales Gas verhält, ist der erste Summand Null. Mit (∂x/∂v)T und (∂x/∂p)T nach Tabelle 1-1 und xiG nach 2.1.1 folgt "u Δu (T, v) = Rv
[T (∂p/∂T )v − p] dv ,
(2-56)
[v − T (∂v/∂T ) p] dp ,
(2-57)
[(∂p/∂T )v − R/v] dv ,
(2-58)
[−(∂v/∂T ) p + R/p] dp .
(2-59)
∞
"p ΔhRp (T, p) =
Vm = Vm,kZG − c .
0
Der Korrekturfaktor kann durch c = 0,40768 (0,29441 − ZRA )
Rp
"v Rm T k pk
und dem Rackett-Kompressibilitätsfaktor ZRA 0,29056 − 0,08775 ω angenähert werden. Weitere thermische Zustandsgleichungen werden in [60] diskutiert. Die kalorischen Zustandsgrößen x realer Fluide, speziell die spezifische innere Energie u, Enthalpie h und
ΔsRv (T, v) = ∞
"p ΔsRp (T, p) = 0
Aus der Definition (1-41) der Enthalpie ergibt sich ΔuRp (T, p) = ΔhRp (T, p)−[pv(T, p)−RT ] , (2-60) ΔhRv (T, v) = ΔuRv (T, v)+[vp(T, v)−RT ] . (2-61)
2 Stoffmodelle
Bei einer druckexpliziten thermischen Zustandsgleichung sind die Variablen (T, v) anzuwenden; für die Variablen (T, p) werden volumenexplizite Zustandsgleichungen benötigt. Die Differenz der spezifischen inneren Energie, der spezifischen Enthalpie bzw. der spezifischen Entropie zwischen zwei gegebenen Zustandspunkten 1 und 2 eines Reinstoffes erhält man aus (2-56) bis (2-58) zu u(T 2 , v2 ) − u(T 1 , v1 ) = "T 2 =
ciG v (T ) dT
"v2 ∂p + −p dv T ∂T v T =T 2
h(p2 , s1 ) = h(p0 , s0 ) + v0 (p2 − p0 ) + T 0 (s1 − s0 )
γ ≡ −(v/p)(∂p/∂v) s
"v1 ∂p −p dv − T ∂T v T =T 1
(2-62)
∞
=
ciG p (T ) dT T1
⎤ "p2 ⎡ ⎢⎢⎢ ∂v ⎥⎥⎥ ⎥⎦ dp + ⎣⎢v − T ∂T p T =T 2
0
⎤ "p1 ⎡ ⎢⎢⎢ ∂v ⎥⎥⎥ ⎥⎦ dp − ⎣⎢v − T ∂T p T =T
(2-63)
1
0
s(T 2 , p2 ) − s(T 1 , p1 ) = "T 2
ciG p (T ) T
dT − R ln
p2 p1
aus. Diese im Prinzip veränderliche Größe [24]
(2-67)
"v mit cv (T, v) = ciG v (T ) + T
1/γ(T, p) = −(p/v) (T/c p )(∂v/∂T )2p + (∂v/∂p)T (2-69) "p mit c p (T, p) = ciG (∂2 v/∂T 2 ) p dp , p (T ) − T 0
(2-70)
⎤ "p2 ⎡ ⎢⎢⎢ ∂v R ⎥⎥⎥ ⎢ − ⎣ − ⎥⎦ dp ∂T p p T =T 0
2
0
1
(∂2 p/∂T 2 )v dv (2-68) ∞
oder
T1
⎤ "p1 ⎡ ⎢⎢⎢ ∂v R ⎥⎥⎥ ⎢ + ⎣ − ⎥⎦ dp . ∂T p p T =T
(2-66)
γ(T, v) = (v/p)[(T/cv)(∂p/∂T )2v − (∂p/∂v)T ]
h(T 2 , p2 ) − h(T 1 , p1 ) = "T 2
(2-65)
zu interpolieren, welche die Funktion h(p, s) an einem geeigneten Gitterpunkt 0 der Dampftafel linearisiert. Ein anderes Verfahren zur Berechnung von Δh s geht von dem Isentropenexponenten
∞
T1
=
Die in (2-22) definierte isentrope Enthalpiedifferenz lässt sich für reale Fluide mithilfe von Dampftafeln ermitteln. Die Enthalpie im Zustand 2 ist dabei zweckmäßig mit der Formel
(2-64)
Auf der Grundlage der spezifischen Wärme im idealen Gaszustand und einer thermischen Zustandsgleichung sind die Größen u, h und s realer Fluide nach (2-52), (2-53) und (2-56) bis (2-59) berechenbar. Die kalorischen Zustandsgrößen sind dabei nur bis auf eine Konstante bestimmt, die durch Vereinbarung festgelegt werden muss. Die Ergebnisse solcher Rechnungen sind für einige technisch wichtige Stoffe in sogenannten Dampftafeln, z. B. [12, 13, 21], niedergelegt.
die für ideale Gase γ = κ (T ) wird, ist in Bereichen des Gasgebietes näherungsweise konstant [25, 26]. Mit einem Mittelwert γ = const folgt aus (2-66) die Isentropengleichung p = p0 (v0 /v)γ , die für (2-22) in Verallgemeinerung von (2-23) die Lösung ergibt Δh s =
γ RT 1 [(p2 /p1 )(γ−1)/γ − 1] . γ−1
(2-71)
Für das chemische Potenzial eines realen Fluids benutzt man in Analogie zu (2-24) den Ansatz μ(T, p) = μiG (T ) + Rm T ln( f /p0 ) = μiG (T ) + Rm T ln(p/p0) + Rm T ln ϕ
(2-72)
mit ϕ ≡ f /p und lim ϕ = 1 .
(2-74)
p→0
(2-73)
F31
F32
F Technische Thermodynamik
Die Größe μiG (T ) ist dabei das chemische Potenzial des hypothetischen idealen Gases beim Standarddruck p0 und der Temperatur T vgl. (2-25). Die durch (2-72) definierte Fugazität f des Fluids hat die Dimension eines Drucks und geht im Grenzfall p → 0 in den Druck über. Der Fugazitätskoeffizient ϕ kennzeichnet als Realteil die Abweichung des chemischen Potenzials des realen Fluids von dem des idealen Gases. Differenziert man (2-72) bei T = const unter Beachtung von (1-50) nach dem Druck und integriert das Ergebnis bei T = const über diese Variable, so folgt
f (v, T ) = f iG (v, T ) + f R (v, T )
[Vm (T, p)/(Rm T ) − 1/p] dp .
(2-75)
0
Der Fugazitätskoeffizient ist danach aus einer volumenexpliziten Zustandsgleichung zu berechnen. Eine Variablentransformation von p nach Vm [27] bringt (2-75) in die Form "Vm ln ϕ = − [p(T, Vm)/(Rm T ) − 1/Vm ]d Vm ∞
+ z − 1 − ln z ,
(2-76)
die sich mit einer druckexpliziten Zustandsgleichung und dem Realgasfaktor z auswerten lässt. 2.1.4 Fundamentalgleichungen
In Kap. 1.2 wurden Fundamentalgleichungen eingeführt, aus denen sich alle thermodynamischen Eigenschaften eines Fluides berechnen lassen und welche somit die Information der thermischen, kalorischen und entropischen Zustandsgleichung zusammenfassen. Diese Fundamentalgleichungen sind bei Reinstoffen in der ursprünglichen Formulierung eine Funktion der inneren Energie U = U(V, S ), vgl. (1-15). Diese lässt sich ohne Informationsverlust durch eine Legendre-Transformation z. B. in die freie Energie F = U − T S = F(T, V), auch Helmholtz-Energie genannt, überführen, vgl. 1.2.3. Eine solche Fundamentalgleichung in der Formulierung der freien Energie F ist durch die gut messbaren Variablen T und V besser zu handhaben als eine entsprechende Fundamentalgleichung U = U(V, S ). Für ca. 50 verschiedene Stoffe sind inzwischen
(2-77)
aus dem idealen Gasanteil f iG und dem Realanteil f R additiv zusammengesetzt. Aus (2-77) lassen sich alle weiteren thermodynamischen Zustandsgrößen wie z. B. der Druck p = − (∂ f /∂v)T = 2 (∂ f /∂ )T
"p ln ϕ =
Fundamentalgleichungen in der freien Energie bekannt [12, 14, 15, 61], deren 15 bis ca. 60 stoffspezifischen Parameter an umfangreiche Meßdaten des jeweiligen Stoffes angepasst wurden. Die spezifische Form dieser Gleichungen ist analog zu (2-52) grundsätzlich als Summe
(2-78)
berechnen. Die Gleichungen werden in der dimensionslosen Form f (v, T ) = ϕ (δ, τ) = ϕiG (δ, τ) + ϕR (δ, τ) (2-79) RT angegeben, wobei δ = vk /v und τ = T k /T die neuen dimensionslosen Variablen sind, welche sich aus dem spezifischen Volumen v und der Temperatur mit Hilfe der entsprechenden kritischen Größen ergeben. Die Berechnung weiterer thermodynamischer Zustandsgrößen aus der dimensionslosen freien Energie ist in Tabelle 2-4 zusammengefasst. Für ϕiG muss eine Funktion der spezifischen Wärmekapazität in Abhängigkeit der Temperatur ciG v (T ) bekannt sein, aus welcher sich durch Integration gemäß der Definition der freien Energie (1-42) "T iG iG iG f (T, v) = u0 − T s0 + ciG v (T )dT T0
"T −T T0
#v $ ciG 0 v (T ) dT + RT ln (2-80) T v
eine Funktion der Form ϕiG (τ, δ) = C0 + C1 ln τ +
Ci τti + ln δ
(2-81)
i
ergibt, wenn für die spezifische Wärmekapazität ein Polynom der Art (2-7) gewählt wird. Für den Realanteil der reduzierten freien Energie ϕR haben sich Ansätze der Form I IP p +Ie R ti di ϕ (τ, δ) = ni τ δ + ni τti δdi exp (−δ pi ) i
i=I p +1
(2-82)
2 Stoffmodelle
Tabelle 2-4. Aus der reduzierten freien Energie ϕ(δ, τ) abgeleitete Zustandsgrößen
Zustandsgrößen
=
Berechnungsvorschrift RT 6 7 1 + ϕ ϕrδ v r iG r τ ϕiG τ + ϕτ − ϕ − ϕ r τ ϕiG τ + ϕτ r −τ2 ϕiG ττ + ϕττ
=
r r 1 + τ ϕiG τ + ϕτ + δϕδ
cp R
=
−τ
ω2 RT
=
p(T, v)
=
−(∂ f /∂v)T
p
s(T, v)
=
−(∂ f /∂T )v
u(T, v)
=
f +Ts
cv (T, v)
=
(∂u/∂T )v
h(T, v)
=
u + pv
s R u RT cv R h RT
c p (T, v)
(∂h/∂T ) p
=
ω(T, v)
=
1 (∂p/∂v) s v2
Sättigungszustand:
T = T = Ts p(T s , v ) = p(T s , v ) = ps
ϕrττ =
= =
2
ϕiG ττ
+
ϕrττ
+
1 + δϕrδ − δτ ϕrδτ
2
1 + 2 δϕrδ + δ2 ϕrδδ 2 1 + δϕrδ − δτ ϕrδτ 1 + 2 δϕrδ + δ2 ϕrδδ − 6 7 r τ2 ϕiG ττ + ϕττ
gleichzeitiges Lösen von: v ps (v − v ) − ln = ϕr (τs , δ ) − ϕr (τs , δ ) R Ts v r δ 1 + δ ϕδ (τs , δ ) = δ 1 + δ ϕrδ (τs , δ )
δ(T s , v ) + ps v = δ(T s , v ) + ps v r ∂ϕ ϕrδ = ; ∂δ τ
=
ϕrτ =
∂2 ϕr ∂τ2
∂ϕr ∂τ
; δ
;
δ
ϕrδδ =
ϕrδτ =
∂2 ϕr ∂δ ∂τ
∂2 ϕr ∂δ2
; τ
δ : reduziertes spezifisches Volumen auf der Siedelinie δ : reduziertes spezifisches Volumen auf der Taulinie
bewährt. Dabei wird die geeignete, für den jeweiligs vorhandenen Satz an Meßdaten angepasste Kombination an Termen für (2-82) durch Strukturoptimierung und nichtlineare Parameteranpassung herausgearbeitet [15]. Ziel hierbei ist es, mit möglichst wenig Termen eine extrapolierbare Gleichung anzugeben, welche die Meßdaten im Rahmen der Meßgenauigkeit wiedergibt. Die bekannteste Gleichung dieser Art ist die Fundamentalgleichung für Wasser, welche in ihrer wissenschaftlichen Formulierung mit 56 Parametern den fluiden Zustandsbereich bis 1273 K und 1000 MPa darstellt [12]. Bei etwas reduzierten Ansprüchen an die Genauigkeit lassen sich mehrere
Substanzen durch eine einheitliche Gleichungsstruktur mit einem stoffspezifischen Parametersatz angeben [61].
2.2 Gemische Zur Beschreibung der Zustandsgrößen von Gemischen werden die Zustandsgleichungen der beteiligten reinen Komponenten durch Mischungsregeln verknüpft und durch Korrekturfunktionen ergänzt. Die Eigenschaften einer Komponente i im Gemisch, z. B. die partiellen molaren Größen, werden durch den Index i gekennzeichnet. Wird ausdrücklich
F33
F34
F Technische Thermodynamik
auf die reine Komponente i Bezug genommen, wird der Index 0i verwendet. 2.2.1 Ideale Gasgemische
Dieses Modell beschreibt das Verhalten von gasförmigen Gemischen im Grenzzustand verschwindender Dichte. Nach einem Theorem von Gibbs [28] sind die innere Energie und die Entropie eines idealen Gasgemisches die Summe der entsprechenden Größen der reinen idealen Gase, aus denen das System zusammengesetzt ist, bei der Temperatur und dem Volumen der Mischung U(T, V, mi ) =
k
U0i (T, V, mi ) =
k
i=1
mi uiG 0i (T )
,
i=1
in einem idealen Gasgemisch gleich dem Druck p0i = ni Rm T/V des reinen idealen Gases i bei der Temperatur T und dem Volumen V der Mischung. Die spezifische innere Energie und Enthalpie idealer Gasgemische sind nach (2-83), (1-41) und (2-85) reine Temperaturfunktionen uiGG =
K
ξ¯i uiG 0i (T ) ,
hiGG =
K
K (T ) + R T = ξ¯i uiG ξ¯i hiG i 0i 0i (T ) . (2-90)
i=1
i=1
Diese Eigenschaft geht beim Differenzieren nach der Temperatur, vgl. (1-20), (1-47) und (2-11), auf die spezifischen Wärmen über:
(2-83)
S (T, V, mi ) =
k
ciGG v (T ) = S 0i (T, V, mi )
=
ciGG p (T ) =
mi s0i (T, V/mi ) .
(2-84)
i=1
Mithilfe von p = T (∂S /∂V)U, mi nach (1-14) erhält man aus (2-83) und (2-84) für das Gemisch dieselbe thermische Zustandsgleichung wie für ein reines ideales Gas: pV = nRm T = mRT . Dabei sind R≡ ξ¯i Ri = Rm /M
(2-85)
M ≡ m/n =
mit ξ¯i = mi /m
(2-91)
K
iGG ξ¯i ciG p0i (T ) = cv (T ) + R ,
(2-92)
ξ¯i c¯iG p0i (t) .
(2-93)
i=1
c¯ iGG p (t) =
K i=1
Für die spezifische Entropie idealer Gasgemische folgt aus (2-84) und (2-85) siGG (T, p) =
K
ξ¯i s0i (T, pi ) =
xi Mi
mit
⎧ ⎪ m = mi ⎪ ⎪ ⎨ i ⎪ ⎪ ⎪ ⎩ n = ni
ξ¯i s0i (T, p) + ΔsM .
i=1
(2-94)
Danach setzt sich die Entropie aus den Beiträgen der reinen Komponenten bei Druck und Temperatur des Gemisches und der stets positiven Mischungsentropie
xi = ni /n ΔsM = −R
K
xi ln xi > 0
(2-95)
i=1
(2-87)
i
die spezielle Gaskonstante und die molare Masse des Gemisches. Aus (2-85) ergibt sich das Dalton’sche Gesetz. Danach ist der für beliebige Gemische definierte Partialdruck einer Komponente, p i ≡ xi p ,
K
(2-86)
i
und
ξ¯i ciG v0i (T ) ,
i=1
i
und
K i=1
i=1 k
(2-89)
i=1
(2-88)
zusammen, in der sich die Irreversibilität des isotherm-isobaren Mischens widerspiegelt. Da ΔsM nur von der Zusammensetzung abhängt, gelten für ideale Gasgemische konstanter Zusammensetzung (2-13) bis (2-16) für die Entropie und (2-22) für die isentrope Enthalpiedifferenz reiner idealer Gase iGG weiter, wenn die Gemischgrößen R, ciGG p , cv , und iGG γ = ciGG eingesetzt werden. p /cv
2 Stoffmodelle
Das chemische Potenzial einer Komponente i in einem idealen Gasgemisch ist nach (1-52) mit (2-90) und (2-94) μiGG (T, p, xi ) = μiG i 0i (T ) + Rm T ln(pi /p0 )
mit der molaren Masse MW = 18,0153 kg/kmol und dem Sättigungsdruck ps0 (T ) nach Tabelle 2-6 ist die Dampfkomponente der feuchten Luft. Der Wasseranteil ungesättigter feuchter Luft lässt sich durch die absolute Feuchte
= μiG 0i (T ) + Rm T ln(p/p0 ) + Rm T ln xi ,
W ≡ mW /V = pW /(RW T )
wobei μiG 0i (T ) das chemische Potenzial des reinen idealen Gases i bei der Temperatur T und dem Standarddruck p0 bedeutet, vgl. (2-25). Bemerneben T und p nur vom kenswert ist, dass μiGG i Stoffmengenanteil xi der Komponente i selbst abhängt.
mit mW als der Masse des Wassers beschreiben, das bei der Temperatur T im Gasvolumen V gelöst ist. Der Zusammenhang zwischen W und dem Partialdruck pW mit RW als der speziellen Gaskonstante des Wassers beruht auf dem Dalton’schen Gesetz. Für eine gegebene Temperatur hat W im Sättigungszustand den Maximalwert Ws = ps0 (T )/(RWT ). Der absoluten Feuchte zugeordnet ist die relative Feuchte
2.2.2 Gas-Dampf-Gemische. Feuchte Luft
ϕ ≡ W / Ws = pW /ps0 (T ) ,
Ideale Gasgemische können neben Bestandteilen, die im betrachteten Temperaturbereich nicht kondensieren, eine als Dampf bezeichnete Komponente enthalten, die als reine flüssige oder feste Phase ausfallen kann. Man spricht dann von Gas-Dampf-Gemischen. Der Sättigungspartialdruck ps des Dampfes D, d. h. seine Löslichkeit in der Gasphase, wird durch die Bedingungen des Phasengleichgewichts zwischen Gas und Kondensat bestimmt, vgl. 1.3.2. Wie die Rechnung zeigt [29], ist ps in guter Näherung gleich dem für jede Temperatur durch das MaxwellKriterium (1-72) festgelegten Sättigungsdruck ps0 (t) des reinen Stoffs D. Gas-Dampf-Gemische heißen ungesättigt, solange für den Partialdruck pD < ps0 gilt, und gesättigt für pD = ps0 ; im letzteren Fall können sie Kondensat mitführen. Unter der Taupunkttemperatur T T eines ungesättigten Gas-Dampf-Gemisches versteht man die Temperatur, auf die das Gemisch isobar abgekühlt werden kann, bis der erste Tautropfen ausfällt. Bei gegebenem Partialdruck pD des Dampfes ergibt sich die Taupunkttemperatur aus der Bedingung ps0 (T T ) = pD .
(2-98)
(2-96)
(2-97)
Das in den Anwendungen am häufigsten auftretende Gas-Dampf-Gemisch ist feuchte Luft. Ihre nicht kondensierenden Bestandteile werden als trockene Luft L zusammengefaßt, deren Zusammensetzung nach Tabelle 2-5 die molare Masse ML = 28,9647 kg/kmol ergibt. Der Wasserdampf W
(2-99)
die bei Sättigung den größten Wert ϕs = 1 annimmt. Ein Maß für den Wassergehalt, das sich auf ungesättigte und gesättigte feuchte Luft einschließlich des mitgeführten Kondensats anwenden lässt, ist die Wasserbeladung X ≡ mW /mL .
(2-100)
Die Masse mL der trockenen Luft ist dabei eine Bezugsgröße, die auch beim Austauen und Befeuchten konstant bleibt. Für ungesättigte feuchte Luft gilt nach dem Dalton’schen Gesetz X=
RL pW RW (p − pW )
mit
X Xs .
(2-101)
Dabei sind RW und RL die speziellen Gaskonstanten, pW und pL = p − pW die Partialdrücke der Komponenten und p der Gesamtdruck. Überschreitet X die Tabelle 2-5. Zusammensetzung trockener Luft in Stoffmengenanteilen xi und Massenanteilen ξ¯i [30]
Komponente i Stickstoff N2 Sauerstoff O2 Argon Ar Kohlendioxid CO2 Neon Ne
Stoffmengenanteil xi 0,78081 0,20947 0,00934 0,00036
Massenanteil ξi 0,75515 0,23141 0,01288 0,00055
0,00002
0,00001
F35
F36
F Technische Thermodynamik
Tabelle 2-6. Sättigungsdampfdruck ps0 von festem und flüssigem Wasser als Funktion der Celsiustemperatur t [62]
t in ◦ C −50 −40 −30 −20 −10 0,01 10 20 30 40 50 60 70 80 90 100
ps0 /hPa 0,0394 0,1284 0,3801 1,0326 2,5990 6,1166 12,282 23,393 42,470 73,849 123,52 199,46 312,01 474,14 701,82 1014,18
für
X < Xs
für
X Xs (2-104)
h0L = ciG p0L t = 1,0004 kJ/(kg K) · t
(2-105)
hg0W = r0 + ciG p0W t
v1+X ≡ V/mL = (1 + X)v = (RL + XRw )(T/p) X Xs .
(2-103)
Hierin ist h = H/(mL + mW ) die gewöhnliche spezifische Enthalpie des Gemisches, während g h0L , h0W und hk0W die spezifischen Enthalpien der trockenen Luft, des Wasserdampfes und des Kondensats bedeuten. Über die Enthalpiekonstanten wird so verfügt, dass die spezifischen Enthalpien von trockener Luft und flüssigem Wasser bei t = 0 ◦ C null sind. Setzt man konstante spezifische Wärmekapazitäten voraus und vernachlässigt die Druckabhängigkeit der Kondensatenthalpie, so folgt [32]
Beladung Xs der gesättigten Gasphase, siehe (2-101) mit pW = ps0 (T ), enthält die feuchte Luft die Kondensatmenge mL (X − Xs ) als Nebel oder Bodenkörper aus flüssigem Wasser oder Eis. Das spezifische Volumen ungesättigter feuchter Luft ergibt sich aus dem Ansatz p = pL + pW und den Partialdrücken pL und pW nach dem Dalton’schen Gesetz zu
mit
h1+X ≡ H/mL = (1 + X)h ⎧ g ⎪ ⎪ ⎨ h0L + Xh0W =⎪ ⎪ ⎩ h0L + Xs hg + (X − Xs )hk 0W 0W
(2-102)
Als Bezugsgröße wird dabei mL verwendet; v = V/(mL + mW ) ist das gewöhnliche spezifische Volumen. Näherungsweise kann (2-102) mit X = Xs auch für kondensathaltige feuchte Luft benutzt werden, wenn das Kondensatvolumen vernachlässigbar ist. Die Enthalpie kondensathaltiger feuchter Luft addiert sich aus den Beiträgen der Phasen, wobei die Enthalpie des Gases nach (2-90) die Summe der Enthalpien der trockenen Luft und des Wasserdampfes ist und als ideales Gasgemisch nicht vom Druck abhängt. Mit mL als Bezugsgröße erhält man für die spezifische Enthalpie des homogenen oder heterogenen Gemisches
hk0W
= 2500 kJ/kg + 1,86 kJ/(kg K) · t ⎧ ⎪ c0W t = 4,19 kJ/(kg K) · t ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ für flüssiges Wasser ⎪ ⎪ ⎪ ⎨ =⎪ −rE + c0E t = −333 kJ/kg ⎪ ⎪ ⎪ ⎪ ⎪ +2,05 kJ/(kg K) · t ⎪ ⎪ ⎪ ⎪ ⎩ für Eis .
(2-106)
(2-107)
(2-108)
Dabei sind r0 und rE die Verdampfungs- und Schmelzenthalpien des Wassers bei 0 ◦ C, vgl. 3.1; c p0L , c p0W , c0W und c0E sind die isobaren spezifischen Wärmekapazitäten der trockenen Luft, des Wasserdampfes, des flüssigen Wassers und des Eises. Die spezifische Enthalpie feuchter Luft kann auch aus Diagrammen [33] entnommen werden. 2.2.3 Reale Gemische
Das Zustandsverhalten realer fluider Gemische wird durch die intermolekularen Wechselwirkungen zwischen gleichartigen wie zusätzlich zwischen den unterschiedlichen Molekülen der beteiligten Komponenten geprägt. Hierbei kann zwischen Effekten aufgrund unterschiedlicher Molekülgrößen (entropische Effekte) und unterschiedlichen energetischen
2 Stoffmodelle
Wechselwirkungen unterschieden werden. Gemische, bei denen nur Wechselwirkungen zwischen gleichartigen Molekülen berücksichtigt werden, heißen ideale Lösungen. Um die Eigenschaften fluider Gemische im gesamten Dichtebereich wiederzugeben, benötigt man eine geeignete thermische Zustandsgleichung oder eine Fundamentalgleichung für das Gemisch. Dabei geht man von einem einheitlichen Ansatz für die Zustandsgleichung des Gemisches und seiner realen Komponenten aus, siehe 2.1.3 bzw. 2.1.4. Die Koeffizienten der Gemischzustandsgleichung werden mithilfe von Mischungsregeln aus den Koeffizienten der reinen Stoffe und einigen Zusatzinformationen bestimmt. Theoretisch begründet [34] sind die Mischungsregeln der Virialgleichung (2-32) B=
K K
xi x j B i j ,
a=
K K
C=
xi x j xk Ci jk ,
ai j = (ai j ai j )0,5 (1 − ki j ) für i ± j
(2-109)
i=1 j=1 k=1
mit B, C, . . . als den Virialkoeffizienten des Gemisches. Die Größen Bi j , Ci jk , . . ., die nur von der Temperatur abhängen, sind für i = j = k die Virialkoeffizienten der reinen Komponenten und andernfalls sog. Kreuzvirialkoeffizienten. Alle Indizes sind aufgrund der Symmetrie der molekularen Wechselwirkungen vertauschbar. Daten für den Kreuzvirialkoeffizienten Bi j = B ji vieler Gemische findet man in [10]. Eine Abschätzung erhält man aus (2-37) mit den Mischungsregeln [11] T kij = (T ki T k j )0,5 (1 − ki j ) , 1/3 3 1/3 Vmki j = Vmki + Vmk , j /2 ωi j = (ωi + ω j )/2 , (z0 )kij = 0,291 − 0,08ωi j , pki j = (z0 )ki j Rm T ki j /Vmki j .
(2-110) (2-111) (2-112) (2-113) (2-114)
Nur für chemisch ähnliche Moleküle vergleichbarer Größe darf der binäre Parameter ki j = 0 gesetzt werden. Die kubische thermische Zustandsgleichung nach Redlich-Kwong-Soave (2-43) benutzt empirische Mischungsregeln [16] für die Gemischkoeffizienten a und b. Danach ist für Gemische aus nicht polaren oder schwach polaren Stoffen
(2-116)
zu berechnen. Der binäre Wechselwirkungsparameter ki j = k ji wurde für viele Stoffpaare aus Phasengleichgewichtsmessungen bestimmt [36] und ist trotz kleiner Werte nicht zu vernachlässigen. Da es sich bei den Wechselwirkungsparametern jeweils um angepasste Werte handelt ist der Parameter in (2-116) für gleichartige Gemische nicht identisch mit dem Parameter in (2-110). Die Mischungsregel für den Koeffizienten b lautet unter denselben Voraussetzungen b=
usw.
(2-115)
mit aii als dem Koeffizienten a der reinen Komponente i nach (2-44). Der Kreuzkoeffizient ist nach der Vorschrift
i=1 j=1 K K K
xi x j a i j
i=1 j=1
K
xi b i ,
(2-117)
i=1
wobei der Koeffizient bi der reinen Komponente i durch (2-49) gegeben ist. Ein Mehrkomponentensystem wird damit durch Informationen über die binären Teilsysteme beschrieben. Die spezifische innere Energie, Enthalpie und Entropie realer Gemische sind mit denselben Ansätzen zu berechnen, die nach (2-52), (2-53) und (2-56) bis (2-59) für reine reale Fluide gelten. Für die Eigenschaften des idealen Gases sind dabei die Eigenschaften des Gemisches im idealen Gaszustand, siehe 2.2.1, einzusetzen, und zur Auswertung der Realanteile ist eine thermische Zustandsgleichung für das Gemisch heranzuziehen. Entsprechendes gilt für den Isentropenexponenten und die isentrope Enthalpiedifferenz nach (2-66) bis (2-71). In den Tabellen 2-7 und 2-8 sind die Realanteile der kalorischen Zustandsgrößen und der Isentropenexponent realer Gemische auf der Grundlage der Zustandsgleichungen (2-32) und (2-33) zusammengestellt. Die Ergebnisse enthalten als Sonderfall die Eigenschaften reiner Stoffe. Für einige technisch relevanten Gemische wurden speziell angepasste vielparametrige Fundamentalgleichungen entwickelt, so z. B. für Ammoniak-Wasser [63] und für Erdgas [64]. Für das chemische Potenzial einer Komponente i in einem realen Gemisch setzt man in Verallgemeinerung von (2-72)
F37
F38
F Technische Thermodynamik
μi = μiG 0i (T ) + Rm T ln( fi /p0 ) =
μiG 0i (T ) +
Rm T ln(pi /p0 ) + Rm T ln ϕi
mit ϕi ≡ fi /pi und lim ϕi = 1 . p→0
(2-118) (2-119)
Tabelle 2-7. Realanteile der kalorischen Zustandsgrößen,
Isentropenexponent und Fugazitätskoeffizient nach der Zustandsgleichung (2-32) für reale Gasgemische
(2-120)
MΔhRp (T, p) = p[B − T (dB/dT )] MΔsRp (T, p) = −p(dB/dT ) 1/γ(T, p) = −(p/Vm ){[T/(Mc p)](∂Vm /∂T )2p +(∂Vm /∂p)T }∗ mit Vm = Rm T/p + B Rp und c p = ciG p (T ) + ∂Δh (T, p)/∂T k ln ϕi (T, p) = 2 x j Bi j − B [p/(Rm T )]
(2-121)
μiG 0i
Dabei ist das chemische Potenzial des hypothetischen reinen idealen Gases i beim Standarddruck p0 und fi die Fugazität der Komponente i im Gemisch vgl. (2-72). Im Grenzzustand des idealen Gasgemisches geht fi in den Partialdruck pi über. Der Fugazitätskoeffizient ϕi kennzeichnet die Abweichung des chemischen Potenzials der Komponente i vom Wert dieser Größe in einem idealen Gasgemisch. Auf der Grundlage von (1-50) lässt sich analog zu (2-75) "p ln ϕi =
[Vi (T, p, x j )/(Rm T ) − 1/p]dp
(2-122)
j=1
∗
Dabei ist Vm = Mv mit M als der molaren Masse des Gemisches.
Tabelle 2-8. Realanteile der kalorischen Zustandsgrößen,
Isentropenexponent und Fugazitätskoeffizient nach der Zustandsgleichung (2-43) für Gemische MΔuRv (T, v) = −(1/b)[a − T (da/dT )] ln(1 + b/Vm )ab MΔsRv (T, v) = Rm ln(1 − b/Vm ) +(1 + b)(da/dT ) ln(1 + b/Vm )ab γ(T, v) = (Vm /p){[T/(Mcv)](∂p/∂T )2Vm −(∂p/∂Vm )T }a mit p = Rm T/(Vm − b) − a/[Vm (Vm + b)] Rv und cv (T, v) = ciG v (T ) + ∂u (T, v)/∂T ln ϕi (T, v) = (bi /b)(z − 1) − ln[z(1 − b/Vm )] k − 2 x j ai j /(Rm T b) ln(1 + b/Vm )
0
herleiten [38], wobei Vi das partielle molare Volumen der Komponente i nach (1-32) bedeutet. Diese Größe ist von den Stoffmengenanteilen x j aller Komponenten im Gemisch abhängig. Die Variablentransformation von p nach V ergibt [39] "V ln ϕi = −
[(∂p/∂ni)T, V, n j1 /(Rm T ) − 1/V]dV − ln z .
j=1
∞
(2-123)
Zur Auswertung von (2-122) bedarf es einer volumenexpliziten Zustandsgleichung, während (2-123) auf druckexplizite Zustandsgleichungen zugeschnitten ist. Die Tabellen 2-7 und 2-8 enthalten auch den Fugazitätskoeffizienten ϕi , berechnet aus den Gemischzustandsgleichungen (2-32) und (2-43) mit dem reinen Stoff i als Sonderfall. Zur Berechnung der Eigenschaften flüssiger Gemische mit stark polaren Komponenten sind keine genügend genauen thermischen Zustandsgleichungen verfügbar. Ausgangspunkt für die Beschreibung solcher Systeme sind zu (2-118) parallele Ansätze für die chemischen Potenziale im Gemisch. Existiert die reine Komponente i bei Druck und Temperatur der Mischung als Flüssigkeit, wird μi = μ0i (T, p) + Rm T ln(xi γi ) mit
lim γi (T, p, x j) = 1
xi →1
(2-124) (2-125)
a
Dabei ist Vm Gemisches.
b
+[abi /(R M T b2 )] ln(1 + b/Vm )a = Mv mit M als der molaren Masse des
da/dT = −(1/T 0,5 )
k K i=1 j=1
xi x j ai j m j /(T k j α j )0,5
mit α j und m j nach (2-45) und (2-46). T k j ist die kritische Temperatur der Komponente j, z der Realgasfaktor.
gesetzt. Dabei ist μ0i (T, p) das chemische Potenzial der reinen Flüssigkeit i und γi der Aktivitätskoeffizient von i im Gemisch. Er ist dimensionslos, hängt von den Stoffmengenanteilen x j aller Komponenten ab und wird für den reinen Stoff eins. Gilt für alle Komponenten über den gesamten Konzentrationsbereich γi = 1, spricht man von einer idealen Lösung μiL i = μ0i (T, p) + Rm T ln xi .
(2-126)
Dieses Lösungsmodell erfüllt die Gibbs-Duhem Gleichung (1-25) xi dμi = 0 bei T, p = const und ist damit thermodynamisch konsistent. Physikalisch
2 Stoffmodelle
wird es nur von sehr ähnlichen Komponenten wie Strukturisomeren realisiert. Die Abweichungen eines Gemisches vom Modell der idealen Lösung werden durch die Aktivitätskoeffizienten gekennzeichnet. Die Gibbs-Duhem-Gleichung verlangt hier xi d ln γi = 0 für T, p = const, was für ein i
binäres Gemisch zur Folge hat, dass die TaylorEntwicklungen von ln γi um die Stelle xi = 1 nach 1 − xi mit dem quadratischen Glied beginnen. Der Vergleich von (2-118) und (2-124) ergibt fi = xi γi f0i (T, p)
(2-127)
mit f0i als der Fugazität der reinen Flüssigkeit i nach 2.1.3. Sind die reinen Komponenten i, die in einem Lösungsmittel j gelöst sind, bei Druck und Temperatur der Mischung nicht flüssig, schreibt man in Abwandlung von (2-124) für das chemische Potenzial der gelösten Stoffe μi = μ∗i + Rm T ln(xi γi∗ ) μ∗i
mit
≡ lim (μi − Rm T ln xi ) , xi →0
(2-128) (2-129)
γi∗ ≡ γi γi∞ ,
(2-130)
γi∞
(2-131)
≡ lim γi
und
xi →0
lim γi∗ = 1 .
xi →0
(2-132)
Praktisch kann dieser Ansatz mit γi∗ als dem rationellen Aktivitätskoeffizienten nur für Zweikomponentensysteme angewendet werden, da die Grenzwerte xi → 0 nur für diesen Fall eindeutig sind. Vergleicht man (2-118) mit (2-127) bis (2-130), folgt xi γi∗ Hi, j
fi = mit Hi, j ≡ lim ( fi /xi ) = γi∗ f0i . xi →0
(2-133) (2-134)
Der Henry’sche Koeffizient Hi, j mit der Dimension eines Drucks ist eine Eigenschaft des gelösten Stoffes i und des Lösungsmittels j und kann aus Phasengleichgewichtmessungen, vgl. 3.2, bestimmt werden. Für einfache Gase (i = 2) und Wasser ( j = 1) gilt im Temperaturbereich 0 t 50 ◦ C [40] ln{H2,1 [T ps01 (T )]/1013,25 hPa} = α2 (1 − T 2 /T ) − 36,855(1 − T 2 /T )2
(2-135)
mit ps01 (T ) als dem Sättigungsdruck des Wassers. Tabelle 2-9 gibt die Koeffizienten α2 und T 2 für Helium, Stickstoff, Sauerstoff und Argon an. Dem Ansatz (2-124) für die chemischen Potenziale entspricht eine Fundamentalgleichung für die molare freie Enthalpie eines flüssigen Gemisches, siehe (1-43), E Gm (T, p, xi ) = GiL m (T, p, xi ) + G m (T, p, xi )
(2-136)
mit GiL m =
K
xi [μ0i (T, p) + Rm T ln xi ]
(2-137)
i=1
und GEm = Rm T
k
xi ln γi ,
(2-138)
i=1
die sich aus einem Beitrag GiL m der idealen Lösung und einem Zusatz- oder Exzessanteil GEm zusammensetzt. Daraus folgen mit den Definitionen (1-41) bis (1-43) und den Ableitungen (∂GEm /∂p)T, xi = VmE E und (∂GEm /∂T ) p, xi = −S m nach (1-46) alle weiteren molaren Größen des Gemisches in der Form Zm (T, p, xi ) = ZmiL (T, p, xi ) + ZmE (T, p, xi ) , (2-139) wobei ZmiL den Beitrag der idealen Lösung und ZmE die molare Zusatzgröße bedeuten. Bei reinen Stoffen ist ZmE = 0. Insbesondere gilt für das molare Volumen, die molare Enthalpie und Entropie K xi V0i + ∂GEm /∂p , Vm = VmiL + VmE = T, xi
i=1
(2-140)
Hm = =
HmiL
+
K
xi H0i − T 2 ∂ GEm /T ∂T
i=1
HmE p, xi
,
(2-141)
Tabelle 2-9. Parameter T 2 und α2 des Henry’schen Koeffizienten H1,2 nach (2-135) für einige in Wasser gelöste
Gase [40] Gelöstes Gas Helium He Stickstoff N2 Sauerstoff O2 Argon Ar
T 2 /K 131,42 162,02 168,85 168,27
α2 41,824 41,712 40,622 40,404
F39
F40
F Technische Thermodynamik
iL E Sm = Sm + Sm
=
K
xi (S 0i − Rm ln xi ) − ∂GEm /∂T
i=1
p, xi
.
(2-142)
Die Änderungen der molaren Zustandsgrößen beim isotherm-isobaren Mischen der reinen Komponenten ΔZmM ≡
K
che Größe und Gestalt der Moleküle und ihre energetischer Wechselwirkungen in einem kombinatori R C schen und einem Restanteil GEm und GEm der molaren freien Zusatzenthalpie. Der Ansatz hat daher die Form C R GEm = GEm + GEm (2-147) mit
xi [Zi (T, p, x j ) − Z0i (T, p)]
(2-143)
i=1
heißen molare Mischungsgrößen, wobei nach (1-33) Zm = xi Zi mit Zi als der zugehörigen partiellen molaren Zustandsgröße der Komponente i im Gemisch gesetzt ist. Nach (2-139) und (2-140) und dieser Definition sind VmE und HmE als molares Mischungsvolumen ΔVmM und molare Mischungsenthalpie ΔHmM messbar. Gemische mit ΔHmM > 0 werden als endotherm, solche mit ΔHmM < 0 als exotherm bezeichnet. Bei idealen Lösungen ist ΔVmM = 0, ΔHmM = 0 und ΔUmM = 0. Für die Aktivitätskoeffizienten findet man nach (1-35), (1-46), (1-50) und (1-53) die in Bezug auf die Gibbs-Duhem-Gleichung konsistente Darstellung
(GEm )C /(Rm T ) =
K
x j ln(Φ j /x j )
j=1
+5
K
x j a j ln(Θ J /Φ j )
und (GEm )R /(Rm T )
=−
K
⎤ ⎡ K ⎥⎥ ⎢⎢⎢ a j x j ln ⎢⎢⎣ Θk τk j ⎥⎥⎥⎦ . (2-149)
j=1
Summiert ten des ten
= GEm −
x j ∂GEm (T, p, x1 , . . . , xi−1 ,
Θ j ≡ x j q j/
j=1
xi+1 . . . , xK )/∂x j
(2-144)
k=1
wird über alle K KomponenGemisches. Im Einzelnen bedeu-
Rm T ln γi = (∂GE /∂ni )T,p,n ji K−1
(2-148)
j=1
und Φ j ≡ x j r j /
K k=1 K
xk q k xk rk
(2-150)
k=1
mit (∂ ln γi /∂p)T, x j = ViE /(Rm T )
(2-145)
und (∂ ln γi /∂T ) p, x j = −HiE /(Rm T 2 ) .
(2-146)
Die partiellen molaren Exzessvolumina ViE und partiellen molaren Exzessenthalpien HiE folgen dabei mit (1-35) aus den entsprechenden molaren Zusatzgrößen. Die in der Fundamentalgleichung (2-136) benötigten Reinstoffeigenschaften sind nach 2.1.3 zu berechnen; die molare freie Exzessenthalpie GEm erhält man aus empirischen oder halbtheoretischen Ansätzen [41], deren Konstanten aus Phasengleichgewichtsmessungen, siehe 3.2, bestimmt werden müssen. Ein verbreiteter Ansatz hierfür ist der UNIQUACAnsatz von Abrams und Prausnitz [42], der auf molekularen Vorstellungen aufgebaut und für Mehrstoffsysteme anwendbar ist. Er erfasst die unterschiedli-
den molaren Oberflächen- bzw. Volumenanteil und x j den Stoffmengenanteil der Komponente j. Die Größen q j und r j sind die relative van-der-Waals’sche Oberfläche bzw. das relative van-der-Waals’sche Volumen eines Moleküls j in Bezug auf die CH2 -Gruppe eines unendlich langen Polyethylens. Diese Reinstoffeigenschaften sind für viele Substanzen berechnet und in [43] vertafelt. Der Faktor τk j ≡ exp[−Δuk j /(Rm T )] mit Δuk j Δu jk und Δu j j = 0
(2-151) (2-152)
ist Ausdruck der molekularen Paarwechselwirkungen, die im UNIQUAC-Ansatz allein berücksichtigt werden. Deshalb benötigt der Ansatz zur Beschreibung eines Vielstoffsystems mit den binären
2 Stoffmodelle
Wechselwirkungsparametern Δuk j und Δu jk nur Gemischinformationen bezüglich der binären Randsysteme. Die als konstant vorausgesetzten Wechselwirkungsparameter wurden für viele Zweistoffsysteme aus Phasengleichgewichten, siehe 3.2, ermittelt und sind in [43] ebenfalls tabelliert. Wegen der Bedingung Δuk j = const ist die Temperaturabhängigkeit von GEm durch den UNIQUACAnsatz (2-147) nur grob erfasst und die Genauigkeit der molaren Zusatzenthalpie HmE nach (2-141) unbefriedigend. Das molare Zusatzvolumen VmE nach (2-140) ist wegen der fehlenden Druckabhängigkeit der Parameter gar nicht zu bestimmen. Die Aktivitätskoeffizienten der Komponenten, vgl. (2-144), werden durch den Ansatz aber sehr gut wiedergegeben: ln γi = ln γiC + ln γiR mit
und
ln γiC
(2-153)
= 1 − Φi /xi + ln(Φi /xi )
− 5qi [1 − Φi /Θi + ln(Φi /Θi )] (2-154) ⎧ ⎤ ⎡ K ⎪ ⎪ ⎥⎥⎥ ⎢⎢⎢ ⎪ ⎨ R ⎥⎥⎥ ⎢ ⎢ ln γi = qi ⎪ Θ τ 1 − ln j ji ⎢ ⎪ ⎦ ⎣ ⎪ ⎩ j=1 ⎡ ⎤⎫ K ⎢ K ⎪ ⎥⎥⎪ ⎪ ⎢⎢⎢ ⎬ Θk τk j ⎥⎥⎥⎦⎪ − . (2-155) ⎢⎣Θ j τi j / ⎪ ⎪ ⎭ j=1 k=1
Somit eignet sich dieser Ansatz insbesondere zur Berechnung von Phasengleichgewichten von fluiden Gemischen im Bereich des Umgebungsdruckes. Die Aktivitätskoeffizienten organischer Substanzen können nach der UNIFAC-Methode von Fredenslund, Jones und Prausnitz [44] abgeschätzt werden. Die Methode verbindet den UNIQUAC-Ansatz mit dem Konzept einer aus Strukturgruppen statt aus Molekülen zusammengesetzten Lösung. Dadurch wird die große Zahl organischer Substanzen auf eine überschaubare Zahl von Strukturgruppen zurückgeführt. Die Aktivitätskoeffizienten nach der UNIFACMethode ergeben sich wieder aus ln γi =
ln γiC
+
ln γiR
.
Danach ist qi =
N
Vki qG k
und ri =
Vki rkG
(2-157)
i=1
k=1
mit Vki als der Anzahl der Strukturgruppen k im Molekül i zu setzen; N ist die Anzahl der Strukturgruppen G in der Lösung. In Tabelle 2-10 sind qG k und rk für ausgewählte Strukturgruppen, die als Untergruppen bezeichnet werden, zahlenmäßig angegeben. Die Untergruppen zwischen den horizontalen Linien werden zu Hauptgruppen zusammengefaßt, die ebenso wie die Untergruppen nummeriert sind. Die letzte Spalte gibt Beispiele für die Zerlegung von Molekülen in Untergruppen; sind mehrere Zerlegungen möglich, ist die mit der kleinsten Zahl verschiedener Untergruppen korrekt. Ausführlichere Daten sind in [46] und [47] aufgeführt. Der Restanteil der Aktivitätskoeffizienten wird nach der Vorschrift ln γiR =
N
νki ln γkRG − γkRG(i)
(2-158)
k=1
aus den Beiträgen der N Strukturgruppen berechnet. Dabei ist γRG der Restaktivitätskoeffizient der Gruppe k im Gemisch und γkRG(i) der Restaktivitätskoeffizient der Gruppe k in der reinen Flüssigkeit i. Durch die Differenzbildung wird die Bedingung γiR = 1 für xi = 1 gewährleistet. Die Gruppenrestaktivitätskoeffizienten γkRG und γkRG(i) ergeben sich auf der Grundlage des UNIQUAC-Ansatzes zu ⎧ ⎤ ⎡ N ⎪ ⎥⎥ ⎢⎢⎢ ⎪ RG G⎨ ln γk = qk ⎪ 1 − ln ⎢⎢⎣ Θm Ψmk ⎥⎥⎥⎦ ⎪ ⎩ m=1 ⎡ ⎤⎫ N ⎢ N ⎥⎥⎪ ⎪ ⎢⎢⎢ ⎬ Θn Ψnm ⎥⎥⎥⎦⎪ − . (2-159) ⎢⎣Θm Ψkm / ⎪ ⎭ m=1
n=1
Zu summieren ist jeweils über die N Strukturgruppen in der Lösung. Dabei ist Θm =
G xG m qm /
N
G xG n qn
(2-160)
n=1
(2-156)
Der kombinatorische Anteil ln γiC ist nach (2-154) zu berechnen, wobei die relativen molekularen Oberflächen und Volumina der Komponenten i aus den WerG ten qG k und rk der Strukturgruppen k addiert werden.
N
der Oberflächenanteil der Gruppe m, wobei xG m =
K j=1
νm j x j /
N N j=1 n=1
νn j x j
(2-161)
F41
F42
F Technische Thermodynamik
Tabelle 2-10. Relative van-der-Waalssche Größen und Beispiele der Strukturgruppenunterteilung für einige ausgewählte Strukturgruppen [45]
rkG 0,9011 0,6744 0,4469 0,2195 1,3454 1,1167 1,1173 0,8886 0,6605 0,5313 0,3652 1,2663 1,0396 0,8121
qGk 0,848 0,540 0,228 0,000 1,176 0,867 0,988 0,676 0,485 0,400 0,120 0,968 0,660 0,348
5 OH
1,0000
1,200
CH3 OH
6 CH3 OH
1,4311
1,432
17
H2 O
7 H2 O
0,9200
1,400
18
ACOH
8 ACOH
0,8952
0,680
19 20 21
CH3 CO CH2 CO CHO
9 CH2 CO
1,6724 1,4457 0,9980
1,488 1,180 0,948
22 23 24 25 26 27 28 29 30
CH3 COO CH2 COO CH3 O CH2 O CHO CH3 NH2 CH2 NH2 CHNH2 ACNH2
11 CCOO
1,9031 1,6764 1,1450 0,9183 0,6908 1,5959 1,3692 1,1417 1,0600
1,728 1,420 1,088 0,780 0,468 1,544 1,236 0,924 0,816
31 32 33 34 35 36 37
CH3 CN CH2 CN COOH HCOOH CH2 Cl CHCl CCl
15 CCN
1,8701 1,6434 1,3013 1,5280 1,4654 1,2380 1,0106
1,724 1,416 1,224 1,532 1,264 0,952 0,724
Untergruppe k 1 CH3 2 CH2 3 CH 4 C 5 CH2 =CH 6 CH=CH 7 CH2 =C 8 CH=C 9 C=C 10 ACH 11 AC 12 ACCH3 13 ACCH2 14 ACCH
Hauptgruppe 1 CH2
15
OH
16
2 C=C
3 ACH 4ACCH2
10 CHO
12 CH2 O
13 CNH2
14 ACNH2
16 COOH 17 CCl
Zuordnung Hexan 2 CH3 , 4 CH2 Neopentan 4 CH3 , 1C Hexen-1 1 CH3 , 3 CH2 , 1 CH2 =CH Hexen-2 2 CH3 , 2 CH2 , 1 CH=CH Naphthalin 8 ACH, 2 AC Toluol 5 ACH, 1 ACCH3 Cumol 2 CH3 , 5 ACH, 1 ACCH Propanol-2 2 CH3 , 1 CH, 1 OH Methanol 1 CH3 OH Wasser 1 H2 O Phenol 5 ACH, 1 ACOH Pentanon-3 2 CH3 , 1 CH2 , 1 CH2 CO Propionaldehyd 1 CH3 , 1 CH2 , 1 CHO Methylpropionat 2 CH3 , 1 CH2 COO Diethylether 2 CH3 , 1 CH2 , 1 CH2 O Ethylamin 1 CH3 , 1 CH2 NH2 Anilin 5 ACH, 1 ACNH2 Propionnitril 1 CH3 , 1 CH2 CN Essigsäure 1 CH3 , 1 COOH 1-Chlorbutan 1 CH3 , 2 CH2 , 1 CH2 Cl
2 Stoffmodelle
Tabelle 2-10. Fortsetzung
20 CCl4
rkG 2,2564 2,0606 1,8016 2,8700 2,6401 3,3900
qGk 1,998 1,684 1,448 2,410 2,184 2,910
21 ACCl
1,1562
0,844
Untergruppe k 38 CH2 Cl2 39 CHCl2 40 CCl2 41 CHCl3 42 CCl3 43 CCl4
Hauptgruppe 18 CCl2
44
ACC1
19CCl3
Zuordnung 1,1-Dichlorethan 1 CH3 , 1 CHCl2 1,1, 1-Trichlorethan 1 CH3 , 1 CCl3 Tetrachlorkohlenstoff 1 CCl4 Chlorbenzol 5 ACH, 1 ACCl
Tabelle 2-11. UNIFAC-Wechselwirkungsparameter anm einiger ausgewählter Strukturgruppen in K [48]
Hauptgruppe 1 CH2 2 C=C 3 ACH 4 ACCH2 5 OH 6 CH3 OH 7 H2 O 8 ACOH 9 CH2 CO 10 CHO 11 CCOO 12 CH2 O 13 CNH2 14 ACNH2 15 CCN 16 COOH 17 CCl 18 CCl2 19 CCl3 20 CCl4 21 ACCl
1 0 −35,36 −11,12 −69,7 156,4 16,51 300,0 275,8 26,76 505,7 114,8 83,36 −30,48 1139,0 24,82 315,3 91,46 34,01 36,7 −78,45 −141,26
2 86,02 0 3,446 −113,6 457,0 −12,52 496,1 217,5 42,92 56,3 132,1 26,51 1,163 2000,0 −40,62 1264,0 97,51 18,25 51,06 160,9 −158,8
3 61,13 38,81 0 −146,8 89,6 −50,0 362,3 25,34 140,1 23,39 85,84 52,13 −44,85 247,5 −22,97 62,32 4,68 121,3 288,5 −4,7 −237,68
den Molanteil der Gruppe m mit x j als dem Molanteil der Komponente j und K als der Zahl der Komponenten in der Lösung bedeutet. Der Faktor Ψnm = exp[−anm /T ] mit anm amn und amm = 0
(2-162) (2-163)
berücksichtigt die energetischen Wechselwirkungen zwischen zwei Gruppen. Alle Untergruppen derselben Hauptgruppe gelten in Bezug auf diese Wechselwirkungen als identisch. Die als konstant
4 76,5 74,15 167,0 0 25,82 −44,5 377,6 244,2 365,8 106,0 −170,0 65,69 − 762,8 −138,4 268,2 122,91 140,78 33,61 134,7 375,5
5 986,5 524,1 636,1 803,2 0 249,1 −229,1 −451,6 164,5 −404,8 245,4 237,7 −164,0 −17,4 185,4 −151,0 562,2 747,7 742,1 856,3 246,9
6 697,2 787,6 637,35 603,25 −137,1 0 289,6 −265,2 108,65 −340,18 249,63 238,4 −481,65 −118,1 157,8 1020,0 529,0 669,9 649,1 860,1 661,6
7 1318,0 270,6 903,8 5695,0 353,5 −180,95 0 −601,8 472,5 232,7 200,8 −314,7 −330,4 −367,8 242,8 −66,17 698,24 708,7 826,76 1201,0 920,4
vorausgesetzten Wechselwirkungsparameter anm und amn der Hauptgruppen wurden durch Auswertung von Phasengleichgewichten, vgl. 3.2, bestimmt. In Tabelle 2-11 sind diese Parameter für die Hauptgruppen aus Tabelle 2-10 zusammengestellt. Eine umfangreichere Matrix ist in [49–51] zu finden. Die angegebenen Daten gelten für Dampf-FlüssigkeitsGleichgewichte kondensierbarer Komponenten bei mäßigen Drücken in größerem Abstand von kritischen Zuständen und Temperaturen zwischen 30 und 125 ◦ C. Einen Parametersatz für Flüssig-flüssig-
F43
F44
F Technische Thermodynamik
Tabelle 2-11. Fortsetzung
Hauptgruppe 1 CH2 2 C=C 3 ACH 4 ACCH2 5 OH 6 CH3 OH 7 H2 O 8 ACOH 9 CH2 CO 10 CHO 11 CCOO 12 CH2 O 13 CNH2 14 ACNH2 15 CCN 16 COOH 17 CCl 18 CCl2 19 CCl3 20 CCl4 21 ACCl
8 1333,0 526,1 1329,0 884,9 −259,7 −101,7 324,5 0 −133,1 − −36,72 − − −253,1 − − − − − 10 000,0 −
9 476,4 182,6 25,77 −52,1 84,0 23,39 −195,4 −356,1 0 128,0 372,2 191,1 − −450,3 −287,5 −297,8 286,28 423,2 552,1 372,0 128,1
10 677,0 448,75 347,3 586,8 441,8 306,42 −257,3 − −37,36 0 185,1 −7,838 − − − − −47,51 − 242,8 − −
11 232,1 37,85 5,994 5688,0 101,1 −10,72 72,87 −449,4 −213,7 −110,3 0 461,3 − −294,8 −266,6 −256,3 35,38 −132,95 176,45 129,49 −246,3
12 251,5 214,5 32,14 213,1 28,06 −128,6 540,5 − −103,6 304,1 −235,7 0 − − 38,81 −338,5 225,39 −197,71 −20,93 113,9 95,5
13 391,5 240,9 161,7 − 83,02 359,3 48,89 − − − − − 0 −15,07 − − − − − 261,1 203,5
14 920,7 749,3 648,2 664,2 −52,39 489,7 −52,29 119,9 6201,0 − 475,5 − −200,7 0 777,4 − 429,7 140,8 − 898,2 530,5
17 35,93 204,6 −18,81 −114,14 75,62 −38,32 325,44 − −191,69 751,9 −34,74 301,14 − 287,0 88,75 44,42 0 −84,53 −157,1 11,8 −314,9
18 53,76 5,892 −144,4 −111,0 −112,1 −102,54 370,4 − −284,0 − 108,85 137,77 − −111,0 −152,7 120,2 108,31 0 0 17,97 −
19 24,9 −13,99 −231,9 −12,14 −98,12 −139,35 353,68 − −354,55 −483,7 −209,66 −154,3 − − −15,62 76,75 249,15 0 0 51,9 −
20 104,3 −109,7 3,0 −141,3 143,1 −67,8 497,54 1827,0 −39,2 − 54,57 47,67 −99,81 882,0 −54,86 212,7 62,42 56,33 −30,1 0 −255,43
21 321,5 393,1 538,23 −126,9 287,8 17,12 678,2 − 174,5 − 629,0 66,15 68,81 287,9 52,31 − 464,4 − − 475,83 0
Tabelle 2-11. Fortsetzung
Hauptgruppe 1 CH2 2 C=C 3 ACH 4 ACCH2 5 OH 6 CH3 OH 7 H2 O 8 ACOH 9 CH2 CO 10 CHO 11 CCOO 12 CH2 O 13 CNH2 14 ACNH2 15 CCN 16 COOH 17 CCl 18 CCl2 19 CCl3 20 CCl4 21 ACCl
15 597,0 336,9 212,5 6096,0 6,712 36,23 112,6 − 481,7 − 494,6 −18,51 − −281,6 0 − −62,41 258,6 74,04 491,95 356,9
16 663,5 318,9 537,4 603,8 199,0 −289,5 −14,09 − 669,4 − 660,2 664,6 − − − 0 326,4 339,6 1346,0 689,0 −
3 Phasen- und Reaktionsgleichgewichte
Gleichgewichte enthält [52]. Eine modifizierte UNIFAC-Methode [53, 54] benutzt zur Verbesserung der Genauigkeit auch der Mischungsenthalpien temperaturabhängige Wechselwirkungsparameter. Aus GEm -Werten nach UNIFAC wird für den Redlich-Kwong-Soave-Parameter a in (2-44) eine Mischungsregel für polare Komponenten abgeleitet. Die resultierende PSRK-Gleichung eignet sich auch zur Vorausberechnung von Phasengleichgewichten für gelöste Gase [55, 56].
3 Phasenund Reaktionsgleichgewichte Mit den Stabilitätsbedingungen aus Kap. 1, ergänzt durch Stoffdatenmodelle aus Kap. 2, können Phasengleichgewichte und Reaktionsgleichgewichte berechnet werden. Die unterschiedliche Zusammensetzung der Phasen im Gleichgewicht ist die Basis der thermischen Verfahrenstechnik, ebenso wie die Gleichgewichtszusammensetzung in chemisch reagierenden Gemischen für die chemische Verfahrenstechnik grundlegend ist. Die intensiven Zustandsgrößen einer fluiden Phase mit C Komponenten sind durch Druck, Temperatur und C − 1 Stoffmengenanteile der Komponenten festgelegt. Für ein System aus P Phasen im thermodynamischen Gleichgewicht sind diese Variablen der Phasen nicht unabhängig voneinander. Aufgrund der Bedingungen (1-60) und (1-61) für das thermische, mechanische und stoffliche Gleichgewicht bestehen zwischen ihnen (P − 1)(C + 2) Verknüpfungen, sodass das Gesamtsystem nur f =C−P+2
(3-1)
unabhängige intensive Variable oder Freiheitsgrade hat. Dieses Ergebnis wird als Gibbs’sche Phasenregel bezeichnet [1]. Für chemisch inerte Systeme stimmt die Zahl C der Komponenten mit der Zahl K der Teilchenarten überein. Sind die Teilchenarten im chemischen Gleichgewicht, wird die Zahl der Komponenten durch jede unabhängige Reaktion um eins vermindert und ist gleich dem Rang R der sogenannten Formelmatrix (ai j ) oder der Zahl der Basiskomponenten, vgl. 1.3.2. Stöchiometrische Bedingungen zwischen den Komponenten setzen die Zahl der Freiheitsgrade weiter herab. In gleichem Maß sinkt gegenüber C
die Zahl der unabhängigen Bestandteile, aus denen sich das System herstellen lässt. Ein Beispiel ist die Elektroneutralitätsbedingung in Elektrolytlösungen.
3.1 Phasengleichgewichte reiner Stoffe Die Aussagen der Phasenregel lassen sich in Zustandsdiagrammen veranschaulichen. 3.1.1 p, v, T -Fläche
In dem in Bild 2-1 gezeigten dreidimensionalen Zustandsraum, der von den thermischen Zustandsgrößen p, v und T eines reinen Fluids aufgespannt wird, schneidet die Maxwell-Bedingung (1-72) zwischen den Zustandsbereichen des Festkörpers, der Flüssigkeit und des Gases bzw. überhitzten Dampfes die Teile der Fläche heraus, in denen der Stoff nicht einphasig vorliegt, sondern in zwei Phasen zerfällt. Die Zustandspunkte der koexistierenden Phasen liegen bei denselben Werten von Druck und Temperatur auf den Schnitträndern der Fläche, vgl. 1.3.3. Die Verbindungsgeraden dieser Zustandspunkte erzeugen zur p, T -Ebene senkrechte Flächen, deren Punkte ein heterogenes Gemisch koexistierender Phasen darstellen. Ihr spezifisches Volumen v = (V α + V β )/m ist dabei ein Rechenwert aus den Volumina V α und V β der beiden Phasen und der Masse m des heterogenen Gemisches. Im Einklang mit der Phasenregel, die für C = 1 und P = 2 den Freiheitsgrad f = 1 ergibt, können in den Zweiphasengebieten Druck und Temperatur nicht unabhängig voneinander vorgegeben werden. Während eines Phasenwechsels bei konstantem Druck bewegt sich der Zustandspunkt eines Systems auf der Verbindungsgeraden zwischen den Punkten der koexistierenden Phasen. Dabei bleibt die Temperatur notwendigerweise konstant. Insgesamt enthält die thermische Zustandsfläche drei Zweiphasengebiete, das Schmelzgebiet, das Nassdampfgebiet und das Sublimationsgebiet, in denen Festkörper und Schmelze, siedende Flüssigkeit und gesättigter Dampf bzw. Festkörper und gesättigter Dampf nebeneinander im Gleichgewicht bestehen, vgl. Bild 2-1. Die Zweiphasengebiete sind durch die Schmelz- und die Erstarrungslinie, die Siedeund die Taulinie bzw. die Sublimations- und die Desublimationslinie begrenzt. Das Durchqueren dieser Gebiete entspricht dem Schmelzen und dem
F45
F46
F Technische Thermodynamik
Bild 3-1. Zustandsgebiete eines reinen Stoffes im
p, u-Diagramm mit logarithmischer Auftragung des spezifischen Volumens [3]
Erstarren, dem Verdampfen und dem Kondensieren sowie dem Sublimieren und dem Desublimieren. Siede- und Taulinie treffen sich mit einer gemeinsamen Tangente im kritischen Punkt K, dem Scheitel des Nassdampfgebietes, vgl. 1.3.3. Das Flüssigkeitsund Gasgebiet hängen bei überkritischen Drücken und Temperaturen miteinander zusammen. Der kritische Druck pk ist der höchste Druck, bei dem eine Flüssigkeit durch isobare Wärmezufuhr unter Blasenbildung verdampfen kann. Umgekehrt lässt sich ein Gas durch isotherme Kompression nur bei Temperaturen unterhalb der kritischen Temperatur T k mit sichtbaren Tropfen verflüssigen. Ein kritischer Zustand für das Schmelzgebiet ist nicht bekannt. Die Flächen der Zweiphasengebiete schneiden sich auf der Tripellinie, einer Geraden senkrecht zur p, T Ebene. Hier finden sich die Zustände, in denen Feststoff, Schmelze und Dampf miteinander im Gleichgewicht sind. Die Phasenregel liefert für solche Systeme mit C = 1 und P = 3 den Freiheitsgrad f = 0, d. h., nur bei den ausgezeichneten Werten ptr und T tr von Druck und Temperatur auf der Tripellinie ist dieses Gleichgewicht möglich. Entsprechend realisiert das Dreiphasengleichgewicht eines reinen Stoffes eine wohldefinierte Temperatur, die als Fixpunkt einer Temperaturskala dienen kann, siehe 1.4. Ebene Darstellungen der thermischen Zustandsgleichung erhält man durch Projektion von Bild 2-1
in die Koordinatenebenen. Ein Beispiel ist das p,v-Diagramm mit Isothermen T = const, die in den Zweiphasengebieten mit den Isobaren p = const zusammenfallen, siehe Bild 3-1. In den Grenzzuständen des idealen Gases am rechten Bildrand haben die Isothermen Hyperbelform. 3.1.2 Koexistenzkurven
Bild 3-2 zeigt das p,T-Diagramm mit Isochoren v = const, das aus der p,v,T-Fläche eines reinen Stoffes hervorgeht. Die Zweiphasengebiete sind zu Linien entartet, die sich im Tripelpunkt, dem Bild der Tripellinie, schneiden. Die Dampfdruckkurve, die vom Tripelpunkt bis zum kritischen Punkt reicht, ist die Projektion des Nassdampfgebietes. Die Schmelz- und Sublimationsdruckkurve entsprechen dem Schmelzund Sublimationsgebiet. Diese sog. Koexistenzkurven, welche die Zustandsgebiete des Festkörpers, der Flüssigkeit und des Gases gegeneinander abgrenzen, ordnen jedem Druck eine Schmelz-, Siede- oder Sublimationstemperatur zu. Umgekehrt geben sie zu jeder Temperatur den Schmelzdruck, Dampfdruck oder Sublimationsdruck an. Der stoffspezifische Verlauf der Koexistenzkurven ist durch die Bedingungen (1-60) und (1-61) für das Phasengleichgewicht festgelegt. Für einen reinen Stoff sind diese dem Maxwell-Kriterium (1-72) und der zu-
3 Phasen- und Reaktionsgleichgewichte
gebener Temperatur mit einer thermischen Zustandsgleichung punktweise berechnen. Für das Beispiel der Gleichung von Redlich-Kwong-Soave gibt Baehr [5] ein Verfahren an, das die kubische Form (2-51) dieser Zustandsgleichung und das mit der druckexpliziten Form (2-43) aufbereitete Maxwell-Kriterium (1-72) vr − br 1 3T ln psr = r vr − vr vr − br vr vr + br α − 2 ln · (3-4) vr vr + br br
Bild 3-2. Koexistenzkurven eines reinen Stoffes im p, T Diagramm [4]
sätzlichen Forderung äquivalent, dass die koexistierenden Phasen bei Druck und Temperatur des Gleichgewichts die thermische Zustandsgleichung erfüllen, siehe 1.3.3. Die Koexistenzkurven folgen damit allein aus der thermischen Zustandsgleichung. Differenziert man (1-72) nach der Temperatur, erhält man mit (1-48) dps /dT = (sα − sβ )/(vα − vβ ) .
(3-2)
Dies ist die Gleichung von Clausius und Clapeyron für die Steigung der Koexistenzkurven der Phasen α und β eines reinen Stoffes. Die spezifischen Entropien und Volumina sα , sβ , vα und vβ sind bei der Temperatur T und dem zugehörigen Sättigungsdruck ps des heterogenen Gleichgewichts einzusetzen. Die spezifische Umwandlungsentropie sα − sβ ist wegen μα = μβ nach (1-61) und μ = Hm − T S m nach (1-52) durch hα − hβ = T (sα − sβ )
(3-3)
mit der entsprechenden Umwandlungsenthalpie hα − hβ verknüpft. Aus (3-2) und (1-48) folgt, dass die kritische Isochore v = vk , siehe Bild 3-2, Tangente der Dampfdruckkurve im kritischen Punkt ist. 3.1.3 Sättigungsgrößen des Nassdampfgebietes
Der Dampfdruck ps und die spezifischen Volumina v and v auf Siede- und Taulinie lassen sich bei vorge-
als dimensionslose Arbeitsgleichungen benutzt. Die Bezeichnungen entsprechen 2.1.3; insbesondere kennzeichnet der Index r reduzierte, d. h. auf ihren Wert im kritischen Zustand bezogene Größen. Die Zeichen und verweisen generell auf Zustandsgrößen der siedenden Flüssigkeit bzw. des gesättigten Dampfes. Die Iteration läuft in folgenden Schritten ab: 1. Vorgabe der reduzierten Temperatur T r = T/T k und Schätzung des reduzierten Dampfdrucks psr = ps /pk . 2. Berechnung der reduzierten spezifischen Volumina vr = v /vk und vr = v /vk aus (2-51). 3. Berechnung von psr aus (3-4). 4. Rücksprung zu 2., falls sich psr über eine vorgegebene Schranke hinaus verändert hat. 5. Ende der Rechnung. Die Konvergenz des Verfahrens ist in einigem Abstand vom kritischen Zustand gut. Eine Alternative ist das Newton-Verfahren zur Bestimmung von psr aus (3-4). Viele Dampfdruckkorrelationen [6] leiten sich aus der Gleichung von Clausius und Clapeyron ab, sind aber im strengen Sinn nicht thermodynamisch konsistent. Setzt man z. B. für die spezifische Verdampfungsenthalpie h − h = r0 = const und für die spezifischen Volumina v = 0 und v = RT/p, ergibt die Integration von (3-2) mit (3-3) ln[ps /(ps)0 ] = r0 (1 − T 0 /T )/(RT 0) .
(3-5)
Zur Anwendung dieser in begrenzten Temperaturbereichen erstaunlich genauen Dampfdruckgleichung wird ein Punkt [(ps )0 , T 0 ] der Dampfdruckkurve und die zugehörige Verdampfungsenthalpie r0 benötigt.
F47
F48
F Technische Thermodynamik
Rein empirisch ist die Dampfdruckgleichung von Antoine, lg (ps /bar) = A − B(T/K + C) ,
(3-6)
die nur in dem Temperaturbereich zuverlässig ist, in dem die stoffspezifischen Konstanten A, B und C bestimmt wurden. Vielfach werden andere Einheiten als bar und Kelvin verwendet. Antoine-Konstanten vieler Stoffe findet man in [7] und [8]. Größere Genauigkeit liefert die 4-gliedrige Dampfdruckgleichung von Wagner [9]. Bei gegebener Temperatur folgen mit v und v die spezifischen Enthalpien und Entropien h , h , s und s auf den Grenzkurven des Nassdampfgebietes nach 2.1.3. Für ausgewählte Stoffe sind Siedetemperaturen und Dampfdrücke sowie spezifische Volumina, Enthalpien und Entropien auf Siede- und Taulinie in Dampftafeln, vgl. 2.1.3, verzeichnet. Unabhängige Variable sind dabei die Temperatur oder der Druck. Ein Beispiel ist die Temperaturtafel Tabelle 3-1 für Wasser mit r = h − h als der spezifischen Verdampfungsenthalpie. Sie ist gleich der auf die Masse bezogenen Wärme, die bei der isobaren Verdampfung einer siedenden Flüssigkeit zuzuführen ist. 3.1.4 Eigenschaften von nassem Dampf
Ein heterogenes Gemisch aus siedender Flüssigkeit und gesättigtem Dampf im Gleichgewicht heißt nasser Dampf. Seine Zusammensetzung wird durch den Dampfgehalt x ≡ m /(m + m ) = m /m
(3-7)
mit m als der Masse der Flüssigkeit, m als der Masse des Dampfes und m = m + m als der Masse des heterogenen Systems gekennzeichnet. Jede mengenartige extensive Zustandsgröße Z dieses Systems, z. B. das Volumen V, die Enthalpie H oder die Entropie S , ist die Summe der entsprechenden Zustandsgrößen Z und Z der Phasen. Die spezifischen Zustandsgrößen von nassem Dampf ergeben sich daher nach der Mischungsregel z ≡ Z/m = (1 − x)z + xz
(3-8)
aus den gleichartigen Eigenschaften z = Z /m und z = Z /m der Phasen. Wegen des Phasengleichgewichts sind z und z nach 3.1.3 Funktionen
von Druck oder Temperatur und können für die technisch wichtigsten Substanzen Dampftafeln entnommen werden. Aus (3-8) folgt unmittelbar das sog. Hebelgesetz der Phasenmengen m (z − z ) = m (z − z) ,
(3-9)
das sich in Phasendiagrammen, z. B. Bild 3-1, geometrisch deuten lässt. Die isothermen Abstände eines Zustandspunktes von nassem Dampf zu den Grenzkurven verhalten sich wie Hebelarme, die unter der Last der Phasenmengen im Gleichgewicht sind. Zur Berechnung isentroper Enthalpiedifferenzen ist der Zusammenhang h = h + T (s − s )
(3-10)
zwischen der spezifischen Enthalpie h und der spezifischen Entropie s von nassem Dampf mit der Siedetemperatur T nützlich. Das Ergebnis beruht auf der Spezialisierung von (3-8) auf Enthalpie und Entropie und der Elimination des Dampfgehaltes x unter Beachtung von (3-3). 3.1.5 T,s- und h,s-Diagramm
Wichtiger als das p, v-Diagramm sind bei der Darstellung von Prozessen das T, s- und h, s-Diagramm. Denn neben den umgesetzten Energien lassen sich in diesen Koordinaten auch Aussagen des zweiten Hauptsatzes kenntlich machen. Bild 3-3 zeigt das T, s-Diagramm eines reinen Stoffes in der Umgebung des Nassdampfgebietes. Siede- und Taulinie mit dem Dampfgehalt x = 0 und x = 1 bilden eine glockenförmige Kurve, in deren Scheitel der kritische Punkt K liegt. Sie schließen das Nassdampfgebiet ein; links der Siedelinie ist das Flüssigkeits- und rechts der Taulinie das Gasgebiet. Die Isobaren, die im Flüssigkeitsgebiet dicht an der Siedelinie verlaufen, haben nach Tabelle 1-1 die Steigung (∂T/∂s) p = T/c p . Dies gilt auch im Nassdampfgebiet, wo die Isobaren mit den Isothermen zusammenfallen. In den Grenzzuständen des idealen Gases am rechten Bildrand sind die Isobaren nach (2-14) in s-Richtung parallel verschobene Kurven. Der Verlauf der Linien x = const ist durch das Hebelgesetz (3-9) bestimmt. Spezifische Energien erscheinen im T, s-Diagramm als Flächen.
3 Phasen- und Reaktionsgleichgewichte
Tabelle 3-1. Dampftafel für das Nassdampfgebiet von Wasser [10]
t ◦
C 0,01 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300 310 320 330 340 350 360 370 373,946
P bar 0,006117 0,008726 0,012282 0,017057 0,023392 0,031697 0,042467 0,056286 0,073844 0,095944 0,12351 0,15761 0,19946 0,25041 0,31201 0,38595 0,47415 9,57868 0,70182 0,84609 1,0142 1,4338 1,9867 2,7026 3,6150 4,7610 6,1814 7,9205 10,026 12,550 15,547 19,074 23,193 27,968 33,467 39,759 46,921 55,028 64,165 74,416 85,877 98,647 112,84 128,58 146,00 165,29 186,66 210,43 220,64
v dm3 /kg 1,000 1,000 1,000 1,001 1,002 1,003 1,004 1,006 1,008 1,010 1,012 1,015 1,017 1,020 1,023 1,026 1,029 1,032 1,036 1,040 1,043 1,052 1,060 1,070 1,080 1,091 1,102 1,114 1,127 1,141 1,157 1,173 1,190 1,209 1,229 1,252 1,276 1,303 1,333 1,366 1,404 1,448 1,499 1,561 1,638 1,740 1,895 2,222 3,106
v m3 /kg 205,997 147,017 106,309 77,881 57,761 43,341 32,882 25,208 19,517 15,253 12,028 9,565 7,668 6,194 5,040 4,129 3,405 2,826 2,359 1,981 1,672 1,209 0,8913 0,6681 0,5085 0,3925 0,3068 0,2426 0,1939 0,1564 0,1272 0,1043 0,08610 0,07151 0,05971 0,05009 0,04218 0,03562 0,03015 0,02556 0,02166 0,01834 0,01548 0,01298 0,01078 0,008801 0,006946 0,004947 0,003106
h kJ/kg 0,000612 21,019 42,021 62,984 83,920 104,84 125,75 146,64 167,54 188,44 209,34 230,24 251,15 272,08 293,02 313,97 334,95 355,95 376,97 398,02 419,10 461,36 503,78 546,39 589,20 632,25 675,57 719,21 763,19 807,57 852,39 897,73 943,64 990,21 1037,5 1085,7 1134,8 1185,1 1236,7 1289,8 1344,8 1402,0 1462,1 1525,7 1594,4 1670,9 1761,5 1892,6 2087,5
h kJ/kg 2500,9 2510,1 2519,2 2528,4 2537,5 2546,5 2555,6 2564,6 2573,5 2582,5 2591,3 2600,1 2608,8 2617,5 2626,1 2634,6 2643,0 2651,3 2659,5 2667,6 2675,6 2691,1 2705,9 2720,1 2733,4 2745,9 2757,4 2767,9 2777,2 2785,3 2792,1 2797,4 2801,1 2803,0 2803,1 2801,0 2796,6 2789,7 2779,8 2766,6 2749,6 2727,9 2700,7 2666,2 2622,1 2563,6 2481,0 2333,5 2087,5
r kJ/kg 2500,9 2489,1 2477,2 2465,4 2453,6 2441,7 2429,8 2417,9 2406,0 2394,0 2382,0 2369,9 2357,7 2345,4 2333,1 2320,6 2308,1 2295,4 2282,6 2269,6 2256,5 2229,7 2202,2 2173,7 2144,2 2113,7 2081,9 2048,7 2014,0 1977,7 1939,7 1899,6 1857,4 1812,8 1765,5 1715,3 1661,8 1604,6 1543,1 1476,8 1404,8 1325,9 1238,6 1140,5 1027,6 892,73 719,54 440,94 0,00
s kJ/(kg · K) 0,000000 0,076252 0,15109 0,22447 0,29650 0,36726 0,43679 0,50517 0,57243 0,63862 0,70379 0,76798 0,83122 0,89354 0,95499 1,0156 1,0754 1,1344 1,1927 1,2502 1,3070 1,4187 1,5278 1,6346 1,7393 1,8420 1,9428 2,0419 2,1395 2,2358 2,3308 2,4248 2,5178 2,6102 2,7019 2,7934 2,8847 2,9762 3,0681 3,1608 3,2547 3,3506 3,4491 3,5516 3,6599 3,7783 3,9164 4,1142 4,4120
s kJ/(kg · K) 9,1555 9,0249 8,8998 8,7804 8,6661 8,5568 8,4521 8,3518 8,2557 8,1634 8,0749 7,9899 7,9082 7,8296 7,7540 7,6812 7,6110 7,5434 7,4781 7,4150 7,3541 7,2380 7,1291 7,0264 6,9293 6,8370 6,7491 6,6649 6,5841 6,5060 6,4303 6,3565 6,2842 6,2131 6,1425 6,0722 6,0017 5,9304 5,8578 5,7832 5,7058 5,6243 5,5373 5,4425 5,3359 5,2109 5,0527 4,7996 4,4120
F49
F50
F Technische Thermodynamik
Bild 3-3. Fluider Zustandsbereich eines reinen Stoffes im
Bild 3-4. Fluider Zustandsbereich eines reinen Stoffes im
T, s-Diagramm [11]
h, s-Diagramm [12]
Insbesondere bedeutet die Fläche unter einer Isobaren wegen T ds = dh − vdp die Differenz spezifischer Enthalpien. So ist das Rechteck unter einer Isobaren des Nassdampfgebietes die spezifische Verdampfungsenthalpie, vgl. (3-3). Die Fläche unter einer beliebigen Zustandslinie ist nach (1-111) die Summe der auf die Masse bezogenen Wärme und dissipierten Energie; nur für einen reversiblen Prozess stellt die Fläche eine Wärme dar. Das h, s-Diagramm eines reinen Stoffes mit Linien p = const, das in Bild 3-4 für die Umgebung des Nassdampfgebietes gezeichnet ist, enthält die Information der Fundamentalgleichung h = h(s, p), vgl. 1.2.3. Siede- und Taulinie grenzen das Nassdampfgebiet nach links und rechts gegen das Flüssigkeits- und Gasgebiet ab. Der kritische Punkt K liegt im gemeinsamen Wendepunkt von Siede- und Taulinie am linken Hang des Nassdampfgebietes. Wie sich aus Tabelle 1-1, vgl. auch (3-10), ergibt, beträgt die Steigung der Isobaren in den homogenen und heterogenen Gebieten (∂h/∂s) p = T . Da die Temperatur von nassem Dampf nach 3.1.2 bei konstantem Druck einen festen Wert hat, sind die Isobaren des Nassdampfgebietes Geraden mit einem Steigungsdreieck nach (3-3). Die Geraden werden mit wachsendem Druck, d. h. steigender Siedetemperatur, immer steiler, wobei die kritische Isobare Tangente
an die Grenzkurven im kritischen Punkt K ist. Die Isobaren überqueren die Grenzkurven im Gegensatz zum T, s-Diagramm ohne Knick, weil die Temperatur sich dort nicht sprungartig ändert. Die Isothermen, die im Nassdampfgebiet mit den Isobaren zusammenfallen, knicken auf den Grenzkurven ab und gehen im Gasgebiet asymptotisch in Linien h = const über. Denn in den Grenzzuständen des idealen Gases hängt die Enthalpie nur von der Temperatur ab. Die Linien x = const folgen aus dem Hebelgesetz (3-9). Die spezifischen Energien des h, s-Diagramms sind Ordinatendifferenzen, die durch die Energiebilanzen von 1.5.2 mit der massebezogenen Wärme und Arbeit eines Prozesses verknüpft sind.
3.2 Phasengleichgewichte fluider Mehrstoffsysteme Koexistierende Phasen von Mehrstoffsystemen haben im Allgemeinen unterschiedliche Zusammensetzung. Diese Aussage besitzt für die Verfahrenstechnik zentrale Bedeutung, da diese unterschiedliche Zusammensetzung der Phasen von allein angestrebt wird. Dieser Ausgleichsprozess wird von allen thermischen Trennverfahren genutzt. Druck, Temperatur und Konzentrationen sind dabei durch die Gleichgewichtsbedingungen (1-60) und (1-61) verknüpft. Mit den Kom-
3 Phasen- und Reaktionsgleichgewichte
ponenten wächst die Zahl der maximal möglichen Phasen eines Systems, die sich aus (3-1) mit f = 0 ergibt. 3.2.1 Phasendiagramme
Die ein- und mehrphasigen Zustandsgebiete binärer und ternärer Systeme lassen sich in Phasendiagrammen kenntlich machen. Die mehrphasigen Zustände müssen in der thermischen Verfahrenstechnik bekannt sein und eingestellt werden, um einen Trennvorgang einleiten zu können. Variable sind dabei Druck, Temperatur und K − 1 Molanteile der als inert vorausgesetzten Komponenten. Für viele Anwendungen genügen Ausschnitte der Diagramme im dampfförmig-flüssigen, flüssig-flüssigen und fest-flüssigen Zustandsbereich. Die Bilder 3-5a bis d zeigen verschiedene Formen des Verdampfungsgleichgewichts binärer Systeme der Komponenten A1 und A2 im Siede- und Gleichgewichtsdiagramm. Die Koordinaten sind T und x bzw. x und x bei p = const. Dabei ist x der
Stoffmengenanteil der Komponente A1 , die beim gegebenen Druck die kleinere Siedetemperatur hat. Die Marken und kennzeichnen die siedende Flüssigkeit und den gesättigten Dampf. Der Druck liegt unterhalb des kritischen Drucks der reinen Komponenten. Die Zustände der siedenden Flüssigkeit und des gesättigten Dampfes, die nach der Phasenregel durch Funktionen x = x (T, p) und x = x (T, p) beschrieben werden, bilden sich im T, x-Diagramm als Siedebzw. Taulinie ab. Die Punkte, die durch das Phasengleichgewicht einander zugeordnet sind, liegen auf Linien T = const, die als Konoden bezeichnet werden. Auf den Konoden lassen sich die Zusammensetzungen x und x ablesen, die im Gleichgewichtsdiagramm gegeneinander aufgetragen sind. Siede- und Taulinie schließen das Nassdampfgebiet ein, dessen Punkte einem zweiphasigen Gemisch aus siedender Flüssigkeit und gesättigtem Dampf entsprechen. Eine Konode durch einen Zustandspunkt dieses Feldes markiert mit ihren Endpunkten den Zustand der Phasen des Gemisches. Die Stoffmengen n und n der
Bild 3-5. Formen des Verdampfungsgleichgewichts binärer Systeme im Siede- und Gleichgewichtsdiagramm. Es bedeuten D Dampf, F Flüssigkeit, ND nasser Dampf, SL Siedelinie, TL Taulinie und LG Löslichkeitsgrenze. Die Zweiphasengebiete sind schattiert angelegt. a Gemisch mit monotonem Verlauf von Siede- und Taulinie. b Gemisch mit einem Minimum der Siedetemperatur. c Gemisch mit einem Maximum der Siedetemperatur. d Gemisch mit einer Mischungslücke im Flüssigkeitsgebiet
F51
F52
F Technische Thermodynamik
beiden Phasen genügen dem Hebelgesetz n (x − x ) = n (x − x) , (3-11) das auf der Erhaltung der Komponentenmengen beim Zerfall eines Systems mit der Zusammensetzung x in eine - und in eine -Phase beruht. Unterhalb der Siedelinie liegt das Flüssigkeitsgebiet, in dem es bereichsweise zwei Phasen geben kann. Oberhalb der Taulinie ist das Einphasengebiet des überhitzten Dampfes. Im Beispiel der Bilder 3-5a bis c bilden die flüssigen Komponenten im gesamten Konzentrationsbereich homogene Mischungen. Bei Systemen nach Bild 3-5a, zu denen auch ideale Lösungen mit idealem Dampf zählen, ändert sich die Temperatur auf den Grenzen des Nassdampfgebiets monoton. Stärkere Abweichungen von der Idealität führen bei ähnlichen Siedetemperaturen der Komponenten häufig zu Minima oder Maxima von Siede- und Taulinie, vgl. Bild 3-5b und c. Die Kurven berühren sich dann in einem gemeinsamen Punkt mit horizontaler Tangente, einem sog. azeotropen Punkt, der im Gleichgewichtsdiagramm auf der Hauptdiagonale liegt. In diesem ausgezeichneten Punkt haben Dampf und Flüssigkeit dieselbe Zusammensetzung und das Nassdampfgebiet wird bei einer konstanten Temperatur durchschritten, sodass Gemische mit azeotroper Zusammensetzung eine besondere Rolle in der Energie- und Verfahrenstechnik spielen. Bild 3-5d zeigt den Fall, dass die flüssigen Komponenten nur beschränkt ineinander löslich sind und in einer Mischungslücke zwei flüssige Phasen vorliegen. Siede- und Taulinie bestehen dann aus zwei Ästen mit einem Minimum der Siedetemperatur im gemeinsamen Punkt B, einem heteroazeotropen Punkt. Die Linie AC ist ein Dreiphasengebiet aus den Flüssigkeiten A und C und dem Dampf B. Die azeotropen Zusammensetzungen sind Funktionen des Drucks. Bei isobarer Wärmezufuhr bewegt sich der Zustandspunkt eines flüssigen Systems im T, x-Diagramm auf einer Linie x = const zu höheren Temperaturen. Ist die Siedelinie erreicht, bildet sich die erste Dampfblase, die im Fall von Bild 3-5a stark mit der leichter siedenden Komponente A1 angereichert ist. Weitere Wärmezufuhr lässt die Temperatur und die Dampfmenge entsprechend dem Hebelgesetz wachsen. Beim Überschreiten der Taulinie verschwindet
der letzte, an A1 verarmte Flüssigkeitstropfen. Im Gegensatz zu einem reinen Stoff bleibt die Temperatur eines binären Systems bei isobarem Phasenwechsel nicht konstant. Ausgenommen sind Systeme mit azeotroper Zusammensetzung. Mit wachsendem Druck verschieben sich die Grenzen des Nassdampfgebietes im T, x-Diagramm zu höheren Temperaturen, vgl. Bild 3-6 für ein System des Typs a aus Bild 3-5. Wird der kritische Druck einer Komponente überschritten, löst sich das Nassdampfgebiet von den Begrenzungen x = 0 bzw. x = 1 des Diagramms. In diesem Fall gehen Siede- und Taulinie in einem Punkt mit gemeinsamer horizontaler Tangente ineinander über, die zugleich Konode ist. Flüssigkeits- und Dampfphase sind in einem solchen Punkt identisch, sodass hier ein kritischer Zustand des Systems vorliegt. Ist der Druck größer als der kritische Druck beider Komponenten, wird das Nassdampfgebiet eine Insel, die schließlich ganz verschwindet. Die Verbindungslinie der kritischen Zustände heißt kritische Kurve.
Bild 3-6. Grenzkurven des Nassdampfgebietes eines Systems nach Bild 3-5a für verschiedene Drücke im Sie-
dediagramm [13]
3 Phasen- und Reaktionsgleichgewichte
Eine Darstellung der Gleichgewichte fester und flüssiger binärer Phasen im T, x-Diagramm findet man in [14]. Die Zusammensetzung ternärer Systeme lässt sich in Dreiecksdiagrammen beschreiben. Vornehmlich werden gleichseitige Dreiecke nach Bild 3-7a benutzt, deren Seiten zu eins normiert sind. Die Ecken entsprechen den reinen Komponenten A1 , A2 und A3 des Systems. Auf den Dreiecksseiten, die nach Stoffmengenanteilen geteilt sind, findet man die binären Randsysteme. Punkte innerhalb des Dreiecks stellen ternäre Gemische dar. Die Linien konstanter Stoffmengenanteile xi verlaufen parallel zu den Dreiecksseiten, die der Ecke Ai gegenüberliegen, und schneiden auf den Randmaßstäben die Werte xi , ab. Die Geometrie
des Diagramms sichert die Bedingung x1 + x2 + x3 = 1. Bild 3-7b zeigt das Phasendiagramm eines ternären Systems im Bereich flüssiger Zustände für konstante Werte von Druck und Temperatur in Dreieckskoordinaten. Das binäre Randsystem der Komponenten A1 und A2 hat eine Mischungslücke, die sich auf die benachbarten ternären Systeme ausdehnt. Die Phase mit der größeren Dichte wird mit , die andere mit bezeichnet. Nach der Phasenregel bilden sich die Zustände der koexistierenden Phasen in der Koordinatenebene als Linien ab. Dies sind die Äste der Binodalkurve, die im Punkt K ineinander übergehen. Die geradlinigen Konoden verbinden die Zustandspunkte von Phasen, die miteinander im Gleichgewicht sind. Jeder Zustandspunkt auf einer Konode stellt ein heterogenes Gemisch dieser Phasen dar. Die Phasenmengen folgen dem Hebelgesetz 6 7 6 7 n xi − xi = n xi − xi
(i = 1, 2, 3) ,
(3-12)
das sich aus der Erhaltung der Komponentenmengen beim Phasenzerfall eines ternären Systems mit der Zusammensetzung xi ergibt. Im Punkt K berühren sich Konode und Binodalkurve, sodass beide Phasen identisch werden. Damit ist K ein kritischer Punkt. Andere Formen des Flüssig-flüssig-Gleichgewichts ternärer Systeme enthält [15]. 3.2.2 Differenzialgleichungen der Phasengrenzkurven
Bild 3-7. Beschreibung ternärer Systeme in Dreieckskoordinaten. a Auffinden der Stoffmengenanteile xi zu einem Zustandspunkt P, b Flüssig-flüssig-Gleichgewicht in einem System mit Mischungslücke
Aus den Bedingungen (1-61) für das Phasengleichgewicht lassen sich Differenzialgleichungen herleiten, die allgemeine Aussagen über den Verlauf der Grenzkurven in Phasendiagrammen liefern. Dies soll am Beispiel eines binären Systems mit den Phasen α und β gezeigt werden, die bei der Temperatur T , dem Druck p sowie den Werten xα und xβ des Stoffmengenanteils der Komponente 1 im Gleichgewicht β sind. Da die Differenz μαi − μi der chemischen Potenziale der Komponente i nach (1-61) in allen Gleichgewichtszuständen Null ist, verschwindet unter den Bedingungen des Gleichgewichts das β totale Differenzial d(μαi − μi ). Die Änderungen der intensiven Zustandsgrößen zwischen benachbarten Gleichgewichtszuständen sind daher durch
F53
F54
F Technische Thermodynamik
β β − S iα − S i dT + Viα − Vi dp β 6 7 + ∂μαi /∂xα T,p dxα − ∂μi /∂xβ
T,p
dxβ = 0 (3-13)
mit 1 i 2 verknüpft, wobei die Temperatur- und Druckableitung des chemischen Potenzials μi nach (1-51) und (1-50) durch die negative partielle molare Entropie S i und das partielle Molvolumen Vi der Komponente i ersetzt sind. Wegen (1-61) und (1-52) besteht β β dabei der Zusammenhang S iα − S i = (Hiα − Hi )/T mit Hi als der partiellen molaren Enthalpie der Komponente i. Sind die α- und β-Phasen Dampf bzw. Flüssigkeit’, erhält man aus (3-13) unter Berücksichtigung von (1-25) von Gibbs-Duhem für die Siede- und Taulinie T = T (x ) bzw. T = T (x ) bei p = const die Differenzialgleichungen [16] T (x − x )(∂μ1 /∂x )T,p dT = , dx (1 − x ) x H − H +(1 − x ) H − H 1 1 2 2 (3-14) p = const . T (x − x )(∂μ1 /∂x )T,p dT = , dx (1 − x ) x H − H +(1 − x ) H − H 1 1 2 2 (3-15) p = const . Die Ableitungen des chemischen Potenzials μ1 sind aufgrund der Stabilitätsbedingungen (1-73) stets positiv. Die eckigen Klammern im Nenner, welche die molare Überführungsenthalpie beim Übergang einer Stoffportion mit der Zusammensetzung x bzw. x von der Flüssigkeit in den Dampf bedeuten, sind in einigem Abstand von kritischen Zuständen ebenfalls positiv. Die Steigung von Siede- und Taulinie im T, xDiagramm ist daher negativ, wenn der Dampf im Vergleich zur Flüssigkeit an der Komponente 1 angereichert ist. Sind Dampf und Flüssigkeit gleich zusammengesetzt, haben Siede- und Taulinie eine horizontale Tangente, wie in Bild 3-6b und c zu erkennen ist. Aus (3-13) lässt sich ableiten, dass einem Minimum der Siedetemperatur bei p = const ein Maximum des Dampfdrucks bei T = const entspricht und umgekehrt. Ist die im Lösungsmittel 1 gelöste Komponente 2 nicht flüchtig, besteht der Dampf aus reinem Lö-
sungsmittel mit x = 1. In diesem Fall vereinfacht sich (3-14) zu dT/dx = −T (∂μ1 /∂x )T,p /(H1 − H1 )
(3-16)
bei p = const, d. h., die Siedetemperatur der Lösung erhöht sich mit steigendem Molanteil x2 = (1 − x ) des gelösten Stoffes. Beschränkt man sich auf Zustände großer Verdünnung x2 1, folgt μ1 dem Ansatz (2-126) für das chemische Potenzial der Komponenten einer idealen Lösung. Die Integration von (3-16) bei p = const ergibt dann unter Vernachlässigung kleiner Terme für die isobare Siedepunktserhöhung der Lösung im Vergleich zum Lösungsmittel [17] 2 T − T s01 = Rm T s01 x2 /(M1 r01 ) .
(3-17)
Dabei sind T s01 die Siedetemperatur und r01 die spezifische Verdampfungsenthalpie des reinen Lösungsmittels mit der molaren Masse M1 beim Druck p. Dissoziiert der Stoff 2, ist für x2 die Summe der Stoffmengenanteile der Teilchenarten einzusetzen, die bei der Lösung des Stoffes 2 entstehen. Der isobaren Siedepunktserhöhung entspricht eine isotherme Dampfdruckerniedrigung, die sich unter den Voraussetzungen von (3-17) aus dem Raoult’schen Gesetz (3-25), siehe 3.2.3, berechnen lässt. Analog zur Siedepunktserhöhung findet man für das Gleichgewicht eines reinen festen Stoffes 1 mit einer flüssigen Mischphase aus den Stoffen 1 und 2 eine Gefrierpunktserniedrigung der Mischung gegenüber dem Schmelzpunkt des reinen Stoffes 1 [18]. 3.2.3 Punktweise Berechnung von Phasengleichgewichten
Für die Praxis wichtiger als die differentiellen Beziehungen für das Gleichgewicht zweier fluider Phasen und ist die punktweise Auswertung der Gleichgewichtsbedingungen (1-61) 6 7 6 7 μi T, p, x1 , . . . , xK−1 = μi T, p, x1 , . . . , xK−1 mit 1 i K
(3-18)
für einen Satz gesuchter Größen. Mit dem Ansatz (2-118), der das chemische Potenzial μi einer Komponente i mithilfe der Fugazität fi darstellt, reduziert sich (3-18) auf
3 Phasen- und Reaktionsgleichgewichte
6 7 6 7 fi T, p, x1 , . . . , xK−1 = fi T, p, x1 , . . . , xK−1 mit 1 i K .
(3-19)
⎡ p ⎤ ⎢⎢⎢ " ⎥⎥⎥ ⎢ ⎥ f0i (T, p) = f0i (T, ps0i ) exp ⎢⎢⎢⎢⎢ V0i /(Rm T )dp⎥⎥⎥⎥⎥ ⎣ ⎦ ps0i
Das Phasengleichgewicht ist daher allein durch die thermische Zustandsgleichung des Systems bestimmt, aus der die Fugazitäten im Prinzip berechenbar sind. In Abhängigkeit von den jeweils verfügbaren Stoffmodellen wird (3-19) in mehreren Varianten angewendet. Für Systeme mit schwach polaren Komponenten kann bei der Auswertung der Bedingungen für das Dampf-Flüssigkeits-Gleichgewicht häufig auf eine thermische Zustandsgleichung für das gesamte fluide Gebiet zurückgegriffen werden. In diesem Fall führt man den Fugazitätskoeffizienten ϕi = ϕi (T, p, x1, . . . , xK−1 ) nach (2-120) ein, so dass (3-19) die Gestalt xi ϕi = xi ϕi
mit 1 i K
(3-20)
erhält. Die Zeichen und beziehen sich dabei auf die Flüssigkeit und den Dampf. Tabelle 2-8 gibt an, wie man Fugazitätskoeffizienten aus der Zustandsgleichung (2-43) von Redlich-Kwong-Soave berechnen kann, wenn man zuvor die molaren Volumina 6 7 Vm = Vm T, p, x1 , . . . , xK−1 6 7 und Vm = Vm T, p, x1 , . . . , xK−1 bestimmt hat. Für das Dampf-Flüssigkeits-Gleichgewicht von Systemen mit stark polaren Komponenten können die Fugazitäten fi in der flüssigen Phase nur mit Hilfe von Aktivitätskoeffizienten-Modellen angegeben werden, vgl. 2.2.3. Liegt die Temperatur des Phasengleichgewichts unter der kritischen Temperatur der reinen Komponenten, lässt sich fi nach (2-127) berechnen. Dabei wird die Existenz der reinen flüssigen Komponenten bei der Temperatur und dem Druck des Systems vorausgesetzt. In diesem Fall geht (3-19) mit fi nach (2-120) in xi γi f0i (T, p) = xi ϕi p
mit 1 i K
(3-21)
über, wobei γi = γi (T, p, x1 , . . . , xK−1 ) den Aktivitätskoeffizienten der Komponente i in der Flüssigkeit und f0i die Fugazität der reinen flüssigen Komponente i bei der Temperatur T und dem Druck p des Phasengleichgewichts bedeuten. Wegen (1-50) und (2-72) ist
(3-22)
V0i
mit ps0i als dem Sättigungsdruck und als dem Molvolumen der reinen Flüssigkeit i bei der Temperatur T . Der i. Allg. kleine Exponentialausdruck heißt Poynting-Korrektur. Wegen des Phasengleichgewichts des reinen Stoffes i auf seiner Dampfdruckkurve haben der reine Dampf und die reine Flüssigkeit i dort dieselbe Fugazität f0i (T, ps0i ) = f0i (T, ps0i ) = ϕs0i ps0i .
(3-23)
Damit erhält man aus (3-21) die viel benutzte Gleichgewichtsbedingung ⎡ p ⎤ ⎢⎢⎢" ⎥⎥⎥ ⎢ ⎥ xi ϕi p = xi γi ϕs0i ps0i exp ⎢⎢⎢⎢⎢ V0i /(Rm T )dp⎥⎥⎥⎥⎥ (3-24) ⎣ ⎦ mit 1 i K .
ps0i
Zur Auswertung werden neben den Reinstoffdaten ps0i und V0i eine thermische Zustandsgleichung des Dampfes, z. B. (2-40) für kleine Drücke mit Fugazitätskoeffizienten nach Tabelle 2-7, sowie ein Ansatz für die molare freie Zusatzenthalpie der Flüssigkeit zur Berechnung des Aktivitätskoeffizienten γi benötigt. Hierfür stehen z. B. das UNIQUAC- oder UNIFAC-Modell zur Verfügung, aus denen sich die Aktivitätskoeffizienten ermitteln lassen, vgl. 2.2.3. Im Fall einer idealen Lösung im Gleichgewicht mit einem idealen Gas folgt aus (3-24) bei vernachlässigbarer Poynting-Korrektur das Raoult’sche Gesetz xi p = xi ps0i (T ) mit 1 i K .
(3-25)
Es gilt unter den übrigen Voraussetzungen auch für reale Lösungen im Grenzfall xi → 1 und gibt Einlick in die Schlüsselgrößen des Dampf-FlüssigkeitsGleichgewichts. Ein Mangel von (3-24) ist, dass in der PoyntingKorrektur gegebenenfalls mit V0i = const über hypothetische Zustände der reinen Flüssigkeit integriert wird. Für überkritische Komponenten ist (3-24) im Prinzip nicht anwendbar, weil für T > (T k )0i kein Dampfdruck existiert. Um diese Einschränkung in der Praxis zu umgehen, sind Korrelationen entwickelt
F55
F56
F Technische Thermodynamik
worden [19], welche die Fugazität f0i (T, p) der reinen Flüssigkeit über die kritische Temperatur hinaus extrapolieren. Das Verdampfungsgleichgewicht überkritischer Komponenten lässt sich im Gegensatz zu (3-24) mit (3-20) konsistent beschreiben. Dies ist bei einem binären System aus dem Lösungsmittel 1 und der überkritischen Komponente 2 auch möglich, wenn die Fugazität der Komponente 2 in der Flüssigkeit nach (2-133) mithilfe des Henry’schen Koeffizienten H2,1 formuliert wird. Dann folgt aus (3-19) mit f2 nach (2-120) die Gleichgewichtsbedingung für den gelösten Stoff x2 γ2∗ H2,1 = x2 ϕ2 p
(3-26)
mit γ2∗ als dem rationellen Aktivitätskoeffizienten der Komponente 2 in der Flüssigkeit, vgl. (2-130). Die Gleichgewichtsbedingung für das Lösungsmittel ist unverändert (3-24), sodass die Symmetrie zwischen den Komponenten gebrochen wird. Wichtig ist, dass sich (3-26) auf das Gleichgewicht derselben Teilchenart des Stoffes 2 im Dampf und in der Flüssigkeit bezieht. Daher entspricht x2 nicht der gesamten in der Flüssigkeit enthaltenen Menge des Stoffes 2, wenn der Stoff im gelösten Zustand dissoziiert oder Verbindungen mit dem Lösungsmittel eingeht. Wie alle Variablen in (3-26) ist der Henry’sche Koeffizient H2,1 der Komponente 2 im Lösungsmittel 1 bei der Temperatur T und dem Druck p des Phasengleichgewichts einzusetzen. Sein Wert in diesem Zustand ergibt sich mit (2-134), (2-118) und (1-50) aus den in der Regel beim Sättigungsdruck ps01 (T ) des reinen Lösungsmittels angegebenen Daten der Literatur, vgl. (2-135), zu H2,1 (T, p) = H2,1 (T, ps01 ) × exp[V2∞ (p − ps01 )/(Rm T )] . (3-27) Dabei ist vorausgesetzt, dass das partielle molare Volumen V2∞ der unendlich verdünnten Komponente 2 in der Flüssigkeit nicht vom Druck abhängt. Einige Daten für V2∞ findet man in [20]. Der rationelle Aktivitätskoeffizient γ2∗ , dessen Druckabhängigkeit selten berücksichtigt wird, kann nach (2-130) und (2-146) aus einem Modell für die molare freie Zusatzenthalpie der Lösung bestimmt werden. Häufig genügt der
Ansatz von Porter GEm /(Rm T ) = Ax1 x2 mit dem anzupassenden Koeffizienten A, womit ln γ2∗ = A x2 (3-28) 1 −1 wird. Aus (3-26) folgt mit (3-27) und (3-28) die Gleichung von Krichevsky-Ilinskaya x2 ϕ2 p = x2 H2,1 (T, ps01 ) ∞ V (p − ps01 ) × exp 2 + A(x2 − 1) . 1 Rm T (3-29) Im Grenzfall großer Verdünnung, x2 → 0 und x1 → 1 ist der Term A(x21 − 1) vernachlässigbar. Die weitere Spezialisierung von (3-29) auf kleine Drücke, bei denen die Gasphase ideal und der Henry’sche Koeffizient vornehmlich durch die Temperatur bestimmt ist, führt auf das Henry’sche Gesetz x2 p = x2 H2,1 (T, ps01 ) .
(3-30)
Es enthält die Grundelemente zur Beschreibung von Gaslöslichkeiten. Die Empfindlichkeit des Lösungsgleichgewichts von Gasen gegen Änderungen von Temperatur und Druck ist aus (3-26), leichter aber aus den Differenzialgleichungen der Phasengrenzkurven zu ermitteln. Bei unendlicher Verdünnung x2 → 0 und reiner Gasphase x2 = 1 folgt aus (3-13), (2-128) und (2-133) 7 6 7 6 (3-31) ∂ ln x2 /∂T p = H2∞ − H2 / Rm T 2 mit H2∞ und H2 als den partiellen molaren Enthalpien des gelösten Stoffes in der Flüssigkeit und im Dampf. Da der Lösungsvorgang i. Allg. exotherm, d. h. H2∞ − H2 < 0 ist, nimmt die Gaslöslichkeit in der Regel mit steigender Temperatur ab, was einer Zunahme des Henry’schen Koeffizienten H2,1 in (3-30) entspricht. Mit denselben Voraussetzungen erhält man (∂ ln x2 /∂p)T = (V2 − V2∞ )/(Rm T ) .
(3-32)
Danach muss die Löslichkeit mit dem Druck ansteigen, weil das partielle molare Volumen V2 des gelösten Stoffes im Gas stets größer ist als der Wert V2∞ in der Flüssigkeit. Schließlich soll eine spezielle Gleichgewichtsbedingung für ein heterogenes System aus zwei flüssigen
3 Phasen- und Reaktionsgleichgewichte
Phasen und mit den Dichten > hergeleitet werden, dessen reine Komponenten bei Temperatur und Druck des Gleichgewichts flüssig sind. In diesem Fall lassen sich die Fugazitäten der Komponenten in beiden Phasen durch (2-127) beschreiben, sodass (3-19) die Form xi γi = xi γi
mit 1 i K
(3-33)
mit γi als dem Aktivitätskoeffizienten der Komponente i annimmt. Sind die Phasen ideale Lösungen mit γi = 1 stimmen die Stoffmengenanteile xi der Komponenten in beiden Phasen überein. Die auf verschiedene Stoffmodelle zugeschnittenen Gleichgewichtsbedingungen (3-20), (3-24), (3-29) und (3-33) lassen sich in standardisierter Form 6 7 xi /xi = Ki T, p, x1 , . . . , xK−1 , x1 , . . . , xK−1 (3-34) mit 1 i K schreiben, wobei Ki als Gleichgewichtsverhältnis für die Komponente i bezeichnet wird. Die Nichtlinearität dieser K Gleichungen mit 2K Variablen ist in der Temperatur stärker als im Druck. Eine charakteristische Anwendung von (3-34) ist, bei gegebenem Druck p und gegebener Zusammensetzung x1 , . . . , xK−1 einer Flüssigkeit die Siedetemperatur T und die Zusammensetzung x1 , . . . , xK−1 des Gleichgewichtsdampfes zu bestimmen. Dabei hat sich folgende iterative Rechnung bewährt [21]: 1. Vorgabe von p und aller xi sowie Schätzung von T und aller xi . 2. Berechnung aller Ki in (3-34). 3. Berechnung aller xi aus (3-34) xi
=
xi Ki /
K
xi Ki .
(3-35)
i=1
4. Rücksprung zu 2., falls sich ein xi über eine vorgegebene Schranke hinaus verändert hat. 5. Berechnung der Restfunktion f =
K i=1
xi Ki − 1 .
(3-36)
6. Anpassung von T , z. B. nach dem NewtonVerfahren, und Rücksprung zu 2., falls | f | eine vorgegebene Schranke übersteigt. 7. Ende der Rechnung. In ähnlichen Schritten hat man vorzugehen [21], wenn bei gegebenem Druck p und gegebener Dampfzusammensetzung x1 , . . . , xK−1 die Taupunkttemperatur T und die Zusammensetzung x1 , . . . , xK−1 der Gleichgewichtsflüssigkeit gefragt ist: 1. Vorgabe von p und allen xi sowie Schätzung von T und allen xi . 2. Berechnung aller Ki in (3-34). 3. Berechnung aller xi aus (3-34) 6 7 6 7 xi = xi Ki / xi /Ki . K
i=1
4. Rücksprung zu 2., falls sich ein xi über eine vorgegebene Schranke hinaus verändert hat. 5. Berechnung der Restfunktion f =
K (xi /Ki ) − 1 .
(3-37)
i=1
6. Anpassung von T , z. B. nach dem NewtonVerfahren, und Rücksprung zu 2., falls | f | eine vorgegebene Schranke übersteigt. 7. Ende der Rechnung. Die Konvergenz dieser einfachen Algorithmen ist besonders bei hohen Drücken ein Problem. Es wird daher empfohlen, die Berechnung von Gleichgewichtszuständen bei niedrigen Drücken zu beginnen und das Ergebnis als Startwert für die nächste Druckstufe zu benutzen. Bei flachem Verlauf der Phasengrenzkurven (∂ ln p/∂ ln T ) x < 2 ist es günstiger, statt des Drucks die emperatur vorzugeben [22]. Eine Diskussion der Gleichgewichtsberechnung mit Zustandsgleichungen findet man in [23]. Rechenprogramme sind in [24] enthalten. Eine weitere Anwendung von (3-34) ist die Berechnung der Zusammensetzung x1 , . . . , xK−1 und x1 , . . . , xK−1 sowie des Mengenverhältnisses β = n /(n + n ) der koexistierenden Phasen für einen gegebenen Zustandspunkt mit den Koordinaten T, p, und x1 , . . . , xk−1 in einem Zweiphasengebiet. Diese Aufgabe stellt sich z. B. beim Zerfall einer
F57
F58
F Technische Thermodynamik
Flüssigkeit in eine dampfförmige und eine flüssige Phase durch isotherme Druckabsenkung. Dieselbe Aufgabe ist zu lösen, um den Verlauf der Konoden für das Flüssig-flüssig-Gleichgewicht eines ternären Systems zu bestimmen. Die Arbeitsgleichungen ergeben sich aus der Verknüpfung von (3-34) mit dem Hebelgesetz (3-12) xi = βxi + (1 − β)xi = [β + Ki (1 − β)]xi mit 1 i K , xi = xi /[β + Ki (1 − β)] mit 1 i K
(3-38) (3-39)
und f =
K
xi /[β + Ki (1 − β)] − 1 = 0 .
(3-40)
i=1
Die Rechnung läuft in folgenden Schritten [25] ab: 1. Vorgabe von T , p und allen xi sowie Schätzung aller xi und des Mengenverhältnisses β. 2. Berechnung aller xi aus (3-38) 7 6 (3-41) xi = xi − βxi /(1 − β) . 3. Berechnung aller Ki in (3-34). 4. Berechnung von β aus (3-40), z. B. mit dem Newton-Verfahren. 5. Berechnung aller xi aus (3-39). 6. Rücksprung zu 2., falls sich ein xi über eine vorgegebene Schranke hinaus verändert hat. 7. Ende der Rechnung. Für die Konvergenz des Verfahrens bei der Berechnung ternärer Flüssig-flüssig-Gleichgewichte ist es vorteilhaft, die Iteration mit einem nicht mischbarem binären Randsystem zu beginnen. Dieses sei aus den Komponenten 1 und 2 zusammengesetzt. Bei der schrittweisen Erhöhung der Konzentration der Komponente 3 können die vorangegangenen Ergebnisse jeweils als Startwert dienen. Die Konzentrationen x1 , x2 und x3 in dem heterogenen Zustand sollten so gewählt werden, dass sich β ≈ 0,5 ergibt. Ein Rechenprogramm findet man in [24].
3.3 Gleichgewichte reagierender Gemische Wie in 1.3.2 gezeigt wurde, sind die nichtnegativen Stoffmengen n j im Gleichgewichtszustand eines Pphasigen Systems aus K chemisch reaktionsfähigen
Substanzen bestimmt durch K − R Gleichgewichtsbedingungen (1-66) für die unabhängigen Reaktionen, K · (P − 1) Bedingungen (1-61) für das stoffliche Gleichgewicht zwischen den Phasen und R unabhängige Elementbilanzen (1-64). Im Weiteren wird vorausgesetzt, dass Temperatur und Druck dem System von außen aufgeprägt werden. Die Gleichgewichtsbedingungen sind dann vorteilhaft als notwendige Bedingungen für das Minimum der freien Enthalpie des Systems aufzufassen. Zählt man chemisch gleiche Stoffe in verschiedenen Phasen als unterschiedliche Substanzen und versteht das Phasengleichgewicht als spezielle Form des chemischen Gleichgewichts, lässt sich die Gleichgewichtszusammensetzung durch N
μ j ν jr = 0
für 1 ≤ r ≤ N − R ,
(3-42)
j=1 N
ai j n j = niG i
für 1 ≤ i ≤ L
(3-43)
j=1
beschreiben. Dabei ist N die rechnerische Zahl von Substanzen im System, μ j das chemische Potenzial der Substanz j und ν jr ihre stöchiometrische Zahl in der r-ten unabhängigen Reaktion. Weiter bedeutet ai j die Menge des Elements i bezogen auf die Menge der Substanz j, n j die Stoffmenge dieser Substanz, niG i die Stoffmenge des Elements i, die in den Verbindungen des Systems enthalten ist, und L die Zahl der Elemente im System. Aufgrund der Stöchiometrie chemischer Reaktionen lassen sich die Stoffmengenänderungen Δn jr der beteiligten Substanzen j infolge des Ablaufs einer Reaktion r auf eine einzige mengenartige Variable, die Umsatzvariable ξr dieser Reaktion, zurückführen: Δn jr = ν jr ξr .
(3-44)
Da alle Reaktionen im System als Linearkombinationen der unabhängigen Reaktionen darstellbar sind, addieren sich die Δn jr dieser Reaktionen zu der gesamten Stoffmengenänderung Δn j einer Substanz. Mit einer gegebenen Anfangszusammensetzung niG j werden die N Stoffmengen n j = niG j +
N−R r=1
ν jr ξr
(3-45)
3 Phasen- und Reaktionsgleichgewichte
damit Funktionen von N − R Umsatzvariablen ξr . Wegen (1-63) erfüllt (3-45) die Elementbilanzen (3-43) für alle möglichen Werte ξr . Die Gleichgewichtsbedingungen (3-42) sondern hieraus die Werte aus, welche mit (1-46) die freie Enthalpie minimieren
ΔGRmr
∂G ≡ ∂ξr
= T, p
N ∂G j=1
=
N
∂n j
T, p
∂n j ∂ξr
μ j ν jr = 0 ,
T, p
(3-46)
j=1
d. h., die differentielle freie Reaktionsenthalpie ΔGRmr der unabhängigen Reaktionen zu null machen. Die konkrete Rechnung erfordert die Einführung von Gemischmodellen, welche die Stoffmengenabhängigkeit der chemischen Potenziale definieren. Berücksichtigt werden soll eine gasförmige und flüssige Mischphase in Koexistenz mit mehreren festen Phasen aus reinen Stoffen. Vernachlässigt man die Druckabhängigkeit chemischer Potenziale in kondensierten Phasen und sieht der Einfachheit halber von einer Formulierung mit rationellen Aktivitätskoeffizienten ab, folgt mit (2-119) und (2-124) iG ΔGRmr ΔGRmr = + ν jr ln(ϕ j x j p/p0 ) Rm T Rm T Gase j +
ν jr ln(γ j x j ) = 0
(3-47)
Flü j
mit 1 ≤ r ≤ N − R . Hierin ist
ΔGRmr
iG
≡
N
ν jr μ0 j (T, p0 )
(3-48)
j=1
=
N
N R iG ≡ ν jr H0 j (T, p0 ) ΔHmr
j=1
der Standardwert der molaren freien Reaktionsenthalpie der Reaktion r beim Druck p0 . Er ist wie jeder Standardwert einer Reaktionsgröße mit Reinstoffdaten gebildet und lässt sich nach (1-52) auf die Standardwerte der Reaktionsenthalpie und -entropie
R ΔS mr
iG
≡
N
ν jr S 0 j (T, p0 )
(3-49)
j=1
zurückführen, die ihrerseits aus der molaren Enthalpie H0 j und Entropie S 0 j aller an der Reaktion beteiligten Stoffe zu berechnen sind. Die beiden Summen in (3-47) erstrecken sich über die Bestandteile der gasförmigen und flüssigen Mischphasen, deren Realverhalten durch die Fugazitätskoeffizienten ϕ j und Aktivitätskoeffizienten γ j beschrieben wird. Durch Spezialisierung auf eine einzige Reaktion in einem idealen Gemisch erhält man das Massenwirkungsgesetz iG ν j ΔGRm − ν j ln(p/p0 ) ln x j = − Rm T Gase j = K(T, p) .
(3-50)
Das linksseitige Potenzprodukt von Stoffmengenanteilen hängt allein von Temperatur und Druck ab, wobei der Wert exp K(T, p) als Gleichgewichtskonstante bezeichnet wird. In der Regel steigert die Zugabe eines Reaktionspartners die Reaktionsausbeute der anderen Ausgangsstoffe. 3.3.1 Thermochemische Daten
Die nach 2.1.3 unbestimmten Konstanten in den Enthalpiefunktionen H0 j (T, p) können für chemisch reagierende Substanzen nicht beliebig vereinbart werden. Sie müssen vielmehr so abgestimmt sein, dass die Reaktionsenthalpie richtig wiedergegeben wird. Wegen (1-63) lässt sich der Standardwert einer Reaktionsenthalpie in der Gestalt ⎡ ⎤ ⎢⎢ ⎥⎥ ⎢ R iG ⎢ ΔHm = ν jr ⎢⎣H0 j − ai j H0i ⎥⎥⎥⎦ = ν jr H0Bj r
ν jr [H0 j (T, p0 ) − T S 0 j (T, p0 )]
und
j=1
j
i
j
(3-51)
schreiben. Der Klammerausdruck bedeutet dabei die im Prinzip messbare Standardreaktionsenthalpie für die Bildung der Substanz j aus den jeweils stabilsten Modifikationen der Elemente i mit der molaren Enthalpie H0 i und wird als molare Bildungsenthalpie H0B j bezeichnet. Für die Elemente ist
F59
F60
F Technische Thermodynamik
Tabelle 3-2. Molare Masse M, spezielle Gaskonstante R, spezifische isobare Wärmekapazität ciG p bzw. c p , molare Bildungsenthalpie HmB und molare absolute Entropie ausgewählter Substanzen im Standardzustand T 0 = 298,15 K und p0 = 1000 hPa [30] Stoff O2 H2 H2 O
M g/mol 31,9988 2,0159 18,0153
R kJ(kg · K) 0,25984 4,1245 0,46152
He Ne Ar Kr Xe F2 HF Cl2 HCl S SO2 SO3 H2 S N2 NO NO2 N2 O NH3 N2 H4 C
4,0026 20,179 39,948 83,80 131,29 37,9968 20,0063 70,906 36,461 32,066 64,065 80,064 34,082 28,0134 30,0061 46,0055 44,0128 17,0305 32,0452 12,011
2,0773 0,41204 0,20813 0,09922 0,06333 0,21882 0,41559 0,11726 0,22804 0,25929 0,12978 0,10385 0,24396 0,29680 0,27709 0,18073 0,18891 0,48821 0,25946 0,69224
CO CO2 CH4 CH3 OH
28,010 44,010 16,043 32,042
0,29684 0,18892 0,51826 0,25949
CF4 CCl4 CF3 Cl CF2 Cl2 CFCl3 COS HCN C2 H2 C2 H4 C2 H6 C2 H5 OH
88,005 70,014 104,459 120,914 137,369 60,075 27,026 26,038 28,054 30,070 46,069
0,094478 0,11875 0,079596 0,066764 0,060527 0,13840 0,30765 0,31932 0,29638 0,27651 0,18048
C3 H8 n-C4 H10 n-C5 H12 n-C6 H14 C6 H6 n-C7 H16 n-C8 H18
44,097 58,124 72,150 86,177 78,114 100,204 114,231
0,18955 0,14305 0,11524 0,09648 0,10644 0,08298 0,07279
ciG p bzw. c p kJ(kg · K) 0,91738 14,298 1,8638 4,179 5,1931 1,0299 0,5203 0,2480 0,1583 0,8238 1,4562 0,4782 0,7987 0,7061 0,5755 0,6329 1,0044 1,0397 0,9946 0,8086 0,8736 2,0586 3,085 0,7099 0,5089 1,0404 0,8432 2,009 2,55 1,370 0,6942 1,8818 0,6401 0,5976 0,8848 0,6910 1,327 1,687 1,553 1,750 2,419 1,420 1,667 1,699 2,377 2,263 1,742 2,242 2,224
B Hm kJ/mol 0 0 −241,818 −285,830 0 0 0 0 0 0 −271,1 0 −92,307 0 −296,83 −395,72 −20,63 0 90,25 33,18 82,05 −46,11 50,63 0 1,895 −110,525 −393,509 −74,81 −238,66 −200,66 −925 −135,44 −695 −477 −301,33 −142,09 135,1 226,73 52,26 −84,68 −277,69 −235,10 −103,9 −124,7 −173,1 −198,8 −49,0 −224,4 −250,0
iG Sm J/(mol · K) 205,138 130,684 188,825 69,91 126,150 146,328 154,843 164,082 169,683 202,78 173,779 223,066 186,908 31,80 248,22 256,76 205,79 191,61 210,76 240,06 219,85 192,45 121,21 5,740 2,377 197,674 213,74 186,264 126,8 239,81 261,61 216,40 285,29 300,77 225,35 231,57 201,78 200,94 219,56 229,60 160,7 282,7 270,0 310,1 262,7 296,0 173,2 328,0 361,2
Zustand g g g fl g g g g g g g g g rhomb. g g g g g g g g fl Graphit Diamant g g g fl g g fl g g fl g g g g g fl g g g fl fl fl fl fl
3 Phasen- und Reaktionsgleichgewichte
H0B j = 0. Um mit Reaktionsenthalpien konsistente Enthalpiekonstanten zu erhalten, setzt man daher die Enthalpien aller Substanzen in einem festgelegten Standardzustand (T 0 , p0 ) gleich ihren Bildungsenthalpien H0 j (T 0 , p0 ) =
H0Bj (T 0 ,
p0 ) .
(3-52)
Üblich ist der thermochemische Standardzustand mit T 0 = 298 , 15 K und p0 = 1000 hPa. Aus praktischen Gründen wird die Bildungsenthalpie statt auf die Elemente O, H, F, Cl, Br, I und N auf die stabileren zweiatomigen Verbindungen O2 , H2 , usw. als Basiskomponenten mit H0Bj = 0 bezogen. Bei der Verfügung über die Konstanten der Entropiefunktionen S 0 j (T, p) ist der dritte Hauptsatz zu berücksichtigen. Danach verschwindet die Entropie aller reinen Substanzen im inneren Gleichgewicht bei T = 0. In diesem Sinn normierte Entropien heißen absolute Entropien S 0iGj . Für die Gleichgewichtsberechnung hinreichend ist eine Normierung, die das Verschwinden der Standardreaktionsentropien bei T = 0 sicherstellt. In chemisch-thermodynamischen Tafelwerken [26–29] findet man Bildungsenthalpien, absolute Entropien oder äquivalente Funktionen im jeweiligen Standardzustand für eine große Zahl von Substanzen. Zusätzlich sind isobare molare oder spezifische Wärmekapazitäten angegeben. Sie erlauben, die Funktionen H0 j (T, p0 ) und S 0 j (T, p0 ) bei einer von der Standardtemperatur abweichenden Temperatur mithilfe der Zustandsgleichungen aus 2.1.3 zu berechnen. Zu berücksichtigen sind dabei die Umwandlungsenthalpien und -entropien beim Schmelzen und Verdampfen. Den prinzipiellen Aufbau solcher Tafeln zeigt Tabelle 3-2. Vorsicht ist geboten bei der Benutzung von Daten aus unterschiedlichen Tafelwerken. Gegebenenfalls sind Standardzustand und Normierung auf eine einheitliche Basis umzurechnen, z. B., wenn statt der Standardentropie Bildungswerte der freien Enthalpie GB0j mit GB0j (T 0 , P0 ) = 0 für die Elemente oder Basiskomponenten vertafelt sind. 3.3.2 Gleichgewichtsalgorithmus
Villars, Cruise und Smith [31] haben einen Algorithmus entwickelt, der (3-47) mithilfe des Newtons-
Verfahrens nach den Gleichgewichtswerten ξr der Umsatzvariablen löst. Ausgangspunkt ist eine Linearisierung von (3-47) nach den Umsatzvariablen an einer Stelle ξ0 N−R ΔGRmr + ∂ΔGRmr /∂ξk Δξk = 0 ξ0
k=1
ξ0
für 1 ≤ r ≤ N − R ,
(3-53)
wobei die wiederholte Auflösung nach Δξk eine Folge verbesserter Werte für die Umsätze ergibt, bis der Gleichgewichtszustand gefunden ist. Um einfache Arbeitsgleichungen zu erhalten, werden in der Koeffizientenmatrix mit den Elementen Grk ≡ ∂ΔGRmr /∂ξk = ∂2G/(∂ξr ∂ξk )
(3-54)
die Konzentrationsabhängigkeit der Fugazitäts -und Aktivitätskoeffizienten vernachlässigt und die Realkorrekturen nach dem Stand der Rechnung allein in ΔGRmr berücksichtigt. Wählt man als unabhängige Reaktionen N − R Bildungsreaktionen, welche aus R Basiskomponenten mit den Indizes 1 ≤ J ≤ R N − R abgeleitete Komponenten mit den Indizes R + 1 ≤ j ≤ N erzeugen, so folgt aus (3-47) R ν jr ν jk ∗ Grk δrk ∗ = δr+R,α + δ Rm T nr+R n j j,α j=1
−
¯G ν¯ G ν¯ Fr ν¯ Fk r ν k − . nF nG
(3-55)
Dabei ist δrk das Kronecker-Symbol mit δrk = 1 für r = k und δrk = 0 für r k. In Anlehnung hieran ist δ∗j, α = 1, wenn der Stoff j Bestandteil der gasförmigen oder flüssigen Mischphase ist; andernfalls ist δ∗j, α = 0. Die Summe der stöchiometrischen Koeffizienten der gasförmigen Reaktionspartner in der r-ten Reaktion ist mit ν¯ G r , die der flüssigen Reaktionspartner mit ν¯ Fr bezeichnet. Die Größen nG und nF bedeuten die gesamte Stoffmenge der Gas- und Flüssigkeitsphase. Fehlt eine der Mischphasen, entfällt der zugehörige Term ν¯ r ν¯ k /n. Benutzt man als Basiskomponenten Stoffe, die im Gleichgewichtszustand des Systems in den größten Mengen vorhanden sind, überwiegt in (3-55) der erste Summand. Damit vereinfacht sich die Koeffizientenmatrix von (3-53) in guter Näherung zu einer Diagonalmatrix, die positiv definit ist,
F61
F62
F Technische Thermodynamik
und man erhält für die Korrekturen der Umsatzvariablen ⎡ ∗ R ν2 ⎢⎢⎢ δr+R, α jr ∗ (m) ⎢ ⎢ + δ Δξr = − ⎢⎣ nr+R n j j, α j=1
−
ν¯ G r
2
nG
2 ⎤−1 ν¯ Fr ⎥⎥⎥⎥ ΔGRmr . − F ⎥⎥⎥⎥ n ⎦ Rm T ξ(m)
(3-56)
ξ(m)
Die zugehörigen Stoffmengen werden aus (3-45) unter Einführung eines Schrittweitenparameters ω(m) berechnet (m) (m) = n(m) n(m+1) j j + ω Δn j
Δn(m) j
mit
=
N−R
ν jr Δξr(m) .
(3-57)
r=1
Dieser wird so bestimmt, dass unter der Bedingung nicht negativer Stoffmengen die freie Enthalpie des Systems in der durch (3-56) gegebenen Richtung im Bereich 0 ≤ ω(m) ≤ 1 minimal wird (m)
(m) ω(m) = min ωopt − n(m) j /Δn j j
für
1≤ j≤N
und Δn(m) j 0 führt das Verfahren bei ω = 0 stets in eine Richtung abnehmender freier Enthalpie. Unter Anwendung der Regula falsi bei einem Vorzeichenwechsel von ∂G/∂ω im Bereich 0 ≤ ω ≤ 1 setzt man daher ⎧ ∂G ⎪ ⎪ ⎪ 0 ⎩ ∂ω ω=1 (3-60)
Aus (3-58) ergeben sich sehr kleine Schrittweiten, wenn Stoffe nur in Spuren vorhanden sind. Für solche Stoffe wird losgelöst von der Hauptrechnung eine Mengenkorrektur nach der Beziehung (m) R n(m+1) = n exp −ΔG /(R T ) (3-61) m mr r+R r+R empfohlen. Die differentielle freie Bildungsenthalpie ΔGRmr der Spurenstoffe bezüglich Basiskomponenten wird dabei durch eine Änderung von ln nr+R bei Konstanz der übrigen Stoffmengen und Realkorrekturen zu null gemacht. Stoffe mit einer auf null geschrumpften Substanzmenge können aus der Rechnung herausgenommen werden, solange ihre differentielle freie Bildungsenthalpie ΔGRmr bezüglich der Basiskomponenten positiv bleibt. Dieser Fall tritt in Zusammenhang mit kondensierten Reinstoffphasen häufig auf. Damit ergibt sich folgender Rechengang: 1. Schätzen einer Gleichgewichtszusammensetzung für die vorgegebenen Systemparameter. 2. Auswahl oder Korrektur eines Satzes von Basiskomponenten mit den größten Stoffmengen. 3. Berechnung von Korrekturen Δξr der Umsatzvariablen nach (3-56). 4. Berechnung neuer Stoffmengen nach (3-57) bzw. (3-61). 5. Rücksprung zu 2., falls max |GRmr /(Rm T )| eine vorgegebene Schranke übersteigt. 6. Ende der Rechnung. Die Minimierung der freien Enthalpie unter Einführung des Schrittweitenparameters macht den Algorithmus frei von Konvergenzproblemen. Im Fall realer Lösungen braucht das Minimum der freien Enthalpie jedoch nicht eindeutig zu sein. 3.3.3 Empfindlichkeit gegenüber Parameteränderungen
Parameter βi einer berechneten Gleichgewichtszusammensetzung sind die Temperatur T , der Druck p und die Stoffmengen niG j im Anfangszustand des Systems sowie die thermochemischen Daten in Gestalt des chemischen Potenzials μ0 j (T, p) seiner reinen Komponenten. Bei Wahrung des Gleichgewichts bewirkt eine Änderung eines Parameters βi eine Änderung der Zusammensetzung des Systems
3 Phasen- und Reaktionsgleichgewichte
derart, dass die differentielle freie Reaktionsenthalpie ΔGRmr der unabhängigen Reaktionen nach (3-46) gleichbleibend den Wert null behält und das totale Differenzial dieser Funktionen in den Variablen ξ, βi und niG j (βi ) verschwindet. Diese Bedingung ergibt für die Parameterempfindlichkeit der Umsatzvariablen ∂ξk /∂βi das lineare Gleichungssystem [32] N−R k=1
−
∂G ∂ξr ∂ξk 2
βi , niG j
∂ξk =− ∂βi
l=1
∂nl
∂βi
(3-62)
für 1 ≤ r ≤ N − R . Alle Ableitungen sind für den gegebenen Gleichgewichtszustand einzusetzen, der eine positiv definite Koeffizientenmatrix verbürgt. Für die Parameterabhängigkeit der Gleichgewichtszusammensetzung folgt daraus mit (3-45) (∂n j /∂βi ) = (∂niG j /∂βi ) +
N−R
ν jr (∂ξr /∂βi ) . (3-63)
r=1
Der erste Term hat dabei für βi = niG j den Wert eins und ist andernfalls null. Die rechte Seite von (3-62) lässt sich mithilfe der Ableitungen (1-50) und (1-51) des chemischen Potenzials sowie der Gleichgewichtsbedingung (3-46) in Verbindung mit (3-45) für die verschiedenen Realisierungen des Parameters βi auswerten. Das Ergebnis ist in Tabelle 3-3 zusammengefaßt. R Dabei bedeuten ΔHmr ≡ (∂H/∂ξr )T, p die differentiR ≡ (∂V/∂ξr )T, p das elle Reaktionsenthalpie und ΔVmr differentielle Reaktionsvolumen der Reaktion r, während mit H j und V j die partielle molare Enthalpie und Tabelle 3-3. Rechte Seite von (3-63) für verschiedene
Realisierungen des Parameters βi βi T
Rechte Seite von (3-63) N R ΔHmr /T = ν jr H j /T
p
R −ΔVmr N
niG j
−
μ0 j
−ν jr
t=1
=−
j=1 N
j=1
ν jr V j
νlr (∂μl /∂n j )T, p, l j
C p = (∂H/∂T ) p, n j +
N
H j (∂n j /∂T ) .
(3-64)
j=1
ξ, niG j
⎛ ⎞ ⎛ ⎞ ⎜⎜⎜ ∂nl ⎟⎟⎟ ⎜⎜⎜ ∂niG ⎟ ⎜⎝ iG ⎟⎠ ⎜⎝ l ⎟⎟⎟⎠ ∂βi T, p, n j1 ∂nl ξ
N ΔGR mr
ΔGRmr
das partielle molare Volumen der Komponente j bezeichnet sind. Im Allgemeinen muss (3-62) numerisch gelöst werden, was mit (3-63) z. B. die Berechnung der isobaren Wärmekapazität eines reagierenden Gemisches im Gleichgewicht erlaubt
Im Fall einer einzigen Reaktion in einem idealen Gemisch sind allgemeine Aussagen über die Auswirkungen von Parameteränderungen möglich. Aus (2-96) bzw. (2-126), die H j = H0 j zur Folge haben, findet man mit (3-45) für die Temperaturabhängigkeit der Umsatzvariablen N
∂ξ = ∂T
j=1
ν j H0 j (T, p) ⎡ 2 ⎤−1 ⎢⎢⎢ N ⎥⎥⎥ ¯ ν ν l ⎢⎢⎣ nl ⎥⎥ , (3-65) − 2 nl n ⎦ Rm T l=1
wobei ν¯ = ν j und n = n j gesetzt ist. Die zugehörige Stoffmengenänderung folgt aus (3-63) mit N − R = 1. Nach diesem auf van’t Hoff zurückgehenden Ergebnis wird die Produktbildung (ν j > 0) endothermer Reaktionen mit ΔHmR > 0 durch eine Temperaturerhöhung gefördert, die exothermer Reaktionen mit ΔHmR < 0 dagegen zurückgedrängt. Die Druckabhängigkeit der Umsatzvariablen ergibt sich wegen V j = V0 j zu N
ν j V0 j (T, p) ⎡ 2 ⎤−1 ⎢⎢⎢ N ⎥⎥⎥ j=1 ¯ ν ν ∂ξ l ⎢⎢⎣ nl ⎥⎥ , =− − ∂p Rm T nl n ⎦ l=1 (3-66)
sodass hoher Druck den Umsatz von Reaktionen mit Volumenabnahme und damit die Bildung großer Moleküle bei allen Gasreaktionen mit V0 j = Rm T/p begünstigt. Die Abhängigkeit der Umsatzvariablen von der Ausgangszusammensetzung folgt mit niG = niG j zu iG ν¯ niG ∂ξ j − ν jn = n jn ∂niG j
⎡ N 2 ⎤−1 ⎢⎢⎢ ⎥ ⎢⎢⎣ nl νl − ν¯ ⎥⎥⎥⎥⎦ . (3-67) n n l l=1
Für einen Ausgangsstoff mit ν j < 0 ist ∂ξ/∂niG j im Fall ν¯ > 0 stets positiv, sodass eine Vergrößerung
F63
F64
F Technische Thermodynamik
¯ < 0 kann von niG j den Umsatz erhöht. Im Fall ν der Zähler von (3-67) das Vorzeichen wechseln. Dann gibt es für die Menge von niG j einen umsatzoptimalen Wert, der durch die Nullstelle des Zählers beschrieben wird. Weitere Zugabe des Ausgangsstoffes j schmälert den Umsatz [32]. Die Empfindlichkeit der Umsatzvariablen gegenüber Datenfehlern ist schließlich durch νj ∂ξ =− ∂μ0 j Rm T
⎡ N 2 ⎤−1 ⎢⎢⎢ ⎥⎥⎥ ¯ ν ν l ⎥⎥ − ⎢⎢⎣ nl nl n ⎦ l=1
(3-68)
gegeben. Die Fehler wirken sich besonders stark bei Substanzen mit großen Beträgen |ν j | der stöchiometrischen Zahlen aus.
4 Energie- und Stofftransport in Temperaturund Konzentrationsfeldern Die Thermodynamik beschreibt den mechanischen, thermischen und stofflichen Gleichgewichtszustand eines Systems unter vorgegebenen Randbedingungen und ggf. Restriktionen, vgl. Kap. 1.4. Von besonderer Bedeutung ist die Berechnung der Zusammensetzung der Phasen im Phasen- und Reaktionsgleichgewicht, vgl. Kap. 3. Diese Gleichgewichtszustände strebt das System, ausgehend von einem beliebigen gegebenen Ausgangszustand, von selbst an. Von technischem Interesse ist zusätzlich die Frage, mit welcher Intensität, in welcher Zeit sich das System in den entsprechenden Gleichgewichtszustand entwickelt. Die Geschwindigkeit, mit der Energie und stoffliche Bestandteile in einem System transportiert werden, hängt von der Verteilung der Temperatur und der chemischen Potenziale in Verbindung mit den thermophysikalischen Transporteigenschaften des Systems ab. Die bisherige vereinfachende Betrachtung von Phasen mit homogen verteilten Zustandsgrößen muss hierbei zu Gunsten von Feldgrößen aufgegeben werden. Die in diesem Kapitel behandelte Transportkinetik ist für die Berechnung der notwendigen Verweilzeiten und für die Dimensionierung von Apparaten grundlegend.
4.1 Konstitutive Gleichungen Inhomogenitäten der Temperatur rufen einen Wärmetransport durch Leitung und Strahlung hervor, während ungleich verteilte chemische Potenziale einen diffusiven Stofftransport verursachen, siehe B 9.2 ff. und B 20.2. Bei der Wärmeleitung und Diffusion wird jedes Volumenelement nur durch seine Nachbarn, bei der Strahlung dagegen durch das gesamte Feld beeinflußt. Strahlung ist deshalb getrennt zu behandeln. Hier folgen zunächst die Stoffgesetze oder konstitutiven Gleichungen für Wärmeleitung und Diffusion. 4.1.1 Fourier’sches Gesetz
In Gasen und Flüssigkeiten ist die Wärmeleitung auf die molekulare Bewegung, in Festkörpern auf Gitterschwingungen und in Metallen zusätzlich auf bewegliche Leitungselektronen zurückzuführen. Makroskopisch lässt sich die Wirkung dieser Mechanismen durch einen mit dem Ort z und der Zeit τ veränderlichen Wärmestromdichtevektor q˙ = q˙ (z, τ) in der SI-Einheit W/m2 beschreiben. Die Projektion q˙ · n des Wärmestromdichtevektors auf die Einheitsnormale n eines beliebig im Raum orientierten Flächenelementes dA liefert den flächenbezogenen Wärmestrom in Richtung der Normalen. Für den durch die Fläche dA geleiteten Wärmestrom gilt dQ˙ = ( q˙ · n)dA = | q˙ | cos β dA ,
(4-1)
wobei β nach Bild 4-1 den Winkel zwischen den Vektoren q˙ und n bedeutet. Durch das empirisch begründete Fourier’sche Gesetz wird der Wärmestromdichtevektor auf den
Bild 4-1. Flächenelement dA mit Normalenvektor n und
Wärmestromdichtevektor q˙
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
Gradienten des Temperaturfeldes T (z, τ) in einem wärmeleitenden Medium zurückgeführt. Unberücksichtigt bleibt dabei der sog. Dufour-Effekt [1], wonach auch Konzentrations- und Druckgradienten einen Beitrag zur Wärmestromdichte liefern. Dieser Koppeleffekt spielt aber nur bei sehr großen Gradienten eine Rolle und soll im weiteren vernachlässigt werden. Für isotropes Material lautet das Fourier’sche Gesetz: q˙ = −λ grad T .
(4-2)
Es fordert mit der skalaren Wärmeleitfahigkeit λ > 0 in der SI-Einheit W/(m · K) einen Wärmefluss in Richtung des größten Temperaturgefälles. Für aniso-
trope Stoffe wie Holz tritt an die Stelle der skalaren Größe λ ein symmetrischer, positiv definiter Tensor zweiter Stufe [2], sodass Wärmestromdichtevektor und Temperaturgradient nicht mehr kollinear sind. Die Konsistenz des Fourier’schen Gesetzes mit dem 2. Hauptsatz wird in 4.2.4 gezeigt. Bemerkenswert ist die Analogie zwischen Fourier’schem und Ohm’schen Gesetz. Wärmestromdichte, Wärmeleitfahigkeit und Temperatur entsprechen der elektrischen Stromdichte, der elektrischen Leitfähigkeit und der elektrischen Spannung. Die Wärmeleitfähigkeit λ ist eine Materialeigenschaft, die vom örtlichen Zustand, d. h. von Temperatur, Druck und Zusammensetzung, abhängt und durch
Tabelle 4-1. Stoffwerte von Luft beim Druck p = 1 bar [5]
t ◦
C −200 −180 −160 −140 −120 −100 −80 −60 −40 −20 0 20 40 80 100 120 140 160 180 200 300 400 500 600 700 800 900 1000
kg/m3 5,106 3,851 3,126 2,639 2,287 2,019 1,807 1,636 1,495 1,377 1,275 1,188 1,112 0,9859 0,9329 0,8854 0,8425 0,8036 0,7681 0,7356 0,6072 0,5170 0,4502 0,3986 0,3576 0,3243 0,2967 0,2734
cp kJ/(kg · K) 1,186 1,071 1,036 1,010 1,014 1,011 1,009 1,007 1,007 1,007 1,006 1,007 1,007 1,010 1,012 1,014 1,016 1,019 1,022 1,026 1,046 1,069 1,093 1,116 1,137 1,155 1,171 1,185
β 10−3 /K 17,24 11,83 9,293 7,726 6,657 5,852 5,227 4,725 4,313 3,968 3,674 3,421 3,200 2,836 2,683 2,546 2,422 2,310 2,208 2,115 1,745 1,486 1,293 1,145 1,027 0,9317 0,8523 0,7853
λ 10−3 W/(m · K) 6,886 8,775 10,64 12,47 14,26 16,02 17,74 19,41 21,04 22,63 24,18 25,69 27,16 30,01 31,39 32,75 34,08 35,39 36,68 37,95 44,09 49,96 55,64 61,14 66,46 71,54 76,33 80,77
ν 10−7 m2 /s 9,786 17,20 25,58 35,22 46,14 58,29 71,59 85,98 101,4 117,8 135,2 153,5 172,6 213,5 235,1 257,5 280,7 304,6 329,3 354,7 491,8 645,1 813,5 996,3 1193 1402 1624 1859
a 10−7 m2 /s 11,37 21,27 32,86 46,77 61,50 78,51 97,30 117,8 139,7 163,3 188,3 214,7 242,4 301,4 332,6 364,8 398,0 432,1 467,1 503,0 694,3 903,8 1131 1375 1635 1910 2197 2492
Pr 1 0,8606 0,8086 0,7784 0,7530 0,7502 0,7423 0,7357 0,7301 0,7258 0,7215 0,7179 0,7148 0,7122 0,7083 0,7070 0,7060 0,7054 0,7050 0,7049 0,7051 0,7083 0,7137 0,7194 0,7247 0,7295 0,7342 0,7395 0,7458
F65
F66
F Technische Thermodynamik
Messungen oder eine mikroskopische Theorie fluider oder fester Stoffe [3, 4] bestimmt werden muss. Die Druckabhängigkeit spielt bei Feststoffen keine Rolle. Daten für die Wärmeleitfähigkeit ausgewählter Stoffe enthalten die Tabellen 4-1 bis 4-4 in Verbindung mit Werten der Dichte , der isobaren spezifischen Wärmekapazität c p und anderer, später zu erläuternder thermophysikalischer Größen. Entsprechende Angaben für weitere Stoffe sind in [6] zu finden, für Kältemittel wird auf [7] verwiesen, und Korrelationen für fluide Gemische sind in [8, 9] aufgeführt. Die Wärmeleitfahigkeit nimmt von den Metallen über nichtmetallische Feststoffe und Flüssigkeiten bis zu den Gasen von ca. 100 auf ca. 0,01 W/(m · K) um vier Zehnerpotenzen ab. Die Werte gut leitender Metalle werden durch Verunreinigungen besonders bei tiefen Temperaturen deutlich herabgesetzt. Geschäumte Kunststoffe wirken in erster Linie wegen ihrer Gaseinschlüsse wärmedämmend. 4.1.2 Maxwell-Stefan’sche Gleichungen und Fick’sches Gesetz
w ≡
i wi
(4-3)
c¯ i wi ,
(4-4)
i=1
und c¯ u ≡
K
ji ≡ i (wi − w) mit
i=1
wobei = m/V die Dichte des Gemisches, i = mi /V die Partialdichte der Komponente i, c¯ = n/V die Stoffmengenkonzentration des Gemisches, c¯ i = ni /V die Stoffmengenkonzentration der Komponente i und K
K
ji = 0
(4-5)
i=1
und die Diffusionsstoffmengenstromdichte bezogen auf die mittlere molare Geschwindigkeit J i ≡ c¯ i (wi − u)
Der diffusive Stofftransport in Gemischen beruht auf einer Relativbewegung zwischen den vorhandenen Teilchen. Makroskopisch bilden die Teilchenarten Ai sich gegenseitig durchdringende Kontinua, die sich mit unterschiedlichen Geschwindigkeiten wi bewegen. Für das Gemisch als Ganzes lassen sich verschiedene mittlere Geschwindigkeiten [10] erklären. Die wichtigsten sind die Schwerpunktsgeschwindigkeit w, die nach E 8.3.1 in der Kontinuitätsund Impulsgleichung strömender Fluide auftritt, und die mittlere molare Geschwindigkeit u. Die impliziten Definitionen lauten K
die Zahl der Komponenten im Gemisch bedeuten. Die Masse und Stoffmenge des Gemisches und der Komponenten sind dabei mit m und n bzw. mi und ni bezeichnet; V ist das Volumen des Gemisches. Die Diffusionsgeschwindigkeit einer Komponente i ist ihre Relativgeschwindigkeit gegenüber einer festzulegenden mittleren Geschwindigkeit des Gemisches. Hiermit verknüpft ist eine Diffusionsstromdichte, welche eine durch die Diffusionsgeschwindigkeit bedingte Flussdichte beschreibt. Verschiedene Varianten der vom Ort z und der Zeit τ abhängigen, vektorwertigen Diffusionsstromdichte sind möglich. Geläufig sind die Diffusionsmassenstromdichte bezogen auf die Schwerpunktsgeschwindigkeit
mit
K
Ji = 0 ,
(4-6)
i=1
die sich wegen (4-3) und (4-4) für die einzelnen Komponenten jeweils zu null summieren. Beide Größen lassen sich ineinander umrechnen [10]. Für die vektorielle, orts- und zeitabhängige Massen- und Stoffmengenstromdichte einer Komponente i erhält man ˙ + ji = i w + ji m ˙ i = ξ¯i m
(4-7)
n˙ i = xi n˙ + J i = c¯ i u + ji
(4-8)
bzw.
mit ξ¯i und xi als dem lokalen Massen- und Stoffmengenanteil der Komponente i sowie m ˙ = w und n˙ = c¯ u als den entsprechenden Massen- und Stoffmengenstromdichten des gesamten Gemisches. In idealen Gasgemischen lassen sich die Diffusionsstromdichten der Komponenten durch die Maxwell-Stefan’schen Gleichungen [11] auf Gradienten von Diffusionspotenzialen und der Temperatur zurückführen. Dieses Ergebnis der kinetischen Theorie ist mit wenigen Postulaten auf nichtideale Gemische verallgemeinert worden [12]. Gefor-
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
Tabelle 4-2. Stoffwerte von Wasser im Sättigungszustand vom Tripelpunkt bis zum kritischen Punkt [5]
t ◦
C 0,01 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 250 300 350 373,976
p bar 0,006117 0,012281 0,023388 0,042455 0,073814 0,12344 0,19932 0,31176 0,47373 0,70117 1,0132 1,4324 1,9848 2,7002 3,6119 4,7572 6,1766 7,9147 10,019 12,542 15,536 39,736 85,838 165,21 220,55
kg/m3 999,78 999,69 998,19 995,61 992,17 987,99 983,16 977,75 971,79 965,33 958,39 951,00 943,16 934,88 926,18 917,06 907,50 897,51 887,06 876,15 864,74 799,07 712,41 574,69 322,00
kg/m3 0,004855 0,009404 0,01731 0,03040 0,05121 0,08308 0,13030 0,19823 0,29336 0,42343 0,59750 0,82601 1,1208 1,4954 1,9647 2,5454 3,2564 4,1181 5,1539 6,3896 7,8542 19,956 46,154 113,48 322,00
cp kJ/(kg · K) 4,229 4,188 4,183 4,183 4,182 4,182 4,183 4,187 4,194 4,204 4,217 4,232 4,249 4,267 4,288 4,312 4,339 4,369 4,403 4,443 4,489 4,857 5,746 10,13 ∞
dert wird die Invarianz der durch die Diffusion verursachten Entropieerzeugung gegenüber der Bezugsgeschwindigkeit der Diffusionsstromdichte. Zugleich wird ein linearer Zusammenhang zwischen der Schlupfgeschwindigkeit wi − w j zweier Komponenten und dem Gefälle der zugeordneten Potenziale angenommen. Der Beitrag des Temperaturgradienten zu den Diffusionsstromdichten, auch Thermodiffusion oder Soret-Effekt genannt, ist nur bei Anwendungen mit schroffen Temperaturänderungen, z. B. der Ablationskühlung, von Bedeutung. Im Folgenden wird der Soret-Effekt wie bereits der Dufour-Effekt als schwache Kopplung zwischen Diffusion und Wärmeleitung vernachlässigt. Mit dieser Vereinfachung lauten die Maxwell-Stefan’schen Gleichungen, in die keine Bezugsgeschwindigkeit
cp kJ/(kg · K) 1,868 1,882 1,882 1,892 1,904 1,919 1,937 1,958 1,983 2,011 2,044 2,082 2,126 2,176 2,233 2,299 2,374 2,460 2,558 2,670 2,797 3,772 5,981 16,11 ∞
β
−3
10 /K −0,08044 0,08720 0,2089 0,3050 0,3859 0,4572 0,5222 0,5827 0,6403 0,6958 0,7501 0,8038 0,8576 0,9123 0,9683 1,026 1,087 1,152 1,221 1,296 1,377 1,955 3,273 10,37 ∞
β 10−3 /K 3,672 3,548 3,435 3,332 3,240 3,156 3,083 3,018 2,964 2,929 2,884 2,860 2,846 2,844 2,855 2,878 2,916 2,969 3,039 3,128 3,238 4,245 7,010 22,12 ∞
r kJ/kg 2500,5 2476,9 2453,3 2429,7 2405,9 2381,9 2357,6 2333,1 2308,1 2282,7 2256,7 2229,9 2202,4 2174,0 2144,6 2114,1 2082,3 2049,2 2014,5 1978,2 1940,1 1715,4 1404,7 893,03 0
eingeht, in drei gleichwertigen Formulierungen [13] K xi x j (wi − w j ) xi grad A∗i =− D R T i j m j=1 K x j J i − xi J j xi grad A∗i =− c ¯ D R T i j m j=1 K x n ˙ j j ˙ i − xi n j=1
c¯ Di j
=−
xi grad A∗i Rm T
⎫ ⎪ (4-9) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ 1≤i≤ K−1 ⎪ ⎪ ⎪ ⎪ ⎪ (4-10) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭ (4-11)
Dabei ist Di j = D ji der verallgemeinerte MaxwellStefan’sche Diffusionskoeffizient für das Komponentenpaar i und j mit der SI-Einheit m2 /s und einem Wert Di j > 0, der in idealen Gasgemischen nicht von der Konzentration abhängt. Weiter bedeutet Rm die
F67
F68
F Technische Thermodynamik
Tabelle 4-2. Fortsetzung
t ◦
C 0,01 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 250 300 350 373,976
λ 10 W/(m · K) 561,0 580,0 598,4 615,4 630,5 643,5 654,3 663,1 670,0 675,3 679,1 681,7 683,2 683,7 683,3 682,1 680,0 677,1 673,4 668,8 663,4 621,4 547,7 447,6 141,9 −3
λ 10 W/(m · K) 17,07 17,62 18,23 18,89 19,60 20,36 21,18 22,07 23,01 24,02 25,09 26,24 27,46 28,76 30,14 31,59 33,12 34,74 36,44 38,23 40,10 51,23 69,49 134,6 141,9 −3
ν ν 2 mm /s mm2 /s 1,792 1898,0 1,307 1006,0 1,004 562,0 0,8012 329,3 0,6584 201,3 0,5537 127,8 0,4746 83,91 0,4132 56,80 0,3648 39,51 0,3258 28,17 0,2941 20,53 0,2680 15,27 0,2462 11,56 0,2278 8,894 0,2123 6,946 0,1991 5,496 0,1877 4,402 0,1779 3,565 0,1693 2,915 0,1619 2,405 0,1554 2,001 0,1329 0,8766 0,1207 0,4257 0,1146 0,2098 0,1341 0,1341
universelle Gaskonstante und A∗i
= grad(μi )T,p ⎡ ⎤ K 4 ⎢⎢⎢ ⎥⎥⎥ Mi 5 ⎢ Vm grad p − Mi ⎢⎢⎣ f i − + Vi − ξ¯ j f j ⎥⎥⎥⎦ M j=1
grad
(4-12)
den Gradienten des Diffusionspotenzials A∗i
der Kom-
ponente i. Wegen (1-34) gilt k
xi grad A∗i = 0 ,
(4-13)
i=1
d. h., nur K − 1 Gleichungen sind linear unabhängig. Im Einzelnen bezeichnen in (4-12) grad (μi )T, p den isotherm-isobaren Gradienten des chemischen Potenzials der Komponente i, Vi , und Mi das partielle molare Volumen und die molare Masse der Komponente i,
a a Pr 2 2 mm /s mm /s 1 0,1327 1883,0 13,51 0,1385 999,8 9,434 0,1433 559,6 7,005 0,1478 328,3 5,422 0,1519 200,9 4,333 0,1558 127,7 3,555 0,1591 83,92 2,983 0,1620 56,85 2,551 0,1644 39,56 2,219 0,1664 28,20 1,958 0,1680 20,55 1,750 0,1694 15,26 1,582 0,1705 11,53 1,444 0,1714 8,840 1,329 0,1720 6,869 1,234 0,1725 5,399 1,154 0,1727 4,285 1,087 0,1727 3,430 1,030 0,1724 2,764 0,9822 0,1718 2,241 0,9423 0,1709 0,825 0,9093 0,1601 0,6804 0,8299 0,1338 0,2517 0,9018 0,07692 0,07365 1,490 0 0 ∞
Pr 1 1,008 1,006 1,004 1,003 1,002 1,001 1,000 0,9992 0,9989 0,9989 0,9994 1,001 1,003 1,006 1,011 1,018 1,027 1,039 1,055 1,073 1,096 1,288 1,691 2,849 ∞
σ 10−3 N/m 75,65 74,22 72,74 71,20 69,60 67,95 66,24 64,49 62,68 60,82 58,92 56,97 54,97 52,94 50,86 48,75 46,60 44,41 42,20 39,95 37,68 26,05 14,37 3,675 0
Vm und M das molare Volumen und die molare Masse des gesamten Gemisches, p den Druck und f i die auf die Masse bezogene Kraft, die von äußeren Feldern auf die Komponente i ausgeübt wird. Der Beitrag des Druckgradienten in (4-12) hat bei der Diffusion in porösen Körpern oder bei der Sedimentation im Schwere- und Zentrifugalfeld einen entscheidenden Einfluß, wobei sich aus der Bedingung grad A∗i = 0 die Konzentrationsverteilung im Gleichgewicht herleiten lässt [14]. Der letzte Term ist nur dann von null verschieden, wenn die Komponenten wie in Elektrolytlösungen verschiedenen Kraftfeldern unterliegen. Die Schwerkraft liefert keinen Beitrag. In den meisten verfahrenstechnischen Anwendungen dominiert der erste Summand. Im Folgenden wird daher allein die Diffusion aufgrund von Konzentrationsdifferenzen behandelt.
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
Tabelle 4-3. Thermophysikalische Eigenschaften nichtmetallischer fester Stoffe bei 20 ◦ C [5]
Stoff Acrylglas (Plexiglas) Asphalt Bakelit Beton Eis (0 ◦ C) Erdreich, grobkiesig Sandboden, trocken Sandboden, feucht Tonboden Fett Glas, FensterSpiegelQuarzThermometerGips Granit Korkplatten Marmor Mörtel Papier Polyethylen Polyamide Polytetrafluorethylen (PTFE) PVC Porzellan (95 ◦ C) Steinkohle Tannenholz (radial) Verputz Zelluloid Ziegelstein
103 kg/m3 1,18 2,12 1,27 2,1 0,917 2,04 1,65 1,75 1,45 0,91 2,48 2,70 2,21 2,58 1,00 2,75 0,19 2,6 1,9 0,7 0,92 1,13 2,20 1,38 2,40 1,35 0,415 1,69 1,38 1,6. . . 1,8
c kJ/(kg · K) 1,44 0,92 1,59 0,88 2,04 1,84 0,80 1,00 0,88 1,93 0,70 0,80 0,73 0,78 1,09 0,89 1,88 0,80 0,80 1,20 2,30 2,30 1,04 0,96 1,08 1,26 2,72 0,80 1,67 0,84
Mit dem Ansatz (2-138) für das chemische Potenzial der Komponente i erhält man zunächst K−1 xi grad (μi )T, p = Γi j grad x j = (Γ grad x)i . Rm T j=1 (4-14) Für die (K − 1)-dimensionale quadratische Matrix Γ gilt dabei ∂ ln γi (x1 , x2 , . . . , xK−1 ) . Γ i j = δ i j + xi ∂x j T, p, xk j (4-15)
λ W/(m · K) 0,184 0,70 0,233 1,0 2,25 0,52 0,27 0,58 1,28 0,16 0,87 0,76 1,40 0,97 0,51 2,9 0,041 2,8 0,93 0,12 0,35 0,29 0,23 0,15 1,03 0,26 0,14 0,79 0,23 0,38. . . 0,52
a mm2 /s 0,108 0,36 0,115 0,54 1,203 0,14 0,20 0,33 1,00 0,091 0,50 0,35 0,87 0,48 0,47 1,18 0,115 1,35 0,61 0,14 0,17 0,11 0,10 0,11 0,40 0,15 0,12 0,58 0,10 0,28. . . 0,34
Eine Auswertung von Γi j für verschiedene Aktivitätskoeffizientenmodelle γi (x) nach 2.2.3 findet man in [15]. Für ideale Gemische geht Γ in die Einheitsmatrix I über. Die Komponenten des Vektors x sind die Stoffmengenanteile der ersten K − 1 Stoffkomponenten x = (x1 , x2 , . . . , xK−1 )T .
(4-16)
Die praktisch benötigten Diffusionsstromdichten J i können durch Inversion der K − 1 MaxwellStefan’schen Gleichungen (4-11) unter Berücksichti-
F69
F70
F Technische Thermodynamik
Tabelle 4-4. Thermophysikalische Eigenschaften von Metallen und Legierungen bei 20 ◦ C [5]
Stoff Metalle Aluminium Blei Chrom Eisen Gold Iridium Kupfer Magnesium Mangan Molybdän Natrium Nickel Platin Rhodium Silber Titan Uran Wolfram Zink Zinn, weiß Zirkon
103 kg/m3
c kJ/(kg · K)
λ W/(m · K)
2,70 1,34 6,92 7,86 19,26 22,42 8,93 1,74 7,42 10,2 9,71 8,85 21,37 12,44 10,5 4,5 18,7 19,0 7,10 7,29 6,45
0,888 0,129 0,440 0,452 0,129 0,130 0,382 1,020 0,473 0,251 1,220 0,448 0,133 0,248 0,235 0,522 0,175 0,134 0,387 0,225 0,290
237 35 91 81 316 147 399 156 21 138 133 91 71 150 427 22 28 173 121 67 23
98,8 23,9 29,9 22,8 127,2 50,4 117,0 87,9 6,0 53,9 11,2 23,0 25,0 48,6 173,0 9,4 8,6 67,9 44,0 40,8 12,3
8,8
0,377
62
18,7
2,7 7,8 7,85 7,8 7,7
0,912 0,54 0,465 0,50 0,46
Legierungen Bronze (84 Cu, 9 Zn, 6 Sn, 1 Pb) Duraluminium Gusseisen Kohlenstoffstahl ( 0,5 und glatte Wände .
F81
F82
F Technische Thermodynamik
Tabelle 4-6. Universelle Wandgesetze für das Geschwindigkeits- und Temperaturprofil bei natürlicher Konvektion [38]
4.4.3 Turbulenzmodelle
Normierter Wandabstand yNx = wq y/ν 1/4 mit wq = q˙ w βgν/( c p ) Normierte Geschwindigkeit wxx = wx /wq Normierte Temperatur θ x = (T − T W )/T q mit T q = q˙ W /( c p wq ) Überlappungsschicht (yNx → ∞) wxx χ1 (y Nx )1/3 − CNx (Pr) x x θ = χ2 (y Nx )−1/3 − CNθ (Pr) mit χ1 = 27; χ2 = 5,6 x CNθ (Pr) = Pr1/2 /{0,24[Ψ (Pr)]1/4} ψ(Pr) = [1 + (4,6/Pr)9/16 ]−16/9 Unterschicht (y Nx → 0) wxx = (wτ /wq )2 yNx θ x = −Pr yNx
Weil sich die turbulenten Scheinspannungen (4-111) wie eine Erhöhung der Viskosität auswirken, hat Boussinesq hierfür einen Gradientenansatz analog zum Newton’schen Reibungsgesetz (4-66) − wi w j = ηtu [∂wi /∂z j + ∂w j /∂zi ] − (2/3) δi jk (4-119) vorgeschlagen. Darin ist k = (1/2) w1 w1 + w2 w2 + w3 w3
Zur Darstellung wird die dimensionslose Größe θ+ ≡ (T − T W )/T τ
mit T τ ≡ −q˙ W /( c p wτ ) (4-117)
benutzt, wobei T τ als Reibungstemperatur bezeichnet wird. Die Bedingung Pr > 0,5 stellt sicher, dass die Temperaturwandschicht innerhalb der Geschwindigkeitswandschicht liegt. Hydraulisch und thermisch glatte Wände erfordern ks+ < 5 bei Pr ≤ 1 und ks+ Pr1/3 < 5 für Pr > 1 mit ks+ ≡ ks wτ /ν und ks als der äquivalenten Sandrauhigkeit [37]. Wegen der geringen Dicke der Wandschicht lassen sich die Ergebnisse (4-113) und (4-117) auf alle erzwungenen Konvektionströmungen mit endlicher Wandschubspannung übertragen und heißen universelle Wandgesetze. Sie gelten für y+ > 70, vgl. Bild E 8-24. In der Schicht y+ < 5 dominiert der molekulare Transport gegenüber den turbulenten Flüssen. In dieser wandnächsten, sog. Unterschicht sind das Geschwindigkeits- und Temperaturprofil durch w+x
=y
+
+
und θ = Pr y
+
bis (4-118). Die Konzentrationsprofile erhält man aus der Analogie von Wärme- und Stofftransport.
(4-118)
gegeben. Bei natürlicher Konvektion gelten die in Tabelle 4-6 angegebenen Modifikationen von (4-113)
(4-120)
die spezifische kinetische Energie der turbulenten Schwankungsbewegung. Das Schließungsproblem der Impulsgleichung (4-104), (4-105) wird damit auf die Modellierung der Wirbelviskosität ηtu bzw. der kinematischen Wirbelviskosität νtu = ηtu / verlagert, die von Ort zu Ort veränderliche Strömungsgrößen und keine Stoffeigenschaften sind. In Wandnähe gilt aufgrund des Wandgesetzes (4-113) lim νtu = χwτ y .
y→0
(4-121)
Die νtu bestimmende turbulente Schwankungsbewegung kann im einfachsten √ Fall durch einen Geschwindigkeitsmaßstab q = k und einen Längenmaßstab L charakterisiert werden, wobei die Dimensionsanalyse √ νtu = C p L k mit C p ≈ 0,55 (4-122) ergibt. Zwischen der Turbulenzlänge L und der spezifischen Dissipation der Turbulenzenergie, angenähert durch 2 3 ε = ν tr (grad w )T · grad w ,
(4-123)
besteht dabei nach Prandtl-Kolmogorov der Zusammenhang [39] L = Cε k3/2 /ε
mit Cε ≈ 0,168 .
(4-124)
Der in E 8.3.5 beschriebene Mischungswegansatz für die Verteilung von q und L zählt zu den algebraischen Turbulenzmodellen. Der Geschwindigkeitsmaßstab
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
wird durch q = C p /Cε L|∂w x /∂y| aus der mittleren Bewegung hergeleitet, und L ist eine vorzugebende Ortsfunktion. Mit (4-122) folgt νtu = L2 |∂wx /∂y| wegen C 3p /Cε = 1 ,
(4-125)
wobei zur Erfüllung des Wandgesetzes (4-113) lim L = χy sein muss. Der Ansatz eignet sich y→0
für einfache, nicht abgelöste oder hochgradig dreidimensionale Strömungen mit einem lokalen Gleichgewicht zwischen Produktion und Dissipation der Turbulenzenergie [40]. Universeller ist das k, ε-Modell von Jones und Launder [41], das als sog. Zweigleichungsmodell zwei partielle Differenzialgleichungen für die Größen q und L benutzt. Die Verteilung des Geschwindigkeitsmaßstabs wird aus einer Transportgleichung für die Turbulenzenergie k bestimmt. Diese Transportgleichung lässt sich aus den Navier-Stokes’schen Gleichungen (4-70) herleiten [42] und beschreibt die Wechselwirkung von Produktion, Konvektion, Diffusion und Dissipation von k. Die hierin enthaltenen Korrelationen von Schwankungsgrößen werden durch Modellanahmen auf die mittlere Bewegung zurückgeführt. Unter Beschränkung auf die vollturbulente Kernschicht mit vernachlässigbarem molekularen Transport gelangt man zu der Beziehung (grad k) · w = Cμ (k2 /ε) tr {[grad w + (grad w)T ] · grad w} (4-126) − ε + div[(νtu /Prk ) grad k] . Die Verteilung des Längenmaßstabs wird über (4-124) aus einer heuristischen Transportgleichung für die spezifische Dissipation ε der Turbulenzenenergie in der vollturbulenten Kernschicht (grad ε) · w = Cε1 (ε/k) tr {νtu [grad w + (grad w)T ] (4-127) · grad w} − Cε2 (ε2 /k) + div[(νtu /Prε )grad ε] gewonnen. Für die Wirbelviskosität wird dabei wegen (4-122) und (4-124) νtu = Cμ k2 /ε mit Cμ = C p · Cε
(4-128)
gesetzt. Wegen der vorangegangenen Approximationen sind die empirisch zu ermittelnden Modellkonstanten problemabhängig. Am häufigsten wird der
Konstantensatz Prk = 1,0 ;
Prε = 1,3 ;
Cε1 = 1,44 ;
Cε2 = 1,87
und Cμ = 0,09
(4-129)
verwendet, wobei wegen des Wandgesetzes (4-113) die Koppelbedingung (4-130) Prε Cμ (Cε2 − Cε1 ) = χ2 besteht [43]. Mit (4-102), (4-104) für t R = 0, (4-119), (4-126), (4-127) und (4-128) stehen 6 Gleichungen ˜ (t R )tu , νtu , k für die 6 unbekannten Funktionen w, p, und ε zur Verfügung. In Wandnähe muss die Lösung bei endlicher Wandschubspannung in das Wandgesetz (4-113) übergehen. Bei ebener Strömung und undurchlässiger Wand gelten daher die Randbedingungen ⎫ ⎪ lim w¯ x = (1/χ) ln y+ + C + lim w¯ y = 0 ⎪ ⎪ y→0 y→0 ⎪ ⎪ tu ⎪ ⎪ R tu lim ν = χwτ y ⎬ lim t xy = τ¯ W , ⎪ ⎪ y→0 y→0 ⎪ ⎪ ⎪ ⎪ 2 3 ⎪ lim k = w / C lim ε = w (xy) ⎭ y→0
τ
μ
y→0
τ
(4-131)
die in Fällen hoher Reynolds-Zahlen, d. h. dünner Wandschichten angewendet werden. Modifikationen bei kleinen Reynolds-Zahlen und abgelösten Strömungen mit verschwindender Wandschubspannung werden in [44] behandelt. Die turbulenten Energieströme (4-112) werden wie die turbulenten Impulsströme nach dem Vorbild des molekularen Transportgesetzes formuliert. Dies führt in Analogie zum Fourier’schen Gesetz (4-2) auf den Gradientenansatz
c p w T = − c p atu grad T¯ .
(4-132)
Die turbulente Temperaturleitfähigkeit atu ist darin eine ortsabhängige Strömungsgröße, die in Wandnähe aufgrund des Wandgesetzes (4-116) den Grenzwert lim atu = χθ wτ y
y→0
(4-133)
annimmt. Mit den Größen νtu und atu lässt sich analog zur molekularen Prandtl-Zahl Pr = ν/a eine turbulente Prandtl-Zahl Prtu ≡ νtu /atu
(4-134)
bilden, die bei Annäherung an die Wand we-
F83
F84
F Technische Thermodynamik
gen (4-121) und (4-133) in den konstanten Wert lim Prtu = χ/χθ = 0,87
y→0
(4-135)
übergeht. Als Modellierung für den turbulenten Energietransport wird dieser Wert häufig für die gesamte turbulente Kernschicht angenommen. Obgleich im Prinzip Prtu = f (Re, Pr, y+ ) gelten muss, erzielt man mit dieser Modellierung für Pr > 0,5 und nicht abgelöste Strömungen gute Ergebnisse [45]. Für die turbulenten Stoffströme (4-110) setzt man entsprechend zu (4-132)
w ξ¯1 = − Dtu grad ξ¯1
(4-136)
mit Dtu als einem turbulenten Diffusionskoeffizienten. Hiermit lässt sich nach dem Vorbild der molekularen Schmidt-Zahl S c = ν/D eine turbulente Schmidt-Zahl Sctu ≡ νtu /Dtu
(4-137)
4.5.1 Grenzschichtgleichungen bei erzwungener Konvektion
Bild 4-3 zeigt den Verlauf der Strömungs- und Temperaturgrenzschicht an einem ebenen Körper im Fall der erzwungenen Konvektion, d. h. einer von Wärme- und Stoffübergang unabhängigen Strömung. Der Grenzschichtrand wird als 99%ige Annäherung an den Zustand der Außenströmung erklärt. Bei laminarer Strömung lassen sich die Dicken δS , δT und δξ der Strömungs-, Temperatur- und Konzentrationsgrenzschicht aus den Geschwindigkeiten des molekularen Transportes quer zu den Grenzschichten und der Verweilzeit der Fluidteilchen in Körpernähe entsprechend der Geschwindigkeit des konvektiven Transports in Längsrichtung abschätzen. Für Re → ∞ ergibt sich asymptotisch [46] δS /L0 ∼ Re−1/2 und −1/2 −1/2 Re Pr für Pr → 0 δT /L0 ∼ Re−1/2 Pr−1/3 für Pr → ∞ .
(4-138)
definieren, die aufgrund der Analogie von Wärmeund Stofftransport in Wandnähe denselben Wert wie die turbulente Prandtl-Zahl hat. Die Modellierung des turbulenten Stofftransports kann für Sc > 0,5 und anliegende Strömung für das gesamte Feld mit diesem Wert erfolgen.
4.5 Grenzschichten Bei der schnellen Umströmung eines Körpers wird ein Fluid unter dem Zwang der Haftbedingung nur in einer dünnen, wandnahen Schicht durch Reibung abgebremst. Ebenso erfasst ein von der Körperoberfläche ausgehender Wärme- und Stofftransport die Strömung nur in einer dünnen, die Wand bedeckenden Grenzschicht. Im Allgemeinen entwickeln sich Grenzschichten mit zunehmender Dicke von der Vorderkante eines Körpers oder dem Staupunkt bis zu einer möglichen Ablösestelle im Gebiet des Druckanstiegs an der Körperkontur, siehe E 8.3.6. An die reibungsbehaftete Grenzschichtströmung schließt sich auf der körperfernen Seite eine näherungsweise reibungsfreie Außenströmung mit meist homogener Temperatur- und Konzentrationsverteilung an.
Bild 4-3. Strömungs- und Temperaturgrenzschicht bei erzwungener Konvektion
Bild 4-4. Turbulente Strömungsgrenzschicht an einer ebenen Platte. Die Dicke der Wandschicht ist proportional ν/wτ [48]
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
Dabei ist L0 eine charakteristische Körperabmessung und Re die mit L0 und der Anströmgeschwindigkeit w0 gebildete Reynolds-Zahl. Für Pr < 1 ist δT > δS , für Pr > 1 es umgekehrt. Die Dicke δξ der Konzentrationsgrenzschicht folgt aus der Analogie von Wärme- und Stofftransport. Mit wachsender Reynolds-Zahl werden die Grenzschichten immer dünner. Bei turbulenter Strömung sind die zeitlich gemittelten Grenzschichten nach Bild 4-4 im Wesentlichen zweischichtig aufgebaut. Sie bestehen aus einer wandnahen Schicht mit merklichen Beiträgen des molekularen Transportes und einer darüber liegenden Defektschicht, in der eine schwach gestörte Außenströmung mit dominantem turbulentem Transport vorliegt. Die meisten Turbulenzmodelle liefern diskrete Grenzschichtdicken, die wie im laminaren Fall für Re → ∞ asymptotisch zu null werden, siehe E 8.3.6, [47]. In vielen technischen Anwendungen findet man Grenzschichtdicken in der Größenordnung von Millimetern und kleiner. Der für den Wärme- und Stoffübergang zwischen Wand und Fluid entscheidende Transport in den Grenzschichten läuft somit bei großen ReynoldsZahlen in Quer- und Längsrichtung auf zwei verschiedenen Längenskalen ab. Dies erlaubt Vereinfachungen in den Feldgleichungen, die damit in die von Prandtl angegebenen Grenzschichtgleichungen übergehen. Bei stationärer, laminarer, erzwungener ebener Strömung erhält man aus (4-73) bis (4-76) für Re → ∞ ∂w x /∂x + ∂wy /∂y = 0 w x ∂ξ¯1 /∂x + wy ∂ξ¯1 /∂y = D∂2 ξ¯1 /∂y2
(4-139) (4-140)
w x ∂w x /∂x + wy ∂w x /∂y = −(1/ ) d p˜ ∞ /dx + ν∂2 w x /∂y2
(4-141)
w x ∂T/∂x + wy ∂T/∂y = a ∂ T/∂y . 2
2
(4-142)
Die x-Kordinate folgt dabei nach Bild 4-3 der Wand und bildet unter Vernachlässigung der Wandkrümmung mit der Wandnormalen y ein Orthogonalsystem. Die zugehörigen Geschwindigkeitskomponenten sind w x und wy . Der molekulare Transport von Substanzmengen, x-Impuls und Wärme in Hauptströmungsrichtung verschwindet gegenüber dem entsprechenden Transport in Querrichtung. Das ursprünglich elliptische Gleichungssystem wird damit parabo-
lisch, was eine in Strömungsrichtung fortschreitende numerische Lösung ermöglicht. Die Impulsgleichung in y-Richtung reduziert sich auf die Aussage ∂ p˜ /∂y = 0. Der Druck ist daher keine Variable der Grenzschicht, sondern wird ihr von außen aufgeprägt. Das Druckgefälle in Hauptströmungsrichtung folgt aus der x-Impulsgleichung der zur Wand extrapolierten reibungsfreien Außenströmung w x∞ dw x∞ /dx = −(1/ ) d p˜ ∞ /dx,
(4-143)
die als bekannt vorausgesetzt und durch den Index ∞ gekennzeichnet wird. Die zur Wand extrapolierte Geschwindigkeit w x∞ der Außenströmung ist wie der zugehörige Druck p˜ ∞ , die entsprechende Temperatur T ∞ und Konzentration ξ¯1∞ allein eine Funktion der Koordinate x. Mögliche Randbedingungen der Grenzschichtgleichungen (4-139) bis (4-142) sind bei geringem Stoffübergang, d. h. vernachlässigbarer Normalgeschwindigkeit auf der Wand, y = 0 (Wand):
w x = wy = 0 T = T w (x) oder e˙ = e˙ w (x) ξ¯1 = ξ¯1w (x) oder m ˙ 1 = m ˙ 1w (x)
y = δ (Außenrand): w x = w x∞ (x) T = T ∞ (x) ξ¯1 = ξ¯1∞ (x) .
(4-144)
Eine Randbedingung für wy kann am äußeren Grenzschichtrand nicht erfüllt werden. Der Enthalpieterm in der thermischen Randbedingung für e˙ , siehe (4-81), kann bei dem vorausgesetzen inerten Gemisch häufig gegenüber dem Wärmeleitungsterm vernachlässigt werden. Für die hier ausgeschlossenen katalytischen Wandreaktionen sind weitere stoffliche Randbedingungen in Form von Stoffbilanzen an der Wand möglich. Bei Strömungen mit d p˜ ∞ /dx = 0, d. h. w x∞ = w0 , und Pr = 1 stimmen die Differenzialgleichungen (4-141) und (4-142) für w x und T überein, sodass sich mit den Randbedingungen T W (x) = const und T ∞ (x) = const ähnliche Grenzschichtprofile w x /w0 = (T − T W )/(T ∞ −T W ) ergeben. Die lokalen Wandschubspannungen und Wärmestromdichten sind dann durch die Reynolds’sche Analogie Nu = (cf /2)Re
(4-145)
F85
F86
F Technische Thermodynamik
verknüpft. Hierin sind Nu = q˙ W L0 /[λ(T W − T ∞ )] und Re = w0 L0 /ν die mit einer beliebigen Länge L0 gebildete Nußelt- und Reynolds-Zahl und cf = 2τW /( w20 ) der lokale Widerstandsbeiwert. Für den Stoffübergang gilt Entsprechendes. Bei stationärer, turbulenter, erzwungener ebener Strömung ergeben sich aus (4-102) bis (4-104) und (4-106) für Re → ∞ die Grenzschichtgleichungen ¯ y /∂y = 0 , ∂w¯ x /∂x + ∂w
(4-146)
w¯ x ∂ξ¯1 /∂x + w¯ y ∂ξ¯1 /∂y = ∂ D∂ξ¯1 /∂y − wy ξ¯1 ∂y ,
(4-147)
w¯ x ∂w¯ x /∂x + w¯ y ∂w¯ x /∂y
= −(1/ ) d p˜ ∞ /dx + ∂ ν∂w¯ x /∂y − wx wy ∂y , (4-148) w¯ x ∂T /∂x + w¯ y ∂T /∂y = ∂ a∂T /∂y − wy T ∂y . (4-149) Die Impulsgleichung in y-Richtung liefert hier ∂( p¯˜ +
wy2 )/∂y = 0, sodass über der Grenzschichtdicke der Klammerausdruck und nicht der piezometrische Druck konstant ist. Bei turbulenzfreier Außenströmung mit dem zur Wand extrapolierten Druck p˜ ∞ gilt aber p˜ W = p˜ ∞ . Das zur Schließung verwendete k, εModell (4-126), (4-127) geht mit den Grenzschichtvereinfachungen über in w¯ x ∂k/∂x + w¯ y ∂k/∂y = Cμ (k2 /ε)(∂w ¯ x /∂y)2 − ε + ∂[(νtu /Prk )(∂k/∂y)]/∂y ,
(4-150)
w¯ x ∂ε/∂x + w¯ y ∂ε/∂y ¯ x /∂y)2 − Cε2 (ε2 /k) = Cε1 (ε/k)νtu (∂w
(4-151)
+ ∂[(ν /Prε )(∂ε/∂y)]/∂y . tu
Abweichend von (4-144) sind bei turbulenten Grenzschichten als Randbedingung für y → 0 die Wandgesetze zu erfüllen. Es gilt (4-131) für die Strömungsgrenzschicht und (4-116) für die Temperaturgrenzschicht, und zwar gleichermaßen bei vorgegebener Temperatur- oder Wärmestromdichte an der Wand, wobei eine dieser Größen jeweils zu iterieren ist. Das Konzentrationsprofil verhält sich analog zum Temperaturprofil.
Die Reynolds’sche Analogie gilt bei turbulenter Strömung nur angenähert, da mit dem Druckgradienten nicht gleichzeitig die Druckschwankungen verschwinden. Stoff-, Impuls- und Energiebilanzen für die von der Konzentrations-, Strömungs- und Temperaturgrenzschicht gebildeten Kontrollräume erhält man durch Integration der Grenzschichtgleichungen über die Grenzschichtdicke. Bei vernachlässigbarer Normalgeschwindigkeit auf der Wand sowie konstanter Temperatur T ∞ und Konzentration ξ¯1∞ in der Außenströmung ergibt sich im laminaren Fall aus (4-139) bis (4-142) d dx
"δξ w x (ξ¯1∞ − ξ¯1 ) dy = − j1W / ,
(4-152)
0
d dx
"δS w x (w x∞ − w x )dy 0
dw x∞ + dx
"δS (w x∞ − w x )dy = τW / ,
(4-153)
0
d dx
"δT w x (T ∞ − T )dy = −q˙ W /( c p ) .
(4-154)
0
Im turbulenten Fall folgt aus (4-146) bis (4-149) in Bezug auf die zeitlichen Mittelwerte der Feldgrößen ein gleichlautendes Ergebnis. Die integralen Bilanzen (4-152) bis (4-154) sind Ausgangspunkt von Näherungsverfahren zur Bestimmung der Schubspannung sowie der Wärmeund Diffusionsstromdichten an der Wand. Der Geschwindigkeits-, Temperatur- und Konzentrationsverlauf in den Grenzschichten wird dabei durch parameterabhängige Profile aus vorgegebenen Profilfamilien ersetzt. Dies führt mit geeignet gewählten Hilfsfunktionen auf gewöhnliche Differenzialgleichungen für die Profilparameter, z. B. die Grenzschichtdicken, als Funktion der Lauflänge x. Die Grenzschichtgleichungen sind so durch die Quadratur gewöhnlicher Differenzialgleichungen zu lösen [49, 50]. Grenzschichtgleichungen und Integralsätze für rotationssymmetrische und dreidimensionale Grenzschichten bei erzwungener Konvektion findet man in [51].
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
4.5.2 Grenzschichtgleichungen bei natürlicher Konvektion
Auch natürliche Konvektionsströmungen, die durch Dichteänderungen aufgrund von Wärme- und Stoffübergang an einer den Fluidraum begrenzenden Wand hervorgerufen werden, haben Grenzschichtcharakter. Bild 4-5 zeigt dies am Beispiel der direkten natürlichen Konvektion an einer beheizten senkrechten Platte mit der Oberflächentemperatur T W . Die ruhende Umgebung hat die konstante Temperatur T ∞ < T W und Dichte ∞ . Da die Dichte eines Fluids in der Regel mit zunehmender Temperatur abnimmt, d. h. der Wandwert W infolge der Aufheizung kleiner als ∞ ist, erfährt das Fluid in der Nähe der Plattenoberfläche einen Auftrieb in dem von der Umgebung aufgeprägten Druckfeld und strömt mit der Geschwindigkeit w x aufwärts. Im stationären Zustand führt die Strömung die von der Wand übertragene Energie nach oben ab, sodass sie wandferne Zonen nicht erfassen kann. Der Wärmeübergang beeinflußt daher nur eine wandnahe Grenzschicht, die allerdings mit wachsender Lauflänge x immer dicker wird. Die Grenzschichtdicken lassen sich im laminaren Fall wieder aus der Geschwindigkeit des molekularen Transports quer zu den Grenzschichten und der Verweilzeit der Fluidteilchen in Wandnähe abschätzen, wobei ein geeigneter Ansatz für die nicht unmittelbar vorgegebene konvektive Transportgeschwindigkeit in
Längsrichtung benötigt wird. Legt man eine Platte mit einem Winkel ϕ zwischen der Horizontalen und der Hauptströmungsrichtung zugrunde, ergibt sich bei der Randbedingung T W = const als Dicke der Strömungs- und Temperaturgrenzschichten δS und δT asymptotisch für Grϕ → ∞ [52] δS /L0 ∼ Grϕ−1/4 und ⎧ −1/4 ⎪ für Grϕ ⎪ ⎪ ⎪ ⎨ −1/4 δT /L0 ∼ ⎪ Gr für ϕ ⎪ ⎪ ⎪ ⎩ Grϕ−1/4 Pr−1/2 für
Pr → 0 Pr ≈ 1 Pr → ∞
(4-155)
Hierin ist Grϕ = β(T W − T ∞ ) gL30 sin ϕ/ν2 eine modifizierte Grashof-Zahl mit der Plattenlänge L0 als Bezugslänge. Da Temperaturunterschiede stets eine Strömung in Gang setzen, ist δS ≥ δT . Bei der Randbedingung q˙ W = const, d. h. konstanter Wärmestromdichte an der Wand, hat man als charakteristische Temperaturdifferenz in der Grashof-Zahl q˙ w L0 /λ einzuführen und in (4-155) den Exponenten (−1/4) durch (−1/5) zu ersetzen [53]. Die Dicke δξ einer Konzentrationsgrenzschicht ergibt sich aus der Analogie von Wärme- und Stofftransport. Mit wachsender GrashofZahl, siehe (4-94) und (4-95) für beide Vorgänge, werden die Grenzschichten asymptotisch dünn. Dies gilt auch bei Turbulenz [54]. Wegen der unterschiedlichen Längenskalen für die Transportprozesse längs und quer zur Hauptströmungsrichtung lassen sich in den Feldgleichungen wieder Grenzschichtvereinfachungen durchführen. Im technisch gewöhnlich realisierten Grenzfall Gr → ∞ erhält man für die stationäre, laminare, ebene Strömung bei direkter natürlicher Konvektion an einer Wand mit dem örtlichen Konturwinkel ϕ nach Bild 4-6 aus (4-92), (4-93) und (4-95) als Impulsgleichung in Hauptströmungsrichtung w x ∂w x /∂x + wy ∂w x /∂y (4-156) = [β∞ (T − T ∞ ) + γ∞ (ξ¯1 − ξ¯1∞ )]g sin ϕ + ν∂2 w x /∂y2 . Entsprechend folgt aus (4-105), (4-93) und (4-95) bei turbulenter Strömung
Bild 4-5. Strömungs- und Temperaturgrenzschicht bei direkter natürlicher Konvektion an einer beheizten senkrechten Platte infolge des Auftriebs des erwärmten Fluids
w x ∂w x /∂x + wy ∂w x /∂y (4-157) # $5 4 = β∞ (T¯ − T ∞ ) + γ∞ ξ¯1 − ξ¯1∞ g sin ϕ + ν∂2 w¯ x /∂y2 − ∂ wx wy /∂y .
F87
F88
F Technische Thermodynamik
Bild 4-6. Ebene Körperkontur mit örtlichem Konturwin-
kel ϕ gegen die Horizontale und Grenzschichtkoordinaten im Schwerkraftfeld
Wegen des vorausgesetzten hydrostatischen Gleichgewichts in der ungestörten Umgebung verschwindet der Gradient des der Grenzschicht aufgeprägten piezometrischen Drucks in x-Richtung. Die eckige Klammer in (4-156) und (4-157) enthält die Auftriebsglieder, die das Geschwindigkeitsfeld an das Temperatur- und Konzentrationsfeld koppeln. Die Kontinuitäts-, Komponentenkontinuitäts- und Energiegleichung sind gleichlautend mit (4-139), (4-140) und (4-142) bzw. (4-146), (4-147) und (4-149) [55]. Als Randbedingung für den laminaren Fall kann (4-144) mit w x∞ = 0 benutzt werden, während als Modifikation für den turbulenten Fall die Wandgesetze nach Tabelle 4-6 und ihre Übertragung auf den Stoffübergang zu berücksichtigen sind. Das k, ε-Turbulenzmodell kann wegen des Maximums im Geschwindigkeitsprofil bei endlicher Schubspannung nicht angewendet werden, da der zugrundeliegende Gradientenansatz (4-119) versagt. Analog zu (4-152) bis (4-154) lassen sich für die Grenzschichten bei direkter natürlicher Konvektion integrale Bilanzen herleiten. Aus (4-156) bzw. (4-157) folgt die Impulsbilanz d dx
"δx
"δx w2x
0
dy =
[β∞ (T − T ∞ ) 0
+ γ∞ (ξ¯1 − ξ¯1∞ )]g sin ϕ dy − τW / ,
(4-158)
wobei im turbulenten Fall zeitliche Mittelwerte der Feldgrößen einzusetzen sind. Als Komponentenmassen- und Energiebilanz gelten (4-152) und (4-154) unverändert.
In der Nähe der Konturwinkel ϕ = 0 bzw. ϕ = π verschwindet in (4-156) und (4-157) die Auftriebskraft, sodass sich eine direkte naturliche Konvektionsströmung nicht ausbilden kann. In diesem Fall wird ein Effekt höherer Ordnung wirksam, der in Abgrenzung zu dem bisherigen als indirekte natürliche Konvektion bezeichnet wird. Wie in Bild 4-7 für eine beheizte horizontale Platte dargestellt ist, nimmt wegen der geringeren Dichte der erwärmten Schicht auf der Platte verglichen mit der Dichte ∞ der ungestörten Umgebung der hydrostatische Druck pstat über der Platte vom Rand zum Inneren hin ab, wodurch eine Grenzschichtströmung in Richtung des Druckgefälles induziert wird. In einiger Entfernung vom Plattenrand löst die Grenzschicht nach oben ab. Grenzschichtgleichungen für die Überlagerung von direkter und indirekter natürlicher Konvektion sind für den laminaren Fall in [57] angegeben. Es zeigt sich, dass die indirekte natürliche Konvektion nur in einem kleinen Winkelbereich ϕ = O(Gr−n ) mit n > 1/5 für Gr → ∞ gegenüber der direkten Form dominiert. Wegen der Ablösung ist die Anwendbarkeit der Gleichungen an schwach geneigten Flächen eingeschränkt. Bei zylindrischen Körpern mit 0 ≤ ϕ ≤ 2π ist der Beitrag der indirekten natürlichen Konvektion zum gesamten Wärme- und Stoffübergang vernachlässigbar, da sie nur in einem kleinen Winkelbereich überwiegt.
4.6 Wärmeund Stoffübergangskoeffizienten Die Temperatur- und Konzentrationsfelder, die sich aus der Lösung der Grenzschichtgleichungen ergeben, interessieren selten in allen Einzelheiten. Benötigt werden vor allem die an der Berandung der Felder übertragenen Energie- und Stoffströme, wobei der konvektive gegenüber dem konduktiven Anteil bei geringem Stoffübergang zu vernachlässigen ist. Zur Darstellung der Dichten des konduktiven Anteils, d. h. der Wärme- und Diffusionsstromdichten nach (4-80) und (4-82), benutzt man die örtlichen Wärme- und Stoffübergangskoeffizienten α und β. Sie sind durch und
q˙ W = −λ(∂T/∂n)W ≡ α(T W − T F )
(4-159)
j1W = − D(∂ξ¯1 /∂n)W ≡ β ξ¯1W − ξ¯1F
(4-160)
4 Energie- und Stofftransport in Temperatur- und Konzentrationsfeldern
Bild 4-7. Strömungs- und Temperaturgrenzschicht bei indirekter natürlicher Konvektion an einer beheizten horizontalen Platte aufgrund des verminderten hydrostatischen Drucks pstat in der aufgewärmten Fluidschicht nach [56]
Bild 4-8. Wärmeübergang an einer beheizten Wand. Geschwindigkeitsverteilung w(y) und Temperaturverteilung T (y) im Normalschnitt
implizit definiert und haben die SI-Einheit W/(m2 · K) bzw. m/s. Im Rahmen der Näherung konstanter Dichte gilt auch J1W = −¯cD(∂x1 /∂n)W = c¯ β(x1W − x1F ) ,
(4-161)
weil sich hier die Bezugsgeschwindigkeiten der Diffusionsmassen- und -stoffmengenstromdichte j1 und J 1 nach (4-5) und (4-6) nicht unterscheiden. Alle Ströme sind positiv, wenn sie wie die Normale n in das Fluid gerichtet sind, siehe Bild 4-8 für den Wärmeübergang. Im Einzelnen bedeuten T w und T F die örtliche Wandtemperatur und die Fluidtemperatur in einigem Abstand von der Wand; ξ¯1W und ξ¯1F bzw. x1W und x1F sind die entsprechenden Massenund Stoffmengenanteile der Komponente 1. Bei den
hier ausgeschlossenen Strömungen mit merklicher Dissipation tritt an die Stelle von T W in (4-159) die adiabate Wandtemperatur [58]. Die Größen T F und ξ¯1F in (4-159) und (4-160) werden für Umströmungsprobleme und Kanalströmungen unterschiedlich definiert. Im Fall eines umströmten Körpers hat man hierfür die Werte T ∞ und ξ¯1∞ der ungestörten Umgebung einzusetzen. Bei Kanalströmungen hat T F die Bedeutung der adiabaten Mischungstemperatur, d. h. der einheitlichen Temperatur, die sich bei der adiabaten Durchmischung eines durch einen Querschnitt fließenden Massenstroms mit inhomogen verteilter Temperatur ergeben würde. Analog ist ξ¯1F der bei der Durchmischung resultierende Massenanteil der Komponente 1. Für konstante Dichte und spezifische Wärmekapazität c p ergibt sich " ˙ w(T − T 0 )dAq (4-162) T F = T 0 + ( /m) Aq
bzw.
" ˙ ξ¯1F = ( /m)
wξ¯1 dAq .
(4-163)
Aq
Hierin sind m ˙ der Massenstrom sowie w, T und ξ¯1 die Strömungsgeschwindigkeit, Temperatur und Massenkonzentration der Komponente 1 auf einem Element dAq des Strömungsquerschnitts. Für T 0 kann eine beliebige Bezugstemperatur gewählt werden. Die Konzentration x1F verhält sich wie ξ¯1F . Den Definitionen (4-159) und (4-160) entsprechend sind
F89
F90
F Technische Thermodynamik
Wärme- und Stoffübergangskoeffizienten keine Stoffeigenschaften, sondern Strömungsgrößen. Die Quotienten λ/α und D/β geben dabei die Größenordnung der Grenzschichtdicken wieder, wie in Bild 4-8 für den Wärmeübergang gezeigt ist. Dünne Grenzschichten bedeuten hohe Wärmeund Stoffübergangskoeffizienten und begünstigen die Übertragungsvorgänge an der Wand. Der Wertebereich von Wärmeübergangskoeffizienten in Standardfällen ist in Tabelle 4-7 aufgeführt, womit sich nach (4-159) Wärmestromdichten bei vorgegebenen Temperaturdifferenzen und umgekehrt abschätzen lassen. Wärme- und Stoffübergangskoeffizienten können mithilfe der Nußelt- und Sherwood-Zahl (4-89) dimensionslos dargestellt werden. Mit den Ansätzen (4-159) und (4-160) folgt aus (4-89) Nu = αL0 /λ und S h = βL0 /D .
(4-164)
Dies ist die meist verwendete Schreibweise beider Kennzahlen. Die charakterische Temperaturund Konzentrationsdifferenz wurde dabei ΔT 0 = −T W − T F und Δξ¯10 = ξ¯1W − ξ¯1F gesetzt. Nußelt- und Sherwood-Zahlen sind damit nicht nur als dimensionslose Stromdichten, sondern auch als das Verhältnis von Bezugslänge zu Grenzschichtdicke interpretierbar. Der insgesamt an einer Wand übertragene Wärme- oder Diffusionsmassenstrom ergibt sich durch Integration der Stromdichten (4-159) und (4-160) über der Wandfläche A " ˙ α(T W − T F )dA = αm ΔT m A (4-165) Q= A
"
m ˙ 1D =
β(ξ¯1W − ξ¯1F )dA = βm Δξ¯1m A .
enten α in W/(m2 · K) [59]
3 100 1000
bis bis bis
20 600 20000
10 50 500 1000
bis bis bis bis
100 500 10000 100000
(4-166)
A
Dabei sind αm und βm mittlere Wärme- und Stoffübergangskoeffizienten, während ΔT m und Δξ¯1m mittlere Temperatur- und Konzentrationsdifferenzen längs der Wand bedeuten. Bei Umströmungsproblemen mit der Randbedingung T W = const bzw. ξ¯1W = const ist T W − T F = T W − T ∞ = const und ξ¯1W − ξ¯1F = ξ¯1W − ξ¯1∞ = const, sodass man ΔT m = T W − T ∞ bzw. Δξ¯1m = ξ¯1W − ξ¯1∞ setzt und " " αm = αdA bzw. βm = βdA (4-167) A
A
findet. Bei Kanalströmungen mit T W = const bzw. ξ¯1W = const wählt man als mittlere Temperatur- und Konzentrationsdifferenz die logarithmischen Mittelwerte dieser Größen zwischen den Ein- und Austrittsquerschnitten e und a (T W − T F )e − (T W − T F )a ΔT log = (T W − T F )e ln (T W − T F )a bzw. (4-168) ¯ )a (ξ¯1W − ξ¯1F )e − (ξ¯1W − ξ1F Δξ¯log = . (ξ¯1W − ξ¯1F )e ln (ξ¯1W − ξ¯1F )a Denn für α = const bzw. β = const und vernachlässigbare Massenstromänderung längs des Kanals ist (4-168) gerade der Integralmittelwert von T W − T F bzw. ξ¯1W − ξ¯1F über der Austauschfläche. Damit sind nach (4-165) und (4-166) die mittleren Wärme- und Stoffübergangskoeffizienten ˙ αm = Q/(ΔT log A)
Tabelle 4-7. Wertebereiche von Wärmeübergangskoeffizi-
Natürliche Konvektion Gase Wasser siedendes Wasser Erzwungene Konvektion Gase zähe Flüssigkeiten Wasser Kondensierender Wasserdampf
bzw.
bzw. βm = m ˙ 1D /(Δξ¯1 log A) (4-169)
festgelegt. Zu ihrer dimensionslosen Darstellung werden sog. mittlere Nußelt- und Sherwood-Zahlen Num ≡ αm L0 /λ bzw. Shm ≡ βm L0 /D
(4-170)
verwendet, die mit den Mittelwerten αm und βm gebildet sind. Eine umfangreiche Sammlung empfohlener Korrelationen örtlicher und mittlerer Nußelt-Zahlen (4-90) und (4-97) bei verschiedenen Geometrien und Strömungsformen findet man in [60]. Lösungen der Energiegleichung (4-71) für Temperaturfelder in ruhenden Medien enthält [61] in großer Vollständigkeit.
Literatur
Literatur Allgemeine Literatur zu Kapitel 1 Baehr, H.D.; Kabelac: Thermodynamik. 13. Aufl. Berlin: Springer 2006 Bejan, A.: Advanced engineering thermodynamics. 3rd ed. New York: Wiley 2006 Bošnjakovi´c, F.; Knoche, K.F.: Technische Thermodynamik. Teil I: 8. Aufl.; Teil II: 6. Aufl. Darmstadt: Steinkopff 1998; 1997 Callen, H.B.: Thermodynamics and an introduction to thermostatistics. 2nd ed. New York: Wiley 1985 Falk, G.; Ruppel, W.: Energie und Entropie. Berlin: Springer 1976 Haase, R.: Thermodynamik. 2. Aufl. Darmstadt: Steinkopff 1985 Kestin, J.: A course in thermodynamics, vols. 1; 2. New York: McGraw-Hill 1979 Lucas, K.: Thermodynamik. Die Grundgesetze der Energie- und Stoffumwandlungen. 5.Aufl. Berlin: Springer 2006 Modell, M.; Reid, R.C.: Thermodynamics and its applications. 2nd ed. Englewood Cliffs, N.J.: PrenticeHall 1983 Stephan, K.; Mayinger, F.: Thermodynamik. Bd. 2: Mehrstoffsysteme und chemische Reaktionen. 14. Aufl. Berlin: Springer 1999
Spezielle Literatur zu Kapitel 1 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
(Callen 1985), p. 131–137 (Modell/Reid 1983), App C (Stephan/Mayinger, Bd. 2, 1999), S. 112–114 In [3], S. 102–104 Strubecker, K.: Einführung in die höhere Mathematik, Bd. IV. München: Oldenbourg 1984, S. 478–479 In [1], p. 186–189 In [1], p. 153–157 In [2], p. 182–191 In [5], p. 322–329 Falk, G.: Theoretische Physik, Bd. II: Thermodynamik. Berlin: Springer 1968. S. 171–179 In [2], p. 227–255 Henning, F.: Temperaturmessung. (Hrsg. H. Moser). 3. Aufl. Berlin: Springer 1977 Mohr, P.J.; Taylor, B.N.: CODATA recommended values of the fundamental physical constants 1998. J. Phys. Chem. Ref. Data 28 (1999) 1713–1852
14. 15. 16. 17.
(Haase 1985), S. 72–74 In [14], S. 74–79 In [14], S. 92–103 Baehr, H.D.; Kabelac, S.: Thermodynamik. 13. Aufl. Berlin: Springer 2006, S. 317–318 18. Ahrendts, J.: Die Exergie chemisch reaktionsfähiger Systeme (VDI-Forschungsheft, 579) (1977) 19. Diederichsen, C.: Referenzumgebungen zur Berechnung der chemischen Energie. (Fortschr.-Ber. VDI, Reihe 19, Nr. 50). Düsseldorf: VDI-Verlag 1991 20. Baehr, H.D.: Zur Definition exergetischer Wirkungsgrade. Brennst. Wärme Kraft 20 (1968) 197–200
Allgemeine Literatur zu den Kapiteln 2 und 3 Baehr, H.D.; Kabelac, S.: Thermodynamik. 13. Aufl. Berlin: Springer 2006 Dohrn, R.: Berechnung von Phasengleichgewichten. Braunschweig: Vieweg 1994 Gmehling, J.; Kolbe, B.: Thermodynamik. 2. Aufl. Weinheim: VCH 1992 Modell, M.; Reid, R.C.: Thermodynamics and its applications. 2nd ed. Englewood Cliffs, N.J.: PrenticeHall 1983 Orbey, H.; Sandler, S.: Modeling vapor-liquid equilibria. Cubic equations of state and their mixing rules. Cambridge: Cambridge Univ. Pr. 1998 Prausnitz, J.M.; Lichtenthaler, R.N.; Gomes de Azevedo, E.: Molecular thermodynamics of fluidphase equilibria. 3rd ed. Upper Saddle River, N.J.: Prentice-Hall 1999 Reid, R.C.; Prausnitz, J.M.; Poling, B.E.: The properties of gases and liquids. 4th ed. New York: McGraw-Hill 1987 Smith, W.R.; Missen, R.W.: Chemical reaction equilibrium analysis. New York: Wiley 1982 Stephan, P.; Schaber, K.H.; Stephan, K.; Mayinger, F.: Thermodynamik. Bd. 1: Einstoffsysteme. 16. Aufl., Bd. 2: Mehrstoffsysteme und chemische Reaktionen. 14. Aufl. Berlin: Springer 2007; 1999 Thermophysikalische Stoffgrößen. (Hrsg. W. Blanke), Berlin: Springer 1989 Walas, S.M.: Phase equilibria in chemical engineering. Boston, Mass.: Butterworth 1985
Spezielle Literatur zu Kapitel 2 1. Baehr, H.D.; Kabelac, S.: Thermodynamik. 13. Aufl. Berlin: Springer 2006
F91
F92
F Technische Thermodynamik
2. In [1], Tabelle 10.7 3. In [1], Tabelle 10.8 4. Pitzer, K.S.: The volumetric and thermodynamic properties of fluids, Part I. J. Am. Chem. Soc. 77 (1955) 2427–2433; Pitzer, K.S.; et al.: The volumetric and thermodynamic properties of fluids, Part II. J. Am. Chem. Chem. Soc. 77 (1955) 2433–2440 5. (Reid/Prausnitz/Poling 1987), p. 656–732 6. Smith, J.M.; van Ness, H.C.: Introduction to chemical engineering thermodynamics. 7th ed. Boston: McGraw-Hill 2005 7. (Walas 1985), p. 3–107 8. Reed, T.M.; Gubbins, K.E.: Applied statistical mechanics. Boston: Butterworth-Heinemann 1991 9. Prausnitz, J.M.; Lichtenthaler, R.N.; Gomes de Azevedo, E.: Molecular thermodynamics of fluid-phase equilibria. 3rd ed. Upper Saddle River, N.J.: Prentice-Hall 1999 10. Dymond, J.H.; Smith, E.B.: The virial coefficients of pure gases and mixtures. Oxford: Clarendon Press 1980 11. Tsonopoulos, C.: An empirical correlation of second virial coefficients. AIChE J. 20 (1974) 263–272 12. Wagner, W.; Pruß, A.: The IAPWS formulation 1995 for the thermodynamic properties of ordinary water substance for general and scientific use. Zur Veröffentlichung eingereicht bei J. Phys. Chem. Ref. Data (1999), siehe auch Wagner, W.; Pruß, A.: Die neue internationale Standard-Zustandsgleichung für Wasser für den allgemeinen und wissenschaftlichen Gebrauch. Jahrbuch 97 VDI-Gesellschaft Verfahrenstechnik und Chemieingenieurwesen (1997) 134–156 13. Baehr, H.D.; Schwier, K.: Die thermodynamischen Eigenschaften der Luft im Temperaturbereich zwischen −210 ◦ C und +1250 ◦ C bis zu Drücken von 4500 bar. Berlin: Springer 1961 14. Tillner-Roth, R.; Harms-Watzenberg, F.; Baehr, H.D.: Eine neue Fundamentalgleichung für Ammoniak. DKV-Tagungsbericht 20 (1993), Bd. II, S. 167–181 15. Span, R.; Bonsen, C.; Wagner, W.: SoftwareGrundpaket zur Berechnung thermodynamischer Daten in Referenzqualität. Lehrstuhl für Thermodynamik, Ruhr-Universität Bochum, siehe auch www.ruhrunibochum.de/thermo. Zugrunde liegen u. a. folgende Zustandsgleichungen: Tegeler, Ch.; Span, R.; Wagner, W.: A new equation of state for argon covering the fluid region for temperatures from the melting line to 700 K at pressures up to 1000 MPa. J. Phys. Chem. Ref. Data 28 (1999) 779– 850 Schmidt, R.; Wagner, W.: A new form of the equation of state for pure substances and its application to oxygen. Fluid Phase Equilibria 19 (1985) 175–200
Span, R.; Lemmon, E.W.; Jacobsen, R.T.; Wagner, W.: A reference quality equation of state for nitrogen. Int. J. Thermophys. 19 (1998) 1121–1132 Span, R.; Wagner, W.: A new equation of state for carbon dioxide covering the fluid region from the triple point temperature to 1100 K at pressures up to 800 MPa. J. Phys. Chem. Ref. Data 25 (1996) 1509– 1596 Setzmann, U.; Wagner, W.: A new equation of state and tables of thermodynamic properties for methane covering the range from the melting line to 625 K at pressures up to 1000 MPa. J. Phys. Chem. Ref. Data 20 (1991) 1061–1155 Friend, D.G.; Ingham, H.; Ely, J.F.: Thermophysical properties of ethane. J. Phys. Chem. Ref. Data 20 (1991) 275–336 Smukala, J.; Span, R.; Wagner, W.: A new equation of state for ethylene covering the fluid region for temperatures from the melting line to 450 K at pressures up to 300 MPa. Eingereicht bei J. Phys. Chem. Ref. Data 1999 Younglove, B.A.; Ely, J.F.: Thermophysical properties of fluids. II. Methane, ethane, propane, isobutane and normal butane. J. Phys. Chem. Ref. Data 16 (1987) 577–798 De Reuck, K.M.; Craven, R.J.B.; Cole, W.A.: Report on the development of an equation of state for sulfur hexafluoride. IUPAC Thermodynamic Tables Project Centre Rep. PC/D44, London 1991 Marx, V; Pruß, A.; Wagner, W.: Neue Zustandsgleichungen für R12, R22, R11 und R113 – Beschreibung des thermodynamischen Zustandsverhaltens bei Temperaturen bis 525 K und Drücken bis 200 MPa. (Fortschr.-Ber. VDI, Reihe 19, Nr. 57). Düsseldorf: VDI-Verlag 1992 Tillner-Roth, R.; Baehr, H.D.: An international standard formulation for the thermodynamic properties of 1,1,1,2-tetrafluoroethane (HFC-134a) for temperatures from 170 K to 455 K and pressures up to 70 MPa. J. Chem. Phys. Ref. Data 23 (1994) 657–729. Lemmon, E.W.; Jacobsen, R.T.: An international standard formulation for the thermodynamic properties of 1,1,1-trifluoroethane (HFC-143a) for temperatures from 161 to 500 K and pressures to 60 MPa. Eingereicht bei J. Phys. Chem. Ref. Data 1999 Tillner-Roth, R.: A fundamental equation of state for 1,1-difluoroethane (HFC-152a). Int. J. Thermophys. 16(1995) 91–100 Younglove, B.A.; McLinden, M.O.: An international standard equation of state for the thermodynamic properties of refrigerant 123 (2,2 dichloro-1,1,1trifluoroethane). J. Phys. Chem. Ref. Data 23 (1994) 731–779
Literatur
De Vries, B.; Tillner-Roth, R.; Baehr, H.D.: The thermodynamic properties of HFC-124. 19th International Congress of Refrigeration, The Hague, Netherlands (1995) 582–589 Piao, C.C.; Noguchi, M.: An international standard equation of state for the thermodynamic properties of HFC-125 (pentafluoroethane). J. Phys. Chem. Ref. Data 27 (1998) 775–806 Tillner-Roth, R.; Yokozeki, A.: An international standard equation of state for difluoromethane (R-32) for temperatures from the triple point at 136.4 K to 435 K and pressures up to 70 MPa. J. Phys. Chem. Ref. Data 26 (1997) 1273–1328 16. Soave, G.: Equilibrium constants from a modified Redlich-Kwong equation of state. Chem. Eng. Sci. 27 (1972) 1197–1203 17. In [1], S. 194–197 18. Strubecker, K.: Einführung in die höhere Mathematik, Bd. 1: Grundlagen. 2. Aufl. München: Oldenbourg 1966, S. 245–254 19. Wagner, W.; Kruse, A.: Properties of water and steam. The industrial standard IAPWS-IF97 for the thermodynamic properties and supplementary equations for other properties. Tables based on these equations. Berlin: Springer 1998 20. Wagner, W.; Span, R.; Bonsen, C.: Wasser und Wasserdampf – Interaktive Software zur Berechung der thermodynamischen Zustandsgrößen auf der Basis des Industriestandards IAPWS-IF97. Berlin: Springer Electronic Media 1999 21. Baehr, H.D.; Tillner-Roth, R.: Thermodynamische Eigenschaften umweltverträglicher Kältemittel. Zustandsgleichungen und Tafeln für Ammoniak, R22, R134a, R152a und R123. Berlin: Springer 1995 22. Im Auftrag der Union of Pure and Applied Chemistry (IUPAC) wurden in der Reihe Int. thermodynamic tables of the fluid state u. a. die Tafeln veröffentlicht: Helium (1977), Propylene (1980), Chlorine (1980). (Hersg. S. Angus, u. a.). Oxford: Pergamon Press sowie Oxygen (1987). (Hrsg. W. Wagner; K.M. de Reuck), Fluorine (1990). (Hrsg. K.M. de Reuck), Methanol (1993). (Hrsg. K.M. de Reuck; R.J.B. Craven), Methane (1996). (Hrsg. W. Wagner; K.M. de Reuck). Oxford: Blackwell Scientific Publications 23. Starling, K.E.: Fluid thermodynamic properties for light petroleum systems. Houston, Tex.: Gulf 1973 24. Baehr, H.D.: Der Isentropenexponent der Gase H2 , N2 , O2 , CH4 , CO2 , NH3 und Luft für Drücke bis 300 bar. Brennst. Wärme Kraft 19 (1967) 65–68 25. In [1], Abb. 4.18 26. Ahrendts, J.; Baehr, H.D.: Der Isentropenexponent von Ammoniak. Brennst. Wärme Kraft 33 (1981) 237–239
27. Gmehling, J.; Kolbe, B.: Thermodynamik. 2.Aufl. Weinheim: VCH 1992 28. Callen, H.B.: Thermodynamics and an introduction to thermostatistics. 2nd ed. New York: Wiley 1985, p. 68– 69; 289–290 29. In [1], S. 283 30. In [1], Tabelle 5-2 31. In [1], Tabelle 5-4 32. In [1], S. 217–219 33. Baehr, H.D.: Mollier-i,x-Diagramme für feuchte Luft. Berlin: Springer 1961 34. In [8], p. 219 35. In [9], p. 131–132; 161–164 36. Knapp, H.; u. a.: Vapor-liquid equilibria for mixtures of low boiling substances. (DECHEMA Chemistry Data Series, Vol. VI, Parts 1–3). Frankfurt: DECHEMA 1982 37. VDI-Wärmeatlas. 5. Aufl. Düsseldorf: VDI-Verlag 1988. Tabelle 12, S. DF 29 38. Stephan, K.; Mayinger, F.: Thermodynamik, Bd. 2: Mehrstoffsysteme und chemische Reaktionen. 14. Aufl. Berlin: Springer 1999 39. In [38], S. 355–356 40. In [9], p. 387 sowie Table 8.5 41. In [7], p. 178ff 42. Abrams, D.S.; Prausnitz, J.M.: Statistical thermodynamics of liquid mixtures: A new expression for the excess Gibbs energy of partly or completely miscible systems. A1ChE J. 21 (1975) 116–128 43. Gmehling, J.; u. a.: Vapor-liquid equilibrium data collection. (DECHEMA Chemistry Data Series, Vol. I. Parts 1–8). Frankfurt: DECHEMA 1977–1988 44. Fredenslund, A.; Jones, R.L.; Prausnitz, J.M.: Group contributions estimation of activity coefficients in nonideal liquid mixtures. A1ChE J. 21 (1975) 1086–1099 45. In [27], S. 251–252 46. In [37], Tabelle 8, S. DF18–20 47. In [5], Table 8.21 48. In [27], S. 253 49. In [37], Tabelle 9, S. DF20–24 50. In [5], Table 8.22 51. Hansen, H.K.; Rasmussen, P.; Fredenslund, A.; Schiller, M.; Gmehling, J.: Vapor-liquid equilibria by UNIFAC group contribution. 5. Revision and extension. Ind. Eng. Chem. Res. 30 (1991) 2352–2355. (Weitere Daten sind im Konsortialbesitz. Information durch Institut für Technische Chemie, Universität Oldenburg, siehe auch http://www.uni-oldenburg.de/tchemie/) 52. Magnussen, T.; Rasmussen, P., Fredenslund, A.: An UNIFAC parameter table for prediction of liquidliquid equilibria. Ind. Eng. Chem. Process Des. Dev. 20 (1981) 331–339
F93
F94
F Technische Thermodynamik
53. Gmehling, J.; Li, J.; Schiller, M.: A modified UNIFAC model. 2. Present parameter matrix and results for different thermodynamic properties. Ind. Eng. Chem. Res. 32 (1993) 178–193 54. Gmehling, J.; Lohmann, J.; Jacob, A.; Li, J.; Joh, R.: A modidified UNIFAC (Dortmund) model. 3. Revision and extension. Ind. Eng. Chem. Res. 37 (1998) 4876– 4882. Siehe auch Bemerkung zu [51] 55. Holderbaum, T.; Gmehling, J.: PSRK: A group contribution equation of state based on UNIFAC. Fluid Phase Equilibria 70 (1991) 251–265 56. Fischer, K.; Gmehling, J.: Further development, status and results of the PSRK method for the prediction of vapor-liquid equilibria and gas solubilities. Fluid Phase Equilibria 112 (1995) 1–22 57. Kabelac, S.; Siemer, M.; Ahrendts, J.: Thermodynamische Stoffdaten für Biogase. Forsch. Ing.wesen 70 (2005) 46–55 58. Landolt-Börnstein: Numerical data and functional relationships in science and technology: new series. Hrsg. W. Martienssen Berlin: Springer 2007 59. Peneloux, A.; Ranzq, E.; Freze, R.: A consistent correction for Redlich-Kwong-Soave Volumes. Fluid Phase Equilibria 8 (1982) 7–23 60. (Dohrn, 1994) Kap. 3 61. Span, R.; Wagner, W.: Equations of State for Technical Applications. I–III. Int. J. Thermophys. 24 (2003) 1– 161 62. Wagner, W.; Saul, A.; Pruß, A.: Int. Equations for the pressure along the melting and along the sublimation curve of ordinary water substance. J. Phys. Chem. Ref. Data 23 (1994) 3, 515–524 63. Tillner-Roth, R.: A Helmholtz free energy formulation of the thermodynamic properties of the mixture (water + ammonia). J. Phys. Chem. Ref. Data 27 (1998) 63–96 64. Kunz, O.; Klimeck, R.; Wagner, W.; Jaeschke, M.: The GERG-2004 wide range reference equation of state for natural gases. Dissertation, Ruhr-Universität Bochum
Spezielle Literatur zu Kapitel 3 1. (Walas 1985), p. 255 2. Baehr, H.D.; Kabelac, S.: Thermodynamik. 13. Aufl. Berlin: Springer 2006, Abb. 4.1 3. In [2], Abb. 4.2 4. In [2], Abb. 4.3 5. In [2], S. 196–198 6. (Reid/Prausnitz/Poling 1987), p. 205–218 7. Boublik, T.; Fried, V.; Hála, E.: The vapour pressures of pure substances. 3rd ed. Amsterdam: Elsevier 1984 8. Gmehling, J.; et al.: Vapor-liquid equilibrium data collection (DECHEMA Chemistry Data Series, Vol. 1, Part 1–8). Frankfurt a.M.: DECHEMA 1977–1988
9. In [6], Anhang D, Dampfdruckgleichung Nr. 1 mit Konstanten für ca. 400 Stoffe 10. Wagner, W.; Kruse, A.: Properties of water and steam. The industrial standard IAPWS-IF97 for the thermodynamic properties and supplementary equations for other properties. Tables based on these equations. Berlin: Springer 1998, Table 1 11. In [2], Abb. 4.18 12. In [2], Abb. 4.20 13. In [1], Fig. 5.17b 14. Haase, R.; Schönert, H.: Solid-liquid equilibrium. Oxford: Pergamon Press 1969, p. 88–134 15. Treybal, R.E.: Liquid extraction. 2nd ed. New York: McGraw-Hill 1963, p. 13–21 16. Stephan, K.; Mayinger, F.: Thermodynamik. Band 2: Mehrstoffsysteme and chemische Reaktionen. 14. Aufl. Berlin: Springer 1999 17. In [16], S. 236 18. In [16], S. 240 19. Gmehling, J.; Kolbe, B.: Thermodynamik. 2. Aufl. Weinheim: VCH 1992 20. In [6], Table 8.24 21. Henley, E.J.; Seader, J.D.: Equilibrium-stage separation operations in chemical engineering. New York: Wiley 1981, p. 281–284 22. In [6], p. 348 23. Nghiem, L.X.; Li, Y.K.: Computation of multiphase equilibrium phenomena with an equation of state. Fluid Phase Equilibria 17 (1984) 77–95 24. Prausnitz, J.M.; et al.: Computer calculations for multicomponent vapor-liquid and liquid-liquid equilibria. Englewood Cliffs, N.J.: Prentice-Hall 1980 25. In [1], p. 370–371 26. Barin, I.: Thermochemical data of pure substances. 3. Aufl. Weinheim: VCH 1995 27. Wagmann, D.D.; et al.: The NBS Tables of chemical thermodynamic properties. Selected values of inorganic and C1 and C2 organic substances in SI units. J. Phys. Chem. Ref. Data 11 (1982), Suppl. No. 2 28. Stull, D.R.; Westrum, E.F., Jr; Sinke, G.C.: The chemical thermodynamics of organic compounds. New York: Krieger 1987 29. In [6], p. 656–732 30. In [2], Tabelle 10.6 31. Smith, W.R.; Missen, R.W.: Chemical reaction equilibrium analysis. New York: Wiley 1982, p. 141–145 32. In [31], p. 184–192
Allgemeine Literatur zu Kapitel 4 Baehr, H.D.; Stephan, K.: Wärme- und Stoffübertragung. 5. Aufl. Berlin: Springer 2006
Literatur
Bird, R.B.; Stewart, W.E.; Lightfoot, E.N.: Transport phenomena. 2nd ed. New York: Wiley 2002 Gersten, K.; Herwig, H.: Strömungsmechanik. Braunschweig: Vieweg 1992 Jischa, M.: Konvektiver Impuls-, Wärme- und Stoffaustausch. Braunschweig: Vieweg 1982 Ouwerkerk, C.: Theory of macroscopic systems. Berlin: Springer 1991 Schlichting, H.; Gersten, K.: Grenzschichttheorie. 10. Aufl. Berlin: Springer 2006 Slattery, J.C.: Advanced transport phenomena. Cambridge: Cambridge Univ. Press 1999 Taylor, R.; Krishna, R.: Multicomponent mass transfer. New York: Wiley 1993
Spezielle Literatur zu Kapitel 4 1. Slattery, J.C.: Momentum, energy and mass transfer in continua. 2nd ed. Huntington, N.Y.: Krieger 1981, p. 475 2. Özi¸sik, M.N.: Heat conduction. 2nd ed. New York: Wiley 1993, p. 618ff 3. Hirschfelder, J.O.; Curtiss, C.F.; Bird, R.B.: Molecular theory of gases and liquids. New York: Wiley 1964 4. Weißmantel, Ch.; Hamann, C.: Grundlagen der Festkörperphysik. 4. Aufl. Heidelberg: Barth 1995 5. (Baehr/Stephan 2006), Anhang B 6. Thermophysikalische Stoffgrößen. (Hrsg. W. Blanke). Berlin: Springer 1989 7. Kakaç, S.; Yenner, Y.: Convective heat transfer. 2nd ed. Boca Raton, Fla.: CRC Press 1995, App. B 8. Reid, R.C.; Prausnitz, J.M.; Poling, B.E.: The properties of gases and liquids. 4th ed. New York: McGrawHill 1987 9. Stephan, K.; Heckenberger, T.: Thermal conductivity and viscosity data of fluid mixtures. (DECHEMA Chemistry data series, Vol. X. Part 1). Frankfurt: DECHEMA 1988 10. (Taylor/Krishna 1993), Sect. 1.2 11. In [3], p. 487 12. (Ouwerkerk 1991), p. 33ff 13. In [10], Sect. 2.1.4 14. In [12], p. 213 15. In [10], App. D 16. In [10], p. 56 17. In [10], Sect. 3.3.1 18. Cussler, E.L.: Diffusion. 2nd ed. Cambridge: Cambridge Univ. Press 2000
19. In [8], p. 581 20. VDI-Wärmeatlas, 10. Aufl. Berlin: Springer 2006, S. Da 27 21. In [10], p. 91 22. In [8], p. 612 23. In [8], p. 598 24. In [8], p. 441ff 25. In [1], p. 18 26. (Bird et al. 1960), p. 727 27. In [12], p. 207 28. In [5], Anhang A.2 29. In [12], p. 211 30. In [5], S. 283 31. In [12], p. 30ff 32. In [12], p. 225 33. Görtler, H.: Dimensionsanalyse. Berlin: Springer 1975 34. (Jischa 1982), S. 68 35. (Schlichting/Gersten 1997), S. 562 36. In [35], S. 574 37. (Gersten/Herwig 1992), S. 487 38. In [37], S. 707ff 39. In [35], S. 604 40. In [34], S. 218 41. Jones, W.P.; Launder, B.E.: The prediction of laminarization with a two equation model of turbulence. Int. J. Heat Mass Transfer 15 (1972) 301–314 42. In [34], S. 194 43. In [35], S. 605 44. In [35], Abschnitt 18.5.2 und 18.5.3 45. In [35], S. 612 46. In [37], S. 120ff 47. In [35], S. 552ff 48. In [35], S. 600 49. In [35], S. 214, 244, 639 50. In [34], S. 52, 74, 158, 236 51. In [35], S. 347, 679 52. In [37], S. 193 53. In [35], S. 293 54. In [37], S. 718 55. In [35], S. 291 und S. 674 56. In [37], S. 215 57. In [37], S. 217 58. In [5], S. 407 59. Grigull, U.; Sandner, H.: Wärmeleitung. 2. Aufl. Berlin: Springer 1990, S. 15 60. VDI-Wärmeatlas. 10. Aufl. Berlin: Springer 2006 61. Carslaw, H.S.; Jaeger, J.C.: Conduction of heat in solids. 2nd ed. Oxford: Clarendon Press 1986
F95
G1
G
Elektrotechnik
H. Clausert K. Hoffmann W. Mathis G. Wiesemann H. Zürneck
G Elektrotechnik
Netzwerke G. Wiesemann 1 Elektrische Stromkreise 1.1 Elektrische Ladung und elektrischer Strom 1.1.1 Elementarladung
Bild 1-1. Der Zusammenhang zwischen Strom i und La-
Das Elektron hat die Ladung −e, das Proton die Ladung +e; hierbei ist e = 1,602176487 · 10−19 A s die Elementarladung. Jede vorkommende elektrische Ladung Q ist ein ganzes Vielfaches der Elementarladung:
dung Q
Q = ne . 1.1.2 Elektrischer Strom
Wenn sich Ladungsträger (Elektronen oder Ionen) bewegen, so entsteht ein elektrischer Strom, seine Größe wird als Stromstärke i bezeichnet. Sie wird als Ladung (oder Elektrizitätsmenge) durch Zeit definiert: " dQ ; Q= i dt . i= dt Fließt ein Strom i während der Zeit Δt = t2 − t1 durch einen Leiter, so tritt durch jede Querschnittsfläche dieses Leiters die Ladung "t2 ΔQ =
i(t) dt
se, Thyristoren), Elektrolyten (galvanische Elemente, Galvanisieren), in Gasen (z. B. Leuchtstofflampen, Funkenüberschlag in Luft) und im Hochvakuum (Elektronenröhren). Kommt ein Strom durch die Bewegung positiver Ladungen zustande, so betrachtet man deren Richtung auch als die Richtung des Stromes (konventionelle Stromrichtung). Wenn aber z. B. Elektronen von der Kathode zur Anode einer Elektronenröhre fliegen (Bild 1-2), so geht der positive Strom i von der Anode zur Kathode (v Geschwindigkeit der Elektronen). Die folgenden drei Wirkungen des Stromes werden zur Messung der Stromstärke verwendet: 1. Magnetfeld (Kraftwirkung) 2. Stofftransport (z. B. bei Elektrolyse) 3. Erwärmung (eines metallischen Leiters). Besonders geeignet zur Strommessung ist die Kraft, die auf eine stromdurchflossene Spule im Magnetfeld wirkt (Drehspulgerät). Die Kraft, die zwei strom-
t1
hindurch (Bild 1-1). Technisch wichtig sind außer dem Strom in metallischen Leitern auch der Ladungstransport in Halbleitern (Dioden, Transistoren, Integrierte Schaltkrei-
Bild 1-2. Konventionelle Richtung des Stromes i und Geschwindigkeit v der Elektronen in einer Hochvakuumdiode
G2
G Elektrotechnik / Netzwerke
durchflossene Leiter aufeinander ausüben, dient zur Definition der SI-Einheit Ampere für den elektrischen Strom (vgl. B 1.3): 1 Ampere (1 A) ist die Stärke eines zeitlich konstanten Stromes durch zwei geradlinige parallele unendlich lange Leiter von vernachlässigbar kleinem Querschnitt, die voneinander den Abstand 1 m haben und zwischen denen die durch diesen Strom hervorgerufene Kraft im leeren Raum pro 1 m Leitungslänge 2 · 10−7 m kg/s2 = 2 · 10−7 N beträgt. Beispiel für die Driftgeschwindigkeit von Elektronen. Durch einen Kupferdraht mit dem Querschnitt A = 50 mm2 fließt der Strom I = 200 A (Dichte der freien Elektronen: n = 85 · 1027 /m3 = 85/nm3 ). Die Driftgeschwindigkeit ist vdr =
mm I ≈ 0,3 . enA s
1.1.3 1. Kirchhoff’scher Satz (Satz von der Erhaltung der Ladungen; Strom-Knotengleichung)
Die Ladungen, die in eine (resistive) elektrische Schaltung hineinfließen, gehen dort weder verloren, noch sammeln sie sich an, sondern sie fließen wieder heraus. Dies gilt auch für die Ströme; insbesondere in den Knoten (Verzweigungspunkten) elektrischer Schaltungen (Bild 1-3a) gilt: iein = iaus ; iein − iaus = 0 . Man kann aber auch
i=0
schreiben. Dann muss man z. B. einfließende Ströme mit positivem Vorzeichen einsetzen und ausfließende mit negativem (oder auch umgekehrt). Ist die
Richtung des Stromes in einem Zweig zunächst nicht bekannt, so ordnet man ihm willkürlich einen sogenannten Zählpfeil bzw. eine sog. Bezugsrichtung zu. Liefert die Rechnung dann einen negativen Zahlenwert, so fließt der Strom entgegen der angenommenen Zählrichtung.
1.2 Energie und elektrische Spannung; Leistung 1.2.1 Definition der Spannung
Zwei positive Ladungen Q1 , Q2 stoßen sich ab (Bild 1-4). Ist Q1 unbeweglich nach Q2 beweglich, so ist mit der Verschiebung der Ladung Q2 vom Punkt A in den Punkt B eine Abnahme der potenziellen Energie Wp der Ladung Q2 verbunden: WA − WB . Wp ist der Größe Q2 proportional, also gilt auch für die Energieabnahme: WA − WB ∼ Q2 . Schreibt man statt dieser Proportionalität eine Gleichung, so tritt hierbei ein Proportionalitätsfaktor auf, den man als die elektrische Spannung UAB zwischen den Punkten A und B bezeichnet: WA − WB = UAB . Q2 Eine Einheit der elektrischen Spannung ergibt sich daher, wenn man eine Energieeinheit durch eine Ladungseinheit teilt. Im SI wählt man: 1Ws 1W 1J = = . 1 Volt = 1 V = 1C 1As 1A 1.2.2 Energieaufnahme eines elektrischen Zweipols
Ein elektrischer Zweipol (Bild 1-5a), zwischen dessen beiden Anschlussklemmen eine (i. Allg. zeitabhängige) Spannung u liegt und in den der (i. Allg.
Bild 1-3. Knoten mit 3 zufließenden und 2 abfließenden
Strömen
Bild 1-4. Kraftwirkung zwischen zwei Punktladungen
1 Elektrische Stromkreise
Bild 1-5. a Zweipol als (Energie-)Verbraucher; b Spannung zwischen zwei Punkten unterschiedlichen Potenzials
ebenfalls zeitabhängige) Strom i hinein und aus dem er auch wieder herausfließt, nimmt im Zeitraum von t1 bis t2 folgende Energie auf: "t2 W=
ui dt . t1
Hierbei werden u und i gleichsinnig gezählt, so wie es in Bild 1-5a dargestellt ist (Verbraucherzählpfeilsystem). Das Produkt ui bezeichnet man als die elektrische Leistung p: dW(t) . dt Im Falle zeitlich konstanter Größen i = I und u = U wird ui = p =
W = UI t ; P = UI = W/t . (Für konstante Ströme, Spannungen und Leistungen werden gewöhnlich Großbuchstaben verwendet; die Kleinbuchstaben i, u, p für die zeitabhängigen Größen.) Ist ui > 0, so nimmt der Zweipol (Bild 1-5a) Leistung auf (Verbraucher); ist ui < 0, so gibt er Leistung ab (Erzeuger, Generator). 1.2.3 Elektrisches Potenzial
Die elektrische Spannung zwischen zwei Punkten (a und b) kann häufig auch als die Differenz zweier Potenziale ϕ aufgefasst werden (Bild 1-5b):
Ladungsausgleich, so verlieren die Ladungen hierbei ihre potenzielle Energie; dies geschieht in allen Verbrauchern elektrischer Energie. Erzeuger elektrischer Energie hingegen bewirken eine Trennung positiver von negativen Ladungen, erhöhen also deren potenzielle Energie: Solche Erzeuger nennt man auch Spannungsquellen. (Die Ausdrücke Erzeuger und Verbraucher sind üblich, obwohl in ihnen eigentlich nur eine Energieumwandlung stattfindet.) Das Bild 1-6 zeigt als Beispiel einer Gleichspannungsquelle ein galvanisches Element. Die Energie, die hier bei chemischen Reaktionen frei wird, bewirkt, dass es zwischen den positiven Ladungen des Pluspols und den negativen des Minuspols innerhalb der Quelle nicht zum Ladungsausgleich kommt. Ein Ausgleich kommt nur zustande, wenn an die beiden Klemmen a, b ein Verbraucher (z. B. ein Ohm’scher Widerstand R angeschlossen wird (im Verbraucher gibt es keine „elektromotorische Kraft“, die dem Ladungsausgleich entgegenwirkt). In dem dargestellten einfachen Stromkreis wird die Quellenleistung Pq vom Widerstand „verbraucht“: Pq = PR = UI . Einige Schaltzeichen (Symbole) für Spannungsquellen sind in Bild 1-7 zusammengestellt. Typische Spannungen galvanischer Elemente bzw. „Batterien“ sind 1,5 V; 3 V; 4,5 V; 9 V; 18 V; BleiAkkumulatoren von Pkws haben allgemein 12 V. Solarzellen haben einen anderen Mechanismus und können ca. 0,5 V erreichen; durch Bündelung vieler Zellen werden Solarmodule mit wesentlich höheren Spannungen aufgebaut. Die inneren Verluste einer Spannungsquelle werden im Schaltbild durch den inneren Widerstand repräsentiert: die reale Quelle wird als Reihenschaltung einer idealen Spannungsquelle (Uq ) mit dem inneren Widerstand (Ri ) aufgefasst (Bild 1-8).
uab = ϕa − ϕb . Ist z. B. uab = 2 V, so wäre das Wertepaar ϕa = 2 V, ϕb = 0 V ebenso wie ϕa = 3 V, ϕb = 1 V usw. eine mögliche Darstellung. 1.2.4 Spannungsquellen
Positive und negative Ladungen ziehen sich an. Kommt es dadurch in elektrischen Schaltungen zum
Bild 1-6. Belastete Gleichspannungsquelle (galvanisches
Element)
G3
G4
G Elektrotechnik / Netzwerke
Bild 1-10. Schaltung mit 2 Maschen
Pauf = I1 U1 + I2 U2 + I2 U3 . Wegen Pab = Pauf und I = I1 + I2 wird hieraus Bild 1-7. Symbole für Spannungsquellen
I1 Uq + I2 Uq = I1 U1 + I2 (U2 + U3 ) . Dies muss u. a. auch in den Sonderfällen I2 = 0 oder I1 = 0 gelten, es ist also Uq = U1 und Uq = U2 + U3 und damit auch U1 = U2 + U3 .
Bild 1-8. Ersatzschaltbild einer realen Spannungsquelle
1.3 Elektrischer Widerstand 1.3.1 Ohm’sches Gesetz
Ohm’sche Widerstände sind solche, bei denen die Stromstärke i der anliegenden Spannung u proportional ist: u ∼ i (Bild 1-11). Diese Proportionalität beschreibt man als Gleichung in der Form Bild 1-9. Umlauf mit 5 Spannungen
1.2.5 2. Kirchhoff’scher Satz (Satz von der Erhaltung der Energie; Spannungs-Maschengleichung)
In jeder elektrischen Schaltung ist die in einer bestimmten Zeit von den Quellen insgesamt abgegebene Energie gleich der von allen Verbrauchern insgesamt aufgenommenen Energie; dasselbe gilt natürlich für die Leistungen. Daraus folgt, dass bei jedem (geschlossenen) Umlauf (Bild 1-9) u=0 wird, was in Bild 1-10 an einem Schaltungsbeispiel verdeutlicht ist. (In Bild 1-9 zählen die Spannungen, die dem willkürlich festgelegten Umlaufsinn entsprechen, positiv – die anderen negativ.) In der Schaltung in Bild 1-10 ist die Quellenleistung (an die Schaltung abgegebene L.) Pab = Uq I und die Verbraucherleistung (von der Schaltung aufgenommene L.)
u = Ri , (Ohm’sches Gesetz) wobei man den Proportionalitätsfaktor R als Ohm’schen Widerstand(swert) bezeichnet. Für manche Aussagen nützlicher ist der Leitwert G = 1/R . Das Ohm’sche Gesetz lässt sich damit auch in der Form i = Gu schreiben; außerdem gilt R = u/i ;
G = i/u .
Die SI-Einheit des Widerstandes ist das Ohm (Ω = V/A), ferner ist 1 Siemens = 1 S = 1/Ω.
Bild 1-11. Der Zusammenhang zwischen Strom i und Span-
nung u an einem Ohm’schen Widerstand R
1 Elektrische Stromkreise
1.3.2 Spezifischer Widerstand und Leitfähigkeit
Für den Widerstand eines Leiters (Bild 1-12) mit konstanter Querschnittsfläche A und der Länge l gilt R ∼ l/A. Als Proportionalitätsfaktor wird hier die Größe eingeführt: l R= , A
=
A R. l
ist materialspezifisch (und temperaturabhängig) und wird als spezifischer Widerstand (Resistivität) bezeichnet. Für den Leitwert des Leiters gilt G=
γA A = .
l l
Man nennt γ die Leitfähigkeit (die Konduktivität) des Leitermaterials (γ = 1/ ). In Tabelle 1-1 sind die Größen und γ für verschiedene Materialien angegeben. Übliche Einheiten für sind (vgl. = RA/l): Ω · mm2 = 1 μΩ · m . 1 m Anschauliche Deutung: = 1 Ω · mm2 /m bedeutet, dass ein Draht mit dem Querschnitt 1 mm2 und der Länge 1 m den Widerstand 1 Ω hat.
= 1 Ω · cm bedeutet, dass ein Würfel von 1 cm Kantenlänge zwischen zwei gegenüberliegenden Flächen gerade den Widerstand 1 Ω hat. 1.3.3 Temperaturabhängigkeit des Widerstandes
In metallischen Leitern gilt die Proportionalität i ∼ u (Ohm’sches Gesetz) nur bei konstanter Temperatur.
nimmt bei Metallen im Allgemeinen mit der Temperatur θ zu. Bei reinen Metallen (außer den ferromagnetischen) stellt = f (θ) nahezu eine Gerade dar. Bestimmte Legierungen verhalten sich allerdings anders, z. B. Manganin (86% Cu, 12% Mn, 2% Ni), siehe Bild 1-13. Bei reinen Metallen ist folgende Beschreibung der Abhängigkeit des spezifischen Widerstandes von der Temperatur zweckmäßig:
Bild 1-12. Leiter mit konstantem Querschnitt
Bild 1-13. Temperaturabhängigkeit spezifischer Widerstän-
de
= 20 (1 + α20 Δθ + β20 Δθ2 + . . .) . Hierbei ist Δθ = θ − 20 ◦ C und
20 Resistivität bei 20 ◦ C α20 linearer Temperaturbeiwert β20 quadratischer Temperaturbeiwert . Einige Temperaturbeiwerte (Temperaturkoeffizienten) sind in Tabelle 1-1 angegeben. Supraleitung
Bei vielen metallischen Stoffen ist unterhalb einer sog. Sprungtemperatur T c keine Resistivität mehr messbar ( < 10−23 Ω · m) (Tabelle 1-2); dieser Effekt wird als Supraleitung bezeichnet. Bei den guten Leitern Cu, Ag, Au konnte bisher noch keine Supraleitung nachgewiesen werden. Das Bekanntwerden von Keramiksintermaterialien mit T c > 90 K („Hochtemperatur-Supraleitung“) hat seit 1986 dazu geführt, dass die Supraleitungs-Forschung in vielen Ländern sehr intensiviert worden ist. Sprungtemperaturen oberhalb von 77,36 K (Siedetemperatur des Stickstoffs) erlauben es, Supraleitung mithilfe von flüssigem Stickstoff zu erreichen, also ohne das teure flüssige Helium auszukommen (vgl. Tabelle 1-3).
G5
G6
G Elektrotechnik / Netzwerke
Tabelle 1-1. Spezifischer Widerstand und Temperaturbeiwerte verschiedener Stoffe
Stoff 1. Reinmetalle Aluminium Blei Eisen Gold Kupfer Nickel Platin Quecksilber Silber Zinn 2. Legierungen Konstantan (55% Cu, 44% Ni, 1% Mn) Manganin (86% Cu, 2% Ni, 12% Mn) Messing 3. Kohle, Halbleiter Germanium (rein) Graphit Kohle (Bürstenkohle) Silicium (rein) 4. Elektrolyte Kochsalzlösung (10%) Schwefelsäure (10%) Kupfersulfatlösung (10%) Wasser (rein) Wasser (destilliert) Meerwasser 5. Isolierstoffe Bernstein Glas Glimmer Holz (trocken) Papier Polyethylen Polystyrol Porzellan Transformator-Öl
20 10−6 Ω · m
γ20 106 S/m
α20 10−3/K
β20 10−6/K2
0,027 0,21 0,1 0,022 0,017 0,07 0,098 0,97 0,016 0,12
37 4,75 10 45,2 58 14,3 10,5 1,03 62,5 8,33
4,3 3,9 6,5 3,8 4,3 6,0 3,5 0,8 3,6 4,3
1,3 2,0 6,0 0,5 0,6 9,0 0,6 1,2 0,7 6,0
0,5 0,43 0,066 Ω·m
2 2,27 15 S/m
−0,04 ±0,01 1,5
0,46 8,7 · 10−6 (40 . . . 100) · 10−6 2300
2,2 115 · 103 (10 . . . 25) · 103 0,43 · 10−3
79 · 10−3 25 · 10−3 300 · 10−3 2,5 · 105 4 · 104 300 · 10−3
12,7 40,0 3,3 0,4 · 10−3 2,5 · 10−3 3,3
−0,2 . . . − 0,8
>1016 1011 . . . 1012 1013 . . . 1015 109 . . . 1013 1015 . . . 1016 1016 1016 bis 5 · 1012 1010 . . . 1013
Mit Supraleitern lassen sich verlustlos sehr starke Magnetfelder erzeugen (wie sie in der Hochenergiephysik, in Induktionsmaschinen oder für Magnetbahnen gebraucht werden). Bei einer Reihe dieser Stof-
fe setzt aber die Supraleitung durch Einwirkung eines starken Magnetfeldes wieder aus (Nb-Sn- und Nb-Ti-Legierungen z. B. bleiben aber noch unter dem Einfluss recht starker Magnetfelder supraleitend). Die
2 Wechselstrom
Tabelle 1-2. Sprungtemperatur verschiedener Supraleiter
Stoff T c in K Cd 0,52 Al 1,18 Ti 0,40 Sn 3,72 Hg 4,15 V 5,4 Ta 4,47 Pb 7,20 NbTi 8,5 Nb 9,25 Tc 7,8 V3 Ga 16,8 Nb3 Sn 18,0 Nb3 Ge 23,2 Bax La5–x Cu5 O3–y > 30 Y-La-Cu-O > 90 K Kelvin; absoluter Nullpunkt: 0 K =ˆ − 273,15 ◦ C Tabelle 1-3. Schmelz- und Siedetemperatur von He, H2 , N2
und O2 Stoff
He H2 N2 O2
Schmelztemperatur T sl in K 13,81 63,15 54,36
Siedetemperatur T lg in K 4,22 20,28 77,36 90,20
Möglichkeit verlustloser Energieübertragung über supraleitende Kabel wird auch dadurch begrenzt, dass oberhalb bestimmter Stromdichten (kritischer Stromdichten) Supraleitung unmöglich wird; vgl. auch Abschnitt B.
Bild 2-1. Sinusförmiger Wechselstrom
stimmt (wird eine dieser drei Größen zeitabhängig, so spricht man von Modulation). Für die Periodendauer T der Schwingung gilt: T = 2π/ω , die Frequenz ist f =
ω 1 = . T 2π
Sinusförmige Ströme haben den Mittelwert null (sie haben keinen Gleichanteil) und sind Wechselströme. (Alle periodischen Größen ohne Gleichanteil nennt man Wechselgrößen.) Eine Summe aus einem Gleich- und einem Wechselstrom nennt man Mischstrom (Bild 2-2). Für i(t) kann man auch schreiben: i(t) = iˆRe {exp [ j(ωt + ϕ0 )]} = Re {iˆ exp ( jϕ0 ) exp ( jωt)} = Re {iˆ exp ( jωt)} = Re {i(t)} . Hierbei ist iˆ = iˆ exp ( jϕ0 )
die komplexe Amplitude
und i(t) = iˆ exp ( jωt)
die komplexe Zeitfunktion
des Stromes i.
2 Wechselstrom 2.1 Beschreibung von Wechselströmen und -spannungen Ein sinusförmig schwingender Strom (Bild 2-1), i = iˆ cos (ωt + ϕ0 ) , ist durch die drei Parameter Scheitelwert (Amplitude) iˆ, Kreisfrequenz ω und Nullphasenwinkel ϕ0 be-
Bild 2-2. Mischstrom vor und nach der EinwegGleichrichtung
G7
G8
G Elektrotechnik / Netzwerke
Die Amplitude iˆ geht aus der komplexen Amplitude iˆ durch Betragsbildung hervor: iˆ = |iˆ| . Die reelle Zeitfunktion i(t) entsteht aus der komplexen durch Realteilbildung: i(t) = Re {i(t)} . √ Den Wert iˆ / 2 = I bezeichnet man als komplexen Effektivwert (vgl. 2.2) der Größe i. Die Kennzeichnung komplexer Größen durch Unterstreichung kann entfallen, wenn verabredet ist, dass die betreffenden Formelbuchstaben eine komplexe Größe darstellen. Beträge sind dann durch Betragsstriche zu kennzeichnen.
Bild 2-3. Dreieckförmiger Strom i(t)
und das Verhältnis des Effektivwertes zum Gleichrichtwert als Formfaktor kf = I/|i| . In der Tabelle 2-2 sind die Mittelwerte, der Scheitelund der Formfaktor eines sinusförmigen (Bild 2-1) und eines dreiecksförmigen (Bild 2-3) Wechselstromes angegeben.
2.2 Mittelwerte periodischer Funktionen
2.3 Wechselstrom in Widerstand, Spule und Kondensator
Für einen periodischen Strom i(t) mit der Periode T werden verschiedene Mittelwerte definiert (Tabelle 2-1 und Bild 2-2). Das Verhältnis von Scheitelwert zu Effektivwert bezeichnet man als den Scheitelfaktor
In der Tabelle 2-3 sind die Zusammenhänge zwischen Strom und Spannung in Widerstand, (idealer) Spule und (idealem) Kondensator – allgemein und für eingeschwungene Sinusgrößen – in unterschiedlicher Weise dargestellt, vgl. Bild 2-5.
ˆ ks = i/I
Reale Spule und realer Kondensator
Tabelle 2-1. Mittelwerte eines periodischen Stromes τ.+ T
arithmetischer Mittelwert
1 i¯ = T
Einweggleichrichtwert
1 τ.+ T i¯EG = iEG (t) dt T τ
Gleichrichtwert (elektrolytischer Mittelwert) Effektivwert (quadratischer Mittelwert)
1 τ.+ T |i¯| = |i(t)| dt T τ 8 I=
Eine eisenlose Spule hat außer ihrer Induktivität L auch den Ohm’schen Widerstand R der Wicklung (Wicklungsverluste). Für eine genauere Betrachtung muss daher jede Spule als RL-Reihenschaltung dargestellt werden (Bild 2-4a). In einer Spule mit einem Eisenkern treten außer den Wicklungsverlusten („Kupferverlusten“) auch noch im Eisenkern Ummagnetisierungsverluste (Hystereseverluste) und Wirbelstromverluste auf, die man zusammenfassend als Eisenverluste bezeichnet. Diese Eisenverluste stellt man im Ersatzschaltbild (Bild 2-4b) durch einen Widerstand parallel zur Induktivität dar.
i(t) dt
τ
1 τ.+ T 2 i (t) dt T τ
Tabelle 2-2. Mittelwerte, Scheitel- und Formfaktor des sinusförmigen und des dreiecksförmigen Wechselstromes
i¯ Sinusförmiger Strom
0
Dreieckförmiger Strom
0
i¯EG iˆ = 0,318iˆ π 0,25iˆ
|i¯| 2iˆ π
I = 0,637iˆ 0,5iˆ
iˆ √ = 0,707iˆ 2 iˆ √ = 0,577iˆ 3
ks √ 2 = 1,414 √ 3 = 1,732
kf π √ = 1,111 2 2 2 √ = 1,155 3
2 Wechselstrom
Tabelle 2-3. Zusammenhang zwischen Spannung und Strom bei Widerstand, Spule und Kondensator (Komplexe Größen sind nicht besonders gekennzeichnet.)
Bauelement
Widerstand
Spule
Kondensator
Kennzeichnende Größe
Resistanz, Ohm’scher W. R
Induktivität L
Kapazität C
allgemein
u= R·i
u= L·
i=C·
komplexe Effektivwerte von Sinusgrößen
U =R·I
di dt U = jωL · I
Zusammenhang zwischen U und I
du dt I = jωC · U
Bild 2-5 stellt (ab jetzt ohne Unterstreichung der komplexen Effektivwerte!) die Zeiger für U und I an den idealen Elementen Widerstand, Spule und Kondensator dar. Dabei ist U jeweils (willkürlich) als reell vorausgesetzt. Man sagt:
Bild 2-4. Reale Spule und realer Kondensator. a Ersatzschaltung einer eisenfreien Spule; b Ersatzschaltung einer Spule mit Eisenkern; c Ersatzschaltung eines Kondensators
(Ein noch genaueres Ersatzschaltbild müsste auch die Kapazität zwischen den einzelnen Windungen berücksichtigen.) Bei einem Kondensator hat das Dielektrikum zwischen den beiden Elektroden auch eine (geringe) elektrische Leitfähigkeit. Daher stellt man bei genauerer Betrachtung einen Kondensator als RC-Parallelschaltung dar (Bild 2-4c). (Bei noch genauerer Darstellung dürfte auch die Induktivität der Zuleitung nicht vernachlässigt werden.)
(a) Der Strom ist im Widerstand mit der Spannung phasengleich („in Phase“). (b) Der Strom eilt der Spannung an der Spule um 90◦ nach. (c) Der Strom eilt der Spannung am Kondensator um 90◦ voraus. Weitere Beispiele für Zeigerdiagramme: Bilder 7-3 und 7-9 in Kap. 7.
2.4 Zeigerdiagramm Die komplexen Zeitfunktionen u(t) und i(t), die komplexen Amplituden uˆ und ˆi und auch die komplexen Effektivwerte U und I können in der komplexen (Gauß’schen Zahlen-)Ebene als sog. Zeiger anschaulich dargestellt werden. Üblich ist die Zeigerdarstellung vor allem für die komplexen Effektivwerte.
Bild 2-5. Zeigerdiagramme für Strom und Spannungen bei a Widerstand, b Spule und c Kondensator
G9
G10
G Elektrotechnik / Netzwerke
2.5 Impedanz und Admittanz Entsprechend dem auf komplexe Effektivwerte angewandten Ohm’schen Gesetz UR /IR = R ergeben sich aus dem Verhältnis U/I auch bei Spule und Kondensator Größen mit der Dimension eines Widerstandes: UL = jωL = jXL = ZL ; IL 1 UC = jXC = ZC . = IC jωC Man nennt ZL bzw. ZC den komplexen Widerstand oder die Impedanz von Spule bzw. Kondensator. ZL und ZC sind rein imaginär; den Imaginärteil einer Impedanz Z nennt man ihren Blindwiderstand (ihre Reaktanz) X: XL = ωL ; XC = −1/(ωC) . Den Realteil R einer Impedanz nennt man ihren Wirkwiderstand (Resistanz). Die Kehrwerte der Impedanzen nennt man Admittanzen: Y = 1/Z ; 1 1 = jBL ; = YL = ZL jωL 1 YC = = jωC = jBC . ZC Auch YL und YC sind rein imaginär; man nennt den Imaginärteil einer Admittanz ihren Blindleitwert (ihre Suszeptanz) B: BL = −1/(ωL) ; BC = ωC . Den Realteil G einer Admittanz nennt man ihren Wirkleitwert (Konduktanz). Den Betrag |Z| einer Impedanz Z nennt man ihren Scheinwiderstand, den Betrag |Y| einer Admittanz Y ihren Scheinleitwert.
2.6 Kirchhoff’sche Sätze für die komplexen Effektivwerte Die Kirchhoff’schen Sätze gelten nicht nur für die Momentanwerte beliebig zeitabhängiger Spannungen (u) und Ströme (i) (insbesondere also auch für Gleichspannungen U und -ströme I), sondern auch für ˆ und komplexen Efdie komplexen Amplituden (u, ˆ i)
Bild 2-6. Zur Anwendung der Kirchhoff’schen Gesetze a Maschenregel (Umlauf); b Knotenregel
fektivwerte (U, I) eingeschwungener Sinusspannungen und -ströme (vgl. Bild 2-6) (ohne Nachweis): n n Uν = 0 ; Iν = 0 . ν=1
ν=1
Spannungen und Ströme, deren Zählpfeile umgekehrt gerichtet sind wie in Bild 2-6, erhalten bei der Summation ein Minuszeichen.
3 Lineare Netze Als linear werden Schaltungen bezeichnet, in denen nur konstante Ohm’sche Widerstände, Kapazitäten, Induktivitäten sowie Gegeninduktivitäten vorkommen und in denen die Quellenspannungen und -ströme entweder konstant sind oder aber einer anderen Strom- oder Spannungsgröße proportional sind („gesteuerte Quellen“; vgl. 3.2.3; 8.2; 25.4.1). Die linearen Gleichstromnetze stellen eine spezielle Klasse der linearen Netze dar, nämlich Netze, die nur Ohm’sche Widerstände sowie konstante Quellenspannungen U0 oder konstante Quellenströme I0 enthalten (Z → R; U → U0 ; I → I0 ).
3.1 Widerstandsnetze 3.1.1 Gruppenschaltungen Reihen- und Parallelschaltung
Impedanzen, durch die ein gemeinsamer Strom I hindurchfließt, nennt man in Reihe (in Serie) geschaltet. Eine Reihenschaltung von n Impedanzen (Bild 3-1) wirkt wie ein einziger Zweipol mit der Impedanz n Zν . Z= ν=1
Impedanzen, die an einer gemeinsamen Spannung U liegen (Bild 3-2), nennt man parallel geschaltet.
3 Lineare Netze
Gruppenschaltungen
Setzt man Reihen- und Parallelschaltungen ihrerseits wieder zu Reihen- und Parallelschaltungen zusammen usw., so lässt sich die Gesamtimpedanz zwischen zwei Anschlussklemmen dadurch berechnen, dass man alle parallel oder in Reihe geschalteten Zweipole bzw. Schaltungsteile schrittweise zusammenfasst; ein Beispiel hierfür zeigt Bild 3-4. Zwischen den Klemmen a und b ergibt sich die Gesamtimpedanz
Bild 3-1. Reihenschaltung
Bild 3-2. Parallelschaltung
Eine Parallelschaltung von n Impedanzen wirkt wie ein einziger Zweipol mit der Admittanz n
1 , Z ν=1 1 hierbei ist Yv = . Zν Y=
Yν =
Speziell für zwei parallelgeschaltete Zweipole mit den Impedanzen Z1 , Z2 ergibt sich als Gesamtimpedanz Z1 Z2 . Z= Z1 + Z2 Spannungs- und Stromteiler
Bei einer Reihenschaltung verhalten sich die Spannungen zueinander wie die zugehörigen Widerstände (Bild 3-3a): U2 Z2 = ; U Z1 + Z2
U2 =
ZA ZB + ZD ZA + ZB (Z1 + Z2 )(Z3 + Z4 + Z5 ) Z7 Z8 = + . Z1 + Z2 + Z3 + Z4 + Z5 Z7 + Z8
Zab = ZC + ZD =
Impedanz- und Admittanz-Ortskurven
Wenn man z. B. beschreiben will, wie die Impedanz Z = R + jωL einer RL-Reihenschaltung (Bild 3-5) von ω abhängt, so stellt man fest, dass die Spitzen der Z-Operatorpfeile auf einer Geraden liegen, siehe Bild 3-6c. In Bild 3-6 ist außerdem die Abhängigkeit der Größe Z von R und L dargestellt. Eine Kurve, auf der sich die Spitze einer komplexen Größe bei Veränderung eines reellen Parameters bewegt, nennt man Ortskurve. Für einige weitere Schaltungen sind Ortskurven in den Bildern 3-7 bis 3-10 dargestellt.
Z2 U. Z1 + Z2
Bei einer Parallelschaltung verhalten sich die Ströme zueinander wie die zugehörigen Leitwerte (Bild 3-3b): Y2 I2 Z1 = = . I Y1 + Y2 Z1 + Z2 Bild 3-4. Gruppenschaltung
Bild 3-5. RL-Reihenschaltung a R variabel, L const, ω Bild 3-3. Spannungsteilung und Stromteilung
const; b L variabel, ω const, R const; c ω variabel, L const, R const
G11
G12
G Elektrotechnik / Netzwerke
Bild 3-6. Z-Ortskurven einer RL-Reihenschaltung. a R variabel, L const, ω const; b L variabel, ω const, R const; c ω variabel, L const, R const Bild 3-8. Y-Ortskurven von Parallelschaltungen
(Z1 + Z2 )(Z3 + Z4 ) Z1 + Z2 + Z3 + Z4 Z1 Z3 Z2 Z4 = + Z1 + Z3 Z2 + Z4
Zab =
Bild 3-7. Die RLC-Reihenschaltung und ihre Z-Ortskurve
(Eingangsimpedanz einer abgeglichenen Brücke). In der Messtechnik sind Brückenschaltungen (Messbrücken) sehr wichtig.
3.1.2 Brückenschaltungen
3.1.3 Stern-Dreieck-Umwandlung
Die Brückenschaltung (Bild 3-11) ist ein Beispiel für eine Schaltung, die keine Gruppenschaltung ist. Im Allgemeinen ist hier U5 0, I5 0 und somit I1 I2 und I3 I4 ; Z1 , Z2 und Z3 , Z4 bilden also keine Reihenschaltungen. Ebenso ist i. Allg. U1 U3 und U2 U4 ; Z1 , Z3 und Z2 , Z4 bilden also keine Parallelschaltungen. Nur im Sonderfall
Jede beliebige Zusammenschaltung konstanter Impedanzen mit drei Anschlussklemmen („Dreipol“) kann durch einen gleichwertigen (äquivalenten) Impedanzstern oder ein gleichwertiges Impedanzdreieck (Bild 3-12) so ersetzt werden, dass die drei Eingangsimpedanzen ZE12 , ZE23 , ZE31 jeweils übereinstimmen. So kann jeder Stern in ein äquivalentes Dreieck umgewandelt werden und umgekehrt. Wenn die Impedanzen Z12 , Z23 , Z31 eines Dreiecks gegeben sind, so können hieraus die Impedanzen Z10 , Z20 , Z30
Z1 /Z2 = Z3 /Z4
(Brückenabgleich)
werden U5 = 0, I5 = 0, und es gilt
3 Lineare Netze
Bild 3-11. Brückenschaltung
Bild 3-9. Y-Ortskurven von Reihenschaltungen
Bild 3-12. Äquivalente Dreipole
Umgekehrt gilt Z10 Z20 + Z20 Z30 + Z30 Z10 , Z30 Z10 Z20 + Z20 Z30 + Z30 Z10 Z23 = , Z10 Z10 Z20 + Z20 Z30 + Z30 Z10 Z31 = . Z20 Stern-Vieleck-Umwandlungen sind für allgemeine n-Pole möglich (jeder n-strahlige Stern lässt sich durch ein vollständiges n-Eck ersetzen, nicht aber umgekehrt jedes vollständige n-Eck durch einen n-strahligen Stern). Z12 =
Bild 3-10. Z-Ortskurven von Parallelschaltungen
des äquivalenten Sternes berechnet werden: Z10 Z20 Z30
Z12 Z31 = , Z12 + Z23 + Z31 Z23 Z12 = , Z12 + Z23 + Z31 Z31 Z23 = . Z12 + Z23 + Z31
3.2 Strom- und Spannungsberechnung in linearen Netzen 3.2.1 Der Überlagerungssatz (Superpositionsprinzip)
In einem linearen Netz mit m Zweigen und n Spannungsquellen (Uq1 , . . . , Uqn ) kann der Strom Iμ im μ-
G13
G14
G Elektrotechnik / Netzwerke
Bild 3-13. Parallelschaltung von 3 Spannungsquellen an ei-
nem Verbraucher (Z4 )
ten Zweig berechnet werden, indem man zunächst die Wirkung jeder einzelnen Quelle auf diesen Zweig berechnet (wobei jeweils alle anderen Quellen unwirksam sein müssen, die Spannungsquellen also durch Kurzschlüsse zu ersetzen sind); die so berechneten Einzelwirkungen Iμ(ν) = Kμ(ν) Uqν
Kurzschlussstrom Ik und Leerlaufspannung UL ) mit der Widerstandskennlinie I = U/R aufgefasst werden (Bild 3-14b). Der durch Ik und UL beschriebene Zweipol hat den inneren Widerstand UL R1 R2 Ri = = . Ik R1 + R2 Dieser innere Widerstand ergibt sich auch, wenn man Uq unwirksam macht (kurzschließt) und den Widerstand Rab des Zweipols mit den Klemmen a, b berechnet (Bild 3-15a). Jeder lineare Zweipol (d. h. jeder Zweipol, der nur konstante Widerstände und konstante Quellenspannungen oder -ströme enthält) ist durch seine Arbeitsgerade (also allein durch das Wertepaar Ik , UL ) vollständig charakterisiert.
ergeben den Strom Iμ =
n ν=1
Äquivalenz von Zweipolquellen
Kμ(ν) Uqν
.
(Enthält das Netz auch oder nur Stromquellen, so kann man auch hier zunächst die Einzelwirkungen berechnen, die sich ergeben, wenn jeweils alle Stromquellen bis auf eine unwirksam gemacht werden, d. h. durch eine Leitungsunterbrechung ersetzt werden.) Beispiel Parallelschaltung von 3 Spannungsquellen an einem Verbraucher Z4 , Bild 3-13. Uq1 Y1 I4(1) = Y4 ; Y1 + Y2 + Y3 + Y4 Uq2 Y2 I4(2) = Y4 ; Y1 + Y2 + Y3 + Y4 Uq3 Y3 I4(3) = Y4 ; Y1 + Y2 + Y3 + Y4 Uq1 Y1 + Uq2 Y2 + Uq3 Y3 I4 = I4(1) + I4(2) + I4(3) = Y4 . Y1 + Y2 + Y3 + Y4
Aktive Zweipole, die durch dasselbe Wertepaar Ik , UL charakterisiert sind, stimmen nach außen hin überein, obwohl sie sich intern unterscheiden können. Man nennt Zweipolquellen mit gleicher Arbeitsgerade äquivalent. Ersatzspannungsquelle
Ein beliebiger Zweipol ist z. B. einer einfachen Spannungsquelle äquivalent, wenn deren Kurzschluss-
Bild 3-14. Belasteter Spannungsteiler. a Schaltbild; b die
Klemmengrößen U, I als Schnittpunkt-Koordinaten
3.2.2 Ersatz-Zweipolquellen Strom-Spannungs-Kennlinie einer linearen Zweipolquelle
Beispiel: Spannungsteiler. Die Klemmengrößen U, I der Spannungsteilerschaltung (Bild 3-14a) können als die Koordinaten des Schnittpunktes S der Arbeitsgeraden U = f (I) (Achsenabschnitte:
Bild 3-15. Spannungsteiler. a Zur Bestimmung des inneren Widerstandes eines Spannungsteilers; b Ersatzspannungsquelle eines Spannungsteilers (vgl. Bild 3-14a)
3 Lineare Netze
strom und Leerlaufspannung mit denen des beliebigen Zweipols übereinstimmen. Der Spannungsteilerschaltung 3-14a ist also die Ersatzspannungsquelle nach Bild 3-15b äquivalent. (Intern unterscheiden sich die Zweipole in den Bildern 3-14a und 3-15b: z. B. wird der Quelle bei Klemmenleerlauf, d. h. R = ∞, in der Schaltung 3-14a Leistung entnommen, in der Schaltung 3-15b aber nicht.)
Bild 3-17. Spannungsquelle an einer Brückenschaltung.
a Schaltung; b Schaltungsstruktur (Graph)
Ersatzstromquelle
Ein Paar äquivalenter Zweipole stellen auch die beiden Schaltungen in Bild 3-16 dar: ein Quellenstrom Iq (Bild 3-16a), der konstant (also unabhängig von R) ist, bildet zusammen mit Ri eine Stromquelle, deren Leerlaufspannung Iq Ri ist. Gilt für die Quellenspannung Uq der Schaltung 3-16b und den Quellenstrom Iq der Schaltung 3-16a der Zusammenhang U q = Iq Ri , so stimmen Leerlaufspannung und Kurzschlussstrom beider Schaltungen überein: die Schaltungen sind äquivalent. (Die Schaltungen 3-16a und b können auch als Wechselspannungsschaltungen verwendet werden: man muss nur Ri durch Zi und R durch Z ersetzen; außerdem bezeichnen dann Iq und Uq komplexe Effektivwerte.) 3.2.3 Maschen- und Knotenanalyse Struktur elektrischer Netze
Interessiert man sich nur für die Struktur eines Netzes (Anzahl der Knoten, Anzahl und Lage der Zweige), nicht aber für die Beschaffenheit der einzelnen Zweige, so kann man jeden Zweig durch eine einfache Linie ersetzen: Graph (Bild 3-17).
Bei den einzelnen Impedanzen Z sind die Bezugsrichtungen bzw. Zählpfeile von U und I jeweils in gleicher Richtung gewählt worden; diese Richtungen sind auch in die Zweige des Strukturgraphen übernommen worden. Das Netz hat 4 Knoten (k = 4), und es existieren alle möglichen 6 Direktverbindungen zwischen diesen Knoten (z = 6; „vollständiges Viereck“). Jeden Linienkomplex, in dem kein geschlossener Umlauf möglich ist (in dem es also jeweils nur einen einzigen Weg gibt, um von einem Punkt zu einem anderen zu gelangen) nennt man einen Baum : (1; 2), (1; 3), (5; 6), (1; 2; 3); (1; 2; 5); (1; 3; 5) usw. Ein Baum, der alle Knoten miteinander verbindet, ist ein vollständiger Baum: (1; 2; 3), (1; 2; 5), (1; 3; 5), (2; 3; 4) usw. Die jeweils nicht im vollständigen Baum enthaltenen Zweige nennt man Verbindungszweige; z. B. gehören zum vollständigen Baum (1; 2; 3) die Verbindungszweige (4; 5; 6). Bezeichnungen k Anzahl der Knoten zmax maximale Anzahl von Zweigen z Anzahl der vorhandenen Zweige vmax maximale Anzahl von Verbindungszweigen v Anzahl der vorhandenen Verbindungszweige b Anzahl der Zweige eines vollständigen Baumes nb Anzahl der möglichen vollständigen Bäume Zwischen diesen Größen gelten folgende Beziehungen: b = k −1, zmax = 0,5k(k − 1) , vmax = (0,5k − 1)(k − 1) ,
Bild 3-16. Äquivalente Quellen. a Ersatzstromquelle; b Er-
satzspannungsquelle
v = z − b = z − (k − 1) , nb = k(k−2) .
G15
G16
G Elektrotechnik / Netzwerke
Maschenanalyse
Gleichungsseiten werden anschließend beschrieben):
Für ein Netz mit k Knoten und z Zweigen können b = k − 1 voneinander linear unabhängige Knotengleichungen und v = z − b linear unabhängige Maschengleichungen aufgestellt werden; außerdem gilt an den einzelnen Impedanzen jeweils U = ZI. Im Fall des Netzes nach Bild 3-17a bedeutet das: für die 6 Spannungen und 6 Ströme erhält man b = 3 Knotengleichungen und v = 3 Maschengleichungen, außerdem die 6 Gleichungen U1 = Z1 I1 usw., insgesamt zunächst also 12 Gleichungen. Mit dem Verfahren der Maschenanalyse wird die Aufstellung der Gleichungen wesentlich erleichtert: man erhält direkt ein Gleichungssystem für die v Ströme in den Verbindungszweigen (im Beispiel also 3 Glei-
(Z4 + Z2 + Z1 ) I4 −Z2 I5 −Z1 I6 = 0 −Z2 I4 + (Z5 + Z3 + Z2 ) I5 −Z3 I6 = 0 −Z1 I4 + −Z3 I5 + (Z6 + Z1 + Z3 ) I6 = U q6 .
In der folgenden Darstellung lässt sich das Gleichungssystem, insbesondere das Koeffizientenschema (die Impedanzmatrix) besser überblicken: I4 Masche 4 Z4 + Z2 + Z1 Masche 5 −Z2 Masche 5 −Z1
I5 −Z2 Z5 + Z3 + Z2 −Z3
I6 −Z1 0 −Z3 0 Z6 + Z1 + Z3 Uq6
In Matrizenschreibweise: ⎤⎡ ⎤ ⎡ ⎡ ⎤ ⎥⎥⎥ ⎢⎢⎢ I4 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ (Z4 + Z2 + Z1 ) −Z2 −Z1 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ ⎥ −Z2 (Z5 + Z3 + Z2 ) −Z3 ⎥⎥⎥ ⎢⎢⎢ I5 ⎥⎥⎥ = ⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ . ⎢⎢⎢ ⎦⎣ ⎦ ⎣ ⎣ ⎦ −Z1 −Z3 (Z6 + Z1 + Z3 ) I6 Uq6
chungen für 3 Ströme, z. B. für die Ströme I4 , I5 , I6 ). Man bezeichnet die Maschenanalyse auch als Umlaufanalyse. Am folgenden Beispiel wird die Aufstellung des Gleichungssystems für die Ströme I4 , I5 , I6 der Schaltung in Bild 3-17a beschrieben: Zunächst wird irgendein vollständiger Baum aus den nb = k(k−2) = 42 = 16 möglichen ausgewählt, für das Beispiel der Baum mit den Zweigen 1; 2; 3. Die Zweige 4; 5; 6 werden dadurch zu Verbindungszweigen. Dann zeichnet man den Umlauf 4 in die Schaltung oder ihren Graphen ein (Bild 3-17b): dieser Umlauf entsteht dadurch, dass man bei A beginnend vom Zweig 4 folgt bis B (in der für Zweig 4 zuvor willkürlich festgelegten Richtung) und von dort nur über Baumzweige (also die Zweige 1; 2) zum Punkt A zurückkehrt. Auf die gleiche Art werden die Umläufe 5 und 6 gebildet. Die Wahl des vollständigen Baumes führt hier übrigens dazu, dass die 3 Umläufe gerade den 3 Maschen des Netzes folgen (Maschen: kleinste Umläufe, gültig jeweils für eine bestimmte Art, das Netz zu zeichnen). Für die Ströme in den Verbindungszweigen 4; 5; 6 wird nun das Gleichungssystem aufgestellt (die Bildungsgesetze für die Koeffizienten und die rechten
Anweisung zur direkten Aufstellung dieses Gleichungssystems Die (unbekannten) Ströme I4 , I5 , I6 werden (in dieser Reihenfolge) hingeschrieben. In die Hauptdiagonale der Impedanzmatrix werden in der entsprechenden Reihenfolge die Maschenimpedanzen der Umläufe 4; 5; 6 eingetragen (Maschenimpedanz: Summe aller Impedanzen entlang eines Umlaufes). Außerhalb der Hauptdiagonalen stehen die Kopplungsimpedanzen, z. B. steht an zweiter Stelle in der oberen Gleichung −Z2 , weil Z2 die Impedanz ist, die den Umläufen 4 und 5 gemeinsam ist; dieselbe Impedanz muss deshalb auch an erster Stelle in der mittleren Gleichung auftreten (d. h., die Impedanzmatrix ist zur Hauptdiagonalen symmetrisch). Wenn zwei Umläufe einander in ihrer Kopplungsimpedanz entgegengerichtet sind, erhält diese ein Minuszeichen. Auf der rechten Gleichungsseite steht die Summe aller Quellenspannungen des betreffenden Umlaufes. Jede Quellenspannung erhält hierbei ein Minuszeichen, wenn ihr Zählpfeil mit der Richtung des Umlaufes übereinstimmt, anderenfalls ein Pluszeichen. Knotenanalyse
Während bei der Umlaufanalyse ein Gleichungssystem für die Ströme in den Verbindungszweigen
3 Lineare Netze
aufgestellt wird, entsteht bei der Knotenanalyse ein Gleichungssystem für die Spannungen an den Baumzweigen. Dies soll wieder am Beispiel der Schaltung 3-17a gezeigt werden, wobei zunächst die Spannungsquelle durch die äquivalente Stromquelle ersetzt wird (Bild 3-18). Zuerst wird (willkürlich) wieder der vollständige Baum (1, 2, 3) ausgewählt (für die Knotenanalyse werden allerdings nur Bäume verwendet, die einen Bezugsknoten besitzen, in dem nur Baumzweige zusammentreffen: 1; 2; 3 mit Bezugsknoten D, 1; 4; 6 mit A, 2; 4; 5 mit B oder 3; 5; 6 mit C. Die Zählpfeile der drei Baumzweige sollen alle auf den Bezugsknoten D zeigen (es können also die in Bild 3-17 schon eingetragenen Richtungen für die Zweige 1; 2; 3 beibehalten werden). Für die Spannungen an den drei Baumzweigen wird nun das Gleichungssystem aufgestellt (die Bildungsgesetze für die Koeffizienten und die rechten Gleichungsseiten werden danach beschrieben): U1 Knoten A Y1 + Y6 + Y4 Knoten B −Y4 Knoten C −Y6
U2 −Y4 Y2 + Y4 + Y5 −Y5
U3 −Y6 Iq6 −Y5 0 Y3 + Y5 + Y6 −Iq6
Anweisung zur direkten Aufstellung dieses Gleichungssystems Die (unbekannten) Spannungen U1 , U2 , U3 werden (in dieser Reihenfolge) hingeschrieben. In die Hauptdiagonale der Admittanzmatrix werden in der entsprechenden Reihenfolge die Knotenadmittanzen der Knoten A, B, C eingetragen (Knotenadmittanz = Summe aller Admittanzen, die in einem Knoten zusammentreffen). Außerhalb der Hauptdiagonale stehen die Kopplungsadmittanzen, z. B. steht an zweiter Stelle in der oberen Gleichung −Y4 , weil Y4 die Admittanz zwischen den Knoten A und B ist; dieselbe Admittanz muss deshalb auch an erster Stelle
in der mittleren Gleichung auftreten (d. h. die Admittanzmatrix ist zur Hauptdiagonalen symmetrisch). Die Kopplungsadmittanzen erhalten immer das Minuszeichen. Auf der rechten Gleichungsseite steht die Summe aller Quellenströme, die in den betreffenden Knoten hineinfließen. Jeder Quellenstrom erhält hierbei ein Pluszeichen, wenn er in den Knoten hineinfließt (von der Quelle aus gesehen), andernfalls ein Minuszeichen. Netze mit idealen Quellen
Ideale Spannungsquellen. Liegen ideale Spannungsquellen in einzelnen Zweigen, so sind die Spannungen, für die das Gleichungssystem aufgestellt wird, nicht alle unbekannt (wenn man die idealen Spannungsquellen in den vollständigen Baum einbezieht), womit sich die Anzahl der Unbekannten verringert. Das folgende Beispiel macht deutlich, dass in Netzen mit (nahezu) idealen Spannungsquellen die Knotenanalyse besonders vorteilhaft ist: In der Schaltung 3-19 soll die Spannung U1 berechnet werden. Die Knotenanalyse führt hier zu einem Gleichungssystem für drei Spannungen. Da in zwei Zweigen ideale Spannungsquellen liegen, wäre es am besten, diese Zweige zu Baumzweigen zu machen; es gibt aber keinen für die Knotenanalyse geeigneten vollständigen Baum, in dem die Zweige 2 und 6 vereinigt werden können. Deshalb muss man sich damit begnügen, dass zunächst im Gleichungssystem nur eine von den beiden Quellenspannungen auftritt: in der vorgeschlagenen Lösung mit dem vollständigen Baum 1; 2; 3 ist dies Uq2 .
(A) (B) (C)
U1
Uq2
G1 + G4 −G4 0
−G4 G4 + G5 −G5
U3 = U1 − Uq6 0 −G5 G3 + G5
I6 I2 −I6
Hierin sind die Ströme I2 und I6 unbekannt und nicht belastungsunabhängig wie der Quellenstrom Iq6 in Bild 3-18. Das Gleichungssystem enthält daher zunächst sogar vier Unbekannte: U1 , U3 , I2 , I6 . (B) ist zur Berechnung von U1 überflüssig. Durch Addition von (A) und (C) wird I6 eliminiert: Bild 3-18. Stromquelle an einer Brückenschaltung
(G1 + G4 )U1 − (G4 + G5 )Uq2 + (G3 + G5 )U3 = 0 .
G17
G18
G Elektrotechnik / Netzwerke
Bild 3-19. Schaltung mit zwei idealen Spannungsquellen
Hierin lässt sich U3 einfach mithilfe von U3 = U1 − Uq6 eliminieren: (G1 + G4 )U1 − (G4 + G5 )Uq2 + (G3 + G5 )(U1 − Uq6 ) = 0 (G4 + G5 )Uq2 + (G3 + G5 )Uq6 U1 = . G1 + G3 + G4 + G5 Zum Beispiel mit den Zahlenwerten Uq2 = 2 V; Uq6 = 6 V; R1 = 0,1 kΩ , R3 = 0,3¯ kΩ ; R4 = 0,25 kΩ , R5 = 0,2 kΩ Bild 3-20. Masche eines Netzwerkes mit Einströmungen an
wird U1 = 3V. Ideale Stromquellen. Sind die Ströme in irgendwelchen Zweigen bekannt (z. B. durch Strommessung), so treten diese Ströme beim Aufstellen eines Gleichungssystems mithilfe der Umlaufanalyse zwar auf, aber nicht als Unbekannte. Dementsprechend kann sich die Auflösung des Gleichungssystems vereinfachen. Hierzu als Beispiel die Schaltung 3-20a, in der IA , IB , IC , die 4 Quellenspannungen und die 4 Widerstände gegeben sind und I1 berechnet werden soll. Die Ströme IA , IB , IC kann man auch durch ideale Stromquellen (d. h. Stromquellen ohne Parallelwiderstand) beschreiben: Bild 3-20b. Wählt man den vollständigen Baum 2; 3; 4 aus, so ergibt sich aus dem Umlauf 1 (mit den Zweigen 1; 2; 3; 4) eine Gleichung, in der von vornherein nur die Unbekannte I1 auftritt. Die Gleichungen (A), (B), (C) sind zur Berechnung von I1 entbehrlich; I1 lässt sich direkt aus (1) berechnen:
I1 =
Uq1 + Uq2 + Uq3 + Uq4 −R4 IA + (R2 + R3 )IB + R3 IC R1 + R2 + R3 + R4
.
Beispielsweise mit R1 = 1Ω, R2 = 2Ω, R3 = 3Ω, R4 = 4Ω;
drei Stellen. a Schaltung; b Beschreibung der Einströmungen IA , IB , IC als ideale Stromquellen
Uq1 = 1 V, Uq2 = 2 V, Uq3 = 3 V, IA = 2 A, IB = IC = 1A
Uq4 = 4 V;
wird I1 = 1A. In (A), (B), (C) treten UA , UB , UC auf: diese Spannungen sind unbekannt und nicht belastungsunabhängig wie die Quellenspannungen Uq1 , . . . , Uq4 . Im Gleichungssystem kommen demnach vier Unbekannte vor (I1 , U A , UB , UC ), von denen aber in (1) nur I1 auftritt. Vergleich zwischen Maschen- und Knotenanalyse Die Knotenanalyse ist bei Netzen mit k > 4 und starker Vermaschung, d. h. z > 2(k − 1), günstiger als die Maschenanalyse; z. B. k = 5, z = 10 (Bild 3-21). Falls ideale Stromquellen bzw. Spannungsquellen vorhanden sind, vermindert sich allerdings der Lösungsaufwand bei Anwendung der Maschen- bzw. Knotenanalyse entsprechend. Gesteuerte Quellen Wenn Quellenspannungen oder -ströme nicht einfach konstant sind (wie in allen bisherigen Betrachtungen im Kap. 3), sondern einer anderen Spannung oder einem anderen Strom proportional sind, spricht man
3 Lineare Netze
3.3 Vierpole
Bild 3-21. Vollständiges Fünfeck
von gesteuerten Quellen. Es gibt demnach vier Arten gesteuerter Quellen (vgl. Bild 3-22): U1 steuert U: U = k1 U1 U1 steuert I:
I = k2 U 1
I1 steuert U:
U = k3 I 1
I1 steuert I:
I = k4 I 1
(spannungsgesteuerte Spannungsquelle) (spannungsgesteuerte Stromquelle) (stromgesteuerte Spannungsquelle) (stromgesteuerte Stromquelle)
Muss man spannungsgesteuerte Quellen bei der Analyse eines linearen Netzes berücksichtigen, so geht dies am besten mit der Knotenanalyse, weil hier ohnehin ein Gleichungssystem für die Spannungen aufgestellt wird. Bei stromgesteuerten Quellen dagegen bietet sich die Umlaufanalyse an. Ein wichtiges Beispiel einer spannungsgesteuerten Spannungsquelle ist der nichtübersteuerte Operationsverstärker, vgl. 8.2: uA = v0 uD . Wie eine gesteuerte Quelle bei der Berechnung berücksichtigt werden kann, soll am Beispiel des Umkehrverstärkers (Bild 8-6a) gezeigt werden. Für den Knoten N gilt hier mit G1 = 1/R1 , G2 = 1/R2 und uA = v0 uD : − G1 uE − uD (G1 + G2 ) − G2 v0 uD = 0 G1 + G2 − G 1 uE − + G 2 uA = 0 v0 uA G1 R2 /R1 v= =− =− . G + G R /R uE 1 2 2 1+1 + G2 +1 v0 v0 Hieraus ergibt sich mit v0 R2 /R1 + 1 uA R2 ≈− (vgl. 8.3.3) . uE R1
Bild 3-22. Gesteuerte Quelle
Eine Schaltung mit vier Anschlussklemmen nennt man Vierpol. Fasst man die vier Anschlüsse zu zwei Paaren zusammen (siehe Bild 3-23), so entsteht ein Zweitor (Vierpol im engeren Sinne), das durch zwei Ströme und zwei Spannungen charakterisiert ist. Einige Aussagen über solche Zweitore werden im Folgenden zusammengestellt, wobei vorausgesetzt ist, dass die Zweitore nur lineare, zeitinvariante Verbraucher und gesteuerte Quellen (aber keine konstanten Quellenspannungen oder -ströme) enthalten. 3.3.1 Vierpolgleichungen in der Leitwertform
Gleichungspaare, die den Zusammenhang zwischen den vier Klemmengrößen (U1 , I1 , U2 , I2 ) des Zweitores beschreiben, nennt man Vierpolgleichungen. Als Beispiel soll der einfache Vierpol nach Bild 3-24 betrachtet werden; hier gilt I1 = Y1 (U1 − U2 ) ; I2 = −(Y1 + kY2 )U1 + (Y1 + Y2 )U2 oder in Matrizenschreibweise U1 Y1 I1 −Y1 = I2 −(Y1 + kY2 ) (Y1 + Y2 ) U2 y11 y12 U1 . = y21 y22 U2 Hierfür schreibt man auch [I] = [Y][U],
oder
I = YU
Bild 3-23. Vierpol als Zweitor mit Kettenbepfeilung
Bild 3-24. Einfacher Vierpol mit symmetrischer Bepfeilung
G19
G20
G Elektrotechnik / Netzwerke
und nennt I die Spaltenmatrix der Ströme, U die Spaltenmatrix der Spannungen und Y die Leitwertmatrix mit den Elementen I1 = Kurzschluss-Eingangsadmittanz, y11 = U1 U2 =0 I1 = Kurzschluss-Kernadmittanz y12 = U2 U1 =0 rückwärts, I1 = Kurzschluss-Kernadmittanz y21 = U1 U2 =0 vorwärts, I2 = Kurzschluss-Ausgangsadmittanz. y22 = U2 U1 =0
3.3.2 Vierpolgleichungen in der Widerstandsform
Löst man die Vierpolgleichungen nach den Spannungen auf, so erhält man sie in der Widerstandsform: U1 z11 z12 I1 = ; U = ZI . U2 z21 z22 I2 Die Elemente der Widerstandsmatrix Z sind: U1 = Leerlauf-Eingangsimpedanz, z11 = I1 I2 =0 U1 z12 = = Leerlauf-Kernimpedanz I2 I1 =0 rückwärts, U2 z21 = = Leerlauf-Kernimpedanz I1 I2 =0 vorwärts, U2 = Leerlauf-Ausgangsimpedanz. z22 = I2 I1 =0
Für die Umrechnung der Widerstandsparameter in die Leitwertparameter gilt 1 z22 −z12 −1 . Y=Z = det Z −z21 z11 3.3.3 Vierpolgleichungen in der Kettenform
Man kann die Vierpolgleichungen auch nach U1 , I1 auflösen und schreibt dann (mit Kettenpfeilen gemäß Bild 3-23): a11 a12 U2 U1 = . I1 a21 a22 I2 U1 a11 = = Leerlauf-Spannungsübersetzung I1 I2 =0 I1 = Kurzschluss-Stromübersetzung. a22 = I2 U2 =0
Passive Vierpole (Vierpole, die keine Quellen enthalten) sind richtungssymmetrisch; für sie gilt det A = a11 a22 − a12 a21 =
z12 =1. z21
4 Schwingkreise 4.1 Phasen- und Betragsresonanz Die Impedanz Z bzw. die Admittanz Y eines Zweipols, der auch Kondensatoren und/oder Spulen enthält, ist frequenzabhängig komplex. Falls Z bei einer bestimmten Frequenz reell wird, spricht man von Phasenresonanz oder kurz von Resonanz; falls der Betrag |Z| bzw. |Y| maximal bzw. minimal werden, von Betragsresonanz. Die Frequenzen, bei denen Phasen- und Betragsresonanz eintreten, liegen i. Allg. nahe bei den Frequenzen der Eigenschwingungen, die in RLC Schaltungen durch eine beliebige Anregung auftreten können (Eigenfrequenzen).
4.2 Einfache Schwingkreise 4.2.1 Reihenschwingkreis
Bei einer RLC-Reihenschaltung (Bild 4-1) gilt 1 Z = R + j ωL − , ωC für ω0 = (LC)−1/2 wird Im (Z) = 0 und |Z| minimal: Z|ω0 = R . Phasen- und Betragsresonanz fallen hier also zusammen. Die Schaltung kann übrigens frei schwingen bei der Eigenkreisfrequenz CR2 . ωe = ω0 1 − 4L
Bild 4-1. Reihenschwingkreis
4 Schwingkreise
Dieser Wert weicht√von ω0 umso stärker ab, je größer R wird; für R 2 L/C sind keine Eigenschwingungen möglich. 4.2.2 Parallelschwingkreis
Bild 4-2. Parallelschwingkreis
Für eine RLC-Parallelschaltung (Bild 4-2) gilt 1 1 Y = + j ωC − , R ωL und bei 1 ω0 = √ LC wird Im(Y) = 0 und |Y| minimal: Y|ω=ω0 =
1 . R
Auch hier fallen Phasen- und Betragsresonanz zusammen und liegen bei der gleichen Frequenz wie bei einem Reihenschwingkreis, der dieselbe Induktivität und dieselbe Kapazität enthält. 4.2.3 Spannungsüberhöhung am Reihenschwingkreis
Für die Schaltung von Bild 4-1 gilt ωRC |UR | = , 2 |U| (ωRC) + (ω2 LC − 1)2 |UL | ω2 LC = , |U| (ωRC)2 + (ω2 LC − 1)2 1 |UC | = . 2 |U| (ωRC) + (ω2 LC − 1)2 In den Bildern 4-3a bis c sind diese Funktionen (Resonanzkurven) √ dargestellt. Falls R < 2L/C ist, kann bei bestimmten Frequenzen |UL | > |U| bzw. |UC > |U| werden. Diesen Resonanzeffekt nennt man Spannungsüberhöhung. Im Resonanzfall ω = ω0 wird √ |UL | |UC | L/C = = . |U| |U| R Dieses Verhältnis heißt Güte Qr des Reihenschwingkreises; sie gibt an, wie ausgeprägt die Resonanz
Bild 4-3. Frequenzabhängigkeit der Spannung an den Ele-
menten eines Reihenschwingkreises. a Ohm’scher Widerstand; b Induktivität; c Kapazität
G21
G22
G Elektrotechnik / Netzwerke
und damit die Selektivität des Schwingkreises ist. Ihr Kehrwert ist der Verlustfaktor dr : √ L/C (Güte) , Qr = R 1 R (Verlustfaktor) . dr = = √ Qr L/C 4.2.4 Bandbreite
Als Bandbreite des Reihenschwingkreises definiert man die Frequenzdifferenz Δ f der beiden Frequenzen, die den Funktionswerten √ √ L/C L/C |UC | |UL | = √ = √ bzw. |U| |U| 2R 2R zugeordnet sind (Bild 4-4): 8 ' # R $2 R ωgu + ω20 + =∓ ωgo 2L 2L 1 (ωgo − ωgu ) Δf = 2π 1 R = · (absolute Bandbreite) 2π L Δf R = dr (relative Bandbreite) . = √ f0 L/C Beim einfachen Parallelschwingkreis (Bild 4-2) kann (entsprechend der Spannungsüberhöhung des Reihenschwingkreises) √ eine Stromüberhöhung auftreten. Hier gilt Qp = R/ L/C.
4.3 Parallelschwingkreis mit Wicklungsverlusten Schwingkreise, die komplizierter sind als die der Bilder 4-1 und 4-2, haben auch ein komplizierteres Resonanzverhalten: z. B. fallen Phasen- und Betrags-
resonanz nicht mehr zusammen. Als Beispiel hierfür dient ein Parallelschwingkreis, bei dem die Wicklungsverluste als Reihenwiderstand zur Induktivität L dargestellt werden (Bild 4-5). Zwischen den beiden Klemmen hat er die Admittanz 1 Yges = j ωC + R + j ωL R C[R2 + (ωL)2 ] − L = 2 +jω 2 R + (ωL) R2 + (ωL)2 Aus Im (Yges ) = 0 ergibt sich (Phasen-)Resonanz bei 1 R2 C . ω01 = √ 1− L LC Im Unterschied zu den einfachen Schaltungen 4-1 und 4-2 gibt es hier oberhalb eines bestimmten Widerstandswertes keine Phasenresonanz mehr, nämlich √ für R L/C. Das Minimum des Scheinleitwertes |Y| erhält man (aus d|Y|/dω = 0) für 8 1 R2 C R2 C − ; 1+2 ω02 = √ L L LC diese√Betragsresonanz ist nicht mehr möglich für R √ (1 + 2) L/C. Zahlenbeispiel Für die Schaltung Bild 4-5 soll gelten R = 0, L = 10 mH, C = 10 nF. Dann wird ω01 = ω02 = 100 · 103 /s . Mit R = 800 Ω, L = 10 mH, C = 10 nF dagegen werden ω01 = 60 · 103 /s und ω02 = 93,3 · 103 /s .
4.4 Reaktanzzweipole Das Verhalten von Schwingkreisen mit mehr als einer Spule und einem Kondensator (z. B. einer Parallelschaltung zweier Reihenschwingkreise) zu be-
Bild 4-4. Zur Definition der Bandbreite
Bild 4-5. Parallelschwingkreis mit Wicklungsverlusten
5 Schwingkreise
rechnen, ist so aufwändig, dass es sich lohnt, hierbei die Ohm’schen Verluste (zunächst) zu vernachlässigen. Jede (reale) Spule wird dann nicht durch eine LR-Reihenschaltung sondern einfach nur durch L repräsentiert. Desgleichen wird jeder (reale) Kondensator nicht durch eine CR-Parallelschaltung dargestellt, sondern nur durch C. Dadurch entstehen Reaktanzschaltungen, deren Eigenschaften leicht zu berechnen sind, weil die entstehenden Gleichungen nicht komplex sind.
4.4.2 Kombinationen verlustloser Schwingkreise
4.4.1 Verlustloser Reihen- und Parallelschwingkreis
Bei der Schaltung Bild 4-8a gibt es i. Allg. eine Reihenresonanzfrequenz (Zab = 0) und zwei Parallelresonanzfrequenzen (Zab → ∞):
Die Vernachlässigung der Ohm’schen Verluste führt beim einfachen Reihen- bzw. Parallelschwingkreis zu den in Bild 4-6 zusammengefassten Ergebnissen.
Die Bilder 4-7 und 4-8 zeigen zwei Beispiele komplizierterer Schwingkreise. Bei der Schaltung 4-7a ergeben sich i. Allg. eine Parallelresonanzfrequenz (hier wird Zab → ∞) und zwei Reihenresonanzfrequenzen (hier wird Zab = 0): ωser 1 = √
1 ; L1 C1
mit L = L1 + L2
1 1 ; ωpar = √ L2 C2 LC C1C2 und C = . C1 + C2 ωser 2 = √
1 1 1 ; ωpar 2 = √ ; ωser = √ L1C1 L2C2 LC L1 L2 und C = C1 + C2 . L= L1 + L2
ωpar 1 = √ mit
Bei den Reaktanz- und Suszeptanzfunktionen in den Bildern 4-6 bis 4-8 wechseln Pol- und Nullstellen miteinander ab; die Steigung ist überall positiv (dX/dω > 0 bzw. dB/dω > 0). Dies gilt auch für beliebige andere Reaktanzzweipole.
Bild 4-7. Parallelschaltung zweier Reihenschwingkreise a Schaltung; b Suszeptanzfunktion
Bild 4-6. Vergleich zwischen Reihen- und Parallelresonanz
Bild 4-8. Reihenschaltung zweier Parallelschwingkreise a Schaltung; b Reaktanzfunktion
G23
G24
G Elektrotechnik / Netzwerke
5 Leistung in linearen Schaltungen 5.1 Leistung in Gleichstromkreisen
die maximale Nutzleistung ist Pmax =
5.1.1 Wirkungsgrad
In einem Widerstand R (Bild 5-1a) wird die Leistung
2 1 Uq 1 · = Pqk . 4 Ri 4
(Pqk = Uq2 /Ri ist die Quellenleistung im Kurzschlussfall.)
U2 = RI 2 R umgesetzt: der Widerstand nimmt diese Leistung elektrisch auf und gibt sie als Wärme ab. Wenn der Widerstand diese Leistung einer Quelle entnimmt, die den inneren Widerstand Ri hat, so bringt die Quelle selbst die Leistung
Beispiel: Leistungsanpassung und Wirkungsgrad bei einer Spannungsteilerschaltung. Bei der Schaltung Bild 5-2 wird die Leistungsabgabe an den Nutzwiderstand maximal, wenn
Pq = U q i
ist. Speziell für R1 = R2 wird die Leistungsanpassung also erreicht, wenn R = 12 R1 ist. In diesem Fall gilt
P = UI =
auf. Wenn man die an den Klemmen abgegebene Leistung P auf die Gesamtleistung Pq bezieht, so erhält man den Wirkungsgrad η = P/Pq .
(5-1)
Im Falle der Schaltung 5-1a ist demnach η=
U R UI = = . U q I U q R + Ri
(5-2)
R = Ri =
η=
Pnutz Pges
R1 R2 R1 + R2
2 1 Uq · 1 8 R1 = = . 2 6 6 Uq · 8 R1
(Im Gegensatz dazu ist in Schaltung Bild 5-1 im Anpassungsfall η = 12 .)
5.1.2 Leistungsanpassung
Der Widerstand R (Bild 5-1a) nimmt die Leistung P = RI 2 =
Uq2 (R + Ri )
R= 2
Uq2 Ri
·
R/Ri (1 + R/Ri )2
auf; sie hat ein Maximum bei R = Ri , siehe Bild 5-1b. Den Fall maximaler Leistungsentnahme an den Klemmen bezeichnet man als Leistungsanpassung;
Bild 5-1. Leistungsabgabe einer Spannungsquelle. a Schal-
tung, b Leistung P/Pqk als Funktion von R/Ri
5.1.3 Belastbarkeit von Leitungen
Die Leistung in einer Leitung (mit dem Leitungswiderstand R) wächst gemäß P = RI 2 mit dem Strom quadratisch an, die Erwärmung nimmt entsprechend zu. Für alle Leitungen gibt es daher höchstzulässige Stromstärken, z. B. für Kupferleitungen mit 1 mm2 Querschnitt 11 bis 19 A, mit 10 mm2 Querschnitt 45 bis 73 A. Daher sind Leitungsschutz-Sicherungen (Schmelzsicherungen, Schutzschalter) in Reihe zur Leitung zu legen, die den Strom unterbrechen, wenn er den höchstzulässigen Wert überschreitet.
Bild 5-2. Belasteter Spannungsteiler
5 Leistung in linearen Schaltungen
5.2 Leistung in Wechselstromkreisen
Entsprechend ergibt sich beim Kondensator (Kapazität C) mit
5.2.1 Wirk-, Blind- und Scheinleistung
u(t) = uˆ cos(ωt + ϕ0C )
Ein Zweipol (Bild 5-3a) nimmt die Leistung und wegen
p = ui
du(t) = −ωC uˆ sin(ωt + ϕ0C ) dt p(t) = −ωC uˆ sin(ωt + ϕ0C )uˆ cos(ωt + ϕ0C ) i(t) = C
auf. Bei einem Ohm’schen Widerstand gilt mit i = ˆı cos(ωt + ϕ0 ) und wegen u = Ri für die Leistung
= −0,5ωC uˆ 2 sin 2(ωt + ϕ0C ) .
p = Rˆı cos (ωt + ϕ0 ) 1 (5-3) = Rˆı2 [1 + cos 2(ωt + ϕ0 )] . 2 Deren arithmetischer Mittelwert √ 1 P = Rˆı2 = R|I|2 (Effektivwert |I| = ˆı 2) 2 ist die Wirkleistung im Widerstand. Bei einer Spule mit der Induktivität L gilt mit 2
2
i = ˆı sin(ωt + ϕ0L )
1 |I|2 1 ˆı2 1 ωC uˆ 2 = ˆıuˆ = = ωC|U|2 = |IU| = . 2 2 2 ωC ωC An einem beliebigen linearen (Bild 5-3a) gilt ganz allgemein mit
u = uˆ cos(ωt + ϕ); i = ˆı cos(ωt)
= uˆ ˆı cos ϕ cos2 ωt − uˆ ˆı sin ϕ sin ωt cos ωt .
p(t) = ωLˆı2 sin(ωt + ϕ0L ) cos(ωt + ϕ0L ) (5-4)
Deren Mittelwert ist null; in der Spule wird keine Wirkleistung umgesetzt; die Spulenleistung pendelt lediglich um diesen Mittelwert (mit der Leistungsamplitude 0, 5 ωLˆı2 ), d. h., die Spule nimmt zeitweilig (während der positiven Sinushalbwelle) Leistung auf und gibt (während der negativen Halbwelle) wieder Leistung ab. Für die Leistungsamplitude gilt uˆ 2 |U|2 = ωL|I|2 = |UI| = . ωL ωL
(5-6)
Der erste Summand auf der rechten Gleichungsseite lässt sich als das Produkt einer Spannung mit einem phasengleichen Strom auffassen, beschreibt also ebenso wie (5-3) eine reine Wirkleistung. Der zweite Summand lässt sich auffassen als Produkt einer Spannung uˆ cos ωt mit einem um π/2 nach bzw. voreilenden Strom ˆı sin ϕ sin ωt (nacheilend, falls ϕ > 0; voreilend, falls ϕ < 0); dieses Produkt stellt demnach wie (5-4) bzw. (5-5) eine Leistungsschwingung dar, bei der die Leistungsaufnahme und -abgabe ständig miteinander abwechseln und deren Mittelwert gleich null ist. Aus (5-6) folgt weiterhin uˆ ˆı cos ϕ[1 + cos 2ωt] 2 uˆ ˆı − sin ϕ sin 2ωt . 2
p=
Hierin bezeichnet man Bild 5-3. Klemmengrößen eines Zweipols
RLC-Zweipol
p = ui = uˆ cos(ωt + ϕ)ˆı cos ωt
di u = L = ωLˆı cos(ωt + ϕ0L ) dt für die Leistung:
0,5 ωLˆı2 = 0,5ˆuˆı = 0,5
Auch hier ist die Wirkleistung null; die Amplitude der Leistungsschwingung ist
für die aufgenommene Leistung:
und wegen
= 0,5ωLˆı2 sin 2(ωt + ϕ0L ) .
(5-5)
P=
uˆ ˆı cos ϕ 2
G25
G26
G Elektrotechnik / Netzwerke
als die Wirkleistung und Q=
uˆ ˆı sin ϕ 2
als die Blindleistung. Aus der Definition von Q ergibt sich Q>0
für ϕ > 0 ,
(d. h., wenn die Spannung dem Strom vorauseilt, also bei induktiver Reaktanz der Impedanz Z) und Q 0); b eisenfreier Transformator, gegensinnige Kopplung (M < 0); c Transformator mit Eisenkern, gleichsinnige Kopplung
Bild 6-2. Transformator mit Zählpfeilen für die Größen an den Primärklemmen (U1 , I1 ) und an den Sekundärklemmen (U2 , I2 ). a Symmetrische Zählpfeile; b Kettenzählpfeile; c verlustloser Transformator mit Abschlussimpedanz
G27
G28
G Elektrotechnik / Netzwerke
6.2.6 Vierpolersatzschaltungen
Bild 6-3. Verlust- und streuungsfreier Transformator. a Transformator mit Abschlussimpedanz ZA ; b Zweipolersatzschaltung
6.2.4 Idealer Transformator
Setzt man zusätzlich zu den Idealisierungen R1 = R2 = 0 (Vernachlässigung der Wicklungsverluste) und L1 L2 = M 2 (Vernachlässigung der magnetischen Streuung) voraus, dass in Bild 6-3b L1 weggelassen werden kann (L1 → ∞) so nennt man einen solchen Transformator ideal; es wird U2 N2 1 =± =± U1 N1 n (ideale Spannungstransformation),
Ein Transformator, dessen untere beiden Klemmen verbunden sind (Bild 6-4a), kann durch die Schaltung in Bild 6-4b, aber auch durch die Schaltung in Bild 6-5 ersetzt werden (Schaltung 6-4b ist ein Sonderfall von 6-5; er entsteht, wenn v = 1 gesetzt wird): für alle drei Schaltungen gelten die Transformator-Gleichungen (6-1a, b). Wählt man in Bild 6-5 v = L1 /M, so verschwindet die primäre Streuinduktivität, und mit√ v = M/L2 verschwindet die sekundäre. Für v = L1 /L2 bilden die Induktivitäten eine symmetrische T-Schaltung (Bild 6-6). 6.2.7 Zweipolersatzschaltung
Falls man sich nur für das Eingangsverhalten eines Transformators (Bild 6-6) interessiert, so genügt eine Zweipolersatzschaltung, in der die Sekundärgrößen U2 , I2 nicht mehr auftreten (Bild 6-7).
N1 I2 =± = ±n I1 N2 (ideale Stromtransformation), und für Eingangsadmittanz bzw. -impedanz gilt bei idealer Impedanztransformation: YE =
1 n2 ZA
,
ZE = n2 ZA .
Durch Impedanztransformation kann eine Abschlussimpedanz an die innere Impedanz der Quelle angepasst werden (Anpassungsübertrager). 6.2.5 Streufaktor und Kopplungsfaktor
Bild 6-4. Transformator und Ersatzschaltung. a Transfor-
matorschaltung; b T-Schaltung mit drei magnetisch nicht gekoppelten Spulen als Vierpolersatzschaltung eines Transformators
Es werden definiert der Kopplungsfaktor k= √
M L1 L2
(0 < k < 1)
und der Streufaktor σ=1−
M2 = 1 − k2 L1 L2
(1 > σ > 0) .
Beim idealen Transformator ist k = 1, σ = 0.
Bild 6-5. Transformatorersatzschaltung mit idealem Übertrager (Transformator)
7 Drehstrom
aus dünnen, gegeneinander isolierten Blechen klein gehalten). PH und PW können z. B. im Ersatzbild 6-7 dadurch berücksichtigt werden, dass man einen (auf die Primärseite bezogenen) Ohm’schen Widerstand RE parallel zur Hauptinduktivität kL1 vorsieht (Bild 6-8). Bild 6-6. Transformatorersatzschaltung mit symmetrischer T-Schaltung
Beispiel: Bild 6-9 zeigt eine Ersatzschaltung eines 50-Hz Einphasentransformators mit den Nenndaten |U1N | = 2 kV (primäre Nennspannung) , |U2N | = 220 V (sekundäre Nennspannung) , |S N | = 20 kVA
(Nennscheinleistung) .
Bild 6-7. Zweipolersatzschaltung eines Transformators
6.3 Transformator mit Eisenkern
7 Drehstrom
Idealen Transformatoreigenschaften (σ → 0; L1 → ∞) kommt man am nächsten, wenn die Transformatorwicklungen auf einen gemeinsamen Eisenkern gewickelt werden, der einen geschlossenen Umlauf bildet (die magnetischen Feldlinien verlaufen dann fast nur im Eisen). Allerdings sind L1 , L2 , M wegen der Nichtlinearität der Magnetisierungskennlinie nicht konstant. Außerdem entstehen durch die ständige Ummagnetisierung (Wechselfeld!) frequenzproportionale Verluste (Hystereseverluste) PH ∼ ω und durch Wirbelströme die Wirbelstromverluste PW ∼ ω2 (die Wirbelstromverluste werden durch die Zusammensetzung des Eisenkernes
7.1 Spannungen symmetrischer Drehstromgeneratoren Elektrische Systeme mit Generatorspannungen gleicher Frequenz, aber unterschiedlicher Phasenlage, nennt man Mehrphasensysteme. Das wichtigste System ist das Dreiphasensystem (Drehstromsystem). Ein Drehstromgenerator, der drei um jeweils 2π/3 gegeneinander phasenverschobene Spannungen gleicher Amplitude erzeugt (symmetrischer Generator), gibt an eine symmetrische Verbraucherschaltung insgesamt eine zeitlich konstante elektrische Leistung ab, belastet also vorteilhafterweise auch die Turbine
Bild 6-8. Berücksichtigung der Eisenverluste eines Trans-
formators in einem Zweipolersatzschaltbild
Bild 6-9. Ersatzschaltung eines Einphasentransformators
(Zahlenbeispiel)
Bild 7-1. Spannungen eines symmetrischen Drehstromge-
nerators. a und b Symbole für phasenverschobene Spannungsquellen; c Liniendiagramm; d Zeigerdiagramm
G29
G30
G Elektrotechnik / Netzwerke
oder den Verbrennungsmotor zeitlich konstant. Die drei Spannungsquellen mit uu (t) = uˆ cos ωt uv (t) = uˆ cos (ωt − 2π/3) uw (t) = uˆ cos (ωt − 4π/3) = uˆ cos (ωt + 2π/3) (Bild 7-1 c) können durch drei Wechselspannungsquellen wie in 1.2.4 (Bild 1-7) oder durch die drei Wicklungen des Generators (Generatorstränge, Bild 7-1 b) symbolisiert werden. Bild 7-1 d zeigt ein Zeigerdiagramm für die komplexen Effektivwerte Uu , Uv , Uw der drei Generatorspannungen. Hierbei gilt mit der Abkürzung
Bild 7-2. Zur Veranschaulichung des Operators a. a a und seine Potenzen, b Differenzen
a = exp ( j · 2π/3) : uˆ uˆ uˆ Uu = √ , Uv = √ a−1 = √ a2 , 2 2 2 uˆ −2 uˆ Uw = √ a = √ a . 2 2 Für den komplexen Operator a gilt außerdem (vgl. Bild 7-2a): √ a = exp ( j · 2π/3) = 0,5 (−1 + j 3) √ a2 = exp ( j · 4π/3) = 0,5 (−1 − j 3) a3 = 1 und 1 + a + a2 = 0 √ 1 − a2 = −j 3 a ; √ √ a2 − a = −j 3 ; a − 1 = −j 3 a2 (vgl. Bild 7-2b). Für die Summe der Generatorspannungen gilt Uu + Uv + Uw = Uu + a2 Uu + aUu = Uu (1 + a2 + a) = 0, die drei Generatorstränge können also im Idealfall völliger Generatorsymmetrie zu einem geschlossenen Umlauf in Reihe geschaltet werden (Bild 7-3b), ohne dass ein Strom fließt. (Falls aber uu , uv , uw nicht rein sinusförmig sind, so entsteht grundsätzlich im Generatordreieck ein Kurzschlussstrom; wenn z. B. uu , uv , uw außer der Grundschwingung (ω) auch noch die 3. Harmonische (3ω) enthalten, so sind die Oberschwingungen nicht gegeneinander phasenverschoben, löschen sich also nicht aus wie die Grundschwingungen.)
Bild 7-3. Symmetrische Generatorschaltungen. a Generator-Sternschaltung; b Generator-Dreieck-schaltung; c Spannungs-Zeigerdiagramm zur Sternschaltung; d Spannungs-Zeigerdiagramm zur Dreieckschaltung
Das Bild 7-3a zeigt die normalerweise verwendete Generator-Sternschaltung mit dem GeneratorSternpunkt M. Für die Spannungen zwischen den Anschlussklemmen R, S, T (die auch mit 1, 2, 3 bezeichnet werden können), die sogenannten (Außen-)Leiterspannungen, gilt in der die GeneratorSternschaltung: √ URS = URM (1 − a2 ) = −ja 3Uu , √ UST = URM (a2 − a) = −j 3Uu , √ UTR = URM (a − 1) = −ja2 3Uu ; sowie für die Generator-Dreieckschaltung URSΔ = Uu ;
USTΔ = a2 Uu ;
UTRΔ = aUu .
Die Außenleiterspannungen sind bei Sternschaltung √ also um 3 größer als bei Dreieckschaltung: √ |URS | = |UST | = |UTR | = 3|URSΔ | √ √ = 3|USTΔ | = 3|UTRΔ | .
7 Drehstrom
7.2 Die Spannung zwischen Generatorund Verbrauchersternpunkt Wenn n Generatorstränge zu einem Stern zusammengeschaltet und mit einem Verbraucherstern aus n Impedanzen verbunden werden (Bild 7-4), so gilt für die Verlagerungsspannung UNM zwischen den beiden Sternpunkten M und N (vgl. 3.2.1): UNM =
Y1 U1M + Y2 U2M + . . . + Yn UnM . Y1 + Y2 + . . . + Yn + YM
(7-1)
Für die Außenleiterströme ergibt sich damit I1 = (U1M − UNM )Y1 , I2 = (U2M − UNM )Y2 , usw. Sind beide Sternpunkte kurzgeschlossen (ZM = 0), so wird einfach I1 = Y1 U1M ,
I2 = Y2 U2M
usw.
7.3 Symmetrische Drehstromsysteme (symmetrische Belastung symmetrischer Drehstromgeneratoren) In Bild 7-5 werden zwei verschiedene Belastungsfälle miteinander verglichen: a) Drei gleiche Impedanzen Z = |Z| exp(jϕ) bilden einen Verbraucherstern, der an einen Generatorstern angeschlossen ist (Bild 7-5a). b) An den Generatorstern wird ein Verbraucherdreieck aus den gleichen Impedanzen wie im Fall a angeschlossen (Bild 7-5b).
Bild 7-5. Symmetrische Drehstromsysteme
Die Verbraucher-Dreieckschaltung nimmt eine dreimal so große Gesamtleistung auf wie die Sternschaltung. Da die Außenleiterströme jedoch im Fall b ebenfalls dreimal so groß sind, werden hier die Leitungsverluste (3|IR|2 RL , RL Leitungswiderstand) neunmal so groß wie im Fall a. Der Wirkungsgrad ist im Fall a (Verbraucher-Sternschaltung) also besser. Im Allgemeinen (d. h., wenn das Drehstromsystem nicht ganz symmetrisch ist) wird die Gesamtleistung, die der Generator abgibt, zeitabhängig. Bei idealer Symmetrie des Generators und des Verbrauchers gilt jedoch (mit uRM = uˆ cos ωt und Z = |Z| exp( jϕ)) pges = uRM · iR + uSM · iS + uTM · iT = uˆ cos ωt · ˆı cos (ωt − ϕ) + uˆ cos (ωt − 2π/3) · ˆı cos (ωt − 2π/3 − ϕ) + uˆ cos (ωt + 2π/3) · ˆı cos (ωt + 2π/3 − ϕ) = 1,5ˆuˆı cos ϕ = const .
Bild 7-4. Generator und Verbraucher in Sternschaltung
Das heißt: Ein symmetrisches Verbraucherdreieck oder ein symmetrischer Verbraucherstern entnehmen einem Drehstromgenerator eine konstante Leistung.
G31
G32
G Elektrotechnik / Netzwerke
Auch die Antriebsmaschine des elektrischen Generators muss daher bei symmetrischer Last keine pulsierende Leistung, sondern vorteilhafterweise nur eine konstante Leistung abgeben (vgl. 16.0.2).
7.4 Asymmetrische Belastung eines symmetrischen Generators 7.4.1 Verbraucher-Sternschaltung
Speziell im Dreiphasensystem vereinfacht sich (7-1) zu YR URM + YS USM + YT UTM UNM = YR + YS + YT + YM Wenn der Generator symmetrisch ist (USM = a2 URM ; UTM = aURM ), wird YR + a2 YS + aYT . YR + YS + YT + YM Wenn YR = YS = YT ist, wird der Zähler gleich Null. Er kann aber auch verschwinden, wenn die Verbraucheradmittanzen nicht übereinstimmen. Ein Beispiel hierzu liefert Bild 7-6. Bei einem Verbraucherstern, bei dem alle Impedanzen Z = |Z| exp ( jϕ) den gleichen Winkel ϕ haben, kann allerdings nur dann UNM = 0 werden, wenn sie auch betragsgleich sind. Bild 7-7 zeigt dies am Beispiel einer rein Ohm’schen Last. UNM = URM
7.4.2 Verbraucher-Dreieckschaltung
Bei der Verbraucher-Dreieckschaltung werden IRS = URS /ZRS , IST = UST /ZST , ITR = UTR /ZTR ; URS UTR − , IR = ZRS ZTR UST URS IS = − , ZST ZRS UTR UST IT = − . ZTR ZST Bei symmetrischer Last (ZRS = ZST = ZTR = Z) sind die Außenleiterströme symmetrisch (d. h. betragsgleich und um 2π/3 gegeneinander phasenverschoben): IR = 3URM /Z , IS = 3USM /Z , IT = 3UTM /Z .
Bild 7-8. Verbraucher-Dreieckschaltung
Bild 7-6. Asymmetrischer Verbraucherstern mit symmetri-
schen Verbraucherspannungen
Bild 7-7. Abhängigkeit der Verlagerungsspannung von der
Asymmetrie eines Ohm’schen Verbrauchersternes
Bild 7-9. Symmetrische Belastung (|IR | = |IS | = |IT |) durch einen asymmetrischen Verbraucher
8 Nichtlineare Schaltungen
Auch in bestimmten Fällen asymmetrischer Belastung (Bild 7-9a) können die Außenleiterströme symmetrisch sein: unter Umständen kann ein Verbraucherdreieck, das außer Blindwiderständen nur einen einzigen Ohm’schen Widerstand enthält (also völlig asymmetrisch ist), einen Generator durchaus symmetrisch belasten.
7.5 Wirkleistungsmessung im Drehstromsystem (Zwei-Leistungsmesser-Methode, Aronschaltung) In einem Drehstromsystem mit drei Außenleitern (aber ohne Mittelleiter; Bild 7-10) kann die von einer beliebigen Verbraucherschaltung aufgenommene Gesamtwirkleistung P mit nur zwei Leistungsmessern bestimmt werden: S = URS IR∗ − UST IT∗ = URS IR∗ + UTS IT∗ (I ∗ bedeutet: konjugiert komplexer Wert zu I). P = Re(S ) = |URS IR | cos ϕRS − |UST IT | cos ϕST .
Bild 7-10. Spannungen und Ströme an den Klemmen eines Drehstromverbrauchers
P1 = −P2 , also P = P1 + P2 = 0. Schließt man z. B. eine Sternschaltung dreier gleicher Kondensatoren (C) an einen symmetrischen Drehstromgenerator an, so wird |URS | |IR | = |IT | = √ ωC ; ϕRS = 60◦ ; ϕST = 60◦ . 3 |URS | |URS | P = |URS | √ ωC · 0,5 − |URS | √ ωC · 0,5 = 0 . 3 3 (Die Schaltung nimmt nur Blindleistung auf: Qges = −|URS |2 ωC.)
Hierbei ist ϕRS der Winkel zwischen URS und IR , ϕST der Winkel zwischen UST und IT . (Bei rein Ohm’scher Last ist auch die vom Leistungsmesser 2 gemessene Leistung P2 = −|UST IT | cos ϕST immer positiv, weil hier cos ϕST negativ wird.)
8 Nichtlineare Schaltungen
Rechenbeispiel 1
8.1 Linearität
Aus URS = 500 V ,
UST = 500 V · a2 ; ◦
IR = 43,6 A exp (−j · 36,6 ) , IT = 70 A exp (j · 81,8◦ ) ergibt sich: P = 500 V · 43,6 A cos 36,6◦ − 500 V · 70 A cos (81,8◦ + 120◦ ) P ≈ 17,5 kW + 32,5 kW = 50 kW .
Die Netzwerkanalyse (3), aber auch die in 2 und 4 bis 7 beschriebenen Methoden setzen großenteils voraus, dass die betrachteten Schaltungen linear sind. Das heißt: Bei einem Widerstand seien Stromstärke i und Spannung u einander proportional, R sei konstant: u∼i ,
Bei einer Verbraucherschaltung, die sich nur aus Blindwiderständen zusammensetzt, muss P = 0 werden. Allerdings kann jeder der beiden Leistungsmesser eine Wirkleistung anzeigen. Hierbei wird
u = Ri mit R = const .
Bei einem Kondensator seien Ladung q und Spannung u proportional, C sei konstant: u∼q ,
Rechenbeispiel 2
d. h.,
d. h.,
u = Cq
mit C = const .
Bei einer Spule seien Fluss Φ und Stromstärke i proportional, L sei konstant: Φ∼i ,
d. h.,
NΦ = Li mit
(N Windungszahl) .
L = const .
G33
G34
G Elektrotechnik / Netzwerke
Mit R, C, L = const sind die Gleichungen u = Ri, u = Cq, NΦ = Li lineare Gleichungen. Man nennt Bauelemente, in denen dies gilt, lineare Bauelemente. Schaltungen aus ihnen nennt man dementsprechend lineare Schaltungen. Im Folgenden werden einige Beispiele dafür gegeben, wie man in einfachen Fällen nichtlineare Bauelemente in die Berechnung einbeziehen kann.
8.2.2 Verstärkungskennlinie des Operationsverstärkers
Operationsverstärker (Bild 8-2a) lassen sich als lineare Spannungsverstärker (spannungsgesteuerte Spannungsquellen) beschreiben, die ihre Eingangsspannung uD mit dem Faktor v0 (Leerlaufverstärkung) multiplizieren: uA = v0 uD
8.2 Nichtlineare Kennlinien 8.2.1 Beispiele nichtlinearer Strom-Spannungs-Kennlinien von Zweipolen
Siehe Bild 8-1.
(in Bild 8-2b ist v0 = 104 ). Diese Beschreibung ist aber nur zutreffend innerhalb eines relativ kleinen Wertebereiches für u D (Bild 8-2b). Außerhalb dieses Wertebereiches wächst die Ausgangsspannung uA nicht mehr proportional mit uD an, man sagt der Verstärker ist „übersteuert“.
Bild 8-1. Strom-Spannungs-Kennlinien nichtlinearer Zweipole a Z-Diode; b Glühlampe; c Tunneldiode; d Glimmlampe; e Heißleiter; f Kaltleiter
8 Nichtlineare Schaltungen
Bild 8-3. Lineare Quelle und nichtlinearer Verbraucher. a Schaltung; b Strom-Spannungs-Kennlinien von Quelle (Arbeitsgerade) und Verbraucher (Diodenkennlinie)
Bild 8-2. Operationsverstärker. a Schaltzeichen; b Verstärkungskennlinie uA = f (uD )
Bei den meisten Anwendungen werden die Operationsverstärker im Bereich linearer Verstärkung betrieben (in Bild 8-2b also im Bereich −1,2 mV < uD < 1,2 mV), sodass sie deshalb oft als lineare Schaltungen bezeichnet werden. Der Zusammenhang uA = f (uD ) ist insgesamt aber nichtlinear, und bei einer Reihe wichtiger Anwendungen werden die Verstärker außerhalb des Bereiches linearer Verstärkung betrieben (Mitkopplungsschaltungen).
8.3 Graphische Lösung durch Schnitt zweier Kennlinien 8.3.1 Arbeitsgerade und Verbraucherkennlinie
In 3.2.2 (Bild 3-14b) ist dargestellt, dass sich die Klemmengrößen u, i als die Koordinaten des Schnittpunktes der Arbeitsgeraden (des Quellenzweipols) mit der Kennlinie des Verbraucherzweipols ergeben. Dies gilt selbstverständlich auch dann, wenn die Verbraucherkennlinie nichtlinear ist, siehe Bild 8-3b. Wie die Lage der Arbeitsgeraden von Uq und Ri abhängt, zeigt Bild 8-4. Bei der Spannungsteilerschaltung in 3.2.2 (Bild 3-14a) ist der i-Achsenabschnitt (Klemmenkurzschlussstrom) von R2 unabhängig. Wenn R2 geändert wird, ändert sich hier nur der uAchsenabschnitt U ∗ (siehe Bild 8-4c):
Bild 8-4. Abhängigkeit der Lage der Arbeitsgeraden vor Uq , R1 oder R2 . a Drehung der Arbeitsgeraden um den Punkt (Uq , 0); b Parallelverschiebung der Arbeitsgeraden; c Drehung der Arbeitsgeraden um den Punkt (0, Ik )
U∗ =
R2 Uq . R1 + R2
8.3.2 Stabile und instabile Arbeitspunkte einer Schaltung mit nichtlinearem Zweipol
Bei Strom-Spannungs-Kennlinien, die einen Abschnitt mit negativer Steigung haben (der differenzi-
G35
G36
G Elektrotechnik / Netzwerke
8.3.3 Rückkopplung von Operationsverstärkern Gegenkopplung
Wird der Ausgang A mit dem invertierenden Eingang N verbunden (in Bild 8-6a über R2 ), so entsteht im Allgemeinen eine Gegenkopplung. (Bei komplexen frequenzabhängigen Rückkopplungsnetzwerken kann eine Rückführung von A nach N wegen einer Phasendrehung u. U. auch Mitkopplung bewirken.) Umkehrverstärker (invertierende Gegenkopplung). Die Verstärkungskennlinie (VKL) uA = f (uD ) eines Operationsverstärkers (Bild 8-2) kann so idealisiert werden, wie es in Bild 8-6b dargestellt ist. Außer der VKL besteht noch ein zweiter Zusammenhang zwischen uA und uD , uA = −
R1 + R2 R2 uD − uE (Arbeitsgerade) , R1 R1
Bild 8-5. Tunneldiodenschaltungen mit stabilen und instabilen Arbeitspunkten
elle Widerstand r = du/di wird hier negativ; siehe auch die Bilder 8-1c bis f), können sich die Arbeitsgerade der Quelle und die Kennlinie des nichtlinearen Zweipols in mehreren Punkten schneiden (Bild 8-5). Diese Schnittpunkte können stabil oder instabil sein. Zum Beispiel stimmen in den Bildern 8-5a3 und b3 die Diodenkennlinien und auch die Arbeitsgeraden überein (also auch deren Schnittpunkte). Ob der mittlere Schnittpunkt stabil ist oder nicht, hängt von zusätzlichen kapazitiven und induktiven Effekten ab, die sich auf die Achsenabschnitte der (statischen) Arbeitsgeraden überhaupt nicht auswirken. Anmerkung: Der mittlere Arbeitspunkt in Bild 8-5b3 ist stabil. Da der differenzielle Widerstand r der Tunneldiode in diesem Bereich negativ ist, kann man durch Einstellen dieses Punktes einen Schwingkreis so entdämpfen, dass er ungedämpft schwingt (vgl. Bild 25-19a). Wählt man dagegen eine Arbeitspunkteinstellung nach Bild 8-5b4, so können hierbei Kippschwingungen entstehen.
Bild 8-6. Lineare Verstärkung und Übersteuerung beim Umkehrverstärker. a Invertierende Gegenkopplung eines Operationsverstärkers (Umkehrverstärker); b Darstellung jedes Arbeitspunktes als Schnittpunkt der Arbeitsgerade mit der VKL; c Übertragungskennlinien uA = f (uE ) (Gesamtverstärkung)
8 Nichtlineare Schaltungen
sodass die Koordinaten des Schnittpunktes der VKL mit der jeweiligen Arbeitsgeraden (Bild 8-6b) das sich tatsächlich einstellende Wertepaar (uD , uA ) darstellen. Die Lage des Schnittpunktes (also auch die Größe von uA ) hängt von uE ab, vgl. Bild 8-6c. Solange die Schnittpunkte auf dem steilen Teil der VKL (Bereich linearer Verstärkung: uA = v0 uD ) liegen (Punkte S 1 , S 2 , S 3 in Bild 8-6b), gilt uD ≈ 0 und daher R2 uA ≈− uE R1 (Gesamtverstärkung des nicht übersteuerten Umkehrverstärkers). Das heißt, beim nicht übersteuerten Verstärker mit hoher Leerlaufverstärkung hängt die Gesamtverstärkung praktisch nur von der äußeren Beschaltung (R1 , R2 ) ab; vgl. 3.2.3: gesteuerte Quellen. Elektrometerverstärker (nichtinvertierende Gegenkopplung). Aus der Schaltung (Bild 8-7a) ergibt sich für die Arbeitsgeraden: uA = −(1 + R4 /R3 )uD + (1 + R4 /R3 )uE . Für Schnittpunkte VKL/Arbeitsgerade im steilen Teil der VKL (uA = v0 uD ) gilt (wie beim Umkehrverstärker) mit v0 1 praktisch uD ≈ 0 und daher gilt für die Gesamtverstärkung des nicht übersteuerten Elektrometerverstärkers: R4 uA ≈ 1+ . uE R3 Der Elektrometerverstärker hat gegenüber dem Umkehrverstärker den Vorteil eines höheren Eingangswiderstandes RE = uE /ip : RE wird im Wesentlichen durch den sehr hohen Eingangswiderstand des Operationsverstärkers (Widerstand zwischen P und N, Bild 8-7a; vgl. Tabelle 25-2) bestimmt, während beim Umkehrverstärker (Bild 8-6a) R1 maßgebend ist. Mitkopplung (Schmitt-Trigger)
Wird der Ausgang mit dem nichtinvertierenden Eingang verbunden, so entsteht im Allgemeinen eine Mitkopplung.
Bild 8-7. Lineare Verstärkung und Übersteuerung beim Elektrometerverstärker. a Nichtinvertierende Gegenkopplung eines Operationsverstärkers (Elektrometerverstärker); b Darstellung jedes Arbeitspunktes als Schnittpunkt der Arbeitsgerade mit der VKL; c Übertragungskennlinien uA = f (uE ) (Gesamtverstärkung)
Nichtinvertierende Mitkopplung. Vertauscht man in der Schaltung von Bild 8-6a P und N miteinander, so entsteht eine nichtinvertierende Mitkopplung (Bild 8-8a). Für die Arbeitsgeraden gilt nun uA =
R1 + R2 R2 uD − uE , R1 R1
siehe Bild 8-8b. Ein Teil der Arbeitsgeraden bildet nun sogar drei Schnittpunkte mit der VKL; in einem solchen Fall ist der mittlere Schnittpunkt nicht stabil. Die Abhängigkeit der Ausgangs- von der Eingangsspannung zeigt Hysterese (Bild 8-8c). Ob z. B. im Fall r = 1 bei uE = 10 V am Ausgang uA = 15 V oder uA = −15 V wird, hängt vom Vorzustand ab: ist zunächst uE = −20 V, so ist uA = −15 V; erhöht man uE dann stetig auf 10 V, so bleibt uA = −15 V. Erst wenn uE = +15 V überschritten wird, springt die Ausgangsspannung auf uA = +15 V.
G37
G38
G Elektrotechnik / Netzwerke
Bild 8-8. Entstehung der Schalthysterese bei einer nichtinvertierenden Mitkopplungsschaltung. a Nichtinvertierende Mitkopplung eines Operationsverstärkers; b stabile und instabile Arbeitspunkte; c Übertragungsverhalten (Schalthysterese)
Invertierende Mitkopplung. Bei der Schaltung von Bild 8-9a gilt für die Arbeitsgeraden R4 R4 uA = 1 + uD + 1 + uE . R3 R3
Bild 8-9. Entstehung der Schalthysterese bei einer inver-
tierenden Mitkopplungsschaltung. a Invertierende Mitkopplung eines Operationsverstärkers; b stabile und instabile Arbeitspunkte; c Übertragungsverhalten (Schalthysterese)
8.4.1 Reihenschaltung
8.4 Graphische Zusammenfassung von Strom-Spannungs-Kennlinien Die Kennlinien in Reihe geschalteter Zweipole können durch Addition der Spannungen zu einer resultierenden Kennlinie „addiert“ werden, vgl. Bild 8-10. Bei parallelgeschalteten Zweipolen werden die Stromstärken addiert, vgl. Bild 8-11.
Bild 8-10. Strom-Spannungs-Kennlinie einer Widerstands-
Dioden-Reihenschaltung. a Reihenschaltung von Widerstand und Diode; b Konstruktion der resultierenden Kennlinie (Addition der Spannungen)
8 Nichtlineare Schaltungen
8.4.2 Parallelschaltung
Bild 8-12. Spannungsbegrenzung mit einer Z-Diode.
a Schaltung; b idealisierte Diodenkennlinie; c Wirkungsgrad
Bild 8-11. Strom-Spannungs-Kennlinie einer Widerstands-
Dioden-Parallelschaltung. a Parallelschaltung von Widerstand und Diode; b Konstruktion der resultierenden Kennlinie (Addition der Ströme)
tung 8-12a, in der eine Z-Diode die Spannung am Nutzwiderstand auf 6 V begrenzt. Der Wirkungsgrad η = f (R) soll berechnet werden. Er ergibt sich aus folgenden Überlegungen: 1. Bereich: R Ri ; η=
8.5 Lösung durch abschnittweises Linearisieren Wenn die u, i-Kennlinie eines nichtlinearen Zweipols wenigstens abschnittweise als gerade angesehen werden kann (idealisierte Kennlinie; vgl. Bild 8-12b), so reduziert sich in den einzelnen Abschnitten die Berechnung von u und i auf ein lineares Problem. Ein einfaches Beispiel hierzu liefert die Schal-
2. Bereich: R Ri ; η=
u 6V ;
iD = 0 ,
i = ii .
ui R = . Uq ii R + Ri u = 6V .
ui u2 /R u2 /R Ri . = = = Uq ii Uq · ui /Ri Uq (Uq − u)/Ri 2R
Die Ergebnisse für beide Bereiche sind in Bild 8-12c zusammengefasst.
G39
G40
G Elektrotechnik / Felder
Felder H. Clausert 9 Leitungen 9.1 Die Differenzialgleichungen der Leitung und ihre Lösungen Bei der „langen“ Leitung hängen Strom und Spannung außer von der Zeit auch vom Ort ab (Bild 9-1). Die Eigenschaften der Leitung werden nach dem Ersatzschaltbild Bild 9-2 durch vier auf die Länge bezogene Kenngrößen beschrieben: R Widerstandsbelag (auf die Länge bezogener Widerstand für Hin- und Rückleitung zusammen: ΔR/Δl für Δl → 0), L Induktivitätsbelag, C Kapazitätsbelag, G Ableitungsbelag (auf die Länge bezogener Leitwert zwischen Hin- und Rückleitung). Wird der 1. Kirchhoff’sche Satz auf das Leitungselement nach Bild 9-2 angewendet, so folgt mit i = Cdu/dt (siehe 2.3): 1 1 − i z − dz, t + i z + dz, t 2 2 ∂u(z, t) + G dz u(z, t) + C dz =0. (9-1) ∂t Entsprechend liefert der 2. Kirchhoff’sche Satz mit u = L di/dt (siehe 2.3): 1 1 − u z − dz, t + u z + dz, t 2 2 ∂i(z, t) =0. + R dz i(z, t) + L dz (9-2) ∂t Ersetzt man die ersten beiden Summanden in (9-1) und (9-2) jeweils durch die ersten beiden Glieder der zugehörigen Taylor-Reihen, so ergibt sich
Bild 9-2. Ersatzschaltbild eines Leitungselements
∂i(z, t) ∂u(z, t) + G u(z, t) + C =0, ∂z ∂t ∂u(z, t) ∂i(z, t) + R i(z, t) + L =0. ∂z ∂t
(9-3) (9-4)
Sollen (9-3) und (9-4) nur für den speziellen Fall gelöst werden, dass Strom und Spannung sich mit der Zeit sinusförmig ändern, so macht man wie in 2.1 die Ansätze √ i(z, t) = 2 Re {I(z) e jωt } , √ u(z, t) = 2 Re {U(z) e jωt } und erhält anstelle von (9-3) und (9-4): dI + (G + jωC )U = 0 , dz dU + (R + jωL )I = 0 . dz
(9-5) (9-6)
Hier sind I und U komplexe Effektivwerte, die von z abhängen. Aus (9-5) und (9-6) ergibt sich d2 I − γ2 I = 0 , dz2 d2 U − γ2 U = 0 , dz2
(9-7) (9-8)
wenn die Abkürzung γ2 = (R + jωL )(G + jωC )
(9-9)
verwendet wird. Gleichungen (9-7) und (9-8) haben gleichartige Lösungen; so ist z. B. Bild 9-1. Leitung, aus zwei Drähten bestehend: Doppellei-
tung
U(z) = Up e−γz + Ur eγz .
(9-10)
9 Leitungen
Man nennt den ersten Summanden die hinlaufende oder primäre (daher Index p) Welle oder Hauptwelle, den zweiten Summanden die rücklaufende (daher Index r) Welle oder Echowelle. Aus (9-10) ergibt sich mit (9-6), (9-9) und der Abkürzung 8 R + jωL ; (9-11) ZL = G + jωC Up −γz Ur γz I(z) = e − e . ZL ZL
(9-12)
9.2 Die charakteristischen Größen der Leitung Die Größe ZL nach (9-11) nennt man den Wellenwiderstand der Leitung. Die durch (9-9) definierte Größe γ heißt Ausbreitungskoeffizient. Er ist i. Allg. komplex: (9-13) γ = α + jβ . Der Realteil α ist ein Maß für die Dämpfung der Welle auf der Leitung und heißt Dämpfungskoeffizient. Durch den Imaginärteil β ist die Ausbreitungs- oder Phasengeschwindigkeit der Welle bestimmt: ω (9-14) v= . β Man bezeichnet β als Phasenkoeffizient. Zwischen β und der Wellenlänge λ besteht die Beziehung 2π . λ= β
(9-15)
Bild 9-3 zeigt den Einfluss der Größen α, β, λ auf den Spannungs- bzw. Stromverlauf auf der Leitung. Aus (9-14), (9-15) folgt mit ω = 2π f : v = fλ .
(9-16)
Die Eigenschaften einer homogenen Leitung können durch die vier konstanten Leitungsbeläge R , L , C , G oder durch die beiden komplexen Größen ZL und γ charakterisiert werden. Wenn die Leitungsverluste vernachlässigt werden (R → 0, G → 0), gehen (9-11) und (9-13) über in L ZL = , (9-17) C √ γ = jβ = jω C L . (9-18)
Bild 9-3. Spannungs- bzw. Stromverlauf auf der Leitung für
zwei Zeitpunkte (nur Hauptwelle)
Bei geringen Verlusten (d. h., ωL R , ωC G ), hat man R L G j − (9-19) ZL = 1− , C 2ω L C ⎛ ⎞ L ⎟⎟⎟⎟ 1 ⎜⎜⎜⎜ C α = ⎜⎝R + G (9-20) ⎟ 2 L C ⎠ und ein unverändertes β (9-18).
9.3 Die Leitungsgleichungen Nach (9-10) und (9-12) ist – mit U1 = U(0), U2 = U(l), I1 = I(0), I2 = I(l): U1 = Up + Ur , U2 = Up e−γl + Ur eγl , I1 =
Up Ur Up −γl Ur γl − , I2 = e − e . ZL ZL ZL ZL
Gibt man z. B. U2 und I2 vor, so kann man diese vier Gleichungen nach Up , Ur oder U1 , I1 auflösen und erhält 1 Up = eγl (U2 + ZL I2 ) , 2 (9-21) 1 −γl Ur = e (U2 − ZL I2 ) 2 bzw. die sog. Leitungsgleichungen ⎤ ⎡⎢ cosh γl ZL sinh γl ⎥⎥⎥ U ⎢⎢⎢ U1 ⎥⎥⎥ 2 . (9-22) = ⎢⎢⎢⎣ 1 sinh γl cosh γl ⎥⎦ I2 I1 ZL Eine zweite Form dieser Gleichungen entsteht durch Auflösen nach U2 , I2 : ⎤ ⎡⎢ cosh γl −ZL sinh γl ⎥⎥⎥ U ⎢⎢⎢ U2 ⎥⎥⎥ 1 . = ⎢⎢⎢⎣ 1 cosh γl ⎥⎦ I1 − sinh γl I2 ZL (9-23)
G41
G42
G Elektrotechnik / Felder
9.4 Der Eingangswiderstand Die Leitung mit dem Abschlusswiderstand Z2 = U2 /I2 hat den Eingangswiderstand Z1 = U1 /I1 , für den mit (9-22) gilt: Z2 cosh γl + ZL sinh γl . Z1 = ZL Z2 sinh γl + ZL cosh γl
r2 = (9-24)
Ist die Leitung mit dem Wellenwiderstand abgeschlossen (Z2 = ZL , „Wellenanpassung“), so folgt Z1w = ZL .
(9-25)
Für die leerlaufende Leitung (Z2 = ∞) hat man Z1l = ZL coth γl
Z2 − ZL . Z2 + ZL
(9-34)
Für die drei Sonderfälle Wellenanpassung, Leerlauf und Kurzschluss nimmt r2 die Werte 0, +1 bzw. −1 an. Mit der Abkürzung r2 entsteht aus (9-32): 1 (U2 + ZL I2 )[eγ(l−z) + r2 e−γ(l−z) ] . (9-35) 2 Der zugehörige Strom ergibt sich mit (9-6) zu U(z) =
(9-26)
I(z) =
und für die kurzgeschlossene Leitung (Z2 = 0) Z1k = ZL tanh γl .
Z2 − ZL −2γ(l−z) e . (9-33) Z2 + ZL Als Reflexionsfaktor des Abschlusswiderstandes definiert man r2 = r(l): r(z) =
1 (U2 − ZL I2 )[eγ(l−z) − r2 e−γ(l−z) ] . (9-36) 2 ZL
(9-27)
Im Fall der verlustfreien Leitung sind (9-26) und (9-27) durch Z1l = −jZL cot βl ,
(9-28)
Z1k = jZL tan βl .
(9-29)
zu ersetzen. Sind die Eingangswiderstände Z1l und Z1k bekannt, so können wegen (9-26) und (9-27) die charakteristischen Größen ZL und γl bestimmt werden: (9-30) ZL = Z1l Z1k , √ Z1l /Z1k + 1 1 . γl = ln √ (9-31) 2 Z1l /Z1k − 1
9.5 Der Reflexionsfaktor Ersetzt man in (9-10) die Größen Ur und Up durch (9-21), so folgt 1 U(z) = (U2 + ZL I2 ) eγ(l−z) 2 1 + (U2 − ZL I2 ) e−γ(l−z) . (9-32) 2 Den Quotienten aus dem zweiten Summanden (Echowelle) und dem ersten (Hauptwelle) in (9-32) bezeichnet man als Reflexionsfaktor r(z); mit Z2 = U2 /I2 erhält man
10 Elektrostatische Felder Näheres zur Einteilung der elektrischen und magnetischen Felder findet man in 14.2.
10.1 Skalare und vektorielle Feldgrößen Bei den Größen Strom und Spannung ist an einen bestimmten durchströmten Querschnitt zu denken bzw. an eine gewisse Länge, auf der der Spannungsabfall auftritt. Daneben gibt es physikalische Größen, die einem Punkt (im Raum) zugeordnet sind. Solche Größen, die einen Raumzustand charakterisieren, nennt man Feldgrößen. Ist eine Feldgröße ungerichtet, wie z. B. die Temperatur oder der Luftdruck, so heißt sie skalare Feldgröße, hat sie auch eine Richtung, wie z. B. die Windgeschwindigkeit, so spricht man von einer vektoriellen Feldgröße. Wenn die Feldgröße im Raum konstant ist, so nennt man das Feld homogen, andernfalls inhomogen. Ein Feld heißt (reines) Quellenfeld, wenn alle Feldlinien Anfang und Ende haben. Bei einem (reinen) Wirbelfeld sind alle Feldlinien geschlossen.
10.2 Die elektrische Feldstärke Das Coulomb’sche Gesetz besagt: Haben zwei Punktladungen q und Q gleiche Polarität und voneinander
10 Elektrostatische Felder
den Abstand r, so stoßen sie sich gegenseitig mit der Kraft qQ (10-1) F= 4πεr2 ab. (Bei ungleichen Vorzeichen der Ladungen ziehen sie sich an.) Die Größe ε in (10-1) heißt Permittivität (Dielektrizitätskonstante, Influenzkonstante). Sie charakterisiert die elektrischen Eigenschaften eines Materials, z. B. des Raumes, in dem sich die Ladungen q und Q befinden. Gleichung (10-1) gilt nur, wenn der die Ladungen umgebende Raum ein konstantes ε aufweist. Schreibt man (10-1) in der Form F=q
Q = qE , 4πεr2
Q , 4πεr2
bzw.
F = qE .
Schwieriger ist die Umkehrung des Problems: Es sei die Spannung zwischen einem beliebigen (Auf-)Punkt P und einem willkürlich gewählten Bezugspunkt O bekannt. Dann folgt aus (10-8) wegen der Wegunabhängigkeit des Integrals, wenn das Ergebnis der unbestimmten Integration mit f bezeichnet wird: "O UPO =
" O E · ds = f P = f (O) − f (P) = df . O
P
(10-3)
und allgemein gilt für die Kraft auf eine (Probe-) Ladung q an einem Ort der elektrischen Feldstärke E: F = qE
C
C ist ein beliebiger geschlossener Weg. Felder, für die (10-7) gilt, heißen wirbelfrei. Bei bekannter Feldstärke kann die Spannung zwischen den Punkten A und B wegen (10-6) berechnet werden: "B UAB = E · ds ., (10-8) A
(10-2)
so liegt folgende Interpretation nahe: Die Kraft auf die (Probe-)Ladung q ist der Ladung q und einem zweiten Faktor proportional, der eine Eigenschaft des Raumes am Ort der Kraftwirkung auf q beschreibt. Diese Eigenschaft des Raumes nennt man das elektrische Feld E, das von der im Abstand r vorhandenen Ladung Q hervorgerufen wird. Wegen (10-2) gilt für das elektrische Feld der Punktladung also die Feldstärke E=
zwischen diesen Punkten; ein solches Integral nennt man wegunabhängig. Diese Eigenschaft lässt sich auch so darstellen: 0 E · ds = 0 . (10-7)
(10-4)
P
Üblicherweise arbeitet man mit ϕ = − f und nennt ϕ die Potenzialfunktion: "O UPO =
"O E · ds = ϕ(P) − ϕ(O) = −
P
Der Zusammenhang zwischen der elektrischen Spannung U und der elektrischen Feldstärke E kann durch eine Energiebetrachtung gefunden werden: Bei der Verschiebung der Ladung q im elektrischen Feld E um das Wegelement Δs tritt eine Änderung der potenziellen Energie auf: ΔW = F · Δs = q(E · Δs) = qΔU .
(10-5)
Bewegt sich die Ladung q im elektrischen Feld vom Punkt A zum Punkt B, so hat man "B WAB = q
E · ds = qUAB .
(10-6)
A
Das in (10-6) auftretende Integral hängt nur von den Punkten A und B ab, nicht vom Verlauf des Weges
dϕ
(10-9)
P
oder
"P E · ds + ϕ(O)
(10-10)
E · ds (+ const).
(10-11)
ϕ(P) = − O
oder
" ϕ(P) = −
Wegen (10-9) oder (10-11) gilt: E · ds = −dϕ, d. h. (vgl. A) ,
(10-12)
E = −grad ϕ .
(10-13)
10.3 Die elektrische Flussdichte Neben der elektrischen Feldstärke benutzt man eine zweite Feldgröße zur Beschreibung des elektrischen
G43
G44
G Elektrotechnik / Felder
Feldes, nämlich die elektrische Flussdichte (elektrische Verschiebung), die durch D = εE
(10-14)
definiert ist. Die Richtungen von D und E stimmen bei den meisten Materialien überein. Materialien mit dieser Eigenschaft nennt man isotrop. Sind die Richtungen von D und E unterschiedlich, so bezeichnet man das Material als anisotrop; dann ist ε kein Skalar mehr, sondern ein Tensor (siehe A 3.4). Im Fall der Punktladung erhält man wegen (10-3) Q , (10-15) 4πr2 also einen Ausdruck, der die Permittivität ε nicht enthält. Die elektrische Feldkonstante (Permittivität des Vakuums) ist As = 8,854 . . . pF/m . ε0 = 8,854 . . . · 10−12 Vm (10-16) Für den von einem Material ausgefüllten Raum gibt man nicht ε selbst an, sondern die Permittivitätszahl (Dielektrizitätszahl), siehe Tabelle 10-1: D=
εr = ε/ε0 .
4πr2 D = AD = Q ,
Tabelle 10-1. Permittivitätszahl εr
1000. . . 9000 ≈ 2,8 3,7 ≈ 10 ≈8 ≈ 2,4 ≈1 2,2 2,2. . . 2,7 2,5. . . 2,8 3,1 5,5 3. . . 4,5 2,5 81
(10-19)
wobei A die Oberfläche einer bezüglich der Lage von Q konzentrischen Kugel ist und D die Flussdichte auf dieser Kugel. Handelt es sich statt um die Kugeloberfläche A um eine beliebige Hüllfläche S um die Ladung, so hat man statt (10-19) den Gauß’schen Satz der Elektrostatik: 0 D · dA = Q . (10-20) S
In (10-20) bedeutet Q die von der Hüllfläche S insgesamt umschlossene Ladung; sind es mehrere Ladungen, so hat man diese unter Beachtung des Vorzeichens zu addieren. Ist die Ladung räumlich verteilt, so ist Q durch Integration über die Raumladungsdichte (= lim(ΔQ/ΔV) für ΔV → 0) zu bestimmen. Das Flächenelement d A wird vereinbarungsgemäß nach außen positiv gezählt. Der elektrische Fluss Ψ durch eine beliebige Fläche A ist " D · dA . (10-21) Ψ=
(10-17)
Man bezeichnet die von einer elektrischen Ladung Q insgesamt ausgehende Wirkung als elektrischen Fluss Ψges und setzt Ψges = Q . (10-18)
Bariumtitanat Bernstein Epoxidharz Glas Glimmer Kautschuk Luft, Gase Mineralöl Polyethylen Polystyrol (PS) Polyvinylchlorid (PVC) Porzellan Starkstromkabelisolation (Papier, Öl) Transformatoröl Wasser
Für die Punktladung gilt nach (10-15)
A
Mit (10-20) kann die Feldstärke z. B. in der Umgebung einer Linienladung qL (= lim(ΔQ/Δl) für Δl → 0) berechnet werden. Im Fall eines koaxialen Zylinders (Bild 10-1) ergeben die Deckflächen A1 und A2 keinen Beitrag zum Integral, da hier die Vektoren D und d A aufeinander senkrecht stehen. Der Beitrag des Mantels M wird, da D auf dem Mantel die gleiche Richtung hat wie d A (in demselben Punkt) und außerdem dem Betrage nach konstant ist: " " " D·d A = D dA = D dA = D·2π l . (10-22) M
Bild 10-1. Herleitung der Potenzialfunktion einer Linienladung sehr großer Länge
10 Elektrostatische Felder
Es wird die Ladung qL l umschlossen. Damit hat man D · 2π l = qL l oder D=
qL . 2π
(10-23)
10.4 Die Potenzialfunktion spezieller Ladungsverteilungen Ist für eine Ladungsverteilung die elektrische Feldstärke bekannt, so kann die Potenzialfunktion mit (10-11) bestimmt werden. Für die Punktladung folgt wegen (11-3), wenn entlang einer Feldlinie integriert wird (hier ist ds = dr) " " " Q dr , ϕ(P) = − E · ds = − Edr = − 4πε r2 (10-24) also Q + ϕ0 . ϕ(P) ≡ ϕ(r) = (10-25) 4πεr Für die Linienladung ergibt sich entsprechend aus (10-23): " " qL d
, ϕ(P) = − E · d = − 2πε
also ϕ(P) ≡ ϕ( ) =
qL qL 1
0 ln + ϕ0 = ln . (10-26) 2πε
2πε
10.5 Influenz Bringt man einen ungeladenen Leiter (der also gleich viele positive wie negative Ladungen trägt) in ein elektrisches Feld, so werden die beweglichen Ladungsträger (Leitungselektronen) verschoben. In Bild 10-2 ist das für eine spezielle Anordnung schematisch dargestellt: Unter der Einwirkung des Feldes
Bild 10-2. Influenz (schematisch). (Q Influenzladung)
eines Plattenkondensators bildet sich auf der einen Seite des hier rechteckigen Leiters ein Elektronenüberschuss (−Q ) aus, während es auf der anderen Seite zu einem Elektronenmangel (+Q ) kommt. Das Feld dieser Ladungen (+Q , −Q ) und das äußere Feld heben sich im Innern des Leiters gerade auf, d. h., das Leiterinnere ist feldfrei. Diese Erscheinung der Ladungstrennung unter der Einwirkung eines äußeren Feldes bezeichnet man als Influenz; die getrennten Ladungen auf dem insgesamt ungeladenen Leiter heißen Influenzladungen (oder influenzierte Ladungen).
10.6 Die Kapazität In Bild 10-3 sind zwei isolierte Leiter im Querschnitt dargestellt, die die Ladungen +Q und −Q tragen. Eine solche Anordnung heißt Kondensator; die beiden Leiter nennt man die Elektroden des Kondensators. Nach dem Coulomb’schen Gesetz wirken Kräfte zwischen den Ladungsträgern. Im statischen Fall stellt sich eine solche Ladungsverteilung ein, dass beide Leiter ein konstantes Potenzial erhalten. Damit ist die Leiteroberfläche eine Äquipotenzialfläche; auf ihr stehen die Feldlinien senkrecht. Das Leiterinnere ist feldfrei. Die Spannung zwischen den beiden Elektroden eines Kondensators ist ihrer Ladung proportional: Q = CU .
(10-27)
Der Proportionalitätsfaktor C heißt Kapazität (des Kondensators). Werden n Kondensatoren parallel geschaltet, so gilt: Q = Q1 + Q2 + . . . + Qn = C1 U + C2 U + . . . + Cn U = (C1 + C2 + . . . + Cn )U !
= Cges U .
Bild 10-3. Kondensator, Feldlinien gestrichelt
G45
G46
G Elektrotechnik / Felder
Ein einzelner Kondensator, der bei der gleichen Spannung U die gleiche Ladung Q speichert, hat also die Kapazität Cges = C1 + C2 + . . . + Cn =
n
Ck .
(10-28)
k=1
Sind n ungeladene Kondensatoren in Reihe geschaltet, so nimmt jeder beim Anlegen der Spannung U die gleiche Ladung Q auf. Es gilt
Q Q Q = + +...+ C1 C2 Cn 1 1 1 Q = + +...+ C1 C2 Cn Q ! = . Cges Für die Kapazität eines einzelnen Kondensators, der die Reihenschaltung ersetzen kann, folgt n
(10-29)
10.7 Die Kapazität spezieller Anordnungen Nach (10-27) ist Q . (10-30) U Die Kapazität lässt sich demnach bestimmen, indem man die Ladung vorgibt, dann die Spannung berechnet und den Quotienten (10-30) bildet. Diese Vorgehensweise soll am Beispiel des Zylinderkondensators der Länge l 1,2 erläutert werden (Bild 10-4). Die Ladung des Kondensators sei Q = qL l. Zunächst ermittelt man die elektrische Flussdichte D mit (10-20). Das ist oben gezeigt worden mit dem Ergebnis (10-23). C=
Bild 10-4. Zylinderkondensator
qL . (10-31) 2πε
Mit (10-8) ergibt sich, wenn entlang einer Feldlinie integriert wird: "B " 2 U= E · ds = E( ) ds E=
1
A
=
U = U1 + U2 + . . . + Un
1 1 1 1 1 = + +...+ = . Cges C1 C2 Cn k=1 Ck
Damit ist wegen (10-14)
qL 2πε
" 2
1
qL
2 d
= ln .
2πε 1
Also wird C mit (10-30) und Q = qL l: 2πεl C= . (10-32) 2 ln
1 Im vorliegenden Fall hätte man die Spannung schneller ermitteln können, da die Potenzialfunktion der zylindersymmetrischen Anordnung bereits bekannt ist: (10-26). Damit wird die Spannung als Differenz des Potenzials der positiv geladenen Elektrode (ϕ+ ) und des Potenzials der negativ geladenen Elektrode (ϕ− ):
2 qL ln . U = ϕ+ − ϕ− = ϕ( 1 ) − ϕ( 2 ) = 2πε 1 Auf die gleiche Weise kann man die Kapazität des Plattenkondensators (Bild 10-5) εA C= (10-33) d und die des Kugelkondensators (Bild 10-6) bestimmen: 4πεr1 r2 C= . (10-34) r2 − r1 Hieraus folgt mit r2 → ∞ die Kapazität einer Kugel mit dem Radius r1 gegenüber der (sehr weit entfernten) Umgebung: C = 4πεr1 . (10-35)
Bild 10-5. Plattenkondensator
10 Elektrostatische Felder
die Ladung konstant bleibt, tritt nur eine weitere Energieform auf, nämlich die im Kondensator gespeicherte elektrische Energie We . Die Summe der Energieänderungen ist Null, also Fx dx + dWe = 0 oder Fx = − Bild 10-6. Kugelkondensator, gleiche Feld- und Potenzial-
verteilung wie bei der Punktladung (Querschnitt)
10.8 Energie und Kräfte Die in einem Kondensator gespeicherte Energie ergibt sich nach 1.2.2, wobei i dt nach 1.1.2 durch dQ ersetzt werden kann: " " ui dt = u dQ . (10-36) We = Wegen (10-27) ist (für konstantes C) dQ = d (Cu) = Cdu und damit "U 1 1 1 Q2 We = C u du = CU 2 = QU = · , 2 2 2 C
Hier ist Ad = V das Volumen zwischen den Platten, also des von dem elektrischen Feld erfüllten Raumes. Für die Energiedichte we = W/V gilt also "De we = E dD; De = Endwert (10-38) 0
Mit (10-14) erhält man für konstantes ε wie bei (10-37) drei Ausdrücke 1 D2 1 2 1 εE = DE = · . (10-39) 2 2 2 ε Mit dem aus der Mechanik bekannten Prinzip der virtuellen Verschiebung gewinnt man einen Zusammenhang zwischen der Änderung der elektrischen Energie und der Kraft. Die linke Platte des Kondensators in Bild 10-5 verschiebe sich aufgrund der Anziehungskraft Fx um ein Wegelement dx. Dabei wird die mechanische Energie Fx dx gewonnen. Wenn die Bewegung reibungsfrei und langsam erfolgt und außerdem
(Q = const) .
(10-40)
Ist bei der betrachteten Verschiebung der linken Platte die Spannung U konstant (der Kondensator bleibt mit der Spannungsquelle verbunden), so nimmt der Kondensator eine zusätzliche Ladung dQ auf und gleichzeitig ändert sich die in der Spannungsquelle gespeicherte Energie WQ . Die Summe der Änderungen der drei jetzt auftretenden Energieformen ist Null, also Fx dx + dWe + dWQ = 0. Hier ist nun nach (10-37) dWe = 12 U dQ und nach (10-36) dWQ = −Ui dt = −U dQ. Das Minuszeichen rührt daher, dass die Quelle Energie abgibt. Damit folgt 1 U dQ − U dQ = 0 2 1 Fx dx = U dQ . 2 Fx dx +
0
(10-37) wobei die beiden letzten Ausdrücke auf (10-27) beruhen. Für einen Plattenkondensator ist u = Ed und Q = DA. Damit folgt aus (10-36) " " E dA dD = V E dD . We =
dWe dx
oder
Ersetzt man 12 U dQ wieder durch dWe , so erhält man schließlich Fx =
dWe dx
(U = const) .
(10-41)
Bei der Herleitung von (10-40) und (10-41) wurde keine bestimmte Elektrodenform des Kondensators vorausgesetzt; die Gleichungen gelten also für beliebig geformte Leiter. Mit (10-40) und (10-41) soll die Kraft zwischen den Platten eines Plattenkondensators berechnet werden. Dazu muss die gespeicherte Energie als Funktion von x dargestellt werden. Nach (10-37) ist z. B.
we =
We (x) =
1 Q2 · 2 C(x)
(Q = const)
We (x) =
1 2 U C(x) 2
(U = const)
oder
mit C(x) =
εA . d−x
G47
G48
G Elektrotechnik / Felder
Dabei wird x wie in Bild 10-5 gezählt. Also erhält man mit (10-40) d 1 Q2 Q2 · (10-42) Fx = − = dx 2 C(x) 2εA und mit (10-41) εA d 1 2 U2 U C(x) = · . (10-43) Fx = dx 2 2 (d − x)2 Das letzte Ergebnis zeigt, dass bei konstanter Spannung die Kraft vom Plattenabstand abhängt. Ist dieser gleich d, so ist x = 0, also U 2 εA . (10-44) 2d2 Geht man in (10-42) und (10-44) zu Feldgrößen über, (Q/A = D, U/d = E), so ergibt sich: Fx =
Fx =
DE D2 εE 2 A= A= A. 2 2 2ε
Bild 10-7. Zur Herleitung der Stetigkeit der Normalkompo-
nenten von D
berücksichtigen sind: E2 · Δs2 + E1 · Δs1 = (t · E2 − t · E1 )Δs = (E2t − E1t )Δs = 0 oder
(10-45)
Für die Kraft pro Fläche Fx /A oder Kraftdichte (Kraftbelag) erhält man demnach die Ausdrücke (10-39).
10.9 Bedingungen an Grenzflächen Um eine Aussage über das Verhalten der Normalkomponente zu gewinnen, wendet man (10-20) auf einen flachen Zylinder an, der gemäß Bild 10-7 im Grenzgebiet zwischen zwei Materialien mit unterschiedlichen Permittivitäten liegt. Die Höhe des Zylinders wird als so gering angenommen, dass nur die Beiträge der beiden Deckflächen berücksichtigt werden müssen. Dann liefert die linke Seite von (10-20):
E2t = E1t . (10-47) Mit (10-46) und (10-47) wird das Brechungsgesetz für elektrische Feldlinien hergeleitet, und zwar unter der Voraussetzung, dass sich in der Grenzschicht keine Ladungen befinden. Nach Bild 10-9 ist mit (10-14) E1t ε1 E1t E2t ε2 E2t tan α1 = = , tan α2 = = . E1n D1n E2n D2n Durch Division folgt tan α1 ε1 = . (10-48) tan α2 ε2
D2 · ΔA2 + D1 · ΔA1 = (n · D2 − n · D1 )ΔA = (D2n − D1n )ΔA . Auf der rechten Seite steht die von dem Zylinder umschlossene Ladung ΔQ = σΔA , wobei σ die Flächenladungsdichte (Ladung pro Fläche, Ladungsbelag) in der Grenzschicht ist. Es ergibt sich (10-46) D2n − D1n = σ . Das Verhalten der Tangentialkomponenten folgt aus (10-7). Dabei wird nach Bild 10-8 für den Umlauf ein Rechteck geringer Höhe gewählt, sodass nur die Beiträge der Wegelemente parallel zur Grenzschicht zu
Bild 10-8. Zur Herleitung der Stetigkeit der Tangentialkomponenten von E
Bild 10-9. Zum Brechungsgesetz für elektrische Feldlinien
11 Stationäre elektrische Strömungsfelder
11 Stationäre elektrische Strömungsfelder 11.1 Die Grundgesetze Zur Beschreibung des räumlich verteilten elektrischen Stromes dient – analog der elektrischen Flussdichte – die elektrische Stromdichte J. Diese ist durch J=
ΔI ΔA
definiert, wobei der Strom ΔI senkrecht durch das Flächenelement Δ A hindurchtritt. Im allgemeinen Fall ist nach Bild 11-1 ΔI = J · ΔA
bzw. dI = J · dA .
Bild 11-1. Zum 1. Kirchhoff’schen Satz
(11-1)
Damit wird der Strom durch einen Querschnitt A: " J · dA . (11-2) I= A
Für den ersten Kirchhoff’schen Satz (1.1.3) ergibt sich " J k · dAk = 0 . (11-3) k A k
Bild 11-2. Zur Herleitung von (11-6) und (11-8)
G = ΔI/ΔU mit ΔI = JΔA und ΔU = EΔl. Durch Gleichsetzung beider Ausdrücke für G folgt J = κE oder allgemeiner (für isotrope Materialien) J = κE .
Einfacher lässt sich dieser Zusammenhang formulieren, wenn man die durchströmten Querschnittsflächen Ak zu einer geschlossenen Fläche S ergänzt und also in (11-3) das Integral über die nicht durchströmten Querschnitte (das Null ist) hinzunimmt (Bild 11-1): 0 J · dA = 0 . (11-4) S
Das Feld der elektrischen Stromdichte ist quellenfrei. Für den Zusammenhang zwischen Spannung und elektrischer Feldstärke gilt (10-8). Damit lautet der zweite Kirchhoff’sche Satz in allgemeiner Formulierung 0 E · ds = 0 .
(11-5)
C
Das Feld der elektrischen Feldstärke ist wie in der Elektrostatik wirbelfrei. Zwischen den Feldgrößen E und J besteht eine dem Ohm’schen Gesetz entsprechende Beziehung. Der in Bild 11-2 skizzierte Zylinder hat den Leitwert G = κΔ A/Δl. Andererseits ist
(11-6)
(11-7)
Die Grundgleichungen des Strömungsfeldes sind in Tabelle 12-1 den analogen Beziehungen für das elektrostatische und das magnetische Feld gegenübergestellt. Die in dem Volumenelement in Bild 11-2 umgesetzte elektrische Leistung ergibt sich mit P = I 2 R bzw. ΔP = (ΔI)2 ΔR mit der Resistivität = 1/κ zu 2 ΔI 2 Δl =
ΔlΔ A = J 2 ΔV . ΔP = (ΔI) ΔA ΔA Bezieht man die Leistung P auf das Volumenelement ΔV = ΔlΔA, so folgen für die Leistungsdichte p = ΔP/ΔV mit (11-6) die Ausdrücke p = J 2 = EJ = κE 2 .
(11-8)
11.2 Methoden zur Berechnung von Widerständen In Analogie zu (10-30) gilt G = I/U. Man kann also den Strom in einem betrachteten Widerstand vorgeben, die zugehörige Spannung ausrechnen und den
G49
G50
G Elektrotechnik / Felder
Quotienten bilden. In manchen Fällen kann ein Widerstand auch als Reihenschaltung aus Elementarwiderständen der speziellen Form ΔR = Δl/A aufgefasst werden: Δl oder R= ΔR =
A" "
R= dR = dl (11-9) A bzw. als Parallelschaltung aus Leitwerten der speziellen Form ΔG = κΔ A/l: ΔA oder G= ΔG = κ l " " κ dA . G= dG = (11-10) l Ist die Kapazität einer Anordnung bekannt, so kennt man auch den Leitwert bzw. Widerstand der entsprechenden Anordnung. Es gilt nämlich RC = ε
oder
G κ = . C ε
(11-11)
11.3 Bedingungen an Grenzflächen Das Verhalten der Feldkomponenten an der Grenzfläche zwischen zwei Materialien mit den Leitfähigkeiten κ1 bzw. κ2 ergibt sich wie in 10.9. Aus (11-4), angewendet auf den in Bild 10-7 skizzierten flachen Zylinder, folgt J2n = J1n .
(11-12)
Wegen (11-5) gilt (wie in der Elektrostatik) E2t = E1t .
(11-13)
Das Brechungsgesetz lautet tan α1 κ1 = , tan α2 κ2
(11-14)
wobei die Winkel wie in Bild 10-9 definiert sind. Hat ein Dielektrikum, gekennzeichnet durch seine Permittivität ε, auch eine gewisse Leitfähigkeit κ, so wird die Feldverteilung (auch an Grenzflächen) im stationären Fall (Gleichstrom) durch die Leitfähigkeiten bestimmt. So verhält sich nach (11-12) die Normalkomponente von J stetig, nicht dagegen die Normalkomponente von D. Es bildet sich vielmehr in der Grenzschicht eine Oberflächenladung gemäß (10-46) aus.
12 Stationäre Magnetfelder 12.1 Die magnetische Flussdichte Im Gegensatz zu elektrischen Ladungen treten magnetische Pole immer paarweise auf: Teilt man z. B. einen stabförmigen Dauermagneten zwischen seinen Polen, so entstehen zwei neue Stabmagnete (jeder mit einem Nord- und einem Südpol). Dabei wird das Ende, das bei freier Lagerung nach Norden (geographisch) weist, als (magnetischer) Nordpol bezeichnet, das andere als (magnetischer) Südpol. Von Magnetpolen hervorgerufene Felder können weitgehend auf gleiche Art behandelt werden wie die von elektrischen Ladungen verursachten Felder. Wichtiger für die technischen Anwendungen sind Magnetfelder, die von bewegten Ladungen (elektrischen Strömen) erzeugt werden. Solche Felder werden in den folgenden Abschnitten betrachtet. Zwei stromdurchflossene Leiter, die nach Bild 12-1 angeordnet sind, ziehen sich mit der Kraft μiIl (l ) (12-1) F= 2π
an, wenn beide Ströme die gleiche Richtung haben, andernfalls stoßen sie sich ab. Die Größe μ in (12-1) ist eine Materialkonstante und heißt Permeabilität (Induktionskonstante). Ähnlich wie in 10.2 lässt sich (12-1) in der Form schreiben: μI (12-2) F = il 2π
Man nennt B die magnetische Flussdichte (magnetische Induktion). Nach (12-2) ist die magnetische Flussdichte des stromdurchflossenen (geraden, sehr langen) Leiters μI B= . (12-3) 2π
Allgemein gilt für die Kraft auf den stromdurchflossenen Leiter der Länge l im Magnetfeld der Fluss-
Bild 12-1. Zur Kraft zwischen zwei stromdurchflossenen
Leitern
12 Stationäre Magnetfelder
dichte B, wenn das Magnetfeld senkrecht auf dem Leiter steht: (12-4) F = ilB . Ist der Winkel zwischen dem Leiter und dem Magnetfeld α, so wird F = ilB sin α .
(12-5)
Die Kraft steht senkrecht auf dem Leiter und auf B. Am einfachsten lässt sich dieser Sachverhalt formulieren, wenn man l einen Vektor zuordnet, dessen Richtung in die des Stromflusses zeigt. Dann gilt (s. Bild 12-2a) (12-6) F = i(l × B) . Befindet sich ein beliebig geformter dünner Draht, durch den der Strom i fließt, in einem inhomogenen Magnetfeld, so kann (12-6) nur auf ein Leiterelement Δs angewendet werden: ΔF = i(Δs × B) . Die Gesamtkraft folgt durch Integration: " F = i ds × B .
(12-7)
(12-8)
Bei räumlich verteilter elektrischer Strömung ist ein Volumenelement ΔV zu betrachten: Bild 12-2b. Hier ist ΔF = ΔV(J × B) . (12-9) Bewegt sich eine Ladung Q mit der Geschwindigkeit v durch das Magnetfeld, so wirkt auf sie die Kraft F = Q(v × B) .
(12-10)
12.2 Die magnetische Feldstärke Neben der magnetischen Flussdichte benutzt man zur Beschreibung des magnetischen Feldes als zweite Feldgröße die magnetische Feldstärke, die (für isotrope Materialien) durch H=
B μ
(12-11)
definiert ist. Für den stromdurchflossenen Leiter (gerade, sehr lang) erhält man mit (12-3) H=
I . 2π
(12-12)
Bild 12-2. Stromdurchflossener Leiter im Magnetfeld
Die magnetische Feldkonstante (Permeabilität des Vakuums) ist Vs μ0 = 4π · 10−7 ≈ 1,2566 . . . μH/m . Am (Dieser spezielle Wert hat sich durch entsprechende Festlegung der Basiseinheit Ampere ergeben.) In Analogie zu (12-10-12-17) beschreibt man die magnetischen Eigenschaften der Stoffe durch die Permeabilitätszahl (relative Permeabilität) μr = μ/μ0 .
(12-13)
Die magnetischen Werkstoffe teilt man ein in dia-, para- und ferromagnetische Stoffe. Bei para- und diamagnetischen Stoffen unterscheidet sich μr nur wenig von 1. Liegt μr wenig unter 1, so nennt man den Stoff diamagnetisch (z. B. Kupfer; μr = 1 − 10 · 10−6 = 0,999990). Ist μr etwas größer als 1, so heißt der Stoff paramagnetisch (z. B. Platin: μr = 1,0003). Bei ferromagnetischen Stoffen (Eisen, Kobalt, Nickel u. a.) ist μr 1. Der Grund dafür liegt darin, dass sich bei diesen Stoffen Elementarmagnete (bzw. Weiss’sche Bezirke, s. Teil B) unter dem Einfluss des äußeren Feldes ausrichten. Der Vorgang ist nichtlinear: Bild 12-3. Außerdem spielt die Vorgeschichte eine Rolle: wird ein Material erstmals magnetisiert, so bewegt man sich auf Kurve 1 in Bild 12-4, der sog. Neukurve, vom Punkt O z. B. bis zum Punkt P1 , in dem die Sättigungsfeldstärke erreicht ist (alle Elementarmagnete sind ausgerichtet). Lässt man jetzt die Feldstärke wieder auf null zurückgehen, so gelangt man auf Kurve 2 zur Remanenzflussdichte Br usw. (Hc . Koerzitivfeldstärke). Nach (12-12) ist 2π H = lH = I ,
(12-14)
wobei l die Länge der Feldlinie C mit dem Radius
bedeutet und H die Feldstärke auf dieser Feldlinie.
G51
G52
G Elektrotechnik / Felder
Der Zusammenhang zwischen dem Umlaufsinn und der Orientierung der Fläche ist wieder durch die Rechtsschraubenregel festgelegt (Bild 12-5). Den gleichen physikalischen Zusammenhang, nur in anderer Formulierung, beschreibt das Gesetz von Biot-Savart: μI ds × r0 · . (12-18) 4π r2 Es gibt den Beitrag zur Flussdichte im sog. Aufpunkt P an, den das stromdurchflossene Leiterelement ds (im sog. Quellpunkt) liefert (Bild 12-6). Vorausgesetzt wird hier eine im ganzen Raum konstante Permeabilität. Wendet man (12-15) auf einen sog. offenen Stromkreis nach Bild 12-7 an, so liefert die rechte Seite den Strom i oder den Wert Null, je nach der Form der Fläche A (bei gleicher Randkurve). Dieser Widerspruch dB =
Bild 12-3. Magnetisierungskennlinien
Bild 12-4. Magnetisierungskennlinie, Hystereseschleife
Handelt es sich bei C um einen nicht kreisförmigen Weg (oder geht der stromdurchflossene Leiter nicht durch den Kreismittelpunkt), so hat man statt (12-14): 0 H · ds = I . (12-15)
Bild 12-5. Zum Durchflutungsgesetz in allgemeiner Form
C
Das ist das Durchflutungsgesetz. Die Richtung des Stromes und der Umlauf C (bzw. das Wegelement ds) sind einander gemäß der Rechtsschraubenregel zugeordnet. Im Allgemeinen steht auf der rechten Seite von (12-15) die Summe der von dem Umlauf C umfassten Ströme: 0 H · ds = Ik = Θ . (12-16) C
k
Man nennt die Summe der Ströme die Durchflutung Θ. Ist die umfasste Strömung räumlich verteilt, so gilt wegen (11-2) " 0 H · ds = J · dA . (12-17) C
Bild 12-6. Zum Biot-Savart’schen Gesetz
A
Bild 12-7. Anwendung des Durchflutungssatzes auf offene
Stromkreise
12 Stationäre Magnetfelder
lässt sich dadurch auflösen, dass auf der rechten Seite die Leitungsstromdichte J durch die Verschiebungsstromdichte ∂ D/∂t ergänzt wird: " 0 ∂D H · ds = (12-19) J+ · dA . ∂t C
A
Das so erweiterte Durchflutungsgesetz nennt man die 1. Maxwell’sche Gleichung, vgl. 14.2.
12.3 Der magnetische Fluss Entsprechend den Zusammenhängen (10-21) im elektrischen Feld und (11-2) im Strömungsfeld definiert man den magnetischen Fluss " B · dA . (12-20) Φ= A
Im Fall des homogenen Feldes vereinfacht sich (12-20) zu Φ= B· A, (12-21) und wenn B senkrecht auf der Fläche A steht, wird Φ = BA .
(12-22)
Eine grundlegende Eigenschaft der Flussdichte B ist ihre Quellenfreiheit: 0 B · dA = 0 . (12-23)
12.5 Magnetische Kreise Für die bisher behandelten Felder gelten ganz ähnliche Gesetze, wie Tabelle 12-1 zeigt. (Einige der auftretenden Größen werden erst in den folgenden Abschnitten erklärt.) Wegen der weitgehenden Übereinstimmung der Grundgesetze können magnetische Kreise (solange μ konstant ist oder als konstant vorausgesetzt werden darf) genauso wie lineare Netze behandelt werden. Auch lassen sich ganz analoge Begriffe bilden. Das folgende Beispiel macht das deutlich: Bild 12-8. Ein Eisenring mit Luftspalt trägt eine stromdurchflossene Wicklung mit N Windungen. Die Querschnittsabmessungen des Ringes seien klein gegen den Radius einer Feldlinie; dann kann das Feld im Eisen näherungsweise als homogen angesehen werden. Außerdem soll die Luftspaltlänge sehr viel kleiner als die Luftspaltbreite sein; damit kann man das Feld auch im Luftspalt als homogen betrachten und von den Feldverzerrungen am Rand des Luftspalts absehen. Unter diesen Voraussetzungen folgt mit (12-24) BFe = BL = B (12-27) und mit (12-16) HFe lFe + HL lL = Θ = NI . Mit (12-11) und (12-22) ergibt sich hieraus lL lFe + =Θ. Φ μFe A μL A
S
12.4 Bedingungen an Grenzflächen Wie in 10.9 und 11.3 werden die Grundgesetze – hier (12-23) und (12-15) – auf einen flachen Zylinder bzw. auf ein Rechteck angewendet. Im ersten Fall erhält man (12-24) B2n = B1n , im zweiten Fall zunächst
falls in der Grenzschicht ein Strom ΔI (innerhalb des Rechtecks) fließt. Dividiert man hier durch Δs und führt den längenbezogenen Strom I = ΔI/Δs ein, so wird H2t − H1t = I (12-25) H2t = H1t .
(12-26)
(12-29)
Falls der Fluss gesucht ist und alle übrigen Größen bekannt sind, ist die Aufgabe hiermit im Prinzip gelöst. Nach Tabelle 12-1 entspricht der Fluss Φ dem Strom I, die Durchflutung Θ einer Spannung (Quellenspannung). Der Ausdruck in den runden
(H2t − H1t )Δs = ΔI ,
und für I = 0
(12-28)
Bild 12-8. Magnetischer Kreis
G53
G54
G Elektrotechnik / Felder
Tabelle 12-1. Die Grundgesetze stationärer Felder
Grundgesetze formuliert mit Feldgrößen
Elektrostatisches Feld
Stationäres elektrisches Strömungsfeld
Stationäres Magnetfeld
1
1
1
D · dA = Q
S
1
S
Zusammenhang zwischen integralen Größen und Feldgrößen
U=0 ⎫ Q⎪ ⎪ ⎬ ⎪ ⎪ = CU Ψe ⎭ . Ψe = D · dA .A U = E · ds
1 μA
U=0
I=
. A.
E · ds
s
V=Θ
s
Flussdichte gesucht (bei sonst gleicher Anordnung), so geht man wieder von (12-27) und (12-28) aus. Mit (12-11) für den Luftspalt (nur hier ist μ bekannt, nämlich μ0 ) folgt aus (12-28) HFe lFe +
(12-30)
(12-32)
B = μH Φ=0
φ = ΛV Ψ = Nφ = LI . Φ = B · dA .A V = H · ds
J · dA
U=
gegeben. Der Kehrwert heißt magnetischer Leitwert Λ: 1 Λ= . (12-31) Rm Bezeichnet man nun noch das Produkt aus Fedstärke und Länge als magnetische Spannung Vm , also Vm = Hl ,
J = κE I=0 I = GU
Klammern stellt die Summe zweier Widerstände dar. Man nennt ihn den magnetischen Widerstand Rm . So ist der magnetische Widerstand des Luftspalts und der des Eisenbügels durch einen Ausdruck der Form
H · ds = Θ
C
s
Rm =
1
E · ds = 0
C
D = εE Ψe = Q
B · dA = 0
S
1
E · ds = 0
C
integralen Größen
J · dA = 0
oder
B lL = Θ μ0
HFe B + =1. Θ/lFe μ0 Θ/lL
(12-33)
Damit kann man statt (12-29) auch schreiben: Φ(RmFe + RmL ) = VmFe + VmL = Θ . Bei vielen Anwendungen ist μFe nicht bekannt und auch nicht annähernd konstant. Die Eigenschaft des Eisens ist vielmehr durch die Magnetisierungskennlinie vorgegeben. Ist jetzt wieder der Fluss oder die
(12-35)
Diese Gleichung enthält die beiden Unbekannten HFe und B(= BFe = BL ). Es wird eine zweite Bedingung gebraucht; sie liegt in Form der Magnetisierungskennlinie vor: Bild 12-9. In dieses Diagramm hat man die erste Bedingung, also den
so lässt sich das Ohm’sche Gesetz des magnetischen Kreises formulieren: Vm = Rm Φ bzw. Φ = ΛVm .
(12-34)
Bild 12-9. Zum Verfahren der Scherung
13 Zeitlich veränderliche Magnetfelder
Bild 13-1. Ungeladener Leiterstab bewegt sich durch Ma-
gnetfeld Bild 12-10. B im Luftspalt eines Dauermagneten
linearen Zusammenhang zwischen HFe und B gemäß (12-35) (Scherungsgerade), einzutragen. Der Schnittpunkt zwischen beiden Kurven liefert die gesuchte Flussdichte. Von einem Dauermagneten mit Luftspalt sind die Abmessungen lFe und lL (Bild 12-8) und die Hystereseschleife bekannt; eine Wicklung ist nicht vorhanden. Gesucht ist die Flussdichte. Anstelle von (12-34) hat man (mit Θ = 0): HFe lFe +
B lL = 0 μ0
oder B = −μ0 HFe
lFe . lL
(12-36)
Die zweite Bedingung liegt als Kurve vor (Bild 12-10). Dabei wird vorausgesetzt, dass das Material sich für lL = 0 in dem durch HFe = 0, BFe = Br gekennzeichneten Zustand befindet. Bei Vergrößern des Abstandes zwischen den Magnetpolen auf das vorgegebene lL verringert sich BFe . Das gesuchte BFe kann im Punkt A abgelesen werden (Bild 12-10).
13 Zeitlich veränderliche Magnetfelder
den Ladungen an den Stabenden existiert ein elektrisches Feld und damit eine elektrische Spannung. Diese kann man messen, indem man den bewegten Leiter über leitende Federn mit einem ruhenden Spannungsmesser verbindet: Bild 13-2. Man findet experimentell: dΦ , dt wenn die Leiterschleife den Widerstand Null hat. Es ist dt der Zeitraum, in dem der von der Leiterschleife bzw. dem Umlauf umfasste Fluss um dΦ zunimmt. Dem Fluss Φ ordnet man die Umlaufrichtung und zugleich die Zählrichtung der Umlaufspannung u˚ (= induzierte Spannung) nach der Rechtsschraubenregel zu. Damit lautet das Induktionsgesetz u1 =
dΦ . (13-1) dt Die Erfahrung zeigt, dass (13-1) auch dann gilt, wenn die Flussänderung dΦ/dt durch eine zeitliche Änderung der Flussdichte zustandekommt. Ist z. B. Φ(t) = B(t)A(t), so geht (13-1) über in u˚ = −
dB dA − A(t) . (13-2) dt dt Hieraus folgt, wenn B zeitlich konstant ist, für die in Bild 13-2 skizzierte Anordnung (mit A = xl): u˚ = −B(t)
u˚ = −B
dx d(xl) = −Bl = −Blv . dt dt
13.1 Das Induktionsgesetz Bewegt man einen insgesamt ungeladenen Leiter durch ein Magnetfeld, so wirken auf die Ladungsträger Kräfte nach (12-10). Die negativ geladenen Leitungselektronen wandern hier an das untere Ende des Leiterstabes, während sich am oberen Ende eine positive Ladung (Elektronenmangel) zeigt. Zwischen
Bild 13-2. Zum Induktionsgesetz
(13-3)
G55
G56
G Elektrotechnik / Felder
Bild 13-2 enthält auch den von der induzierten Spannung verursachten Strom i. Mit diesem ist ein „sekundäres“ Magnetfeld verknüpft, das dem vorgegebenen „primären“ Magnetfeld entgegenwirkt: Lenz’sche Regel. Die allgemeine Form des Induktionsgesetzes erhält man, indem man in (13-1) den Fluss durch (12-20) und die Spannung durch (10-8) darstellt: 0 " d E · ds = − B · dA . (13-4) dt C
A
Das ist die 2. Maxwell’sche Gleichung. Sie gilt ganz allgemein für beliebige Umläufe. Wichtig ist, dass die Umlaufrichtung und die Orientierung der Fläche gemäß der Rechtsschraubenregel miteinander verknüpft sind. Im Gegensatz zum elektrostatischen Feld ist das durch Induktionswirkungen entstehende elektrische Feld nicht wirbelfrei. Damit folgt, dass das Integral in (10-8) nicht wegunabhängig ist. Bei einer Wicklung mit N Windungen umfasst u. U. jede Windung einen anderen Fluss (Teil- oder Bündelfluss): Φ1 , Φ2 , . . . , ΦN . Dann ist (13-1) durch u˚ = −
d (Φ1 + Φ2 + . . . + ΦN ) dt
(13-5)
zu ersetzen. Die Summe der Teilflüsse nennt man den Gesamt- oder Induktionsfluss ψ, also ist dψ . dt Sind die N Teilflüsse gleich, so hat man u˚ = −
dΦ . u˚ = −N dt
(13-6)
Bild 13-3. Zur Bestimmung der magnetischen Feldenergie
Die linke Seite stellt die von der Spannungsquelle in der Zeit dt abgegebene Energie dar, der erste Summand rechts ist die im Widerstand in Wärme umgesetzte Energie und der zweite Summand die zum Aufbau des Feldes aufgewendete Energie. Für diese Energieaufwendung lässt sich mit (12-22) schreiben (wobei bezüglich der Abmessungen des Kerns vorausgesetzt wird, dass das Feld als homogen betrachtet werden kann): dWm = Ni dΦ = NiA dB .
(13-10)
Hier lässt sich Ni aufgrund des Durchflutungsgesetzes (12-16) durch 2π H ersetzen: dWm = 2π AH dB = VH dB .
(13-11)
Dabei ist V das Volumen des Kerns. Durch Integration folgt "Be Wm = V
H dB ;
Be = Endwert
0
Für die Energiedichte wm = Wm /V gilt also "Be wm =
(13-7)
H dB .
(13-12)
0
13.2 Die magnetische Energie Um die zum Aufbau des magnetischen Feldes erforderliche Energie zu bestimmen, stellt man zunächst die Umlaufgleichung auf. Nach (13-1) lautet sie für die Anordnung nach Bild 13-3: u˚ = −u + Ri = −N
dΦ . dt
(13-8)
Durch Multiplizieren mit i dt entsteht ui dt = Ri2 dt + Ni dΦ .
(13-9)
Mit (12-11) erhält man hieraus für konstantes μ den Ausdruck wm =
1 B2 1 1 μH 2 = BH = · . 2 2 2 μ
vgl. 16.1.1
(13-13) Verringert man die magnetische Feldstärke von ihrem Endwert auf null, so gewinnt man die magnetische Energie vollständig zurück, wenn das Material keine Hysterese zeigt. Wird dagegen bei einem Material mit Hysterese die Hystereseschleife einmal vollständig durchlaufen, so kommt es – wie sich aus (13-12)
13 Zeitlich veränderliche Magnetfelder
Bild 13-6. Ersatzschaltbild zu Bild 13-5
13.3.2 Die Gegeninduktivität
Bild 13-4. Hystereseverlust
ergibt – zu einem Energieverlust (Hystereseverlust, Ummagnetisierungsverlust), der der von der Hystereseschleife umschlossenen Fläche proportional ist: Bild 13-4 (die waagrecht schraffierten Flächen entsprechen der aufgewendeten Energie, die senkrecht schraffierten der zurückgewonnenen Energie).
13.3 Induktivitäten 13.3.1 Die Selbstinduktivität
Für die Leiterschleife (Spule) nach Bild 13-5 gilt die Umlaufgleichung (13-8). Besteht zwischen dem Fluss Φ und dem verursachenden Strom i ein linearer Zusammenhang, so setzt man Ψ = NΦ = Li
(13-14)
und nennt L die Selbstinduktivität der Spule. Mit (13-14) folgt aus (13-8) der Zusammenhang di (13-15) u = Ri + L , dt für den man das Ersatzschaltbild 13-6 angeben kann. Die Selbstinduktivität entspricht also einem Schaltelement, bei dem gilt: di uL = L . (13-16) dt
Zwischen zwei stromdurchflossenen Spulen nach Bild 13-7 tritt eine magnetische Kopplung auf. Zunächst ist wegen (13-7) dΦ1 u˚ 1 = −u1 + R1 i1 = −N1 , dt (13-17) dΦ2 . u˚ 2 = −u2 + R2 i2 = −N2 dt Die Flüsse werden von beiden Strömen verursacht. Bei Linearität gilt Ψ1 = N1 Φ1 = L11 i1 + L12 i2 , (13-18) Ψ2 = N2 Φ2 = L21 i1 + L22 i2 . Hier sind L11 und L22 die Selbstinduktivitäten der Spulen 1 bzw. 2, L12 und L21 die Gegeninduktivitäten zwischen den Spulen. Diese stimmen (bei isotropen Medien) überein, wie mit einer Energiebetrachtung gezeigt werden kann. Üblich sind die vereinfachten Bezeichnungen L1 = L11 , L2 = L22 , M = L12 = L21 . (13-19) Mit (13-18) und (13-19) folgt aus (13-17): di2 di1 u1 = R1 i1 + L1 +M , dt dt (13-20) di1 di2 +M . u2 = R2 i2 + L2 dt dt Durch Umformung entsteht das Gleichungspaar d(i1 + i2 ) di1 u1 = R1 i1 + (L1 − M) +M , dt dt (13-21) d(i1 + i2 ) di2 +M , u2 = R2 i2 + (L2 − M) dt dt für das das Ersatzschaltbild 13-8 gilt.
Bild 13-5. Stromdurchflossene Leiterschleife, Selbstinduk-
tivität
Bild 13-7. Zwei magnetisch gekoppelte Leiterschleifen
G57
G58
G Elektrotechnik / Felder
Daraus folgt mit (13-22): L= Bild 13-8. Ersatzschaltbild zu Bild 13-7
13.3.3 Berechnung von Selbst- und Gegeninduktivitäten
Mit (13-14) und (13-18), (13-19) folgt – in Analogie zu (10-30) – Ψ NΦ L= (13-22) = i i und M = L12 = L21 = =
Ψ12 N1 Φ12 = i2 i2
Ψ21 N2 Φ21 = . i1 i1
(13-23)
Man gibt sich also einen Strom vor, berechnet den Fluss und bildet den Quotienten (13-22) bzw. (13-23).
μlN 2 a ln . 2π
i
(13-24)
Beispiel Als Beispiel für die Berechnung einer Gegeninduktivität werden die beiden senkrecht zur Papierebene sehr langen Leiterschleifen (Länge l) mit N1 bzw. N2 Windungen nach Bild 13-10 betrachtet. Bei vorgegebenem Strom i1 wird der Beitrag der Leiter a wegen (12-20), (12-11), (12-12) mit I = N1 i1
μlN1 i1 Φ2a = 2π
" ad
ac
d μlN1 i1 ad = ln .
2π
ac
Dabei wurde statt über A über die Fläche A integriert, da die Feldvektoren senkrecht auf A stehen und diese Integration einfacher ist. Ganz entsprechend erhält man für den Beitrag der Leiter b Φ2b =
μlN1 i1 bc ln . 2π
bd
Mit Φ21 = Φ2a + Φ2b liefert (13-23):
Beispiel
Die Ermittlung einer Selbstinduktivität soll für die mit N gleichmäßig verteilten Windungen bewickelte Ringspule mit rechteckigem Querschnitt und den Abmessungen nach Bild 13-9 durchgeführt werden. Wegen (12-20), (12-11) und (12-12) mit Ni statt I erhält man " Φ= =
" B dA =
μlNi μHl d = 2π
" a
i
M=
μlN1 N2 ad bc ln . 2π
ac bd
(13-25)
Die Ergebnisse (13-24) und (13-25) zeigen, dass die Windungszahl in der Selbstinduktivität als N 2 enthalten ist, während die beiden Windungszahlen in die Gegeninduktivität als Produkt N1 N2 eingehen.
d
μlNi a ln . 2π
i
Bild 13-9. Ringspule im Querschnitt (Es ist nur eine der N
Windungen dargestellt)
Bild 13-10. Zur Berechnung der Gegeninduktivität zwischen zwei senkrecht zur Papierebene sehr langen rechteckigen Spulen mit N1 bzw. N2 Windungen
13 Zeitlich veränderliche Magnetfelder
13.3.4 Die gespeicherte Energie
Die im Feld einer Spule gespeicherte Energie ergibt sich aus (10-36) mit (13-16) zu " " " di Wm = Li di . ui dt = L i dt = dt "I Wm = L
i di =
1 Ψ2 1 2 1 LI = Ψ I = · , (13-26) 2 2 2 L
0
wobei die beiden letzten Ausdrücke auf (13-14) beruhen. Durch ähnliche Überlegungen erhält man für zwei magnetisch gekoppelte Spulen (Bild 13-7): Wm =
1 1 L1 I12 + MI1 I2 + L2 I22 . 2 2
(13-27)
Dabei ist vorausgesetzt, dass die von beiden Strömen erzeugten Beiträge zum „koppelnden“ Fluss sich addieren. Andernfalls steht vor M ein Minuszeichen. Für n gekoppelte Spulen kann man herleiten: 1 Lμν Iμ Iν , 2 μ=1 ν=1 n
Wm =
Bild 13-11. Zur Herleitung der Kraft mithilfe des Prinzips
der virtuellen Verschiebung
Für konstantes L folgt
n
(13-28)
wobei Lμν = Lνμ die Gegeninduktivität zwischen der μ-ten und ν-ten Spule ist. Übrigens können Selbst- und Gegeninduktivitäten auch über die Energie ermittelt werden. Im ersten Fall bestimmt man für einen vorgegebenen Strom I die Energie W und bildet mit (13-26): L=
2W . I2
(13-29)
Bei zwei Spulen gibt man sich I1 und I2 vor, berechnet W und liest aus (13-27) die gesuchten Koeffizienten L1 , L2 , M ab.
13.4 Kräfte im Magnetfeld Das Prinzip der virtuellen Verschiebung werde auf die in Bild 13-11 skizzierte Anordnung angewendet, und zwar unter den folgenden Voraussetzungen: Die Stromquelle gibt einen konstanten Strom ab, die Leitungen sind widerstandsfrei,
der senkrechte Leiterstab kann sich reibungsfrei bewegen, weiter ist der Übergangswiderstand zwischen dem beweglichen Leiterstab und den feststehenden Leitern gleich null. Bei einer Verschiebung um dx wird die mechanische Energie Fx dx gewonnen. Gleichzeitig ändern sich die magnetische Feldenergie und die in der Quelle gespeicherte Energie um dWm bzw. dWq . Die Summe der Änderungen ist null: Fx dx + dWm + dWq = 0. Hierin ist nach (13-26) dWm = 12 I dΨ = 12 I dΦ (für N = 1) und mit (13-1) dWQ = −uI dt = − dΦ dt I dt = −I dΦ. Das Minuszeichen bringt zum Ausdruck, dass die Quelle Energie abgibt. Damit hat man 1 Fx dx + I dΦ − I dΦ = 0 2 oder 1 Fx dx = I dΦ . 2 Ersetzt man 12 I dΦ wieder durch dWm , so erhält man dWm (I = const) . (13-30) Fx = dx Mit (13-30) soll die Kraft zwischen zwei Eisenjochen nach Bild 13-12 bestimmt werden (Anwendung: Elektromagnet). Die Abmessungen seien so gewählt, dass man von Randeffekten absehen kann. Die magnetische Energie ist nach (13-13) und mit (12-22), (12-29), (12-33): lL B2 B2 Φ2 lFe + Wm = AlFe + AlL = 2μFe 2μ0 2 μFe A μ0 A Φ2 Rm ges Θ2 = . 2 2Rm ges Nach (13-30) wird mit (12-23) dRm ges 1 1 Θ2 d Θ2 · · · =− · Fx = 2 dx Rm ges 2 R2m ges dx 2 dR Φ m ges · . =− 2 dx =
G59
G60
G Elektrotechnik / Felder
die auch als 3. und 4. Maxwell’sche Gleichung bezeichnet werden. In (14-4) ist die Raumladungsdichte. Zu (14-1) bis (14-4) kommen noch die sog. Materialgleichungen (14-10-14), (14-11-14-6), (14-12-14-11) hinzu: D = εE , Bild 13-12. Kraft zwischen Eisenjochen
Darin ist mit (12-30), wenn μFe nicht von x abhängt: lL − x lFe + , Rm ges (x) = μFe A μ0 A
dRm ges 1 =− , dx μ0 A
also wird mit (12-22) Fx =
B2 Φ2 = A. 2μ0 A 2μ0
(13-31)
Die Kraft pro Fläche (der Kraftbelag) ist also 1 1 B2 1 = BHL = μ0 HL2 , vgl. (13-13) . 2 μ0 2 2
Aussagen über die Quellen der Felder machen 0 (12-23) B · dA = 0 , (14-3) " D · dA = S
dV , V
A
A
Damit ist rot H = J +
∂D . ∂t
(14-6)
Entsprechend folgt aus (14-2) ∂B rot E = − . (14-7) ∂t Mit dem Gauß’schen Satz (siehe A17.3) ergibt sich aus (14-4): " " 0 D · dA = div D dV =
dV V
V
(14-8)
div B = 0
A
(10-20)
C
div D = . Entsprechend kann (14-3) durch
Die beiden Maxwell’schen Hauptgleichungen machen Aussagen über die Wirbel des magnetischen bzw. elektrischen Feldes: 0 " ∂D (12-19) H · ds = J+ · dA , (14-1) ∂t C A 0 " d (13-4) E · ds = − B · dA . (14-2) dt
S
(14-5 a,b,c)
Mit dem Stokes’schen Satz (siehe A17.3) lässt sich (14-1) umformen: 0 " " ∂D H · ds = rot H · dA = J+ · dA . ∂t
S
14.1 Die Maxwell’schen Gleichungen in integraler und differenzieller Form
0
B = μH .
und somit
14 Elektromagnetische Felder
C
J = κE ,
(14-4)
(14-9)
ersetzt werden. Die Gleichungen (14-6) bis (14-9) sind die Maxwell’schen Gleichungen in differenzieller Form.
14.2 Die Einteilung der elektromagnetischen Felder Die Einteilung der Felder in die Kapitel 10 bis 15 erscheint sinnvoll, wenn man die Maxwell’schen Gleichungen unter verschiedenen einschränkenden Annahmen betrachtet. Der speziellste und zugleich einfachste Fall ist der, dass keine zeitlichen Änderungen auftreten und kein Strom fließt (∂/∂t = 0, J = o). Die Grundgleichungen zerfallen dann in zwei Gruppen rot E = o div D =
D = εE
rot H = 0 div B = 0 B = μH ,
15 Elektromagnetische Wellen
zwischen denen keine Beziehungen bestehen: in die Elektrostatik und die Magnetostatik. Diese Gebiete lassen sich also völlig unabhängig voneinander behandeln. Setzt man weiterhin ∂/∂t = 0 voraus, lässt aber Gleichströme zu, so sind das elektrische und das magnetische Feld über rot H = κE verknüpft. Hier spricht man von Feldern stationärer Ströme. Eine recht enge Verbindung zwischen elektrischen und magnetischen Größen liegt dann vor, wenn zeitliche Änderungen der magnetischen Flussdichte berücksichtigt werden (die magnetisierende Wirkung des Verschiebungsstromes jedoch noch nicht). Dieses Teilgebiet heißt Felder quasistationärer Ströme. Die Maxwell’schen Gleichungen in der allgemeinsten Form bilden die Grundlage zur Behandlung elektromagnetischer Wellen.
14.3 Die Maxwell’schen Gleichungen bei harmonischer Zeitabhängigkeit Ändern sich die Feldgrößen zeitlich nach einem Sinusgesetz, so geht man wie in 2.1 zur komplexen Darstellung über und macht z. B. für die elektrische Feldstärke den Ansatz E(x, y, z; t) ≡ E(P, t) = Re{E(P)e } . jωt
Hier ist P der Aufpunkt, der z. B. in kartesischen Koordinaten durch (x, y, z) bestimmt ist. Aus (14-1) und (14-2) ergeben sich " 0 H · ds = (J + jωD) · d A , (14-10) C
0
A
"
E · ds = −jω C
B · dA .
(14-11)
A
Statt (14-6) und (14-7) hat man rot H = J + jωD , rot E = −jωB .
(14-12) (14-13)
Die allein vom Ort P abhängenden komplexen Amplituden E(P), H(P) usw. nennt man Phasoren. (Anders als in der Wechselstromlehre arbeitet man in der Feldtheorie mit Amplituden und nicht mit Effektivwerten.)
15 Elektromagnetische Wellen 15.1 Die Wellengleichung Die Maxwell’schen Gleichungen (in der allgemeinsten Form) beschreiben die sehr enge Verknüpfung zwischen elektrischen und magnetischen Feldern: beide Felder „induzieren“ sich gegenseitig. Wenn dieser Vorgang nicht an einen Ort gebunden ist, sondern im Raum fortschreitet, liegt eine elektromagnetische Welle vor. Die folgenden Überlegungen beschränken sich auf den Fall sinusförmiger Zeitabhängigkeit. (Die Erweiterung auf den allgemeinen Fall beliebiger zeitlicher Änderung lässt sich mithilfe von Fourierreihen bzw. von Fourierintegralen leicht durchführen.) Außerdem wird vorausgesetzt, dass das betrachtete Gebiet raumladungsfrei, homogen und isotrop ist. Dann folgt aus (15-14-15-12) und (15-14-15-13), wenn man jeweils auf beiden Seiten die Rotation bildet: rot rot H + γ2 H = 0
(15-1)
rot rot E + γ E = 0
(15-2)
2
mit der Abkürzung γ2 = jωμ(κ + jωε) ;
γ = α + jβ (α, β reell) . (15-3)
(Häufig wird die Abkürzung k2 = −γ2 verwendet; man nennt k die komplexe Kreisrepetenz.) Statt (15-1) und (15-2) kann mit der aus der Vektoranalysis (A 17.1, (17-6)) bekannten Beziehung rot rot A = grad div A − ΔA und bei Beachtung von (14-8), (14-9) und = 0 geschrieben werden: ΔH − γ2 H = 0
(15-4)
ΔE − γ E = 0 .
(15-5)
2
Diese Gleichungen nennt man Helmholtz-Gleichungen oder auch Wellengleichungen. Bei Verwendung rechtwinkliger Koordinaten ist Δ=
∂2 ∂2 ∂2 + + , ∂x2 ∂y2 ∂z2
d. h., jede rechtwinklige Komponente von E und H (z. B. E x ) genügt der Gleichung ∂2 E x ∂2 E x ∂2 E x + + − γ2 E x = 0 . ∂x2 ∂y2 ∂z2
(15-6)
G61
G62
G Elektrotechnik / Felder
Zur Illustration eines Wellenfeldes soll eine möglichst einfache Lösung betrachtet werden. Es sei E = e x E x (z) .
(15-7)
Damit folgt aus (15-5) bzw. (15-6) d2 E x − γ2 E x = 0 dz2
(15-8)
mit der Lösung (vgl. 9.1) E x (z) = Ep e−γz + Er eγz .
(15-9)
Die zugehörige magnetische Feldstärke ergibt sich aus (15-14-15-13) mit (15-14-15-5): e x ey ez dE x rot E = 0 0 ∂/∂z = ey dz Ex 0 0 = −jωμH = −jωμey Hy . Da rot E hier nur eine y-Komponente aufweist, kann H (auf der rechten Seite) auch nur eine y-Komponente besitzen: dE x = −jωμHy . (15-10) dz Auf die gleiche Weise folgt aus (14-14-12) dHy = −(κ + jωε)E x . dz
(15-11)
Mit (15-10) erhält man aus (15-9), wenn man die Feldwellenimpedanz (Feldwellenwiderstand) 8 jωμ jωμ (15-12) ZF = = γ κ + jωε
Anmerkung: Weist dagegen das elektrische oder das magnetische Feld eine Komponente in Ausbreitungsrichtung auf, so spricht man im 1. Fall von einer E-Welle oder TM-Welle (transversal-magnetisch) und im 2. Fall von einer H-Welle oder TE-Welle (transversal-elektrisch). Die Lösung soll noch für zwei Sonderfälle betrachtet werden. Breitet sich die Welle im Vakuum aus (die folgenden Beziehungen gelten näherungsweise auch für den Luftraum), so wird ZF nach (15-12) μ0 ≈ 377 Ω (reell) , (15-14) ZF = ε0 d. h., das elektrische und das magnetische Feld der Hauptwelle sind in Phase; das gleiche gilt für die Echowelle. Beide Wellen sind in Bild 15-1 veranschaulicht. Für γ ergibt sich nach (15-3) ω √ γ = jω ε0 μ0 = jβ = j c0
Die Welle ist ungedämpft und breitet sich nach (15-915-15) mit der Geschwindigkeit √ v = 1/ ε0 μ0 ≈ 3 · 108 m/s , also mit der Lichtgeschwindigkeit c0 , aus. Die Wellenlänge beträgt nach (15-9-15-16) λ = c0 / f . Der zweite Sonderfall betrifft die Wellenausbreitung in einem Leiter; es soll dabei κ ωε sein, d. h., die
einführt, für das magnetische Feld: Hy (z) =
Ep −γz Er γz e − e . ZF ZF
(15-13)
Das Gleichungspaar ((15-9), (15-13)) stellt eine Welle dar, bei der beide Felder senkrecht auf der Ausbreitungsrichtung (z-Achse) stehen und keine Feldkomponenten in Ausbreitungsrichtung auftreten. Eine solche Welle nennt man transversal-elektromagnetisch (abgekürzt: TEM-Welle).
(rein imaginär) . (15-15)
Bild 15-1. Transversalwelle
15 Elektromagnetische Wellen
Bild 15-2. Leitende Platte im magnetischen Wechselfeld (Transformatorblech)
Verschiebungsstromdichte ∂ D/∂t wird gegenüber der Leitungsstromdichte J vernachlässigbar. Dann folgt aus (15-12) jωμ ωμ = (1 + j) ZF = (15-16) κ 2κ und aus (15-3) ωμκ γ = jωμκ = (1 + j) 2 1+j =: = α + jβ . (15-17) d Man nennt d die Eindringtiefe. Die Welle in diesem Fall heißt Wirbelstromwelle, obwohl die diesem Sonderfall zugrunde liegende Differenzialgleichung die Wärmeleitungs- oder Diffusionsgleichung ist. Für die in Bild 15-2 skizzierte Anordnung (Transformatorblech) ergibt sich aus Symmetriegründen mit (15-13): E γz 2E (e + e−γz ) = cos γz . Hy (z) = ZF ZF Arbeitet man hier die Randbedingung Hy (±b) = H0 ein, so erhält man Hy (z) = H0
cosh γz . cosh γb
(15-18)
solchen Antenne stellt eine um ihre Ruhelage schwingende Ladung Q dar. Gleichwertig ist die Vorstellung, dass ein Wechselstrom I in einem Leiter der sehr kleinen Länge l fließt. Es lässt sich zeigen, dass ein im Ursprung eines Kugelkoordinatensystems nach Bild 15-3 angeordnetes Stromelement das folgende Feld verursacht (der das Leiterelement umgebende Raum sei nichtleitend, damit wird γ = jω/c = jk imaginär): ilˆ −j ω r ZF 1 c e + (15-20) cos θ , Er = 2π r2 jωεr3 ilˆ −j ω r jωμ ZF 1 e c + 2 + Eθ = sin θ , (15-21) 4π r r jωεr3 ilˆ −j ω r jω/c 1 Hϕ = (15-22) e c + 2 sin θ . 4π r r Die übrigen Feldkomponenten sind null. Das Feld in unmittelbarer Nähe des Stromelements bezeichnet man als Nahfeld. Für die Funktechnik interessant ist das Feld in großer Entfernung, das Fernfeld; dieses wird durch die Terme beschrieben, die proportional zu 1/r sind: ilˆ −j ω r jωμ e c sin θ , 4π r ilˆ −j ω r jω/c e c sin θ , Hϕ = 4π r Eθ =
(15-23) (15-24)
Die Gleichungen (15-20) bis (15-24), die die Entstehung der elektromagnetischen Welle und ihre Ablösung von dem Elementarerreger beschreiben, kann man durch Feldbilder veranschaulichen: Bild 15-4. Die bis jetzt betrachtete Elementarantenne nennt man auch einen Hertz’schen Dipol, entsprechend der Vorstellung, dass hier ein elektrischer Dipol oszilliert. Hat der Elementarerreger dagegen die Form einer
Die Ströme in dem Leiter bezeichnet man als Wirbelströme. Die Stromdichte folgt mit (15-11): κE x (z) = J x (z) = −H0 γ
sinh γz . cosh γb
(15-19)
15.2 Die Anregung elektromagnetischer Wellen Elektromagnetische Wellen werden von (Sende-) Antennen angeregt. Eine Elementarform einer
Bild 15-3. Im Ursprung eines Kugelkoordinatensystems angeordnetes Stromelement (Hertz’scher Dipol)
G63
G64
G Elektrotechnik / Felder
Die beiden letzten Terme lassen sich zusammenfassen (vgl. A17.1): dw = −E · J − div(E × H) . (15-25) dt Durch Integration über das Volumen und Benutzung des Gauß’schen Satzes (siehe A17.3) entsteht 0 " " dw − (E × H)dA = dV . (15-26) E · J dV + dt S
V
V
Die Terme auf der rechten Seite sind die in Wärme umgesetzte Leistung und der auf die Zeit bezogene Zuwachs der Feldenergie; demnach muss die linke Seite die in das Volumen eingestrahlte Leistung sein; deren Flächendichte nennt man den Poynting-Vektor: S= E×H
Bild 15-4. Die Entstehung einer elektromagnetischen Welle in der Umgebung eines Hertz’schen Dipols
(15-27)
Mit den soeben entwickelten Beziehungen soll die vom Fernfeld eines Hertz’schen Dipols transportierte Leistung berechnet werden. Man denkt sich um den Dipol eine geschlossene Fläche gelegt, am einfachsten eine Kugel, in deren Mittelpunkt sich der Dipol befindet. Dann erhält man (ohne Zwischenrechnung) mit (15-26), (15-23), (15-24) für den Mittelwert der Leistung (Wirkleistung): 2 0 l 1 2π ∗ P = Re ZF (E × H )d A = |I|2 . (15-28) 2 3 λ S
Ordnet man der Antenne durch die Gleichung kleinen stromdurchflossenen Leiterschleife (die einen oszillierenden magnetischen Dipol darstellt), so benutzt man die Bezeichnung Fitzgerald’scher Dipol.
15.3 Die abgestrahlte Leistung Einen Ausdruck für die von der Welle transportierte Leistung gewinnt man, indem man von dem zeitlichen Zuwachs der elektrischen und magnetischen Energiedichte ausgeht. Dieser ist wegen (15-10-39) und (15-13-15-13) ∂D ∂B dw = E· +H· dt ∂t ∂t oder mit (15-14-15-6) und (15-14-15-7) dw = −E · J + E · rot H − H · rot E . dt
P = Rrd |I|2
(15-29)
einen Strahlungswiderstand Rrd zu, so ergibt sich für den Hertz’schen Dipol 2 l 2π Rrd = ZF (15-30) 3 λ und, falls dieser sich im Vakuum befindet: 2 2 l l Rrd ≈ 80π2 Ω ≈ 789,6 Ω . λ λ
15.4 Die Phase und aus dieser abgeleitete Begriffe Die komplexe Wellenfunktion, die man als Lösung von (15-6) erhält, kann in der Form
15 Elektromagnetische Wellen
A(P)ejϕ(P)
oder
A(x, y, z)ejϕ(x, y, z)
(15-31)
geschrieben werden. Die Amplitude A und der Nullphasenwinkel ϕ sind reelle Größen. Zu der komplexen Wellenfunktion gehört der Augenblickswert A(P) cos[ωt + ϕ(P)] .
(15-32)
Flächen, auf denen ϕ konstant ist, heißen Flächen gleicher Phase oder Phasenflächen. Nach der Form dieser Flächen unterscheidet man ebene Wellen, Zylinderwellen, Kugelwellen u. a. Wenn A auf den Phasenflächen konstant ist, spricht man von gleichförmigen (uniformen) Wellen. Die Wellennormale (in irgendeinem Punkt) steht senkrecht auf der Phasenfläche und hat die Richtung von grad ϕ. (Der Betrag von grad ϕ gibt die stärkste Änderungsrate der Nullphase ϕ an.) Die auf die Länge bezogene Abnahme der Phase in irgendeiner Richtung ist der der betreffenden Richtung zugeordnete Phasenkoeffizient: ∂ϕ , βx = − ∂x
∂ϕ βy = − , ∂y
∂ϕ βz = − . ∂z
(15-33)
Diese Terme lassen sich zu einem vektoriellen Phasenkoeffizienten zusammenfassen: β = −grad ϕ .
(15-34)
Das Argument der Cosinusfunktion in (15-32) gibt die augenblickliche Phase der Welle an. Eine Fläche konstanter Phase ist durch ωt + ϕ(P) = const
definiert. Die Fläche konstanter Phase stimmt in jedem Augenblick mit einer Phasenfläche überein. Bei einer Zeitänderung um dt muss, wenn (15-35) erfüllt sein soll, die Phase um dϕ abnehmen. In kartesischen Koordinaten gilt:
(15-35)
dϕ =
∂ϕ ∂ϕ ∂ϕ dx + dy + dz = grad ϕ · ds . ∂x ∂y ∂z
Damit lautet die Bedingung für die Bewegung einer Fläche konstanter Phase ω dt + grad ϕ · ds = 0 .
(15-36)
Daraus folgen die Phasengeschwindigkeiten in den drei Richtungen der kartesischen Koordinaten: ω ω = ∂ϕ/∂x β x ω ω vy = − = ∂ϕ/∂y βy ω ω = vz = − . ∂ϕ/∂z βz
vx = −
(15-37)
Die Phasengeschwindigkeit in Richtung der Wellennormalen ist ω vp = − . (15-38) |grad ϕ| Die Größe vp ist kein Vektor (mit den Komponenten (15-37)), sondern die kleinste Phasengeschwindigkeit der Welle.
G65
G66
G Elektrotechnik / Energietechnik
Energietechnik H. Zürneck 16 Prinzipien der Energieumwandlung
Tabelle 16-1. Typische elektrische Leistungen
16.0 Grundbegriffe 16.0.1 Energie, Leistung, Wirkungsgrad
Energieumwandlung und Energietransport sind die Aufgaben der elektrischen Energietechnik im weitesten Sinn. Elektrische Energie ist ohne grundsätzliche physikalische Einschränkung, wie sie z. B. der 2. Hauptsatz in der Thermodynamik darstellt, in andere Energieformen umwandelbar („Exergie“), wobei sich die Umwandlungsverluste gering halten lassen. Ihre Höhe ist durch die Bemessung der verwendeten Betriebsmittel beeinflussbar, und damit im Wesentlichen eine Frage wirtschaftlicher Abwägung. Ist W eine übertragene oder umgesetzte Energie, dann ist dW (16-1) P= dt die zugehörige momentane Leistung. Ein Teil der umgesetzten Leistung kommt nicht dem gewünschten Ziel zugute, geht dem Prozess „verloren“. Die übliche, wenn auch nicht korrekte Bezeichnung dafür ist „Verluste“. Leistungswirkungsgrad, kurz Wirkungsgrad η, ist das Verhältnis von abgegebener Leistung zur aufgenommenen Leistung eines Betriebsmittels oder einer Übertragungsstrecke. η=
Pab . Pauf
(16-2)
Gelegentlich wird mit dem Arbeitswirkungsgrad gerechnet, bei dem man das Verhältnis der entsprechenden Energien bildet. 16.0.2 Energietechnische Betrachtungsweisen
Wichtigste Form, in der elektrische Energie angewandt und erzeugt wird, ist 3-phasiger Drehstrom. Daraus abgeleitet wird zum Betrieb kleinerer Verbraucher auf der Niederspannungsebene einphasiger Wechselstrom.
Gerät, Prozess Signal in Fernsehempfangsantenne Leuchtdiode Glühlampen (ohne Speziallampen) Lichtmaschine in Kfz Dauerleistung aus 16-A-Steckdose E-Lokomotive Synchrongenerator
Leistung P 10 nW 10 mW 0,1 . . . 200 W 400 W 3,5 kW 2 . . . 6 MW . . . 1300 MW
Bild 16-1. Symmetrisches Drehspannungssystem UV verkettete Spannungen, US Sternspannungen
Im symmetrischen Drehstromnetz gilt für die Sternspannungen US in der Darstellung als Zeitfunktionen u1 = uˆ cos ωt , 2π u2 = uˆ cos ωt − (16-3) , 3 4π u3 = uˆ cos ωt − . 3 Bei symmetrischem Verbraucher bilden die Ströme ein Drehstromsystem: i1 = ˆi cos (ωt − ϕ) , 2π ˆ i2 = i cos ωt − −ϕ , 3 4π ˆ −ϕ . i3 = i cos ωt − 3
(16-4)
Für die verketteten Spannungen UV ergibt sich u12 = u1 − u2 , u23 = u2 − u3 , u31 = u3 − u1 , und nach Auflösung |UV | =
√ 3 |US | .
(16-5)
(16-6)
16 Prinzipien der Energieumwandlung
Bildet man aus (16-4) und (16-5) P = u1 i1 + u2 i2 + u3 i3
(16-7)
die Summe der Leistungen aller drei Stränge, so erhält man 3 P = uˆ Sˆi cos ϕ (16-8) 2 oder in Effektivwerten: √ P = 3 US I cos ϕ = 3 UV I cos ϕ (16-9) für die übertragene (Wirk-)Leistung. Eine einzelne Teilleistung aus (15-7), die die Leistung eines Wechselstromsystems darstellt, pulsiert mit doppelter Netzfrequenz (2ω). Bei der Summation der Teilleistungen zur Gesamtleistung des Drehstromsystems heben sich die pulsierenden Anteile auf. Die Leistung wird also durch symmetrischen Drehstrom kontinuierlich, und nicht pulsierend übertragen. Dies hat weit reichende Folgen: Verbraucher und Generator arbeiten mit zeitlich konstantem Leistungsfluss. Ist der Verbraucher ein Drehstrommotor, so ist dessen Drehmoment M = P/ω. Da der Leistungsfluss P nicht pulsiert, ist auch das Drehmoment zeitlich konstant. Die gleiche Überlegung gilt für den Generator. 16.0.3 Definitionen
Wirkleistung P (a) Wechselstrom: P = UI cos ϕ .
(16-10)
Mittelwert der zeitlich pulsierenden Leistung. Spannung und Strom sinusförmig und gegeneinander um den Phasenwinkel ϕ verschoben. (b) Drehstrom: √ (16-11) P = 3 US I cos ϕ = 3 UV I cos ϕ . Übertragungsleistung nicht pulsierend. Scheinleistung S S = UI , S = 3 US I =
√
3 UV I .
Blindleistung Q (a) Wechselstrom: Q = UI sin ϕ ,
(16-14)
(b) Drehstrom: Q = 3US I sin ϕ √ = 3 UV I sin ϕ . (16-15) Formales Produkt (oder bei Drehstrom Summe der Produkte) aus Spannung und derjenigen Komponente des Stromes I sin ϕ, die im Mittel nichts zur Übertragung von Energie beiträgt. Angabe in Var (var), kvar oder Mvar. Andere Darstellungen: Statt der Zeitfunktionen für die Größen des symmetrischen Drehstromsystems werden vorzugsweise bei der Behandlung unsymmetrischer (Fehler-)Fälle (z. B. bei der Kurzschlussberechnung) andere Darstellungen bevorzugt. Beim Verfahren der „symmetrischen Komponenten“ [1], transformiert man das Drehstromsystem in einen Bildraum, in dem ihrerseits wieder symmetrische Mit-, Gegen- oder Nullkomponenten auftreten. Auch werden die Ersatzbilder der Betriebsmittel (Maschinen, Leitungen, Transformatoren, Fehlerstellen) in diesen Bildbereich transformiert. Nach Berechnung der im Bildbereich symmetrischen, und damit einfacher zu behandelnden Vorhänge, wird ggf. zurücktransformiert und man erhält die Auswirkungen im Originalnetz.
16.1 Elektrodynamische Energieumwandlung
(a) Wechselstrom: (b) Drehstrom:
Keine physikalische Größe, da entgegen (16-10) und (16-11) nicht maßgebend für die übertragene Wirkleistung und damit die Energie. Maßgebend für die Auswahl von Betriebsmitteln, deren Beanspruchung unabhängig von der Phasenlage des Stromes ist, z. B. Transformatoren. Angaben nicht in physikalischer Einheit Watt (W), sondern Kunstbezeichnungen VA, kVA.
(16-12) (16-13)
Formales Produkt (bzw. Summe der Produkte) der Effektivwerte von Strom und Spannung.
16.1.1 Energiedichte in magnetischen und elektrischen Feldern
Die Umwandlung mechanischer in elektrische Energie (Generator) sowie die Wandlung elektrischer in
G67
G68
G Elektrotechnik / Energietechnik
mechanische Energie (Motor) ist prinzipiell sowohl unter Ausnutzung der elektrischen wie auch der magnetischen Feldstärke möglich. In der Technik kommt bis auf wenige Ausnahmen (elektrostatischer Bandgenerator für Hochspannungsuntersuchungen, Kondensatormikrofon) nur die Verwendung der magnetischen Kraftwirkungen zur Anwendung, da die unter technisch realisierbaren Feldstärken erzielbaren Energiedichten im Magnetfeld wesentlich größer sind als im elektrischen Feld [2]. Bei einer elektrischen Feldstärke von E = 1 kV/mm (unterhalb der Durchbruchsfeldstärke für Luft) ist die Energiedichte (vgl. (16-10-16-39)) w=
1 ε0 E 2 = 4,4 J/m3 . 2
(16-16)
Im Magnetfeld der Flussdichte |B| = 1,5 T (Eisen schon im Sättigungsgebiet) beträgt die Energiedichte (vgl. (16-13-16-13)) w=
2
1B = 0,9 · 106 J/m3 . 2 μ0
(16-17)
Letztere ist also um mehr als 5 Zehnerpotenzen größer als im Fall des angenommenen elektrischen Feldes. 16.1.2 Energiewandlung in elektrischen Maschinen
Allen elektrodynamischen Energiewandlern (Generatoren, Motoren, Schallwandlern) gemeinsam ist das Prinzip, dass sich ein stromdurchflossenes Leitersystem in einem Magnetfeld befindet und dass Strom und Feld gegeneinander Relativbewegungen ausführen können. Im Schema der Elementarmaschine (Bild 16-2) ist ein ortsfestes und (hier) zeitlich konstantes Feld der Flussdichte B angenommen, in dem senkrecht zur Flussrichtung ein Leiter der Länge l den Strom i führen kann. Die Art der Stromzuführung, die vom Maschinentyp abhängig
Bild 16-2. Elementarmaschine
ist, wird schematisch durch flexibel angenommene Leitungen dargestellt. ui ist die durch Bewegung induzierte Spannung, R soll den Widerstand der Leiteranordnung symbolisieren, und u ist eine von außen wirkende „Betriebsspannung“. Die Rückwirkung, die der Leiterstrom auf das Feld hat, und die bei vielen elektrischen Maschinen große Bedeutung für das Betriebsverhalten hat, wird durch das Schema nicht erfasst. Unabhängig von einer Bewegung des Leiters entsteht eine Kraft (z. B. Teil der Umfangskraft bei einer rotierenden Maschine) F = Bli .
(16-18)
Bewegt sich der Leiter in x-Richtung mit der Geschwindigkeit v, so ist die Flussänderung in der Leiterschleife dΦ = B dA = Bl dx
(16-19)
und bei zeitlich und örtlich konstanter Flussdichte dx dΦ = Bl = Blv . ui = (16-20) dt dt Der Momentanwert der dabei umgesetzten mechanischen Leistung, Pmech = Fv ,
(16-21)
entspricht dem Momentanwert der „inneren“ elektrischen Leistung (16-22) Pel = ui i . Sie unterscheidet sich um die „Verluste“ Pv = (u − ui )i = i2 R
(16-23)
von der außen, an den Maschinenklemmen wirksamen Leistung (16-24) P = ui . Bewegt sich der Leiter stromlos, d. h., sind induzierte und äußere Spannung im Gleichgewicht, so stellt sich eine Leerlaufgeschwindigkeit u v0 = (16-25) Bl ein. Wird der Leiter abgebremst, also v < v0 und ui < u, so gibt er mechanische Leistung ab, die er zuzüglich der Verluste Pv der Spannungsquelle u als elektrische Leistung entnimmt: Fall des Motorbetriebes. Wird der Leiter in Richtung der Bewegung angetrieben, v > v0 , ui > u, so kehrt sich der Strom gegenüber dem Motorbetrieb um und die dem Leiter zugeführte mechanische Leistung fließt, abzüglich der
16 Prinzipien der Energieumwandlung
Verluste, der Spannungsquelle als elektrische Leistung zu: Generatorbetrieb. Der Anordnung der „Elementarmaschine“ unmittelbar entsprechen Energiewandler, von denen nur eine begrenzte translatorische, u. U. oszillierende, Bewegung verlangt wird. Dynamische Lautsprecher/Mikrofone, Aktuatoren in Plattenlaufwerken (Momentanleistungen im Kilowattbereich). Der Leiter ist dort in Form einer Spule ausgebildet, die sich in einem im Bewegungsbereich homogenen Magnetfeld befindet. Rotierende Maschinen Die Maschinen bestehen grundsätzlich aus einem zylindrischen Stator, siehe Bild 16-3a, und einem Rotor R, der innerhalb der „Bohrung“ des Stators S im Abstand des Luftspaltes L drehbar gelagert ist. Die dem Luftspalt benachbarten Zonen von Stator und Rotor sind mit Längsnuten versehen, in die der jeweiligen Bauart entsprechende Wicklungen eingelegt sind. Bei einigen Maschinentypen sind Rotor oder Stator nicht als rotationssymmetrische Körper ausgebildet, sondern es handelt sich um Rotoren bzw. Statoren mit „ausgeprägten Polen“, Bild 16-3b. Drehmoment und Bauvolumen. Mit dem Strombelag a, der die Stromstärke pro Umfangseinheit an der Luftspaltoberfläche angibt und der wirksamen Leiterlänge l ergibt sich das Element der Umfangskraft zu dF = a(x) dx lB(x)
(16-26)
und damit das Element des Drehmomentes zu dM = a(x) dx lB(x)r .
(16-27)
dem Umfang sowie der Polpaarzahl p = 1 ergibt sich für das Drehmoment "2πr M=
dM = aBl · 2πr2 ,
(16-28)
x=0
M = aB · 2V .
(16-29)
mit V = πr2 l (dem Volumen des Läufers). Da die Größe des Strombelages die Wicklungserwärmung bestimmt und damit auch in den Wirkungsgrad eingeht, sind ihm enge Grenzen gesetzt. Ebenso ist die maximale Flussdichte durch die Sättigungseigenschaften des stets verwendeten Eisens begrenzt. Ein Vergleich von Maschinen unterschiedlicher Größe, jedoch gleicher Bauart, zeigt gemäß (16-29), dass das erzielbare Drehmoment proportional dem Läufervolumen ist. Damit bestimmt Ersteres auch das Gesamtvolumen und im Wesentlichen das Gewicht der Maschine. Auch bei anderen Verteilungen der Feldgrößen über dem Umfang, z. B. bei der bei Drehfeldmaschinen angestrebten sinusförmigen Verteilung, trifft diese Aussage zu, lediglich sind in (16-27) dann andere räumliche Verläufe der Feldgrößen einzusetzen und ggf. z. B. die Scheitelwerte von a und B. Die mechanische Wellenleistung Pmech einer Maschine ist (16-30) Pmech = Mωmech mit der Kreisfrequenz ωmech der Rotation. Die Leistung geht über das Drehmoment in die Baugröße ein. Demgemäß sind Maschinen mit geringem Verhältnis Gewicht/Leistung solche, die möglichst hohe Drehzahlen haben.
Unter der idealisierenden Annahme rechteckförmiger Verteilung von Strombelag a und Flussdichte B über
16.1.3 Kommutatormaschinen
Bild 16-3. a Schematischer Querschnitt der rotationssymmetrischen Maschine; b Schematischer Querschnitt durch Maschine mit ausgeprägten Polen im Rotor
Bei Kollektormaschinen wird das Feld von Erregerpolen geführt, die über eine Erregerwicklung die Durchflutung erhalten. Bei kleineren Gleichstrommaschinen werden auch Permanentmagnete eingesetzt. Ein Rotor („Anker“) aus geblechtem Eisen dreht sich relativ zum Feld. Er trägt in Nuten eine Wicklung, deren einzelne Wicklungsstränge zu einem Polygon zusammengeschaltet sind. Die Ecken des Polygons sind an Lamellen eines Kollektors angeschlossen, der mit dem Rotor umläuft. Die Stromzuführung zu den
G69
G70
G Elektrotechnik / Energietechnik
Lamellen des Kollektors erfolgt über Gleitkontakte (Bürsten) in der Weise, dass, unbeschadet der Rotation, stets gleichbleibende Zuordnung von Stromund Feldrichtung auftritt, d. h., die Umfangskraft in allen Leitern in gleicher tangentialer Richtung zeigt. Gleichzeitig sorgt die Umschaltung von einer zur benachbarten Lamelle, die Kommutierung, auch für die geeignete Zuordnung der Polaritäten von induzierter Spannung und Klemmenspannung an den Bürsten. Kollektormaschinen werden als Motoren mit Gleichstromspeisung für Antriebe, die kontinuierlich steuerbare Drehmomente und Drehzahl haben sollen, noch in großem Umfang eingesetzt. Im Grunddrehzahlbereich wird die Drehzahl über die Ankerspannung gesteuert. Zur Speisung werden heute fast ausschließlich Geräte der Leistungselektronik verwendet. Oberhalb des Grunddrehzahlbereiches kann durch Feldschwächung die Drehzahl nochmals erhöht werden, jedoch wird aus Gründen einer oberen Grenze für den Ankerstrom (Erwärmung, Kollektor) das erreichbare Drehmoment mit zunehmender Feldschwächung kleiner. Sollen Kollektormaschinen an Wechselstrom betrieben werden, müssen die zeitlichen Verläufe von Fluss und Ankerstrom übereinstimmen. Erreicht wird dies durch Reihenschaltung der entsprechend bemessenen Erregerwicklung und des Ankers. Als Universalmotor hat diese Form des Reihenschlussmotors erhebliche Bedeutung bis zur Leistung von etwa 2 kW, da die Kollektormaschine, prinzipiell in ihrer Drehzahl, unabhängig von der Netzfrequenz ist. Weitere Einzelheiten: Kommutierung wird durch zusätzliche „Wendepole“, deren Wicklung vom Ankerstrom durchflossen ist, verbessert. „Kompensationswicklung“, ebenfalls vom Ankerstrom durchflossen, hebt das Ankerfeld ganz oder teilweise auf. Dadurch auch Verbesserung der Kommutierung und Verbesserung der dynamischen Eigenschaften, insbesondere bei geregelten Antrieben. 16.1.4 Magnetisches Drehfeld
In Bild 16-4 sind drei gleiche Spulen an symmetrische Drehspannung u1 , u2 , u3 angeschlossen. Die Spulenachsen sind um jeweils 2π/3 entsprechend den Phasewinkeln des Drehspannungssystemes räumlich gegeneinander versetzt, die räumlichen Einheitsvekto-
Bild 16-4. Zur Entstehung eines magnetischen Drehfeldes
ren der Achsrichtung lauten: E1 = e j0 ,
2π
E2 = e j 3 ,
4π
E3 = e j 3 .
In jeder Achsrichtung bildet sich ein magnetisches Wechselfeld der Form b(t) = bˆ · cos(ωt + α) ,
(16-31)
wobei α der Phasenlage der jeweiligen Spannung entspricht, im Dreiphasensystem also 0, −2π/3, −4π/3. Multiplikation dieser Wechselfelder mit dem entsprechenden Einheitsvektor und Addition der Produkte liefert die Flussdichte im Koordinatenursprung: b = bˆ · cos(ωt − 0) · ej0 2π 2π ˆ + b · cos ωt − · ej 3 3 4π 4π ˆ + b · cos ωt − · ej 3 , 3 b=
4π bˆ jωt · e + e−jωt + ejωt + e−jωt · ej 3 2 8π + e jωt + e−jωt · ej 3 ,
und wegen 4π 8π e−jωt · e j0 + e j 3 + e j 3 = 0 , b=
3 ˆ jωt ·b·e 2
ein Drehfeld, welches sich durch einen Zeiger konˆ und konstanter Rotationskreisstanter Länge (3/2 · b) frequenz ω darstellen lässt (Kreisdrehfeld). Etwaige Unsymmetrien der Spannungen oder der Spulen erzeugen ein überlagertes gegenläufiges Drehfeld (e−jωt ), damit periodische zeitliche Pulsationen von |b| und somit ein elliptisches Drehfeld.
16 Prinzipien der Energieumwandlung
Bild 16-5. Schema einer Drehstromwicklung
In realen Maschinen sind die Spulen der Drehstromwicklung über dem Umfang verteilt (Bild 16-5). Die Wicklungsanordnung bewirkt, dass das von einer Spule ausgehende Feld räumlich annähernd sinusförmig im Luftspalt verteilt ist. Die Anwendung der vorhergehenden Überlegung auf diese Verteilung ergibt eine als Drehfeld im Luftspalt umlaufende Welle der Flussdichte. Die gleichen Überlegungen gelten auch für die umlaufende Welle des Strombelages a. Bild 16-5 stellt eine Wicklung mit der Polpaarzahl p = 1 dar. Bei größeren Polpaarzahlen werden p derartiger Spulenanordnungen am Umfang verteilt untergebracht, wobei das Einzelsystem auf den Bogen 2πp zusammengedrängt wird. Allgemein gilt für die Kreisfrequenz ωD des Drehfeldes ωD = ω1 /p
stationären Betrieb mit der synchronen Drehzahl, sein Gleichfeld wird also mit ωD in Richtung des Statorfeldes gedreht. Er erzeugt damit ein Drehfeld, welches synchron mit dem Statordrehfeld umläuft. Für die Behandlung des Betriebsverhaltens wird räumlich sinusförmige Verteilung beider Drehfelder angenommen, was auch in der Praxis durch entsprechenden Wicklungsaufbau und andere konstruktive Maßnahmen annähernd erreicht wird. Beide mit gleicher Geschwindigkeit umlaufende Felder addieren sich zu einem resultierenden Drehfeld, welches für Spannungsbildung und Drehmomenterzeugung maßgebend ist. Entscheidend für die Größe des resultierenden Feldes ist der räumliche Winkel zwischen Stator- und Rotorfeld. Für stationäre Betriebsverhältnisse (Hauptanwendungsfall: Generator in Kraftwerken) lässt sich der Turbogenerator durch eine Ersatzschaltung nach Bild 16-6 nachbilden |3|. Die „innere“ Spannung E und die Klemmenspannung U unterscheiden sich durch den Spannungsabfall, den der Laststrom I an der Reaktanz X, die die Wirkung der Fehler innerhalb der Maschine beschreibt, hervorruft: I=−
(16-32)
16.1.5 Synchronmaschine
P = 3UIw =
Der Stator trägt eine Drehstromwicklung der Polpaarzahl p, der Rotor eine vom Erregergleichstrom ie durchflossene Wicklung derselben Polpaarzahl. Der Erregerstrom ie wird über Schleifringe und Bürsten zugeführt. Bei kleineren Leistungen sind gelegentlich die Aufbauten von Stator und Rotor vertauscht (Außenpolmaschine). Die an das Drehstromnetz angeschlossene Statorwicklung erzeugt ein umlaufendes Drehfeld (Feldwelle), deren Rotationsfrequenz ωD von der Netzkreisfrequenz ωN und der Polpaarzahl p abhängt: ωN . p
(16-34)
Ist θ der Winkel zwischen E und U (Polradwinkel), so beträgt die Wirkleistung
mit der Drehspannungsfrequenz ω1 .
ωD =
U E + . jX jX
3|E||U| sin θ . X
(16-35)
Für das Moment gilt P 3p |E||U| = · sin θ . (16-36) ω ω X Das den Generator antreibende (oder den Synchronmotor belastende) Moment darf den Scheitelwert, der sich aus (16-36) ergibt, nicht überschreiten und muss bei Winkeländerungen (Lastschwankungen) zu einem stabilen Punkt zurückkehren. Grenzlagen des Polradwinkels sind θ = 0◦ und 90◦ , in der Praxis θ < 90◦ . M=p
(16-33)
Die entsprechende Drehzahl ist die „synchrone“ Drehzahl n0 . Der Rotor dreht sich im normalen
Bild 16-6. Vereinfachtes Ersatzbild des Synchronturboge-
nerators
G71
G72
G Elektrotechnik / Energietechnik
Die Regelung für den Generator greift an zwei Stellen ein: 1. Über den Erregerstrom als Stellgröße wird der Blindleistungsaustausch zwischen Generator und Netz beeinflusst und damit die Spannung der Maschine geregelt. 2. Das Drehmoment des Antriebes (Turbine) ist Stellgröße für die vom Generator abgegebene Wirkleistung. Die statische Einstellung des Reglers ist so, dass mit fallender Frequenz (steigende Last) die Wirkleistungsabgabe steigt. 16.1.6 Asynchronmotoren
Asynchronmaschinen enthalten in ihrem Stator eine Drehstromwicklung der Polpaarzahl p. Der Rotor (auch Läufer) enthält bei der Schleifringausführung auch eine Drehstromwicklung mit derselben Polpaarzahl wie der Stator, deren Anschlüsse über Schleifringe zugänglich sind. Über diese Anschlüsse können Widerstände zur Anlaufhilfe bei Schweranlauf angeschlossen werden oder – in seltenen Fällen – leistungselektronische Einrichtungen zur Verstellung der Drehzahl. Bei der sehr viel häufiger verwendeten Käfigläuferausführung besteht die „Rotorwicklung“ aus Stäben, die an den Stirnseiten des Rotors untereinander kurzgeschlossen sind (Käfig). Die Vielzahl der Stäbe hat magnetisch die Wirkung einer vielphasigen, in sich kurzgeschlossenen Drehstromwicklung. Die Ausdehnung der Stäbe in radialer Richtung ist in fast allen Fällen größer als in Richtung des Rotorumfanges (Stromverdrängungsläufer zur Verbesserung des Anlaufverhaltens). Meistens wird der Stator an ein Drehstromnetz konstanter Spannung und Frequenz angeschlossen. Die Drehzahl ist dann eng an die durch Netzfrequenz fN und Polarpaarzahl p bestimmte synchrone Drehzahl n0 = fN /p gebunden (n ≈ (0,95 · · · 0,97)n0 ). Sollen Drehzahl und/oder Drehmoment steuerbar sein, so erfolgt die Speisung leistungselektronisch aus dem Drehstrom- oder Gleichstromnetz (dies z. B. bei elektrischen Bahnen) über Umrichter (s. Kap. 18) mit variabler Frequenz und Spannung. Die Drehspannung erzeugt ein magnetisches Drehfeld, welches in Bezug auf ein statorfestes Koordinatensystem mit der Kreisfrequenz ωel = ω1 /p (ω1 = Kreisfrequenz der Statorspannung) rotiert.
Bild 16-7. Drehrichtung von Läufer (ωmech ), Drehfeld (ωel ) und Läufer-Drehstromsystem (ω2 )
Von der Differenz der Rotationsgeschwindigkeit des Feldes ωel und der Rotationsfrequenz des Läufers ωmech hängen Kreisfrequenz ω2 und Größe der im Läufer induzierten Drehspannung ab: ω2 = ωel − ωmech . Der Schlupf ω2 ωel − ωmech n0 − n s= = = ωel ωel n0
(16-37)
(16-38)
gibt die relative Abweichung der mechanischen Drehzahl von der des Drehfeldes an. n Drehzahl des Läufers n0 = f1 /p „synchrone“ Drehzahl (Drehzahl im f1
verlustfreien Leerlauf des Motors) Frequenz der angelegten Drehspannung
Die induzierte Läuferspannung hat in der kurzgeschlossenen Läuferwicklung Drehstrom zur Folge, der bezogen auf das Läufersystem die Kreisfrequenz ω2 besitzt. Vom Stator aus betrachtet hat der Läuferstrom wegen der Rotation des Läufers jedoch scheinbar die Kreisfrequenz ωel . Damit kann er zusammen mit dem mit ωel rotierenden Feld ein Drehmoment entwickeln. Wie beim Transformator können Läuferwiderstand und -reaktanz auf die Primärseite (Stator) umgerechnet werden. Vernachlässigt man den für das Betriebsverhalten der Maschine nicht bedeutenden Statorwiderstand, so überträgt das Drehfeld die Wirkleistung
(16-39) Pel = 3 Re U 1 I ∗1 auf den Rotor. Diese Leistung teilt sich auf in die mechanische Leistung Pmech = (1 − s)Pel (16-40) und die im Läuferwiderstand umgesetzte Verlustleistung Pvl = sPel . (16-41)
16 Prinzipien der Energieumwandlung
Nach Umrechnung |1| ist R1 /s , (16-42) (R1 /s)2 + Xσ2 umgerechneter Läuferwiderstand , umgerechnete Streureaktanz .
Pmech = 3(1 − s)U12 R1 Xσ
Damit ist das Moment nach Einführung von ωel = 2π f1 /p Pmech Pmech M= = ωmech (1 − s)ωel 3pU12 1 = · . sXσ 2π f1 Xσ R1 + sXσ R1
(16-43)
Beim sog. Kippschlupf skp =
R1 Xσ
(16-44)
durchläuft das Moment ein Maximum, das Kippmoment Mkp . Bezieht man das Moment darauf und führt skp , den Kippschlupf, als charakteristische Größe der Maschine ein, so gilt für das Moment die Kloss’sche Gleichung M 2 = s (16-45) skp . Mkp + skp s Bild 16-8 stellt diesen Zusammenhang dar. Tabelle 16-2 zeigt zusammengefasst die Betriebsarten der Asynchronmaschine. Im Anlauffall s = 1 stellt die Maschine einen kurzgeschlossenen Transformator dar. Reduktion des Anlaufstromes evtl. durch Verringern der Spannung (Stern-Dreieck-Schaltung), (vermindert nach (16.1.6.7) das Anlaufmoment) oder/und Erhöhung des Läuferwiderstandes beim Anfahren (Schleifringläufer, Stromverdrängungsläufer).
Bild 16-8. Betriebskennlinie des Asynchronmotors (schraf-
fiert: normaler Betriebsbereich) MA Anlaufmoment, MN Nennmoment
Bereich s = 1 bis skp wird beim Hochlauf durchfahren. Arbeitspunkt im Motorbetrieb im Bereich s = skp . . . s = 0, für Dauerbetrieb wegen der Läuferverluste etwa bis M = 0,5Mkp . Dort „harte Kennlinie“, d. h., im normalen Betriebsbereich hängt die Drehzahl nur wenig vom Lastmoment ab. Im übersynchronen Generatorbetrieb (n > n0 , s < 0) nimmt die Maschine, wie auch im Motorbetrieb, induktive Blindleistung auf und kann Wirkleistung abgeben. Betrieb daher nur am Netz möglich, welches induktive Blindleistung abgeben kann. Anwendung praktisch auf „Senkbremsschaltung“ beschränkt (Aufzüge, Förderanlagen).
16.2 Elektromagnete Das Feld B im Luftspalt eines Elektromagneten (Bild 16-9), werde homogen angenommen. Die im Volumen Ax gespeicherte Energie beträgt W=
Ax B2 · . 2 μ0
(16-46)
Dagegen ist die in den Eisenteilen des magnetischen Kreises herrschende Energiedichte, wegen der wesentlich größeren Permeabilität des Ferromagnetikums gegenüber derjenigen von Luft, sehr viel kleiner als im Luftspalt. Unter Annahme aufgeprägter Flussdichte B bewirkt eine Verschiebung dx der Pole in Richtung der An-
Tabelle 16-2. Betriebsarten der Asynchronmaschine
s 1 0...1
n 0 n0 . . . 0
1
> n0 0 werden als Dämpfung, Werte d < 0 nach Betragsbildung auch als Verstärkung bezeichnet.
G85
G86
G Elektrotechnik / Nachrichtentechnik
Zur Angabe absoluter Signalwerte werden Pegel verwendet, LP = 10 lg (P/P0 ) dB und LU = 20 lg (U/U0 ) dB
(20-2)
bei denen ein Bezug auf eine konstante Leistung P0 bzw. eine konstante Spannung U0 vorgenommen wird. Die am häufigsten verwendeten Bezugswerte sind P0 = 1 mW, der mit der „Quasi-Einheit“ dB (1 mW) = dBm und U0 = 1 V, der mit der „QuasiEinheit“ dB (1 V) = dBV bezeichnet wird. Für den Bezugswiderstand R0 = (U0 ) 2/P0 = 1 kΩ gilt dann LP /dBm = LU /dBV. Die Signaldynamik Ds = smax /smin als Verhältnis von Größt- zu Kleinstwert eines Signals kann damit auch als Pegeldifferenz ds = Ls,max − Ls,min = 20 lg Ds dB ausgedrückt werden. 20.1.2 Lineare und nichtlineare Verzerrungen
Nachrichtensignale werden zur Trennung von Kanälen und zur Ausblendung von Störungen häufig einer frequenzabhängigen Aufbereitung oder Verarbeitung durch Filter unterzogen. Diese bewirken eine frequenzabhängige Veränderung der Amplituden- und Phasenwerte des Signalspektrums, erzeugen jedoch keine zusätzlichen Spektralanteile. Voraussetzung dafür ist ein linearer Zusammenhang zwischen Ausgangssignal sa und Eingangssignal se , sodass das Verhältnis sa /se keine Abhängigkeit von den Signalen selbst aufweisen darf. Im Gegensatz dazu werden beim Übergang auf diskrete Signale und zur frequenzmäßigen Umsetzung von Signalen in andere Bänder Einrichtungen verwendet, die nichtlineare Zusammenhänge aufweisen. Eine Abhängigkeit dieser Art ist die Multiplikation zweier Signale. Dabei können jedoch auch verarbeitungsseitig nicht ausgleichbare Überlagerungen linearer und nichtlinearer Verzerrungen entstehen.
20.2 Auflösung, Störungen, Störabstand 20.2.1 Empfindlichkeit und Aussteuerung
Die Grenze der Auswertbarkeit von Signalen wird durch den kleinstzulässigen Signalpegel bestimmt,
der Grenzempfindlichkeit genannt wird. Zusammen mit dem aus der Signaldynamik bestimmten höchsten Signalpegel ergibt sich der Aussteuerbereich, der für einen wirtschaftlichen und verzerrungsarmen Betrieb vorzusehen ist. Hier liegen die Vorteile der digitalen Nachrichtentechnik, bei der nur zwischen zwei Signalwerten zu unterscheiden ist. 20.2.2 Störungsarten und Auswirkungen
Die Sicherheit einer Nachrichtenübertragung wird durch die Auswirkungen von Störungen bestimmt, gleichgültig ob diese aus systeminternen Kanälen oder von systemfremden Einflüssen herrühren. Es ist zwischen kurzzeitigen und kontinuierlichen Störungen zu unterscheiden, wobei Erstere meist durch betriebsbedingte Zustandswechsel, Letztere vorwiegend durch physikalische Unvollkommenheiten hervorgerufen werden. Störungen können gleichermaßen aus deterministischen wie stochastischen Signalen bestehen. Ihre Auswirkungen in analogen wie digitalen Systemen liegen in einer Unschärfe der Signalauswertung. Die Störanteile werden durch das Leistungsverhältnis ∧
S /N = 10 lg (PNutzsignal /PStörsignal ) dB
(20-3)
beschrieben, das Störabstand (signal to noise ratio) heißt. 20.2.3 Maßnahmen zur Störverminderung
Bessere Eigenschaften lassen sich mit einer störungsbezogenen Signalbewertung erzielen, weil damit alle Nutzsignalanteile gleichen Störabstand besitzen können. Verfahren dieser Art filtern die spektrale Verteilung der Signale entsprechend den Störspektren. Durch eine Preemphasis genannte lineare Verzerrung wird in der Aufbereitung ein frequenzunabhängiger Störabstand hergestellt. Der verarbeitungsseitige, Deemphasis genannte Ausgleich bezüglich des Nutzsignales liefert danneine Verbesserung, die in Bild 20-1 als Fläche mit Schraffur gekennzeichnet ist. Einrichtungen dieser Art heißen Optimalfilter [3]. Digitale Codierungsverfahren erlauben eine frequenzmäßige Umsetzung von Signalen mit den darin enthaltenen Informationen auf einzelne, voneinander getrennte Frequenzbänder. Damit kann eine wirksame-
20 Signaleigenschaften
Bild 20-2. Nachrichtenquader und Kanalkapazität
Bild 20-1. Störverminderung durch lineare Filterung
re Verbesserung des Störabstandes als mit Analogverfahren erreicht werden, indem mithilfe von Filtern, die kammartige Frequenzgänge besitzen, ineinander verschachtelte Signal- und Störfrequenzbänder getrennt werden können.
20.3 Informationsfluss, Nachrichtengehalt 20.3.1 Herleitung des Entscheidungsbaumes
Nachrichtensignales zugleich wiedergeben zu können, benötigt man eine dreidimensionale Darstellung, da diese Größen voneinander unabhängig sind. Der Inhalt des umfassten Volumens ist ein Maß für die Nachrichtenmenge des betreffenden Signales. Bezieht man sich auf stationäre Grenzwerte, so ergibt sich ein prismatischer Körper, der Nachrichtenquader genannt wird. Die Codierungsverfahren der Nachrichtentechnik ermöglichen Veränderungen sowohl seiner Lage als auch seiner Form, wie Bild 20-2 zeigt, wobei inhaltliche Verluste durch gleichbleibendes Volumen vermieden werden können.
Die Auswertung nachrichtenbeinhaltender Signale bezieht sich auf Symbole, die sich in ihren Signalwerten oder deren zeitlicher Folge unterscheiden können. Die Zuordnung der Symbole erfordert den Vergleich von Unterscheidungsmerkmalen und lässt sich im einfachsten Fall auf die zweiwertige Entscheidung „zutreffend“ oder „nicht zutreffend“ zurückführen. Mit n Entscheidungen können m = 2n verschiedene Symbole voneinander getrennt werden. Dies erfordert bei einem Vorrat von m Symbolen im Mittel einen Durchlauf durch einen Entscheidungsbaum mit n = ld m Verzweigungen. Werden statt dessen p-wertige Entscheidungen verwendet, so gilt n = log p m = ln m/lnp. Für das Alphabet mit m = 27 Buchstaben und Leerzeichen sind dann n = ln 27/ ln 3 = 3 dreiwertige Entscheidungen für eine Zuordnung zu treffen.
der Störabstand S /N und die Frequenzbandbreite Bs des Signales eine entscheidende Rolle, damit keine Überdeckungseffekte durch Störungen auftreten oder informationstragende Signalanteile durch Filterung abgetrennt werden. Die zeitliche Zuordnung kann bei der Auswertung von Signalen auch durch Laufzeiteffekte gestört werden, wenn die Information im zeitlichen Bezug von Signalwerten zueinander steckt.
20.3.2 Darstellung mit Nachrichtenquader
20.3.4 Kanalkapazität und Informationsverlust
Um den Vorrat an Symbolen, deren Änderungsgeschwindigkeit und die zeitliche Dauer eines
Die Gesamtzahl Ns der Entscheidungen, die zur vollständigen Auswertung eines die Zeitdauer T s währen-
20.3.3 Grenzwerte und Mittelungszeitraum
Die Grenzen jeder Nachrichtenaufbereitung und -übertragung werden durch die Sicherung der Auswertbarkeit auf der Verarbeitungsseite bestimmt. Hier spielen die Dynamik ds = 20 lg Ds dB = 20 lg (smax /smin ) dB ,
(20-4)
G87
G88
G Elektrotechnik / Nachrichtentechnik
den Nachrichtensignales zu treffen sind, kann über den Zusammenhang Ns = (T s /Δt) n bit = 2BsT s ld m bit
(20-5)
aus der Anzahl n = ld m zweiwertiger Entscheidungen für jeden Auswertungszeitpunkt bestimmt werden. Der Zeitabstand Δt der einzelnen Auswertungen erfordert wegen des Einschwingverhaltens eine Systembandbreite von mindestens Bs = 1/2Δt. Wird die Anzahl m der Signalwertstufen durch das Verhältnis m = smax /smin = (Pmax /Pmin ) = (1 + S /N) (20-6) bei Bezug auf die Leistungen Pmax = Ps + PN und Pmin = PN des Störabstandes S /N gebildet, so entspricht dies einer linearen Unterteilung der Signalwerte. Aus den Beziehungen (20-5) und (20-6) kann dann die Rate der Entscheidungen H = Ns /T s = Bs ld (1 + S /N) bit
(20-7)
bestimmt werden. Diese Größe H wird Informationsfluss und bei Übertragungswegen Kanalkapazität genannt. Zur Unterscheidung von der Bandbreite Bs benutzt man wegen der zweiwertigen Entscheidungen für die Größe H die unechte Sondereinheit bit/s (Bit je Sekunde). Die Übertragungsfähigkeit eines Kanals kann in dieser Darstellung als Öffnung in einer aus Signalwert und Frequenz aufgespannten Ebene beschrieben werden. Um Informationsverluste zu vermeiden, muss der Kanal in seiner Dynamik Dk und Bandbreite Bk so ausgelegt sein, dass er das zu Signal verlustfrei zu übertragen vermag oder es muss eine Umcodierung des Signales zur Anpassung an die Kanaleigenschaften vorgenommen werden, siehe Bild 20-2.
20.4 Relevanz, Redundanz, Fehlerkorrektur 20.4.1 Erkennungssicherheit bei Mustern
Die Signalauswertung mithilfe eines Entscheidungsbaumes erlaubt nur dann eine sichere Zuordnung von Symbolen, wenn die Unterscheidungsmerkmale eindeutig erkannt werden können. Dazu ist ein Vergleich der auszuwertenden Signale untereinander oder mit gespeicherten Werten erforderlich. Derartige
Verfahren bezeichnet man als Mustererkennung. Die als Erkennungssicherheit bezeichnete Wahrscheinlichkeit der richtigen Symbolzuordnung wird durch das Verhältnis aus richtigen Entscheidungen zur Gesamtzahl aller Entscheidungen bestimmt. Zuverlässige Nachrichtenübertragung erfordert Werte für die dazu komplementäre, Fehlerwahrscheinlichkeit genannte Größe zwischen 10−8 und 10−10 . 20.4.2 Störeinflüsse und Redundanz
Die für richtige Entscheidungen erforderlichen Informationen heißen relevant. Ihre Mindestzahl ist aus (20-5) zu bestimmen. Die Erkennungssicherheit kann durch Hinzunahme weiterer, bei störfreier Übertragung der Signale für die Zuordnung nicht unbedingt erforderlicher Merkmale und damit zusätzlicher Entscheidungen gesteigert werden. Diese Vergrößerung des Informationsflusses wird als Redundanz bezeichnet und durch das Verhältnis Hmin H − Hmin 3 =1− ≈ 1− R= dB (20-8) H H S /N beschrieben, wobei H der Informationsfluss des redundanzbehafteten Signales und Hmin der des entsprechenden, völlig redundanzfreien Signales ist. Kanalstörungen führen bei redundanzfreien Signalen zu nicht erkennbaren Übertragungsfehlern. Der angegebene Näherungswert gilt für rauschartige Störeinflüsse, wenn der Störabstand S /N mindestens den Wert 20 dB aufweist. 20.4.3 Fehlererkennung und Fehlerkorrektur
Die Fortschritte auf dem Gebiet der digitalen Signalverarbeitung erlauben durch Speicherung immer größerer Informationsmengen und immer raschere vergleichende Auswertung bei Anwendung geeigneter Codierungsarten sowohl die Verminderung der redundanten Signalanteile als auch die Erkennung und Korrektur von Fehlern, die bei der Übertragung durch Störeinflüsse aufgetreten sind. Dazu wird die Redundanz R genutzt, die dafür in ihrer Verteilung dem Verarbeitungsprozess und auch den fehlerverursachenden Störungen angepasst werden kann.
21 Beschreibungsweisen
21 Beschreibungsweisen 21.1 Signalfilterung, Korrelation 21.1.1 Reichweite des Filterungsbegriffes
Alle Arten der Signalverarbeitung, die auf eine frequenz- oder amplitudenabhängige Signalbewertung h( f ) bzw. h(s) führen, werden mit dem Oberbegriff der Filterung erfasst. Jeder Bearbeitungsschritt, der die Verzerrung des Zeitverlaufes s(t) eines Signales oder dessen Amplituden- und/oder Phasenspektrums S ( f ) bzw. ϕ( f ) bewirkt, ist eine solche Filterung, gleichgültig, ob diese beabsichtigt oder eine unerwünschte Nebenwirkung ist. Bedingt durch den Einsatz digitaler Rechner, kommen in zunehmendem Maße rekursive und adaptive Verfahren zum Einsatz, die eine signalwertabhängige Steuerung der Filter ermöglichen. Gestützt auf die zeitlichen Veränderungen wert- und zeitdiskreter Signalwerte s(t) erfolgt deren Betrachtung meist im Zeitbereich. Das Frequenzverhalten S ( f ) lässt sich daraus mithilfe der Fouriertransformation bestimmen "∞ s(t) e−j·2π f t dt . (21-1) S(f) = 0
21.1.2 Lineare und nichtlineare Verzerrungen
Jede Art der Verzerrung erfordert eine Unterscheidung zwischen linearem und nichtlinearem Betrieb. Die mathematisch einfacher beschreibbaren linearen Verzerrungen führen auf lineare Gleichungssysteme für die Signalspektren, wobei der Überlagerungssatz (21-2) S a ( f ) = S e ( f )h( f ) gilt und dies bevorzugt zur Begrenzung von Frequenzbändern eingesetzt wird. Dabei ist die Stationarität aller Parameter h( f ) und die Beschränkung der Eingangssignalamplituden S e auf die verarbeitbare Dynamik vorausgesetzt. Alternativ kann das Eingangs-/Ausgangsverhalten eines linearen zeitinvarianten Systems auch im Zeitbereich mit dem Faltungsintegral "t se (τ)h(τ − t) dτ (21-3) sa (t) = (se ∗ h)(t) = 0
betrachtet werden.
Nachführbare adaptive Prozesse und Signalwertbegrenzungen führen auf nichtlineare Verzerrungen, das Systemverhalten wird dadurch signalabhängig und eine Betrachtung im Frequenzbereich ist dann nicht mehr ohne weiteres möglich. Unerwünschte Spektralanteile können entweder durch Kompensation oder durch frequenzabhängige Filterung gedämpft werden. Sind die zeitlichen Veränderungen der Systemeigenschaften hinreichend klein, Δh(t) s(t), kann die Betrachtung durch intervallweise Linearisierung vereinfacht werden. 21.1.3 Redundanzverteilung in Mustern
Die senkenseitige Verarbeitung von Nachrichtensignalen zur Wiedergewinnung darin enthaltener Informationen erfordert im Falle der codierten Übertragung den Vergleich von Unterschieden, um die erforderliche Zuordnung vornehmen zu können. In störbehafteter Umgebung muss jedes Symbol mit einer gewissen Redundanz behaftet sein, um seine Erkennungssicherheit zu gewährleisten. Die Redundanz kann dabei jedem einzelnen Signalwert aber auch Signalwertfolgen, die Muster genannt werden, zugeordnet sein. Kurzzeitstörungen, deren Häufigkeit reziprok zu ihrer Dauer ist, wirken sich deshalb in länger währenden Mustern zunehmend weniger aus. Dies ist bei der Auswertung von störbehafteten Signalen durch Mustererkennung von großer Bedeutung, da damit Verdeckungseffekte beherrscht werden können. 21.1.4 Kreuz- und Autokorrelation
Der Gehalt eines bestimmten Musters in einem Signal s(t) lässt sich durch Vergleich mit dem dieses Muster beschreibenden Bezugssignal sb (t) ermitteln. Die zeitvariable Produktbildung liefert bei anschließender Integration nur für phasenrichtige Spektralanteile von Null verschiedene Werte. Diese Vorgehensweise wird im Zeitbereich durchgeführt und als Korrelation 1 B(t) = lim T −>∞ 2T
"T s(t)sb (t + τ) dt
(21-4)
0
bezeichnet. Die Korrelation stellt eine spezielle Art adaptiver Filterung dar. Die Korrelation eines Signa-
G89
G90
G Elektrotechnik / Nachrichtentechnik
les mit sich selbst heißt Autokorrelation, wobei der Zusammenhang "T 1 A(t) = lim s(t)s(t + τ) dt T −>∞ 2T "8 = 2π
0
P( f ) cos(2π f t) d f
(21-5)
0
über die Fourier-Transformation eine frequenzunabhängige Leistungsverteilung P( f ) = const bei Redundanzfreiheit erfordert und deshalb zur Prüfung auf Redundanzgehalt verwendet werden kann. 21.1.5 Änderung der Redundanzverteilung
Die Veränderung des Redundanzgehaltes von Nachrichtensignalen zur Verbesserung des Störabstandes kann durch gezielten Zusatz von signalbezogenen Informationen erreicht werden. Dazu gibt es sowohl festeingestellte als auch von den Signalverläufen abhängige lineare und nichtlineare Verfahren. Eine Steigerung des Störabstandes unter Verwendung korrelativer Verfahren erhöht jedoch wegen der zeitlichen Integration nach (21-4) stets die Auswertzeit.
21.2 Analoge und digitale Signalbeschreibung 21.2.1 Lineare Beschreibungsweise, Überlagerung
Aus Aufwandsgründen muss die Dynamik nachrichtentechnischer Systeme beschränkt werden. Ihr Verhalten lässt sich bei vernachlässigbaren nichtlinearen Verzerrungen mit proportionalen Zusammenhängen n
S a( f ) = S e( f )
h i( f )
(21-6)
0
beschreiben. Dieser Betrachtungsweise liegt die lineare Filterung und Analyse im Spektralbereich zugrunde. Bei Entkopplung der Parameter h i ( f ) kann der Prozess umgekehrt und der Überlagerungssatz zur Bemessung genutzt werden [4]. 21.2.2 Beschreibung nichtlinearer Zusammenhänge
Nichtlineare Signalzusammenhänge erfordern eine funktionale Darstellungsweise der Art sa = f (se ), die
bei Frequenzabhängigkeit S ( f ) stets auf nichtlineare Differenzial- oder Integralgleichungen führt. Eine geschlossene Lösung und Umkehrung ist nur in sehr einfachen Fällen möglich. Zur Betrachtung haben sich deshalb zwei Näherungsverfahren herausgen fi (se (t)) bildet: Funktionalreihenansätzen sa (t) = 0
und die intervallweise Linearisierung unter Berücksichtigung der Übergangsbedingungen von energiespeichernden Elementen an den Intervallgrenzen. Bei der zuerst genannten Vorgehensweise werden u. a. sogenannte Volterrareihen verwendet, bei denen es sich bei zeitinvarianten Systemen um eine Verallgemeinerung der FaltungsintegralDarstellung des Eingangs-/Ausgangsverhaltens handelt. Die Impulsantwortfunktion, die als Volterrakern 1. Ordnung gedeutet werden kann, treten auch Volterrakerne höherer Ordnung auf. Weitere Einzelheiten findet man u. a. bei Schetzen [15]. 21.2.3 Parallele und serielle Bearbeitung
Im Gegensatz zu analogen nachrichtentechnischen Einrichtungen, bei denen die zu verknüpfenden Signale in kontinuierlicher Form gleichzeitig und damit parallel verfügbar sind, verwenden digitale Aufbereitungs- und Verarbeitungsverfahren in Anlehnung an den Rechnerbetrieb meist eine serielle Signalbehandlung. Dies ist darin begründet, dass digitale Einrichtungen Zwischenwerte speichern und deshalb im Multiplexbetrieb umschaltbare Verknüpfungseinrichtungen verwenden können. Bei hohem Informationsfluss kann die zeitliche Folge der Bearbeitungsschritte zu Durchsatzschwierigkeiten führen, wenn Echtzeitbetrieb gefordert wird. Besondere auf die nachrichtentechnischen Anforderungen der Codierung und Filterung zugeschnittene Signalprozessoren erlauben durch eine raschere, zum Teil auch parallel ablaufende Signalbearbeitung die erforderliche Erhöhung des Informationsflusses.
Verfahren der Nachrichtentechnik Die in der Nachrichtentechnik verwendeten Verfahren der Signalbehandlung zur Übermittlung und Verarbeitung von Informationen unterliegen stets störenden
22 Aufbereitungsverfahren
Beeinflussungen aufgrund nichtidealer Eigenschaften der verwendeten Einrichtungen. Im Gegensatz zu den physikalisch bedingten absoluten Grenzwerten müssen auch verfahrensbedingte Einflüsse berücksichtigt und in ihren Auswirkungen auf ein vorherbestimmtes Mindestmaß reduziert werden. Die dafür zutreffenden Abhängigkeiten werden mit Blick auf die verwendeten technischen Einrichtungen in den Kapiteln 22 bis 24 erörtert.
22 Aufbereitungsverfahren 22.1 Basisbandsignale, Signalwandler
Zuordnungen haben sich, da verarbeitungsseitig mit festen Takten korrelierbar, für die Übertragung in stark gestörter Umgebung besonders bewährt. 22.1.2 Direktwandler, Steuerungswandler
Die Signalwandlung bei der Aufbereitung und Verarbeitung nichtelektrischer Quellen- bzw. Senkensignale kann durch die physikalischen Effekte des betreffenden Energieumsatzes erfolgen. Wegen unvermeidlicher Verluste wird stets ein gewisser Energieanteil in Verlustwärme umgewandelt und geht der Signalübertragung verloren. Diese Verluste bewirken eine Dämpfung dv = 10 lg(Pa /Pe ) = 10 lg η
22.1.1 Dynamik der Signalquellen
Der Begriff des Basisbandsignales umfasst Signale mit der von den Quellen zur Verfügung gestellten Dynamik und Frequenzbandbreite. Dabei ist die Energieform unerheblich, da der Einsatz von Signalwandlern keine Einschränkung darstellt, wenn sie keine Veränderung relevanter Signalanteile bewirken. Bandbreite, Dynamik und Störabstand von Basisbandsignalen für Systeme zur Nachrichtenübertragung sind in Tabelle 22-1 zusammengestellt. Diese Angaben gründen sich auf Untersuchungen, die zu Normwerten geführt haben. Die Anpassung der Signale an die Eigenschaften zugeordneter Übertragungswege kann bei Verminderung der Dynamik und/oder Bandbreite ohne Verlust an Informationsgehalt durch eine Umcodierung vorgenommen werden. Dazu können informationsverarbeitende Signalwandler mit kontinuierlicher oder diskreter Wertzuordnung verwendet werden. Besondere Vorteile ergeben sich damit durch Anpassung an das Kanalverhalten unter Verminderung des Einflusses kanaltypischer Störungen. Zeitbezogene
(22-1)
und damit eine Verschlechterung des Störabstandes (S /N)Ausgang = (S /N)Eingang − dv .
(22-2)
Anforderungen an die Bandbreite von Signalwandlern können oft nur durch Bedämpfung frequenzabhängiger Einflüsse erfüllt werden, was die niedrigen Wirkungsgrade η einiger Wandlerarten in der Tabelle 22-2 erklärt. Außer den Direktwandler genannten Einrichtungen mit Energiekonversion gibt es noch eine weitere Wandlergruppe, bei der eine informationsfreie Hilfsenergie zugeführt wird und der Wandlungseffekt in einer signalabhängigen Steuerung der Hilfsquelle besteht. Der Wirkungsgrad η für das Signal kann dadurch >1 werden, da ein Verstärkungseffekt vorliegt. Bei Berücksichtigung der Hilfsquellenleistung muss jedoch der Gesamtwirkungsgrad stets 2 fg
(22-6)
gewählt werden, da für f0 = 2 fg die beiden Spektralanteile zusammenfallen. Gleichung (22-6) wird als Abtasttheorem bezeichnet. 22.2.2 Amplitudenquantisierung
Bild 22-1. Abtastung von Nachrichtensignalen
Zur wertdiskreten Darstellung von Signalen ist eine schwellenbehaftete Amplitudenbewertung erforderlich, die sich bei konstanter Auflösung als Treppenkurve einheitlicher Stufenhöhe nach Bild 22-3
G93
G94
G Elektrotechnik / Nachrichtentechnik
22.2.3 Differenz- und Blockcodierung
Bild 22-3. Codierte Amplitudenbewertung
darstellt. Zweiwertigen Entscheidungen entsprechen der digitalen Codierung, z. B. den im Bild 22-3 angegebenen Dualzahlen. Zuordnungsunterschiede ergeben sich zwischen fortlaufenden Zahlenfolgen und vorzeichenbehafteter Betragsdarstellung sowie in der Beschreibung des Nullwertes. Akustische Signalpegel werden vom menschlichen Ohr logarithmisch bewertet, sodass die expontielle Stufung bei Schallsignalen stets eine Reduktion des Informationsflusses ohne Verlust relevanter Anteile bewirkt. Die nichtlinearen Wertzuordnungen werden allgemein unter dem Begriff der Pulscodemodulation (PCM) zusammengefasst. Bild 22-4 zeigt den Störabstand S /N eines Telefonkanales in Abhängigkeit vom Signalpegel Ls bei logarithmischer Signalquantisierung.
Bild 22-4. Störabstand von PCM-Telefonsignalen
Schöpft ein wertquantisiertes Nachrichtensignal den Dynamikbereich der Codierung im zeitlichen Mittel nicht voll aus, kann die zur Übertragung erforderliche Kanalkapazität durch Differenzbildung mit zeitlich vorangegangenen Signalwerten vermindert werden. Verfahren der Differenzcodierung erfordern deshalb zur Verminderung des Informationsflusses zumindest zeitweise redundante Signalanteile. Die Wiedergewinnung der Signalwerte erfolgt im einfachsten Fall durch Summenbildung aus der übertragenen Differenz und dem zuletzt bestimmten Signalwert, wie dies Bild 22-5 zeigt. Daraus folgt bis zum Verfügbarkeitszeitpunkt eines Signalwertes sa (t) am Ausgang des Systems ein Zeitverzug von zwei Abtastperioden Δt. Die Differenzbildung kann auch aus mehreren zeitlich vorhergehenden Signalwerten nach feststehenden oder auch signalwertabhängigen Regeln vorgenommen werden. Bei der Fernsehbildübertragung ist so mit Bildpunkten von Nachbarzeilen (Interframe-Codierung) und Nachbarbildern (Intraframe-Codierung) ohne merklichen Qualitätsverlust etwa eine Halbierung des Informationsflusses erreicht worden. Kann dagegen ein Signalverlauf durch eine feste Anzahl von Mustern beschrieben werden, deren codierte Übertragung eine geringere Kanalkapazität als die des ursprünglichen Signales erfordert, so bringt dies übertragungstechnische Vorteile. Diese Blockquantisierung genannte Codierungsart benötigt zur Auswertung Referenzmuster, die durch Korrelation von Signalausschnitten zu gewinnen sind und für die bestmögliche Redundanzreduktion eine adaptive Anpassung an den augenblicklichen Signalverlauf erfordern.
Bild 22-5. Prinzip der Differenzcodierung
22 Aufbereitungsverfahren
Bild 22-7. Prinzip der Modulationsübertragung Bild 22-6. Blockorientierte Kanalcodierung
22.2.4 Quellen- und Kanalcodierung
Bei redundanzverändernden Codierungsarten ist zwischen der Berücksichtigung quellenspezifischer Merkmale und kanalspezifischer Störungseinflüsse zu unterscheiden. Bei Kenntnis des Mustervorrates einer Signalquelle und der Häufigkeit des Auftretens einzelner Muster kann der Informationsfluss auch durch eine verteilungsabhängige Codierung vermindert werden. Codierungen, die solche quellenbezogenen Merkmale berücksichtigen, werden als Quellencodierung bezeichnet. Durch Umcodierung von Nachrichtensignalen ohne Berücksichtigung quellenbezogener Merkmale kann eine Veränderung der Redundanzverteilung und damit meist eine Verbesserung des Störabstandes erreicht werden. Da Umcodierungen in einer Veränderung der Zuordnung zwischen Signalwerten und Codes bestehen, kann damit vor allem musterabhängigen Störeinflüssen entgegengewirkt werden. Bild 22-6 zeigt dazu ein blockorientiertes Kanalcodierverfahren, bei dem durch partielle Summation aus einer Folge von Signalwerten eine Umordnung und Zusammenfassung erfolgt.
22.3 Sinusträger- und Pulsmodulation 22.3.1 Modulationsprinzip und Darstellungsarten
Wird einem zu übertragenden Nachrichtensignal s(t) ein deterministisches und damit informationsfreies Hilfssignal durch eine nichtlineare Operation hinzugefügt, so bezeichnet man diese Art der Signalaufbereitung als Modulation. Sie dient vor allem zur Veränderung von Kanalfrequenzlagen für die
Nutzung in Frequenzmultiplexsystemen. Bei einigen Modulationsarten können durch die Verarbeitungsverfahren Störeinflüsse des Übertragungsweges vermindert werden. Voraussetzung jeder Modulation ist die Kenntnis des zeitlichen Verlaufes des als Träger bezeichneten Hilfssignales sT (t), dem das zu übertragende Nachrichtensignal s(t) aufgeprägt wird. Aus dem entstehenden Signal S (t) kann mit einer als Demodulator bezeichneten Einrichtung das Modulationssignal s(t) wiedergewonnen werden. Das Schema von Modulationsübertragungen zeigt Bild 22-7, wobei für bestimmte Demodulationsverfahren ein Hilfsträger erforderlich ist, dessen Signal phasenstarr mit dem Trägersignal sT (t) verkoppelt sein muss. Die Modulationsarten stützen sich zum überwiegenden Teil auf sinus- oder pulsförmige Trägersignale sT (t), da die harmonische oder binäre Darstellungsweise den analogen bzw. digitalen Verfahren zur Signalaufbereitung und Signalverarbeitung besonders entspricht. Für wertkontinuierlich und für wertdiskret quantisierte Nachrichtensignale sind die Bezeichnungen der üblichen Modulationsarten in Tabelle 22-3 zusammengestellt. Nach der Aufprägung des Nachrichtensignales s(t) ist unabhängig von der Modulationsart stets ein Frequenzband zur Übertragung der signalabhängigen Veränderungen erforderlich. Die Anforderungen an die Bandbreite B des Übertragungskanales lassen sich aus der spektralen Amplitudenverteilung S ( f ) des modulierten Signales, die Dynamikverhältnisse aus seinem Zeitverlauf S (t) erkennen. 22.3.2 Zwei-, Ein- und Restseitenbandmodulation
Wird eine harmonische Schwingung S (t) der Frequenz F als Trägersignal verwendet, so lässt sich ein
G95
G96
G Elektrotechnik / Nachrichtentechnik
Tabelle 22-3. Übersicht über gebräuchliche Modulationsarten
Modulationssignal Amplitudenverlauf Wertkontinuierlich
Trägersignal Verlauf sinusförmig
pulsförmig
Wertdiskret
sinusförmig
pulsförmig
Modulationsart (Kurzzeichen) Amplitudenmodulation – Restseitenbandmodulation – Einseitenbandmodulation Frequenzmodulation Phasenmodulation Amplitudenumtastung – Trägertastung Frequenzumtastung Phasenumtastung Pulsamplitudenmodulation – je 2n Signalwerte auf 2 orthogonalen Trägern Pulsfrequenzmodulation Pulsphasenmodulation verschiedene Arten von PCM, wegen Störspektren bandbegrenzt, gibt quantisierte PAM-, PFM- oder PPM-Modulation
Nachrichtensignal s(t) im einfachsten Falle auf deren Amplitude A aufprägen. S (t) = A(s) cos (2πFt) = A0 (1 + ms(t)/smax ) cos (2πFt)
(22-7)
(AM) (RM) (ESB) (FM) (PM) (ASK) (A1) (FSK) (PSK) (PAM) (QAM) (PFM) (PPM)
des modulierten Signales s(t) weist als Produkt aus modulationssignalabhängiger Amplitude und Trägeramplitude nach (22-7) und Bild 22-8b als Einhüllende das Modulationssignal s(t) auf. Diesen
Dabei wird der Faktor m Modulationsgrad genannt und darf für verzerrungsarme Modulation nur Werte m < 1 annehmen. Füllt das Spektrum s( f ) des Nachrichtensignales s(t) ein Frequenzband mit der Amplitude smax aus, so lässt sich das modulierende Signal durch die Beziehung s(t) = smax cos(2π f t) beschreiben und das Produkt der trigonometrischen Funktionen in Summen und Differenzen angeben. Damit gilt für die Zeitabhängigkeit S (t) = A0 cos 2πFt + m(A0 /2)(cos 2π(F − f )t) + cos (2π(F + f ) t)) .
(22-8)
Wird der Zusammenhang (22-8) im Spektralbereich S ( f ) dargestellt, so ergeben sich neben dem Träger mit der Amplitude A0 zwei Seitenbänder mit Amplitude mA0 /2 symmetrisch auf beiden Seiten der Trägerfrequenz F0 . Die Richtung steigender Modulationsfrequenz f ist in den Seitenbändern entgegengesetzt, wie dies die Pfeile in Bild 22-8a andeuten. Die unverzerrte Übertragung eines zweiseitenband-amplitudenmodulierten Signales erfordert deshalb die doppelte Kanalbandbreite B des modulierenden Signales s(t). Der zeitliche Verlauf
Bild 22-8. Zweiseitenband-Amplitudenmodulation. a Fre-
quenzbänder, b Modulationssignal s(t) und moduliertes Signal S (t), c Modulationstrapez
22 Aufbereitungsverfahren
Zusammenhang lässt auch die Modulationstrapez genannte Abhängigkeit s(s), Bild 22-8c, erkennen, mit der der Modulationsgrad m und nichtlineare Verzerrungen bei dieser Modulationsart auf einfache Weise darstellbar sind. Da die Information des aufmodulierten Signales s(t) in jedem der beiden Seitenbänder vollständig enthalten ist, muss die Übertragung eines einzigen Seitenbandes zur Wiedergewinnung des Signales s(t) auf der Empfangsseite und damit auch dessen Bandbreite B für den Übertragungskanal genügen. Frequenzbandsparende Nachrichtensysteme benutzen deshalb das Einseitenbandmodulation (ESB) genannte Übertragungsverfahren, das nur ein einziges Seitenband nutzt. Dazu wird sendeseitig ein Filter mit steilen Dämpfungsanstieg zur Trennung der Seitenbänder eingesetzt und empfangsseitig durch Zusatz eines Hilfsträgersignales der Frequenz F im Demodulator entsprechend Bild 22-7 durch Synchrondemodulation eine verzerrungsarme Wiedergewinnung des Nutzsignales erreicht. Die Bewegtbildübertragung des Fernsehens erfordert wegen des großen Informationsflusses eine Verminderung der Kanalbandbreite. Helligkeitsschwankungen verbieten jedoch als sehr niederfrequente Signalanteile aufgrund unzureichender Filtereigenschaften die Einseitenbandmodulation als Übertragungsverfahren. Durch eine teilweise Übertragung des anderen Seitenbandes kann jedoch die Flankensteilheit der Filter auf einen technisch beherrschbaren Wert vermindert werden, siehe Bild 22-9. Der zum halben Trägerwert A/2 und zur Trägerfrequenz F0 punktsymmetrische Dämpfungsverlauf im Bereich niederer Frequenzen wird als Nyquist-Flanke bezeichnet und bestimmt die Eigenschaften dieses Restseitenbandmodulation (RM) genannten Übertragungsverfahrens.
Bild 22-9. Spektrum der Fernseh-Restseitenbandmodula-
tion
22.3.3 Frequenz- und Phasenmodulation
Wird die Phase ϕ des Übertragungssignales S (t) = A0 cos ϕ moduliert und die Amplitude A0 konstant gehalten, so bezeichnet man dies je nach der Art der Abhängigkeit als Frequenz- oder als Phasenmodulation. Über den Zusammenhang .∞ Φ = 2π F(t) dt besteht die Verbindung zwischen 0
Phase F und Frequenz F eines Signales. Für die aus Aufwandsgründen bevorzugte Frequenzmodulation ist der modulationsabhängige Verlauf der Momentanfrequenz F(t) und das zugehörige Ausgangssignal S (t) in Bild 22-10 dargestellt. Dafür gilt der Zusammenhang ⎡ ⎤⎫ ⎧ "∞ ⎪ ⎢⎢⎢ ⎥⎥⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎢⎢⎢⎢t + (ΔF/F0 ) [s(t)/smax ]dt⎥⎥⎥⎥⎥⎬ S (t) = A0 cos ⎪ 2πF , ⎪ 0 ⎪ ⎪ ⎢ ⎥ ⎪ ⎪ ⎣ ⎦ ⎩ ⎭ 0
(22-9)
dessen Zerlegung in harmonische Komponenten eine Summe von Besselfunktionen liefert. Daraus ergeben sich in Abhängigkeit von dem auf die höchste Modulationsfrequenz fmax bezogenen Frequenzhub ΔF sehr unterschiedliche Spektralverteilungen S ( f ), siehe Bild 22-11. Die Kanalbandbreite B für eine verzerrungsarme Übertragung muss in beiden Fällen mindestens B > 2(ΔF + fmax ) betragen. Phasenmodulationsverfahren erlauben zur Frequenzaufbereitung zwar eine besserer Kontrolle der Ruhefrequenzlage, haben aber wegen des höheren technischen Aufwandes weniger praktische Bedeutung erlangt. 22.3.4 Zeitkontinuierliche Umtastmodulation
Die Übertragung digitaler Modulationssignale führt bei konstanten Amplitudenwerten im einfachsten Falle auf das zeitabhängige Ein- und Ausschalten eines Hilfsträgersignales. Dieses Verfahren wird Trägertastung (A1) genannt und in der Morsefunktelegrafie noch verwendet. Da nachregelnde Empfangseinrichtungen in den signalfreien Zeitabschnitten keine Information erhalten, bevorzugt man heute Umtastmodulationsarten, die ständig ein Übertragungssignal bereitstellen. Die modulationsabhängige Umschaltung zwischen zwei Trägergeneratoren der Frequenzen F1 und F2 zeigt Bild 22-12. Sie wird als Frequenzumtastung (FSK, frequency-shift keying) bezeichnet. Das
G97
G98
G Elektrotechnik / Nachrichtentechnik
Bild 22-10. Frequenzmodulationsverfahren
(FM)
Bild 22-11. Spektrum einer Schmalband- und einer Breitband-FM
Bild 22-12. Frequenzumtastung (FSK)
zugehörige Spektrum S ( f ) des Übertragungssignales setzt sich aus den Pulsspektren beider Modulationsintervalle zusammen. Die Beschränkung der Übertragungsbandbreite auf B = 2(F2 − F1 + 3 fmax ) erfasst etwa 95% der Signalleistung, wenn die beiden Trägerfrequenzen F1 und F2 als ganzzahliges Vielfaches der modulierenden Frequenzen f gewählt werden und keine sprunghaften Übergänge im Umschaltaugenblick auftreten. Durch Signalfilterung kann eine modulationsabhängige Phasenzuordnung erreicht werden. Dieses
Bild 22-13. Zeigerdiagramm einer Vierphasenumtastung
(PSK)
Phasenumtastung (PSK, phase-shift keying) genannte Verfahren lässt sich durch ein Vektordiagramm z. B. für vier Phasenzustände entsprechend Bild 22-13 beschreiben. Bei einer Beschränkung der Phasenänderungsgeschwindigkeit dΦ/dt = 2π fmax auf die höchste Modulationsfrequenz fmax ergibt sich die geringste Bandbreiteforderung an den Übertragungskanal. 22.3.5 Kontinuierliche Pulsmodulation
Anstelle harmonischer Schwingungen kann als Trägersignal auch ein rechteckförmiges Pulssignal dienen, das weniger Aufwand bei der Signalauswertung erfordert. Zur analogen Aufprägung des Modulationssignales s(t) bieten sich die Pulsamplitude A(s) bei der Pulsamplitudenmodulation (PAM), die Pulsfrequenz F(s) bei der Pulsfrequenzmodulation (PFM), die Pulsphase Φ(s) bei der Pulsphasenmodulation (PPM) und die Pulsdauer t(s) bei der Pulsdauermodulation (PDM) oder auch Pulsweitenmodulation (PWM) an. Zur Veranschau-
22 Aufbereitungsverfahren
Bild 22-15. Muster einer 8-Bit-Pulscodemodulation (PCM)
Bild 22-14. Kontinuierliche Pulsmodulationsarten
lichung sind die Ausgangssignale S (t) bei diesen Modulationsarten in Bild 22-14 dargestellt. Die volldigitale Betriebsweise von Nachrichtenkanälen hat diese Verfahren jedoch weitgehend verdrängt, sodass sie nur noch vereinzelt zur Signalaufbereitung und Signalverarbeitung eingesetzt werden. Der Einfluss unterschiedlicher spektraler Energieverteilungen und Störabstände ist bei diesen Verfahren von Bedeutung. 22.3.6 Pulscode-, Delta- und Sigma-Delta Modulation
Im Unterschied zur PAM wird bei der Pulscodemodulation (PCM) nicht nur die Zeit diskretisiert, sondern es erfolgt auch eine Amplitudendiskretisierung, die man (Amplituden-)Quantisierung nennt. Die Quantisierung ist ein nichtlinearer Prozess. Die Signalübertragung erfolgt mit seriellen synchronen Pulsmustern, wobei bevorzugt Dualzahlen verwendet
werden. Mit dem Faktor 2 kann dabei die Dynamik auf einfache Weise exponentiell erweitert werden. Das zur Sprachübertragung in Telefonqualität bevorzugte logarithmische PCM-Codierungsschema zeigt Bild 22-15, bei dem für die Signalwerte s = (+/−)M · 2E gilt. Die Modulationseinrichtungen sind dabei Analog-Digital-Umsetzer, die diese Stufung bei serieller Ausgabe der Signalwerte aufweisen. Bei der Standard-PCM wird jeder Amplitudenwert einzeln quantisiert, was mit einem erheblichen Aufwand in Kodierer und Dekodierer verbunden ist. Vielfach sind jedoch die Amplitudenproben des PAMSignal korreliert, was bei der Standard-PCM nicht berücksichtigt wird. Bei der DPCM (Differential Pulse Code Modulation) wird daher bei solchen Signalen nur die Differenz des Signals mit einem Prädiktor kodiert, der sich aus vergangenen Amplitudenwerten berechnet und somit die Vergangenheit des Signals und damit dessen Korrelationen berücksichtigt. Ein besonders einfaches digitales Modulationsverfahren mit Prädiktion ist die Deltamodulation (DM), welche im Unterschied zu DPCM-Varianten das Ausgangssignal jeweils nur um einen Schritt verändert. Die zugehörige sehr einfache Modulationseinrichtung nach Bild 22-16 besteht aus einer schwellenbehafteten Differenzbildung (Komparator) für zweiwertige Ausgangssignale S (t) = +/−A, einem Einstufenkomparator und einem Integrierglied. Bei verschwindendem Eingangssignal s(t) liefert sie eine konstante Pulsfolge höchstmöglicher Änderungsrate (granulares Rauschen). Sie erreicht
Bild 22-16. Prinzip der Deltamodulation (DM)
G99
G100
G Elektrotechnik / Nachrichtentechnik
jedoch nur eine tiefpassbegrenzte zeitliche Anstiegsgeschwindigkeit (Steigungsüberlastung oder Slope Overload) und ist auch noch durch den Integrationsverzug mit Überschwingen behaftet. Diese Nachteile beschränken die Anwendbarkeit des Deltamodulationsverfahrens. Daher muss ein Kompromiss hinsichtlich der Schrittweite erzielt werden, damit diese Effekte minimiert werden können. Besser ist es noch, die Schrittweite an das Eingangssignal zu adaptieren, sodass man einen adaptiven Delta-Modulator (ADM) erhält. Zur der Dekodierung eines von einem DeltaModulator erzeugten Signals, das man über einen Kanal überträgt, wird zunächst ein Integrator und anschließend ein Tiefpass benötigt. Verschiebt man diesen Integrator an den Anfang der KodiererDekodierer-Kette und somit vor den Delta-Modulator und zieht diesen Integrator zusammen mit dem in der Rückkopplungsschleife befindlichen Integrator hinter die Differenzbildung, dann erhält man die Struktur eines Sigma-Delta-Modulators. Das von einem Sigma-Delta-Modulator erzeugte Signal braucht nur mit einem Tiefpass gefiltert werden, um das Eingangssignal zurück zu gewinnen. Um eine gute Signalqualität zu erhalten, muss allerdings eine hohe Überabtastung verwendet werden. Diese scheinbar unbedeutende äquivalente Umformung der Kette aus Delta-Modulator und zugehörigem Demodulator führt aber bei dem neuen System zu ganz unterschiedlichen Eigenschaften. Während beim Delta-Modulator die Übertragungsfunktionen für Eingangs- und Rauschsignal gleichartigen Charakter haben, besitzt beim Sigma-Delta-Modulator die Übertragungsfunktion für das Eingangssignal Tiefpass-Charakter, für das Rauschsignal aber Hochpass-Charakter. Damit ist sogenanntes NoiseShaping – d. h. Hochpass-mäßige Verformung des Rauschens – möglich, wodurch das Rauschspektrum zu den hohen Frequenzen verschoben wird. Weiterhin wird beim Deltamodulator die Signaldifferenz kodiert, was zu der bereits erwähnten Steigungsüberlastung (Overload) führen kann, während beim Sigma-Delta-Modulator das Signal kodiert wird, wodurch nur das Signal begrenzt wird. Weitere Einzelheiten findet man in der weiterführenden Literatur und insbesondere in der Monographie von Zölzer [17].
22.4 Raum-, Frequenz- und Zeitmultiplex 22.4.1 Baum- und Matrixstruktur
Die Nutzung verfügbarer Nachrichtenkanäle für wechselnde Quellen und Senken erfordert deren bedarfgerechte Zuordnung und damit Einrichtungen, die Umschaltungen ermöglichen. Die Struktur derartiger Anordnungen unterscheidet sich darin, ob die Kanäle in Folge oder parallel mit den Schaltpunkten verbunden sind, wie siehe Bild 22-17 erkennen lässt. Die Folgeschaltung Bild 22-17a wird auch Baumstruktur genannt und schützt durch räumliche Trennung vor Fehlschaltungen von Kanälen, hat jedoch den Nachteil, dass die als Bündel bezeichneten parallel laufenden Verbindungswege wegen der räumlichen und zeitlichen Abfragefolge nur unvollständig genutzt werden können. Abhilfe schafft hier ein Mehrfachzugriff in unterschiedlicher Reihenfolge, der als Mischung bezeichnet wird und dem Informationsfluss angepasst werden kann. Im Gegensatz dazu erfordert die kreuzschienenartige Matrixstruktur nach Bild 22-17b stets ein Steuerwerk, das ist eine Hilfseinrichtung, die für die störungsfreie Auswahl der Durchschaltepunkte sorgt. Voraussetzung ist die Kenntnis über bereits belegte Schaltpunkte, um eine innere Blockierung zu vermeiden. Aus diesem Grunde können derartige Einrichtungen sinnvoll nur mit digitaler Steuerungen betrieben werden. Sie haben wegen der besseren Ausnutzung der Bündel die Baumstruktur weitgehend verdrängt.
Bild 22-17. Raummultiplex in a Baum- und b Matrixstruk-
tur
22 Aufbereitungsverfahren
22.4.2 Durchschalt- und Speicherverfahren
Der wichtigste Unterschied beim Betrieb von Einrichtungen zur bedarfsabhängigen Kanalzuweisung besteht darin, ob die Durchschaltung entweder direkt auf Anforderung hin oder erst nach einer Überprüfung des Gesamtschaltzustandes erfolgen kann. Letzteres erfordert die zeitunabhängige Verfügbarkeit unbearbeiteter Anforderungen und wird deshalb als Speicherverfahren bezeichnet. Damit kann die Nutzung von Durchschaltmöglichkeiten in Systemen hoher Kanalzahl erheblich verbessert werden, es erfordert jedoch eine besondere Signalisierung des Schaltzustandes. Im Gegensatz dazu ist bei dem jeder Anforderung folgenden Durchschaltverfahren zu jedem Zeitpunkt der Schaltzustand systembedingt festgelegt. Der höhere Aufwand des Speicherverfahrens hat sich durch den Einsatz von Digitalrechnern zur Speicherung und Steuerung beträchtlich vermindert und den Ablauf so beschleunigt, dass verfahrensbedingte Verzögerungen kaum mehr in Erscheinung treten. In Systemen hoher Kanalzahl werden heute deshalb vorzugsweise digitale Speicherverfahren verwendet. 22.4.3 Zugänglichkeit und Blockierung
Für die Zugänglichkeit von Nachrichtenkanälen in kanalzuweisenden Systemen ist zwischen Wähl- und Suchsystemen zu unterscheiden, die von der anfor-
dernden Quelle ausgehend einen freien Kanal nach Bild 22-18a oder von einem freien Kanal aus die anfordernde Quelle nach Bild 22-18b aufsuchen. Dabei sind neben der Anzahl der abzusuchenden Verbindungsstellen auch deren zeitliche Verfügbarkeit für die Auslastung solcher Einrichtungen von Bedeutung. Entsprechend den Regeln zur Anforderungsbearbeitung besteht jedoch die Gefahr der Blockierung, sodass in bestimmten Belastungsfällen keine weitere Anforderungsbearbeitung mehr erfolgen kann. Dabei ist zwischen der inneren, durch die Systemstruktur bedingten Blockierung und der äußeren, durch das Anforderungsverhalten bedingten Blockierungen zu unterscheiden. Durch zunehmenden Einsatz von Speicherverfahren anstelle von Durchschaltverfahren hat sich das Blockierungsverhalten von äußeren auf innere Einflüsse verlagert und wird vorwiegend durch eine nicht hinreichende Berücksichtigung des Systemverhaltens in den programmierten Steuerungsabläufen bestimmt. 22.4.4 Trägerfrequenzverfahren
Der Hauptvorteil moderner Nachrichtensysteme besteht in der Mehrfachnutzung von Übertragungswegen nach dem Multiplexverfahren. Das älteste und verbreitetste Verfahren dieser Art ist das Trägerfrequenzverfahren, bei dem mithilfe von Modulation und frequenzselektiver Filterung eine Änderung der von den Nachrichtenkanälen benutzten Frequenzbänder herbeigeführt wird. Bei hinreichend linearem Übertragungsverhalten des Übertragungsweges können so eine Vielzahl von Kanälen störungsfrei zusammengeführt und wieder getrennt werden, siehe Bild 22-19. Der Vorteil des Trägerfrequenzverfahrens besteht darin, dass bei nichtkorrelierten Signalen si in den n Einzelkanälen sich deren Leistungen addieren und deshalb die Amplitude des Gesamtsignales S auf
Bild 22-18. Prinzip a des Wähl- und b des Suchsystems
22-19. Prinzip Multiplexverfahrens
Bild
des
Trägerfrequenz-
G101
G102
G Elektrotechnik / Nachrichtentechnik
Tabelle 22-4. Eigenschaften von Trägerfrequenzsystemen
Bezeichnung V 60 V 120 V 960 V 2700 V 10 800
Kanalzahl 60 120 960 2700 10 800
Frequenzband (12–252) kHz (12–552) kHz (60–4028) kHz (312–12 388) kHz (4332–61 160) kHz
dem Übertragungsweg bei gleichen Maximalwerten smax in den Einzelkanälen ; ; = n = n
√ 2 (si ) = (smax )2 = smax n S = Ps = 1
1
(22-10)
nur mit der Wurzel der Kanalzahl n ansteigt. Die Kennwerte der fünf meistverwendeten Trägerfrequenzsysteme für den Einsatz auf Telefonfernleitungen sind in Tabelle 22-4 zusammengestellt. 22.4.5 Geschlossene und offene Systeme
Trägerfrequenzsysteme erlauben nur die einmalige Verwendung eines Frequenzbandes auf einem Übertragungsweg, um Übersprechstörungen zwischen Kanälen zu vermeiden. Mehrfache Frequenzzuweisung auf unterschiedlichen Übertragungswegen erfordert einen hohen Entkopplungsgrad zwischen diesen und kann mit Koaxialleitungen (80 bis 100 dB) oder Lichtwellenleitern (∞) am besten gesichert werden. Solche leitungsgebundenen Übertragungssysteme arbeiten mit getrennten Räumen zur Ausbreitung der die Nachricht tragenden elektromagnetischen Wellen und werden als geschlossene Systeme bezeichnet. Im Gegensatz dazu werden Systeme, die sich des freien Raumes zur Wellenausbreitung bedienen, als offene Systeme bezeichnet. Hierzu rechnet der
Leitungsart
Verstärkerabstand
symmetrisch 1,3 mm ∅
18,6 km
koaxial 2,6/9,5 mm ∅
9,3 km 4,65 km 1,55 km
Rundfunk, aber auch Funkverbindungen, bei denen mit strahlbündelnden Antennen für das Aussenden und den Empfang der elektromagnetischen Wellen durch Richtfunk eine räumliche Entkopplungen gegen gleichfrequent genutzte Übertragungskanäle geschaffen wird. 22.4.6 Zeitschlitz- und Amplitudenauswertung
Durch die Verwendung zeitdiskret quantisierter Signale wird eine zeitbezogene Kanalzuordnung möglich, die als Zeitmultiplexverfahren bezeichnet wird. Das Grundprinzip der Arbeitsweise ist in Bild 22-20 dargestellt. Der typische Verlauf des Signals S (t) auf dem Übertragungsweg bei Pulsamplitudenmodulation zeigt Bild 22-21. Unter Beachtung des Abtasttheoremes (22-6) kann durch selektive Filterung die Bandbreite ohne Informationsverlust beschränkt werden. Moderne Systeme dieser Art arbeiten mit Pulscodemodulation, wobei die Information der Kanäle in binär codierter Folge in den zugeordneten Zeitschlitzen übertragen wird. Einige im Telefonweitverkehr eingesetzten Systeme dieser Art sind in Tabelle 22-5 aufgeführt. Ein vereinfachtes Zeitmultiplexverfahren ergibt sich bei unterschiedlichen Signalamplituden in den Kanälen. Die verarbeitungsseitige Kanaltrennung kann dann an einfachen Amplitudenschwellen erfolgen und erfordert keinen quellsynchronen Zeitbezug.
Bild 22-20. Prinzip des Zeitmultiplexverfahrens
23 Signalübertragung
Tabelle 22-5. Eigenschaften von PCM-Übertragungssystemen
Bezeichnung PCM 30 PCM 120 PCM 480 PCM 1920
Kanalzahl 30 120 480 1920
Bitrate 2048 kbit/s 8448 kbit/s 34 368 kbit/s 104 448 kbit/s
Dieses Verfahren wird bei der Fernsehbildübertragung eingesetzt, wo neben dem Bildinhalt stets Synchronisiersignale zu übertragen sind. Einen Signalausschnitt nach der Gerber-Norm zeigt Bild 22-22. Die Kanaltrennung erfolgt hier bei einem Amplitudenwert von 75% des Maximalwertes, sodass Synchronisierimpulse „ultraschwarz“ werden und bei der Bildwiedergabe nicht in Erscheinung treten. Die dafür erforderliche Amplitudenumkehr des Bildsignales wird Negativmodulation genannt und ist auch zur optischen Ausblendung von Störimpulsen im Bildinhalt besonders vorteilhaft.
Leitungsart symmetrisch 1,4 mm ∅ koaxial 1,2/4,4 mm ∅
Verstärkerabstand 4,8 km 4,3 km 4,1 km 2,0 km
23 Signalübertragung 23.1 Kanaleigenschaften, Übertragungsrate 23.1.1 Eigenschaften, Verzerrungen, Entzerrung
Das Übertragungsverhalten eines Nachrichtenkanals wird durch seine linearen und nichtlinearen Verzerrungen sowie durch die Einprägung von Störsignalen bestimmt. Diese Einflüsse bewirken meist eine Verschlechterung des Störabstandes und können durch verarbeitungsseitige Signalfilterung vermindert werden. Entsprechend der modellartigen Betrachtung nach Bild 23-1 lassen sich amplitudenund phasenabhängige Kanalverzerrungen über den Zusammenhang h k = (1/h f )h e
Bild 22-21. Verlauf eines Zeitmultiplexsignals
Bild 22-22. Amplitudenmultiplex beim Fernsehbildsignal
(23-1)
ausgleichen, soweit das auf den Kanaleingang bezogene Störsignal sstör sf hinreichend klein ist. Der frequenzabhängige Amplitudenverlauf kann durch die Signalfilterung hf so beeinflusst werden, dass sich für das Ausgangssignal sa der größtmögliche Störabstand ergibt. Diese Art der Entzerrung des Übertragungsverhaltens wird Optimalfilterung genannt [3], vgl. Bild 20-1. Kanalbedingte nichtlineare Verzerrungen müssen für einen störungsfreien Multiplexbetrieb zur einwandfreien Kanaltrennung mit Filtern vermindert werden. In praktischen Übertragungsmedien herrschen jedoch die linearen Verzerrungen vor, deren Ausgleich stets mit einem verarbeitungsseitigen Filter des Übertragungsverhaltens h e = 1/h k vorgenommen werden kann und als Kanalentzerrung bezeichnet wird. Ein frequenzabhängiger Störabstand im Kanal erfordert dann eine aufbereitungsseitige Vorverzerrung h f des Eingangssignals se um allen relevanten Anteilen den gleichen Störabstand zu sichern.
G103
G104
G Elektrotechnik / Nachrichtentechnik
23.1.2 Nutzungsgrad und Kompressionssysteme
Entscheidend für die optimale Nutzung eines Nachrichtenkanales ist allein die einwandfreie Wiedergewinnung übertragener Informationen. Deshalb ist nicht der Störabstand des augenblicklichen Signalverlaufes s(t) von Bedeutung sondern der Störabstand des gesamten die Nachricht tragenden Musters. Im Allgemeinen bestehen diese Muster aus der blockweisen Zusammenfassung von Einzelsignalen und besitzen den aus Dynamik und Bandbreite multiplikativ gebildeten Informationsfluss Hs . Bei endlichem Auflösungsvermögen kann der momentane Informationsfluss Hs (t) für jedes Signal bestimmt werden, wobei die Kanalkapazität des Übertragungsweges Hk ≥ Hs (t) zur verlustfreien Übertragung sein muss. Das Verhältnis dieser beiden Größen wird Kanalnutzungsgrad ηk genannt und als zeitlicher Mittelwert angegeben ηk = (1/T )
"T
Hs (t)/Hk dt .
(23-2)
0
Einsparungen an Kanalkapazität können für ηk < 1 durch eine bessere aufbereitungsseitige Anpassung des Informationsflusses Hs an die Kanalkapazität Hk erreicht werden, da sich die amplituden- und frequenzmäßige Zuordnung durch Umcodierung verändern lässt. Dazu dienen nichtlineare Signalquantisierungsarten und die spektrale Energieumverteilung durch Modulationsverfahren. Übertragungseinrichtungen dieser Art werden als Kompressionssysteme bezeichnet und in zunehmendem Maße auf stark gestörten Übertragungswegen zur Reduktion der Bandbreite oder zur Verbesserung des Störabstandes eingesetzt. Der Ausgleich momentaner Nutzungsgrad- und/oder Störabstandsschwankungen
erfolgt dabei durch zeitabhängige Musterzuweisung und verarbeitungsseitige Mittelwertbildung. Bei Quellen mit zeitvarianten Informationsfluss kann zusätzlich eine adaptive Anpassung an die Kanalkapazität vorgenommen werden.
23.2 Leitungsgebundene Übertragungswege 23.2.1 Symmetrische und unsymmetrische Leitungen
Übertragungsleitungen können Nachrichtensignale mithilfe elektromagnetischer Wellen dämpfungsarm über große Entfernungen führen. Sie werden für erdsymmetrischen Betrieb als Zweidrahtleitungen ausgeführt, die aus konstruktiven Gründen paarweise zu „Sternvierer“ genannten Bündeln in Kabeln zusammengefasst werden, Bild 23-2a. Für den erdunsymmetrischen Betrieb verwendet man Koaxialleitungen nach Bild 23-2b zum Aufbau der Kabel. Eigenschaften einiger für die Trägerfrequenzübertragung eingesetzter Ausführungsformen enthält Tabelle 23-1. Das Übersprechen in den zu Viererbündeln zusammengefassten Zweidrahtleitungen wird durch Verdrillung der Bündel mit unterschiedlicher Schlagweite, das bei Koaxialleitungen dagegen durch die Schirmwirkung des Außenleiters bestimmt.
Bild 23-2. Schnittbilder von Übertragungsleitungen Tabelle 23-1. Eigenschaften von Trägerfrequenzleitungen
Art
Bild 23-1. Ausgleich von Amplituden- und Phasenverzer-
rungen
Bezeichnung Abmessung
Sym2 × 0,6 mm ∅ metrisch 2 × 1,4 mm ∅ 1,2/4,4 mm ∅ Koaxial 2,6/9,5 mm ∅
Wellenwiderstand ZL ca. 175 Ω ca. 75 Ω
Dämpfungsmaß bei 1 MHz dB/km 2,1 0,9 5,2 2,4
23 Signalübertragung
23.2.2 Hohlleiter- und Glasfaserarten
Zur Übertragung von Signalen bei höheren Pegeln p > 40 dBm kommen im Höchstfrequenzbereich (1 GHz < f < 100 GHz) metallische Wellenleiter in Betracht. Eindeutige Schwingungsformen ergeben sich z. B. bei einem Frequenzverhältnis von fmax / fmin ≈ 2 in rechteckförmigen Hohlleitern deren Seitenverhältnis 1:2 beträgt. Die zulässigen Grenzpegel pmax und die Dämpfung d/R können dann näherungsweise aus der leitend umschlossenen materialfreien Querschnittsfläche q nach den Beziehungen pmax ≈ [60 + 10 lg (400 cm2 /q)] dBm und d/R ≈ 0,22 (q/cm2 )0,83 dB/m
(23-3)
bestimmt werden. Für die Nachrichtenübertragung wird in zunehmendem Maße der optische Wellenbereich genutzt, seit es gelingt dämpfungsarme, dielektrische Wellenleiter auf der Basis von Quarzglasfasern (SiO2 ) herzustellen. Es gibt zwei Faserarten, die sich durch ihre relativen Querschnittsabmessungen a/λ unterscheiden. Die Gradientenfaser nutzt bei einem Durchmesser a ≈ 50 λ eine radial abnehmende Brechzahl zur Reduktion der Abstrahlung aus dem Leiterinneren und damit zur Verminderung der Übertragungsdämpfung. Bild 23-3 zeigt den typischen Verlauf der längenbezogenen Dämpfung d/R einer solchen Faser. Bei den neueren Monomodeoder Stufenindexfasern werden diese Energieverluste
Bild 23-3. Dämpfungsverlauf einer Glasfaser
durch den Betrieb mit eindeutiger Schwingungsform der ausbreitungsfähigen Wellen in einem kleineren Querschnitt des Durchmessers a ≈ λ vermieden. 23.2.3 Kabelnetze
Die Bereitstellung leitungsgebundener Übertragungswege fordert einen wirtschaftlichen Ausgleich zwischen dem Herstellungsaufwand und der Auslastung der Kanalkapazität. In Kommunikationssystemen hat sich die hierarchische organisierte Informationsbündelung in fest zugeordneten oder umschaltbaren Kanälen als wirtschaftlichste und störungsärmste Art der Nachrichtenübertragung erwiesen. Entsprechend Bild 23-4 werden die Anschlussleitungen A genannten Wege zwischen den, die Signalquellen und -senken beinhaltenden Teilnehmern T und den in den Knoten Ki befindlichen Vermittlungseinrichtungen fest zugeordnet. Die Fernleitungen F genannten Verbindungen zwischen den auch Netzknoten Ki genannten Vermittlungseinrichtungen werden dagegen umschaltbar gemacht. Hohe Belegungsdichte fördert die Zusammenfassung parallelgeführter Kanäle eines Fernleitungsweges F im Multiplexbetrieb und erhöht den Nutzungsgrad des Netzes. Das Ausfallverhalten ist im Anschlussbereich teilnehmerbezogen, im Fernbereich dagegen vermittlungsbezogen und kann durch Ersatzschaltung verbessert werden. Dies bedeutet, dass ein dem Knoten K2 zugeordneter Teilnehmer in Bild 23-4 von den zum Knoten K1 gehörigen Teilnehmern über den Knoten K3 erreicht werden kann. Konstruktiv werden die Einzelleitungen zur Verminderung der Herstellungs- und Verlegekosten so weit wie möglich in Form von Bündeln in Kabeln zusammengefasst [5].
Bild 23-4. Teilnehmerzuordnung eines Nachrichtennetzes
G105
G106
G Elektrotechnik / Nachrichtentechnik
23.3 Datennetze, integrierte Dienste 23.3.1 Netzgestaltung, Vermittlungsprotokoll
Durch den Einsatz von Datenspeichern in den Endstellen T und den Vermittlungsknoten K bei der digitalen Nachrichtenübertragung kann der Informationsfluss unterschiedlichster Signale blockweise zusammengefasst und im Zeitmultiplex übertragen werden, s. Bild 23-5. Durch die sequentielle Auswertung vorangestellter Kennzeichnungssegmente, hier mit x, y und z bezeichnet, können die Datenpakete belastungsabhängig vermittelt werden. Trotz der zur Zustandskennzeichnung erforderlichen Zusatzinformation nutzt diese Art der Blockvermittlung die Kanalkapazitäten eines Netzes besser als die einfache Leitungsvermittlung aus. Alle Steuerungs-, Bearbeitungs- und Zuweisungsinformationen werden in dem Vermittlungsprotokoll genannten Kennzeichnungssegment zusammengefasst. Die folgerichtige Auswertbarkeit dieser Information erfordert eine Rangfolge in Schichten nach Tabelle 23-2, wobei den Anforderungen der Netzknoten und Endgeräte entsprechend ein stufenweiser Ausbau vorgenommen werden kann. 23.3.2 Fernschreiben, Bildfernübertragung
Aus der Telegrafie, der historisch ersten Art elektrischer Nachrichtenübertragung hat sich die
Bild 23-5. Betrieb protokollgesteuerter Nachrichtennetze Tabelle 23-2. Protokollschema zum ISDN-Netzbetrieb
Fernschreibtechnik entwickelt, die sich des international genormten Codes nach Bild 19-2 zur Übertragung alphanumerischer Zeichen bedient. Als Basisbandsignal können derartige Zeichen im Frequenzmultiplex zusammen mit Sprachsignalen über Fernsprechanschlussleitungen geführt und durch Hoch-Tiefpassfilter mit einer Grenzfrequenz von 300 Hz abgetrennt werden. Dabei ist die Übertragungsrate 50 Schritte/s = 50 Baud bei moderneren Einrichtungen auch 100 Baud. Die ungünstigen Übertragungseigenschaften längerer Leitungen für gleichstrombehaftete Signale vermeidet das WTVerfahren (WT, Wechselstromtelegrafie), bei dem das Fernschreibsignal einer Trägerfrequenz von 120 Hz als tonlose Amplitudenmodulation (Al) aufgeprägt wird. Zur Fernübertragung im Multiplexbetrieb und für Übertragungsraten bis 1,2 kBaud benutzt man Fernsprechkanäle der Frequenzbreite 300 bis 3400 Hz und setzt die Modulationsart FSK (frequency shift keying) ein. Modernere Verfahren mit QAM-Modulation (Quaternär-Amplituden-Modula tion) ermöglichen auf derartigen Kanälen Übertragungsraten bis 9,6 kBaud. Bei der Bildfernübertragung wird wegen des Endgeräteaufwandes und der erforderlichen Kanalkapazitäten die Übertragungsrate dadurch begrenzt, dass nur Verfahren für ruhende farbfreie Vorlagen hoher Gradation und Auflösung, Fernkopie oder Telefax genannt, und Verfahren für langsamveränderliche farbiger Bilder geringer Auflösung als Bildschirm- bzw. Videotext sowie die farbfreie Grauwertübertragung des Bildfernsprechens vorgesehen sind. Die Zuordnung der Bildinformation auf Quell- und Senkenseite wird in allen Fällen durch eine zeilenweise Abtastung und Synchronisation gewährleistet. Die Übertragungsverfahren orientieren sich für ruhende Bilder an der Fernschreibübertragung, für bewegte Bilder dagegen an der Fernsehübertragung. 23.3.3 Verbundnetze mit Dienstintegration
Die Zusammenschaltung von Übertragungswegen zu einem Nachrichtennetz bezog sich in der Vergangenheit immer auf die zu übertragenden Signale und führte zu Netzen, die nur bestimmte Endgeräte für Quellen und Senken zuließen. Durch die digitale signalunabhängige Auslegung dieser Einrichtungen entstanden die sogenannten offenen Netze, bei denen
23 Signalübertragung
im Rahmen der verfügbaren Kanalkapazitäten eine beliebige Quellen- und Senkenbeschaltung zugelassen ist. Dabei kann auch eine bedarfsabhängige Zusammenschaltung unterschiedlicher Übertragungswege erfolgen, was als Verbundnetz bezeichnet wird. Bezüglich der verfügbaren Signale muss zwischen netzfremden und netzinternen Quellen unterschieden werden, wobei letztere bedarfsabhängig vom Benutzer abrufbare Sonderfunktionen ermöglichen. Das ISDN-Netzkonzept (Integrated Services Digital Network) verfügt über eine Kanalkapazität von 144 kbit/s in beiden Richtungen, die in zwei Kanäle mit je 64 kbit/s Kanalkapazität und einen Signalisationskanal mit einer Kanalkapazität von 16 kbit/s aufgeteilt ist. Diese Werte beruhen zwar auf der Codierung von Fernsprechsignalen, bedeuten jedoch keine Einschränkungen bei der Zuordnung von Endgeräten entsprechend Bild 23-6. Das ISDNNetz kann durch Austausch der Vermittlungs- und Endgeräte auf den Anschluss- und Fernleitungen des analogen Fernsprechnetzes eingerichtet werden. Zur Fernsehbildübertragung in Echtzeit ist eine Kanalkapazität von 140 Mbit/s erforderlich, die breitbandigere Übertragungswege erfordert (Breitband-ISDN). Glasfasern bieten Kanalkapazitäten bis Gbit/s bei höchster elektromagnetischer Störsicherheit und werden deshalb gegenüber den vorhandenen Koaxialkabeln sowohl als Fernleitungen wie auch als Breitbandanschlussleitungen bevorzugt werden.
Bild 23-6. Endgeräte des ISDN-Nachrichtennetzes
23.4 Richtfunk, Rundfunk, Sprechfunk 23.4.1 Funkwege, Antennen, Wellenausbreitung
Bei der Verwendung elektromagnetischer Wellen im freien Raum zur Übertragung von Nachrichten sind keine Einrichtungen auf den Übertragungswegen erforderlich, da sich die Wellen im Gegensatz zur Führung in metallischen oder dielektrischen Wellenleitern auch ungeführt ausbreiten können. Dadurch kann die räumliche Lage von Empfangsund Sendestellen in weiten Grenzen frei gewählt werden. Von Hindernissen abgesehen unterliegt die Wellenausbreitung einer rückwirkungsfreien Zerstreuung der Energie längs der Wegstrecke R und ergibt eine von der Betriebsfrequenz f abhängige Grundübertragungsdämpfung d = 20 lg ((R/km)( f /MHz)) dB + 32,44 dB . (23-4) Durch den Einsatz strahlbündelnder Antennen am Übergang von bzw. zu leitungsgebundenen Sende-/ Empfangseinrichtungen kann eine richtungsmäßige Entkopplung von Übertragungswegen erreicht werden. Für Antennen mit relativ zum Quadrat der Wellenlänge λ großer Öffnungsfläche A kann die als Antennengewinn g bezeichnete, auf eine allseitig gleichmäßige Energiezerstreuung bezogene Kenngröße aus der Beziehung g = 10 lg (4πqA/λ2) dB ,
(23-5)
bestimmt werden. Dabei stellt der Faktor q < 1 ein Maß für die Gleichförmigkeit der Energieverteilung in der strahlenden Öffnung A dar. Oberhalb von 1 GHz werden vor allem Reflektorspiegel aus rotationsparabolischen Abschnitten leitender Flächen verwendet, die quasioptischen Gesetzmäßigkeiten der Strahlbündelung gehorchen. Unter 1 GHz dienen dagegen Antennen aus stabförmigen Monopolen oder Dipolen oder Gruppen derartiger Elemente zur Strahlbündelung. Bild 23-7 zeigt eine solche Yagi-Antenne, bei der durch mehrere mit dem schleifenförmigen Speisedipol strahlungsgekoppelte stabförmige Hilfselemente die Richtwirkung erreicht wird. Da es sich bei den Antennen im Allgemeinen um geometriebezogene auf metallischer Wellenführung beruhende Feldwandler handelt, ist ihr
G107
G108
G Elektrotechnik / Nachrichtentechnik
Bild 23-7. Bauweise einer Yagi-Antenne Bild 23-9. Prinzip der Satellitenfunkübertragung
Bild 23-8. Arten der Wellenausbreitung. a Sichtverbindung, b Spiegelung in der lonosphäre, c erdgeführte Wellen
elektrisches Verhalten umkehrbar, also ihr Gewinn g für den Sende- und Empfangsfall, abgesehen von ihrer leistungsmäßigen Belastbarkeit, gleich. Zwischen 2 und 20 GHz erfordern Funkverbindungen weitgehend hindernisfreie Wege, siehe Bild 23-8a. Der Kurzwellenbereich zwischen 3 und 30 MHz kann dagegen durch Spiegelung an sonnenbedingten Ionisationsschichten in der hohen Atmosphäre bei Dämpfungswerten von nur 70 dB für Reichweiten bis 8000 km Abstand genutzt werden, siehe Bild 23-8b. Im Langwellenbereich unter 300 kHz werden Freiraumwellen an der Erdoberfläche durch deren Leitfähigkeit geführt, siehe Bild 23-8c. In dem dazwischenliegenden Frequenzbereich zeigt sich ein Übergangsverhalten. 23.4.2 Punkt-zu-Punkt-Verbindung, Systemparameter
Die Ausbreitung der von strahlbündelnden Antennen ausgesendeten elektromagnetischen Wellen erlaubt bei Störungs- und Hindernisfreiheit die
aufwandsgünstigste Art der Nachrichtenübertragung. Im Frequenzbereich zwischen 2 und 20 GHz und für Entfernungen bis 50 km wird die Punkt-zuPunkt-Verbindung zwischen erhöhten Standorten für Sende- und Empfangsstelle nach Bild 23-8a als erdgebundener Richtfunk bezeichnet. Die interkontinentalen Punkt-zu-Punkt-Verbindungen bedienen sich bei Übertragungsfrequenzen von einigen GHz geostationärer Satelliten als Umlenkstationen im Weltraum, siehe Bild 23-9. Die Eigenschaften solcher Funkübertragungen werden durch die Systemparameter Störabstand S /N, Grundübertragungsdämpfung d, Gewinn gs und ge von Sende- und Empfangsantenne sowie je einen Dämpfungsanteil ds und de für deren Zuleitungen und Weichen als Systemkennwert k = 20 lg (S /N) dB + d − (gs + ge ) + (ds + de ) (23-6) angegeben. 23.4.3 Ton- und Fernsehrundfunk
Die Nachrichtenübertragung bei flächenhafter Versorgung einer beliebigen Anzahl von Empfangsstellen von einer Sendestelle aus wird als Rundfunk bezeichnet. Nach der Art der übertragenen Signale unterscheidet man zwischen Ton- und Fernsehrundfunk. Tonrundfunk bedient sich bei Frequenzen unter 30 MHz der Zweiseitenband-Amplitudenmodulation bei einer Kanalbandbreite von 9 kHz und im Ultrakurzwellenbereich zwischen 88 und 108 MHz bei einer Kanalbandbreite von 200 kHz der Frequenzmodulation als Übertragungsverfahren. Der Fernsehrundfunk mit 52 Kanälen der Bandbreite 7 MHz in den Frequenzbereichen 47 bis 68 MHz (I) und 174 bis 223 MHz (III) sowie 470 bis 789 MHz
24 Signalverarbeitung
(IV/V) benutzt Restseitenbandmodulation für die Bildübertragung bei einer in 5,5 MHz Abstand zum Bildträger an der oberen Bandgrenze eingelagerten Frequenzmodulation mit einem Frequenzhub von 50 kHz für den zugeordneten Tonkanal. Zur digitalen Mehrkanal-Tonübertragung höherer Qualität wird ein PCM-Signal auf der Synchronschulter an der in Bild 22-22 gezeigten Stelle eingefügt. Zunehmend werden in dichtbesiedelten Gebieten zur Fernsehübertragung leitungsgebundene Übertragungswege für zusätzliche Kanäle geschaffen. Die in solchen Kabelnetzen angewendeten Übertragungsverfahren gründen sich auf die für Funkkanäle, um die vorhandenen Empfangsgeräte benutzen zu können. Maßgebend für die Qualität einer Rundfunkversorgung ist die Größe des Empfangssignales an den Orten des Empfangsbereiches und der aus der Erreichung eines Mindestwertes abgeleitete Versorgungsgrad. Bei Funkübertragung kann durch sendeund empfangsseitigen Einsatz von Richtantennen höheren Gewinnes stets eine Verminderung der Übertragungsdämpfung und damit Einsparung von Sendeleistung erzielt werden. Bei Kabelnetzen gelingt dies durch Einfügen von Zwischen- und Verteilverstärkern in den Leitungszügen. 23.4.4 Stationärer und mobiler Sprechfunk
Die bedarfsabhängige Übertragung von Sprachsignalen im Wechsel- oder Gegenverkehr über Funkkanäle bezeichnet man als Sprechfunk. Verbindungswechsel zwischen ortsfesten und/oder ortsveränderlichen Sende- und Empfangsstellen erfordern Rundstrahlantennen oder bündelnde Antennen mit schwenkbarer Hauptstrahlrichtung. Qualitätsminderungen durch Funkstörungen bei hinreichender Verständlichkeit lassen sich bei Kanalbandbreiten unter 10 kHz im Frequenzbereich zwischen 3 und 300 MHz mit Schmalbandfrequenzmodulation durch Signalbegrenzung am besten beherrschen. Zunehmend werden jedoch digitale PCM-Verfahren eingesetzt, da sie eine bessere Nutzung der Kanäle erlauben. Die Einteilung nach Benutzerkreis in öffentliche, lizenzierte und nichtöffentliche Funkdienste sowie die Begrenzung der Sendeleistung ermöglicht eine Mehrfachbelegung gleicher Kanäle in größerem örtlichen Abstand.
24 Signalverarbeitung 24.1 Detektionsverfahren, Funkmessung 24.1.1 Detektionsprinzipien, Auflösungsgrenze
Um eine Nachricht aus dem sie enthaltenden zeitabhängigen Signal zu entnehmen, müssen die informationstragenden Merkmale bekannt sein und dürfen nicht durch Störsignale verdeckt werden. Detektionsverfahren für diesen Zweck lassen sich als eine besondere Art der Modulation beschreiben, wobei das Ausgangssignal dem aufbereitungsseitig zugeführten Nachrichtensignal s(t) entsprechen muss. Dazu kann die in Bild 22-7 gestrichelt eingetragene synchrone Hilfsträgerquelle dienen. Modulierte Übertragungssignale weisen oft einen nicht zur Nachricht gehörenden Informationsanteil auf, der zur Signalabtrennung und zur Verminderung von Störeinflüssen genutzt werden kann. Einfache Demodulatoranordnungen ergeben sich, wenn anstelle eines Hilfsträgers solche im Übertragungssignal enthaltenen Signalanteile genutzt werden können. Die Empfindlichkeit von Detektoren wird durch die im logarithmischen Dämpfungsmaß angegebene Auflösungsgrenze dg = 20 lg (smin /μV) dB
(24-1)
= 20 lg (sstör /1μV) dBμV + 10 lg (S /N) dB bestimmt, die das Störsignal sstör als kleinstzulässigen Wert des Eingangssignales smin mit dem Störabstand S /N verknüpft. 24.1.2 Aussteuerung und Verzerrungen
Da jede Demodulation eine nichtlineare Signalverarbeitung erfordert, entstehen neben dem Nachrichtensignal s(t) auch noch Störspektren, die den Störabstand verschlechtern, wenn sie in das Nutzsignalband S ( f ) fallen und nicht mit Filtern abgetrennt werden. Demodulatoren sind durch die zu ihrem Aufbau verwendeten elektronischen Bauteile in ihrem amplitudenmäßigen Aussteuerbereich begrenzt. Der zulässige Verzerrungsgrad bestimmt also das höchstzulässige Eingangssignal smax und damit die Signaldynamik smax 106 μV . dg = 20 lg (smax /smin ) dB = 20 lg dB V smin = 20 lg (smax / V) dB + 120 dB + (dg /dBμ V) dB . (24-2)
G109
G110
G Elektrotechnik / Nachrichtentechnik
24.1.3 Amplituden- und Frequenzdemodulation
Bei der Demodulation von Signalen unterscheidet man grundsätzlich inkohärente und kohärente Verfahren, die auch Asynchron- und SynchronDemodulation genannt werden; vgl. [8]. Im Gegensatz zur inkohärenten Demodulation wird bei der kohärenten Demodulation der Signalträger frequenz- und phasenrichtig – also in synchroner Form – benötigt, was den Aufwand erheblich erhöht. Wir gehen an dieser Stelle im Wesentlichen auf inkohörente Demodulationsverfahren für die Zweiseitenband-Amplitudenmodulation (AM) und die Frequenzmodulation (FM) ein. Die AM gründet ihre Verbreitung auf die Einfachheit analoger inkohärenter AM-Demodulation. Die Information steckt bei dieser Modulationsart nach Bild 22-8b in den Einhüllenden des Signales S (t) und kann durch einfache Gleichrichtung gewonnen werden, wie dies Bild 24-1 zeigt. Das verzerrungsbedingte Störspektrum lässt sich mit einem RC-Tiefpass vom Nutzsignal trennen, wenn der Spektralanteil bei der Frequenz fT − fs, max gegenüber der höchsten Signalfrequenz fs, max genügend gedämpft werden kann. Bei der klassischen inkohärenten Demodulation von analogen FM-Signalen wird zunächst eine Umwandlung des FM-Signals in ein AM-Signal durchgeführt – im einfachsten Fall des Flankendemodulators an der Flanke eines Filters oder im Gegentaktbetrieb – und anschließend kann dann ein inkohärenter AM-Demodulator benutzt werden.
Bild 24-1. Verfahren der Zweiseitenband-Demodulation. a Schaltung, b Signale
Eine FM-Modulation analoger Signale kann auch mit Hilfe von Rückkopplungsschleifen (engl. Feedback Loops) erfolgen, bei denen ein spannungsgesteuerter Oszillator (engl. Voltage Controlled Oscillator (VCO)) durch eine von der Frequenz bzw. Phase des FM-Eingangssignals abgeleitete Regelspannung nachgesteuert wird. Verwendet man eine Frequenzrückkopplungsschleife (engl. Frequency Locked Loops (FLL)), dann folgt die momentane Frequenz des VCOs der Frequenz des Eingangssignals. Die Regelspannung ist direkt proportional zu dem Signal, das dem Trägersignal des FM-Signals aufmoduliert wurde. Auch eine Phasenregelschleife (engl. Phase Locked Loop (PLL)) kann in ähnlicher Weise zur FM-Demodulation verwendet werden, bei welcher die momentane Phase des VCOs an das FM-Eingangssignal angepasst wird; siehe 24-2. FLL und PLL unterscheiden sich nur durch ein Differenzierglied in der Rückkopplungsschleife. Zum vollen Verständnis beider Systeme wird eine nichtlineare Analyse benötigt, da der Frequenzbzw. Phasenvergleicher ein nichtlineares Teilsystem (z. B. Multiplizierer) ist. Insbesondere der Einrastvorgang von FLL und PLL kann von einem linearen Standpunkt aus nicht verstanden werden. Einzelheiten findet man in der weiterführenden Literatur [12], [13]. Wir wollen auf die wichtigsten Aspekte einer analogen PLL-Struktur eingehen. Die Grundaufgabe eines PLL besteht darin, die Momentanphasen zweier Signale anzugleichen; im Fall von Sinussignalen sind ˜ ˜ 0 t + Φ(t)). das s(t) = sin(ω0 t + Φ(t)) und s˜(t) = sin(ω Dabei sei s(t) das Eingangssignal und s˜(t) das VCOSignal des PLL; vgl. 24-3. Unter der Annahme kleiner Phasenänderungen und bei gleichen Frequenzen ˜ 0 ) können wir aus dem Produkt der bei(ω0 = ω den Signale eine sinusförmig von der Differenzphase ˜ abhängige Regelspannung ableiten, wenn φ := Φ − Φ man s˜(t) um 90◦ phasenverschiebt; es ergibt sich
Bild 24-2. Blockbild eines PLL
24 Signalverarbeitung
Bild 24-3. Nichtlineares Basisbandmodell eines PLL
1 ˜ + 1 sin 2ω0 t + Φ + Φ ˜ . sin Φ − Φ 2 2 Wenn man den zweiten Term mit doppelter Kreisfrequenz mit Hilfe eines Tiefpassfilters eliminiert, dann kommt man zum Basisbandmodell des PLL, das bezüglich der Differenzphase φ mithilfe einer Integralgleichung beschrieben wird s(t) · s90 (t) =
dφ dΦ = −K·A dt dt
"t f (t − τ) sin(φ(τ)) dτ , 0
wobei A und K der Verstärkungsfaktor des Multiplizierers bzw. des Filters und f (t) die Impulsantwort des Tiefpassfilters (F(s) ist die Laplace-Transformierte von f (t)) . t sind; vgl. 24-3. Der VCO kann als Integrator 0 dτ modelliert werden. Bei vorgegebener Eingangsphase Φ kann man Lösungen dieser Integralgleichung diskutieren. Eine lineare Näherung erhält man, wenn die Sinusfunktion nach dem ersten Glied der Taylorreihe abgebrochen wird. Diese Näherung dient zur Dimensionierung des Filters und zu approximativen Rauschbetrachtungen; vgl. [12]. Die Ordnung eines PLL bestimmt sich aus der Ordnung des Tiefpassfilters plus eins, sodass ein PLL 2. Ordnung ein TP-Filter 1. Ordnung enthält. Der Prozess des Einrastens kann nur mithilfe des nichtlinearen Basisbandmodells diskutiert werden. Im Fall des PLL 2. Ordnung kann man eine geometrische Analyse der resultierenden Differenzialgleichung durchführen und die wichtigsten nichtlinearen Eigenschaften des PLL diskutieren; vgl. [13]. Zur Demodulation von FM-Signalen können auch digitale Koinzidenzschaltungen verwendet werden. Dazu wird das FM-Signal zur Demodulation in ein PWM-Signal überführt. Die momentane Frequenzabweichung wird mithilfe der frequenzabhängigen Phasenlaufzeit eines LC-Schwingkreises nach Rechteckformung mit dem ebenso geformten
Bild 24-4. Koinzidenzdemodulator für FM-Signale
Eingangssignal S ( f ) multipliziert. Das Nutzsignal s(t) ergibt sich dann als zeitlicher Mittelwert am Ausgang eines RC-Tiefpassgliedes, s. Bild 24-4. Hinsichtlich Demodulation digitaler Signale soll auf die weiterführende Literatur verwiesen werden [8], [14]. 24.1.4 Pulsdemodulation, Augendiagramm
Zur Wiedergewinnung von Nachrichten aus pulsmodulierten Übertragungssignalen bedient man sich bei wertquantisiertem Modulationssignal stets schwellenbehafteter Koinzidenzschaltungen, da diese in hohem Maße die Ausblendung kanalbedingter Störungen erlauben. Gute Kanalnutzung bei hohem Störabstand erfordert eine Begrenzung des Übertragungsfrequenzbandes S ( f ), sodass sich sinusartige Signalverläufe S (t) ergeben, wie dies Bild 24-5a erkennen lässt. Durch lineare und nichtlineare Verzerrungen des Übertragungskanales werden die
G111
G112
G Elektrotechnik / Nachrichtentechnik
bestimmt werden, wobei λ die Wellenlänge, g der Antennengewinn und d die zugelassene Dämpfung zwischen Sende- und Empfangssignal bedeutet. Die Größe σ ist eine das Reflexionsverhalten des Hindernisses beschreibende, Radarquerschnitt genannte Kenngröße mit der Dimension einer Fläche. Durch den Doppler-Effekt wird bei zeitlicher Veränderung des Abstandes R an der Reflexionsstelle der elektromagnetischen Welle eine Frequenzmodulation aufgepägt. Verfahren, die diese zusätzliche Information nutzen, werden als Doppler-Radar bezeichnet. Sie liefern aus der Geschwindigkeit vR = dR/dt der Abstandsänderung in der Ausbreitungsrichtung R der elektromagnetischen Welle die Doppler-Modulationsfrequenz Δ fD = f (t) − fT = 2( f /c)(dR/dt) = 2vR /λ . (24-4) Bild 24-5. a PCM-Frequenzbandbegrenzung und b Augen-
diagramm
Zeitverläufe S (t) jedoch von den Musterfolgen abhängig. Die graphische Überlagerung aller möglichen Signalfolgen führt auf das Augendiagramm, das für störsichere Detektion eine geöffnete, im Bild 24-5b schraffierte Augenfläche aufweisen muss. Deren zeitliche Ausdehnung entspricht der Koinzidenzzeit tk und deren mittlerer Signalwert dem bestmöglichen Wert sk für die Entscheidungsschwelle. 24.1.5 Funkmessprinzip und Signalauswertung
Durch Pulsmodulation einer hochfrequenten Trägerschwingung kann bei sich ungehindert geradlinig ausbreitenden elektromagnetischen Wellen die Laufzeit zwischen einem Sende- und Empfangsort durch Zeitvergleich aus einem aufmodulierten Signal bestimmt werden. Mit einer einzigen Richtantenne für Senden und Empfang ergeben sich gleiche Ausbreitungswege zu und von einem reflektierenden Hindernis, sodass sich die Richtung aus der Antennenstellung und der Abstand des Hindernisses aus der Laufzeit ermitteln lässt. Verfahren dieser Art werden unter dem Begriff Puls-Radar (Radio Detection and Ranging) zusammengefasst. Die Reichweite R einer solchen Einrichtung kann aus der Beziehung √4 √ (24-3) R = 0,080 4πσ λ 10(2g+d )/40 dB
Durch eine trägerphasenbezogene Synchrondemodulation oder auch inkohärente Demodulation kann auch die Bewegungsrichtung bestimmt werden [6]. Die räumliche Abtastung, aus Aufwandsgründen meist in zeitlicher Folge vorgenommen, lässt mit speicherbehafteter Signalverarbeitung eine ZeitOrts-Transformation zu, die bei phasenrichtiger Überlagerung der Ergebnisse ein räumliches Abbild aller erfassten reflektierenden Stellen zu liefern vermag. Verfahren dieser Art werden unter dem Begriff der Mikrowellenholografie zusammengefasst.
24.2 Signalrekonstruktion, Signalspeicherung 24.2.1 Systemadaption und Umsetzalgorithmen
Die Wiedergewinnung nachrichtentechnischer Signale auf der Verarbeitungsseite kann umso einfacher und von kanalspezifischen Störeinflüssen unabhängiger geschehen, je mehr redundante Anteile für die Auswertung zur Verfügung stehen. Diese Anteile brauchen nicht in den augenblicklichen Signalen enthalten zu sein, sondern können auch aus dem Systemverhalten oder dessen Veränderungen gewonnen werden. Dies erfordert eine Informationsspeicherung, da Entscheidungen über die zu erwartenden Veränderungen dann aus bereits übertragenen Informationen gewonnen werden können. Solche Systeme bezeichnet man als adaptiv, da sie in ihrem
24 Signalverarbeitung
Verhalten signalabhängig angepasst werden können, wobei sich Verzugseffekte und Auflösungsgrenzen bemerkbar machen. Durch redundante Signalanteile kann zwar das Verhalten verbessert werden, jedoch kostet dies zusätzliche Kanalkapazität. Zur Adaption signalabhängigen Systemverhaltens kann in endlicher Zeit nur eine beschränkte Anzahl von Werten und Verfahren genutzt werden. Die Regeln nach denen dies erfolgt, müssen eindeutig sein und werden Umsetzalgorithmen genannt. Umsetzungen, die viele verschiedenartige Einflüsse berücksichtigen und/oder längere Zeiträume erfassen, erfordern aus Aufwandsgründen digitale Rechenwerke.
triebsmäßige Änderung der gespeicherten Information ermöglichen, Letztere dagegen nur der Signalkonservierung dienen. Die Art des Zugriffs auf die zur Speicherung benutzten Medien bestimmt die Anwendbarkeit der Speicherverfahren für nachrichtentechnische Zwecke, da die abzulegenden oder aufzurufenden Informationen sowohl in ihrer Reihenfolge als auch in ihrer Geschwindigkeit den zugeordneten Quellen und Senken entsprechen müssen. Man bezeichnet diese Informationsflüsse als Schreib- bzw. Leserate, wobei zur Übertragung sowohl einkanalige serielle als auch vielkanalige parallele und MultiplexVerfahren gleichermaßen zum Einsatz kommen.
24.2.2 Speicherdichte, Schreib- und Leserate
24.2.3 Flüchtige und remanente Speicherung
Die systemangepasste algorithmische Signalverarbeitung erfordert veränderbare Bezugs- und/oder Steuerwerte, die den Entscheidungskriterien zugrunde liegen. Anordnungen mit Speichern erlauben bei digitalem Aufbau einen besonders einfachen Austausch dieser Werte. Durch Zwischenspeicherung des diskontinuierlichen Informationsflusses Hq einer Quelle kann dieser auf den Mittelwert reduziert und damit Kanalkapazität Hk des Übertragungsweges eingespart werden. Der in dem Pufferspeicher aufzunehmende Informationsgehalt beträgt dann "T Hs = (24-5) Hq − Hk dt .
Alle Verfahren zur Signalspeicherung beruhen auf Zustandsänderungen in den Speichermedien. Nach signalabhängiger Einprägung der Veränderungen kann mithilfe von zuordnungsabhängigen Detektionsverfahren zeitversetzt das gespeicherte Signal ein- oder auch mehrmals reproduziert werden. Die einfachste Speicheranordnung ist der Laufzeitspeicher, der als verzerrungsfreier Übertragungsweg eine Signalverzögerung s(t − τ) bewirkt und in analoger wie auch digitaler Bauweise verwendet wird. Derartige Speicher verlieren nach jedem Durchlauf die Information und werden deshalb als flüchtige Speicher bezeichnet. Ähnliche Eigenschaften weisen auch die meisten vollelektronischen Speicher auf, da die in ihnen enthaltenen Halbleiterbauteile für den Speichervorgang eine kontinuierliche Stromversorgung benötigen. Im Gegensatz dazu benötigen mechanische und elektromagnetische Speicherverfahren keine Hilfsenergie und werden deshalb als remanente Speicher bezeichnet.
0
Dies ist für die schmalbandige störarme Übertragung großer redundanzbehafteter Informationsflüsse auf schmalbandigen Kanälen, wie z. B. von Bewegtbildern aus dem Weltraum, von Interesse. Der in einem Speicher aufnehmbare Informationsgehalt Hs spielt dann eine entscheidende Rolle, wenn es sich um eine Signalreproduktion handelt, da die speicherbare Signaldauer T s bei konstantem Informationsfluss H durch T s = Hs /H bestimmt wird. Der Informationsgehalt hochwertiger akustischer und optischer Nachrichtensignale erfordert bei Signaldauern von einigen Stunden Speicher der Größenordnung Gbit bis Tbit, sodass die Speicherdichte, auf die Fläche bezogen, der üblicherweise benutzte Kennwert ist. Es sind Schreib-Lese-Speicher und reine Reproduktionsspeicher zu unterscheiden, wobei Erstere eine be-
24.2.4 Magnetische, elektrische und optische Speicher
Ausgehend von Lochstreifen und Schallplatten zur Signalspeicherung für Reproduktionszwecke werden heute vorwiegend remanente Magnetfelder in dünnen permeablen Schichten genutzt. Dieses Verfahren erlaubt einen wahlfreien Schreib- und Lesebetrieb bei Speicherdichten von einigen kbit/mm2 und Bandbreiten bis zu mehreren MHz. In Spurform auf Bändern oder Scheiben mit Köpfen nach Bild 24-6 aufmagnetisierte und auslesbare Signalfolgen sind vor allem
G113
G114
G Elektrotechnik / Nachrichtentechnik
Bild 24-6. Schnittbild eines Magnetkopfes
Bild 24-7. Schaltung eines FET-Speicherelementes
für die Signalreproduktion längerer Signaldauern und Speicherzeiten geeignet. Für die Kurzzeitspeicherung der adaptiven Nachrichtenverarbeitung werden bedarfsabhängig einteilbare Speicher mit hoher Schreib- und Leserate benötigt. Hier werden elektrische Verfahren unter Verwendung digitaler mikroelektronischer Schaltungen aus Feldeffekttransistoren nach Bild 24-7 bevorzugt, da sie einschränkungsfrei adressierbar bei Speicherdichten von Mbit/cm2 bei einem Strombedarf von einigen mA/Mbit aufweisen. Der Nachteil der Flüchtigkeit kann durch Pufferung der Stromversorgung ausgeglichen werden. Zur Speicherung sehr umfangreicher Nachrichten bedient man sich zunehmend digitaler optischer Verfahren holographischer Art, die Speicherdichten bis zu Mbit/mm2 ermöglichen. Die hierzu verwendeten Verfahren gestatten jedoch vorerst nur eine sequentiell serielle Signalreproduktion.
24.3 Signalverarbeitung und Signalvermittlung 24.3.1 Strukturen für die Verarbeitung analoger und digitaler Signale
Die signalwertabhängige Beeinflussung von Eigenschaften nachrichtentechnischer Einrichtungen wird als Signalverarbeitung bezeichnet. Es können sowohl
signalabhängige als auch durch Störeinflüsse bedingte Veränderungen gleichermaßen vermindert oder ausgeglichen werden. Gesteuerte Systemveränderungen sind den Signalwerten starr zugeordnet, wie z. B. bei der nichtlinearen Quantisierung. Bei den geregelten Systemveränderungen dagegen werden mittels Detektion bestimmte Systemeigenschaften nachgeführt, wie z. B. der Dämpfungsausgleich in Systemen mit pilotabhängiger Verstärkungsregelung, bei denen ein Trägersignal konstanter Amplitude als Bezugsgröße dient. Die Signalverarbeitung bediente sich früher vorwiegend analoger Einrichtungen, die jedoch zunehmend durch digitale ersetzt wurden, weil sich damit systembedingte Abhängigkeiten einfacher berücksichtigen ließen. Analoge Einrichtungen zeigen zwar signalspeicherndes Tiefpassverhalten, das bei einfacheren Verarbeitungszusammenhängen zu aufwandsgünstigeren Anordnungen bei hoher Bandbreite führt, sind jedoch Einschränkungen hinsichtlich der Stabilität unterworfen. Auflösung und Bandbreite digitaler Einrichtungen sind dagegen nur vom Aufwand und den Eigenschaften der Signalwandler abhängig. Informationsflüsse bis 100 Mbit/s und Störabstände bis 100 dB lassen sich bei vertretbarem Aufwand beherrschen. Dabei werden die modernen Signalprozessoren genutzt. Diese Elemente sind höchstintegrierte Spezialrechner, die bei Auflösungen von 16 Bit Signalflüsse bis 100 Mbit/s mit Filterungsund Korrelationsverfahren in parallelen Strukturen verarbeiten können, siehe Bild 24-8. 24.3.2 Signalauswertung und Parametersteuerung
Die Anpassung von Systemeigenschaften erfordert steuerungsabhängige Informationen. Verfahren dieser Art setzen voraus, dass die entscheidenden Störungseinflüsse bekannt sind und durch in eindeutig steuerungsfähige Parameter beschrieben werden können. Durch Vergleich zwischen erwartetem und vorhandenem Signal können dabei diese Systemparameter durch Korrelation bei trennbaren Mustern gewonnen werden. Dazu müssen gespeicherte Referenzmuster vorliegen oder durch Berechnung aus Signalwertfolgen bestimmt werden. Die Korrelationsintervalle müssen dazu den Änderungsgeschwindigkeiten der Störeinflüsse angepasst werden. Daraus folgt stets eine Verzögerung in
24 Signalverarbeitung
Bild 24-8. Aufbauprinzip eines Signalprozessors
der Nachführung, die Vorhalt genannt wird und zu Fehlern bei sprunghaften Zustandsänderungen führt. 24.3.3 Rekursion, Adaption, Stabilität, Verklemmung
Die Signalverarbeitung besteht aus rekursiven und nichtrekursiven Verfahren, die sich auf die Bearbeitung vorhergehender Zustände stützen bzw. diese nicht benötigen. Die Grundstrukturen gliedern sich in Schleifenschaltungen für den rekursiven Betrieb, siehe Bild 24-9a und in Abzweigschaltungen für den nichtrekursiven Betrieb, siehe Bild 24-9b. Maßgebend für die Annäherung an Sollwerte ist bei digitalen Einrichtungen mit schrittweisem Vorgehen die zeitabhängige Veränderung der Systemparameter z, die als Adaption bezeichnet wird und sich auf die vorgenannte Parametersteuerung stützt. Die beiden Strukturen von Bild 24-9 zeigen insoweit unterschiedliches Verhalten, als bei rekursiven Verfahren durch phasenrichtige Rückführung die Anordnung zu Eigenschwingungen erregt werden kann. Die Stabilität des Betriebsverhaltens kann so ungünstig beeinflusst werden, dass vom Eingangs-
signal unabhängige Ausgangssignale auftreten, die Grenzzyklen genannt werden. Andererseits neigen alle parametergesteuerten Signalverarbeitungsverfahren mit auswertungsabhängiger Rückkopplung zur Verklemmung, bei der das System fortwährend in einem durch Signaländerungen unbeeinflussbaren Zustand verharrt und damit untauglich wird [7]. Im Gegensatz zu den analogen Systemen, die durch Differentialgleichungen beschrieben werden, hat man es bei zeitdiskreten Systemen mit Differenzengleichungen zu tun. Im Fall linearer zeitinvarianter Systeme besitzen die Analysemethoden für beide Arten der Beschreibungsgleichungen gewisse Ähnlichkeiten, da die Lösungen dieser Gleichungen in Funktionenvektorräumen endlicher Dimension (Ordnung der Differenzial- oder Differenzengleichungen bzw. Anzahl der Zustandsgrößen) enthalten sind. Daher kann man die entsprechenden Lösungstheorien auf der Grundlage der linearen Algebra entwickeln; vgl. Literaturhinweise in Mathis [9]. In der weiterführenden Literatur wird auf die mathematischen Grundlagen analoger Schaltungen eingegangen (z. B. in [9], [11]) und in [10] werden die verschiedenen Architekturen der digitalen Signalverarbeitung, deren Eigenschaften und grundlegende Entwurfsverfahren behandelt. 24.3.4 Netzarten, Netzführung, Ausfallverhalten
Bild 24-9. a Rekursiv- und b Abzweigstruktur
Eine besondere Art der Signalverarbeitung stellt die gesteuerte Umschaltung von Nachrichtenkanälen in Verteilsystemen mit mehr als 2 Knoten dar. Man nennt derartige Systeme Nachrichtennetze. Je nach der Anordnung der zwischen den Knoten
G115
G116
G Elektrotechnik / Elektronik
Knoten jederzeit miteinander in Verbindung treten können. 24.3.5 Belegungsdichte, Verlust und Wartezeitsysteme Bild 24-10. Grundstrukturen
von Nachrichtennetzen. a Sternnetz, b Maschennetz, c Schleifennetz
vorhandenen Kanäle ist zwischen dem Sternnetz nach Bild 24-10a, dem Maschennetz nach Bild 24-10b und dem Schleifennetz Bild 24-10c zu unterscheiden. Die Vermittlungsstellen in den Knoten bestehen aus Multiplexeinrichtungen zur bedarfsabhängigen Umschaltung der Übertragungskanäle und werden zur informationsflussabhängigen Zuweisung der Kanalkapazität durch Signalverarbeitungseinrichtungen gesteuert. Diese Funktion wird als Netzführung bezeichnet. Im Sternnetz kann nur der erste Teil dieser Funktion erfüllt werden, da die Übertragungswege den Teilnehmern starr zugeordnet sind und deshalb ein Austausch verfügbarer Kanalkapazität nicht möglich ist. Im Gegensatz dazu erlaubt das Maschennetz eine bedarfsabhängige Zuweisung von Kanalkapazität, was sich bei hoher Auslastung oder Ausfällen von Übertragungswegen für Umweg- bzw. Ersatzschaltungen nutzen lässt. Voraussetzung dafür sind Informationen über die Belastungsverhältnisse des Netzes und über die Veränderungen des Schaltzustandes. Informationen dieser Art können zwar in einem übergeordneten Steuerungsnetz übertragen werden, heute wird aber ihre Aufnahme in das sog. Vermittlungsprotokoll bevorzugt. Das Schleifennetz ist meist protokollgesteuert und fordert zwar den geringsten Aufwand, doch besteht selbst bei Gegenverkehr hier im Überlastungs- oder Störungsfall die Gefahr der Inselbildung, bei der nicht mehr alle
Die Belastung eines Nachrichtennetzes wird durch die Ausnutzung von bereitgestellter Kanalkapazität bestimmt. Für ein Netz mit n gleichen Kanälen ergibt sich dann die Belegungsdichte E als Verhältnis aus Nutzungsdauer tN und Verfügbarkeitszeit tV . Der Größe E wird zur Unterscheidung die unechte Sondereinheit Erlang (Erl) zugewiesen. Sind in einem Netz n Kanäle unterschiedlicher Kanalkapazität Hi zusammengefasst, so sind diese entsprechend zu bewerten und es gilt ⎡ n ⎤ n ⎢⎢⎢ 6 7 6 7⎥⎥⎥⎥ ⎢ E = (tN /tV )Erl = ⎢⎣ Hi tNi / Hi tVi ⎥⎦ Erl . 1
1
(24-6) Die Kanalanforderung und Zuweisung kann entweder in einem festgelegten Zeitrahmen in der Reihenfolge der Anforderungen oder auch nach einer zustandsabhängigen Prüfung in einer belastungsgünstigeren Reihenfolge vorgenommen werden. Vermittlungsnetze der ersten Art werden als Verlustssysteme bezeichnet, da in ihnen bei hoher Belegungsdichte Anforderungen als undurchführbar zurückgewiesen werden. Im Gegensatz dazu ergeben sich bei den Wartezeitsystemen belastungsabhängige Verzugszeiten zwischen Bedarfsanforderung und Kanalzuweisung. Durch die Anpassungsfähigkeit digitaler signalspeichernder Verarbeitungseinrichtungen zur bedarfsgesteuerten Zuweisung von Übertragungswegen unterschiedlicher Kanalkapazität ist es inzwischen gelungen, die Suchzeit so weit zu verkürzen und betriebsbedingte Umsteuerungen so zu beschleunigen, dass sich kaum noch Unterschiede zwischen diesen beiden Betriebsarten ergeben und Wartezeitsysteme fast echtzeittauglich geworden sind.
25 Analoge Grundschaltungen
Elektronik K. Hoffmann, W. Mathis, G. Wiesemann 25 Analoge Grundschaltungen Das Betriebsverhalten elektronischer Schaltungen wird vor allem von den in ihnen enthaltenen elektronischen Bauelementen (vgl. 27) bestimmt. Ihre besonderen Eigenschaften sind nichtlineare Zusammenhänge zwischen Strom und Spannung oder die verstärkende Wirkung gesteuerter Energieumsetzung. Dazu sind Ruhespannungen und -ströme erforderlich, die sogenannte Arbeitspunkte bilden und eine Beschaltung dieser Elemente erfordern. Neben Versorgungsquellen werden dafür passive lineare Netze oder auch elektronische Bauteile eingesetzt. Durch Störeffekte der Beschaltung und Trägheitseffekte der elektronischen Ladungsträgersteuerung ergeben sich Frequenzabhängigkeiten, die auf nichtlineare Differenzialgleichungen führen. Aus ihnen lassen sich jedoch keine überschaubaren Bemessungskriterien ableiten [1]. In der Praxis wird die Zerlegung in Grundschaltungen bevorzugt, da sich damit Einflussfaktoren getrennt betrachten lassen. Umfangreichere Anordnungen werden dann aus solchen Grundschaltungen zusammengesetzt.
und einem Widerstand R gebildeten Weiche nach Bild 25-1. Diese wird vorzugsweise zur Trennung der Gleichstrom-Arbeitspunkteinstellung von der Wechselstromansteuerung in elektronischen Schaltungen eingesetzt und als kapazitive Ankopplung bezeichnet. Für den Versorgungspfad gilt mit der Eingangsimpedanz |Ze | = |U/I| R, |1/ωC| und Us U0 U( f )/U0 = (1/jωC)/(R + 1/jωC) = 1/(1 + jωRC) = 1/(1 + j f / fg ) . (25-1) Wichtigster Kennwert dieser Anordnung ist die Eckfrequenz fg = 1/2πRC, bei der die Eingangs√ amplitude U auf das 1/ 2-fache des Bezugswertes U0 absinkt, der hier der Gleichspannungswert U0 = U( f = 0) ist. Diese Frequenzabhängigkeit h( f ) wird Tiefpassverhalten genannt und als Bode-Diagramm in doppeltlogarithmischer Darstellung nach Bild 25-2 wiedergegeben. Der Signalpfad besitzt dagegen bei Bezug auf den Signalwert
25.1 Passive Netzwerke (RLC-Schaltungen) Widerstände, Kondensatoren, Spulen und Übertrager sind zwar keine elektronischen Elemente, werden wegen der sicheren Einhaltung ihrer Kennwerte, wegen ihres einfacheren Aufbaues und geringeren Störbeeinflussung aber bevorzugt zur stabilisierenden Beschaltung elektronischer Bauteile eingesetzt. Dies trifft vor allem auf die signalunabhängige Festlegung von Arbeitspunkten und die Vermeidung von Rückwirkungen zwischen Signal- und Versorgungsquellen zu, damit passiven Netzwerken Signale besonders einfach frequenzselektiv voneinander getrennt werden können.
Bild 25-1. Signal- und Versorgungsquellenentkopplung
durch Hoch-Tiefpass-Glied
25.1.1 Tief- und Hochpassschaltung
Die einfachste Art frequenzselektiver Entkopplung besteht in einer aus einem Kondensator C
Bild 25-2. Bode-Diagramm eines Tiefpass-RC-Gliedes
G117
G118
G Elektrotechnik / Elektronik
Us = U( f → ∞) Hochpassverhalten mit derselben Eckfrequenz fg : U( f )/Us = R/(R + 1/jωC) = 1/(1 + 1/jωRC) = 1/(1 − j fg / f ) (25-2) 25.1.2 Differenzier- und Integrierglieder
Hoch- und Tiefpassverhalten führen im Zeitbereich auf Differenzialgleichungen, deren Lösungen Exponentialfunktionen der Art e−t/τ oder 1 − e−t/τ sind. Sprunghafter Signalanstieg zum Zeitpunkt t = 0 bewirkt ein Einschwingverhalten nach Bild 25-3. Als Kennwert dient die Zeitkonstante τ, die mit der Grenzfrequenz fg und Werten R und C über die Beziehung τ = 1/(2π fg) = RC
(25-3)
zusammenhängt. Die Übertragung pulsförmiger Signale in elektronischen Schaltungen führt wegen Tiefpassverhaltens stets auf Signalverzögerungen. Bei einer relativen Schwellamplitude von U/U0 = 0,5 ergibt sich dadurch ein Zeitversatz um tV = τ ln 2 = 0,69τ, wie in Bild 25-3 eingetragen. Die Eingangsimpedanz Ze elektronischer Bauteile kann durch ein RC-Glied nach Bild 25-4 genähert werden. Durch Überbrückung eines vorgeschalteten Widerstandes R mit einer Zusatzkapazität Cz kann diese
Bild 25-5. Zur Versteilerung von Impulsflanken
Störung vermindert werden, wenn die Zeitkonstanten der beiden RC-Glieder gleich bemessen werden, τ = ReCe = RCz und damit Cz = ReCe /R .
(25-4)
Diese Anordnung bezeichnet man als frequenzkompensierten Spannungsteiler. Die Abflachung von Impulsflanken durch Tiefpassverhalten führt bei ungenauer schwellenbehafteter Auswertung auf zeitliche Schwankungen tj , die als sog. Jitter bezeichnet werden. Durch Signalumkehr und zweimalige Differenziation mit Hochpassschaltungen können Impulsflanken versteilert und dadurch ein in Schwellpegelschwankungen ΔU begründeter Jitter tj gemäß Bild 25-5 vermindert werden. 25.1.3 Bandpässe, Bandsperren, Allpässe
Die selektive Trennung von Signalanteilen in einzelne Frequenzbänder erfordert die Zusammenschaltung frequenzabhängiger Übertragungsglieder, im einfachsten Fall je eines Hoch- und eines Tiefpasses. Dabei ist zwischen zwei Fällen zu unterscheiden, da fg, HP > fg, TP oder fg, HP < fg, TP gewählt werden kann, wie Bild 25-6 erkennen lässt. Innerhalb der Bandbreite B = | fg, TP − fg, HP | = fo − fu wird das Bild 25-3. Einschwingverhalten von RC-Gliedern
Bild 25-4. Frequenzkompensierte Teilerschaltung
Bild 25-6. Frequenzverlauf von Bandpass und Bandsperre
25 Analoge Grundschaltungen
Signal übertragen oder unterdrückt. Man bezeichnet solche Schaltungen als Bandpässe bzw. Bandsperren. Die Frequenzabhängigkeit ihres Übertragungsverhaltens h( f ) = Ua ( f )/Ue lässt sich als Produkt von (25-1) und (25-2) aus je einem entkoppelten RC-Hoch- und Tiefpass gewinnen: h( f ) = 1/(1 + ( fg, HP / fg, TP ) + j( f / fg, TP − fg, HP / f )) . (25-5) Schwingkreise aus Spulen und Kondensatoren weisen wegen geringerer Verluste gegenüber RCSchaltungen höhere Kreisgüten
Q = fg, T P fg, HP /B = fm /B auf und ermöglichen deshalb den Bau von Filtern geringerer Bandbreite B. Eine Steigerung der Kreisgüte Q erfordert eine bessere Konstanz der Mittenfrequenz fm , was durch Bauteile mit mechanischen Resonanzen, z. B. durch Schwingquarze, erreicht werden kann. Allgemein lässt sich frequenzselektives Verhalten auf das entsprechender Tiefpässe zurückführen, indem eine Frequenznormierung | f − fm | fg vorgenommen wird, sodass bei zur Mittenfrequenz fm symmetrischem Dämpfungsverlauf die Angabe einer Eckfrequenz fg genügt. Die Bemessung von Filterschaltungen höheren Grades richtet sich dabei nach der für den Dämpfungsverlauf gewählten Polynomfunktion [2]. Dabei ist zwischen Bessel-, Butterworth- und Tschebyscheff-Filtern zu unterscheiden, deren Übertragungs- und Einschwingverhalten in Bild 25-7 vergleichend dargestellt ist. Die in der elektronischen Schaltungstechnik bevorzugten Butterworth-Filter bieten einen gewissen Ausgleich zwischen Dämpfungsanstieg und Überschwingen. Eine besondere Filterart sind Allpässe. Sie bewirken eine frequenzabhängige Phasendrehung der übertragenen Signale ohne Amplitudenveränderung. Werden sie als RC-Schaltung entsprechend Bild 25-8 ausgeführt, so gilt mit der Eckfrequenz fg = 1/2πRC für ihr Übertragungsverhalten h( f ) = (1 − j f / fg )/(1 + j f / fg ) = exp(−j · 2 arctan( f / fg )) .
(25-6)
Die verzerrungsfreie Auftrennung und Wiederzusammenführung von Signalen durch selektive Filterschal-
Bild 25-7. Übertragungs- und Einschwingverhalten von Bessel-, Butterworth- und Tschebyscheff-Filtern
Bild 25-8. Allpassfilter
tungen wird als Frequenzweiche bezeichnet und erfordert, dass das Summensignal Ua am Ausgang keine Abhängigkeit von der Frequenz f aufweisen darf. Diese Forderung wird durch je eine einfache RCHoch- und Tiefpassschaltung gleicher Eckfrequenz fg nach Bild 25-1 erfüllt. Dies zeigt die Summenbildung der Ausgangssignale U0 und Us in Bild 25-3 für beide Schaltungen, die verzerrungsfrei die anregende Sprungfunktion liefert. 25.1.4 Resonanzfilter und Übertrager
Schmale Bandpässe zur selektiven Abtrennung von Spektralanteilen werden als Resonanzfilter bezeichnet. In der Elektronik werden dazu je nach Anforderungen sehr unterschiedliche Ausführungen und Bemessungsprinzipien verwendet. Weit verbreitet sind Potenzfilter bei denen mehrere Resonanzkreise rückwirkungsfrei so überlagert werden, dass sich das Ge-
G119
G120
G Elektrotechnik / Elektronik
samtübertragungsverhalten als Produkt in der Form h( f ) = Ua ( f )/Ua ( fm ) D n =1 [1 + jQi ( f / fmi − fmi / f )]
(25-7)
i=1
schreiben lässt, wobei fmi die Mittenfrequenzen und Qi die Güten der einzelnen Kreise sind. Je nach Ansatz des Polynomes für den Dämpfungsverlauf ergeben sich Butterworth-, Bessel- und TschebycheffFilter. Wenn bei Filtern neben der Welligkeit (Ripple) im Durchlassbereich auch im Sperrbereich der Übertragungsfunktion eine Welligkeit vorgeschrieben ist, dann spricht man von Cauer-Filtern oder elliptischen Filtern; vgl. weiterführende Literatur. Einen einfacheren Aufbau bietet die Zusammenfassung je zweier Resonanzkreise zu einem Koppelfilter, das meist mit transformatorischer Kopplung nach Bild 25-9 ausgeführt √wird. Bei gleicher √ Mittenfrequenz fm = 1/(2π L1C1 ) = 1/(2π L2 C2 ) der beiden Kreise und√überkritisch bemessener Kopplung √ K > M Q1 Q2 / L1 L2 ergibt sich ein höckerartiger zur Mittenfrequenz fm symmetrischer Dämpfungsverlauf mit steilerem Anstieg in Resonanznähe als bei Einzelkreisen. Die transformatorische Signalübertragung erlaubt außerdem eine Potenzialtrennung zwischen Ein- und Ausgang. Mitten- und Grenzfrequenzen sollen in elektronischen Schaltungen die geforderten Werte frei von Schwankungseinflüssen einhalten. Dazu bedient man sich der Empfindlichkeitsanalyse und vermindert störende Abhängigkeiten durch Kompensationsmaßnahmen. Die wichtigste Einflussgröße stellt die Betriebstemperatur θ dar, deren Einfluss durch den Temperaturkoeffizienten α als relative temperaturbezogene Abweichung beschrieben wird. Für Kapazitäten gilt so z. B. α = (ΔC/C)/Δθ. Kompensationsmaßnahmen erfordern Bauteile entgegengesetzt wirkenden Temperaturverhaltens, also umgekehrtes
Bild 25-9. Koppelfilter
Bild 25-10. Zur Temperaturkompensation
Vorzeichen des Temperaturkoeffizienten α. Für die Reihenschaltung zweier temperaturabhängiger Kondensatoren C1 und C2 nach Bild 25-10 gilt damit 1/Cges = (1/C1 + 1/C2 ) und αges =
α1 C2 + α2 C1 . C1 + C2
(25-8)
25.2 Nichtlineare Zweipole (Dioden) Grundsätzlich besitzen alle elektronischen Bauteile nichtlineare Zusammenhänge zwischen ihren Klemmenspannungen und/oder -strömen, die mit wachsender Aussteuerung zunehmend zu Verzerrungen führen. Je nach Anwendungszweck werden bestimmte Verzerrungen funktionsmäßig genutzt oder sie werden durch Begrenzung der Aussteuerung und/oder durch Beschaltung mit linearen passiven Bauteilen entsprechend den Anforderungen vermindert. 25.2.1 Diodenverhalten (Beschreibung)
Das einfachste aus einem Halbleiterübergang (siehe 27.2) bestehende elektronische Bauelement ist die Diode. Der Zusammenhang zwischen I und U wird bei überlastungsfreiem Betrieb durch eine Exponentialfunktion beschrieben: I = Is (eU/UT − 1) ≈ Is eU/UT für |I| Is .
(25-9)
Dabei bedeutet Is den Sperrstrom und UT die Temperaturspannung. Die Temperaturspannung UT , im praktischen Fall stets etwas größer als ihr theoretischer Wert (kT/e): BoltzmannKonstante × Temperatur/Elementarladung), besitzt für Siliciumhalbleiter einen Wert von etwa 40 mV. Der Zusammenhang (25-9) führt auf den spannungsabhängigen Widerstand R = U/I = R(U),
25 Analoge Grundschaltungen
Bild 25-12. Diodengleichrichterschaltung
Bild 25-11. Spannungsabhängiger Widerstandsverlauf einer Diode mit Näherungen
den Bild 25-11 zeigt und der durch den Sperrwiderstand Rs und den Durchlasswiderstand Rd√sowie die Schleusenspannung US = U(R = Rs Rd ) gekennzeichnet ist, die für Siliciumdioden etwa US = 0,7 V beträgt. Das Verhalten von Dioden kann aussteuerungs- und beschaltungsabhängig in folgenden Schritten angenähert werden: A. Sprungartige Umschaltung zwischen Sperr- und Durchlasswiderstand bei der Schleusenspannung US B. Sperrwiderstand der Diode vernachlässigbar hoch: Rs → ∞ C. Schleusenspannung vernachlässigbar klein: US ≈ 0 D. Diodenstrom vom Durchlasswiderstand Rd = 0 unabhängig und damit das Verhalten des idealen Schalters. Die Geschwindigkeit der Umschaltung wird durch die Trägheit der Ladungsträger im Halbleiter und durch die Umladung innerer spannungsabhängiger wie auch aufbaubedingter fester Kapazitäten begrenzt. Daraus folgt Tiefpassverhalten nach (25-1), das sich dem spannungsabhängigen nichtlinearen Verhalten der Diode überlagert. Im Großsignalbetrieb kann man eine Diode übrigens durch die folgende Beziehung in impliziter Weise beschreiben u·i=0,
ten Wechselstromversorgung eingesetzt und bestehen im einfachsten Fall aus einer Anordnung mit einer Diode D nach Bild 25-12. Ein dem Verbraucherlastwiderstand RL parallel geschalteter Ladekondensator CL liefert dabei Ausgangsgleichstrom I in der Sperrphase der Diode. Bei sinusförmiger Netzspannung UN der Frequenz f = 1/T , exponentiellem Verlauf der Spannung U(t) in der Sperrphase nach Bild 25-13 und linearer Entwicklung dieser Abhängigkeit gilt für die Brummspannung genannte Spannungsschwankung ΔU = Umax − Umin = Umax (1 − e−T/RLCL ) (25-10) ≈ Umax T/RLCL am Ausgang dieser Einwegschaltung genannten Anordnung. Für die Bemessung des Ladekondensators ergibt sich daraus CL ≈ Umax /ΔU f RL = I/ΔU f .
(25-11)
Der Ausgangsgleichstrom I durchfließt in dieser Schaltung auch die Speisequelle. Sie muss deshalb gleichstromdurchgängig sein und wird dadurch belastet. Für eine analytische Betrachtung der Einweggleichrichtung wird übrigens erheblicher mathe-
u, i > 0 .
25.2.2 Gleichrichterschaltungen
Gleichrichterschaltungen werden zur Erzeugung von Gleichspannungen und -strömen aus der netzfrequen-
Bild 25-13. Brummspannungsverlauf beim Einweggleich-
richter
G121
G122
G Elektrotechnik / Elektronik
Bild 25-14. Zweiweg-Gleichrichterschaltungen
matischer Aufwand benötigt; vgl. die weiterführende Literatur und insbesondere Kriegsmann’s Arbeit [12]. Die in Bild 25-14a gezeigte Brückenschaltung vermeidet diesen Nachteil, da sich der Gleichstrompfad in der Gleichrichterschaltung schließt. Zur Bemessung des Siebkondensators CL ist wie bei der für größere Ströme günstigeren Mittelpunktschaltung Bild 25-14b und der für symmetrische Ausgangsspannungen bevorzugten Doppelmittelpunktschaltung Bild 25-14c die Frequenz f der Brummspannung ΔU in (25-11) gleich der doppelten Netzfrequenz 2 fN zu setzen, da die Zweiwegschaltungen von Bild 25-14 beide Halbschwingungen zur Gleichrichtung nutzen. Wird die untere Hälfte
der Gleichrichterbrücke in Bild 25-14c nebst der zugehörigen Speisung fortgelassen, so ergibt sich die Delon-Schaltung Bild 25-15a, die eine Verdopplung der Ausgangsspannung auf 2 U bewirkt und aus zwei Einwegschaltungen besteht. Entsprechendes Verhalten besitzt auch die Villard-Schaltung Bild 25-15b, mit einer galvanischen Verbindung zwischen Einund Ausgang. Der Koppelkondensator CK wird von der Überlagerung der Gleich- und der Wechselspannung U + UN beansprucht. Diese Schaltung n-stufig fortgesetzt, wie in Bild 25-15c gezeigt, wird Greinacher-Kaskade genannt und dient zur Erzeugung hoher Gleichspannungen. Spannungsvervielfacherschaltungen haben einen hohen ausgangsseitigen Innenwiderstand, der auf die kapazitive Zuführung der Netzspannung UN zurückzuführen ist. 25.2.3 Mischer und Demodulatoren
Das nichtlineare Diodenverhalten wird auch zur Frequenzumsetzung von Signalbändern in Modulationsschaltungen genutzt. Im einfachsten Fall nach Bild 25-16 wird dazu der Signalspannung Us eine monofrequente Trägerspannung Ut Us überlagert und eine Diode verwendet, die im Aussteuerbereich um ihren Arbeitspunkt (UA , IA ) einen möglichst quadratischen Kennlinienverlauf besitzt. Dann gilt für den nichtlinearen Spannungsanteil UL am Lastwiderstand RL UL = IRL = IA RL ((U0 + Us cos (2π fs t) + Ut cos (2π ft t))/UA )2
(25-12)
Nach Abtrennen der Gleichstromkomponente mit dem Koppelkondensator CK und trigonometrischen Umformungen ergibt sich für die Ausgangsspannung U = K Us Ut (cos (2π( fs + ft ))t √ + cos (2π( fs − ft )t)) + (Us / 2) cos (4π fs t) √ (25-13) +(Ut / 2) cos (4π ft t) ,
Bild 25-15. Schaltungen zur Spannungsvervielfachung
Bild 25-16. Diodenmodulatorschaltung
25 Analoge Grundschaltungen
wobei der Vorfaktor K Konversionskonstante genannt wird. Es entstehen neben der doppelten Signal- und Trägerfrequenz zwei proportionale Seitenbandspektren bei fs + ft und bei fs − ft von denen eines durch selektive Filterung hervorgehoben, das andere unterdrückt wird. Dieser als Mischung bezeichnete Vorgang wird zur Frequenztransponierung benutzt. Mit dem gleichen Verfahren kann auch eine Demodulation amplitudenmodulierter Signale vorgenommen werden, wenn dem Empfangssignal Us das Trägersignal Ut aufgemischt wird und am Ausgang durch Tiefpassfilterung eine Signalbandbegrenzung erfolgt. Diese Anordnung erfordert ein Trägersignal und ist deshalb zur Einseitenbanddemodulation bei unterdrücktem Träger geeignet. Sie wird als Synchrondemodulator bezeichnet. Der Demodulatoraufwand kann durch Verzicht auf den Trägergenerator und die Vorspannungsquelle so vermindert werden, dass die Gleichrichterschaltung von Bild 25-12 entsteht. Die verzerrungsarme Demodulation erfordert zur Mischung des Empfangssignales Us =ˆ UN , dass in ihm ein hinreichend großer Trägeranteil enthalten ist. Der zusammen mit dem Innenwiderstand der Anordnung auf die Signalbandgrenze fs, max bemessene Ladekondensator CL dient dann der Tiefpassfilterung. In der modernen Empfangstechnik im GHz-Bereich werden allerdings hauptsächlich Mischer auf der Basis der Gilbertzelle verwendet, die sich aus einem Differenzverstärker mit Transistoren ableitet; vgl. die weiterführende Literatur und insbesondere die Monographie von Razavi [13].
25.2.4 Besondere Diodenschaltungen
Das Sperrverhalten von Dioden wird nach Bild 25-17a durch die Stromzunahme im ZenerBereich bestimmt. Die Grenze wird für Gleichrichterdioden als Spannung Uzd bei dem Strom I = 1 mA angegeben. Dioden für größere Ströme im Zener-Bereich mit kleinem differenziellen Widerstand Rz = dUz /dIz werden als Z-Dioden bezeichnet (siehe 27.2.4). Sie dienen zur Erzeugung von Referenzspannungen und zur Überspannungsbegrenzung. Durch Vorschalten eines Widerstandes R nach Bild 25-17b kann eine Spannungsänderung ΔU0 mit der Z-Diode ZD auf den Wert ΔUz vermindert werden, wenn der Vorwiderstand R > Rz gewählt wird. Bild 25-17a zeigt, wie über den Widerstand R = dU/dI die Spannungsgrenzwerte U0, max und U0, min zu gewinnen sind. Das Ersatzbild einer Z-Diode ZD besteht nach Bild 25-17c aus einer Gleichspannungsquelle Uz, d mit vorgeschaltetem Zenerwiderstand Rz . Kurzzeitig überlastungsfeste Z-Dioden werden als Suppressordioden (TAZ, transient absorption zener) bezeichnet und dienen dem Schutz elektronischer Schaltungen durch Ableitung von Strömen bis zu I = 100 A bei Anstiegszeiten von wenigen Pikosekunden. Thyristoren sind steuerbare Dioden, bei denen durch einen Steuerstrom Is in einer zusätzlichen Elektrode bei positiven Spannungen U wahlweise eine Öffnung oder Sperrung erfolgen kann (siehe 27.4.1). Das Unterbrechen des Stromes erfordert die Unterschrei-
Bild 25-17. a Zenerverhalten von Dioden, b; c Er-
satzbild
G123
G124
G Elektrotechnik / Elektronik
Bild 25-18. a Thyristorkennlinie und b Sicherungsschal-
tung
Bild 25-20. a Kapazitätsdiodenkennlinie und b Varaktor-
schaltung
tung eines Haltestrom Ih genannten Mindestwertes: I < Ih . Der Kennlinienverlauf Bild 25-18a weist für U > 0 eine steuerstromabhängige Verzweigung für den Grenzwert Is0 auf. Thyristoren werden als elektronische Schalter eingesetzt, z. B. in Überspannungssicherungen nach Bild 25-18b. Bei einem Anstieg der Ausgangsspannung Ua über Summe aus Zenerspannung Uz der Z-Diode ZD und Schleusenspannung US der Steuerelektrode wird der Thyristor Th geöffnet und die vorgeschaltete Sicherung Si ausgelöst oder die Ausgangsspannung Ua an einem Vorwiderstand Rv < (U0 − US )/Ih abgesenkt. Dioden mit bereichsweise fallenden Kennlinien, wie z. B. die von Tunneldioden nach Bild 25-19a, erlauben eine Entdämpfung und bei resonanzfähiger Beschaltung mit einem LC-Reihenkreis nach Bild 25-19b kann eine stabile nichtlineare
Schwingung erregt werden; Einzelheiten siehe 25.3.3. Der Arbeitspunkt A wird dann bei sehr niedrigem Innenwiderstand R0 der Gleichspannungsquelle U0 instabil; vgl. 8.3.2. Die Sperrschichtkapazität von Dioden ist nach Bild 25-20a spannungsabhängig, was zur elektronischen Abstimmung von Resonanzkreisen genutzt wird. Wegen des nichtlinearen Zusammenhanges C = f (U) können aus Verzerrungsgründen jedoch nur kleine Wechselspannungsamplituden zugelassen werden. Die Trennung der Steuerspannung Us von der Signalspannung des abzustimmenden Schwingkreises kann am einfachsten durch die gegensinnige Reihenschaltung zweier Kapazitätsdioden (KD) nach Bild 25-20b erreicht werden.
25.3 Aktive Dreipole (Transistoren) Zur Verstärkung von Signalen höherer Änderungsgeschwindigkeit sind trägheitsarm elektronisch steuerbare Bauteile erforderlich, die für eine stabile Betriebsweise über hinreichend entkoppelte Ein- und Ausgänge verfügen müssen. Einzelbauteile dieser Art werden als Transistoren (siehe 27.3) bezeichnet. 25.3.1 Transistorverhalten
Bild 25-19. a Tunneldiodenkennlinie und b Oszillatorschal-
tung
Gesteuerte Verstärkung lässt sich elektronisch durch Stromsteuerung zweier ladungsgekoppelter Diodenstrecken erzielen. Diese Anordnung wird Bipolartransistor genannt. Das Klemmenverhalten ist durch den zum Steuerstrom IB in der Basis B proportionalen, je-
25 Analoge Grundschaltungen
doch vom Potenzial des Kollektors C weitgehend unabhängigen Kollektorstrom IC , der in Sperrrichtung betriebenen Steuerstrecke C–E, sowie dem Impedanzverhalten der in Durchlassrichtung betriebenen BasisEmitter-Strecke B–E bestimmt. Transistoren werden meist im Strombereich IB IS betrieben, sodass sich mit (25-9) der Zusammenhang IC = β0 IB ≈ β0 IS eUBE /UT
(25-14)
ableiten lässt. Der Faktor β0 = IC /IB wird als Stromverstärkung bezeichnet. Die Temperaturspannung UT ist für Siliziumtransistoren etwa UT = 40 mV. Typische Kennlinienverläufe IB = f (UBE ) und IC = f (IB ) sind in Bild 25-21 für NPN-Transistoren dargestellt und ein für Aussteuerung mit kleinen Signalamplituden günstiger Arbeitspunkt A ist eingetragen. Die entsprechenden Werte für PNP-Transistoren unterscheiden sich nur durch entgegengesetztes Vorzeichen aller Ströme und Spannungen. Das frequenzabhängige Übertragungsverhalten von Bipolartransistoren wird vor allem durch die Impedanz der Basis-Emitter-Diode bestimmt, deren Verhalten durch das in Bild 25-22a gezeigte RC-Netzwerk angenähert werden kann und den Eingangsleitwert Y = 1/(Rb + 1/(j · 2π f Ce + 1Re ))
(25-15)
Im Arbeitspunkt IC = IC, A ergibt sich aus (25-14) der Zusammenhang S = dIC /d UBE = β0 Is (eUBE /UT )/UT = IC, A /UT (25-17) und damit das Ersatzbild 25-22b. Die Gleichungen (25-16) und (25-17) zeigen, dass die dynamischen Kenngrößen Y0 und S = β0 Y0 eines Bipolartransistors aus seinen statischen Betriebsströmen im Arbeitspunkt IB, A oder IC, A = β0 IB, A und der Stromverstärkung β0 ermittelt werden können. Feldeffektgesteuerte Transistoren (FET) können in vier Gruppen eingeteilt werden, die sich nicht nur durch die Polarität des steuerbaren Strompfades zwischen Source S und Drain D, sondern auch dadurch unterscheiden, ob das Gate G als in Sperrrichtung betriebene Diode (Sperrschicht-FeldeffektTransistor JFET) oder als vollisolierte Feldelektrode, (Isolierschicht-Feldeffekt-Transistor, IGFET, auch MOSFET) ausgeführt ist [3]. Bild 25-23 zeigt die vier Stromabhängigkeiten, für die der einheitliche Zusammenhang 2 ID = ID0 /Up2 UGS − Up , (25-18) gilt, wenn als Pinch-off-Spannung Up die dem Transistortyp entsprechende Bedingung Upp U Upn
liefert. Der Anfangswert Y0 = Y( f → 0) = 1(Rb + Re ) kann auch aus (25-14) durch Differenziation im Arbeitspunkt an der Stelle IB = IB, A gewonnen werden: Y0 = dIB /dUBE = Is (eUBE UT )/UT = IB, A /UT . (25-16) Für ein- und ausgangsseitig parallelgeschaltete Impedanzen ist die Umwandlung der Stromverstärkung β0 in den Leitwertparameter der Steilheit S vorteilhaft.
Bild 25-21. Stromkennlinien eines Bipolartransistors
Bild 25-22. Leitwertersatzbilder von Transistoren, mit a Stromverstärkung β0 und b Steilheit S
Bild 25-23. Drainstromkurven von Feldeffekttransistoren
(FET)
G125
G126
G Elektrotechnik / Elektronik
erfüllt wird. Feldeffekttransistoren werden meist mit dem Ersatzbild 25-22b beschrieben, wobei der Eingangsleitwert Y = j · 2πfCe kapazitiv und die Steilheit S = dID /dUGS = 2 ID0 /Up2 (UGS, A − Up ) ? = 2 ID0 ID, A |Up | (25-19) proportional der Gate-Source-Spannung UGS, A im Arbeitspunkt ist und von der Wurzel des Drainstromes ID, A abhängt. 25.3.2 Lineare Kleinsignalverstärker
Die Einstellung von Arbeitspunkten wird durch Temperaturabhängigkeit und damit vom Leistungsumsatz im Halbleiter beeinflusst. Für übliche Transistoren mit Stromverstärkungen β0 = IC /IB 10 und damit IC ≈ IE ist die Kollektorverlustleistung QC = UCE IC = (U0 − IE RE − IC RC )IC = U0 IC − IC2 (RE + RC )
(25-20)
die bestimmende Größe. Die Stabilität ist gesichert, wenn sich diese Leistung unabhängig von der Aussteuerung ist, also der Differenzialquotient dQC /dIC im Arbeitspunkt IC, A verschwindet. RE + RC = U0 /2IC, A .
Bipolartransistor kann hinsichtlich des Gleichstromverhaltens mit zwei Fixatoren modelliert werden: ein Fixator zwischen Basis- und Emitter-Klemme (legt UBE und IB fest), und ein Fixator zwischen Kollektor- und Emitter-Klemme (legt UCE und ID fest). Die Werte dieser Ströme und Spannungen können aus einem Datenblatt des entsprechenden Transistors übernommen werden. Danach kann man die Netzwerkgleichungen (bei Nullsetzen aller Wechselstrom- und Wechselspannungsquellen) des Netzwerkes in üblicher Weise aufstellen, wobei die Werte der Widerstände die unbekannten Größen sind. Gegebenenfalls müssen noch zusätzliche Bedingungs(un)gleichungen hinzugefügt werden wie z. B. die Größe des Querstromes eines Spannungsteilers; vgl. die obenstehenden Betrachtungen. Diese systematische Methode eignet sich besonders dann, wenn es sich um Netzwerke mit mehreren Transistoren handelt, die gleichstrommäßig gekoppelt sind; vgl. die weiterführende Literatur und insbesondere das Buch von Vago [14]. Das Übertragungsverhalten von Transistorstufen nach Bild 25-24 kann unter Verwendung des Ersatzbildes 25-22b durch Bild 25-25 beschrieben werden, bei dem die Versorgungsquelle U0 als Wechselstromkurzschluss zu betrachten ist. Das als Verstärkung
(25-21)
Die Basis-Emitter-Spannung von Bipolartransistoren weist eine Temperaturabhängigkeit von etwa 2 mV/K auf, sodass die Reduktion der dadurch bedingten Stromänderung auf 1/10 bei einer Übertemperatur von etwa 100 K näherungsweise einen statischen Spannungsabfall von 2V am Emitterwiderstand RE = 2 V/IC, A erfordert. Damit ergibt sich für den Kollektorwiderstand RC = (U0 − 4 V)/2IC, A . Der Querstrom It im Spannungsteiler Rt1 und Rt2 sollte It 10IB sein und die Betriebsspannung U0 mindestens 5 V betragen. Eine systematische Arbeitspunktfestlegung von Transistorschaltungen kann mithilfe des Fixators durchgeführt werden. Bei diesem Netzwerkelement handelt es sich um einen Zweipol, bei dem Strom und Spannung festgelegt sind – also gewissermaßen um eine Strom- und Spannungsquelle zugleich. Ein
Bild 25-24. Zur Stabilisierung von NPN- und PNP-
Transistoren
Bild 25-25. Wechselstromersatzbild der Bipolartransistorschaltungen nach Bild 25-24
25 Analoge Grundschaltungen
bezeichnete Verhältnis von Ausgangs- zu Eingangsspannung wird damit v = Ua /Ue = −S ZC /(S + Y)ZE .
(25-22)
Für den praktischen Fall von Stromverstärkungen β0 > 10 ist S Y und damit die Spannungsverstärkung v = −ZC /ZE nur von den Impedanzen ZC und ZE , nicht jedoch von Transistorkennwerten S , Y und β0 abhängig. Diese Art der Schaltungsbemessung erlaubt den exemplar- und typunabhängigen Einsatz von Transistoren in Verstärkerschaltungen. Mit steigender Aussteuerung ergeben sich zunehmende Verzerrungen, die in vielen Fällen den nutzbaren Signalbereich begrenzen. Eine Gegenkopplung über passive lineare Bauteile vermindert diese Einflüsse. Die bevorzugte Anordnung besteht in einer wechselstrommäßig nicht überbrückten Gegenkopplungsimpedanz ZE am Emitter- bzw. Sourceanschluss. Bild 25-26 zeigt das Verhalten einer solchen Stufe mit N-Kanal-Sperrschicht-FET. Die Steuerspannung UGS des Transistors ergibt sich als Differenz der Eingangsspannung Ue und der Gegenkopplungsspannung Ug , sodass sich der Drainstrom ID = f (UGS ) des Transistors auf den Wert ID = f (Ue ) der Anordnung vermindert, wie die obere Bildhälfte zeigt. Der verstärkungsbestimmende Kennwert der Steilheit wird im Gegenkopplungsfall Sg = dID /dUe = S /(1 + SRg ) = 1/(Rg + 1/S ) ,
(25-23)
er weist zwar eine geringere Größe, dafür aber eine kleinere Änderung auf, wie der untere Bildteil von 25-26 zeigt. Für die Bemessung Rg 1/S wird die Steilheit Sg ≈ 1/Rg und damit für Signalwerte Ue > 0 von der Aussteuerung und dem Transistorkennwert S weitgehend unabhängig. Die Zusammenschaltung zweier Transistoren in der Schaltung von Bild 25-27a liefert mit der Kopplung über den gemeinsamen Emitterwiderstand RE eine Verstärkeranordnung mit zwei Eingängen, die als Differenzverstärker bezeichnet wird. Transistoren T1 und T2 mit gleicher Steilheit S führen bei Vernachlässigung des Eingangsleitwertes Y auf das Wechselstromersatzbild 25-27b. Für unterschiedliche Eingangssignale Ue1 und Ue2 kann daraus das Differenzverstärkung genannte Übertragungsverhalten vD = Ua /(Ue1 − Ue2 ) = −SRC (Ue2 − UE )/(Ue1 − Ue2 ) = −SRC (Ue2 − (Ue1 + Ue2 )/2(1 + 1/2S RE))/ (25-24) (Ue1 − Ue2 ) gewonnen werden. Wird die Gegenkopplung SRE 1 gewählt, so ergibt sich vD = SRC . Werden dagegen beide Eingänge mit dem gleichen Signal Ue1 = Ue2 beaufschlagt, so ergibt sich unter den gleichen Voraussetzungen das Gleichtaktverstärkung genannte Übertragungsverhalten vG = SRC /(1 + 2SRE ) ≈ RC /2RE .
(25-25)
Durch die Bemessung SRE 1 kann mit dieser Schaltung ein großes Verhältnis vD /vG erreicht und damit können Gleichtaktstörsignale von Gegentaktnutzsignalen getrennt werden. Transistoren für große Kollektorströme verfügen nur über kleine Stromverstärkungen. Dieser Nachteil lässt sich für NPN- wie auch PNP-Transistoren mit einer
Bild 25-26. Zur Verzerrungsverminderung durch Gegenkopplung, Beispiel N-Kanal-Sperrschicht-FET-Schaltung
Bild 25-27. a Differenzverstärkerschaltung mit b Ersatzbild
G127
G128
G Elektrotechnik / Elektronik
Darlington-Schaltung genannten Anordnung zweier Transistoren nach Bild 25-28a ausgleichen. Das zugehörige Ersatzbild 25-28b führt auf die Stromverstärkung der Gesamtanordnung β = IC /IB = β1 β2 + β1 + β2 ≈ β1 β2 ,
(25-26)
wenn β1 1 und β2 > 1 gilt. Werden mehrere Transistorverstärkerstufen zu Erhöhung der Verstärkung nach Bild 25-29a hintereinandergeschaltet, so bezeichnet man diese Anordnung als Kaskaden- oder Kettenschaltung. Die arbeitspunktstabilisierende Gegenkopplung des Emitterwiderstandes RE kann in der gezeigten Weise wechselstrommäßig durch einen parallelgeschalteten Kondensator CE unwirksam gemacht werden. Für seine Bemessung muss die Impedanz ZE nach Ersatzbild 25-29b für diesen Schaltungsteil so gewählt werden, dass der
Bild 25-28. a Darlington-Schaltungen mit b Ersatzbild
Bild 25-29. Ausschnitt aus einer Verstärkerkette. a Schaltung, b zur Bemessung der Emitterkombination und c Wechselstromersatzbild
Spannungsabfall UE an ihr klein gegen die Steuerspannung U des betreffenden Transistors bleibt. |UE |/U = (S + Y)ZE ? = (S + Y) (1/RE )2 + (ωC)2 1 . (25-27) Die Nebenbedingung ωCRE 1 ergibt für Transistoren größerer Stromverstärkung β 1 und damit Steilheit S Y aus (25-25) die Bemessungsvorschrift ωC S , sodass die Eckfrequenz fg = 1/2πSC beträgt. Die in Bild 25-29a abgegrenzte Verstärkerstufe hat dann bei Frequenzen f fg entsprechend dem Wechselstromersatzbild 25-29c die Verstärkung v = Ua /Ue = −S /(Y + 1/RC ) , (25-28) wenn der punktiert eingetragene Koppelkondensator CK die Bedingung CK Y/2π f erfüllt. Für den Arbeitswiderstand RC 1/Y ergibt sich die Maximalverstärkung vmax = −S /Y. Sie ist von der Belastung durch den Eingangsleitwert Y des Folgetransistors abhängig. Dieser Nachteil kann durch Einfügen einer Emitterfolger genannten Schaltung nach Bild 25-30a vermieden werden. Die Anordnung enthält einen zusätzlichen Transistor T2, bei dem das Ausgangssignal Ua an der Emitterklemme E abgegriffen wird. Das Ersatzbild mit beiden Transistoren zeigt Bild 25-30b. Die Verstärkung wird danach v = Ua /Ue = −S1 RC /(1 + (1 + Y2 RC )/(S2 + Y2 )RL ) . (25-29) Sind die Bedingungen S2 Y2 und Y2 RC 1 erfüllt und wird der Lastwiderstand RL 1/S2 bemessen, so ist die Verstärkung v = −S1 RC vom Lastwiderstand RL unabhängig.
Bild 25-30. Verstärkerstufe mit Emitterfolger. a Schaltung und b Wechselstromersatzbild
25 Analoge Grundschaltungen
25.3.3 Lineare Großsignalverstärker (A- und B-Betrieb) und Sinusoszillatoren
Die in einer RC-Verstärkerschaltung auftretende größte Ausgangsspannungsamplitude wird durch den Wert der Versorgungsspannung U0 bestimmt und bewirkt als Produkt mit dem in der Stufe geführten Strom die in Wärme umgesetzte Verlustleistung Qv . Transistoren unterliegen hinsichtlich ihrer Spannungsfestigkeit Umax , ihrer Stromergiebigkeit Imax und ihrer zulässigen Verlustleistung Qv Grenzen, die in das Ausgangskennlinienfeld I = f (U), Bild 25-31, eingetragen werden können. Bei kollektor- bzw. drainseitigem Arbeitswiderstand R und Speisung aus einer Versorgungsquelle U0 kann der Zusammenhang U = f (I) = U0 − RI auf der als Arbeitsgerade bezeichneten Kurve abgegriffen werden. Der Transistor wird bei symmetrischer Aussteuerung zwischen dem Sättigungspunkt G und dem Sperrpunkt B am besten genutzt, wenn der Arbeitspunkt A in der Mitte der Arbeitsgerade bei dem Wert U0 /2 liegt und an dieser Stelle die Verlustleistungshyperbel Q = U02 /4R tangiert wird. Diese Betriebsweise heißt A-Betrieb. Um eine Überlastung bei fehlender Ansteuerung zu vermeiden, darf in diesem Betriebszustand höchstens die Grenzleistung Q = Qv erreicht werden. Bei Vollaussteuerung und sinusförmigem Spannungsund Stromverlauf ergibt sich näherungsweise die entnehmbare Wechselstromleistung T "T " 2 sin2 t dt PA = (1/T ) UI dt = U0 /RT 0
0
(25-30) = U02 /8R = Q/2 als halbe Ruheleistung. Wird dagegen der Arbeitspunkt des Transistors im Sperrpunkt B in der Nähe der Versorgungsspan-
Bild 25-31. Zur Aussteuerung eines Großsignalverstärkers
nung U0 gewählt, so ergibt sich bei Vollaussteuerung mit sinusförmigen Halbwellen "T PB = (2/T )
UI dt = 2PA 0
= U02 /4R = Q
(25-31)
die doppelte Leistung und damit eine bessere Ausnutzung, die jedoch durch die Nichtumkehrbarkeit des Ausgangsstromes erkauft wird. Eine entgegengerichtete Stromaussteuerung kann durch einen gegensinnig betriebenen weiteren Transistor erreicht werden. Man spricht vom Gegentakt-B-Betrieb, dessen Übertragungsverhalten linear ist, aber das Umschalten von einem Transistor auf den anderen ein nichtlinearer Prozess ist. In realen Schaltungen kommt es daher zu sogenannten Übernahmeverzerrungen im Umschaltpunkt (Arbeitspunkt B), wobei die nichtlinearen Verzerrungen ansteigen, wenn sich das Eingangssignal verkleinert. Schaltungstechnisch wird der Gegentakt-B-Betrieb im einfachsten Falle durch Reihenschaltung eines komplementären Transistors realisiert, was Bild 25-32a zeigt. Diese Anordnung wird als Gegentakt-B-Komplementärstufe bezeichnet. Der Widerstand Rd dient der Einstellung des Arbeitspunktes und erlaubt, die Sperrströme zu kompensieren, sodass sich bei gleichen Kennwerten die Arbeitskennlinien nach Bild 25-32b verzerrungsarm zusammenfügen. Durch Verwendung eines Widerstandes Rd mit negativem Temperaturkoeffizienten (NTC) kann einer vom Leistungsumsatz abhängigen Arbeitspunktverlagerung entgegengewirkt werden. Der Koppelkondensator CK sperrt den Gleichstromweg
Bild 25-32. Komplementär-Gegentakt-B-Stufe. a Schaltung und b Ausgangskennlinienfelder
G129
G130
G Elektrotechnik / Elektronik
zum Lastwiderstand RL . Die beiden sequentiell eingeschalteten Transistoren T1 und T2 werden in dieser Anordnung im Hinblick auf einen kleinen ausgangsseitigen Innenwiderstand als Emitterfolger betrieben. In der Brückenverstärkerschaltung Bild 25-33 sind zwei gleichartige Gegentakt-B-Stufen symmetrisch zum Lastwiderstand RL zusammengeschaltet, sodass der Koppelkondensator entfallen kann und mit einem Differenzsignal an den Eingängen beliebig langsame Signaländerungen übertragen werden können. Die Übernahmeverzerrungen sind beim reinen Gegentakt-B-Betrieb insbesondere für Audioverstärker allerdings unvertretbar groß, sodass man den Arbeitspunkt in beiden Transistoren in Richtung A-Betrieb verschiebt. Dadurch erhöht sich der Ruhestrom ein wenig, aber die Übertragungskennlinie des Verstärkers wird „linearisiert“. Man spricht dann vom Gegentakt-AB-Betrieb; vgl. weiterführende Literatur [4]. Verstärkeranordnungen nach Bild 25-34, die über eine Signalrückführung vom Ausgang zum Eingang verfügen, können sich bei entsprechender Bemessung stabile Schwingungen ausführen, die unabhängig von den Anfangsbedingungen der Schaltung sind. Das man nur verständlich machen kann, wenn nichtlineare Eigenschaften der Schaltungen in die Betrachtungen einbezogen werden. Eine notwendige Bedingung dazu ist, dass ein Paar von Systemeigenschwingungen der linearisierten Schaltung auf der imaginären Achse liegt, was u. a. mithilfe der sogenannten Barkhausen’schen Schwingbedingung
analysiert werden kann. Dazu wird das Netzwerk in zwei Teile zerlegt und das Klemmenverhalten der rückgekoppelten Gesamtschaltung untersucht. Bei hinreichend hohem Verstärkereingangswiderstand Ze = Ue /Ie kann mit der gestrichelt gezeichneten Verbindung für U = Ue die Schwingbedingung sehr einfach abgeleitet werden, wenn der Verstärker mit der Verstärkung Ua /Ue = v ejϕv die Dämpfung des Koppelnetzes mit dem Koppelfaktor U/Ua = k ejϕk auszugleichen vermag. Mithilfe der komplexen Bedingungsgleichung können nach Barkhausen (Ua /Ue )(U/Ua ) = 1 = vk ej(ϕv +ϕk )
(25-32)
die Schaltungsparameter so bestimmt werden, dass ein Paar von Systemeigenschwingungen auf der imaginären Achse liegen. Wird die Schaltungen mithilfe von Zustandsgleichungen beschrieben, dann kann man auch die Systemeigenwerte der Systemmatrix untersuchen. Die Betragsbedingung kv = 1 und die Phasenbedingung ϕv + ϕk = 2nπ werden bei niederen Frequenzen oder für pulsförmige Schwingungen meist über RC-Glieder, bei höheren Frequenzen und für harmonische Schwingungen meist über einen LC-Schwingkreis oder piezomechanische Resonanzen (Schwingquarz) im Kopplungsvierpol erfüllt. Die Barkhausensche Bedingung als auch die anderen Kriterien sind für das Auftreten einer Schwingung nur notwendige aber nicht hinreichende Bedingungen. Wenn man die Schwingamplitude und deren Stabilität ermitteln möchte, dann muss man alle Voraussetzungen des Satzes von Andronov und Hopf berücksichtigen und eine analytische Störungsrechnung oder Simulationen verwenden [5], wobei die Nichtlinearitäten der Schaltung einbezogen werden müssen. Mit der Methode der Beschreibungsfunktion (siehe Abschnitt I Regelungs- und Steuerungstechnik) kann man zeigen, dass eine zunehmenden Aussteuerung der Nichtlinearität zu einer abnehmenden mittleren Verstärkung v = f (U) und in bestimmten Fällen auto-
Bild 25-33. Schaltung eines Brückenverstärkers
Bild 25-34. Zur Erläuterung der Schwingbedingung
Bild 25-35. Oszillatorschaltungen, Beispiele: a RCOszillator und b LC-Oszillator
25 Analoge Grundschaltungen
Bild 25-36. Ersatzbilder für nichtlineares Transistorverhalten. a Diodenersatzbild allgemein und Ersatzbilder für b den aktiv normalen Betrieb; c den Sperrzustand und d den Sättigungszustand mit Vereinfachung e
matisch zur Einhaltung der zugehörigen Schwingamplitude U führt; weitere Einzelheiten kann man der weiterführenden Literatur und insbesondere der Monographie von Kurz und Mathis [5] entnehmen. Klassische Oszillatorschaltungen dieser Art sind z. B. der Phasenschieberoszillator nach Bild 25-35a, bei dem die Frequenzeinstellung meist durch gleichlaufende Veränderung der beiden Widerstände R vorgenommen wird, und der Meißneroszillator nach Bild 25-35b mit transformatorischer Phasenumkehr und Abstimmung über die Schwingkreiskapazität C. Die Schwingamplitude der Oszillatorschaltungen wird in a) durch eine automatische Verstärkungsregelung mit (nichtlinearer) Signalgleichrichtung mit Dioden bzw. b) durch die Eigenschaften der Nichtlinearität der Basis-Emitter-Strecke des Transistors festgelegt (siehe 25-36a). Moderne Sinusoszillatoren im GHz-Bereich arbeiten auf der Basis eines Differenzverstärkers; vgl. z. B. die Monographie von Razavi [13]. 25.3.4 Nichtlineare Großsignalverstärker, Flip-Flop und Relaxationsoszillatoren
Mit hinreichend großen Ansteueramplituden kann ein Transistor zwischen voller Öffnung und Sperrung durchgesteuert werden und damit in den mit G
und B bezeichneten Zuständen in Bild 25-31 verharren. Die Betrachtung erfordert dann die Berücksichtigung nichtlinearer Zusammenhänge. Für einen NPN-Transistor ergibt sich für den linearen Verstärkerbetrieb das Ersatzbild in Bild 25-36a, das aus dem Ersatzbild in Bild 25-22b dadurch entsteht, dass der Eingangsleitwert Y durch die spannungsabhängige Basis-Emitter-Diode DBE ersetzt und die Basis-Kollektor-Diode DBC eingefügt wird. Für PNP-Transistoren sind die Richtungen aller Ströme und Spannungen wie auch die Polarität der beiden Dioden umzukehren. Wird das Diodenverhalten nach Näherung B von Abschnitt 25.2.1 mit Durchlasswiderstand Rd und Schleusenspannung US angenähert, so führt dies zu drei unterschiedlichen Ersatzbildern. Für den aktiv normalen Betrieb auf der Arbeitsgeraden gilt Bild 25-36b: UBE und UCE − UBE > US ; DBE → Rd ; DCE → Rs ; für den Sperrzustand gilt Bild 25-36c: UBE und UBE − UCE < US ; DBE und DBC → Rs ; und für den Sättigungszustand gilt Bild 25-36d: UBE und UBE − UCE > US ; DBE und DBC → Rd . Bei Sättigung ist die Kollektor-Emitter-Spannung UCE US , sodass die beiden Dioden DBE und DBC näherungsweise parallelgeschaltet sind und das Ersatzbild 25-36d in das Bild 25-36e überführt werden kann. Diese nichtlineare Betriebsweise wird vor allem zur Hochfrequenz- und Pulsverstärkung genutzt, da dann der Arbeitspunkt entsprechend Bild 25-37a von B nach C in den Sperrbereich des Transistors verlagert und so die stromführende Betriebszeit weiter verkürzt werden kann. Die Arbeitsgerade überschneidet die Verlustleistungshyperbel Qv . Trotzdem kann die mittlere Kollektorverlustleistung "T QC = (1/T )
UCE (t)IC (t) dt Qv
(25-33)
0
im Rahmen der thermischen Integrationsfähigkeit des betreffenden Transistors unter dem zulässigen
G131
G132
G Elektrotechnik / Elektronik
Bild 25-37. C-Betrieb eines Transistorverstärkers mit a Ausgangskennlinienfeld und b dem Ausgangsspannungsund Stromverlauf der Schaltungsanordnung des Sendeverstärkers c
Grenzwert Qv bleiben. Bei harmonischer Ansteuerung treten dann Stromimpulse IC (t) der Dauer τ < T/2 auf, wie Bild 25-37b zeigt. Sinusförmige Schwingungen UCE (t) am Ausgang werden mit einem LC-Schwingkreis am Kollektoranschluss in der Anordnung nach Bild 25-37c erreicht. Dieser √ Kreis wird meist auf die Frequenz f0 = 1/2π LC abgestimmt, kann aber auch auf eine ungerade Harmonische (2n + 1) f0 eingestellt werden. Die Anordnung Bild 25-37c wird als Sendeverstärker, seine Arbeitspunkteinstellung weit im Sperrbereich als CBetrieb bezeichnet. Wird eine solche Verstärkerstufe ohne ausgangsseitigen Resonanzkreis betrieben, so stellt sich am Lastwiderstand RL bei Aussteuerung bis an den Sättigungspunkt G ein trapezförmiger Spannungs- und Stromverlauf mit der Anstiegs- und Abfallzeit Δt nach Bild 25-38b ein. Im Kollektor des Transistors wird dabei die Leistung QC umgesetzt, die einen parabelförmigen Zeitverlauf QC (t) und damit den zeitlichen Mittelwert "T ! QC = (2/T ) UCE (t)IC (t) dt 0
" /CE/ =2 U (t/Δt)(1 − t/Δt) dt IC /T T
0
/CE/ =2 U IC /T [(t2 /2Δt) − (t3 /3Δt2 )] /CE/ =U IC Δt/3T
(25-34)
Bild 25-38. Verhalten eines Verstärkers im D-Betrieb. a Eingangs- und b Ausgangsspannungsverlauf und c die daraus abgeleitete Verlustleistung
aufweist. Um eine Überlastung des Transistors zu vermeiden, darf dieser Wert den zulässigen Grenzwert Qv nicht überschreiten. Diese zur Verstärkung von Impulsen variabler Breite (Pulslängen-modulierte (PLM-) Signale) bevorzugte Art der Transistoraussteuerung wird D-Betrieb genannt; man spricht auch Pulsweitenmodulation (PWM) oder von Pulsdauermodulation (PDM). Im einfachsten Fall kann ein gesteuerter Schalter verwendet werden, der zu einem idealen Wirkungsgrad von 100% führt. Das Klasse-D-Verstärkerprinzip wird aufgrund seines hohen realen Wirkungsgrades von mehr als 90% neuerdings auch bei Audioleistungsverstärkern eingesetzt. Die PLM-Signale müssen natürlich wieder in analoge Signale umgesetzt werden, wofür nur sehr verlustarme LC-Tiefpassfilter geeignet sind. Demnach benötigt man ein Modulationsverfahren, bei dem das abgetastete analoge Eingangssignal in ein PLM-Signal überführt wird, wobei das analoge Signal nach Tiefpassfilterung möglichst störungsfrei zurückgewonnen werden kann. Vielfach verwendet man einen Pulsweiten-(PWM-)Modulator, mit dem die Amplitudenproben direkt in eine Pulslänge überführt wird. Ein störungsarmes analoges Ausgangssignal kann nur dann konstruiert werden, wenn
25 Analoge Grundschaltungen
die Schaltfrequenz ca. 7-fach über der höchsten (Audio-)Bandgrenze liegt, was u. a. zu Verlustleistungserhöhung und EMV-Problemen führen kann. Mit dem ZePoC-Verfahren steht jedoch ein alternatives Modulationsverfahren zur Verfügung, welches diese Nachteile stark reduziert; vgl. weiterführende Literatur [15]. Werden zwei derartige nichtlineare Verstärkerstufen nach Bild 25-39a in Kette geschaltet, wie Bild 25-39a zeigt, so verläuft der Zusammenhang zwischen Ausund Eingangssignal Ua = f (Ue ) nach Bild 25-39b treppenförmig, da der Transistor T2 aussteuerungsabhängig in den Sättigungs- und Sperrzustand gelangen kann. In dem Übergangsbereich zwischen diesen Betriebszuständen sind beide Transistoren T1 und T2 im aktiv normalen Betrieb, sodass das Ersatzbild 25-39b gilt. Bei gleichen Kennwerten beider Transistoren wird damit U0 − β0 RC (U0 − US − β0 RC × (Ue − US )/Rd ) . RC + Rd (25-35) Die Grenzen der Gültigkeit dieser Beziehung sind die Ausgangsspannungen Ua = 0 und Ua = U0 und damit bei hinreichend hoher Stromverstärkung β0 1 Ua =
Bild 25-39. a Flipflop-Schaltung mit b Übergangsverhalten
und c Ersatzbild
und Versorgungsspannung U0 US die zugehörigen Eingangsspannungen Ue1, e2 = US ± (U0 − US )/β0 RC /Rd .
(25-36)
Wird in der Schaltung Bild 25-39a die strichpunktierte Verbindung zwischen Ein- und Ausgang hergestellt, so führt dies auf die Zusatzbedingung Ua = Ue , und es können nur noch die drei Punkte O, L oder S eingenommen werden. Da es sich um einen rückgekoppelten schwingfähigen Analogverstärker handelt, ist der Betriebspunkt L ein instabiler Zustand, von dem aus die Anordnung sofort in den Punkt O oder S umschlägt, wenn sie sich selbst überlassen wird. Wegen ihres umsteuerbaren in zwei stabilen Zuständen verharrenden Verhaltens wird sie Flipflop-Schaltung genannt und bildet das Grundelement aller statischen digitalen Speicherschaltungen; vgl. 26.2. Werden die beiden Verstärkerstufen dagegen über RC-Hochpassglieder nach Bild 25-40a miteinander gekoppelt und die Basisvorwiderstände RB1 und RB2 so bemessen, dass die beiden Transistoren T1 und T2 im Ruhezustand Arbeitspunkte im aktiv normalen Betriebszustand einnehmen, erregen sich nichtharmonische Schwingungen. Diese Anordnung führt die Bezeichnung Multivibrator oder Relaxtionsoszillator. Aufgrund des Ausweichens der Anordnung in die
Bild 25-40. a Multivibratorschaltung mit b Verlauf der Spannung an Ein- und Ausgang von Transistor T2
G133
G134
G Elektrotechnik / Elektronik
stabilen Betriebspunkte ergeben sich sehr rasche Zustandsübergänge und damit eine wechselseitige Sperrung und Sättigung der beiden Transistoren T1 und T2. Die Öffnungs- und Sperrzeiten hängen von den Zeitkonstanten τ der RC-Glieder und den Schwellenspannungswerten US der Transistoren sowie der Versorgungsspannung U0 ab. Für den Transistor T2 dieser Schaltung sind in Bild 25-40b die Spannungsverläufe Ua (t) und Ue (t) dargestellt. Aus ihnen geht hervor, dass die Spannung Ue (t) wegen exponentiell zeitabhängiger Umladung des Kondensators C2 zum Öffnungszeitpunkt t = t2 die Schleusenspannung US erreicht: Ue (t2 ) = US = U0 + (US − 2U0 )e−t2 /τ2 .
(25-37)
Aus dieser Beziehung kann die Sperrzeit t2 des Transistors T2 gewonnen werden. Ein entsprechender Zusammenhang gilt für die Sperrzeit t1 des Transistors T1. Die Periodendauer als Summe der beiden Sperrzeiten beträgt damit T = t1 + t2 = (RB1C1 + RB2C2 ) ln(2U0 − US )/(U0 − US ) , (25-38) wobei die Versorgungsspannung U0 > US sein muss und bei U0 US für die Schwingfrequenz die Näherung f = 1/T = 1/(τ1 + τ2 ) ln 2 = 1,44/(τ1 + τ2 ) (25-39) gilt. Multivibratoren nach Bild 25-40a können nur für relativ niedrige Frequenzen verwendet werden, da die eingeschalteten Transistoren in Sättigung gehen und beim Ausschalten die Ladungsträger aus der Basis ausgeräumt werden müssen. Daher verwendet man für Multivibratoren, die bei höheren Frequenzen arbeiten sollen, andere Schaltungsarchitekturen. Eine wichtige Schaltungsklasse sind Emitter-gekoppelten Multivibratoren, die auch im MHz-Bereich noch arbeitsfähig sind; vgl. die weiterführende Literatur. Elektronische Kippschaltungen können besonders einfach mit bistabilen schwellenbehafteten Elementen aufgebaut werden. Der Thyristor Ty besteht aus einer komplementären Transistorenschaltung nach Bild 25-41a und stellt einen gesteuerten Schalter dar. Seine Schließbedingung wird durch Überschreiten der Schleusenspannung US und des
Bild 25-41. a Thyristorprinzipschaltung und Klemmenbezeichnung; b Strom-Spannungs-Abhängigkeit im Schaltbetrieb
Haltestromes Ih als hysteresebehaftete Umschaltung zwischen Sättigungs- und Sperrbetrieb nach Bild 25-41b bewirkt. Dieses Schaltelement kann mit einem einzigen RC-Glied periodische Kippschwingungen liefern, wenn die Versorgungsspannung die Bedingung UB > US + Uz und der Haltestrom die Bedingung Ih < UB /R erfüllt. Zur Erhöhung der Ausgangsspannung wird der Steuerelektrode G eine Zenerdiode ZD vorgeschaltet. Im Ladefall herrscht dann in der Schaltstrecke A–K des Thyristors sein Sperrwiderstand Rs im Entladefall sein Durchlasswiderstand Rd , wie dies die Ersatzbilder 25-42b zeigen. Die Kondensatorspannung setzt sich dann aus exponentiellen RC-Umladungen nach Bild 25-42c zusammen und die Schwingfrequenz f = 1/T ist damit aus den Schwellenwerten Uz + US bzw. Ih Rd zu bestimmen: T = tan + tab = UB (1 − e−t/τan ) + Ih Rd e−t/τab + (Uz + US )e−t/τab .
(25-40)
Die Zeitkonstanten besitzen die Werte τan = RC/(1 + R/Rs) und τab = RC/(1 + R/Rd ). Zur Linearisierung des Anstieges der Kondensatorspannung UC im Zeitbereich tan kann der Ladewiderstand R durch eine Konstantstromquelle ersetzt werden. Die Erregung von Kippschwingungen in stark nichtlinearen elektronischen Verstärkerschaltungen lässt
25 Analoge Grundschaltungen
IE = f (UBE ) gebracht werden, wie Bild 25-43b zeigt. Dadurch stellt sich der labile Zustand ein, aus dem sich die Anordnung aufzuschaukeln vermag. Die Kondensatorspannung ist gleich der Steuerspannung UEB des Unijunktiontransistors, sodass sein Emitterstrom IE zwischen dem Höckerwert Ih und dem Talwert It springt. Periodische Durchschaltung und Sperrung der Kollektor-Basis-Strecke des Transistors UIT liefert dann die pulsförmige Ausgangsspannung Ua (t) von Bild 25-43c.
25.4 Operationsverstärker 25.4.1 Verstärkung Bild 25-42. Sägezahngenerator mit Thyristor: a Schaltung;
Spannungsverstärkung
b Ersatzbilder und c Kondensatorspannungsverlauf
Im Beispiel (Bild 25-44) gilt: für
sich mit dem für diesen Zweck entwickelten Unijunktiontransistor UIT besonders gut veranschaulichen, der allerdings nur noch historische Bedeutung besitzt. Für seine Beschaltung wird nach Bild 25-43a außer dem RC-Zeitglied nur noch ein einziger Widerstand RC zum Abgreifen des Ausgangssignales Ua benötigt. Zur Erregung muss der statische Arbeitspunkt A des Elementes in den fallenden Teil der Arbeitskennlinie
Bild 25-43. Sägezahngenerator mit Unijunktiontransistor: a Schaltung, b Strom-Spannungs-Kennlinie und c Zeitverlauf der Ausgangsspannung
− 2,5 V < u1 < 2,5 V (Bereich linearer Verstärkung)
Bild 25-44. Beispiel für Spannungsverstärkung
G135
G136
G Elektrotechnik / Elektronik
ist u2 ∼ u1 oder anders ausgedrückt: u 2 = Vu u 1
(mit Vu = 4) .
und (25-41)
Man kann den Vierpol im Bereich linearer Verstärkung als spannungsgesteuerte Spannungsquelle auffassen (u1 ist die steuernde, u2 die gesteuerte Spannung), vgl. 3.2.3. Vu bezeichnet man als Spannungsverstärkung.
p2 = 40 p1 = 50 mW (1 − cos 2ωt) . Die zeitlichen Mittelwerte dieser Leistungen (die sog. Wirkleistungen) sind P1 = 1,25 mW; P2 = 50 mW . Logarithmische Verhältnisgrößen (Pegel)
Stromverstärkung
In dem Fall, den das Bild 25-45 darstellt, kann der Vierpol im Bereich −1 mA < i1 < 1 mA als stromgesteuerte Stromquelle aufgefasst werden: i2 = Vi i1 .
(25-42)
Hierbei bezeichnet man Vi als Stromverstärkung, im Beispiel ist Vi = 10. Leistungsverstärkung
Wenn − 2,5 V < u1 < 2,5 V und −1 mA < i1 < 1 mA ist, so gilt für die Ausgangsleistung: p2 = u2 i2 = Vu u1 Vi i1 = Vu Vi p1 = Vp p1 .
Von Spannungs-, Strom- und Leistungsverhältnissen (u2 /u1 ; i2 /i1 ; p2 /p1 ) bildet man gern den dekadischen (lg) oder den natürlichen Logarithmus (ln); diese logarithmischen Verhältnisgrößen nennt man Pegel oder Dämpfungen (je nach dem Zusammenhang), vgl. Abschnitt 20.1.
(25-43)
Hierbei bezeichnet man Vp = Vu Vi als Leistungsverstärkung. Im Beispiel wird Vp = 40, d. h., p2 = 40p1 (für 2,5 V < u1 < 2,5 V und −1 mA < i1 < 1 mA) .
25.4.2 Idealer und realer Operationsverstärker Idealer Operationsverstärker
Bild 25-46 stellt das Schaltzeichen für einen Operationsverstärker dar. Der innere Aufbau eines solchen Integrierten Schaltkreises (IC, integrated circuit) soll hier nicht betrachtet werden. Die Eingangsgröße uD (Eingangs-Differenzspannung: uD ist die Potenzialdifferenz der beiden Eingänge) steuert die von den Versorgungsquellen gelieferte Leistung so, dass eine hohe (Gegentakt-)Spannungsverstärkung V0 (Leerlaufverstärkung) möglich ist (Bild 25-47). Die beiden Versorgungsspannungen müssen übrigens nicht bei allen Verstärkern gleich groß sein.
Speziell für u1 = 2,5 V sin ωt, i1 = 1 mA sin ωt ergeben sich p1 = u1 i1 = 2,5 V · 1 mA sin2 ωt = 1,25 mW(1 − cos 2ωt)
Bild 25-45. Beispiel für eine Stromverstärkungskennlinie
Bild 25-46. Schaltzeichen für den Operationsverstärker
25 Analoge Grundschaltungen
Bild 25-47. Beispiel einer Verstärkungskennlinie (VKL): UDo = +1,3 mV, UDu = −1,3 mV, UA max = 13 V, UA min = −13 V, V0 = 104
In vielen Prinzipschaltbildern zeichnet man zur Vereinfachung die Versorgungsspannungs-Anschlüsse und eventuelle weitere IC-Anschlüsse nicht mit ein. Hierdurch entsteht eine Darstellung, bei der die Gleichung i = 0 nicht erfüllt zu sein scheint, weil eben nicht alle Ströme berücksichtigt werden, die aus dem Verstärker herausfließen (oder in ihn hinein). Ein idealer Verstärker hat außer dem Idealverlauf der VKL noch weitere (niemals vollständig realisierbare) Eigenschaften, deren wichtigste in Tabelle 25-2 zusammengefasst sind; dazu gehören: UD offset = 0 (durch Offsetspannungskompensation erreichbar); für UDu < uD < UDo ist uA = V0 uD , wobei V0 1 ist. Realer Operationsverstärker (Beispiel: LM 148)
Der in Bild 25-48 dargestellte integrierte Schaltkreis LM 148 enthält vier Verstärker des Typs 741. Einige typische Werte eines solchen Verstärkers sind in den
Bild 25-48. Anschlüsse eines Vierfach-Operationsver-
stärker-ICs (LM 148), 14-Lead-dual-in-line-Package
Tabellen 25-1 und 25-2 zusammengestellt. Es muss immer beachtet werden, dass die Bedingungen uD < 2Us
und |uP | < US , |uN | < US
(25-44)
eingehalten werden, damit der Schaltkreis nicht beschädigt wird. Im Normalfall wird gewählt US = (5. . .18) V.
Tabelle 25-1. Grenzen der Betriebsgrößen (Op. Verst. 741)
Maximum der Versorgungsspannungen (supply voltages) Extremwerte der Eingangs(differenz)spannung (differential input voltage) Extremwerte der Eingangspotenziale (input voltage) Betriebstemperaturbereich (operating temperature range) Maximum des Ausgangsstromes (output current) Minimum des Ausgangsstromes
US max UD max UD min UP max , UN max UP min , UN min TA IA max IA min (kurzschlusssicher)
22 V 44 V −44 V 22 V −22 V −55 ◦ C . . . 125 ◦ C 20 mA −20 mA
G137
G138
G Elektrotechnik / Elektronik
Tabelle 25-2. Abweichungen eines Operationsverstärkers vom Idealverhalten
(Statische) Leerlaufverstärkung (open loop voltage gain) Eingangswiderstand (input resistance) Ausgangswiderstand (output resistance) (Eingangs-)Offsetspannung (input offset voltage) Offsetspannungsdrift Mittlerer Eingangsruhestrom (input bias current) Eingangs-Offsetstrom (input offset current) Gleichtaktverstärkung (common mode voltage gain) (Maximale) Anstiegsgeschwindigkeit der Ausgangsspannung (slew rate) Transitfrequenz (unity gain bandwidth)
Soll z. B. UA max = −UA min = 13 V sein (vgl. Bild 25-47), so muss US = 15 V gewählt werden. Im Übrigen können die Operationsverstärker auch bei Versorgungsspannungen |US | < |US nenn | arbeiten, i. Allg. bis zum Wert |US | = 0,3|US nenn |.
Bild 25-49. a Bode-Diagramm (Abhängigkeit der Leerlauf-
verstärkung V0 von der Frequenz f bei einem Operationsverstärker nach Korrektur durch ein externes RC-Glied). b Ersatzschaltbild eines nicht übersteuerten Operationsverstärkers
Op. Verst. 741
V0 stat
Idealer Verstärker ∞
RE
∞
(0,8 . . . 2,5) MΩ
RA
0
100 Ω
uD offset
0
(1 . . . 5) mV
duD offset /dT iEb = 0,5 (iP + iN ) iE offset = iP − iN
0 0 0
10 μV/K (30 . . . 100) nA (4 . . . 25) nA
Vcm = duA /ducm mit ucm = 0,5 (uP + uN ) duA rs = dt max
0
10−5
∞
0,5 V/μs
fT
∞
1 MHz
(0,5 . . . 1,6) · 105
Wie sehr ein realer Verstärker vom Idealverhalten abweichen kann, zeigt die Tabelle 25-2: So ist z. B. die Verstärkung V0 nur für niedrige Frequenzen sehr hoch und sinkt schließlich bis auf den Wert 1 ab (die zugehörige Frequenz nennt man Transitfrequenz fT ), vgl. Bild 25-49a. Wegen dieser dynamischen Unvollkommenheit können Operationsverstärker nur im Niederfrequenzbereich eingesetzt werden. Bestimmte Operationsverstärker kommen in einzelnen Eigenschaften dem Idealverhalten näher als der Standardverstärker 741: es gibt z. B. Verstärker mit RE = 106 MΩ (FET-Eingang), rs = 800 V/μs, iEb = 0,1 nA, uD offset = ±0,7 μV, duD offset /dT = 0,01 μV/K oder fT = 10 MHz. Das Bild 25-49b zeigt ein einfaches Ersatzschaltbild für den nichtübersteuerten Operationsverstärker als spannungsgesteuerte Spannungsquelle. 25.4.3 Komparatoren Nichtinvertierender Komparator
Wählt man für die Darstellung der VKL auf beiden Achsen gleiche Maßstäbe, so erscheint der lineare
25 Analoge Grundschaltungen
Fensterkomparator
Am folgenden Beispiel wird dargestellt, wie eine Kombination zweier Komparatoren anzeigt, ob eine Spannung uE z. B. im Bereich 5 V < uE < 10 V Bild 25-50. Verstärkungskennlinie
liegt oder außerhalb davon.
Verstärkungsbereich praktisch als Spannungssprung (Bild 25-50). Für den Verlauf uA = f (uD ) gilt im Beispiel aus Bild 25-47: 13 V für uD 1,3 mV uA = −13 V für uD −1,3 mV .
Beispiel
Eine an das Eingangsklemmenpaar angelegte Spannung wird also praktisch mit dem Wert 0 V verglichen: uA = −13 V bedeutet, dass uD < 0 ist. So gesehen ist jeder Operationsverstärker auch ein Vergleicher (Komparator). Die Bezugsschwelle muss nicht bei 0 V liegen, sondern lässt sich auch verschieben (Bild 25-51b).
Für die beiden Operationsverstärker in der Schaltung in Bild 25-53 soll gelten V0 = ∞ und UA max = −UA min = 15 V. Die beiden Dioden können als ideal angesehen werden (vgl. Kennlinie i = f(u) ). Außerdem ist Ur1 = 10 V ;
Ur2 = 5 V .
Ein Tiefstwert-Gatter (vgl. 26.1.1) verknüpft die Ausgänge zweier Komparatoren und wirkt (mit der Zuordnung −15 V =ˆ 0; +15 V =ˆ 1) als UND-Gatter: uA = uA1 & uA2 . uA , uA1 , uA2 sind in Bild 25-54 dargestellt.
Invertierender Komparator
Vertauscht man in Bild 25-51a die beiden Eingänge miteinander (Bild 25-52a), so erhält man eine Inversion der Kennlinie uA = f (uE ), vgl. Bild 25-52b.
Umwandlung einer Sinus- in eine Rechteckspannung
Bild 25-55 zeigt, welchen Verlauf uA (t) hat, wenn eine sinusförmige Spannung uE am Eingang eines
Bild 25-51. Nichtinvertierender Komparator
Bild 25-52. Invertierender Komparator
Bild 25-53. Fensterkomparator
G139
G140
G Elektrotechnik / Elektronik
Bild 25-56. Umkehrverstärker Bild 25-54. Ausgangsspannungen zweier Komparatoren
und ihrer UND-Verknüpfung (Fensterkomparator)
Eine genauere Berechnung ergibt Vges =
Bild 25-55. Eingangsspannung und Ausgangsspannungen
uA ≈− uE
R2 /R1 . 1 + R2 /R1 1+ V0
(25-46)
Wenn V0 → ∞ geht, so folgt hieraus (45). Die Formel (46) zeigt, dass sich stets |Vges | < V0 ergibt. Durch die Gegenkopplung (GK) ergibt sich eine Verkleinerung der Verstärkung. Der Vorteil der GK besteht darin, dass durch das Verhältnis zweier zugeschalteter Widerstände ein beliebiger Verstärkungswert |Vges | < V0 eingestellt werden kann. Solange |Vges | V0 bleibt, wird Vges damit praktisch unabhängig von Schwankungen der Leerlaufverstärkung V0 , die sich z. B. in Abhängigkeit von der Temperatur oder der Betriebsfrequenz ergeben können. Durch GK wird also eine Verstärkungsbegrenzung (Verstärkungs„Stabilisierung“) erreicht.
an zwei Komparatoren
Rechenverstärker
nichtinvertierenden Komparators (Bild 25-51) liegt. Die Schwingung a gibt den Verlauf für Ur = 0 an, Schwingung b für Ur = 5 V.
Umkehraddierer. Für den nichtübersteuerten idealen Verstärker mit hoher Leerlaufverstärkung V0 ist uD ≈ 0, sodass gilt (vgl. Bild 25-57):
25.4.4 Anwendungen des Umkehrverstärkers Die Gesamtverstärkung des Umkehrverstärkers
In 8.3.3 sind vier Rückkopplungsprinzipien dargestellt; eines davon ist die invertierende Gegenkopplung (Umkehrverstärker, Bild 25-56) mit der Gesamtverstärkung uA R2 Vges = ≈− . (25-45) uE R1 Falls V0 sehr groß (d.h. uD ≈ 0 im Bereich linearer Verstärkung) ist, hängt also beim idealen Verstärker das Verhältnis uA /uE praktisch nur von der äußeren Beschaltung ab.
i11 + i12 ≈ i2 uA uE1 uE2 + ≈− R11 R12 R2 R2 R2 uA ≈ − uE1 + uE2 . R11 R12
Bild 25-57. Umkehraddierer mit zwei Eingängen
(25-47)
25 Analoge Grundschaltungen
Subtrahierer. In Bild 25-58 gilt mit uD = 0 und we gen u = 0 für den Umlauf 1 Rp RN iE1 − iE2 + uE2 − uE1 = 0 α α
(25-48)
und für den Umlauf 2
Bild 25-60. Quadrierer, Schaltung und Diodenkennlinie
uA − Rp iE2 + RN iE1 = 0 Rp RN uA iE1 − iE2 + = 0. α α α
(25-49)
Zieht man (25-49) von (25-48) ab, so entsteht −
uA + uE2 − uE1 = 0 ; α
uA = α(uE2 − uE1 ) . (25-50)
Integrierer. In Bild 25-59 gilt mit uD ≈ 0: " uE −1 und uA ≈ i1 ≈ i2 dt . R C Wegen i1 ≈ i2 folgt dann " 1 uA ≈ − uE (t) dt , RC "t 1 uE (τ) dτ , uA ≈ − RC =−
1 RC
Quadrierer. Mit uD = 0 und i1 = Ku21 (Approximation der Diodenkennlinie im Durchlassbereich durch eine quadratische Parabel) wird wegen i1 ≈ i2 (Bild 25-60) uA , uA = −RKu2E . (25-52) Ku2E = − R Multiplizierer. Eine Analogmultiplikation lässt sich auf Addition, Subtraktion und Quadratbildung zurückführen (Bild 25-61). Umkehraddierer als Digital-Analog-Umsetzer
Für den Umkehraddierer in Bild 25-62 gilt: 1 1 uA = − u2 + u1 + u0 ; vgl. Tabelle 25-3 . 2 4 (25-53)
−∞ "t
uE (τ) dτ + uA (0) .
Vertauscht man den Widerstand R mit dem Kondensator C, so entsteht im Prinzip ein Differenzierer.
(25-51)
0
Bild 25-61. Blockschaltbild eines Multiplizierers
Bild 25-58. Subtrahierer
Bild 25-59. Integrierer
Bild 25-62. Digital-Analog-Umsetzer (DAU) zur Darstellung einer dreistelligen Binärzahl
G141
G142
G Elektrotechnik / Elektronik
Tabelle 25-3. Zuordnung der analogen Ausgangsspannung
zu den Schalterstellungen bei einem D/A-Wandler (Geschlossener Schalter =ˆ 1, Offener Schalter =ˆ 0) S2 0 0 0 0 1 1 1 1
S1 0 0 1 1 0 0 1 1
S0 0 1 0 1 0 1 0 1
−uA /V 0 1 2 3 4 5 6 7
Für den Umkehraddierer in Bild 25-63 gilt: 1 uA = − (u1 + u2 + u3 ) . 3 In Bild 25-64 sind u1 , u2 , u3 und uA dargestellt. Hier ist uA (ebenso wie beim DAU, Bild 25-62) ein stufiges Analogsignal. Die Spannungen u1 , u2 , u3 bilden die Digitalinformation, die noch einem Codier-Schaltnetz zugeführt werden müsste, damit an dessen zwei Ausgängen y0 , y1 schließlich die Dualzahl y = y1 21 + y0 20 zur Verfügung steht. 25.4.5 Anwendungen des Elektrometerverstärkers
Beim Elektrometerverstärker (Bild 25-65) gilt im linearen Verstärkungsbereich für die Gesamtverstärkung (vgl. 8.3.3)
Der Umkehraddierer mit vorgeschalteten Komparatoren als Analog-Digital-Umsetzer
Für die vier Operationsverstärker eines AnalogDigital-Umsetzers (Bild 25-63) soll gelten V0 = ∞ und UA max = −UA min = 15 V.
Vges =
uA R4 ≈1+ . uE R3
(25-54)
Der Elektrometerverstärker als spannungsgesteuerte Stromquelle
Wegen iN ≈ 0 ist uA ≈ i A (R3 + R4 ) und mit (25-54) daher iA (R3 + R4 ) R3 + R4 ≈ uE R3
iA ≈
uE . R3
(25-55)
Der Strom iA ist also zur Eingangsspannung u E proportional und von R4 unabhängig (Konstantstromquelle). (Wenn uE bzw. R4 zu groß werden, dann wird der Bereich linearer Verstärkung verlassen, sodass die Voraussetzung uD ≈ 0 nicht mehr zutrifft; (25-55) wird dadurch ungültig.) Bild 25-63. Analog-Digital-Umsetzer (ADU)
Der Elektrometerverstärker als Widerstandswandler (Impedanzwandler)
Macht man beim Elektrometerverstärker R4 = 0, so wird (falls uD ≈ 0) uA/uE ≈ 1. Eingangs- und Ausgangsspannung sind also gleich (Spannungsfolger),
Bild 25-64. Quantisierungs-Kennlinie
Digital-Umsetzers (ADU)
eines
AnalogBild 25-65. Elektrometerverstärker
26 Digitale Grundschaltungen
der Eingangswiderstand ist aber praktisch unendlich groß und der Ausgangswiderstand niedrig (Stromverstärkung). 25.4.6 Mitkopplungsschaltungen (Schmitt-Trigger) Nichtinvertierende Mitkopplung
In einer nichtinvertierenden Mitkopplungsschaltung (Bild 25-66; vgl. 8.3.3) gilt für die Sprungspannungen R1 R1 UE auf = 1 + (25-56a) Ur − UA min , R2 R2 R1 R1 UE ab = 1 + (25-56b) Ur − UA max . R2 R2 Aufgelöst nach R2 /R1 und Ur : R2 UA max − UA min = , R1 UE auf − UE ab Ur =
(25-57a)
UA max UE auf − UA min UE ab . (UA max − UE auf ) − (UA min + UE ab ) (25-57b)
Diese Formeln können also zur Dimensionierung der Schaltung dienen, wenn der Verlauf uA (uE ) vorgegeben ist. Invertierende Mitkopplung
In einer invertierenden Mitkopplungsschaltung (Bild 25-67, vgl. 8.3.3) gilt für die Sprungspannungen: R4 UA min + Ur R3 UE auf = , (25-58a) 1 + R4 /R3 UE ab =
R4 Ur R3 . 1 + R4 /R3
Aufgelöst nach R4 /R3 und Ur : R4 UA max − UA min = −1, R3 UE ab − UE auf Ur =
(25-58b)
(25-59a)
UA max UE auf − UA min UE ab . (UA max + UE auf ) − (UA min + UE ab ) (25-59b)
26 Digitale Grundschaltungen 26.1 Gatter 26.1.1 Diodengatter Höchstwertgatter
Wenn man voraussetzt, dass die Dioden in Bild 26-1 ideale elektronische Ventile darstellen (Diodenwiderstand im Durchlassbereich u > 0 : Rdurchlass = 0; im Sperrbereich u < 0: Rsperr = ∞), dann ist die Diode mit der höchsten Spannung ux durchlässig; es wird uy = Max(ux0 , ux1 , ux2 ) und alle Dioden mit ux < uy sperren. Die höchste Eingangsspannung setzt sich also am Ausgang durch (Höchstwertgatter). Falls nur zwei verschiedene Eingangsspannungswerte vorkommen, nämlich L: Low = niedriger Pegel H: High = hoher Pegel ,
UA max +
Bild 25-66. Schalthysterese bei nichtinvertierender Mit-
kopplung
Bild 25-67. Schalthysterese bei invertierender Mitkopplung
und
so ergibt sich damit zwischen den Eingangsspannungen und der Ausgangsspannung der Zusammenhang nach Tabelle 26-1a.
Bild 26-1. Höchstwertgatter: uy = Max(ux0 , ux1 , ux2 )
G143
G144
G Elektrotechnik / Elektronik
Tabelle 26-1. Verknüpfung der Eingangsgrößen durch das Höchstwertgatter
Bild 26-3. Tiefstwertgatter: uy = Min(ux0 , ux1 , ux2 ) Bild 26-2. Schaltzeichen für Gatter zur disjunktiven und
konjunktiven Verknüpfung
Im Allgemeinen wählt man die „positive Logik“ (Tabelle 26-1b): dann wird das Höchstwertgatter zur ODER-Schaltung (Bild 26-2a); andernfalls wird es zur UND-Schaltung (Bild 26-2b).
spannung US , z. B. US ≈ 0,6 V), so wird klar, dass in einem Diodenschaltnetz der Abstand zwischen L- und H-Pegel von Stufe zu Stufe abnimmt und in den (passiven) Diodenschaltungen nicht regeneriert werden kann (Signalregeneration ist nur in Schaltungen mit Verstärkungseigenschaften möglich, z. B. in Transis-
Tiefstwertgatter
Beim Tiefstwertgatter (Bild 26-3) bestimmt die Diode mit der niedrigsten Spannung ux die Spannung uy am Ausgang: uy = Min(ux0 , ux1 , u x2 ). Bei positiver Logik stellt dieses Gatter eine UND-Verknüpfung her, bei negativer eine ODER-Verknüpfung. Fehlende Signalregeneration, Belastung
Berücksichtigt man, dass an einer Diode auch im Durchlassbetrieb eine Spannung abfällt (Schwellen-
Bild 26-4. Verringerung des Abstandes zwischen H- und L-
Pegel in einem Diodenschaltnetz
26 Digitale Grundschaltungen
torschaltungen); vgl. Bild 26-4. Außerdem kann mit Dioden kein Inverter aufgebaut werden, sodass mit ihnen nicht alle möglichen Verknüpfungen realisierbar sind. Legt man übrigens (mit z. B. UB = 6 V, US = 0,6 V) an alle drei Eingänge des Höchstwertgatters (Bild 26-1) 0 V an und belastet seinen Ausgang y mit einem Eingang eines Tiefstwertgatters (Bild 26-3), dessen andere Eingänge an 6 V gelegt werden, so ergibt sich am Tiefstwertgatterausgang 3,3 V (statt 0 V im Idealfall), falls beide Gatter gleiche Ohm’sche Widerstände haben. Entkopplung der Eingänge
Voraussetzung für die logische Verknüpfung mehrerer Eingangsgrößen ist, dass die Dioden die einzelnen Eingänge voneinander entkoppeln. Dies ist bei beiden Schaltungen (Bilder 26-1 und 26-3) der Fall (es könnte z. B. kein Strom von x0 nach x1 fließen). In beiden Schaltungen können nicht nur 3, sondern auch 2 oder mehr als 3 Eingänge vorgesehen werden; es entstehen dann UND- und ODER-Verknüpfungen von entsprechend vielen Eingangsgrößen. 26.1.2 Der Transistor als Inverter
In einer Emitterschaltung (Bild 26-5) wird bei geeigneter Wahl der Widerstandswerte erreicht, dass der Transistor (vgl. 25.3.1) für ux =ˆ L sperrt und für ux =ˆ H (= UB ) leitet, sodass an ihm (fast) keine Spannung abfällt. Damit gilt für ux und uy die Zuordnung nach Bild 26-6a. Sowohl bei positiver als auch bei negativer Logik ist somit x = y¯ (Schaltzeichen: Bild 26-6b).
Bild 26-7. Parallel- und Reihenschaltung der KollektorEmitter-Strecken
Bild 26-7 zeigt eine Reihen- und eine Parallelschaltung von Invertern. 26.1.3 DTL-Gatter
Dem Inverter (Bild 26-5) kann ein Dioden-ODERGatter oder ein Dioden-UND-Gatter (Bilder 26-1 und 26-3) vorgeschaltet werden (Bild 26-8): so entstehen eine NOR-Schaltung (y = x1 + x0 ) oder eine NANDSchaltung (y = x1 · x0 ) in Dioden-Transistor-Technik (Dioden-Transistor-Logik, DTL-Technik). 26.1.4 TTL-Gatter
Wenn die Eingangsdioden der DTL-Schaltungen (Bild 26-8) in einem Multiemittertransistor zusammengefasst werden, dann entstehen die Grundformen von TTL-Schaltkreisen (TTL, Transistor-TransistorLogik). Das Bild 26-9 zeigt dies am Beispiel der Schaltung von Bild 26-8b (inverser Betrieb von T1, wenn x1 = x0 = T ).
Bild 26-5. NPN-Transistor in Emitterschaltung
Bild 26-6. Inversion
Bild 26-8. DTL-Gatter
G145
G146
G Elektrotechnik / Elektronik
Bild 26-9. Grundform einer TTL-Schaltung (bei positiver Logik NAND-Verknüpfung: y = x1 · x0 )
Bild 26-10. Standard-TTL-Schaltung (bei positiver Logik
NAND-Verknüpfung: y = x1 · x0 )
Besondere technische Bedeutung haben TTLStandardschaltkreise. Die Erweiterung der NANDSchaltung von Bild 26-9 zu einem solchen Schaltkreis zeigt Bild 26-10. 26.1.5 Schaltkreisfamilien (Übersicht)
Außer den erwähnten gibt es noch wichtige andere Schaltkreisfamilien (Tabelle 26-2). Um die Vor- und Nachteile beurteilen zu können, muss man vor allem folgende Kriterien betrachten: Betriebsspannung. Die meisten Schaltungen verwenden UB = 5 V. MOS- und LSL-Schaltungen brauchen höhere Spannungen. CMOS-Schaltungen können mit verschieden hohen Betriebsspannungen betrieben werden: bei höheren Spannungen arbeiten sie schneller und der Störspannungsabstand wird größer; vgl. J 3.1.2. Stör(spannungs)abstand. Ein H-Ausgangssignal darf nach Überlagerung eines Störsignals nur um einen bestimmten Betrag USH unterschritten werden, wenn es am Eingang des nachfolgenden Gatters noch sicher als H-Signal erkennbar sein soll. Ebenfalls darf das L-Ausgangssignal nur um USL überschritten werden. Als Störabstand definiert man US = 0,5(USH + USL ). Bei LSL-Schaltungen ist US besonders groß.
Verlustleistung. Als (mittlere) Verlustleistung wird definiert: Pv = 0,5(PvH + PvL )(PvH , PvL : Leistung bei H- bzw. L-Signal am Ausgang). Insbesondere bei TTL-Schaltungen werden kurze Signallaufzeiten durch hohe Verlustleistung erkauft. CMOSSchaltungen nehmen besonders kleine Leistungen auf (allerdings frequenzabhängig). Signallaufzeit. Als (mittlere) Signallaufzeit wird definiert: T = 0,5(T LH + T HL )(T LH ist die Zeit, um die der Wechsel des Ausgangspegels von L auf H verzögert ist gegenüber dem Wechsel des Eingangspegels; T HL ist die Zeit, um die der Wechsel des Ausgangspegels von H auf L verzögert wird). Schnelle Standardund Schottky-TTL haben besonders kleine Laufzeiten; noch schneller sind die ECL-Bausteine. Maximale Schaltfrequenz. Taktgesteuerte Flipflops (siehe 26.2.2 und 26.2.3) arbeiten mit (periodischen) Folgen von Rechteck-Steuerimpulsen. Die maximale Frequenz, die das Flipflop (beim Tastverhältnis VT = 0,5) verarbeiten kann, nennt man die maximale Schaltfrequenz (VT = Impulsdauer/Periodendauer). Ausgangslastfaktor. Der Ausgangslastfaktor (fanout) FA gibt an, wie viele Eingänge folgender Bausteine derselben Schaltkreisfamilie höchstens an den Ausgang angeschlossen werden dürfen. CMOSSchaltungen haben einen hohen Ausgangslastfaktor (FA = 50). Preis. Am preisgünstigsten sind die TTL-StandardSchaltkreise. Aus der Tabelle 26-2 können charakteristische Werte zum Vergleich wichtiger Schaltkreisfamilien entnommen werden. In den Spalten für Pv und fmax würden sich durchweg ungünstigere Werte ergeben, wenn man statt der typischen (mittleren) Verlustleistung Pv die maximale Verlustleistung nähme bzw. statt der typischen maximalen Schaltfrequenz fmax deren garantierten Wert (z. B. ist für StandardTTL: Pv = 10 mW, Pv gar = 19 mW; fmax = 25 MHz, fmax gar = 15 MHz). Zur Großintegration (LSI, largescale integration) eignet sich besonders die MOSund die CMOS-Technik, deren Empfindlichkeit gegen statische Aufladungen allerdings ein Problem darstellt (Eingangsschutzschaltung!). Weiterentwicklungen der CMOS-Technik sind die LOCMOS- und die HCMOS-Technik (geringere Signallaufzeiten als bei CMOS).
26 Digitale Grundschaltungen
Tabelle 26-2. Vergleich wichtiger Schaltkreisfamilien
a
von der Schaltfrequenz abhängig
26.1.6 Beispiele digitaler Schaltnetze
Rückkopplungsfreie Schaltungen aus Logikgattern nennt man Schaltnetze. In den folgenden drei Beispielen sollen Schaltnetze entworfen werden, die vorgegebene logische Funktionen realisieren. Beispiel 1: Zweidrittel-Mehrheit Die Feststellung einer Zweidrittel-Mehrheit (Tabelle 26-3) kann man mithilfe der disjunktiven Normalform (vgl. Abschnitt J)
y = ( x¯2 x1 x0 ) + (x2 x¯1 x0 ) + (x2 x1 x¯0 ) + (x2 x1 x0 ) (26-1a) oder mithilfe der konjunktiven Normalform y = (x2 + x1 + x0 )(x2 + x1 + x¯0 ) × (x2 + x¯1 + x0 )( x¯2 + x1 + x0 ) (26-1b) treffen. Beide Formen können nach den Regeln der Boole’schen Algebra minimiert und auch ineinander überführt werden: y = (x1 x0 ) + (x2 x0 ) + (x2 x1 ) bzw. (26-2a) y = (x2 + x1 )(x2 + x0 )(x1 + x0 ) .
(26-2b)
G147
G148
G Elektrotechnik / Elektronik
Tabelle 26-3. Funktionstabelle (Wahrheitstabelle) zur Fest-
stellung einer Zweidrittel-Mehrheit (y = 1 zeigt an, dass 2 oder 3 Eingangsvariable den Wert 1 haben) n 0 1 2 3 4 5 6 7
x2 0 0 0 0 1 1 1 1
x1 0 0 1 1 0 0 1 1
x0 0 1 0 1 0 1 0 1
y 0 0 0 1 0 1 1 1
Schaltungen zu den beiden Minimalformen (2) sind in Bild 26-11 dargestellt. Meist jedoch geschieht die Minimierung (1) → (2) anhand eines Karnaugh-VeitchDiagrammes (KV-Diagramm); Bild 26-12 zeigt dies für die Darstellung (la): den Zeilen n = 0, . . . , 7 der Tabelle 26-3 entsprechen die Felder 0, . . . , 7 des KVDiagrammes.
Tabelle 26-4. Vergleich zweier zweistelliger Dualzahlen x
und y 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1
x0 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1
y1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1
y0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1
A 0 0 0 0 1 0 0 0 1 1 0 0 1 1 1 0
B 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
C 0 1 1 1 0 0 1 1 0 0 0 1 0 0 0 0
Beispiel 2: Vergleich zweier zweistelliger Dualzahlen (Zwei-BitKomparator) Wenn festgestellt werden soll, ob für die beiden Zahlen x = x1 · 2 1 + x0 · 2 0
und y = y1 · 21 + y0 · 20
gilt x > y, x = y oder x < y, so kann man die Zuordnung der Tabelle 26-4 wählen: A = 1 bedeutet x > y, B = 1 bedeutet x = y und C = 1 bedeutet x < y. Hierbei ist
Bild 26-12. KV-Diagramm zur Tabelle 26-3: y = x0 x1 +
x1 x2 + x2 x0
A = (x1 y¯1 ) + (x0 x1 y¯ 0 ) + (x0 y¯ 0 y¯ 1 ) , B = (x0 ↔ y0 )(x1 ↔ y1 ) ,
C = A+B.
x0 ↔ y0 ist die Äquivalenz-Verknüpfung von x0 mit y0 ; der invertierte Wert x0 ↔ y0 = x0 y0 ist die Antivalenz-Verknüpfung (Exklusiv-ODERVerknüpfung von x0 mit y0 , vgl. J 1.1). Beispiel 3: Decodiermatrix Zehn verschiedene vierstellige Dualzahlen x = x3 · 2 3 + x2 · 2 2 + x1 · 2 1 + x0 · 2 0 Bild 26-11. Schaltungen zur Feststellung einer Zweidrittel-
Mehrheit
sollen den 10 Ausgängen (y0 , . . . , y9 ) eines Decoders eindeutig zugeordnet werden (Tabelle 26-5). Die übrigen sechs Binärzahlen sollen bei fehlerfreier Über-
26 Digitale Grundschaltungen
26.2 Ein-Bit-Speicher 26.2.1 Einfache Kippschaltungen Bistabile Kippstufe (SR-Flipflop = RS-Flipflop)
Bild 26-13. Decodiermatrix (für Glixon-Code)
tragung nicht auftreten; andernfalls soll es zu einer Fehleranzeige ( f = 1) kommen. In Bild 26-13 wird eine Decodiermatrix angegeben, die den Code nach Tabelle 26-5 realisiert (der übrigens einschrittig und für 10 Schritte zyklisch permutiert ist: bei der Bildung der Nachbarzahl ändert sich in der vierstelligen Binärzahl x nur eine einzige Stelle – ein Bit –, und zwar auch beim Übergang von 9 (=ˆ 1000) zu 0 (=ˆ 0000). Tabelle 26-5. Zuordnung der Dezimalziffern 0, . . . , 9 zu zehn verschiedenen vierstelligen Dualzahlen (x) nach dem Glixon-Code
x 0 1 3 2 6 7 5 4 12 8 9 10 11 13 14 15
y 0 1 2 3 4 5 6 7 8 9 − − − − − −
x3 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1
x2 0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1
x1 0 0 1 1 1 1 0 0 0 0 0 1 1 0 1 1
x0 0 1 1 0 0 1 1 0 0 0 1 0 1 1 0 1
f 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1
Bei aktiven Systemen spricht man von Rückkopplung, wenn ein Systemausgang mit einem Systemeingang verbunden ist; speziell bei Mitkopplung können Schaltungen mit Selbsthalte-Eigenschaften (Speicher) entstehen (vgl. 8.3.3 und 25.4.6): Übertragungscharakteristik mit Hysterese. Diesen Effekt gibt es auch bei mitgekoppelten (aktiven) Digitalschaltkreisen, z. B. zwei kreuzweise mitgekoppelten NOR-Gattern; Bild 26-14. Eine solche Schaltung ist kein Schaltnetz mehr im Sinne von 26.1.6, sondern ein (einfaches) Schaltwerk. Wenn an einem der beiden NOR-Gatter (z. B. A) das Eingangssignal den Wert H hat (x1 = H), so gilt am Ausgang y2 = L. Ist zugleich x2 = L, so liegt an beiden Eingängen von B das Signal L; also wird y1 = H (Zeile 1 in Tabelle 26-6). Falls danach x1 = L wird und weiterhin x2 = L bleibt, ändern sich die Ausgangssignale nicht (Zeile 2 in Tabelle 26-6). Die Eingangskombination x1 = H, x2 = L bewirkt also eine Ausgangskombination, die auch dann erhalten bleibt (gespeichert wird), wenn x1 = x2 = L wird; man nennt einen solchen Speicher ein Flipflop. In der Tabelle 26-6 bezeichnen y2(n) , y1(n) die Aus, y(n−1) begangsgrößen im n-ten Schaltzustand; y(n−1) 2 1 zeichnen den vorangehenden Ausgangszustand. Falls der Eingangszustand x2 = x1 = H vermieden wird, so ist immer y2 = y1 , und man stellt den Speicher aus Bild 26-14 durch ein einfaches Schaltzei-
Bild 26-14. Bistabiler Ein-Bit-Speicher (drei verschiede-
ne Darstellungen für zwei kreuzweise mitgekoppelte NORGatter)
G149
G150
G Elektrotechnik / Elektronik
Tabelle 26-6. Schaltfolgetabelle eines Ein-Bit-Speichers
n 1 2 3 4 5
x2 L L H L H
x1 H L L L H
y(n−1) 2 b L b H b
y(n−1) 1 b H b L b
y(n) 2 L L H H L
y(n) 1 H H L L L
Monostabile Kippstufe (Monoflop)
Bei einem Monoflop ist nur ein Zustand stabil (in Bild 26-17 ist dies y = L). Ein H-Impuls am Eingang (x) bewirkt, dass während der Zeit T y = H wird. Die Dauer T des Ausgangsimpulses hängt von der Zeitkonstante RC des Verzögerungsgliedes ab; der Widerstand R und der Kondensator C müssen extern an den integrierten Schaltkreis angeschlossen werden (Bild 26-17c). Astabile Kippstufe
Bild 26-15. SR-Flipflop (= RS-Flipflop)
chen dar (Bild 26-15), wobei x1 = S (Setzen, set), x2 = R (Rücksetzen, reset, Löschen), y1 = Q und y2 = Q¯ gesetzt wird. Die Schaltfolgetabelle 26-7 für ein SR-Flipflop (Bild 26-15) braucht nur eine Ausgangsgröße (Q) zu enthalten, weil am zweiten Ausgang stets die komplementäre Größe liegt (falls S = R = H ausgeschlossen ist). Bei dem SR-Flipflop in den Bildern 26-14 und 26-15 ist das H-Signal die aktive Größe. Bei einem SRFlipflop aus zwei NAND-Gattern wird das L-Signal zur aktiven Größe; um auch hier das in Tabelle 26-6 beschriebene Verhalten zu erreichen, müssen alle Einund Ausgänge invertiert werden (Bild 26-16).
Aus zwei Monoflops (Bild 26-17c) kann eine Rückkopplungsschaltung (Bild 26-18a) gebildet werden, bei der die Rückflanke des Ausgangsimpulses von MF1 den Ausgangsimpuls von MF2 bewirkt; dessen Rückflanke stößt wiederum MF1 an usw. (u. U. kann die Schaltung nicht anschwingen).
Tabelle 26-7. Schaltfolgetabelle des SR-Flipflops: Q(n) =
S + R¯ · Q(n−1) n 1 2 3 4
R L L H L
S H L L L
Q(n−1) b H b L
Q(n) H H L L
Bild 26-16. Aus zwei NAND-Gattern aufgebauter Ein-BitSpeicher mit dem gleichen Verhalten wie der Speicher in Bild 26-14
Bild 26-17. Monoflop (SR-Flipflop mit vorgeschaltetem Differenzierglied)
Bild 26-18. Taktgenerator
26 Digitale Grundschaltungen
Bild 26-21. Mit der abfallenden Taktflanke gesteuertes SR-
Flipflop Bild 26-19. Taktzustandsgesteuertes SR-Flipflop
26.2.2 Getaktete SR-Flipflops
Taktzustands-Steuerung. In Bild 26-19 wird ein taktzustandsgesteuertes SR-Flipflop dargestellt. Es kann nur dann durch das Eingangssignal S = H gesetzt (Q → H) oder durch R = H gelöscht (Q → L) werden, wenn zugleich am Takteingang ein Freigabeimpuls C = H auftritt (C clock = Takt). Taktflanken-Steuerung. Das Bild 26-20a zeigt ein taktflankengesteuertes SR-Flipflop: dieses Flipflop ist nicht während der gesamten Dauer des Eingangsimpulses (C = H) aufnahmebereit, sondern nur für kurze
Zeit nach Beginn des Impulses (die Aufnahmebereitschaft beginnt mit der ansteigenden Taktflanke und bleibt nur für die sehr kurze Zeit T erhalten; siehe Bild 26-20c). Ein Impuls mit der (sehr kurzen) Dauer T entsteht als Laufzeit eines Inverters (evtl. 3 oder 5 Inverter usw.; vgl. die Spalte für die Signallaufzeit in Tabelle 26-2): dynamischer Takteingang. Falls ein SR-Flipflop das Eingangssignal mit der abfallenden Taktflanke übernimmt, wählt man das Schaltbild nach Bild 26-21. 26.2.3 Flipflops mit Zwischenspeicherung (Master-Slave-Flipflops, Zählflipflops)
SR-Master-Slave-Flipflop (SR-MS-FF). In Bild 26-22a bewirken die differenzierenden Ein¯ der UND-Gatter, dass zwei gänge (für C und C) taktflankengesteuerte SR-Flipflops entstehen. Das linke („Master“) übernimmt ein H-Signal an einem der beiden Eingänge mit der ansteigenden Impulsflanke. Das rechte („Slave“) übernimmt vom Master dessen Inhalt aber erst mit der Beendigung des Eingangsimpulses, also um die Dauer τ dieses Impulses verzögert (Bild 26-23). JK-(MS-)Flipflop. Ein besonders vielseitig verwendbares Flipflop ist das JK-Flipflop. Bei ihm
Bild 26-20. Mit der ansteigenden Taktflanke gesteuertes
SR-Flipflop
Bild 26-22. SR-MS-Flipflop (Übernahme der Information
in den Master mit der ansteigenden Taktflanke, Weitergabe an den Slave mit der abfallenden Taktflanke)
G151
G152
G Elektrotechnik / Elektronik
Bild 26-26. Schaltzeichen für das JK-Flipflop mit Eingän-
gen zum direkten Setzen und Löschen (S, R), Übernahme an den Ausgang mit den Taktrückflanken
Bild 26-23. Setzen und Löschen eines SR-MS-Flipflops (Impulsdiagramm)
Bild 26-27. D-Flipflop Bild 26-24. JK-Flipflop (Weitergabe der Information an die Ausgänge mit der abfallenden Taktflanke)
darf im Gegensatz zum SR-Flipflop oder zum SR-MS-Flipflop an beiden Haupteingängen (J, K) gleichzeitig das H-Signal auftreten: in diesem Fall kehrt sich Q mit jedem Eingangsimpuls C um. Im Übrigen verhält sich das JK-Flipflop genauso wie das SR-MS-Flipflop (Bild 26-25). JK-FFs haben gewöhnlich außer den (Vorbereitungs-)Eingängen J, K noch zwei Eingänge zum direkten Setzen (preset, S ) und Rücksetzen (clear, R), die auch beim SR-MS-FF (Bild 26-22a) entstehen würden, wenn man S2 disjunktiv mit dem Direkt-Setzsignal S und R2 disjunktiv mit dem Direkt-Rücksetzsignal R verknüpft. Bild 26-26 zeigt ein JK-FF mit direkter Setz- und Rücksetz-Möglichkeit.
Bild 26-25. Impulsdiagramm eines JK-Flipflops
D-Flipflop. Das Bild 26-27a zeigt, wie ein JKFlipflop als D-Flipflop verwendet werden kann. Das D-Flipflop (Bild 26-27b) wird gesetzt (Q = H), wenn D = J = H wird, und es wird mit D = L rückgesetzt ¯ vgl. Bild 26-27c. (wegen K = J), T-Flipflop. Das Bild 26-28a zeigt, wie ein JKFlipflop als T-Flipflop (Toggle-Flipflop) verwendet werden kann. Das T-Flipflop (Bild 26-28b) ändert seinen Ausgangszustand mit jeder Rückflanke des Eingangssteuertaktes (C), falls zugleich T = H ist; die Frequenz von Q ist halb so groß wie die von C: Binäruntersetzung. Ist dagegen T = L, so bleibt der Ausgangszustand unverändert, vgl. Bild 26-28c.
Bild 26-28. T-Flipflop
26 Digitale Grundschaltungen
Bild 26-29. 4-Bit-Auffangregister mit D-Flipflops (positiv flankengesteuert)
chern sie so lange, bis ein Reset-Impuls (R¯ = L) das Register löscht oder bis durch einen neuen Steuerimpuls ein neuer Inhalt eingelesen wird. Es gibt Auffangregister für 4, 8, 16 oder 32 Bit. Schieberegister übernehmen mehrere Bits nacheinander (sequentiell; in Bild 26-30 mit der Taktrückflanke). Gebräuchlich sind 4- oder 8-Bit-Schieberegister. 26.3.2 Zähler Asynchrone Zähler
Bild 26-30. 4-Bit-Schieberegister
26.3 Schaltwerke
Flipflop-Ketten können als Zähler arbeiten. Wenn der Takt C nur das erste FF steuert (Bild 26-31a), man eine solche Zählschaltung asynchron. Das Diagramm 26-31b zeigt, dass die Dualzahl y = Q3 · 2 3 + Q2 · 2 2 + Q1 · 2 1 + Q0 · 2 0
(26-3)
Schaltungen zur logischen Verknüpfung nennt man Schaltwerke, wenn sie Speicher (Flipflops) enthalten.
nacheinander die Werte 0, 1, 2, . . . , 15, 0, 1, 2, . . . , 15, 0, 1, . . . durchläuft: es sind 16 verschiedene Zustände möglich (16er-Zähler).
26.3.1 Auffang- und Schieberegister
Synchrone Zähler
Auffangregister übernehmen mehrere Bits gleichzeitig (in Bild 26-29: mit der Taktvorderflanke) und spei-
Zähler, deren Flipflops alle von einem gemeinsamen Takt gesteuert werden, nennt man synchron.
Bild 26-31. Asynchroner 4-Bit-Binärzähler
G153
G154
G Elektrotechnik / Elektronik
Bild 26-32. Synchroner Dezimalzähler aus 4 JK-
Flipflops
Das Bild 26-32 zeigt als Beispiel einen synchronen Dezimalzähler. Bei ihm kann durch das Lösch-Signal (Reset) R¯ = L der Anfangszustand Q0 = Q1 = Q2 = Q3 = L eingestellt werden. Danach durchläuft die Binärzahl y (vgl. (26-3)) nacheinander die Werte 1, . . . , 9, 0, 1, . . . , 9, 0, 1, . . . Ringzähler und Johnson-Zähler
Durch Rückkopplung kann ein Schieberegister (Bild 26-30) zu einem Zähler werden: entweder zu einem Ringzähler (Bild 26-33) oder zu einem Johnson-Zähler (Bild 26-34). Beim Johnson-Zähler (Bild 26-34a) hängt der periodische Verlauf des Zählerzustandes vom Anfangszustand ab, der über die S- und R-Eingänge der Flipflops vorgegeben werden kann. Es entsteht entweder (Bild 26-34b) die Folge y = 1, 3, 7, 15, 14, 12, 8, 0, 1, 3, 7 . . . @ABC Periode
oder (Bild 26-34c) Bild 26-34. Johnson-Zähler
y = 5, 11, 6, 13, 10, 4, 9, 2, 5, 11, 6 . . . @ABC Periode
Bei einem Johnson-Zähler aus beispielsweise fünf JK-Flipflops sind je nach Anfangszustand vier verschiedene periodische Verläufe möglich; für drei von ihnen gilt T = 10T C und für einen T = 2T C . Beispiel: Johnson-Zähler mit asymmetrischer Rückkopplung
Bild 26-33. Ringzähler
Es soll eine Schaltung aufgebaut werden, bei der sieben Leuchtdioden ständig nacheinander aufleuchten: wenn Diode 1 erlischt, leuchtet 2 auf; wenn 2 erlischt, leuchtet 3 auf; . . .; wenn 7 erlischt, leuchtet
27 Halbleiterbauelemente
Bild 26-35. Schieberegister mit asymmetrischer Rückkopplung
(Bild 26-36b). Für y4 ist die Realisierung in Bild 26-35 eingezeichnet, die Steuerausgänge für die anderen 6 Dioden sind nicht dargestellt, um das Schaltbild übersichtlich zu lassen. Wählt man übrigens einen Anfangszustand aus, der in der Abfolge des Impulsdiagramms (y = 0, 1, 3, 7, 14, 12, 8, 0, 1, 3 . . .) nicht vorkommt, so stellt sich trotzdem nach spätestens fünf Steuerimpulsen C der periodische Ablauf des Impulsdiagrammes Bild 26-36a ein. Daher ist es für die Erzeugung der aufeinander folgenden Impulse an den sieben Ausgängen y1 , . . . , y7 zur Ansteuerung der Leuchtdioden nicht nötig, das Register zu Beginn mithilfe von S- und R-Eingängen in einen bestimmten Anfangszustand zu versetzen.
27 Halbleiterbauelemente 27.1 Grundprinzipien elektronischer Halbleiterbauelemente Bild 26-36. Nacheinanderansteuerung von 7 Leuchtdioden,
27.1.1 Ladungsträger in Silizium
Lampen oder dgl.
Eigenschaften des eigenleitenden Siliziums
wieder 1 auf usw. Dies kann z. B. mit einem asymmetrisch rückgekoppelten Schieberegister realisiert werden (Bild 26-35). Geht man von dem Anfangszustand Q0 = Q1 = Q2 = Q3 = 0 aus, so ergibt sich ein Impulsdiagramm, bei dem für die Periode T der Flipflopausgänge gilt: T = 7T C (Bild 26-36a). Die Verknüpfungen
Das heute technisch bedeutendste Halbleitermaterial ist das vierwertige Silizium. Es steht in der IV. Hauptgruppe des Periodensystems der Elemente und kristallisiert in einer sog. Diamantgitterstruktur. Diese räumliche Tetraederstruktur kann man in der Ebene, wie Bild 27-1 zeigt, vereinfacht darstellen. Jede der vier freien Bindungen eines Siliziumeinzelatoms findet im idealen Gitteraufbau einen Partner bei insgesamt vier Nachbaratomen. Alle Elektronen des Siliziums sind demnach im Gitteraufbau gebunden; es stehen keine freien Elektronen, wie beispielsweise bei Metallen, zum Stromtransport zur Verfügung. Bei sehr tiefen Temperaturen ist Silizium tatsächlich extrem hochohmig, und die Leitfähigkeit nimmt – anders als bei metallischen Leitern – mit steigender
y1 = Q¯ 3 Q¯ 0 , y2 = Q0 Q¯ 1 , y3 = Q1 Q¯ 2 , y4 = Q2 Q¯ 3 = Q2 Q0 , y5 = Q3 Q1 , y6 = Q¯ 1 Q2 , y7 = Q¯ 2 Q3 liefern eine Folge von Impulsen, mit denen die Leuchtdioden angesteuert werden können
G155
G156
G Elektrotechnik / Elektronik
te der Elektron-Loch-Paare, heißt Eigenleitungsdichte ni . Ein von außen angelegtes elektrisches Feld übt auf Elektronen und Löcher Kräfte entgegengesetzter Richtungen aus: es kommt zum Ladungstransport infolge der Elektronen- und des Löcherstroms. Reine Halbleiter werden als NTC-Widerstände (negative temperature coefficient) angewendet. Bild 27-1. a Kristallgitter des Siliziums; b ebene Darstellung des Siliziumgitters
Temperatur zu. Die Erklärung dafür liegt in der mit der Temperatur zunehmenden Instabilität des Gitters. Einige Gitterbindungen brechen auf, d. h., Elektronen werden frei und können sich im Gitter bewegen. In die entstandene Bindungslücke, deren Gebiet durch das fehlende Elektron elektrisch positiv wirkt, kann ein benachbartes Elektron springen, das seinerseits eine Bindungslücke hinterlässt. Obwohl dieser Vorgang aus Elektronenbewegungen besteht, erscheint es so, als ob sich die Bindungslücke bewegt, und es hat sich als zweckmäßig erwiesen, die bewegliche Bindungslücke als ein eigenständiges, einfach positiv geladenes Teilchen, ein sog. Loch, aufzufassen (Bild 27-2). Diesen Vorgang des Aufbrechens einer Gitterbindung und des gleichzeitigen Entstehens eines Elektron-Loch-Paares, nennt man Generation. Beim Anlegen einer Spannung an den Halbleiterkristall sind bewegliche Ladungsträger (Elektronen und Löcher) für den Ladungsträgertransport vorhanden: der Kristall ist leitfähig. Treffen ein Elektron und ein Loch zusammen, wird die Gitterbindung wieder geschlossen und beide Ladungsträger verschwinden gleichzeitig: sie rekombinieren. Die räumliche Dich-
Bild 27-2. Elektron-Loch-Paarbildung durch thermische Generation, a im ebenen Gittermodell und b im Bändermodell
Eigenschaften des dotierten Siliziums
Die Konzentration der freien Ladungsträger ist in einem reinen Siliziumkristall bei Zimmertemperatur mit 1010 cm−3 außerordentlich klein gegenüber der Elektronenzahldichte eines metallischen Leiters von etwa 1023 cm−3 . Die Elektronenzahldichte und damit die Leitfähigkeit von Silizium kann erhöht werden, wenn man Atome der V. Hauptgruppe des periodischen Systems (z. B. Phosphor oder Arsen) anstelle von Siliziumatomen auf regulären Gitterplätzen einbaut (Donatoren). Das fünfte Elektron, das keine Gitterbindung eingehen kann, wird schon durch die Zufuhr einer geringen Energie (sehr viel niedriger als Zimmertemperatur) vom Atom gelöst. Zusätzlich zu den Elektron-Loch-Paaren befinden sich etwa so viele Elektronen im Kristall, wie fünfwertige Atome in das Gitter eingebaut sind. Die Zahl der im Kristall vorhandenen freien Elektronen ist dann weit größer, als die der Löcher, man spricht von einem N-dotierten Silizium oder kurz N-Silizium. Die Elektronen bezeichnet man in diesem Fall als die Majoritätsträger, die Löcher als die Minoritätsträger. Der Kristall ist elektrisch neutral, weil jedes ionisierte Donatoratom elektrisch positiv geladen ist. Im Gegensatz zu einem Loch ist das ionisierte positive Störatom fest im Gitter eingebaut und daher unbeweglich und kann nicht zum Stromtransport beitragen (Bild 27-3). Die Zahl der Löcher im Kristall wird kleiner als im Fall der Eigenleitung. Das Verhältnis von Majoritätsträgern zu Minoritätsträgern wird durch das Massenwirkungsgesetz, p · n = n2i , geregelt. Die Leitfähigkeit lässt sich analog auch durch den Einbau von dreiwertigen Atomen (z. B. Aluminium, Bor oder Gallium) in das Siliziumgitter erreichen. In die unvollständige Gitterbindung am Ort des dreiwertigen Störatoms kann schon bei geringer Energiezufuhr leicht ein Elektron springen. Es fehlt dann für andere Gitterbindungen; ein Loch ist gleichzei-
27 Halbleiterbauelemente
Bild 27-3. N-Leitung in einem Siliziumkristall infolge io-
nisierter fünfwertiger Störstellen (Phosphor), a im ebenen Gittermodell und b im Bändermodell
Bild 27-4. P-Leitung in einem Siliziumkristall infolge ionisierter dreiwertiger Störstellen (Bor); a im ebenen Gittermodell und b im Bändermodell
tig mit einer ortsfesten negativen Ladung entstanden (Bild 27-4). Der Halbleiter ist P-dotiert, P-leitend oder ein P-Halbleiter. In diesem Fall sind die Löcher Majoritätsträger, die Elektronen die Minoritätsladungsträger. 27.1.2 Das Bändermodell
Zur Erklärung vieler Eigenschaften von Halbleiterbauelementen ist es zweckmäßig, die potenziellen Energien der beteiligten Elektronen im Halbleiterkristall heranzuziehen. Eine Darstellung, die die Energie der Elektronen unter Einbeziehung ihres Wellencharakters über dem Ort des Kristalls beschreibt, ist das Bändermodell. Es berücksichtigt die Coulomb-Wechselwirkung der eng im Kristall benachbarten Elektronen. Die im Bohr’schen Atommodell auftretenden diskreten Energiewerte der Elektronen und die zugeordneten festen Bahnen spalten sich theoretisch in so viele Einzelwerte auf, wie Atome im Kristall in Wechselwirkung stehen: d. h., die diskreten Energiewerte der Siliziumeinzelatome spalten sich in dichte Energiebänder auf, die
durch verbotene Zonen getrennt sind (Bild 27-5). Wichtig für das Verständnis der Bauelemente ist die Elektronenbesetzung bzw. -Nichtbesetzung der oberen beiden Bänder: dem Leitungs- und dem Valenzband. In Bild 27-2 ist das Bändermodell eines eigenleitenden Kristalls dargestellt. Statistische Betrachtungen liefern die Ergebnisse für die Besetzung des Leitungs- und des Valenzbandes mit Elektronen bzw. Löchern. Die Angaben werden in Abhängigkeit von der energetischen Lage des Fermi-Niveaus EF geliefert. Das Fermi-Niveau ist eine markante Größe der Fermi-Statistik, die die Wahrscheinlichkeit der Besetzung von Energieniveaus mit Elektronen in Festkörpern in Abhängigkeit von der Temperatur und der Teilchenenergie beschreibt, und ist der Energiewert, bei dem die Wahrscheinlichkeit von 50% vorliegt, ob der dort vorhandene Platz mit einem Elektron besetzt ist oder nicht. Dabei kann das Fermi-Niveau durchaus auch in der verbotenen Zone liegen, obwohl sich dort keine Elektronen aufhalten dürfen. (Im Normalfall befindet sich das Fermi-Niveau in Halbleitern in der verbotenen Zone, in Metallen dagegen innerhalb des Leitungsbandes.) Die Abbildungen 27-3 und 27-4 zeigen neben den vereinfachten Kristalldarstellungen die entsprechenden Bändermodelle für dotierte Halbleiter. Die geringe Energiezufuhr zur Ionisierung von Donatoren bzw. Akzeptoren wird durch die kleinen energetischen Abstände zu den Bandkanten Ec (Unterkante Leitungsband) und Ev (Oberkante Valenzband) deutlich.
Bild 27-5. Entstehung von Energiebändern aus den Ener-
gieniveaus der Einzelatome. a Gitterkonstante; e erlaubte Energiewerte; v verbotene Energiewerte
G157
G158
G Elektrotechnik / Elektronik
27.1.3 Stromleitung in Halbleitern Beweglichkeit, Driftgeschwindigkeit
Ohne elektrisches Feld bewegen sich die Elektronen mit thermischer Bewegung durch Stöße mit den äußeren Schalen der Gitteratome oder anderen freien Ladungsträgern auf Zickzackbahnen durch den Kristall (Bild 27-6). Zwischen zwei Stößen legen sie die mittlere freie Weglänge zurück. Da keine Richtung bevorzugt ist, ist der Mittelwert der Geschwindigkeit v¯ = 0; es fließt kein Strom. Unter dem Einfluss eines angelegten elektrischen Feldes E wird ein Elektron zwischen den Stößen mit der Coulombkraft F = −eE beschleunigt. Daraus ergibt sich eine mittlere Geschwindigkeit der Elektronen von vn = −μn · E. Den Proportionalitätsfaktor μn nennt man die Beweglichkeit der Elektronen. Analog gilt für die Löcher vp = μp · E. Leitfähigkeit
Die sich mit der Driftgeschwindigkeit v durch den Kristall bewegenden Ladungsträger stellen per definitionem einen elektrischen Strom dar. Den Zusammenhang zwischen Stromdichte und elektrischer Feldstärke beschreibt das Ohm’sche Gesetz. 1 jges = (In + Ip ) · A = q · (n · μn + p · μp ) · E = σ · E , σ ist die Leitfähigkeit des Halbleitermaterials. Diffusionsströme in Halbleitern
In Metallen spielen Diffusionsströme keine Rolle, da Anhäufungen der einzigen beweglichen Ladungsträgersorte, der Elektronen, durch Feldströme in
Bild 27-6. Thermische Wärmebewegung freier Elektronen im Festkörper; ausgezogene Linie: ohne elektrisches Feld; gestrichelte Linie: unter Einfluss eines elektrischen Feldes
der Relaxationszeit τR ≈ 10−14 s abgebaut werden. Im Halbleiter dagegen gibt es positive und negative Ladungsträger, sodass neutrale Ladungsträgeranhäufungen entstehen können, die sich durch gegen τR langsame Diffusionsvorgänge ausgleichen. Das Auftreten von Diffusionsströmen ist ein wesentliches Merkmal der Halbleiter und eine Voraussetzung für die Funktion aller bipolaren Bauelemente. Teilchen, die sich statistisch bewegen, strömen in Richtung des Konzentrationsgefälles. Elektronen und Löcher bewegen sich im ungestörten Halbleitermaterial mit thermischer Geschwindigkeit ohne Vorzugsrichtung. Liegt ein Konzentrationsgefälle der freien Ladungsträger vor, kommt eine gezielte Bewegung der geladenen Teilchen durch Diffusion zustande, was gleichbedeutend mit einem elektrischen Strom ist: jn, diff = e · Dn · grad n ;
jp, diff = −e · Dp · grad p
27.1.4 Ausgleichsvorgänge bei der Injektion von Ladungsträgern
Unter dem Begriff Injektion versteht man das Einbringen einer zusätzlichen Ladungsträgermenge in den Halbleiter. Dabei ergeben sich zwei grundsätzlich verschiedene Möglichkeiten: Majoritätsträgerinjektion. Beispiel der Injektion von Elektronen in einen N-dotierten Halbleiter (Bild 27-7b): Der Elektronenüberschuss wird im Wesentlichen durch einen Elektronen-Feldstrom in der Relaxationszeit τR abgebaut. Es liegen ähnliche Verhältnisse wie im Metall vor. Minoritätsträgerinjektion. Beispiel der Injektion von Elektronen in einen P-dotierten Halbleiter (Bild 27-7a): Die Raumladung der injizierten Elektronen baut ein elektrisches Feld im P-Halbleiter auf, das einen Löcherfeldstrom zur Folge hat. Die Ladungsanhäufung wird zwar in der Relaxationszeit neutralisiert, aber nicht abgebaut. Der Konzentrationsausgleich erfolgt über Rekombinationsvorgänge bei gleichzeitiger Diffusion. Der Abbau der Ladungsträgerüberschüsse erfolgt mit der Zeitkonstante τ, der Minoritätsladungsträgerlebensdauer, die in Silizium in der Größenordnung von einigen μs liegt. Sie ist etwa um den Faktor 108 größer als die Relaxationszeit τR . Dieses Verhal-
27 Halbleiterbauelemente
Stromloser Zustand. Ausbildung der Raumladungszone
In einem Gedankenmodell werden zwei Halbleiterquader, der eine P-dotiert, der andere N-dotiert, miteinander in Berührung gebracht. Unmittelbar nach der Berührung diffundieren Elektronen aus dem N-Gebiet entlang dem steilen Konzentrationsgefälle in das PGebiet und entsprechend Löcher aus dem P-Gebiet in das N-Gebiet. Sie rekombinieren dort und hinterlassen ortsfest gebundene ionisierte Störstellen, die elektrisch geladene Bereiche, Raumladungen, darstellen. Damit verbunden ist ein von den positiven Donatorionen im N-Gebiet zu den negativen Akzeptorionen im P-Gebiet gerichtetes elektrisches Feld. Es behinBild 27-7. Veranschaulichung des Injektionsvorganges. a Minoritätsträgerinjektion, Elektronen in einen P-Halbleiter; b Majoritätsträgerinjektion, Elektronen in einen N-Halbleiter
ten unterscheidet den Leitungsmechanismus in Halbleitermaterial wesentlich von dem im Metall.
27.2 Halbleiterdioden 27.2.1 Aufbau und Wirkungsweise des PN-Überganges
Der PN-Übergang bildet die Grundlage zum Verständnis aller Halbleiterbauelemente. Man kann ihn sich aus zwei aneinanderstoßenden P- und N-Halbleitern aufgebaut vorstellen. Legt man an den PN-Übergang eine Spannung, so fließt ein erheblich höherer Strom, wenn das P-Gebiet positiv gegenüber dem N-Gebiet ist, als bei entgegengesetzter Polung. Der PN-Übergang wirkt als Gleichrichter oder Diode. Bei Durchlassspannungen von einigen Volt können je nach Querschnitt bis zu mehreren hundert Ampere geführt werden. In Sperrichtung dagegen beträgt der Strom nur wenige Mikroampere. Erhöht man die Sperrspannung über einen bestimmten Wert (Durchbruchspannung UB ), verliert der PN-Übergang seine Sperrfähigkeit und der Strom steigt steil an. Wegen seiner grundlegenden Bedeutung wird der abrupte PN-Übergang hier eingehender behandelt, wobei das grundsätzliche Transportgeschehen durch Drift und Diffusion erklärt werden kann.
Bild 27-8. Stromloser abrupter PN-Übergang. a Eindimen-
sionales Modell. Örtliche Verläufe b der Dotier- und freien Ladungsträgerkonzentrationen, c der Raumladungsdichte, d der Feldstärke, e des Potenzials, f der Bandkanten des Bändermodells
G159
G160
G Elektrotechnik / Elektronik
dert sowohl die Elektronen als auch die Löcher an einer weiteren Diffusion in die Nachbargebiete. Die entstandene Raumladungszone vergrößert sich so lange, bis das mit ihr verknüpfte elektrische Feld keinen Nettostrom mehr über die Grenzfläche zwischen Pund N-Gebiet zulässt. Der PN-Übergang befindet sich in diesem Zustand im thermodynamischen Gleichgewicht. Die Integration über die entstandene elektrische Feldstärke ergibt die Diffusionsspannung UD . Sie beträgt für Silizium bei üblichen Dotierungen etwa 0,8 V. Die Raumladungszone wird sich in das niedriger dotierte Gebiet weiter ausbreiten als in das benachbarte hochdotierte Gebiet, weil sich in beiden Raumladungsbereichen die gleiche Gesamtladung befinden muss. Der Kristall besteht demnach aus den raumladungsfreien Bahngebieten und der Raumladungszone. Die Sperrschichtgrenzen sind von der Dotierung der beiden aneinandergrenzenden Gebiete abhängig. In Bild 27-8 wird, ausgehend vom vereinfachten eindimensionalen Modell des PN-Überganges, die Raumladungszone schrittweise ausgehend von der Poissongleichung über den Ort integriert. Als erstes Ergebnis erhält man den Feldstärkeverlauf E(x) und aus dem zweiten Integrationsschritt den örtlichen Verlauf des Potenzials V(x). Aus der Potenzialdifferenz über der Raumladungszone lässt sich die Diffusionsspannung UD ablesen. Die Multiplikation des Potenzials mit der Elektronenladung liefert die potenzielle Energie der Elektronen und damit den örtlichen Verlauf der Bandkanten des Bändermodells eines PN-Überganges. 27.2.2 Der PN-Übergang in Flusspolung
Das thermodynamische Gleichgewicht, das zur Ausbildung der Raumladungszone geführt hatte, wird durch Anlegen einer äußeren Spannung gestört. Die Spannung des P-Gebietes soll positiv gegenüber dem N-Gebiet sein: Bei Flusspolung überlagert sich die von außen angelegte Spannung U der Diffusionsspannung UD , wodurch das über der Raumladungszone liegende elektrische Feld geschwächt wird. Es können jetzt mehr Elektronen und Löcher über die Sperrschicht diffundieren, als vom elektrischen Feld zurücktransportiert werden, weil das elektrische Feld, das den Diffusionsstrom im stromlosen Fall noch kompensieren
Bild 27-9. PN-Übergang in Flusspolung. a Polarität der an-
gelegten Spannung, b Konzentrationsverlauf, c Bandverlauf
konnte, nun kleiner geworden ist. Die in die Nachbargebiete diffundierenden Ladungsträger stellen eine Minoritätsträgerinjektion dar und erhöhen die Minoritätsträgerkonzentrationen an den Sperrschichträndern. Die zu ihrer Kompensation notwendigen Ladungsträger werden von den Kontakten geliefert und stellen den Strom dar, den der PN-Übergang führt. Der wesentliche Effekt bei Flusspolung am PNÜbergang ist also, dass nach Anlegen der Spannung die Diffusion überwiegt und damit das ursprüngliche Gleichgewicht von Diffusion und Drift stört. Die Verkleinerung der Raumladungszone bei Flusspolung ist als ein Nebeneffekt zu betrachten, der allein nicht die gute Durchlasseigenschaft erklärt. 27.2.3 Der PN-Übergang in Sperrpolung
(Bild 27-10) Bei Anlegen einer Spannung, die das N-Gebiet positiv gegenüber dem P-Gebiet polt, wird das elektrische Feld der Raumladungszone noch verstärkt. Der Driftstrom überwiegt den Diffusionsstrom in der Raumladungszone. Das elektrische Feld ist so gerichtet, dass es nur Minoritätsträger transportieren kann. Die sind allerdings in den Bahngebieten nicht zahlreich vorhanden und müssen aus einer kleinen Konzentration an die Sperrschichtränder herandiffundieren. Deshalb
27 Halbleiterbauelemente
Bild 27-12. Zener-Durchbruch als Folge des quantenmechanischen Tunneleffekts
Bild 27-10. PN-Übergang in Sperrpolung. a Polarität der
angelegten Spannung, b Konzentrationsverlauf, c Bandverlauf
führt der PN-Übergang in Sperrichtung nur einen sehr kleinen Strom, der in erster Näherung unabhängig von der angelegten Sperrspannung ist. Bei dieser Polung der Spannung weitet sich die Raumladungszone abhängig von der angelegten Spannung weit in den Halbleiter aus. 27.2.4 Durchbruchmechanismen
Lawinendurchbruch (Bild 27-11) An dem im Bild 27-8 dargestellten Verlauf der Feldstärke ändert sich bei angelegter Sperrspan-
nung die Höhe des Feldstärkemaximums an der Dotierungsgrenze. Da auch der Weg, der durch die Sperrschicht gelangenden Minoritätsträger länger wird, kann die Aufnahme der kinetischen Energie auf der mittleren freien Weglänge zu Ionisierungen von Gitteratomen, d. h. zur Generation von ElektronLoch-Paaren, führen. Die neu entstandenen freien Ladungsträger können wiederum Ionisierungen auslosen. Das kann zum lawinenartigen Anwachsen des Sperrstromes führen. Der Wert der Sperrspannung, bei dem der Lawinendurchbruch auftritt, nennt man Durchbruchspannung UB . Zener-Durchbruch (Bild 27-12) Der Zener-Durchbruch tritt bei Dioden mit beidseitig hochdotierten Zonen auf. Er beruht auf dem quantenmechanischen Tunneleffekt: Ein Elektron kann hinreichend dünne Potenzialschwellen ohne Energieverlust überwinden. Ein Elektron mit der Energie E1 sieht sich in der Sperrschicht einer dreieckigen Potenzialschwelle gegenüber, deren Höhe dem Bandabstand Ec − Ev entspricht und deren Breite b ist. Die Steigung der Bandkante entspricht der elektrischen Feldstärke, d. h., die Breite b nimmt mit steigender Feldstärke ab. Die Tunnelwahrscheinlichkeit steigt mit abnehmender Breite b, sodass ab einer kritischen Feldstärke viele Ladungsträger die Sperrschicht überwinden können. 27.2.5 Kennliniengleichung des PN-Überganges
Bild 27-11. Ladungsträgermultiplikation beim Lawinen-
durchbruch
Trifft man einige Vereinfachungen, wie ladungsneutrale Bahngebiete, keine Generation oder
G161
G162
G Elektrotechnik / Elektronik
Bild 27-13. Diodenkennlinie mit dem Schaltzeichen und Spannungsrichtung Bild 27-14. Spannungsstabilisierung mit einer Zenerdiode
Rekombination in der Sperrschicht und keine starken Injektionen, d. h., die Minoritätsträgerkonzentrationen an den Sperrschichträndern bleiben klein gegenüber den Majoritätsträgerkonzentrationen, ergibt sich bei eindimensionaler Rechnung die Kennlinie eines PN-Übergangs. j = j0 [exp (eU/kT ) − 1] . Für große negative Spannungen nimmt die Stromdichte j den Wert j0 an, die deshalb Sättigungsstromdichte heißt. In Bild 27-13 ist die Kennlinie und das Schaltbild einer Diode dargestellt. 27.2.6 Zenerdioden
Dioden sperren nur bis zu einer bestimmten Durchbruchspannung UB . Von UB an steigt der Sperrstrom steil mit der Spannung an. Sind P- und N-Gebiet hochdotiert, (Na , Nd > 1017 cm−3 ), so ist der Durchbruch auf den Zener-Durchbruch (UB < 5 V) zurückzuführen, sonst auf den Lawinendurchbruch (UB > 5 V). Den steilen Stromanstieg oberhalb UB nutzt man zur Spannungsstabilisierung aus. Die Spannung ändert sich selbst bei Stromänderungen von mehreren Größenordnungen nur wenig. Dioden, die bestimmungsgemäß im Durchbruch betrieben werden, nennt man unabhängig vom Durchbruchmechanismus Z-Dioden oder auch Zenerdioden. Bild 27-14 zeigt das Schaltzeichen der Z-Diode, die Kennlinie und die Grundschaltung zur Spannungsstabilisierung. Als Stabilisierungsfaktor bezeichnet man das Spannungsverhältnis U0 /Uz . 27.2.7 Tunneldioden
Eine Tunneldiode ist so hoch dotiert, dass die (mit der Elementarladung e multiplizierte) Diffusionsspannung größer wird als der Bandabstand.
Das Ferminiveau liegt dann in den erlaubten Bändern. Dadurch wird der Tunnelprozess auch in Flussrichtung möglich. Die Wirkungsweise wird an dem vereinfachten Bändermodell in den Bildern 27-15a bis e erläutert. Für die verschiedenen Spannungszustände ergeben sich unterschiedliche Tunnelwahrscheinlichkeiten, die in der Kennlinie der Tunneldiode zu einem negativen Kennlinienbereich („negativen Widerstand“) führen. Das kann zur Entdämpfung von Schwingkreisen ausgenutzt werden. (Anwendungsbereich: Erzeugung und Verstärkung sehr hoher Frequenzen bis 100 GHz).
Bild 27-15. Bändermodell und Kennlinie der Tunneldiode, a Tunnelstrom in Sperrichtung aufgrund des ZenerDurchbruchs; b stromloser Fall; c maximaler Tunnelstrom in Vorwärtsrichtung. Elektronen aus dem Leitungsband tunneln in den freien Teil des Valenzbandes; d Zurückgehen des Tunnelstromes wegen kleiner werdender Überlappung zwischen dem besetzten Teil des Leitungsbandes und dem leeren Teil des Valenzbandes; e Zunahme des Stromes aufgrund des Injektionsstromes wie bei einer normalen Diode
27 Halbleiterbauelemente
27.2.8 Kapazitätsdioden („Varaktoren“)
Bei den Kapazitätsdioden (siehe Bild 27-16) wird die Abhängigkeit der differenziellen Sperrschichtkapazität von der Sperrspannung ausgenutzt. Bei einer Erhöhung der Sperrspannung nimmt die Dicke der Raumladungszone zu. Während der Spannungserhöhung fließt ein Strom, um die freien Ladungsträger aus dem sich ausdehnenden Raumladungsgebiet abzuführen. Wird die Spannung wieder angesenkt, muss die sich verkleinernde Raumladungszone mit freien Ladungsträgern gefüllt werden. Der PNÜbergang zeigt ein kapazitives Verhalten. Das von der Sperrschicht herrührende kapazitive Verhalten wird deswegen Sperrschichtkapazität Cs genannt. Für den abrupten PN-Übergang ist die Sperrschichtkapazität dem reziproken Quadrat der Sperrspannung proportional. Dieser funktionale Zusammenhang kann durch die Wahl des Dotierungsprofiles beeinflusst werden. Wählt man für die Dotierung einen geeigneten Verlauf des Dotierungsprofiles, lässt sich daraus ein Kapazitätsverlauf Cs (U) erzielen, der in Schwingkreisen zu einer linearen Beziehung zwischen Spannung und Frequenz führt. Die Kapazitätsdiode ist für elektronische Frequenzabstimmung, Frequenzmodulation und parametrische Verstärkung geeignet. 27.2.9 Leistungsgleichrichterdioden, PIN-Dioden
Als Anforderung an eine gute Leistungsdiode stehen hohe Sperrfähigkeit bei geringen Durchlassverlusten im Vordergrund. Für die Herstellung stellt sich diese Doppelforderung als ein Widerspruch heraus, weil eine hohe Sperrspannung lange, gering dotierte Gebiete erforderlich macht, die wiederum zu schlechten
Bild 27-16. Zur Veranschaulichung der differenziellen Sperrschichtkapazität Cs bei Belastung des PN-Überganges in Sperrichtung und Schaltzeichen der Kapazitätsdiode
Durchlasseigenschaften (hohe Bahnwiderstände) führen. Einen gelungenen Kompromiss stellt die PIN-Diode dar. Der Name PIN-Diode beschreibt den Aufbau dieses Diodentyps. Eine im Idealfall eigenleitende I-Zone wird zwischen zwei hochdotierte P- und N-Gebiete angeordnet. In der Praxis wird es eine schwach dotierte Zone sein, deshalb wird auch oft der Name PSN-Diode verwendet. Der Vorteil dieser Anordnung liegt im Sperrverhalten. Die beweglichen Ladungsträger werden aus der I-Zone und dem Rand der hochdotierten Gebiete abgesaugt. Die Feldlinien laufen dann von den entblößten Donatoren der N-Seite zu den negativen Akzeptoren der P-Seite. Die Feldverhältnisse sind ähnlich wie beim Plattenkondensator. Die PIN-Diode kann bei gleicher Sperrschichtweite die doppelte Spannung gegenüber einer P+ N-Diode (P+ bedeutet ein sehr hoch dotiertes P-Gebiet) bei gleicher maximaler Feldstärke aufnehmen (Bild 27-17). Das Durchlassverhalten der PIN-Diode ist grundsätzlich unterschiedlich zu dem eines PN-Überganges: Von beiden Randzonen werden Ladungsträger in das I-Gebiet injiziert, das dadurch mit Ladungsträgern überschwemmt wird (Bild 27-18). Der Strom, den die PIN-Diode führt, wird durch die im I-Gebiet rekombinierenden Ladungsträger verursacht. Die Kennliniengleichung ist mit der eines P+ N-Überganges vergleichbar und lautet: eU jPIN = j0 (PIN) e 2kT − 1
Bild 27-17. Sperrspannung und Feldstärkeverlauf in einer
PIN-Diode im Vergleich zur P+ N-Diode
G163
G164
G Elektrotechnik / Elektronik
Tunnelstrom ist ein Majoritätsträgereffekt und unterliegt nicht den Diffusions- und Speichereffekten, sodass die Eigenschaften der Rückwärtsdiode weitgehend frequenzunabhängig sind. Sie ist bis in das GHzGebiet einsetzbar und findet ihre Hauptanwendung in der Mikrowellengleichrichtung und Mikrowellenmischung.
27.3 Bipolare Transistoren 27.3.1 Prinzip und Wirkungsweise
Bild 27-18. Konzentrationsverläufe in einer PIN-Diode
Die Sättigungsstromdichte ist um ein Vielfaches größer als beim PN-Übergang. 27.2.10 Mikrowellendioden, Rückwärtsdioden
Bei der Rückwärtsdiode (siehe Bild 27-19) ist die Pund N-Dotierung so gewählt, dass der Zenerdurchbruch schon bei beliebig kleinen Sperrspannungen auftritt. In Vorwärtsrichtung ist der Strom bis zu einigen Zehntel Volt beträchtlich kleiner als der Tunnelstrom in Rückwärtsrichtung. Sie wird deswegen in Rückwärtsrichtung als Flussrichtung eingesetzt. Der
Bild 27-19. Kennlinie, Bändermodell (stromloser Fall) und
Schaltzeichen einer Rückwärtsdiode
Der Bipolartransistor ist ein Bauelement, das aus drei Halbleiterschichten, die entweder in der Reihenfolge NPN oder PNP aufgebaut sind. Daraus ergibt sich eine Anordnung von zwei hintereinandergeschalteten PN-Übergängen, verbunden durch eine einkristalline Halbleiterschicht, die Basis. Jede Schicht ist mit einem metallischen Kontakt versehen. Bild 27-20 zeigt ein eindimensionales PNP-Transistormodell mit seinen Anschluss-, Spannungs- und Strombezeichnungen sowie den prinzipiellen Aufbau eines NPN-Transistors. Daneben sind die Schaltzeichen für beide Transistortypen dargestellt. Das Transportverhalten der Ladungsträger betrachten wir im Folgenden beispielhaft für den PNP-Transistor. Im Normalbetrieb ist die Basis-Emitter-Diode in Durchlassrichtung, die Basis-Kollektor-Diode in Sperrichtung gepolt. Aus der Diodentheorie (27.2.2) ergibt sich wegen der Flusspolung eine Anhebung der Minoritätsträgerkonzentration (gegenüber dem Gleichgewichtswert) am emitterseitigen Basisrand; am kollektorseitigen Basisrand stellt sich dagegen
Bild 27-20. Modell eines PNP-Transistors. a Schematische Anordnung der Dreischichtenfolge; b Schaltzeichen für PNP- und NPN-Transistor; c prinzipieller Aufbau eines NPN-Transistors
27 Halbleiterbauelemente
wegen der Sperrpolung eine Absenkung auf nahezu Null ein. Die vom Emitter in die Basis injizierten Löcher diffundieren bis zur Kollektorsperrschicht und werden dort als Minoritätsträger vom elektrischen Feld der Raumladungszone in den Kollektor gesaugt. Für den Kollektor bedeutet das eine Majoritätsträgerinjektion, d. h., die Überschussladung wird in Form eines Stromes aus dem Kollektorkontakt abgeführt. Bei großer Basisbreite ist dieser Strom allerdings sehr klein und die PNP-Schicht wirkt nur als Zusammenschaltung von Dioden (vgl.Bild 27-22 ohne gesteuerte Quellen), die passiv ist. Der eigentliche Transistoreffekt, der zu einer Verstärkungswirkung des Bauelementes führt, ergibt sich erst bei einer sehr starken Verringerung der Basisweite, sodass genügend viele Löcher über die Basiszone diffundieren können und in den Kollektor injiziert werden. Bei entsprechender Dimensionierung der Basisweite – bezogen auf die Diffusionslänge – ergibt sich ein nahezu geradliniger Verlauf der Minoritätsträger in der Basis (Bild 27-21). Die Größe des Kollektorstromes ist von der Menge der in den Kollektor diffundierenden Löcher und damit von der Steigung der Löcherkonzentration am Sperrschichtrand abhängig und kann mithilfe der Durchlassspannung über dem Emitter-Basis-PN-Übergang gesteuert werden. Die Steigung lässt sich durch die Höhe der Injektion durch den P-Emitter einstellen. Rekombinationsverluste in der Basis führen zu einer Abnahme der
Steigung und damit Verkleinerung des Kollektorstromes. Der Transistoreffekt ist also auf einen reinen Minoritätsträgereffekt in der Basis zurückzuführen. Von der Dimensionierung der Basis hängt das elektrische Verhalten des Transistors entscheidend ab. Die Wirkungsweise des bipolaren Transistors ist mit der eines gesperrten PN-Überganges vergleichbar, dessen Sperrstrom steuerbar ist. Der Kollektorstrom ergibt sich aus dem Anteil α · IE des Emitterstromes, der den Kollektor erreicht und dem Sperrstrom der Basis-Kollektor-Diode ICBO : (üblicherweise 0,99 < α < 1) IC = α · IE + ICB0 . Für einen Faktor α der möglichst nahe bei 1 liegt, ist eine hohe Löcherinjektion am Emitterrand der Basis notwendig. Diese Eigenschaft wird als Emitterwirkungsgrad bezeichnet und erfordert eine hohe Dotierung des Emitters gegenüber der Basis. Weiterhin sollen möglichst alle Löcher ohne zu rekombinieren den Kollektorsperrschichtrand erreichen (Transportfaktor), das erfordert eine kleine Basisweite gegenüber der Diffusionslänge. Damit sind die Grundbedingungen für die Herstellung von Transistoren genannt. Aufgrund der Beziehung IE = IB + IC erhalten wir IC = β IB mit der Stromverstärkung β = IC /IB = α/(1 − α); ein typischer Wert ist β = 99 (für α = 0,99). Das für den PNP-Transistor erläuterte Prinzip gilt entsprechend für den NPN-Transistor. Ersatzschaltbilder und Vierpolparameter
Ähnlich wie für den PN-Übergang lässt sich auch der Transistor mit dem Halbleitergleichungssystem berechnen und man erhält als Ergebnis zwei Ausdrücke für den Emitterstrom IE und den Kollektorstrom IC : IE = IED − α1 · ICD
Bild 27-21. Transistormodell und Minoritätsträgerkonzen-
trationsverlauf
und
IC = α · IED − ICD .
Die Ausdrücke für IED und ICD sind Diodenströme, die die Spannungsabhängigkeiten der Basis- und Kollektordiode beschreiben. Daraus lässt sich ein Ersatzschaltbild mit gesteuerten Stromquellen (Bild 27-22) konstruieren. Je nach Anwendungsgebiet kann das Ersatzschaltbild vereinfacht werden.
G165
G166
G Elektrotechnik / Elektronik
Grenzfrequenz ergibt sich für die Basisschaltung eine der reziproken Transitzeit proportionale Größe. 27.3.2 Universaltransistoren. Kleinleistungstransistoren Bild 27-22. Ersatzschaltbild eines Transistors
Für die Vierpoldarstellung des Transistors wird das Ergebnis der Kennlinienberechnung für die Leitwertparameterdarstellung in der Form: IE = IE (UEB , UCB ) ;
IC = IC (UEB , UCB )
geschrieben. Für kleine Wechselspannungen u und kleine Wechselströme i werden die Kennliniengleichungen durch eine Taylorentwicklung angenähert: ie = y11 · ue + y12 · uc ;
iC = y21 · ue + y22 · uC .
Spannungsgrenzen des Transistors. Lawinendurchbruch
Wie in einer Diode kann in der Kollektorsperrschicht der Lawinendurchbruch auftreten, der bei offenem oder kurzgeschlossenem Emitter bei den gleichen Spannungswerten einer vergleichbaren Diode liegt. Ist dagegen die Basis offen, wird durch den Lawinenstrom die Majoritätsträgerkonzentration in der Basis erhöht und dadurch der Emitter veranlasst, noch stärker zu injizieren. Dadurch sinkt die Spannungsgrenze des Transistors unter den entsprechenden Wert einer vergleichbaren Diode.
Kleinleistungstransistoren sind typischerweise PNPTransistoren mit diffundierten PN-Übergängen. Ihre Verlustleistung liegt bei einigen 100 mW. Sie werden in Baureihen von 30 V, 60 V und 100 V für die Kollektorspannung, 5 bis 10 V für die Emitter-BasisSpannung und bis zu maximal 500 mA für den Kollektorstrom, angeboten. Die Grenzfrequenzen liegen zwischen 10 und 100 MHz. 27.3.3 Schalttransistoren
Transistoren lassen sich auch als Schalter betreiben. Die eingeführten Vereinfachungen bei der Vierpolbetrachtung sind nicht anwendbar, denn sie gelten für Kleinsignalaussteuerungen. Wichtig sind für den Betrieb eines Schalttransistors die beiden Zustände EIN und AUS und die dynamischen Übergänge. Im AUS-Zustand muss der Transistor einen hohen Widerstand bei hoher Sperrfähigkeit besitzen und im EIN-Zustand muss er einen möglichst großen Strom bei kleinem Spannungsabfall führen können. In der Praxis wird man für Schalttransistoren die Emitterschaltung verwenden, da mit ihr sowohl Strom- als auch Spannungsverstärkung erzielt werden können. Im Kennlinienfeld der Emitterschaltung ändert sich der Arbeitspunkt beim Schaltbetrieb schnell zwischen den beiden in Bild 27-23 markierten Endzuständen. Der Kennlinienbereich unterhalb des AUS-Zustandes
Punch-through-Effekt
Durch Erhöhung der Kollektorspannung breitet sich die Raumladungszone weiter in die Basis aus. Berührt die Kollektorsperrschicht den Emittersperrschichtrand, ist die Punch-through-Spannung erreicht und die Basis kann den Transistor nicht mehr steuern, es fließt ein starker Emitter-Diffusionsstrom. Frequenzverhalten des Transistors
Der Transistoreffekt beruht auf der Diffusion von Minoritätsträgern durch die Basis. Dafür benötigen sie eine Laufzeit oder Transitzeit ttr , die von der Basisdicke und der Diffusionskonstanten D abhängt. Als
Bild 27-23. Arbeitspunkte im Emitterkennlinienfeld eines Schalttransistors. I Sperrbereich, II Aktiver Bereich, III Sättigungsbereich
27 Halbleiterbauelemente
(Sperrbereich) wird durch Anlegen von Sperrspannungen an den Emitter- und den Kollektorübergang erreicht. Der Kennlinienzweig für IB = 0 trennt den Sperrbereich vom aktiven Bereich. Im aktiven Bereich, dem Normalbetrieb für Transistoren, liegt der Emitter an Durchlasspolung, der Kollektor wird in Sperrichtung betrieben. Wird die Kollektor-Emitter-Spannung vom EINZustand weiter verkleinert, wird auch die Kollektordiode in Durchlassrichtung betrieben und beide Übergänge injizieren in die Basis und überschwemmen sie mit Ladungsträgern. Dieser Betriebsbereich hat deswegen sinngemäß den Namen Sättigungsbereich erhalten. In Bild 27-24 wird der Schaltvorgang erläutert. Zum Zeitpunkt t = 0 wird ein konstanter Basisstrom eingeschaltet. Während der Zeit td wird das Konzentrationsgefälle in der Basis aufgebaut, ohne dass ein nennenswerter Kollektorstrom fließt. Diese Anfangsphase heißt Verzögerungszeit td (delay time) und wird als die Zeit bis zum Erreichen des 10%-Wertes des endgültigen Kollektorstromes definiert. Während der Zeit tr (rise time) steigt das Konzentrationsgefälle am Kollektorsperrschichtrand. Sie wird bis zum Erreichen des 90%-Wertes des Kollektorstromes definiert. Anschließend wird die Speicherladung in der Basis noch weiter erhöht, ohne dass sich die Steigung
Bild 27-24. Schaltvorgang zwischen Sperrbereich und aktivem Bereich. a Emitterstrompuls, b zeitlicher Verlauf des Kollektorstromes; td Verzögerungszeit, tr Anstiegszeit, tf Abfallzeit
oder der Kollektorstrom noch merklich ändern. Der Ausschaltvorgang gestaltet sich ähnlich. Während der Speicherzeit ts (storage time) wird die Speicherladung abgebaut, der Strom ändert sich nur wenig. Erst während der Abfallzeit tf (fall time) wird das Konzentrationsgefälle kleiner und der Strom nimmt ab. Die Zeitgrenzen werden wie beim Einschalten bei Erreichen des 90%- und 10%-Wertes vom Kollektorstrom abgelesen. Zu bemerken ist, dass ein Ausschaltvorgang aus dem Sättigungsbetrieb längere Speicherzeiten benötigt. Diesen Nachteil muss der Anwender mit dem Vorteil der kleineren Verlustleistung im eingeschalteten Zustand abwägen. Beispiel für die Anwendung von Schalttransistoren sind astabile, bistabile und monostabile Kippschaltungen.
27.4 Halbleiterleistungsbauelemente 27.4.1 Der Thyristor Aufbau und Wirkungsweise
Der Thyristor ist ein Halbleiterbauelement, das ohne einen Gatestrom gesperrt ist, gleichgültig, welche Polarität der angelegten Spannung vorliegt. Ist die Spannung positiv, lässt er sich durch einen kleinen Steuerstrom in einen gut leitenden Zustand schalten und hat dann eine ähnliche Strom-Spannungs-Kennlinie wie die PIN-Diode. Der elektrische aktive Teil eines Thyristors besteht aus drei PN-Übergängen. Die beiden äußeren Schichten sind stark dotiert, während die beiden inneren Basisschichten schwach dotiert sind. Der Anschluss an die äußere P-Schicht wird als Anode, der Anschluss an die äußere N-Schicht wird als Kathode bezeichnet; die Steuerelektrode (Gate[anschluss]) ist an der P-Zone angebracht (Bild 27-25). Zum besseren Verständnis der Funktionsweise zerlegt man den Thyristor gedanklich in zwei Transistoren (Bild 27-26). Die beiden Kollektoranschlüsse des NPN- und des PNP-Transistors sind jeweils mit dem Basisanschluss des anderen Transistors verbunden. Der Kollektorstrom αPNP I des PNP-Transistors fließt als Basisstrom in den PNP-Transistor. Der fehlende Anteil (1 − αPNP I) geht als Rekombinationsstrom in der N-Basis verloren. Entsprechend fließt vom NPN-Transistor der Kollektorstrom αNPN I in die N-Basis des PNP-Transistors, in die zusätzlich noch der Steuerstromanteil αNPN Is fließt. Über den
G167
G168
G Elektrotechnik / Elektronik
Bild 27-27. Summe der Stromverstärkungsfaktoren αNPN + αPNP als Funktion des Stromes bei einer Kathodenfläche von 20 mm2 Bild 27-25. Thyristor. a Schematischer Aufbau der Vierschichtstruktur; b Schaltzeichen
Bild 27-26. Zweitransistormodell des Thyristors
PN-Übergang S 2 , der für beide Teiltransistoren als Kollektor wirkt, fließt in die beiden Basiszonen des Thyristors noch der Sperrstrom IC0 . Die Bilanz der Rekombinationspartner in der N- oder P-Basis liefert nach einer Umformung: IA =
αNPN · IG IC0 + . 1 − (αNPN + αPNP ) 1 − (αNPN + αNPN )
Dieser Zusammenhang wird als Kennliniengleichung bezeichnet. Die Spannung tritt in ihr zwar nicht unmittelbar in Erscheinung, sie ist jedoch im Sperrstrom Ic0 und in den Stromverstärkungsfaktoren αNPN und αPNP enthalten. Für den Verlauf der Kennlinie ist darüber hinaus die Stromabhängigkeit der Stromverstärkungsfaktoren maßgeblich, deren Summe in Bild 27-27 dargestellt ist.
Diskussion der Kennlinie für Is = 0 (offenes Gate)
Bei Erhöhung der Sperrspannung wächst IC0 infolge der Ladungsträgermultiplikation im Übergang S2 an. Wird die Durchbruchspannung erreicht, steigt IC0 steil an und die Summe der Stromverstärkungsfakto ren ( α) wächst gemäß Bild 27-27 gegen 1. Dies führt zu einer Abnahme von IC0 und damit zu einer Abnahme von U2 . Es entsteht ein Kennlinienteil mit negativer Steigung. Erreicht die α den Wert 1, wird Ic0 zu null, d. h., die Spannung U2 wird null. Wächst der Strom IA weiter an, übersteigt die α den Wert 1, der Sperrstrom Ic0 wird negativ; der Übergang S 2 wird in Flussrichtung betrieben. Beide Teiltransistoren des Thyristors arbeiten im Sättigungsbereich. Diskussion der Kennlinie für Is > 0. Bei zusätz-
licher Einspeisung eines Gatestromes gehört ein kleineres Ic0 zu einem vorgegeben IA als bei Is = 0, damit wird der Spannungswert für die Zündung des Thyristors herabgesetzt (Bild 27-28). Ausschalten des Thyristors
Im Durchlassbereich sind die Basiszonen mit beweglichen Ladungsträgern „überschwemmt“. Es liegen Verhältnisse wie in einer durchlassbelasteten PINDiode vor. Damit der Thyristor in Sperrrichtung oder in der Vorwärtsrichtung sperren kann, müssen diese gespeicherten Ladungsträger abgebaut werden. In welcher Zeit das erfolgt, hängt von den Bedingungen des äußeren Stromkreises und den Rekombinationsverhältnissen im Thyristor ab. Den Anwender inter-
27 Halbleiterbauelemente
Die heute üblichen Werte für β0 liegen zwischen 5 und 10. Man muss zwar einen kräftigen Steuerstrom aufwenden um den Thyristor abzuschalten, dieser Strom braucht aber nur für kurze Zeit von wenigen μs zu fließen. Darin liegt ein wesentlicher Vorteil des GTO-Thyristors gegenüber Transistoren. 27.4.3 Zweirichtungs-Thyristordiode (Diac)
Bild 27-28. Strom-Spannungs-Kennlinie eines Thyristors
mit IG als Parameter
essiert in erster Linie die Zeitspanne nach Abschalten des Stromes, bis der Thyristor in Vorwärtsrichtung sperrfähig wird. Diese Zeit bezeichnet man als Freiwerdezeit. 27.4.2 Der abschaltbare Thyristor
Um einen Thyristor mittels Steuerstrom abzuschalten, muss der Steuerbasis ein hinreichend großer negativer Steuerstrom entzogen werden, (GTO-, Gate-turn-offThyristor), (Bild 27-29). Der Thyristor schaltet aus, wenn die Flusspolung am Übergang S1 wieder aufgehoben wird, d. h. wenn U2 null oder gar negativ wird. Der zum Abschalten eines Anodenstroms IA0 notwendige negative Steuerstrom heißt IG0 . Als Abschaltverstärkung β0 bezeichnet man: β0 =
27.4.4 Bidirektionale Thyristordiode (Triac)
Bidirektionale Thyristordioden (Triacs) können sowohl bei positiver als auch bei negativer Spannung durch einen positiven oder negativen Gatestrom
IA0 . |IG0 |
Bild 27-29. Schema der Gate-Kathoden-Struktur eines
GTO-Thyristors
Wird in ein symmetrisches PNP-System die Kathoden-N-Zone in der einen Scheibenhälfte in die obere und in der anderen Scheibenhälfte in die untere P-Schicht eingelassen und werden beide Scheibenseiten ganz kontaktiert, so entsteht ein fünfschichtiges Gebilde, das einer integrierten Schaltung aus zwei antiparallelen Thyristoren ohne Steueranschluss entspricht. Die Strom-Spannungskennlinie dieser Anordnung verfügt über je eine Schaltcharakteristik in Vorwärts- und Rückwärtsrichtung. Solche bidirektionalen Thyristordioden können durch Überschreiten der Kippspannung oder durch steilen Anstieg der Spannung gezündet werden (Bild 27-30).
Bild 27-30. Schematischer Schichtenaufbau, Schaltzeichen und Kennlinie einer Zweirichtungs-Thyristordiode (auch „eines Diacs“)
G169
G170
G Elektrotechnik / Elektronik
Bild 27-31. Schematischer Aufbau der Schichtenfolge, Schaltzeichen und Kennlinie eines Triacs
gezündet werden. Dadurch können Wechselstromverbraucher in einem großen Leistungsbereich geregelt werden. Ähnlich aufgebaut wie das Diac ist das Triac eine integrierte Schaltung aus zwei antiparallelen Thyristoren, die mit einem Gatestrom gezündet werden können (Bild 27-31).
als Source (Quelle) bezeichneten Kontakt zum Drain (Senke). Die Breite des Kanals, durch den die Elektronen fließen, wird durch zwei seitliche P-Gebiete bestimmt. Die Breite des Kanals kann durch eine an diese PN-Übergänge angeschlossene Spannung noch verändert werden. Den sperrschichtfreien Anschluss an die P-Zonen nennt man Gate. Wird das Gate aus einem sperrenden Metall-Halbleiter-Kontakt (SchottkyDiode) gebildet, wird das Bauelement als MeSFET oder MSFET bezeichnet. Die Dotierungen können auch umgekehrt gewählt werden, dann liegt ein PKanal-FET vor. Bild 27-32 zeigt das Prinzipbild des SperrschichtFET (JFET) mit seinem Schaltzeichen und den Betriebsspannungen. Die JFETs werden vorzugsweise in Planartechnik hergestellt. Die Spannung UDS (Drain-Source) bewirkt den Drainstrom ID durch den Kanal. An das Gate wird eine Sperrspannung UGS gegen den Source-Kontakt angeschlossen, sodass sich eine Raumladungszone weit in den Kanal ausbreitet, die den nutzbaren Querschnitt für den Kanal herabsetzt. Die Spannung UGS , bei der der Kanal auf seiner vollen Breite bei UDS = 0 abgeschnürt wird, nennt man Abschnürspannung UP . Bei fließendem Drainstrom fällt längs des Kanals
27.5 Feldeffektbauelemente Bei den Feldeffekt(FE)-Bauelementen werden Majoritätsträger durch ein elektrisches Querfeld gesteuert. Minoritätsträger spielen untergeordnete Rolle. Es gibt zwei Klassen von FE-Transistoren: a) SperrschichtFE-Transistoren (JFET), b) FE-Transistoren mit isoliertem Gate (IGFET). Auch wenn die JFETs in den Anwendungen inzwischen kaum noch eine Bedeutung besitzen, wollen wir auf deren Funktionsweise zunächst eingehen, da der PN-Übergang wie bei den Bipolartransistoren wesentlich ist. Danach gehen wir auf die IGFETs und insbesondere auf deren wichtigste Vertreter, die MOSFETs, näher ein. 27.5.1 Sperrschicht-Feldeffekt-Transistoren (Junction-FET, PN-FET, MSFET oder JFET) Aufbau und Wirkungsweise (N-Kanal-FET)
Ein N-Halbleiter ist an den Enden mit einer Spannungsquelle verbunden. Elektronen fließen von dem
Bild 27-32. a Vereinfachtes Prinzip des Feldeffekttransistors (JFET); b prinzipieller Aufbau als N-Kanal-PN-FET; c Schaltzeichen
27 Halbleiterbauelemente
Bild 27-33. Kennlinienfeld des JFET, links Übertragungskennlinien, rechts Ausgangskennlinienfeld
die Spannung UDS ab. Die Spannungsquellen sind so gepolt, dass sich UDS am drainseitigen Ende des Kanals zu der Gate-Source-Spannung UGS addiert, sodass der Kanal dort am engsten wird. Die Spannung UDS , bei der sich der Kanal abzuschnüren beginnt, bezeichnet man als Kniespannung UDS sat ; den Strom an der Sättigungsgrenze bei UGS = 0 nennt man Drain Source-Kurzschlussstrom IDSS . Bei Steigerung der Drain-Source-Spannung über die Kniespannung hinaus bleibt der Drainstrom nahezu konstant, weil der leitende Kanal durch die mit UDS anwachsende Sperrschicht den Kanal weiter abschnürt und die in die Sperrschicht einströmenden Majoritätsträger – abgesehen von dem Einfluss der Verkürzung der verbleibenden leitenden Kanallänge – auf den gleichen Wert begrenzt bleiben. Legt man zusätzlich an die Gate-Source-Strecke eine Sperrspannung, beginnt die Abschnürung des Kanals bei entsprechend kleineren Drain-Source Spannungen (siehe Ausgangskennlinienfeld Bild 27-33).
MNSFET (Metal nitride semiconductor FET), allgemein von einem MISFET (Metal insulator semiconductor FET). Ist der Kanal bei offenem Gate bereits abgeschnürt, spricht man von einem Anreicherungs- oder selbstsperrenden (engl. „normal off“ oder Enhancement-) IGFET, besitzt der Kanal dagegen bei offenem Gate bereits eine nennenswerte Leitfähigkeit, bezeichnet man diesen Typ als Verarmungs- oder selbstleitenden (engl. „normal on“ oder Depletion-)IGFET. In Bild 27-34b werden die Schaltzeichen der verschiedenen IGFETs gezeigt. In den meisten Anwendungen werden inzwischen MOSFETs eingesetzt, sodass sich die folgenden Ausführungen auf diesen Typ eines IGFET beziehen. Aufbau und Wirkungsweise des Anreicherungs-MOSFET
Wir betrachten beispielhaft einen P-KanalAnreicherungs-MOSFET, dessen planarer Aufbau in Bild 27-34a gezeigt wird. In das N-HalbleiterSubstrat (oder Bulk) sind die hochdotierten Pleitenden Drain- und Source-Inseln eindiffundiert. Zwischen den Inseln ist auf das N-Substrat eine dünne Siliziumdioxid-SiO2 -Schicht aufgebracht, die mit einem metallisierten Gatekontakt versehen ist. Die entsprechenden Klemmen sind demnach S (Source), D (Drain), B (Bulk) und G (Gate). Das
27.5.2 Feldeffekttransistoren mit isoliertem Gate (IG-FET, MISFET, MOSFET oder MNSFET)
Die Steuerung des leitenden Kanals erfolgt beim IGFET ebenfalls durch ein elektrisches Querfeld, das im Gegensatz zum JFET durch ein isoliertes Gate erzeugt wird. Wird die Isolierschicht durch eine Siliziumdioxidschicht gebildet, spricht man von einem MOSFET (Metal oxide semiconductor FET), wird sie durch eine Siliziumnitritschicht gebildet, von einem
Bild 27-34. a Schematischer Aufbau eines N-Kanal-
JGFET; b Schaltzeichen verschiedener JGFET
G171
G172
G Elektrotechnik / Elektronik
Verhalten des Transistors wird ganz wesentlich vom elektrischen Potenzial ψ s auf der kanalseitigen Oberfläche des Substrats bestimmt, dass natürlich durch das Gatepotenzial beeinflusst wird. Seien Source S und Bulk B auf Massepotenzial und (UGS > 0), dann ist immer eine der beiden PN-Übergänge unabhängig von der Polung von UDS in Sperrichtung gepolt. Dabei kann man sich PN-Dioden vorstellen, deren Kathoden (N-Gebiete) zusammengeschaltet sind und die durch das Substrat gebildet werden, während Source und Drain den Anoden (P-Gebiete) entsprechen. Man spricht vom Akkumulations-Mode. Legt man eine negative Spannung an das Gate, enden die elektrischen Feldlinien senkrecht auf der Oberfläche des Halbleiters unterhalb der Isolierschicht und binden dort freie Löcher im von Elektronen dominierten N-Substrat. Die Löcherkonzentration steigt mit wachsender Gatespannung und erreicht den Wert der Elektronenkonzentration bei der sogenannten Schwellenspannung (engl. Threshold Voltage) UT0 . Legt man eine Drain-Source-Spannung UDS < 0 an, dann wird dennoch das Transportverhalten im Löcher- oder P-Kanal hauptsächlich durch Diffusion der Löcher von S nach D und nicht durch eine Drift aufgrund der Drain-Source-Spannung bestimmt. Man spricht vom Gebiet der schwachen Inversion, die bei Low-Power-Transistorschaltungen heute eine wichtige Rolle spielt. Steigert man den Betrag der Gatespannung über UT0 hinaus, reichert sich der P-leitende Kanal zwischen S und D mit Ladungsträgern an und bildet eine sehr gute leitende Verbindung von Source und Drain. Wie jeder PN-Übergang umgibt sich der P-Kanal ebenso wie die S- und D-Gebiete Substrat-seitig mit einer Verarmungs-(Depletion-)Zone. Wir befinden uns im Gebiet der starken Inversion. Es herrscht zwischen Source und Drain völlige Symmetrie. Legt man nun eine Drain-Source-Spannung UDS < 0 an, dann kann aufgrund der vielen Löcher im P-Kanal ein von der Gatespannung gesteuerter und hauptsächlich durch Drift erzeugter Drainstrom fließen. Wie beim JFET addiert sich der Spannungsabfall über der SourceDrain-Strecke zur Gatespannung. Daher ist der Kanal am drainseitigen Ende am kleinsten und an der Sourceseite am größten und dementsprechend ist dort die Depletionzone kleiner bzw. größer. Solange der
Kanal zwischen S und D noch ausgebildet ist, befindet man sich im Ohm’schen, linearen oder auch TriodenBereich. Reicht die Spannung von der Draininsel zur Kanalbildung nicht mehr aus, beginnt sich der Kanal abzuschnüren (engl. „Pinch-Off“). Den Spannungswert der Drain-Source-Spannung an der Abschnürgrenze bezeichnet man als Sättigungsspannung UDS sat und von da ab befinden wir uns im Sättigungsbereich. Bei einer Steigerung von UDS über UDS sat hinaus wird kein durchgehender P-Kanal mehr ausgebildet und der Drainstrom wird auf seinen Sättigungswert IDS sat begrenzt; vgl. auch die Situation beim JFET in 27.5.1. Der MOSFET arbeitet dann wie eine durch die GateSource-Spannung gesteuerte Stromquelle mit Innenwiderstand, was an der leichten Steigung der Kurven des Kennlinienfeldes in Bild 27-35 zusehen ist. Für den Schaltungsentwurf und die Schaltungssimulation werden für MOSFETs ebenso wie bei PN-Dioden und Bipolartransistoren mathematische Modelle benötigt, die sich mithilfe von Netzwerkelementen darstellen lassen; man spricht von Kompaktmodellen. Von besonderem Interesse sind Großsignalmodelle, die in sämtlichen Arbeitsbereichen gültig sind. Weiterhin werden Modelle gebraucht, die hinsichtlich der Source/DrainBeschreibung symmetrisch sind. Der Drainstrom sollte daher dem folgenden Ansatz genügen I=
W Is ( f (VGB , VSB ) − f (VGB , VDB )) , L
wobei Is mit dem Kanalstrom eines rechteckigen Transistors bei der Schwellenspannung UT0 im
Bild 27-35. Kennlinienfeld eines IGFET vom Anreiche-
rungstyp
27 Halbleiterbauelemente
Zusammenhang steht und f (·) ein Funktional ist, das eine exponentielle Form unterhalb und eine quadratische Form oberhalb der UT0 annimmt. Um somit den Kanalstrom in allen Arbeitsgebieten zu modellieren, müssen wir Drift- als auch Diffusionsterme in die Stromflussgleichung einbeziehen. Damit notieren wir den Kanalstrom I als Funktion der Position entlang des Kanals als I(x) = IDrift (x) + IDiffusion (x) . Mithilfe einer Vereinfachung und den Transportgleichungen für Diffusion und Drift erhält man W μ 2 I= QS − 2CUT QS L 2C W μ 2 − QD − 2CUT QD , L 2C
bzw. von UG ausdrücken und man erhält den Kanalstrom zu # US $ U W − − D I ≈ Is e(κ(UG −UT0 ))/UT e UT − e UT , L wobei US , UD und UG die Potenziale von S, D und G sowie W die Weite und L die Länge des MOSFETs sind. Im Bereich starker Inversion kann man die Ladungen mit dem Modell einer MOS-Kapazität berechnen und im Ohm’schen Bereich ergibt sich der Kanalstrom zu I≈
(27-1)
wobei QS die mobile Ladung pro Einheitsfläche am Source-Ende des Kanals und QD die mobile Ladung pro Einheitsfläche am Drain-Ende des Kanals sowie UT := kT/q die Temperaturspannung sind. Man beachte, dass die quadratischen Terme in dieser Gleichung von der Drift-Komponente des Kanalstroms verursacht werden, während die linearen Terme von der Diffusionskomponente stammen. Im Fall der Gleichheit von Diffusions- und Driftkomponente sind die Terme |QS,D | und 2CUT gleich und am Gate liegt die Schwellen- oder Threshold-Spannung an. Im Rahmen der Kompaktmodellierung von MOSFETs benötigt man also eine sogenannte Spannungsgleichung, welche die Eingangs-Gate-Spannung (und ggf. weitere Spannungen) mit dem elektrischen Potenzial der Halbleiteroberfläche des Kanals – dem Oberflächenpotenzial ψ s – über einen nichtlinearen Zusammenhang verbindet, und eine AusgangsStromgleichung, die den Ausgangs-Drain-Strom mit dem Oberflächenpotenzial verbindet. Die Ladungen QS und QD können wie hier als weitere Zwischengrößen auftreten. Einzelheiten dazu findet man in der weiterführenden Literatur. Im Folgenden wollen wir zunächst einige Grenzfälle betrachten und anschließend eine globale Beschreibung von MOSFETs für alle Arbeitsbereiche angeben. In schwacher Inversion lassen sich die Ladungen QS und QD näherungsweise in Abhängigkeit von ψ s
W μCOx (κ(UG − UT0 ) − US )2 L 2κ −(κ(UG − UT0 ) − UD )2 ,
(27-2)
wobei COx := εOx /tOx die Kapazität pro Einheitsfläche über dem Oxyd (tOx : Oxyddicke) und μ die Löcher-Beweglichkeit sowie κ den sogenannten Body-Effekt repräsentiert. Die Beziehung für den Kanalstrom kann auch dargestellt werden durch I≈
W μCOx 2 . 2κ(UGS − UT0 )UDS − UDS L 2κ
Im Sättigungsbereich, also oberhalb der Sättigungsspannung UDS sat , wird die entsprechende Kennlinie mit dem Sättigungsstrom IDS sat fortgesetzt, wobei noch eine Korrektur durch die Verkürzung des Kanals (Kanallängenmodulation) hinzugefügt werden muss, die zu dem bereits erwähnten linearen Stromanstieg im Sättigungsbereich führt. Mit dem sogenannten EKV-Modell (EnzKrummenacher-Vittoz) kann man eine gute Näherung für den Kanalstrom angeben, die in sämtlichen Arbeitsbereichen eines MOSFETs gültig ist, I=
W Is log2 1 + e(κ(UG −UT0 )−US )/2UT L W − I s log2 1 + e(κ(UG −UT0 )−UD )/2UT . L
(27-3)
Die zuvor genannten Näherungsausdrücke für die einzelnen Arbeitsbereiche des MOSFETs lassen sich aus dieser Darstellung durch geeignete Näherungen der 2 x/2 gewinnen. Funktion log 1 + e
G173
G174
G Elektrotechnik / Elektronik
Weitere Effekte im realen MOSFET führen zu komplexeren Kompaktmodellen, die jedoch über den Rahmen dieser Einführung hinaus gehen; vgl. die weiterführende Literatur. Aufbau und Wirkungsweise des Verarmungs-MOSFET
Im Gegensatz zum Anreicherungs-MOSFET besteht beim Verarmungstyp, bei sonst ähnlichem Aufbau, bereits ein leitender Kanal zwischen Source und Drain. Je nach Polarität der Gatespannung wird der leitende Kanal breiter oder schmaler, sodass die Kennlinien (Bild 27-36) gegenüber dem Anreicherungstyp verschoben sind. Die Gatespannung, bei der der Kanal abgeschnürt wird, bezeichnet man wie beim JFET als Abschnürspannung UP . Schalteigenschaften des MOSFET
Die MOSFETs besitzen wegen ihrer (a) einfachen Ansteuerung, (b) kleinen Restströme im gesperrten Zustand und (c) spannungsunabhängigen Gatekapazitäten gute Schalteigenschaften und sind deswegen Grundbausteine für integrierte Schaltungen der Digitaltechnik. In der CMOS-Technik (complementary) werden in ein Substrat (N-Typ) sowohl N-Kanal- als auch P-Kanal-Transistoren integriert (Inverter), wobei der N-Kanal-MOSFET in eine Wanne aus P-dotiertem Halbleitermaterial
gesetzt mit SiO2 -Material isoliert wird. Wenn man N- und P-Kanal-MOSFETs zur Verfügung hat, kann die Schaltungstechnik wie in der Bipolarschaltungstechnik mit (komplementären) NPN- und PNP-Transistoren (vgl. Abschnitt 25.3.3) teilweise erheblich vereinfacht werden.
27.6 Optoelektronische Halbleiterbauelemente 27.6.1 Innerer Fotoeffekt
Wird in ein Halbleitermaterial Lichtenergie (Photonen) eingestrahlt, so können Elektronen aus ihren Gitterbindungen gelöst werden; es werden zusätzliche Elektronen-Loch-Paare erzeugt. Vereinfachend wird angenommen, dass die Absorption eines Lichtquantes durch einen Band-Band-Übergang (Bild 27-37) erfolgt. Das erfordert, dass die Photonen über eine Mindestenergie verfügen müssen, die dem Bandabstand von Ec − Ev entspricht: Eγ = hν Ec − Ev . Aus λν = c (ν Frequenz und λ Wellenlänge des eingestrahlten Lichtes, c Lichtgeschwindigkeit, h PlanckKonstante) ergibt sich, dass für Silizium (Bandabstand Ec − Ev = 1,106 eV) λmin 1,1 μm sein muss. Gleichzeitig mit der Entstehung eines Elektron-LochPaares ist die Absorption von Lichtquanten verbunden. Bezeichnet man mit I0 die Quantenstromdichte (Zahl der in den Halbleiter eindringenden Lichtquanten bezogen auf die Zeit und die Fläche), auch („Intensität“) und mit α(λ) den wellenlängenabhängigen Absorptionsgrad, so ist I(x), die Quantenstromdichte durch den Querschnitt mit der Koordinate x, eine exponentiell abklingende Funktion I(x) = I0 exp(−αx) .
Bild 27-36. Kennlinienfeld eines IGFET vom Verarmungs-
typ
Bild 27-37. Absorption eines Lichtquantes durch einen
Band-Band-Übergang (Generation eines LadungsträgerPaares)
27 Halbleiterbauelemente
Der Kehrwert der Absorptionskonstanten α wird auch als Eindringtiefe der Strahlung in den Halbleiter bezeichnet. 27.6.2 Der Fotowiderstand
Das Funktionsprinzip des Fotowiderstandes beruht auf dem inneren Fotoeffekt, der die Leitfähigkeit des Halbleitermaterials erhöht. Er ist ein passives Bauelement ohne Sperrschicht. Verwendet werden je nach Anwendungsbereich Halbleiterwerkstoffe, deren Bandabstand der zu detektierenden Strahlung angepasst ist: CdS (Cadmiumsulfid), CdSe (Cadmiumselenid), ZnS (Zinksulfid) oder deren Mischkristalle. Beurteilt werden Fotowiderstände nach: (a) der Fotoleitfähigkeit σfot (u) im Verhältnis zur Dunkelleitfähigkeit σ0 als Funktion der Bestrahlungsstärke E des mit konstanter Wellenlänge λ eingestrahlten Lichtes, (b) der spektralen Empfindlichkeit σfot (λ) als Funktion der Wellenlänge des mit konstanter Bestrahlungsstärke E eingestrahlten Lichtes, (c) dem Zeitverhalten σfot (t), (d) und den Rauscheigenschaften NEP (noiseequivalent power). Bild 27-38 zeigt eine Auswahl von Halbleiterwerkstoffen mit deren relativen spektralen Empfindlichkeiten als Funktion der Wellenlänge.
Bild 27-38. Relative spektrale Empfindlichkeit verschiedener Fotohalbleiterwerkstoffe abhängig von der Wellenlänge des eingestrahlten Lichtes
27.6.3 Der PN-Übergang bei Lichteinwirkung
Wird die Umgebung eines PN-Überganges beleuchtet, so werden durch den inneren Fotoeffekt örtlich Ladungsträgerpaare generiert. Die Ladungsträger, die durch Diffusion die Sperrschicht erreichten oder in ihr generiert werden, werden durch das elektrische Feld getrennt und können einen äußeren Strom hervorrufen. Der Fotostrom fließt sowohl bei positiver als auch bei negativer äußerer Spannung in Sperrichtung, d. h., die Kennlinie des unbeleuchteten PN-Überganges wird nach unten verschoben (Bild 27-39). Wird der PN-Übergang im 1. oder 3. Quadranten betrieben, so bezeichnet man ihn als Fotodiode und bei generatorischem Betrieb im 4. Quadranten als Solarzelle. Die Fotodiode
In Anwendungsschaltungen wird die Fotodiode meist in Sperrichtung betrieben. Ohne Beleuchtung fließt der sehr kleine Sperrstrom. Dieser Sperrstrom erhöht sich bei Beleuchtung proportional zur Beleuchtungsstärke, deshalb eignen sie sich besonders gut zur Lichtmessung. Bild 27-40 zeigt den schematischen Aufbau einer Fotodiode in Planartechnik. Zur Verbesserung des kapazitiven Verhaltens für schnelle Detektoren, wird die Fotodiode auch als PIN-Diode ausgeführt.
Bild 27-39. Kennlinie eines beleuchteten (E = E0 ) und unbeleuchteten (E = 0) PN-Überganges
G175
G176
G Elektrotechnik / Elektronik
Bild 27-40. Schematischer Aufbau einer Fotodiode. Die ge-
strichelt gezeichnete Linie gibt die Grenze der Raumladungszone an
Bild 27-41. Schematischer Aufbau eines Fototransistors. Die gestrichelt gezeichnete Linie gibt die Grenze der BasisKollektor-Raumladungszone an
27.6.5 Die Lumineszenzdiode (LED) Die Solarzelle
Die Solarzelle ist in der Lage, bei Lichteinwirkung eine Wirkleistung PFot abzugeben (siehe schraffierte Fläche in Bild 27-39). Die abgegebene Leistung hängt von der spektralen Bestrahlungsstärke E(λ) der einfallenden Strahlung, dem Verlauf der Diodenkennlinie und der Wahl des Arbeitspunktes ab. Die Emitterschicht wird bei Solarzellen (wie auch bei Fotodioden) möglichst dünn ausgeführt, um auch bei kurzen Wellenlängen des Lichtes (hohe Absorption bzw. geringe Eindringtiefe) noch die Nähe der Raumladungszone zu erreichen. Die Oberflächen werden oft mit Antireflexschichten versehen. Großflächige Solarzellen sind mit dünnen fingerförmigen Metallkontakten ausgerüstet, um möglichst viel Licht einfallen zu lassen. Der auf der Erde gegenwärtig technisch erreichbare Wirkungsgrad η (abgegebene zu eingestrahlter Leistung) liegt bei Silizium-Solarzellen bei etwa 11% (vgl. 16.5). 27.6.4 Der Fototransistor
In der Wirkungsweise entspricht ein Fototransistor einer Fotodiode mit eingebautem Verstärker und weist eine bis zu 500-mal größere Fotoempfindlichkeit im Vergleich zur Fotodiode auf. Im Bild 27-41 ist der Aufbau eines Fototransistors wiedergegeben. Emitter- und Basisanschluss sind so angebracht, dass eine möglichst große Öffnung für die einfallende Strahlung entsteht. Der Basis-Kollektor-Sperrstrom wird bei Bestrahlung um den Fotostrom erhöht. Der Kollektor führt dann in Emitterschaltung den um den Stromverstärkungsfaktor β erhöhten Fotostrom.
Unter Lumineszenz versteht man alle Fälle von optischer Strahlungsemission, deren Ursache nicht auf der Temperatur des strahlenden Körpers beruht. Ein in Durchlassrichtung betriebener PN-Übergang injiziert in die Bahngebiete Minoritätsträger, die dort unter Abgabe von Photonen rekombinieren. Diese Eigenschaft bezeichnet man als Injektionslumineszenz und die speziell auf diese Eigenschaft gezüchteten Dioden als Lumineszenzdioden. Bild 27-42 zeigt den schematischen Aufbau einer LED am Beispiel von GaAsP. Die Strahlung wird durch die Rekombinationsprozesse in der P-Schicht erzeugt. Aufgrund des Bandabstandes emittiert Silizium nichtsichtbare Strahlung im nahen Infrarotbereich und ist deshalb als Material für Lumineszenzdioden nicht geeignet. Die wichtigsten Materialien, mit denen Injektionslumineszenz im sichtbaren Bereich des Spektrums möglich ist, sind GaAs (Galliumarsenid für Infrarot und Rot), GaAsP (Galliumarsenidphosphid für Rot und Gelb) und GaP (Galliumphosphid für Rot, Gelb und Grün). Das Anwendungsgebiet der LEDs liegt hauptsächlich im Ein-
Bild 27-42. Schematischer
Aufbau einer GaAsPLumineszenzdiode. Die Rekombinationsstrahlung entsteht in der 2 bis 4 μm dicken P-Zone unter der Halbleiteroberfläche
Literatur
satz als Signal- und Anzeigelämpchen oder als Strahlungsquellen für infrarote Lichtschranken; ihre Vorteile gegenüber Glühlampen sind hauptsächlich die höhere Lebensdauer und Stoßfestigkeit sowie die bessere Modulierbarkeit.
Literatur Kapitel 1 bis 15 Bauer, W.; Wagener, H.H.: Bauelemente und Grundschaltungen der Elektronik. Bd. 1: Grundlagen und Anwendungen. 3. Aufl. 1989; Bd. 2: Grundschaltungen, 2. Aufl. 1990. München: Hanser Blume, S.; Witlich, K.-H.: Theorie elektromagnetischer Felder. 4. Aufl. Heidelberg: Hüthig 1994 Böhmer, E.: Elemente der angewandten Elektronik. 14. Aufl. Braunschweig: Vieweg 2004 Böhmer, E.: Rechenübungen zur angewandten Elektronik. 5. Aufl. Braunschweig: Vieweg 1997 Bosse, G.: Grundlagen der Elektrotechnik, Bd. 1: Elektrostatisches Feld und Gleichstrom, 3. Aufl.; Bd. 2: Magnetisches Feld und Induktion, 4. Aufl.; Bd. 3: Wechselstromlehre, Vierpol- und Leitungstheorie, 3. Aufl.; Bd. 4: Drehstrom, Ausgleichsvorgänge in linearen Netzen, 2. Aufl. Berlin: Springer 1996 Clausert, H.; Wiesemann, G.: Grundgebiete der Elektrotechnik. Bd. 1: Gleichstrom, elektrische und magnetische Felder, 8. Aufl. 2003; Bd. 2: Wechselströme, Leitungen, Anwendungen der Laplace- und Z-Transformation, 8. Aufl. 2003. München: Oldenbourg Constantinescu-Simon, L. (Hrsg.); Handbuch Elektrische Energietechnik, 2. Aufl. Braunschweig: Vieweg 1997 Felderhoff, R; Freyer, U.: Elektrische und elektronische Messtechnik. 7. Aufl. München: Hanser 2003 Fischer, H.; Hofmann, H.; Spindler, J.: Werkstoffe in der Elektrotechnik, 5. Aufl. 2003. München: Hanser 2003 Frohne, H.; Löcherer, K.-H.; Müller, H.: Moeller Grundlagen der Elektrotechnik. 19. Aufl. Stuttgart: Teubner 2002 Führer, A.; Heidemann, K.; Nerreter, W.: Grundgebiete der Elektrotechnik, Bd. 1, 7. Aufl. 2003; Bd. 2, 5. Aufl. 1998, München: Hanser
Grafe, H. u. a.: Grundlagen der Elektrotechnik, Bd. 1: Gleichspannungstechnik, 13. Aufl. 1988, Bd. 2: Wechselspannungstechnik, 12. Aufl. 1992. Berlin: Verlag Technik Haase, H.; Garbe, H.; Gerth, H.: Grundlagen der Elektrotechnik. Witte: Uni Verlag 2004 Jackson, J. D.: Klassische Elektrodynamik. 3. Aufl. Berlin: De Gruyter 2002 Jötten, R.; Zürneck, H.: Einführung in die Elektrotechnik, Bd. 1 und 2. Braunschweig: Vieweg 1970; 1972 Krämer, H.: Elektrotechnik im Maschinenbau. 3. Aufl. Braunschweig: Vieweg 1991 Küpfmüller, K.; Mathis, W.; Reibiger, A.: Theoretische Elektrotechnik. 18. Aufl. Berlin: Springer 2007 Leuchtmann, P.: Einführung in die elektromagnetische Feldtheorie. München: Pearson Studium 2005 Lehner, G.: Elektromagnetische Feldtheorie. 4. Aufl. Berlin: Springer 2004 Lindner, H.; Brauer, H.; Lehmann, C.: Taschenbuch der Elektrotechnik und Elektronik. 7. Aufl. Leipzig: Fachbuchverl. 1998 Lunze, K.: Theorie der Wechselstromschaltungen. 8. Aufl. Berlin: Verl. Technik 1991 Lunze, K.: Einführung in die Elektrotechnik (Lehrbuch). 13. Aufl. Berlin: Verl. Technik 1991 Lunze, K.; Wagner, E.: Einführung in die Elektrotechnik (Arbeitsbuch). 7. Aufl. Berlin: Verl. Technik 1991 Mäusl, R.; Göbel, J.: Analoge und digitale Modulationsverfahren. Heidelberg: Hüthig 2002 Mende/Simon: Physik: Gleichungen und Tabellen. 11. Aufl. Leipzig: Fachbuch-Verl. 1994 Papoulis, A.: Circuits and systems: A modern approach. New York: Holt, Rinehart and Winston 1980 Paul, R.: Elektrotechnik, Bd. 1: Felder und einfache Stromkreise, 3. Aufl. 1993; Bd. 2: Netzwerke, 3. Aufl. 1994. Berlin: Springer Philippow, E.: Taschenbuch Elektrotechnik, Bd. 1: Allgemeine Grundlagen. 3. Aufl. München: Hanser 1986 Piefke, G.: Feldtheorie, Bd. 1-3. Mannheim: Bibliogr. Inst. 1973–1977 Prechtl, A.: Vorlesungen über die Grundlagen der Elektrotechnik. Bd. 1+2. Wien: Springer, 1994/95 Pregla, R.: Grundlagen der Elektrotechnik, 7. Aufl. Heidelberg: Hüthig 2004
G177
G178
G Elektrotechnik / Elektronik
Profos, P.; Pfeifer T. (Hrsg.): Grundlagen der Messtechnik. 5. Aufl. München: Oldenbourg 1997 Schrüfer, E.: Elektrische Messtechnik. 6. Aufl. München: Hanser 1995 Schüßler, H.W.: Netzwerke, Signale und Systeme; Bd. 1: Systemtheorie linearer elektrischer Netzwerke; Bd. 2: Theorie kontinuierlicher und diskreter Signale und Systeme. 3. Aufl. Berlin: Springer 1991 Seidel, H.-U.; Wagner, E.: Allgemeine Elektrotechnik. 3. Aufl. München: Hanser 2003 Simonyi, K.: Theoretische Elektrotechnik. Weinheim: Wiley-VCH Steinbuch, K.; Rupprecht, W.: Nachrichtentechnik. 3. Aufl. Berlin: Springer 1982 Tholl, H.: Bauelemente der Halbleiterelektronik, Teil 1: Grundlagen, Dioden und Transistoren; Teil 2: Feldeffekt-Transistoren, Thyristoren und Optoelektronik. Stuttgart: Teubner 1976; 1978 Unbehauen, R.: Grundlagen der Elektrotechnik (2 Bde.). 5. Aufl. Berlin: Springer 1999/2000 Wunsch, G.; Schulz, H.-G.: Elektromagnetische Felder. 2. Aufl. Berlin: Verlag Technik 1996 Zinke, O.; Seither, H.: Widerstände, Kondensatoren, Spulen und ihre Werkstoffe. 2. Aufl. Berlin: Springer 1982
Kapitel 16 bis 18 Hosemann, G.; Boeck, W.: Grundlagen der elektrischen Energietechnik. 3. Aufl. Berlin: Springer 1987 Küpfmüller, K.; Mathis, W.; Reibiger, A.: Theoretische Elektrotechnik. 18. Aufl. Berlin: Springer 2007 Happoldt, H.; Oeding, D.: Elektrische Kraftwerke und Netze. 5. Aufl. Berlin: Springer 1978 Brinkmann, K.; Schäfer, H. (Hrsg.): Der Elektrounfall. Berlin: Springer 1982 DIN VDE 0100: Errichten von Starkstromanlagen mit Nennspannungen bis 1000 V Hütte. Elektrische Energietechnik. Bd. 2: Geräte. Berlin: Springer 1978 Spring, E.: Elektrische Maschinen. Berlin: Springer 1998
Spezielle Literatur 1. Steinbuch, K.; Rupprecht, W.: Nachrichtentechnik, Band I: Schaltungstechnik. 3. Aufl. Berlin: Springer 1982, S. 23–170 2. Hoffmann, K.: Planung und Aufbau elektronischer Systeme. 3. Aufl. Ulmen: Zimmermann. Neufang 1992, S. 48–64 3. Hänsler, E.: Statistische Signale. 3. Aufl. Berlin: Springer 2001 4. Ohm, J.-R.; Lüke, H.D.: Signalübertragung. 9. Aufl. Berlin: Springer 2004 5. Hütte, Band IV B: Fernmeldetechnik. 28. Aufl. Berlin: Ernst 1962, S. 487–517 6. Philippow, E.: Taschenbuch Elektrotechnik, Bd. 4: Systeme der Informationstechnik. München: Hanser 1979, S. 369–397 7. Lacroix, A.: Digitale Filter. München: Oldenbourg 1980, S. 164–188 8. Kammeyer, K.-D.: Nachrichtenübertragung. 3. Aufl. Wiesbaden: Vieweg 2004 9. Mathis, W.: Theorie nichtlinearer Netzwerke. Berlin: Springer 1987 10. Oppenheim, A.V.; Schafer, R. W.; Buck, J. R.: Zeitdiskrete Signalverarbeitung. 2. Aufl. München: Pearson Studium 2004 11. Chua, L.O., C.A. Desoer, C. A.; Kuh, E.S.: Linear and Nonlinear Circuits. New York: McGraw-Hill 1987 12. Best, R.E.: Phase-Locked Loops. 5. Ed. New York: McGraw-Hill 2003 13. Stensby, J.L.: Phase Locked Loops Theory and Applications. Boca Raton: CRC Press 1997 14. Weidenfeller, H.; Vlceck, A.: Digitale Modulationsverfahren mit Sinusträgern. Berlin-Heidelberg: 1996 15. Schetzen, M.: The Volterra and Wiener Theories of Nonlinear Systems. New York: John Wiley and Sons 1980 16. Weidenfeller, H.; Vlcek, A.: Digitale Modulationsverfahren. Berlin-Heidelberg: Springer 1996 17. Zölzer, U.: Digitale Audiosignalverarbeitung. 3. Aufl., Teubner Verlag: Wiesbaden 2005
Abschnitte 25.1 bis 25.3 Allgemeine Literatur Wupper, H.; Niemeyer, U.: Elektronische Schaltungen I+II. Berlin: Springer 1996
Kapitel 19 bis 24 Allgemeine Literatur Herter, E.; Lörcher, W.: Nachrichtentechnik. 9. Aufl. München: Hanser 2004
Spezielle Literatur 1. Nerreter, W.: Berechnung elektrischer Schaltungen mit dem Personal Computer. München: Hanser 1987, S. 125–188
Literatur
2. Tietze, U.; Schenk, Ch.: Halbleiter-Schaltungstechnik. 12. Aufl. Berlin: Springer 2002, S. 391–414 3. Horowitz, P.; Hill, W.: The art of electronics. 2nd ed. London: Cambridge Univ. Press 1989, p. 113–171 4. Seifart, M.; Becker, W.-J.: Analoge Schaltungen. 6. Aufl. Berlin: Verlag Technik 2003 5. Kurz, G.; Mathis, W.: Oszillatoren. Heidelberg: Huthig 1994 6. Zölzer, U.: Digitale Audiosignalverarbeitung. 3. Aufl. Stuttgart: Teubner 2005 7. Williams, A.B.; Taylor, F.J.: Filter Design Handbook. 4. Aufl. New York: McGraw-Hill 2006 8. Mathis, W.: Theorie nichtlinearer Netzwerke. Berlin: Springer 1987 9. O’Dell, T. H.: Electronic Circuit Design – Art and Practice. Cambridge: Cambridge Univ. Press 1988 (deutsche Übersetzung: Krehnke, J.; Mathis, W.: Die Kunst des Entwurfs elektronischer Schaltungen. Berlin: Springer 1990) 10. O’Dell, T. H.: Circuits for Electronic Instrumentation. Cambridge: Cambridge Univ. Press 1991 11. Cauer, W.: Theorie der linearen Wechselstromschaltungen. Leipzig: Akad. Verlags-Gesellschaft Becker und Erler 1941 12. Kriegsmann, G.: An asymptotic theory of rectifcation and detection. IEEE Transactions Circuits and Systems, Volume 32, Issue 10, S. 1064–1068, 1985 13. Razavi, B.: RF Microelectronics. New Jersey: Prentice Hall 1998 14. Vago, I.: Graph Theory: Application to the Calculation of Electrical Networks. New York: Elsevier 1985 15. Streitenberger, M.: Zur Theorie digitaler Klasse-D Audioleistungsverstärker und deren Implementierung. VDE-Verlag 2005
Palotas, L. (Hrsg.): Elektronik für Ingenieure. Braunschweig: Vieweg 2003 Wiesemann, G.; Kraft, K.H.: Aufgaben über Operationsverstärkerund Filterschaltungen. Mannheim: Bibliograph. Inst. 1985 Zastrow, D.: Elektronik. 6. Aufl. Braunschweig: Vieweg 2002
Abschnitt 25.4
Bludau, W.: Halbleiter-Optoelektronik. München: Hanser 1995 Gerlach, W.: Thyristoren. Berlin: Springer 1979 Löcherer, K.-H.: Halbleiterbauelemente. Stuttgart: Teubner 1992 Müller, R.: Bauelemente der Halbleiter-Elektronik. 4. Aufl. Berlin: Springer 1991 Müller, R.: Grundlagen der Halbleiter-Elektronik. 7. Aufl. Berlin: Springer 1995 Paul, R.: Elektronische Halbleiterbauelemente. 3. Aufl. Stuttgart: Teubner 1992 Paul, R.: MOS-Transistoren. Berlin: Springer 1994 Paul, R.: Optoelektronische Halbleiterbauelemente. 2. Aufl. Stuttgart: Teubner 1992 Sze, S.M.: Modern semiconductor device physics. New York: Wiley 1998
Beuth, K.; Beuth, O.: Elementare Elektronik. 7. Aufl. Würzburg: Vogel 2003 Böhmer, E.: Elemente der angewandten Elektronik. 13. Aufl. Braunschweig: Vieweg 2002 Federau, J.: Operationsverstärker. 2. Aufl. Braunschweig: Vieweg 2001 Fliege, N.: Lineare Schaltungen mit Operationsverstärkern. Berlin: Springer 1979 Fritzsche, G.; Seidel, V.: Aktive RC-Schaltungen in der Elektronik. Heidelberg: Hüthig 1981 Mennenga, H.: Operationsverstärker. 2. Aufl. Heidelberg: Hüthig 1981 Nanndorf, U.: Analoge Elektronik. Heidelberg: Hüthig 2001
Kapitel 26 Beuth, K.: Elektronik-Grundwissen, Bd. 4: Digitaltechnik. 12. Aufl. Würzburg: Vogel 2003 Böhmer, E.: Elemente der angewandten Elektronik. 13. Aufl. Braunschweig: Vieweg 2004 Borucki, L.: Grundlagen der Digitaltechnik. 5. Aufl. Stuttgart: Teubner 2000 Leonhardt, E.: Grundlagen der Digitaltechnik. 3. Aufl. München: Hanser 1984 Oberthür, W.; u. a.: Digitale Steuerungstechnik (HPIFachbuchreihe Elektronik, IVD). 4. Aufl. München: Pflaum 1987 Pernards, P.: Digitaltechnik. Bd. I, 4. Aufl.; Bd. II. Heidelberg: Hüthig 2001/1995 Schaller, G.; Nüchel, W.: Nachrichtenverarbeitung; Bd. 1: Digitale Schaltkreise, 3. Aufl.; Bd. 2: Entwurf digitaler Schaltwerke. 4. Aufl. Stuttgart: Teubner 1987 Seifart, M.; Beikirch, H.: Digitale Schaltungen. 5. Aufl. Berlin: Verlag Technik 1998
Kapitel 27
G179
G180
G Elektrotechnik / Elektronik
Wagemann, H.-G.; Schmidt, A.: Grundlagen der optoelektronischen Halbleiterelemente. Stuttgart: Teubner 1998 Sze, S.M.: Semiconductor Devices: Physics and Technology. 2. Aufl. New York: Wiley 2002 Rohe, K.-H.: Elektronik für Physiker. 2. Aufl. Stuttgart: Teubner 1983 Gray, P.R.; Hurst, P.J.; Lewis, S.H.; Meyer, R.G.: Analysis and Design of Analog Integrated Circuits. 4. Aufl. New York: Wiley 2001 Allen, P.E.; Holberg, D.R.: CMOS Analog Circuit Design. 2. Aufl. New York: Oxford Univ. Press 2002 Hering, E.; Bressler, K.; Gutekunst, J.: Elektronik für Ingenieure und Naturwissenschaftler. 5. Aufl. Berlin: Springer 2005 Siegl, J.: Schaltungstechnik. 2. Aufl. Berlin: Springer 2005
Tille, Th.; Schmitt-Landsiedel, D.: Mikroelektronik. Berlin: Springer 2005 Göbel, H.: Einführung in die Halbleiter- und Schaltungstechnik. Berlin: Springer 2005 Goser, K.; Glösekötter, P.; Dienstuhl, J.: Nanoelectronics and Nanosystems. Berlin: Springer 2003 Grabinski, W.; Nauwelaers, B.; Schreurs, D. (Eds.): Transistor Level Modeling for Analog/RF IC Design. New York: Springer 2006 Enz, C. C.; Vittoz, E.: Charge-based MOS Transistor Modeling – The EKV model for low-power and RF IC design. New York: Wiley 2006 Chua, L.O., C.A. Desoer, C.A.; Kuh, E.S.: Linear and Nonlinear Circuits. New York: McGraw-Hill 1987 Vlach, J.; Singhal, K.: Computer Methods for Circuit Analysis and Design. 2. Ed. New York: Van Nostrand 1994
H1
1 Grundlagen der Messtechnik 1.1 Übersicht 1.1.1 Messsysteme und Messketten
Die Messtechnik hat die Aufgabe, eindimensionale Messgrößen und mehrdimensionale Messvektoren technischer Prozesse aufzunehmen, die erhaltenen Messsignale umzuformen und umzusetzen (Messwerterfassung) sowie die erhaltenen Messwerte so zu verarbeiten (Messwertverarbeitung), dass das gewünschte Messergebnis (die Zielgröße) gewonnen wird. In Messeinrichtungen oder in Messsystemen (Bild 1-1) formen zunächst Aufnehmer (Sensoren) die im Allgemeinen nichtelektrische Messgröße in ein elektrisches Messsignal um. Dieses wird in der Regel mit geeigneten Messschaltungen, Messverstärkern und analogen Rechengliedern so umgeformt, dass ein normiertes analoges Messsignal gewonnen wird (Messumformer zur Signalanpassung). Es schließt sich ein AnalogDigital-Umsetzer an, der das normierte analoge in ein digitales Messsignal umsetzt. Nach einer Messwertverarbeitung liegen die gesuchten Informationen vor. Sie können analog oder digital ausgegeben werden.
Bild 1-1. Messglieder einer Messkette in einem Messsystem
In Messeinrichtungen und Messsystemen spielen lineare Umformungen und Umsetzungen von Messsignalen eine wesentliche Rolle. Wegen nichtidealer Messglieder (besonders unter den Sensoren) sind die Messsignale häufig verfälscht. In solchen Fällen ist eine korrigierende Signalverarbeitung erforderlich; ebenso wie Messsignalverarbeitung bei einer Reihe von Messaufgaben erst zu den interessierenden Zielgrößen führt (Intelligente Sensoren und Messsysteme).
H
1.1.2 Anwendungsgebiete und Aufgabenstellungen der Messtechnik
Die verschiedenen Anwendungsgebiete der Messtechnik können zum Teil im Rahmen von Automatisierungssystemen gesehen werden. Bei einer Vielzahl von Anwendungen ist jedoch der Mensch der Empfänger der Information. Die Anwendungsgebiete der Messtechnik lassen sich in drei Gruppen unterteilen, nämlich in – Mess- und Prüfprozesse in Forschung und Entwicklungslabors, im Prüffeld und bei Anlagenerprobungen – Industrielle Großprozesse zur Herstellung und Verteilung von Fließ- und Stückgut und von Energie
Messtechnik
H
Messtechnik
H.-R. Tränkler G. Fischerauer
H2
H Messtechnik
– Dezentrale Einzelprozesse, z. B. der Gebäudetechnik, Fahrzeugtechnik oder der privaten Haushalte. Typische Aufgabenstellungen sind: – – – – – – – – –
Sicherstellung der Genauigkeit (Kalibrierung) Verrechnung (Energie, Masse, Stückzahl) Prüfung (z. B. Lehrung) Qualitätssicherung (z. B. Materialprüfung) Steuerung und/oder Regelung Optimierung Überwachung (z. B. Schadensfrüherkennung) Meldung und/oder Abschaltung (Schutzsystem) Mustererkennung (Gestalt, Oberfläche, Geräusch, z. B. für Handhabungs- und Montagezwecke).
1.2 Übertragungseigenschaften von Messgliedern Für die Beurteilung einer aus mehreren Messgliedern aufgebauten Messeinrichtung sind verschiedene Eigenschaften von Bedeutung. Dazu zählen die statischen Übertragungseigenschaften (z. B. die Genauigkeit), die dynamischen Übertragungseigenschaften (z. B. die Einstellzeit), die Zuverlässigkeit (z. B. die Ausfallrate) und nicht zuletzt die Wirtschaftlichkeit und Wartbarkeit einer Messeinrichtung. 1.2.1 Statische Kennlinien von Messgliedern
Der Zusammenhang zwischen der stationären Ausgangsgröße y und der Eingangsgröße x eines Messgliedes bzw. seine graphische Darstellung wird als statische Kennlinie bezeichnet (Bild 1-2). Der Messbereich geht hier von x0 bis x0 +Δx. Die Differenz zwischen Messbereichsende x0 +Δx und Messbereichsanfang x0 ist die Eingangsspanne Δx. Die zu-
Bild 1-2. Kennlinie eines Messgliedes
geordneten Ausgangsgrößen y0 und y0 +Δy begrenzen den Ausgangsbereich mit der Ausgangsspanne Δy. Dem linearen Anteil der Kennlinie (gestrichelt) ist i. Allg. ein unerwünschter nichtlinearer Anteil yN (x) überlagert. Die Kennlinienfunktion y(x) lässt sich darstellen durch Δy (x − x0 ) +yN (x) . y(x) = y0 + Δx @ABC linearer Anteil
Die Empfindlichkeit E(x) von nichtlinearen Messgliedern ist nicht konstant. Sie ist identisch mit der Steigung der Kennlinie im betrachteten Arbeitspunkt (x, y(x)): E(x) =
dy(x) Δy dyN (x) = + . dx Δx dx
Bei linearen Messgliedern, deren Kennlinie durch den Ursprung des Koordinatensystems geht (x0 = 0, y0 = 0), berechnen sich Kennlinienfunktion und Empfindlichkeit zu Δy x, Δx dy(x) Δy = = const . E(x) = dx Δx
y(x) =
Eine näherungsweise konstante Empfindlichkeit haben z. B. anzeigende Drehspulinstrumente. 1.2.2 Dynamische Übertragungseigenschaften von Messgliedern
Die Ausgangssignale von Messgliedern folgen Änderungen des Eingangssignals i. Allg. nur mit Verzögerungen. Gewöhnlich lassen sich dann zur Beschreibung der dynamischen Übertragungseigenschaften bestimmte Systemstrukturen und bestimmte Kenngrößen angeben. Besonders häufig treten lineare verzögernde Messglieder 1. und 2. Ordnung auf, die durch eine bzw. durch zwei Kenngrößen (Parameter) im Zeit- und/oder Frequenzbereich charakterisiert werden. Zuweilen besteht die Notwendigkeit, auch Messglieder höherer Ordnung durch geeignete Kenngrößen zu beschreiben. Schließlich tritt nichtlineares Verhalten bei Messgliedern auf, wenn Signale Sättigungs- oder Begrenzungserscheinungen aufweisen.
1 Grundlagen der Messtechnik
Zeitverhalten linearer Übertragungsglieder
Bei einem verzögerungsfreien Messglied folgt das Ausgangssignal direkt dem Eingangssignal x(t) und ist diesem im einfachsten Fall gemäß k · x(t) proportional. Die Ausgangssignale y(t) verzögerungsbehafteter Messglieder können veränderlichen Eingangssignalen x(t) nicht direkt folgen. Es ergibt sich ein dynamischer Fehler
Bild 1-4. Passives Messglied 1. Ordnung (Tiefpassfilter)
Fdyn (t) = y(t) − kx(t)
Das Zeitverhalten wird also durch eine Differenzialgleichung (Dgl.) der Form
als Differenz des realen Ausgangssignals y(t) und des unverzögerten Sollsignals kx(t), das sich bei gleicher Eingangsgröße im Beharrungszustand ergeben hätte (Bild 1-3, vgl. 1.3.2). Am Beispiel eines fundamentalen passiven Messgliedes soll gezeigt werden, wie man das Zeitverhalten beschreiben kann und welche Verallgemeinerungen sinnvoll und möglich sind. In der Messschaltung in Bild 1-4 liegt die Eingangsspannung ue (t) an der Serienschaltung eines Ohm’schen Widerstandes R und einer Kapazität C, an der die Ausgangsspannung ua (t) abgegriffen werden kann. Die Spannung ua (t) an der Kapazität ist proportional .t der Ladung i(τ) dτ, der Strom beträgt also i(t) =
dy(t) + y(t) = kx(t) dt beschrieben, in der x(t) die Eingangsgröße, y(t) die Ausgangsgröße und τ eine Zeitkonstante ist. Die Dgl. ist gewöhnlich, linear mit konstanten Koeffizienten und von 1. Ordnung (die höchste vorkommende Ableitung ist die erste; siehe A 24.1ff. Daher handelt es sich hier um ein lineares Übertragungsglied 1. Ordnung. Wird bei einem linearen Messglied das Eingangssignal mit einem Faktor c multipliziert, so nimmt auch das Ausgangssignal den c-fachen Wert an. Unter der Annahme x1 (t) → y1 (t) und x2 (t) → y2 (t) gilt also:
0
C(dua (t)/dt) und die Spannung am Widerstand R ist uR (t) = Ri(t) = RC
dua (t) . dt
Aus uR (t) + ua (t) = ue (t) erhält man für das Zeitverhalten dieses Übertragungsgliedes RC
dua (t) + ua (t) = ue (t) . dt
τ
x2 (t) = c · x1 (t) → y2 (t) = c · y1 (t) . Außerdem gilt bei linearen Messgliedern das Superpositionsgesetz: x(t) = x1 (t) + x2 (t) → y(t) = y1 (t) + y2 (t) . In ähnlicher Weise liefern differenzierte oder integrierte Eingangssignale bei linearen Messgliedern am Ausgang differenzierte oder integrierte Ausgangssignale: dx1 (t) dy1 (t) → y2 (t) = , dt dt "t "t x2 (t) = x1 (τ)dτ → y2 (t) = y1 (τ)dτ .
x2 (t) =
0
0
Das Zeitverhalten linearer Verzögerungsglieder n-ter Ordnung wird allgemein durch die Dgl. dn y(t) dy(t) + a0 y(t) = kx(t) + . . . + a1 dtn dt beschrieben, wobei die Konstante k meist so gewählt wird, dass a0 = 1 wird. an
Bild 1-3. Dynamischer Fehler eines verzögerungsbehafte-
ten Messgliedes
H3
H4
H Messtechnik
1.2.3 Testfunktionen und Übergangsfunktionen für Übertragungsglieder
Um das Zeitverhalten von Übertragungsgliedern überprüfen zu können, legt man an den Eingang bestimmte typische Testfunktionen, die sich vergleichsweise einfach realisieren lassen, und beobachtet das sich ergebende Ausgangssignal (vgl. I 3.2). Besonders häufig dient als Testfunktion die Einheitssprungfunktion ε(t), die zur Zeit t = 0 vom Wert 0 auf einen konstanten Wert x0 springt. Zuweilen verwendet man als Testfunktion auch die zeitliche Ableitung oder das zeitliche Integral der Sprungfunktion und es ergeben sich auf diese Weise als Testfunktionen die Impulsfunktion δ(t) (eine Distribution, siehe A 8.3) und die Rampenfunktion r(t) = tε(t) (Bild 1-5). Wird ein Übertragungsglied 1. Ordnung mit einer Sprungfunktion x0 ε(t) erregt, so lautet die Dgl. τ
dy(t) + y(t) = y0 (= kx0 ) . dt
Die homogene Dgl. τ(dy(t)/dt) + y(t) = 0 ist separierbar, und man erhält die vollständige Lösung y(t) = c0 + c1 e−t/τ . Wegen y(t) = 0 für t = 0 und y(t) = y0 für t → ∞ ergibt sich als Sprungantwort y(t) = y0 (1 − e−t/τ ) . Durch Normierung auf die Höhe x0 der Sprungfunktion am Eingang erhält man die Übergangsfunktion oder Sprungantwort
Bild 1-5. Typische Testfunktionen
h(t) =
y(t) = k(1 − e−t/τ ) . x0
Die Steigung der Übergangsfunktion im Ursprung beträgt k k dh(t) = |e−t/τ |t=0 = . dt t=0 τ τ Die Tangente schneidet also die Asymptote zur Zeit t = τ (Bild 1-6). Ebenfalls dort hat die Übergangsfunktion den Wert (1 − 1/e)k, also 63,2% ihres Endwertes erreicht. Der dynamische Fehler ist Fdyn (t) = h(t) − k = −ke−t/τ . Der relative dynamische Fehler ist Fdyn = −e−t/r . k Er ist im logarithmischen Maßstab ebenfalls in Bild 1-6 dargestellt. Man kann dort ablesen, dass der Betrag des relativen dynamischen Fehlers erst nach fast 5 Zeitkonstanten unter 1% gesunken ist. Da sich die Impulsfunktion δ(t) durch Differenziation der Einheitssprungfunktion ε(t) ergibt, berechnet sich die Impulsantwort oder Gewichtsfunktion g(t) durch Differenziation der Übergangsfunktion zu g(t) =
dh(t) k −t/τ = e . dt τ
Wird die durch Integration aus der Sprungfunktion ε(t) erhaltene Rampenfunktion r(t) = tε(t) als Testfunktion an ein Übertragungsglied 1. Ordnung gelegt,
Bild 1-6. Übergangsfunktion h(t) und relativer dynamischer
Fehler −Fdyn /k eines Messgliedes 1. Ordnung
1 Grundlagen der Messtechnik
Bild 1-8. Frequenzverhalten des Amplitudenverhältnisses
bei einem Messglied 1. Ordnung
1 Ua = . Ue 1 + (ω/ωg )2 Bild 1-7. Gewichtsfunktion g(t), Übergangsfunktion h(t)
und Rampenantwort
.t
h(ϑ)dϑ eines Messgliedes 1. Ord-
0
nung
so liefert dieses die Rampenantwort "t h(ϑ)dϑ = kτ 0
4# t τ
$ 5 − 1 + e−t/τ .
Die Verläufe von Gewichtsfunktion (Impulsantwort), Übergangsfunktion (Sprungantwort) und Rampenantwort sind in Bild 1-7 dargestellt, wobei die jeweiligen Testfunktionen gestrichelt eingetragen sind. 1.2.4 Das Frequenzverhalten des Übertragungsgliedes 1. Ordnung
Als Testfunktionen eignen sich auch Sinusfunktionen veränderlicher Frequenz (bei konstanter Amplitude). Nach dem jeweiligen Einschwingen des Ausgangssignals beobachtet man bei linearen Messgliedern wieder ein sinusförmiges Signal derselben Frequenz wie die Anregungsfunktion, dessen Amplitude und Phase jedoch von der Frequenz abhängig sind. Das Frequenzverhalten des elektrischen Übertragungsgliedes 1. Ordnung (passives Tiefpassfilter) in Bild 1-4 lässt sich mithilfe der (in der Elektrotechnik üblichen) komplexen Rechnung zu G( jω) =
1 1/( jωC) Ua = = Ue R + 1/( jωC) 1 + jωRC
bestimmen (vgl. G 2.1). Hier beträgt die Zeitkonstante τ = RC = 1/ωg . Das Amplitudenverhältnis ergibt sich zu (Bild 1-8)
Legt man z. B. die Grenzfrequenz auf fg = 1/(2πτ) = 1/(2πRC) = 1 Hz fest, so beträgt von 0 bis 0,2 Hz der Amplitudenabfall höchstens etwa 2%, während Störsignale von 50 Hz ebenfalls nur mit etwa 2% durchgelassen werden. 1.2.5 Das Frequenzverhalten des Übertragungsgliedes 2. Ordnung
Übertragungsglieder 2. Ordnung enthalten in ihrer Dgl. die erste und die zweite zeitliche Ableitung der Ausgangsgröße. Typische Beispiele mechanischer Messglieder 2. Ordnung sind translatorische Feder-Masse-Systeme, wie Federwaagen oder Beschleunigungsmesser, oder rotatorische Systeme mit Drehfeder und Trägheitsmoment, wie anzeigende Drehspulmesswerke. Für dynamische Betrachtungen muss die statische Drehmomentengleichung Dα = Mel für den Skalenverlauf eines linearen Drehspulmesswerks um das Dämpfungsmoment pα˙ und das Beschleunigungsmoment J α¨ erweitert werden. Die Dgl. lautet also J
dα(t) d2 α(t) + Dα(t) = Mel (t) . +p dt dt2
Sie beschreibt den zeitlichen Verlauf α(t) der Winkelanzeige als Funktion des elektrisch erzeugten Moments Mel (t) und des Trägheitsmoments J, der Dämpfungskonstanten p und der Drehfederkonstanten D des rotatorischen Systems.
H5
H6
H Messtechnik
Das Zeitverhalten eines allgemeinen Übertragungsglieds 2. Ordnung wird durch die folgende Dgl. beschrieben, deren Glieder in Einheiten der Ausgangsgröße y(t) angegeben werden: 1 d2 y(t) 2ϑ dy(t) + y(t) = kx(t) . · + · ω0 dt dt2 ω20 (x(t) Eingangsgröße, ω0 Kreisfrequenz der ungedämpften Eigenschwingung, ϑ Dämpfungsgrad und k statische Empfindlichkeit. Durch einen Vergleich der obigen speziellen Dgl. des Drehspulmesswerks mit der allgemeinen Dgl. erhält man: p D bzw. ϑ = √ . ω0 = J 2 DJ 1.2.6 Sprungantwort eines Übertragungsgliedes 2. Ordnung
Nach sprungförmiger Änderung der Eingangsgröße x(t) eines Messgliedes 2. Ordnung auf den Wert x = x0 lautet die Dgl. 1 2ϑ y¨ + y˙ + y = kx0 (= y0 ) . 2 ω0 ω0 Abhängig vom Dämpfungsgrad ϑ ergibt sich für die normierte Sprungantwort y/y0 bei ungedämpfter Einstellung (ϑ = 0): y/y0 = 1 − cos ω0 t , bei periodischer (schwingender) Einstellung (ϑ < 1): ω0 −ϑω0 t e cos(ωt − ϕ) ω √ ϑ mit ω = ω0 1 − ϑ2 und tan ϕ = √ , 1 − ϑ2 y/y0 = 1 −
beim aperiodischen Grenzfall (ϑ = 1):
Bild 1-9. Sprungantwort eines Messgliedes 2. Ordnung bei verschiedenen Dämpfungsgraden ϑ
1 √ ω0 (ϑ − ϑ2 − 1) 1 . und T 2 = √ ω0 (ϑ + ϑ2 − 1)
mit T 1 =
Sprungantworten eines Messgliedes 2. Ordnung sind für verschiedene Dämpfungsgrade ϑ in Bild 1-9 dargestellt. Kenngrößen bei schwingender Einstellung (ϑ < 1)
Die Kreisfrequenz ω bei gedämpft schwingender Einstellung (ϑ < 1) ist gegenüber der Kreisfrequenz ω0 bei √ ungedämpfter Einstellung (ϑ = 0) um den Faktor 1 − ϑ2 verringert. Bei schwingender Einstellung (Bild 1-10) sind die Hüllkurven der Sprungantwort ( y/y0 )hüll = 1 ∓
ω0 −ϑω0 t e . ω
Berührungspunkte mit den Hüllkurven ergeben sich zu den Zeiten tB gemäß
y/y0 = 1 − e−ω0 t (1 + ω0 t) ,
cos(ωtB − ϕ) = 1 , ωtB − ϕ = iπ , π ϕ tB = + i (i = 0, 1, . . .) . ω ω
bei aperiodischer (kriechender) Einstellung (ϑ > 1): T1 T2 y −t/T 1 −t/T 2 =1− e − e y0 T1 − T2 T1 − T2
Der Nullphasenwinkel ϕ wird dabei wie angegeben über den Dämpfungsgrad ϑ berechnet. Schnittpunkte mit der Asymptoten y/y0 = 1 ergeben sich zu den Zeiten tS gemäß
1 Grundlagen der Messtechnik
Bild 1-11. Relative Überschwingweite q1 als Funktion des Dämpfungsgrades ϑ
Bild 1-10. Kenngrößen bei schwingender Einstellung (Messglied 2. Ordnung)
π cos(ωtS − ϕ) = 0 , ωtS − ϕ = + iπ , 2 π π ϕ + i (i = 0, 1, . . .) . tS = + ω 2ω ω Die Berührungspunkte mit den Hüllkurven und die Schnittpunkte mit der Asymptoten liegen jeweils um T/4 = π/2ω voneinander entfernt. Damit lässt sich die Kreisfrequenz ω einfach bestimmen. Extrema erhält man durch Nullsetzen der Ableitung der Sprungantwort zu den Zeiten tE gemäß d( y/y0 ) π = 0 , tE = i (i = 0, 1, . . .) . dt ω Im Ursprung weist die Sprungantwort also ein Minimum auf. Die Extrema liegen jeweils um T/2 = π/ω voneinander entfernt. Für die Bestimmung des Dämpfungsgrades ϑ aus der Sprungantwort benötigt man die Abweichungen der Funktionswerte yE an den Extremstellen vom asymptotischen Wert y0 . Die Beträge dieser Abweichungen sind ω0 −ϑω0 tE e cos ϕ . |yE /y0 − 1| = ω Das Verhältnis q1 zweier aufeinander folgender maximaler Abweichungen beträgt
Die relative Überschwingweite q1 ist in Bild 1-11 als Funktion des Dämpfungsgrades ϑ aufgetragen und ergibt den Dämpfungsgrad gemäß ϑ=
+ (ln q1 )2
.
Aperiodischer Grenzfall (ϑ = 1)
Bei kriechender Einstellung (ϑ > 1) findet kein Überschwingen der Sprungantwort statt. Von Interesse ist der aperiodische Grenzfall (ϑ = 1). Die Sprungantwort und die zweite Ableitung lauten y/y0 = 1 − (1 + ω0 t) e−ω0 t , d2 ( y/y0 ) = ω20 (1 − ω0 t) e−ω0 t . dt2 Der Wendepunkt der Sprungantwort wird zur Zeit tw = 1/ω0 erreicht. Der normierte Funktionswert am Wendepunkt beträgt yW /y0 = 1 − 2/e = 26,4% . 1.2.7 Frequenzgang eines Übertragungsgliedes 2. Ordnung
Beim Übertragungsglied 2. Ordnung erhält man den Frequenzgang G( jω), indem man in die Dgl. sinusförmige Ansätze für die Eingangs- und die Ausgangsgröße einführt. Es ergibt sich mit der normierten Frequenz η = ω/ω0 (= f / f0 )
π
√ π e−ϑω0 ω (i+1) 2 q1 (ϑ) = −ϑω π i = e−ϑω0 ω = e−πϑ/ 1−ϑ . 0ω e
− ln q1 π2
G( jη) =
k . 1 + j · 2ϑη − η2
H7
H8
H Messtechnik
Die Kenngrößen ω0 und ϑ eines Messgliedes können sowohl aus der Sprungantwort oder der Gewichtsfunktion als auch aus dem komplexen Frequenzgang ermittelt werden. Welche Methode im Einzelfall am vorteilhaftesten ist, hängt von den verfügbaren Messeinrichtungen und von möglichen Einschränkungen der Betriebsparameter ab. 1.2.8 Kenngrößen für Messglieder höherer Ordnung
Bild 1-12. Amplitudengang |G( jη)| und Phasengang ϕ(η) ei-
nes Messgliedes 2. Ordnung als Funktion der normierten Frequenz η = ω/ω0 (Parameter ist der Dämpfungsgrad ϑ)
Bei Messgliedern höherer als 2. Ordnung ist die exakte Bestimmung der mindestens 3 dynamischen Kenngrößen oft nur schwer möglich und teilweise auch nicht notwendig. Man behilft sich in diesen Fällen mit Ersatzkenngrößen und unterscheidet, ähnlich wie bei Messgliedern 2. Ordnung, zwischen schwingender und kriechender Einstellung. Bei schwingender Einstellung nach Bild 1-13a verwendet man als Kenngröße gerne die Einstellzeit T e , die notwendig ist, bis die Sprungantwort eines Messgliedes innerhalb vorgegebener Toleranzgrenzen bleibt. Als weitere Kenngröße ist die Größe yu¨ des ersten Überschwingers üblich. Sie gibt einen Anhaltspunkt über die Größe der Dämpfung des Messgliedes. Bei kriechender Einstellung nach Bild 1-13b verwendet man als Kenngrößen neben der Einstellzeit T e (wie bei schwingender Einstellung) gerne die Ersatztotzeit T t und die Ersatzzeitkonstante T s . Die Wende-
Amplitudengang |G( jω)| und Phasengang ϕ(ω) sind in Bild 1-12 dargestellt. Der Amplitudengang ist |G( jη)| =
k (1 −
η2 )2
+ (2ϑη)2
.
√ Für Dämpfungsgrade ϑ von 0 bis 1/ 2 treten im Amplitudengang bei den Kreisfrequenzen √ 2 ω/ω0 = √1 − 2ϑ Resonanzüberhöhungen um den Faktor 12 ϑ 1 − ϑ2 auf. Der Phasengang ist 2ϑη (−π für η > 1) . ϕ(η) = −arctan 1 − η2 Unabhängig vom Dämpfungsgrad ϑ ist bei η = 1 die Phase gleich −90◦ .
Bild 1-13. Kenngrößen eines Messgliedes höherer Ordnung. a Bei schwingender Einstellung, b bei kriechender Einstellung
1 Grundlagen der Messtechnik
tangente der Sprungantwort trifft die Zeitachse nach Ablauf der Ersatztotzeit T t . Die Ersatzzeitkonstante T s ist als die Differenz zwischen den Zeitpunkten definiert, die durch den Schnitt der Wendetangente mit der Zeitachse einerseits und mit der Asymptote andererseits gegeben sind.
1.3 Messfehler 1.3.1 Zufällige und systematische Fehler
Die in technischen Prozessen vorkommenden Messgrößen und die über Messeinrichtungen gewonnenen Messwerte sind i. Allg. fehlerbehaftet und weichen vom Soll- bzw. Nennwert ab. Die beobachteten Fehler setzen sich dabei aus systematischen (deterministischen) und zufälligen (stochastischen) Anteilen zusammen. Die Ursachen für systematische Fehler können z. B. fehlerhafte Einstellungen oder deterministische Einflusseffekte, aber auch bleibende Veränderungen oder definierte Zeitabhängigkeiten der Messgrößen sein. Die Größe eines systematischen Fehlers ist prinzipiell feststellbar. Systematische Fehler lassen sich deshalb korrigieren. Im Gegensatz dazu sind die Ursachen der die Einzelmessung beeinflussenden zufälligen Fehler nicht erkennbar. So ist z. B. die örtliche Verteilung der Dichte bei inhomogenen Gemischen nicht reproduzierbar; ebenso wenig wie die zeitliche Folge der Kernzerfälle, die bei bestimmten Strahlungsmessgeräten aufgenommen wird. Es handelt sich also um zufällige Fehler, wenn deren Ursachen bei den gegenwärtigen Kenntnissen und technischen Möglichkeiten nicht gemessen und reproduziert werden können. Zufällige Fehler lassen sich in ihrer Gesamtheit durch Verteilungsfunktionen und durch statistische Kennwerte erfassen, und zwar umso genauer, je größer die Zahl der zur Verfügung stehenden Einzelwerte ist. 1.3.2 Definition von Fehlern, Fehlerkurven und Fehleranteilen
Der Fehler eines Messgliedes zeigt sich als unerwünschte Abweichung des Istwertes yist vom Sollwert ysoll der Ausgangsgröße bei derselben Eingangsgröße x (Bild 1-14).
Bild 1-14. Istkurve, Sollkurve und Fehlerkurve eines Mess-
gliedes
Der (absolute) Fehler F ist definiert als die Differenz von Istwert yist und Sollwert ysoll . Der relative Fehler Frel ist der auf einen Bezugswert B bezogene (absolute) Fehler, wobei für B häufig die Ausgangsspanne Δy oder (bei Messverkörperungen, z. B. Widerständen) der Sollwert ysoll eingesetzt wird. Er hat die Dimension eins (ist „dimensionslos“): F = yist − ysoll , Frel =
yist − ysoll . Δy
Absolute Fehler werden häufig in Einheiten der Eingangsgröße angegeben. Bei linearen Messgliedern ist dies in einfacher Weise durch Umrechnung mit der Empfindlichkeit E möglich: F x = (yist − ysoll )/E . Der in der Fehlerkurve dargestellte Gesamtfehler F lässt sich aufspalten (Bild 1-15) in den – – – –
Nullpunktfehler F0 , Steigungsfehler FS (x), Linearitätsfehler FL (x), Hysteresefehler FH (x, h).
Istkennlinie yist , Sollkennlinie ysoll und Fehler F = yist − ysoll sind gegeben durch Δyist (x − x0 ) + FL (x) + FH (x, h) , Δx Δysoll ysoll = y0 soll + (x − x0 ) , Δx x − x0 F = (y0 ist − y0 soll ) + (Δyist − Δysoll ) @ABC @ABC Δx yist = y0 ist +
F0
+FL (x) + FH (x, h) .
FS (x)
H9
H10
H Messtechnik
Bild 1-16. Verschiedene Ausgleichsgeraden zur Festlegung des Linearitätsfehlers. a Festpunktmethode, b Gerade durch Messbereichsanfang, c Toleranzbandmethode, d wie b, jedoch mit Steigung wie im Messbereichsanfang
Bild 1-15. Aufspaltung des Gesamtfehlers. a Nullpunktfeh-
ler, b Steigungsfehler, c Linearitätsfehler, d Hysteresefehler
Alle Fehleranteile sind absolute Fehler (in Einheiten) der Ausgangsgröße. Häufig gibt man relative Fehler an, die auf den Sollwert Δysoll der Ausgangsspanne bezogen werden. Schwierigkeiten bereiten die Hysteresefehler FH (x,h), die naturgemäß außer von der Eingangsgröße x auch von der Vorgeschichte h(history) abhängen. 1.3.3 Linearitätsfehler und zulässige Fehlergrenzen
Bei der Zerlegung des Gesamtfehlers in Fehleranteile haben wir den Linearitätsfehler etwas willkürlich nach der Festpunktmethode bestimmt. Die Sollkennlinie geht dabei durch die zwei Punkte der Istkennlinie am Anfang und am Ende des Messbereichs (Bild 1-16a). Andere Möglichkeiten zur Festlegung dieser Ausgleichsgeraden sind:
– Gerade durch den Messbereichsanfang, aber mit einer Steigung, die ein bestimmtes Minimalprinzip erfüllt (Bild 1-16b). – Gerade, deren Lage so gewählt wird (Toleranzbandmethode), dass ausschließlich ein bestimmtes Minimalprinzip erfüllt wird (Bild 1-16c). – Gerade durch den Messbereichsanfang mit einer Steigung gleich der der Istkennlinie im Messbereichsanfang (Bild 1-16d). Diese Festlegung ist besonders bei kleinen Aussteuerungen sinnvoll. Bei der Klassenangabe für elektrische Messgeräte ist über den ganzen Messbereich ein konstanter Fehler zugelassen. Im Gegensatz dazu ist es bei Messgliedern i. Allg. sinnvoll, die zulässigen Fehler in der Umgebung des Messbereichsanfangs kleiner festzulegen als am Messbereichsende. Linearitätsfehlerfestlegungen mit Sollgeraden durch den Messbereichsanfang der Istkennlinie nehmen darauf Rücksicht, dass der Messbereichsanfang, auch aufgrund von Fertigungsmaßnahmen (Abgleich des Nullpunktes), in der Regel geringere Fehler aufweist als das Messbereichsende (Bild 1-17). Zum konstanten maximalen Nullpunktfehler |F0 |max addiert sich der zur Eingangsgröße (x − x0 ) proportionale maximale Steigungsfehler |FS (x)|max : |F0 |max = |y0 ist − y0 soll |max , x − x0 |FS (x)|max = |Δyist − Δysoll |max . Δx
1 Grundlagen der Messtechnik
– ein- und/oder ausgangsseitige Rückwirkungen, z. B. durch die Belastung einer Quelle von endlichem Innenwiderstand.
Bild 1-17. Sinnvolle Festlegung zulässiger Fehlergrenzen bei Messgliedern
Die Angabe des zulässigen Fehlers Fzul muss durch die (konstante) Empfindlichkeit E dividiert werden, um den Fehler in Einheiten der Eingangsgröße zu erhalten, wie z. B. bei einem Gerät zur Messung der Länge l: Fzul = ±(50 + 0,1 l/mm)μm . Man kann auch den zulässigen Fehler Fzul durch die Ausgangsspanne Δy (bzw. die Eingangsspanne Δx) dividieren und erhält so den zulässigen relativen Fehler. Nimmt man beim gleichen Längenmessgerät (z. B. einem Messschieber mit elektronischer Anzeige) eine maximale Messlänge lmax = Δx = 500 mm an, so beträgt der zulässige relative Fehler Frel, zul = ±(10−4 + 10−4 l/ lmax ) . Der Fehler besteht also wieder aus der Summe eines konstanten Nullpunktfehlers und eines proportionalen Steigungsfehlers.
Zuweilen beeinflussen auch Luftdruck und Luftfeuchte, mechanische Erschütterung, elektrische und magnetische Felder oder die Einbaulage die Messwerte in unerwünschter Weise. Es finden Verknüpfungen mit der Messgröße statt, deren Entflechtung aufwändig sein kann. Am einfachsten lassen sich die Wirkungen von Einflussgrößen in Kennlinienfeldern darstellen (Bild 1-18). In Sonderfällen kann es vorkommen, dass eine Einflussgröße nur den Nullpunkt (a) oder nur die Steigung (b) der Kennlinie eines Messgliedes beeinflusst. Im Allgemeinen ist jedoch mit gemischter (c), und auch mit Beeinflussung des Linearitätsfehlers (d) zu rechnen. In den Kennlinienfunktionen y treten neben der Messgröße x als Parameter die Einflussgrößen auf. Bei nur einer Einflussgröße ϑ lässt sich die Kennlinienfunktion in folgende Taylorreihe entwickeln y(x, ϑ) = y(x0 ± ξ, ϑ0 + τ) ∂y = y(x0 , ϑ0 ) + ξ ∂x (x0 ,ϑ0 ) 1 ∂2 y + ξ2 + . . . 2 ∂x2 (x0 ,ϑ0 ) ∂y 1 ∂2 y + τ+ τ2 ∂ϑ (x0 ,ϑ0 ) 2 ∂ϑ2 (x0 ,ϑ0 ) 1 ∂2 y +...+ ξτ + . . . 2 ∂x∂ϑ (x0 ,ϑ0 )
1.3.4 Einflussgrößen und Einflusseffekt
Bisher wurde immer angenommen, dass die Einflussgrößen (auch: Störgrößen) als konstant angesehen werden können. In Wirklichkeit können Einflussgrößen nicht unerheblich zu den Messfehlern beitragen. Wichtige Einflussgrößen sind: – die Temperatur (wenn sie nicht gerade selbst die Messgröße ist), – die Versorgungsspannung von aktiven Sensoren, Verstärkern oder Messschaltungen, – die fertigungsbedingten Abweichungen von wesentlichen Bauteilen und Komponenten,
Bild 1-18. Darstellung von Einflussgrößen
H11
H12
H Messtechnik
Die Einflussgröße tritt i. Allg. nicht unabhängig von der Messgröße auf, was sich in dem gemischtquadratischen Glied der Reihe ausdrückt. In Analogie zur Empfindlichkeit (y/x) x=x0 eines ungestörten Messgliedes wird der Einflusseffekt (auch: Störempfindlichkeit) als partielle Ableitung der Ausgangsgröße nach der Einflussgröße im Arbeitspunkt definiert: ∂y Eϑ (x0 , ϑ0 ) = . ∂ϑ (x0 ,ϑ0 ) Er gibt an, um welchen Betrag ∂y sich die Ausgangsgröße ändert, wenn bei konstanter Messgröße sich die Einflussgröße ϑ von ϑ0 auf ϑ0 + ∂ϑ ändert.
Werden alle besetzten Klassen einbezogen, so ist natürlich nk und die Wahrscheinlichkeit ist k
P=1. Anstelle der gesamten Verteilungsfunktion verwendet man gerne charakteristische Kennwerte für ihre Lage und Form, welche sich aus den n Messwerten xi berechnen lassen. Betrachtet man die Verteilungsfunktion in Bild 1-19, so erkennt man zunächst, dass sich die Messwerte in der Umgebung eines etwa in der Mitte liegenden Wertes häufen. Es ist deshalb sinnvoll, den (arithmetischen) Mittelwert x¯ als erste Kenngröße festzulegen: 1 xi . n i=1 n
x¯ =
1.3.5 Diskrete Verteilungsfunktionen zufälliger Messwerte
Diskrete Messwertverteilungen entstehen im einfachsten Fall dadurch, dass ganzzahlige absolute Häufigkeiten nk über äquidistanten diskreten Messwerten xk aufgetragen werden, die der jeweiligen Klassenmitte entsprechen (Bild 1-19). Die Klassenbreite ist dabei gleich der Differenz benachbarter diskreter Messwerte Δx = xk+1 − xk . Wenn insgesamt n Messwerte xi zur Verteilungsfunktion beitragen, so ist die empirische Wahrscheinlichkeit Pk , dass Messwerte in die Klasse k fallen, gleich der relativen Häufigkeit Pk =
nk n
und die Wahrscheinlichkeit P für das Auftreten von Messwerten in mehreren benachbarten Klassen beträgt nk 1 = P= Pk = nk . n n k k k
Bild 1-19. Diskrete Messwertverteilung
Weicht der Mittelwert vom Soll- oder Nennwert der Messgrößen ab, so liegt ein systematischer Fehler vor, der gerade gleich der Differenz zwischen Mittelwert und Soll- bzw. Nennwert ist. Zur Charakterisierung der zufälligen Fehler ist als zweite Kenngröße der mittlere quadratische Fehler, die sog. empirische Standardabweichung s üblich. Deren Quadrat, die Varianz oder Streuung s2 , ist 1 (xi − x¯)2 . n − 1 i=1 n
s2 =
Wie man leicht zeigen kann, gilt auch die numerisch günstigere Beziehung ⎡ n ⎛ n ⎞2 ⎤ 1 ⎢⎢⎢⎢ 2 1 ⎜⎜⎜⎜ ⎟⎟⎟⎟ ⎥⎥⎥⎥ 2 ⎢⎢ x − ⎜ xi ⎟ ⎥⎥ . s = n − 1 ⎣ i=1 i n ⎝ i=1 ⎠ ⎦ Mittelwert und Standardabweichung sagen nicht alles über die Form der Verteilungsfunktion aus. Außerdem ist es für weiterführende Überlegungen oft zweckmäßig, statt von einer diskreten Verteilungsfunktion von einer kontinuierlichen Verteilung der Messwerte auszugehen, die dann aber nur für eine große Anzahl n von Messwerten x gültig ist. Praktisch beobachtete Verteilungen lassen sich häufig näherungsweise durch die Normalverteilung beschreiben, weil dies die Grenzverteilung beim Zusammenwirken vieler voneinander unabhängiger und ähnlich großer Einflusseffekte ist (Zentraler Grenzwertsatz).
1 Grundlagen der Messtechnik
1.3.6 Die Normalverteilung
Die Normalverteilung (Gauß’sche Verteilung) f (x) ist eine stetige symmetrische Verteilung der streuenden Messwerte x um den Mittelwert μ. Betragsmäßig gleich große positive und negative Abweichungen (zufällige Fehler) besitzen gleiche Häufigkeit. Große Abweichungen sind weniger häufig als kleine. Schließlich liegt an der Stelle des Mittelwerts x = μ (zufälliger Fehler = 0) das Maximum der Verteilungsfunktion. Weiterhin gilt wie bei allen stetigen Verteilungsfunktionen, dass die Standardabweichung σ die Beziehung "∞ 2 σ = (x − μ)2 f (x) dx −∞
erfüllt und die Gesamtfläche unter der Verteilungsfunktion "∞ f (x)dx = 1 −∞
ist, da sie die Wahrscheinlichkeit für das Auftreten jedes beliebigen Messwertes im Bereich −∞ < x < ∞ darstellt. Formelmäßig gilt für die Normalverteilung f (x) abhängig von den Messwerten x bzw. den zufälligen Fehlern x − μ (x − μ)2 1 exp − f (x) = √ . 2σ2 2πσ Die Diskussion dieser in Bild 1-20 dargestellten Verteilungsfunktion liefert das Maximum √ fmax = 1/(σ 2π) bei x = μ und Wendepunkte bei x = μ ± σ. Allgemein erhält man durch Integration einer Verteilungsfunktion über einem bestimmten Intervall die
Bild 1-20. Normalverteilung f (x)
Wahrscheinlichkeit für das Auftreten von Messwerten in diesem Intervall. Eine Verteilungsfunktion wird deshalb oft auch als Wahrscheinlichkeitsdichte bezeichnet. 1.3.7 Gauß’sche Fehlerwahrscheinlichkeit
Die differenzielle Wahrscheinlichkeit dP für das Auftreten von Messwerten x (bzw. Fehlern x − μ) im differenziellen Intervall der Breite dx beträgt dP = f (x)dx . In einem endlichen Intervall x1 x x2 nach Bild 1-21 ergibt sich also bei Normalverteilung für die Wahrscheinlichkeit "x2 P=
f (x)dx = x1
1 √ σ 2π
"x2
(x − μ)2 exp − dx . 2σ2
x1
Das auftretende Integral ist elementar nicht lösbar. In verschiedenen Tabellenwerken ist ein entsprechendes normiertes Integral als Fehlerfunktion (error function) 2 erf(x) = √ π
"x
e−t dt 2
0
tabelliert. Mit der Substitution x−μ √ =t σ 2 ergibt sich nach Zwischenrechnung
Bild 1-21. Fehlerwahrscheinlichkeit P
H13
H14
H Messtechnik
Dort ist die Summenwahrscheinlichkeit bzw. die relative Summenhäufigkeit "x0 bzw.
−∞
Bild 1-22. Fehlerwahrscheinlichkeit P(ε) bei symmetrischem Intervall −ε x − μ ε
P=
1 x1 − μ x2 − μ . erf √ − erf √ 2 σ 2 σ 2
Die Wahrscheinlichkeit des Auftretens von Fehlern im symmetrischen Intervall −ε x − μ ε ist wegen erf (x) = – erf (– x) ε P(ε) = erf √ . σ 2 Diese Fehlerwahrscheinlichkeit ist in Bild 1-22 grafisch und in einer Wertetabelle dargestellt. 1.3.8 Wahrscheinlichkeitspapier
Abweichungen von der Glockenform der Normalverteilung können im sog. Wahrscheinlichkeitsnetz (Bild 1-23) häufig leichter erkannt werden.
1 nk n −∞ 0
f (x) dx
abhängig von der jeweils oberen Messwertgrenze x0 aufgetragen. Die Ordinatenachse der Summenwahrscheinlichkeit ist derart geteilt, dass sich für die Normalverteilung eine Gerade ergibt. Abweichungen von der Geradenform zeigen also entsprechende Abweichungen von der Normalverteilung. Der Schnittpunkt der erhaltenen Geraden mit der 50%-Linie liefert den Mittelwert x¯. Die Werte x¯ ± s erhält man bei den Summenwahrscheinlichkeiten 84,13% und 15,87% (50% ± 0,5 · 68,26%). 1.3.9 Fehlerfortpflanzung zufälliger Fehler
Der Fehler dy eines Messergebnisses y = f (x1 , x2 , . . . , xn ) berechnet sich aus den Fehleranteilen dx1 , dx2 , . . . , dxn der Eingangsgrößen x1 , x2 , . . . , xn über das totale Differenzial zu dy =
∂y ∂y ∂y dx1 + dx2 + . . . + dxn . ∂x1 ∂x2 ∂xn
Zur Berechnung der Standardabweichung eines zufällig schwankenden Messergebnisses sind die auftretenden Fehler zunächst zu quadrieren. Man erhält (dy)2 =
n ∂y i=1
∂xi
2 +2
dxi
∂y ∂y · dxi dx j . ∂xi ∂x j i j
Die gemischten Glieder (i j) heben sich im statistischen Mittel gegenseitig auf, da die Wahrscheinlichkeit positiver zufälliger Fehler gleich der von negativen zufälligen Fehlern ist. Unter der Voraussetzung einer Normalverteilung und für kleine Standardabweichungen si xi ergibt sich die Standardabweichung sy des Messergebnisses y aus den Standardabweichungen s1 , s2 , . . . , sn der Messwerte x1 , x2 , . . . , xn zu 8 Bild 1-23. Wahrscheinlichkeitsnetz
sy =
∂y s1 ∂x1
2
∂y + s2 ∂x2
2
∂y +...+ sn ∂xn
2 .
2 Strukturen der Messtechnik
Für Summen- und Produktfunktionen y ergeben sich die Standardabweichungen sy zu y = a 1 x1 + a 2 x2 − a 3 x3 :
sy = a21 s21 + a22 s22 + a3 s23 , bzw. x1 x2 y= : x3 8 2 2 2 sy s2 s3 s1 = + + . y x1 x2 x3 1.3.10 Fehlerfortpflanzung systematischer Fehler
Die Bedeutung der Gesetze der Fehlerfortpflanzung liegt darin, dass man mit ihnen Aussagen über die Zuverlässigkeit eines von mehreren Eingangsgrößen bestimmten Ergebnisses oder eines Messverfahrens machen kann, wenn nur die Fehler bei der Messung der einzelnen Eingangsgrößen bekannt sind. Häufig ist das Messergebnis y eine Funktion einer oder mehrerer Eingangsgrößen xi , von denen jede entweder durch einen einzelnen Messwert oder den Mittelwert einer Anzahl von Messwerten repräsentiert wird (Bild 1-24). Diese Eingangsgrößen sind mit Fehlern behaftet, deren Auswirkung auf das Messergebnis unterschiedlich ist, je nachdem, ob es sich um systematische oder um zufällige Fehler handelt. Hier werden systematische Fehler behandelt, deren Größe nach Betrag und Vorzeichen bekannt ist. Bei großen Fehlern F x1 , F x2 , . . . der Eingangsgrößen führt die Differenzenrechnung zum Fehler Fy des Messergebnisses y. Bei einem multiplikativen Zusammenhang y = x1 · x2 ist der relative Fehler des Messergebnisses Fy F x1 F x2 F x1 F x2 = + + · . y x1 x2 x1 x2 Bei genügend kleinen Fehleranteilen können die endlichen Fehler F xi durch Differenziale dxi ersetzt wer-
den. Der Fehler dy des Messergebnisses y berechnet sich dann aus den Fehleranteilen dx1 , dx2 , . . . , dxn über das totale Differenzial zu ∂y ∂y ∂y dy = dx1 + dx2 + . . . + dxn . ∂x1 ∂x2 ∂xn Für Summen-, Produkt- und Potenzfunktionen y erhält man die „fortgepflanzten“ systematischen Fehler dy y = x1 + x2 − x3 − x4 : dy = dx1 + dx2 − dx3 − dx4 , x1 x2 y= : x3 x4 dy dx1 dx2 dx3 dx4 = + − − , y x1 x2 x3 x4 y = kxm : dx dy =m . y x Bei der Summenfunktion addieren sich also die absoluten Fehler, bei der Produktfunktion die relativen Fehler und bei der Potenzfunktion wird der relative Fehler mit dem Exponenten m multipliziert.
2 Strukturen der Messtechnik 2.1 Messsignalverarbeitung durch strukturelle Maßnahmen Für die erreichbaren Übertragungseigenschaften von Messeinrichtungen ist in starkem Maße die Struktur der Vermaschung der einzelnen Messglieder maßgebend. Die Qualität der Messeinrichtungen ist von der durch strukturelle Maßnahmen bedingten Messsignalverarbeitung abhängig. Es lassen sich drei Grundstrukturen, nämlich (1.) die Kettenstruktur, (2.) die Parallelstruktur und (3.) die Kreisstruktur unterscheiden. 2.1.1 Die Kettenstruktur
Bild 1-24. Fortpflanzung systematischer Fehler bei Verknüpfungen und Funktionsbildungen
In der Kettenstruktur werden nichtelektrischen Messgröße eines Aufnehmers bis zum nes Ausgabegerätes realisiert.
Messketten von der als Eingangsgröße Ausgangssignal eiDie Anpassung des
H15
H16
H Messtechnik
Aufnehmer-Ausgangssignals an das Eingangssignal des sog. Ausgebers erfolgt meist über eine Messschaltung, einen Messverstärker und/oder ein geeignetes Rechengerät. Häufig wird in einer Kettenstruktur auch die nichtlineare Kennlinie eines Messgrößenaufnehmers linearisiert, indem ein Messglied mit inverser Übertragungskennlinie nachgeschaltet wird. Die Kettenstruktur nach Bild 2-1a ist dadurch gekennzeichnet, dass das Ausgangssignal yi des vorangehenden Messgliedes jeweils das Eingangssignal xi+1 des nachfolgenden Messgliedes bildet. Die resultierende statische Kennlinie y3 = f (x1 ) ergibt sich i. Allg. am einfachsten grafisch gemäß Bild 2-1b. Für den Spezialfall linearer Kennlinien mit
konstanten Empfindlichkeiten E, yi = ci + E i xi
mit
E=
dyi , dxi
ergibt sich bei der Kettenstruktur wieder eine lineare Kennlinie mit der Empfindlichkeit n
E=
E (n Anzahl der Messglieder) . i=1
Beispiel: Im Zusammenhang mit der Durchflussmessung nach dem Wirkdruckverfahren (3.4.1) ist der Differenzdruck Δp über einer Drosselstelle näherungsweise dem Quadrat des Volumendurchflusses Q proportional (Δp ∼ Q2 ). Eine Linearisierung ist mit einem nachgeschalteten radizierenden Differenzdruck-Messumformer möglich, dessen Ausgangsstrom I der Wurzel aus dem Differenzdruck proportional ist (I ∼ Δp). In Bild 2-1c sind die nichtlinearen Einzelkennlinien und die resultierende lineare Gesamtkennlinie grafisch dargestellt. 2.1.2 Die Parallelstruktur (Differenzprinzip)
Besondere Bedeutung hat die Parallelstruktur in Gestalt des Differenzprinzips erlangt. Ähnlich wie bei Gegentaktschaltungen für Verstärkerendstufen, können z. B. zwei sonst gleichartige nichtlineare Wegsensoren um einen bestimmten Arbeitspunkt x0 herum, von der Messgröße x (dem Messweg) gegensinnig ausgesteuert werden, während Einflussgrößen, wie z. B. die Temperatur ϑ, gleichsinnig wirken (Bild 2-2a). Durch Subtraktion der Ausgangssignale y1 und y2 kann die Übertragungskennlinie linearisiert und der Einfluss gleichsinnig wirkender Störungen reduziert werden. Lässt sich die Abhängigkeit der Ausgangsgrößen y beider Messglieder von der allgemeinen Eingangsgröße ξ und der Temperatur ϑ durch y = a0 + a1 ξ + a2 ξ2 + f (ϑ)
Bild 2-1. Die Kettenstruktur. a Prinzip, b grafische Konstruktion der resultierenden statischen Kennlinie, c Linearisierung durch Radizierung bei der Durchflussmessung nach dem Wirkdruckverfahren
beschreiben und werden die beiden Messglieder mit ξ1 = x0 − x bzw. ξ2 = x0 + x ausgesteuert, so sind ihre Ausgangssignale y1 = a0 + a1 (x0 − x) + a2 (x0 − x)2 + f (ϑ) , y2 = a0 + a1 (x0 + x) + a2 (x0 + x)2 + f (ϑ) .
2 Strukturen der Messtechnik
Bild 2-3. Anwendung des Differenzprinzips: Linearer Wegaufnehmer mit Differenzialkondensator
Bild 2-2. Die Parallelstruktur (Differenzprinzip). a Diffe-
renzprinzip, b Linearisierung durch Anwendung des Differenzprinzips
Das Differenzsignal ist dann yges = y2 − y1 = 2(a1 + 2a2 x0 )x . Das Differenzsignal yges ist unter den getroffenen Annahmen streng linear von der Messgröße x abhängig und völlig unabhängig von der Temperatur ϑ (Bild 2-2b). Die Empfindlichkeit Eges ist konstant und doppelt so groß wie der Betrag der Empfindlichkeiten E der einzelnen Messglieder im Arbeitspunkt ξ = x0 (x = 0): ∂y1,2 = ∓(a1 + 2a2 x0 ) , E1,2 = ∂x x=0 ∂yges Eges = = 2(a1 + 2a2 x0 ) . ∂x x=0 Allgemein ergibt sich im Arbeitspunkt ein Wendepunkt, also eine Linearisierung der Gesamtkennlinie, und eine Reduktion des Einflusses gleichsinnig wirkender Störungen. Anwendungen des Differenzprinzips
Das Differenzprinzip kann in Messschaltungen immer dann angewendet werden, wenn an einen
zweiten Messgrößenaufnehmer die Messgröße gegensinnig angelegt werden kann, wie z. B. bei Kraft-, Dehnungs- oder Wegsensoren. Zwei gegensinnig ausgesteuerte Dehnungsmessstreifen können in einer Brückenschaltung sowohl den Messeffekt verdoppeln als auch den gleichsinnigen Temperatureinfluss stark reduzieren. Der Linearisierungseffekt spielt in diesem Fall nur eine untergeordnete Rolle, da die Dehnungen und die daraus resultierenden relativen Widerstandsänderungen nur klein sind und gewöhnlich unter 1% liegen. Beispiel: Exakte Linearisierung wird bei einem Differenzialkondensator-Wegaufnehmer (siehe 3.2.3) erreicht, wenn nach Bild 2-3 die Plattenabstände x1 und x2 der beiden Kondensatoren C1 und C2 durch den Messweg x gemäß x1 = x0 − x und x2 = x0 + x gegensinnig beeinflusst werden. Die normierte Ausgangsspannung U/U0 der wechselspannungsgespeisten Brückenschaltung beträgt mit Ci = εA/xi (A Plattenfläche, Permittivität ε = ε0 εr , i = 1, 2). U 1 1 x 1/jωC2 − = · = . U0 (1/jωC1 ) + (1/jωC2 ) 2 2 x0 Die Ausgangsspannung U ist also dem Messweg x direkt proportional. 2.1.3 Die Kreisstruktur
Die Kreisstruktur in Gestalt des Kompensationsprinzips (Gegenkopplung) ergibt sich nach Bild 2-4a. Der zu messenden Eingangsgröße x wird die Ausgangsgröße xK eines in der Rückführung liegenden Messgliedes entgegengeschaltet und so lange verändert, bis sie näherungsweise gleich der Eingangsgröße ist. Im Falle konstanter Übertragungsfaktoren v und G der Messglieder im Vorwärtszweig bzw. in der Rückfüh-
H17
H18
H Messtechnik
Bild 2-5. Das Prinzip der Modulation
Bild 2-4. Die Kreisstruktur. a Prinzip, b Spannungskompensation von Hand, c motorische Kompensation einer Spannung, d gegengekoppelter reiner Spannungsverstärker
rung berechnet sich der Übertragungsfaktor y/x bei Gegenkopplung aus y = v(x − xK ) = v(x − Gy) zu y v 1 = = 1 x 1 + Gv +G v Bei sehr großen Übertragungsfaktoren v 1/G des Messgliedes im Vorwärtszweig vereinfacht sich der Übertragungsbeiwert bei Gegenkopplung zu y/x = 1/G. Als Beispiele können die verschiedenen Methoden der Spannungsmessung und Spannungsverstärkung in Bild 2-4b bis d dienen. Im Fall (b) führt die Kompensation von Hand, im Fall (c) die motorische Kompensation („Servo“) zu einem der Messspannung U proportionalen Winkel α. Im Fall (d) des reinen Spannungsverstärkers vergrößert sich die Ausgangsspannung U2 so lange, bis die rückgeführte Spannung [R2 /(R1 +R2 )]U2 gleich der Eingangsspannung U1 ist. Damit ist U2 auch proportional zu U1 .
2.2 Das Modulationsprinzip Die nullpunktsichere Verstärkung oder Umformung kleiner Messsignale ist häufig in unerwünschter Weise durch vorhandene – teils extrem niederfrequente – Störsignale begrenzt. In erster Linie handelt es sich dabei um Temperaturdrift oder um Langzeitdrift wegen Alterung. Mithilfe des Modulationsprinzips nach Bild 2-5 kann Nullpunktsicherheit gewährleistet werden
(vgl. G 22.3). Die Amplitude einer oft sinus- oder rechteckförmigen Trägerschwingung wird mit dem zu verstärkenden Messsignal moduliert, dann mit einem a priori nullpunktsicheren Wechselspannungsverstärker verstärkt und anschließend wieder vorzeichenrichtig demoduliert. Die Frequenz ωT der Trägerschwingung wählt man so, dass sie in einen vergleichsweise ungestörten Frequenzbereich zu liegen kommt. Die Frequenz muss daher einerseits größer sein als die Frequenz der höchsten Oberwellen der Netzfrequenz, die Störungen verursachen können. Andererseits soll die Frequenz niedriger als die Frequenz störender Rundfunksender liegen. Aus diesen Überlegungen heraus bietet sich als Frequenz für die Trägerschwingung etwa der Bereich zwischen 500 Hz und 50 kHz an. Modulatoren zur Messung nichtelektrischer Größen
Bei trägerfrequenzgespeisten Messbrücken (Bild 2-6a) erfolgt eine nullpunktsichere Umformung von Widerstands-, Kapazitäts- oder Induktivitätsänderungen in amplitudenmodulierte Wechselspannungen. Bei einer mit vier Widerstandsaufnehmern ausgestatteten (sogenannten Voll-)Brücke, die mit der Trägerfrequenz-Spannung U0 cos ωT t gespeist wird, ist die normierte Ausgangsspannung R0 + ΔR R0 − ΔR U cos ωT t = − U0 2R0 2R0 ΔR = cos ωT t . R0 Diese Brückenausgangsspannung kann mit einem nullpunktsicheren Wechselspannungsverstärker verstärkt und anschließend phasenabhängig gleichgerichtet werden. Dieser Synchrongleichrichter wird
2 Strukturen der Messtechnik
Signalverarbeitungsmaßnahmen vollzogen werden können (Mikroperipherik-Komponenten). Dadurch sind spezifische Anforderungen des Prozesses, des Bedienungspersonals, des Sammelleitungssystems und der Mikroperipherik-Komponenten erfüllbar. 2.3.1 Erhöhung des nutzbaren Informationsgehalts
Bild 2-6. Modulatoren zur Messung nichtelektrischer Größen. a Trägerfrequenz-Messbrücke, b Rotierende Modulatorscheibe im Wechsellicht-Fotometer
von derselben Trägerfrequenz gesteuert, die die Messbrücke speist. Für die Messung optischer und daraus abgeleiteter Größen kann mit einer rotierenden Modulatorscheibe ein Lichtstrom periodisch moduliert werden (Bild 2-6b). Dieses Verfahren ist dann von Vorteil, wenn die Intensität eines Lichtstroms nullpunktsicher ausgewertet werden soll. Beispiele sind das Wechsellichtfotometer, mit dem die Transparenz einer Probe bestimmt werden kann, und Gasanalysegeräte, bei denen aus der Infrarotabsorption auf die Gaskonzentration geschlossen werden kann. Die Drehzahl des Antriebsmotors der Modulatorscheibe bestimmt die Trägerfrequenz. Die Modulatorscheibe moduliert die von der Strahlenquelle zum Strahlungsempfänger gelangende Intensität. Die Modulation kann rechteckförmig oder sinusähnlich sein. Das vom Strahlungsempfänger abgegebene Signal wird mit einem Wechselspannungsverstärker verstärkt und dann gleichgerichtet.
Der nutzbare Informationsgehalt H jedes Sensors ist begrenzt und lässt sich i. Allg. durch Messsignalverarbeitung erhöhen. Nur von theoretischer Bedeutung ist der unendlich hohe Informationsgehalt eines analogen Sensors, dessen Kennlinie unabhängig von Einflussgrößen und ideal reproduzierbar ist. In Wirklichkeit ist jedem Sensor-Ausgangssignal aufgrund der Messunsicherheit ein bestimmter Eingangsbereich zugeordnet. Die Zahl der unterscheidbaren Eingangssignale ist also begrenzt und lässt sich bei gegebenem Streubereich auch bei einer nichtlinearen Kennlinie grafisch bestimmen (Bild 2-7). Bei einer linearen Sollkennlinie und einem zulässigen relativen Fehler Frel berechnet sich die Zahl z der unterscheidbaren Eingangssignale zu z=
1 . 2Frel
2.3 Struktur eines digitalen Instrumentierungssystems Die Struktur digitaler Instrumentierungssysteme ist durch dezentrale, „intelligente“ Komponenten gekennzeichnet, die über ein digitales Sammelleitungssystem (Bussystem) miteinander kommunizieren. Jede individuelle Peripheriekomponente enthält dabei einen Mikrorechner, mit dem spezifische
Bild 2-7. Bestimmung der Zahl z der unterscheidbaren Zu-
stände
H19
H20
H Messtechnik
Der Nutz-Informationsgehalt Hnutz beträgt allgemein Hnutz = ld z und wird in der Pseudoeinheit Shannon (Sh) angegeben (frühere Einheit: bit). Bei linearer Sollkennlinie ist daher der NutzInformationsgehalt Hnutz = ld(1/Frel ) − ld 2 = −ld Frel + 1 . Bild 2-9. Sensorgenerationen
Typischerweise liegt der Nutz-Informationsgehalt eines industriellen Drucksensors ohne Korrektur des Temperatureinflusses zwischen 4 und 6 Sh. Mit rechnerischer Korrektur des Temperatureinflusses lassen sich möglicherweise Werte zwischen 8 und 12 Sh erreichen. 2.3.2 Struktur von Mikroelektroniksystemen mit dezentraler Intelligenz
Die grundsätzliche Struktur von Mikroelektroniksystemen und Mikroperipherikkomponenten (speziell der Sensoren) ist gekennzeichnet durch die Anwendung der Mikroelektronik zur Prozessführung und durch die notwendigen Mikroperipherikkomponenten zur Verbindung von Prozess, Mikroelektronik und Mensch (Bild 2-8). In einer fortgeschrittenen Version sind die dezentralen Mikroperipherikkomponenten (speziell die Sensoren) „intelligent“, beinhalten einen Mikrorechner und sind mit einem Datenbus verbunden (Bild 2-9).
Bild 2-8. Komponenten der Mikroperipherik
Ausgehend von diesen Vorstellungen und dem Wunsche nach möglichst vollständiger Integration von Komponente (speziell Sensor) und Signalverarbeitung ergibt sich die Struktur eines Mikroelektronik-Systems nach Bild 2-10. Mit der sog. anthropospezifischen Messsignalverarbeitung in der Ausgabekomponente ist eine Anpassung an die Eigenschaften des Menschen, speziell an die zulässige Informationsrate, möglich. Im einfachsten Fall wird außer einem besonders interessierenden Messwert dessen Änderungs-
Bild 2-10. Struktur eines futuristischen Mikroelektronik-
Systems
3 Messgrößenaufnehmer (Sensoren)
geschwindigkeit oder Streuung angegeben. Die Änderungsgeschwindigkeit kann dabei in Form des Wertes angegeben werden, der erreicht wird, wenn die momentane Änderungsgeschwindigkeit für einen konstanten Zeitraum, z. B. von 10 s, beibehalten wird. Die Angabe der Streuung eines Messwertes, z. B. durch die Breite einer Messmarke, verhindert fälschliche Interpretationen, die nur bei entsprechend höherer Messgenauigkeit Gültigkeit besäßen. Besondere Bedeutung hat die flexible Anpassung einer Mikroperipherikkomponente an den Peripheriebus, was gegenwärtig in der Industrie noch wenig beachtet wird. Dabei ist es die Aufgabe der „komponentenspezifischen Intelligenz“, nur die tatsächlich benötigte Übertragungsrate anzufordern und zu benutzen und bei Überlastung des Busses ein Notprogramm zu fahren, das den wichtigsten Systemaufgaben noch gerecht wird.
3 Messgrößenaufnehmer (Sensoren) 3.1 Sensoren und deren Umfeld 3.1.1 Aufgabe der Sensoren
Beim Entwurf und beim Betrieb von Mess- und Automatisierungssystemen kommt den Sensoren besondere Bedeutung zu. Ihre Aufgabe ist es, die Verbindung zum technischen Prozess herzustellen und die nichtelektrischen Messgrößen in elektrische Signale umzuformen. Bei dieser Umformung bedienen sie sich eines physikalischen oder chemischen Messeffektes, der von unerwünschten Stör- oder Einflusseffekten überlagert ist. Jedes Sensorsystem enthält eine im Allgemeinen individuelle Auswerteschaltung, mit deren Hilfe das Signal in ein Amplituden- oder Frequenzsignal umgeformt wird, eine Verstärkerschaltung, eine Umsetzungsschaltung ins digitale Signalformat und an geeigneter Stelle Maßnahmen zu analogen oder digitalen Signalverarbeitung. Die Realisierung des Messeffektes in einem Sensor bedarf konstruktiver und fertigungstechnischer Maßnahmen. Ein Sensor muss kalibriert und gegebenenfalls nachkalibriert werden. Schließlich muss auch
die für den Betrieb des Sensors erforderliche Infrastruktur, wie z. B. Hilfsenergie oder Steuerungssignale, verfügbar sein. Je nach Anwendungsbereich lassen sich verschiedene Sensorklassen unterscheiden. Typisch sind dabei Sensoren für die industrielle Technik, z. B. Verfahrenstechnik oder Fertigungstechnik, aber auch Sensoren für Präzisionsanwendungen oder für Anwendungen in Massengütern, also in dezentralen Einzelprozessen. Abhängig vom Anwendungsbereich werden unterschiedliche Anforderungen an die Sensoren gestellt. Eine wesentliche Rolle spielen die erreichbare Genauigkeit, die Einflusseffekte, die dynamischen Eigenschaften, die Signalform bei der Signalübertragung, die Zuverlässigkeit und natürlich auch die Kosten. 3.1.2 Messeffekt und Einflusseffekt
Von grundsätzlicher Bedeutung beim Entwurf eines Sensors sind der verwendete Messeffekt und die zu erwartenden störenden Einflusseffekte. Nicht für jede Messaufgabe stehen einfach aufgebaute, selektive Sensoren zur Verfügung. Die Art und die Zahl der verfügbaren physikalischen und chemischen Messeffekte sind begrenzt. In manchen Fällen liegt ein leicht realisierbarer Effekt zu Grunde wie z. B. der thermoelektrische Effekt, bei dem eine Temperaturdifferenz in eine eindeutig davon abhängige Spannung umgeformt wird. Vom Prinzip her schwieriger gestaltet sich schon die Messung mechanischer Größen, wie z. B. die Druckmessung. Neben dem eigentlichen Messeffekt tritt dabei immer die Temperatur als Einflussgröße auf. Die Kunst des Sensorentwicklers ist es dabei, die Auswirkung des Einflusseffekts möglichst zu eliminieren. 3.1.3 Anforderungen an Sensoren
Zu den wichtigsten Anforderungen, die an Sensoren gestellt werden, zählen statische Übertragungseigenschaften, Einflusseffekte und Umgebungsbedingungen, dynamische Übertragungseigenschaften, Zuverlässigkeit und Wirtschaftlichkeit. Als statische Übertragungseigenschaften interessieren zunächst die Empfindlichkeit des Sensors und die zulässigen Fehlergrenzen. Eine zu geringe Empfindlichkeit kann wegen der notwendigen Nachverstär-
H21
H22
H Messtechnik
kung zusätzliche Fehler verursachen. Ein niedriger resultierender Gesamtfehler des Sensors ist von Bedeutung, wenn z. B. genaue Temperatur- oder Lageregelungen erforderlich sind. Weiterhin sollen Sensoren möglichst geringe Einflusseffekte aufweisen. Eine Einflussgröße, z. B. eine Temperatur, kann dabei dann entweder durch geeignete Maßnahmen konstant gehalten werden, oder aber der Einfluss wird in der Auswerteschaltung korrigiert. Daneben können sich mechanische Erschütterungen und Schwingungen als Störgrößen auswirken, ebenso wie elektromagnetische Einflüsse unterschiedlich vertragen werden (Elektromagnetische Verträglichkeit, EMV). Neben diesen Einflusseffekten existieren gewöhnlich Grenzwerte für die Umgebungsbedingungen, die nicht überschritten werden dürfen, wenn ein zuverlässiger Betrieb angestrebt wird. Die zulässigen mechanischen und thermischen Beanspruchungen sind z. B. gewöhnlich durch bestimmte maximale Beschleunigungswerte bzw. auf bestimmte Temperaturbereiche begrenzt. 3.1.4 Signalform der Sensorsignale
Die Entscheidung darüber, welche Signalform der Sensorsignale möglich und vorteilhaft ist, hängt u. a. von den erforderlichen Eigenschaften bei der Signalübertragung und von der Art der erforderlichen Messwertverarbeitung ab. Im Wesentlichen lassen sich dabei die amplitudenanaloge, die frequenzanaloge und die (direkt) digitale Signalform unterscheiden. Für amplitudenanaloge Signale gilt: – Die erreichbare statische Genauigkeit ist beschränkt. – Die dynamischen Übertragungseigenschaften sind im Allgemeinen sehr gut. – Die Störsicherheit ist gering. – Die möglichen Rechenoperationen sind beschränkt. – Die galvanische Trennung ist sehr aufwändig. – Die anthropotechnische Anpassung ist gut, da z. B. Tendenzen schneller erkennbar sind. Für frequenzanaloge und für digitale Signale gilt: – Die mögliche statische Genauigkeit ist im Prinzip beliebig hoch.
– Die Dynamik ist begrenzt. – Die Störsicherheit bei der Signalübertragung ist hoch. – Rechenoperationen sind wegen der einfachen Anpassung an einen Mikrorechner leicht möglich. – Eine galvanische Trennung ist mit Übertragern oder Optokopplern einfach möglich. Eine anthropotechnische Anpassung ist im Falle frequenzanaloger Signale akustisch möglich. Bei digitalen Signalen kann durch Erhöhung der Stellenzahl eine sehr hohe Auflösung erzielt werden. Für spezielle Rechenoperationen, wie z. B. Quotienten- oder Integralwertbildung, sind frequenzanaloge Signale sehr gut geeignet. Frequenzanaloge Signale lassen sich mit wenig Aufwand ins digitale Signalformat umsetzen. Da außerdem eine Reihe wichtiger Sensoren frequenzanaloge Ausgangssignale liefern und zudem einfacher aufgebaut sind als vergleichbare amplitudenanaloge Sensoren, steigt die Bedeutung frequenzanaloger Signale und Sensoren.
3.2 Sensoren für geometrische und kinematische Größen 3.2.1 Resistive Weg- und Winkelaufnehmer
Vom Prinzip her besonders einfach sind resistive Weg- und Winkelaufnehmer, bei denen ein veränderlicher Ohm’scher Widerstand an einem Draht oder an einer Wicklung abgegriffen wird. Im einfachsten Fall bewegt sich nach Bild 3-1a und b ein vom Messweg oder Messwinkel angetriebener Schleifer auf einem gestreckten oder kreisförmigen Messdraht. Der abgegriffene Widerstand R ist im unbelasteten Zustand dem Messweg x proportional. Mit dem Widerstandswert R0 beim Messbereichsendwert x0 ergibt sich x R = R0 . x0 Im belasteten Zustand hängt die Kennlinie vom Verhältnis R0 /RL (RL Lastwiderstand) ab, siehe 4.1.2. Die Querschnittsfläche A des Widerstandsdrahtes soll möglichst konstant und der spezifische Widerstand
hinreichend groß und temperaturunabhängig sein. Beim Ringrohr-Winkelaufnehmer nach Bild 3-1c fungiert Quecksilber als Abgriff, indem es unterschied-
3 Messgrößenaufnehmer (Sensoren)
Bild 3-1. Resistive Weg- und Winkelaufnehmer. a Prinzip eines Wegaufnehmers, b Prinzip eines Winkelaufnehmers, c Ringrohr-Winkelaufnehmer, d gewickelter Wegaufnehmer, e Leitplastik-Aufnehmer
liche Teilbereiche des Messdrahtes kurzschließt und damit den Widerstand zwischen Quecksilber und den Drahtenden winkelproportional verändert. Ein wesentlich höherer Gesamtwiderstand kann bei resistiven Weg- und Winkelaufnehmern nach Bild 3-1d durch Wendelung des Messdrahtes auf einem isolierenden Trägermaterial erzielt werden. Dadurch ergeben sich Unstetigkeiten im Widerstandsverlauf des Aufnehmers; es tritt der sog. Windungssprung auf. Durch eine zusätzliche Schicht aus leitfähigem Kunststoff („Leitplastik“) über der Messwicklung (Bild 3-1e) kann sowohl der Windungssprung eliminiert als auch der Abrieb stark vermindert werden. 3.2.2 Induktive Weg- und Längenaufnehmer
Bei induktiven Aufnehmern wird durch Weg oder Winkel die Selbstinduktivität einer Spule oder die Gegeninduktivität (Kopplung) zwischen zwei Spulen gesteuert. Drossel als Wegaufnehmer
Beim Drosselsystem nach Bild 3-2a wird die Induktivität L(x) durch Veränderung des Luftspaltes x eines weichmagnetischen Kreises gesteuert. Bei Normierung mit der Induktivität L(0) = L0 ergibt sich unter vereinfachenden Annahmen (homogenes Feld im Eisen usw.) L 1 = . L0 1 + μ x r xM
Bild 3-2. Drosselprinzip für induktive Wegaufnehmer.
a Prinzip eines Drosselsystems, b Kennlinie ohne Streufluss, c Kennlinie mit Streufluss, d Schalenkernsystem aus Ferritmaterial, e Doppeldrossel (Differenzprinzip)
Dabei ist μr , die Permeabilitätszahl (relative Permeabilität) und xM die Weglänge im magnetischen Material. Der Zusammenhang zwischen der Induktivität L und dem Messweg x ist in Bild 3-2b qualitativ dargestellt. Tatsächlich ergibt sich unter Berücksichtigung von Streuflüssen auch bei sehr großem Luftspalt eine endliche Induktivität L(x → ∞) = L∞ > 0. Die reale Kennlinie kann dann mit guter Näherung durch eine gebrochen rationale Funktion 1. Grades der Form
L = L0
L∞ x · L0 xm x 1+ xm
1+
beschrieben werden und ist in Bild 3-2c dargestellt. Dabei ist xm der mittlere Weg, für den sich die mittlere Induktivität 12 (L0 + L∞ ) ergibt. Wegaufnehmer nach diesem Prinzip können auch mit kreiszylindrischen Schalenkernen aus Ferritmaterial nach Bild 3-2d realisiert und mit Frequenzen bis etwa 100 kHz betrieben werden. Oft ist es von Vorteil,
H23
H24
H Messtechnik
zwei Aufnehmer (Doppeldrossel) mit der Messgröße x gegensinnig auszusteuern (Bild 3-2e) und die Ausgangssignale voneinander zu subtrahieren (Spannung ΔU). Durch dieses Differenzprinzip kann eine Linearisierung der Kennlinie und eine Kompensierung des Temperatureinflusses erreicht werden. Tauchkernsysteme
Tauchkernsysteme sind zur Messung mittlerer und auch größerer Wege geeignet. Nach Bild 3-3a besteht ein einfacher Tauchkernaufnehmer aus einer, in der Regel mehrlagigen Spule, deren Induktivität durch die Eintauchtiefe eines ferromagnetischen Tauchkerns gesteuert wird. Die Anwendung des Differenzprinzips führt entweder zum Doppelspulen-Tauchkernsystem (Bild 3-3b) oder zum Differenzialtransformator-Tauchkernsystem (linear variable differential transformer, LVDT) nach Bild 3-3c, wobei beide Differenzialsysteme bessere Kennlinienlinearität (Bild 3-3d) aufweisen als das einfache Tauchkernsystem. Weitere induktive Aufnehmer
In der Werkstoffprüfung, für die Schwingungsmessung sowie als Präsenzdetektoren und Aufnehmer für kleine und mittlere Wege haben Wirbelstromaufnehmer (Bild 3-4a) Bedeutung erlangt. Durch das von der Spule erzeugte Wechselfeld werden in der nichtmagnetischen leitenden Platte Wirbel-
Bild 3-3. Tauchkernprinzip für induktive Aufnehmer. a Einfacher Tauchkernaufnehmer, b Doppelspulen-Tauchkernsystem, c Differenzialtransformator-Tauchkernsystem, d Kennlinie von Differenzialsystemen
ströme erzeugt, die zu einer Bedämpfung der Spule und zu einer Verringerung der Induktivität führen. Es haben sich sogar gedruckte spiralförmige Flachspulen (Bild 3-4b) als sehr geeignet zur Wegaufnahme erwiesen. Verwendet man statt einer leitenden eine ferromagnetische Platte, so steigt die Induktivität der Spule bei Annäherung an. So lassen sich z. B. Eisenteile von unmagnetischen Metallen unterscheiden. Als induktiver Aufnehmer für größere Wege im Bereich von etwa 10 bis 200 mm eignen sich auch Luftspulen, die aus Federmaterial, z. B. KupferBeryllium, gefertigt und als konische Schraubenfedern ausgebildet sind (Bild 3-4c). Näherungsweise ist die Windungszahl einer solchen Spule und ihre wirksame Fläche konstant. Die Induktivität dieser Spule, die bei Frequenzen im MHz-Bereich betrieben wird, ist der wirksamen Länge umgekehrt proportional. Die Baulänge der Spule ist praktisch identisch mit der Messspanne. Bei kleinen Wegen x legt sich die Spule fast vollständig flach zusammen. 3.2.3 Kapazitive Aufnehmer für Weg und Füllstand
Bei kapazitiven Aufnehmern wird durch den Messweg oder durch den Höhenstand einer Flüssigkeit die Kapazität eines Platten- oder Zylinderkondensators gesteuert. Die Kapazität C eines Plattenkondensators berechnet sich aus der Fläche A und dem Abstand d zu A C = ε0 εr . d
Bild 3-4. Weitere induktive Aufnehmer. a Prinzip des Wirbelstromaufnehmers, b gedruckte spiralförmige Flachspule, c konische Schraubenfeder als Wegaufnehmer
3 Messgrößenaufnehmer (Sensoren)
Dabei ist ε0 = 1/μ0 c20 = 8,854 . . . pF/m die elektrische Feldkonstante und εr die relative Permittivität (Dielektrizitätszahl). Verändert der Messweg x den Plattenabstand wie in Bild 3-5a gezeigt, so ist die daraus resultierende Kapazität dem Messweg näherungsweise umgekehrt proportional. Beeinflusst der Messweg x die Plattenfläche nach Bild 3-5b, so ergibt sich ein näherungsweise linearer Anstieg der Kapazität mit dem Weg. Während bei der gewöhnlichen Wegmessung Luft das Dielektrikum ist (εr = 1), kann bei bekannter Dielektrizitätszahl die Dicke von Kunststofffolien und -platten bestimmt werden. Die Höhenstandsmessung von Flüssigkeiten in Behältern ist mithilfe eines Zylinderkondensators möglich. Die Kapazität besteht dabei aus einem konstanten Anteil C0 , der sich beim Füllstand x0 ergibt, und aus einem Anteil, der dem Füllstand (x − x0 ) proportional ist: 2πε0 C = C0 + (x − x0 )(εr − 1) ln(D/d)
jeweiligen Messgrößen unterschiedlichen magnetischen Induktionen ausgesetzt ist, die eindeutig der Messgröße zugeordnet werden können. Die wichtigsten magnetischen Aufnehmer sind HallSensoren, die auf dem Hall-Effekt beruhen, und Feldplatten (magnetfeldabhängige Widerstände), die auf dem Gauß-Effekt beruhen.
Dabei ist D der Innendurchmesser der Außenelektrode und d der Außendurchmesser der Innenelektrode. Bei isolierenden Flüssigkeiten bildet das Füllgut das Dielektrikum des Zylinderkondensators (Bild 3-5c). Bei leitenden Flüssigkeiten besitzt der Zylinderkondensator ein festes Dielektrikum, während das Füllgut die Außenelektrode des Zylinderkondensators bildet (Bild 3-5d).
RH ist der Hall-Koeffizient. Hall-Sensoren aus GaAs besitzen eine vergleichsweise geringe Temperaturabhängigkeit und sind bis etwa 120 ◦ C geeignet.
Hall-Sensoren
Bei den Hall-Sensoren (Bild 3-6a) wird ein Halbleiterstreifen der Dicke d einem magnetischen Feld der Induktion B ausgesetzt. Lässt man durch den Streifen in Längsrichtung einen Steuerstrom I fließen, so bewirkt die Lorentzkraft auf die bewegten Ladungen eine Ladungsverschiebung im Streifen und damit ein elektrisches Querfeld. Zwischen den Längsseiten ist deshalb eine Hall-Spannung abgreifbar: U H = RH
IB . d
Feldplatten
Bei der Feldplatte (Bild 3-6b) wird die Abhängigkeit des Widerstandes RB in Längsrichtung des Halbleiterstreifens von der Induktion B ausgenutzt. Beim MDR
3.2.4 Magnetische Aufnehmer
Mit magnetischen Aufnehmern lassen sich Wege und Winkel messen, wenn der Aufnehmer durch die
Bild 3-5. Kapazitive Aufnehmer. a und b Kapazitive Wegaufnehmer, c Höhenstandsmessung bei isolierenden Flüssigkeiten, d Höhenstandsmessung bei leitenden Flüssigkeiten
Bild 3-6. Magnetische Aufnehmer. a Hall-Sensor und
Kennlinie, b Feldplatte und Kennlinie
H25
H26
H Messtechnik
Bild 3-7. Winkelcodierer (Codescheibe)
(magnetic field depending resistor) spricht man auch vom magnetischen Widerstandseffekt oder GaußEffekt. Der Widerstand RB der Feldplatten nimmt etwa quadratisch mit der Induktion B zu und beträgt RB = R0 (1 + kB2 ) . Der typische Widerstandsverlauf einer Feldplatte ist in Bild 3-6b dargestellt. Da die Empfindlichkeit der Feldplatten mit steigender Induktion gemäß dRB = 2kR0 B dB wächst, werden Feldplatten in der Umgebung eines Arbeitspunktes |B| > 0 betrieben. Wegen ihrer hohen Temperaturabhängigkeit werden Feldplatten gerne in einer Differenzialanordnung eingesetzt. So lassen sich Weg-, Winkel- und auch Drehzahlaufnehmer realisieren. 3.2.5 Codierte Weg- und Winkelaufnehmer
Bei codierten Längen- und Winkelmaßstäben ist jeder Messlänge bzw. jedem Messwinkel ein umkehrbar eindeutiges, binär codiertes digitales Signal zugeordnet. Dieses liegt in räumlich parallel codierter Form vor und kann unmittelbar abgelesen werden. Der Winkelcodierer oder die Codescheibe besteht aus einer Welle und einer Scheibe oder einer Trommel, die mit einem Codemuster versehen ist (Bild 3-7). Das Codemuster besteht entweder aus einer Kombination leitender und nichtleitender Flächen oder aus einer Kombination lichtdurchlässiger und lichtundurchlässiger Flächen. Es sind auch magnetische Winkelcodierer bekannt, bei denen das Codemuster
aus magnetischen und nichtmagnetischen Flächen aufgebaut ist. Die erreichbare Auflösung liegt je nach Ausführungsform etwa zwischen 100 und 50 000 auf dem Umfang. Damit bei der Abtastung von Winkelcodierern der Fehler nicht größer als eine Quantisierungseinheit werden kann, wird die Codescheibe mit einer redundanten Abtasteinrichtung abgefragt oder es werden sog. einschrittige Codes, wie der Gray-Code, angewendet, bei dem sich beim Übergang von einer Zahl zur nächsten stets nur ein einziges Bit ändert. 3.2.6 Inkrementale Aufnehmer
Bei den sog. inkrementalen Messverfahren wird der gesamte Messweg bzw. der gesamte Messwinkel in eine Anzahl gleich großer Elementarschritte zerlegt. Die Breite eines Elementarschrittes kennzeichnet das Auflösungsvermögen. Der Aufbau eines inkrementalen Längenmesssystems ist in Bild 3-8 gezeigt. Es besteht aus dem Maßstab und dem zugehörigen Abtastkopf. Der Abtastkopf ist über dem Maßstab in einem Abstand von wenigen Zehntelmillimetern montiert. Die Abtastplatte besteht aus vier Abtastfeldern und ist im Abtastkopf enthalten. Der Aufbau ist wie bei einem Strichgitter und setzt sich aus lichtundurchlässigen Strichen und aus durchsichtigen Lücken zusammen, deren Teilung mit der Maßstabsteilung übereinstimmt. Das Licht der im Abtastkopf eingebauten Lampe fällt schräg auf die Abtastplatte und durch die Lücken der vier Abtastfelder auf den Maßstab. Von den blanken Maßstabslücken wird das Licht reflektiert. Es tritt wieder durch die Lücken der Abtastplatte und trifft auf die zugeordneten Fotoempfänger.
Bild 3-8. Inkrementales Längenmesssystem
3 Messgrößenaufnehmer (Sensoren)
Wird nun der Maßstab relativ zum Abtastkopf verschoben, so schwankt die Intensität des auf die Fotoempfänger gelangenden Lichtes periodisch. Die Fotoempfänger wiederum liefern eine sinusähnliche Spannung, deren Periodenzahl nach Impulsformung gezählt wird. Die vier Gitterteilungen sind jeweils um eine Viertel Gitterperiode gegeneinander versetzt angeordnet. Durch Antiparallelschaltung der Gegentaktsignale ergeben sich zwei um 90◦ verschobene Differenzsignale, deren Gleichanteil kompensiert ist. Diese um 90◦ gegeneinander verschobenen Signale ergeben nach Auswertung der Phasenlage die Richtungsinformation der Bewegung. Je nach Bewegungsrichtung, eilt das eine Signal dem anderen um 90◦ vor oder nach. Mit einem Richtungsdiskriminator kann deshalb die Zählrichtung für den nachgeschalteten Vorwärts-Rückwärts-Zähler bestimmt werden. Neben den inkrementalen Längenmaßstäben mit optischer Abtastung gibt es auch inkrementale Winkelmaßstäbe mit optischer, magnetischer oder induktiver Abtastung. Ein typischer Wert der erreichbaren Auflösung liegt bei einer Winkelminute.
rechtwinkeligen Reflektor, dessen Abstand gemessen werden soll. Der Vergleichsstrahl wird über einen fest angeordneten Reflektor zum Punkt B des halbdurchlässigen Spiegels zurückgeführt. Dort werden durch Überlagerung mit dem reflektierten Messstrahl die Interferenzstreifen gebildet und von den Fotodetektoren C und D analysiert. Durch eine Abstandsänderung von λ/4 wird so die Lichtintensität vom Maximalwert auf einen Minimalwert geändert. Bei Bewegung des Messreflektors wird in den Fotodetektoren ein sinusähnliches Signal erzeugt, dessen Periodenzahl nach Impulsformung in einem elektronischen Zähler ermittelt werden kann. Die Genauigkeit eines Laser-Interferometers hängt nur von der Genauigkeit der Wellenlänge des monochromatischen Lichtes ab. Diese Wellenlänge ist von den Umgebungsbedingungen abhängig. Eine Abstandsänderung d des Messreflektors hängt mit der Wellenlänge λ0 bei Normalbedingungen und der Zahl N der Interferenzstreifen über folgende Beziehung zusammen:
3.2.7 Laser-Interferometer
Der Korrekturfaktor K berücksichtigt die vorhandenen Werte von Druck, Temperatur und relativer Luftfeuchte nach der Beziehung
Höhere Genauigkeit und höhere Auflösung als mit inkrementalen Gittermaßstäben ist mit einem LaserInterferometer erreichbar, dessen Prinzip bereits von Michelson beschrieben wurde. Das Funktionsprinzip eines Laser-Interferometers kann mit Bild 3-9 erklärt werden. Durch einen halbdurchlässigen Spiegel wird das von einem Laser erzeugte monochromatische Licht in einen Messstrahl und einen Vergleichsstrahl aufgespalten (A). Der Messstrahl trifft auf einen
2d = λ0 N(1 + K) .
K = kp (p − p0 ) + kT (T − T 0 ) + kf ( f − f0 ) . kp , kT und kf sind die Korrekturbeiwerte für den Druck p, die Temperatur T bzw. die relative Luftfeuchte f. Die mit 0 indizierten Größen kennzeichnen die Normalbedingungen. Die Korrekturbeiwerte betragen kp = −0,2 · 10−6 /hPa , kT = 0,9 · 10−6 /K , kf = 3,0 · 10−6 . Die herrschenden Umgebungsbedingungen müssen also bei genauen Messungen mit Sensoren erfasst und berücksichtigt werden. 3.2.8 Drehzahlaufnehmer
Bild 3-9. Funktionsprinzip des Laser-Interferometers
Nach dem Funktionsprinzip unterscheidet man analoge Tachogeneratoren, bei denen eine Spannung indu-
H27
H28
H Messtechnik
ziert wird, deren Amplitude der Drehzahl proportional ist, und Impulsabgriffe, bei denen die Impulsfolgefrequenz der Drehzahl proportional ist (siehe 6.3.4). Wirbelstromtachometer
Beim Wirbelstromtachometer (Bild 3-10a) wird die induzierte Spannung nicht direkt abgegriffen, sondern das Drehmoment der von ihr erzeugten Wirbelströme erfasst. Ein mehrpoliger Dauermagnet rotiert in einem getrennt gelagerten Kupfer- oder Aluminiumzylinder. Dieser taucht in den Luftspalt zwischen dem ringförmigen Dauermagneten und einer Eisenrückschlussglocke ein. Die Feldlinien zwischen Magnet und Eisenrückschlussglocke erzeugen bei Rotation im Zylinder Wirbelströme, die ein Moment bewirken, das proportional der Drehzahl steigt. Diesem Moment wirkt ein von einer Spiralfeder erzeugtes Gegendrehmoment entgegen. Im Gleichgewicht ist der Winkelausschlag von der Drehzahl linear abhängig. Tachogeneratoren
folgende Mittelwertbildung erfolgen oder es wird die Spannung in ihrem Maximum abgetastet und so lange gehalten (sample and hold), bis der gesuchte Maximalwert ausgewertet worden ist. Bei dreiphasigen Tachogeneratoren (Bild 3-10b) besitzt die gleichgerichtete Ausgangsspannung nur eine geringe Restwelligkeit. Der Anker besteht aus einem umlaufenden Polrad mit gerader Polzahl, wobei Nord- und Südpole abwechseln. Die Ständerwicklungen sind natürlich (anders als im Bild 3-10b) gleichmäßig am Umfang angeordnet. Impulsabgriffe
Eine drehzahlproportionale Frequenz erhält man über Impulsabgriffe, die nach Bild 3-11a entweder als Induktionsabgriff oder nach Bild 3-11b, c und d als induktive, magnetische oder optische Begriffe realisiert sein können. Ein Induktionsabgriff, der im Prinzip in Bild 3-11a dargestellt ist, besteht aus einem Dauermagnetstab, einer Induktionsspule und einem Eisenrückschluss-
Bei Wechselspannungs-Tachogeneratoren werden über feststehende Spulen und rotierende Magnete Wechselspannungen erzeugt, deren Amplitude der Drehzahl proportional ist. Bei einphasigen Tachogeneratoren kann die Messung dieser Amplitude entweder durch Brückengleichrichtung und nach-
Bild 3-10. Analoge Drehzahlaufnehmer. a Wirbelstromta-
chometer (Merz), b dreiphasiger Tachogenerator
Bild 3-11. Impulsabgriffe zur Drehzahlaufnahme. a Induktionsabgriff (Hartmann & Braun), b induktiver Abgriff. c magnetischer Abgriff (Honeywell), d optischer Abgriff
3 Messgrößenaufnehmer (Sensoren)
mantel. Die Marken auf der Messwelle sind so ausgebildet, dass der magnetische Fluss in der Induktionsspule geändert wird. Im einfachsten Fall dienen Nuten oder ein weichmagnetisches Zahnrad zur Modulation des magnetischen Flusses. Nach dem Induktionsgesetz ist die induzierte Spannung U der Änderungsgeschwindigkeit des magnetischen Flusses und der Windungszahl N proportional: U=N
dΦ ∼n. dt
Die induzierte Spannung ist der Drehzahl n proportional. Bei der Messung kleiner Drehzahlen treten deshalb höhere relative Fehler auf. Induktive, magnetische und optische Abgriffe sind im Prinzip Wegaufnehmer und haben diesen Nachteil nicht. Beim induktiven Abgriff wird durch Marken auf der Messwelle der magnetische Widerstand eines magnetischen Kreises und damit die Induktivität geändert. Beim magnetischen Abgriff werden ähnlich wie beim Induktionsabgriff ein oder mehrere Permanentmagnete verwendet, um durch die Marken der Messwelle den magnetischen Fluss zu modulieren. Mit HallSonden oder Feldplatten (magnetfeldempfindlichen Widerständen) ergibt sich dann ein vom Wert der magnetischen Induktion abhängiges Ausgangssignal. Beim optischen Abgriff (Bild 3-11d) wird das von einer Lichtquelle (z. B. von lichtemittierenden Dioden) auf einen Lichtempfänger (z. B. Fototransistor) gerichtete Licht durch entsprechende Marken auf einer Messwelle oder -scheibe (Schlitzscheibe oder Fotoscheibe) moduliert. In allen drei Fällen ist die Frequenz des Ausgangssignals der Drehzahl proportional. Die Messung dieser Frequenz ist mit einfachen Mitteln mithilfe der digitalen Zählertechnik möglich. Es können auch eine oder mehrere Perioden des Messsignals durch nachfolgende Reziprokwertbildung ausgewertet werden. Analoganzeige der Drehzahl
Analoge Anzeiger sind immer dann von Bedeutung, wenn der Mensch eine grobe, aber schnelle Information, z. B. über die Drehzahl eines Verbrennungsmotors erhalten soll. Liegen drehzahlproportionale Frequenzsignale vor, so können diese nach Bild 3-12 mit einem Frequenz-
Bild 3-12. Frequenz-Spannungs-Umsetzung
Spannungs-Umsetzer in eine proportionale Spannung umgeformt werden. Nach Impulsformung wird das Signal des Impulsabgriffes auf eine monostabile Kippstufe geleitet, die am Ausgang Impulse konstanter Breite τ und konstanter Höhe U0 liefert. Der arithmetische Mittelwert dieses Signales ist 1 u¯ = T
"T
"τ u(t) dt = f
0
U0 dt = U0 τ f . 0
3.2.9 Beschleunigungsaufnehmer
Mit Sensoren zur Messung der Linearbeschleunigung kann die Beanspruchung von Mensch oder Material ermittelt werden. Ferner ist durch einfache bzw. doppelte Integration von Beschleunigungssignalen die Bestimmung der Geschwindigkeit oder des zurückgelegten Weges von Luft- und Raumfahrzeugen möglich (Trägheitsnavigation). Beschleunigungsmessungen werden in der Regel auf Kraftmessungen zurückgeführt. Für die Beschleunigung a einer Masse m und die Trägheitskraft F gilt nach Newton a = F/m. Gemäß dem verwendeten Prinzip der Kraftmessung unterscheidet man Beschleunigungssensoren mit elektrischer Kraftkompensation, mit piezoelektrischer Kraftaufnahme und mit Federkraftmessung. Zu der zuletzt genannten Gruppe gehören z. B. Feder-Masse-Systeme nach Bild 3-13a, bei denen die Beschleunigung a eine proportionale Auslenkung x der Masse bewirkt. Eine scheibenförmige Masse ist an zwei Membranfedern aufgehängt und unterliegt wegen der Ölfüllung des Gehäuses einer näherungsweise geschwindigkeitsproportionalen Dämpfung. Der Verschiebeweg x der Masse wird über ein induktives Doppeldrosselsystem erfasst. (Die Induktivität der einen Drossel
H29
H30
H Messtechnik
ω0 =
c m
und ϑ =
k 2mω0
ein, so erhält man für die Beschleunigung a=
d2 s dx d2 x 2 + 2 . = ω x + 2ϑω 0 0 dt dt2 dt
Während „tief abgestimmte“ Systeme mit sehr niedriger Eigenfrequenz als seismische Wegaufnehmer verwendet werden (s ≈ x), müssen Feder-MasseSysteme für Beschleunigungsaufnehmer „hoch abgestimmt“ sein, um auch schnellen Änderungen möglichst verzögerungsfrei folgen zu können. Der Wunsch nach möglichst hoher Kreisfrequenz ω0 der ungedämpften Eigenschwingung widerspricht der Forderung nach hoher statischer Empfindlichkeit E. Die Empfindlichkeit ist nämlich E=
Bild 3-13. Feder-Masse-System als BeschleunigungsAufnehmer. a Konstruktionsskizze, b Amplitudengang
wird dabei vergrößert, die der anderen Drossel verkleinert.) In einer Wechselstrom-Brückenschaltung können diese gegensinnigen Induktivitätsänderungen ausgewertet werden (Differenzprinzip).
ist also umgekehrt proportional dem Quadrat der Eigenfrequenz. Der Amplitudengang |G( jω)| eines Feder-Masse-Systems als Beschleunigungsaufnehmer ist gleich dem Verhältnis der Amplitude der Relativbewegung der Masse zur Amplitude der sinusförmigen Beschleunigung am Eingang. Aus der Theorie der Übertragungsglieder 2. Ordnung, siehe 1.2.7, folgt: |G( jω)| =
Dynamisches Verhalten
Das dynamische Verhalten eines Beschleunigungsaufnehmers mit Feder-Masse-System lässt sich durch die Dgl. d2 (s − x) dx k + cx = m dt dt2 beschreiben. Darin bedeuten x s s−x k c m
Auslenkung der Masse (gegen das Gehäuse), Absolutweg des Gehäuses, Absolutweg der Masse, sowie Dämpfungskonstante, Federkonstante, Masse.
Führt man die Kreisfrequenz ω0 der ungedämpften Eigenschwingung und den Dämpfungsgrad ϑ gemäß
1 m dx = 2 = , da ω0 c
1 1 |x| = 2· ; . = ⎡ 2 2 ⎤2 |a| ω0 ⎢⎢⎢ ⎥ ⎢⎢⎣1 − ω ⎥⎥⎥⎥⎦ + 2ϑ ω ω ω 0
0
Der Verlauf des Amplitudengangs (Bild 3-13b) hängt stark vom Dämpfungsgrad ϑ ab. Der wiederum hängt stark von der Viskosität des zur Dämpfung verwendeten Öles und damit von der Temperatur der Ölfüllung ab. Beschleunigungsaufnehmer mit Feder-Masse-Systemen sind bei hohen Genauigkeitsansprüchen nur bis zu Messfrequenzen von etwa 10% der Eigenfrequenz und bei verminderten Ansprüchen etwa bis zu 50% der Eigenfrequenz geeignet. Beschleunigungsaufnehmer werden bei Schwingungsuntersuchungen und für Schocktests eingesetzt. In Kraftfahrzeugen werden sie zur Auslösung von Airbags verwendet, sobald zulässige Werte der Stoßbeschleunigung überschritten werden.
3 Messgrößenaufnehmer (Sensoren)
3.3 Sensoren für mechanische Beanspruchungen Bei der Messung mechanischer Beanspruchungen sind Sensoren für Kräfte, Drücke und Drehmomente von Bedeutung. Diese mechanischen Beanspruchungen können zunächst mit Federkörpern gemessen werden, deren Dehnung oder Auslenkung ausgewertet wird. Außerdem gibt es Aufnehmer mit selbsttätiger Kompensation über die Schwerkraft oder mit elektrischer Kraftkompensation. Kräfte und Drücke lassen sich auch mit magnetoelastischen und piezoelektrischen Aufnehmern erfassen. PräzisionsDruckmessungen sind mit Schwingquarzen möglich. Ein kraftanaloges Frequenzsignal liefern Aufnehmer mit Schwingsaite, schwingender Membran oder Schwingzylinder. 3.3.1 Dehnungsmessung mit Dehnungsmessstreifen
Beim Dehnungsmessstreifen (DMS) ändert sich der elektrische Widerstand eines Drahtes unter dem Einfluss einer Dehnung. Nach Bild 3-14a wird dabei die Länge l des Drahtes um die Länge dl vergrößert und der Durchmesser D um den Betrag dD verringert. Mit dem spezifischen Widerstand ist der Widerstand des Drahtes vor der Dehnung 4 l . πD2 Durch die Dehnung wird der Widerstand R=
R + dR =
4 ( + d )(l + dl) · π (D + dD)2
Für differenzielle Änderungen d , dl und dD ergibt sich die relative Widerstandsänderung
Bild 3-14. Dehnungsmessung. a Dehnung eines Drahtes, b Folien-Dehnungsmessstreifen
dD d
dR dl = −2 + R l D
dl dD/D d /
= + 1−2 . l dl/l dl/l Die relative Längenänderung ε = dl/l bezeichnet man als Dehnung, die relative Längenänderung εq = dD/D als Querdehnung. Der Quotient aus negativer Querdehnung und Dehnung heißt Poisson-Zahl μ=
−εq . ε
Mit diesen Größen ist die relative Widerstandsänderung dR d /
= 1 + 2μ + ε = kε . R ε Der sog. k-Faktor beschreibt die Empfindlichkeit des DMS. Aus dem Volumen V = 14 πD2 l berechnet sich die relative Volumenänderung dl dD dl dV = +2 = (1 − 2μ) . V l D l Da unter der Wirkung eines Zuges allenfalls eine Volumenzunahme erfolgt, kann die Poisson-Zahl höchstens gleich 0,5 sein. Gemessene Werte der PoissonZahl liegen etwa zwischen 0,15 und 0,45. Bei Dehnung ohne Volumenänderung ist die PoissonZahl 0,5. Bleibt gleichzeitig der spezifische Widerstand konstant, so wird der k-Faktor k = 1 + 2μ +
d /
= 1 + 2 · 0,5 + 0 = 2 . ε
Dieser Wert wird bei Metallen wie Konstantan (60% Cu, 40% Ni) und Karma (74% Ni, 20% Cr, 3% Al) tatsächlich beobachtet. Bei höheren Temperaturen bis 650 ◦ C bzw. 1000 ◦ C ist Platiniridium (90% Pt, 10% Ir) oder Platin als DMS-Material geeignet. Beide Materialien haben etwa den k-Faktor k = 6. Besonders hohe Widerstandsänderungen ergeben sich bei Halbleiterdehnungsmessstreifen. In dotiertem Silizium ist der Piezowiderstandseffekt d / stark ausgeprägt. Typisch sind k-Faktoren von etwa 100. Zulässige Dehnungen von etwa 3 · 10−3 führen zu vergleichsweise hohen relativen Widerstandsänderungen. Störend ist u. U. die starke
H31
H32
H Messtechnik
Temperaturabhängigkeit von Nullpunkt und Steilheit (Widerstand und k-Faktor), die sich jedoch in gewissen Grenzen kompensieren lässt. Die gebräuchliche Ausführungsform ist heute der Folien-DMS (vgl. Bild 3-14b) für beschränkte Umgebungstemperaturen. Nur bei höheren Temperaturen werden noch Draht-DMS verwendet. Folien-DMS lassen sich leicht in großen Stückzahlen in Ätztechnik herstellen (ähnlich wie gedruckte Schaltungen). Die Gestalt des Leiters kann nahezu beliebig sein, deshalb können die Querverbindungen auch breiter ausgeführt werden als die Leiter in Messrichtung. Typische Widerstandswerte von DMS liegen zwischen 100 und 600 Ω. 3.3.2 Kraftmessung mit Dehnungsmessstreifen
Wirkt an einem Stab mit dem Querschnitt A die Zugoder Druckkraft F, so entsteht nach Bild 3-15a in diesem eine mechanische Spannung σ. Sie bewirkt nach dem Hooke’schen Gesetz innerhalb des Elastizitätsbereiches eine proportionale Dehnung σ ε= , E (E Elastizitätsmodul). Bei der in Bild 3-15b dargestellten Kraftmessdose mit DMS sind zwei DMS in Kraftrichtung und zwei DMS senkrecht dazu auf einem Hohlzylinder aufgeklebt, der durch die Messkraft gestaucht wird. Im Idealfall erfahren die DMS in Kraftrichtung eine Längsdehnung ε1 =
Bild 3-15. Kraftmessung
F AE
mit Dehnungsmessstreifen. a Elastische Verformung eines Federkörpers, b Kraftmessdose mit Dehnungsmessstreifen (Siemens)
und die DMS senkrecht dazu eine kleinere Querdehnung εq = −με1 . (F Messkraft, A Querschnittsfläche des Stauchzylinders, E Elastizitätsmodul, μ Poisson-Zahl.) Der Widerstand der beiden DMS in Kraftrichtung verringert sich dabei, der Widerstand der beiden DMS senkrecht dazu vergrößert sich. Die vier DMS werden so in einer Brückenschaltung im Ausschlagverfahren (siehe 4.2.3) angeordnet, dass die maximale Empfindlichkeit erreicht wird. Gleichzeitig ergibt sich bei geeigneter Dimensionierung eine Verringerung der Temperaturabhängigkeit des Ausgangssignals durch das Differenzprinzip (Unterdrückung von Gleichtaktstörungen). Zur Abschätzung der im elastischen Bereich erhaltenen Dehnungen nehmen wir für Stahl ein Elastizitätsmodul von E = 200 kN/mm2 und eine zulässige Spannung σzul = 500 N/mm2 an. Daraus errechnet sich die Dehnung ε = σzul /E = 2,5 0/00 = 2,5 mm/m . Im elastischen Bereich sind also nur Dehnungen von wenigen 0/00 zulässig. Typische Messbereiche bei der Dehnungsmessung an metallischen Werkstoffen liegen bei ± 5000 μm/m = ± 5 0/00. Dehnungen von 1% dürfen im Normalfall nicht erreicht werden, da sie zu plastischen Verformungen führen. 3.3.3 Druckmessung mit Dehnungsmessstreifen
Häufig werden zur Druckmessung elastische Membranen oder Plattenfedern eingesetzt, die sich bei Belastung mit einem Druck p bzw. einem Differenzdruck Δp verformen. Die an der Membranoberfläche entstehenden radialen und tangentialen Spannungen σr und σt bewirken Dehnungen εr und εt und können mit geeigneten DMS erfasst werden (Bild 3-16). Für gegen die Membrandicke h kleine Durchbiegungen sind die Dehnungen der Membran mit fester Randeinspannung nach Bild 3-16a 3 + μ # r $2 σr 3 # R $2 p = (1 + μ) 1 − εr = , E 8 h E 1+μ R 1 + 3μ # r $2 σt 3 # R $2 p = (1 + μ) 1 − . εt = E 8 h E 1+μ R
3 Messgrößenaufnehmer (Sensoren)
Bild 3-17. Drehmomentmessung mit Dehnungsmessstrei-
fen. a Dehnung an der Oberfläche einer Messwelle, b Drehmoment-Messwelle mit Dehnungsmessstreifen
Der Torsionswinkel ϕ ist ϕ= Bild 3-16. Druckmessung mit Dehnungsmessstreifen.
a Durch Druck verformte Membran, b Radialer Verlauf der tangentialen und radialen Dehnung, c RosettenDehnungsmessstreifen (Hottinger Baldwin Messtechnik)
(G Schubmodul). Mit Bild 3-17a ergibt sich für die Dehnung ε an der Oberfläche der Messwelle abhängig vom Winkel α ε=
(E Elastizitätsmodul, μ Poisson-Zahl, r radiale Koordinate, R Membranradius.) Die Dehnungen verlaufen parabelförmig und haben am Membranrand das entgegengesetzte Vorzeichen gegenüber der Mitte. In Membranmitte sind die radialen und tangentialen Dehnungen gleich groß (vgl. Bild 3-16b). Zur Dehnungsmessung an der Membranoberfläche verwendet man spezielle Rosetten-Dehnungsmessstreifen (Bild 3-16c). Diese DMS sind so gestaltet, dass je zwei Streifen die große Radialdehnung in der Nähe des Membranrandes bzw. die darauf senkrechte Tangentialdehnung in der Nähe der Membranmitte erfassen. 3.3.4 Drehmomentmessung mit Dehnungsmessstreifen
Zur Drehmomentmessung mit Dehnungsmessstreifen verwendet man eine elastische Hohlwelle mit den Radien R1 und R2 nach Bild 3-17a, die auf einer Messlänge L unter dem Einfluss des Torsionsmomentes MT um den Winkel ϕ verdreht wird.
LMT 2 · 4 π R − R4 G 2 1
1 R2 ϕ MT 1 R2 · · sin 2α = · 4 sin 2α . 4 2 L π R2 − R1 G
Das Torsionsmoment MT kann also durch Messung der Dehnung an der Oberfläche der Messwelle bestimmt werden. Dazu werden DMS auf die Messwelle aufgeklebt. Parallel und auch senkrecht zur Achse der Messwelle ist die Dehnung gleich null. Betragsmäßig maximale Dehnung erhält man bei den Aufklebewinkeln αmax = 45◦ und 135◦ . Bild 3-17b zeigt eine Messwelle mit vier Dehnungsmessstreifen, deren Widerstandsänderungen in einer Vollbrückenschaltung ausgewertet werden können. 3.3.5 Messung von Kräften über die Auslenkung von Federkörpern Parallelfeder
Beim einfachen Biegebalken als Messfeder stört die bei der Durchbiegung auftretende Neigung des freien Endes. Durch parallele Anordnung zweier gleicher Blattfedern nach Bild 3-18a wird erreicht, dass sich das freie Ende nur parallel bewegt. Die Auslenkung der Parallelfeder ist 3 1 l F x= 2b h E
H33
H34
H Messtechnik
3 R4 p (1 − μ2 ) 3 · 16 h E (μ Poisson-Zahl, R Radius, h Dicke, E Elastizitätsmodul der eingespannten Membran). Dieser Zusammenhang gilt nur für kleine Auslenkungen x (etwa bis zur Membrandicke h), da sich die Plattenfeder durch auftretende Zugspannungen versteift. Größere mögliche Auslenkungen bei sonst gleicher Geometrie erhält man durch gewellte Membranen. Zur Aufnahme kleiner Drücke, z. B. zur Luftdruckmessung oder zur Messung kleiner Differenzdrücke eignen sich Kapselfedern, die vergleichsweise dünn, großflächig und gewellt ausgeführt sind und in ihrem Aufbau einer Dose ähneln, die auf Ober- und Unterseite mit einer Membran abgeschlossen ist (Bild 3-19b). Für hohe Drücke bis etwa 1000 bar werden Rohrfedern (Bild 3-19c) (Bourdonfedern) verwendet, bei denen sich ein kreisförmig gebogenes Rohr mit ovalem Querschnitt bei Druckbeanspruchung um einen Winkel ϕ aufbiegt, weil wegen der größeren Außenbogenlänge die Kraft auf die bogenäußere Innenwand größer ist als die auf die bogeninnere Wand. x=
Bild 3-18. Messung von Kräften über die Auslenkung von Federkörpern. a Parallelfeder als Federkörper, b zylindrische Schraubenfeder
(l Länge, b Breite und h Höhe der Biegefedern, E Elastizitätsmodul). Die Umformung einer Messkraft F in eine Auslenkung x ist auch mit einer zylindrischen Schraubenfeder (Bild 3-18b) möglich. Die Auslenkung ist x=
8iD3 F · d4 G
(i Windungszahl, d Drahtdurchmesser, D Federdurchmesser, G Schubmodul, F Messkraft). 3.3.6 Messung von Drücken über die Auslenkung von Federkörpern
Druckmessung mit Membranen ist auch durch Messung der maximalen Auslenkung in Membranmitte nach Bild 3-19a möglich. Die Auslenkung x berechnet sich abhängig vom Messdruck p zu
3.3.7 Kraftmessung über Schwingsaiten
Eine gespannte, meist metallische Saite kann nach Bild 3-20a z. B. elektromagnetisch zu Transversalschwingungen angeregt werden. Die Grundfrequenz f der schwingenden Saite ist 1 σ f = 2l
(l Länge, Dichte des Saitenmaterials, σ mechanische Spannung). Die mechanische Spannung σ kann durch die Spannkraft F und den Durchmesser d der Saite ausgedrückt werden: σ = F/( π4 d2 ). Für die Grundfrequenz f der Schwingsaite ergibt sich damit 8 1 F f = . ld π
Bild 3-19. Messung von Drücken über die Auslenkung von
Federkörpern. a Membran als Plattenfeder, b Kapselfeder (Siemens), c Rohrfeder (Bourdonfeder)
Für praktische Anwendungen ist die Schwingsaite mit einer Mindestkraft F0 vorgespannt und schwingt dabei bei der Frequenz f0 . Wirkt die zusätzliche Messkraft F, so resultiert die neue Frequenz f. Aus
3 Messgrößenaufnehmer (Sensoren)
Bild 3-21. Waage mit elektrodynamischer Kraftkompensa-
tion
Bild 3-20. Kraft- und Druckmessung über Schwingsaiten. a Prinzip der Schwingsaitenaufnehmer, b Schwingsaitenwaage (Mettler)
8 1 f = ld ergibt sich
8
F0 + F π
und
f F = F0 f0
1 f0 = ld
F0 π
Tauchspulsystem erzeugt wird, das vom Strom I durchflossen wird. Der Tauchspulstrom I ist der Kompensationskraft FK und für die Verstärkung v → ∞ der Gewichtskraft FG proportional. Es handelt sich hierbei um eine Kreisstruktur, die die Wirkungsrichtung des Tauchspulsystems umkehrt. Ein mit der Waagschale verbundener Wegaufnehmer liefert über einen Verstärker den Tauchspulstrom I, der so nachgeregelt wird, dass das Kräftegleichgewicht FG = FK für eine bestimmte Position der Waagschale erreicht wird. Lediglich der Temperatureinfluss muss noch gesondert korrigiert werden. Die Kompensationskraft FK des Tauchspulsystems ist FK = πDBNI
2 −1.
Mit dem Differenzprinzip (siehe 2.1.2) lässt sich die Linearität wesentlich verbessern. Bei der Schwingsaiten-Waage (Bild 3-20b) sind zwei Schwingsaiten durch je eine Schraubenfeder vorgespannt. Durch die Gewichtskraft FG wird die Spannkraft und damit die Frequenz der ersten Schwingsaite erhöht und die der zweiten Schwingsaite erniedrigt. Aus der Frequenzdifferenz f1 − f2 lässt sich FG bestimmen. 3.3.8 Waage mit elektrodynamischer Kraftkompensation
Bei elektrischen Präzisionswaagen wird nach Bild 3-21 die zu messende Gewichtskraft FG durch eine Gegenkraft FK kompensiert, die von einem
(πD mittlerer Wicklungsumfang, B magnetische Induktion, N Windungszahl, I Stromstärke. NI = Θ heißt auch Durchflutung oder „Amperewindungszahl“). In ähnlicher Weise wird bei Messumformern für Niederdruck der zu messende Druck oder Differenzdruck über eine richtkraftlose Membran in eine Kraft umgeformt, die dann über einen Hebel, an dem auch die Tauchspule angreift, kompensiert wird. 3.3.9 Piezoelektrische Kraft- und Druckaufnehmer
Belastet man ein Piezoelektrikum wie Quarz (SiO2 ) oder Bariumtitanat (BaTiO3 ) in bestimmten Richtungen mechanisch, so treten an deren Oberfläche elektrische Polarisationsladungen auf. Synthetisch erzeugter Quarz kristallisiert in sechseckigen Prismen (Bild 3-22a).
H35
H36
H Messtechnik
dabei sofort über den niederohmigen Eingang des Stromintegrierers auf die vergleichsweise verlustfreie Integrationskapazität abgesaugt, sodass Verluste des Piezoaufnehmers und des Eingangskabels keine Schwächung des Signals mehr bewirken können. Piezoelektrische Aufnehmer sind zur Messung schnell veränderlicher Drücke, wie sie z. B. in Verbrennungsmotoren auftreten, sehr gut geeignet. Mit ihrer Hilfe kann das sog. Indikatordiagramm (p,V-Diagramm) im Betrieb aufgenommen werden.
3.4 Sensoren für strömungstechnische Kenngrößen
Bild 3-22. Piezoelektrische Kraft- und Druckaufnehmer. a Achsen und Struktur eines Quarzkristalls (Grave), b Ladungsverstärker für statische Messungen
Wirkt eine Kraft F in Richtung einer der xi -Achsen, so entsteht auf den senkrecht dazu stehenden Flächen eine Ladung Q = kp F . Die piezoelektrische Konstante (der sog. Piezomodul) kp beträgt bei Quarz kp = 2,3 pC/N, Bariumtitanat kp = 250 pC/N . Die Empfindlichkeit ist also bei Bariumtitanat etwa 100-mal so groß wie bei Quarz. Nachteilig ist beim Bariumtitanat der gleichzeitig vorhandene pyroelektrische Effekt, bei dem durch Wärmeeinwirkung Ladungen erzeugt werden. Piezokeramische Aufnehmer sind im Besonderen für Körperschallmessungen, Schwingungs- und Beschleunigungsmessungen geeignet. Die Eigenkapazität von Quarzaufnehmern liegt bei etwa 200 pF. Dies bedeutet, dass bei einem Isolationswiderstand von 1012 Ω mit einer Zeitkonstanten von 200 s bzw. mit einer Spannungsverringerung von 0,5%/s zu rechnen ist. Für statische Messungen werden deshalb Ladungsverstärker nach Bild 3-22b eingesetzt. Die entstehenden Ladungen werden
Sensoren zur Messung von Durchflüssen sind z. B. bei Verbrennungsvorgängen erforderlich, wenn der Durchfluss von Flüssigkeiten oder Gasen gesteuert oder geregelt werden muss. Ferner sind Aufnehmer für Durchflüsse z. B. für Abrechnungszwecke und zur Überwachung von Anlagen erforderlich. 3.4.1 Durchflussmessung nach dem Wirkdruckverfahren
Schnürt man den Querschnitt einer Rohrleitung durch eine Drosseleinrichtung nach Bild 3-23 ein, so lässt sich aus der Druckerniedrigung (dem sog. Wirkdruck oder dynamischen Druck) der Durchfluss berechnen (vgl. E 8.1.3). Bei horizontaler Rohrleitung, bei inkompressiblem Messmedium (Flüssigkeit) und unter Vernachlässigung von Reibungskräften besagt das Gesetz von Bernoulli, dass für eine betrachtete Massenportion m die Summe aus statischer Druckenergie pV und kinetischer Energie 12 mv2 konstant ist (vgl. B 10.1). Nach Division durch das Volumen V und mit der Dichte = m/V führt die Gleichheit der Energiedich-
Bild 3-23. Durchflussmessung nach dem Wirkdruckverfah-
ren
3 Messgrößenaufnehmer (Sensoren)
ten vor (Index 1) und an (Index 2) der Drosselstelle auf 1 1 p1 + v21 = p2 + v22 . 2 2 (p1 , p2 statischer Druck, v1 , v2 Geschwindigkeit vor bzw. an der Drosselstelle.) Aus einer Erhöhung der Geschwindigkeit, Δv = v2 − v1 , folgt also eine Abnahme des Drucks an der Drosselstelle, der sog. Wirkdruck
2 Δp = p1 − p2 = v2 − v21 ⎡ 22 ⎤ ⎥⎥
2 ⎢⎢⎢⎢ v2 = v1 ⎢⎣ − 1⎥⎥⎥⎦ . 2 v1 Außerdem gilt das Kontinuitätsgesetz für den Volumendurchfluss Q = A1 v1 = A2 v2 . Dabei bedeuten A1 und A2 die Strömungsquerschnitte vor bzw. an der Drosselstelle. Führt man das aus der Kontinuitätsgleichung errechnete Öffnungsverhältnis m = A2 /A1 = v1 /v2 in die Bernoulli’sche Gleichung ein, so ergibt sich die Durchflussgleichung 8 Q = A1 v1 = mA1
1 2Δp · .
1 − m2
Der Durchfluss ist also proportional der Wurzel aus dem Differenzdruck Δp. Deshalb werden Radiziereinrichtungen zur Durchflussberechnung eingesetzt. Bei einer Strömungsgeschwindigkeit v1 = 1 m/s, einem Öffnungsverhältnis m = 0, 5 des Drosselgerätes und einer Dichte = 1 kg/dm3 des Messmediums berechnet sich ein theoretischer Differenzdruck von
2 1 Δp = v1 2 − 1 = 1500 Pa = 15 mbar . 2 m In DIN 1952 sind Blende, Düse und Venturidüse als Bauarten von Drosselgeräten genormt. 3.4.2 Schwebekörper-Durchflussmessung
Bei der Durchflussmessung mit Schwebekörper wird nach Bild 3-24 auf einen Schwebekörper in einem
Bild 3-24. Schwebekörper-Durchflussmessung
vertikalen, konischen Rohr von unten eine Kraft F von der Strömung ausgeübt: F=
A2
· Q2 . 2 (A1 − A2 )2
A1 ist der Querschnitt des konischen Rohres in der Höhe des größten Querschnittes des Schwebekörpers, A2 ist die Querschnittsfläche des Schwebekörpers. Der durch die Strömung erzeugten Kraft F wirkt die Differenz aus Gewichtskraft FG und Auftriebskraft FA auf den Schwebekörper (Dichte S , Volumen VS ) entgegen. Diese nach unten gerichtete Kraft beträgt FG − FA = ( S − )VS g . Der Schwebekörper stellt sich auf eine Höhe h bzw. einen Querschnitt ein, wo die wirksamen Kräfte im Gleichgewicht sind: A2
· Q2 = g( S − )VS . 2 (A1 − A2 )2 Daraus ergibt sich der Volumendurchfluss 8 A1 − A2 2 g( S − )VS . Q= √
A2 3.4.3 Durchflussmessung über magnetische Induktion
Nach dem Induktionsgesetz lässt sich die Geschwindigkeit v eines senkrecht zur Richtung eines magnetischen Feldes mit der Induktion B bewegten Leiters der Länge D über die an den Enden dieses Leiters induzierte Spannung U bestimmen. Das darauf basierende Durchflussmessverfahren über die magnetische Induktion ist im Prinzip in Bild 3-25 dargestellt.
H37
H38
H Messtechnik
Anordnung ab. Üblicherweise ergibt sich ein Innenwiderstand im MΩ-Bereich; deshalb muss der Eingangswiderstand des nachfolgenden Messverstärkers besonders hochohmig sein (vgl. 4.4.4). 3.4.4 Ultraschall-Durchflussmessung Bild 3-25. Durchflussmessung über magnetische Induktion
Die strömende Flüssigkeit wird hierbei als Leiter angesehen, d. h., sie muss eine Mindestleitfähigkeit von etwa 0,1 mS/m besitzen. Die meisten technischen Flüssigkeiten erfüllen diese Anforderung, z. B. Leitungswasser mit etwa 50 bis 80 mS/m. Destilliertes Wasser liegt mit 0,1 mS/m an der Grenze, Kohlenwasserstoffe sind ungeeignet. Das erforderliche Magnetfeld muss das Rohrstück senkrecht zur Strömungsrichtung durchsetzen. Senkrecht zur Richtung der magnetischen Induktion B und senkrecht zur Strömungsrichtung wird eine Spannung induziert. Sie kann durch zwei Elektroden, die in dem isolierten Rohr angebracht sind, abgegriffen werden. Die induzierte Spannung ergibt sich aus dem Induktionsgesetz zu U=
dA Dds dΦ =B =B = BDv dt dt dt
(Φ magnetischer Fluss, B magnetische Induktion, A Fläche, D Rohrinnendurchmesser, s Weglänge, v Geschwindigkeit). Der wesentliche Vorteil gegenüber dem Wirkdruckverfahren liegt in dem linearen Zusammenhang und in der Tatsache, dass kein Druckverlust durch Drosselgeräte oder Strömungskörper auftritt. Der Volumendurchfluss Q als Produkt von Rohrquerschnitt π4 D2 und Geschwindigkeit v beträgt dann Q=
Bei der Ultraschall-Durchflussmessung wird nach Bild 3-26 an einem Piezokristall ein kurzer Schallimpuls erzeugt, der stromabwärts mit der Geschwindigkeit c1 = c + v cos ϕ und stromaufwärts mit c2 = c − v cos ϕ unter dem Winkel ϕ zur Strömungsrichtung der Messflüssigkeit auf den Empfängerkristall zuläuft. Dabei ist c die Schallgeschwindigkeit und v die durchschnittliche Strömungsgeschwindigkeit der Flüssigkeit. Die beiden Laufzeiten t1 und t2 auf den beiden Strecken der Länge L betragen L L , = c1 c + v cos ϕ L L t2 = . = c2 c − v cos ϕ t1 =
Wird der am Empfängerkristall empfangene Impuls ohne Verzögerung, aber mit verstärkter Amplitude wieder auf den Sender gegeben (SingaroundVerfahren), so ergeben sich die Impulsfolgefrequenzen f1 und f2 zu 1 c + v cos ϕ ; = t1 L 1 c − v cos ϕ ; f2 = = t2 L f1 =
Da die Strömungsgeschwindigkeit v klein ist gegen die Schallgeschwindigkeit c (im Wasser z. B. 1450 m/s), können schon kleine temperaturbedingte Änderungen der Schallgeschwindigkeit (in Wasser z. B. 3,5 (m/s)/K) das Messergebnis stark
π 2 π D D v= · U. 4 4 B
Im Allgemeinen ist die induzierte Spannung U gering. Sie beträgt z. B. bei B = 0,1 T, D = 0,1 m und v = 0,1 m/s nur 1 mV. Der Innenwiderstand des Aufnehmers bezüglich der beiden Elektroden hängt von der Leitfähigkeit der strömenden Flüssigkeit und von der Geometrie der
Bild 3-26. Prinzip der Ultraschall-Durchflussmessung
3 Messgrößenaufnehmer (Sensoren)
verfälschen. Deshalb wird die Differenz der beiden Impulsfolgefrequenzen, 2 v cos ϕ , L ausgewertet, die – unabhängig von der momentanen Schallgeschwindigkeit – der Strömungsgeschwindigkeit v und damit auch dem Volumendurchfluss Q = Av proportional ist (A Rohrquerschnitt). Zur Bestimmung des Massendurchflusses aus dem Volumendurchfluss Q oder der Strömungsgeschwindigkeit v muss die Dichte der Messflüssigkeit bekannt sein, die sich bei bekanntem Kompressionsmodul K aus der Schallgeschwindigkeit c zu = K/c2 ergibt. Die Schallgeschwindigkeit c wiederum erhält man beim Ultraschallverfahren aus der Summe der beiden Impulsfolgefrequenzen: f1 − f2 =
2 c. L Der Massendurchfluss ist damit f1 + f2 =
q = Q =
K f1 − f2 2KA · Av = . L cos ϕ ( f1 + f2 )2 c2
3.4.5 Turbinen-Durchflussmesser (mittelbare Volumenzähler mit Messflügeln)
Bei den mittelbaren Volumenzählern mit Messflügeln (Turbinen-Durchflusszählern) versetzt die Strömung im Messrohr ein drehbar gelagertes Turbinenrad in Rotation. Die Drehzahl ist unter bestimmten Bedingungen proportional zur Strömungsgeschwindigkeit. Bei den als Hauswasserzähler verwendeten Flügelradzählern (Bild 3-27) wird mit einem Flügelrad die Geschwindigkeit erfasst. Das Wasser tritt durch die Öffnung im Boden des Grundbechers ein, treibt das Flügelrad an und tritt oben wieder aus.
Bild 3-28. Verdrängungszähler (Ovalradzähler, Orlicek)
3.4.6 Verdrängungszähler (unmittelbare Volumenzähler)
Verdrängungszähler haben bewegliche, meist rotierende Messkammerwände, die vom Messgut angetrieben werden. Beim Ovalradzähler (Bild 3-28) rollen in einer Messkammer zwei drehbar gelagerte Ovalräder mit Evolventenverzahnung aufeinander ab. In der links gezeichneten Stellung wird vom Druck der eintretenden Messflüssigkeit auf das untere Ovalrad ein linksdrehendes Drehmoment ausgeübt. Das obere rechtsdrehende Ovalrad schließt ein Teilvolumen zur Messkammerwand hin ab und transportiert diesen Teil der Messflüssigkeit auf die Ausgangsseite. Bei einer Umdrehung der Ovalräder werden so vier Teilvolumina transportiert, die dem Messkammerinhalt VM entsprechen.
3.5 Sensoren zur Temperaturmessung 3.5.1 Platin-Widerstandsthermometer
Nach DIN EN 60751 wird die Temperaturabhängigkeit des Widerstandes eines Platin-Widerstandsthermometers im Bereich 0 ◦ C ϑ 850 ◦ C durch R = R0 (1 + Aϑ + Bϑ2 ) beschrieben (Bild 3-29a; ϑ Celsiustemperatur, R0 Widerstand bei 0 ◦ C). Die Koeffizienten betragen A = 3,9083 · 10−3 /K, B = −0,5775 · 10−6 /K2 . Ersetzt man A und B durch den mittleren Temperaturkoeffizienten α im Bereich von 0 bis 100 ◦ C, so ergibt sich
Bild 3-27. Turbinen-Durchflussmessung (Flügelradzähler,
Siemens)
α = A + 100 K · B = 3,85 · 10−3 /K .
H39
H40
H Messtechnik
Bild 3-29. Platin-Widerstandsthermometer. a Temperatur-
abhängigkeit des elektrischen Widerstandes, b Toleranzgrenzen der Klassen A und B
Der maximale Linearitätsfehler FL im Bereich 0 ϑ 100 ◦ C ergibt sich bei ϑ = 50 ◦ C zu FL = 1,44 · 10−3 . Bei Bezug auf die Ausgangsspanne (100 K) · α ergibt sich ein relativer Fehler FL /(100 K · α) = 3,75% . Die Toleranzgrenzen der genormten Toleranzklassen A und B sind in Bild 3-29b dargestellt und betragen für Platin-Widerstandsthermometer |Δϑ| = 0,15 K + 0,002 ϑ (Klasse A bis 650 ◦ C) , |Δϑ| = 0,3 K + 0,005 ϑ
(Klasse B bis 850 ◦ C) .
Für technische Messungen baut man den Messwiderstand in einen Messeinsatz und diesen wiederum in eine Schutzarmatur ein (Bild 3-30). 3.5.2 Andere Widerstandsthermometer
Nickel besitzt im Vergleich zu Platin eine höhere Temperaturempfindlichkeit des elektrischen Widerstandes. Der mittlere Temperaturkoeffizient im Bereich zwischen 0 und 100 ◦ C beträgt
Bild 3-30. Platin-Widerstandsthermometer im Schutzrohr
(Siemens)
α = 6,18 · 10−3 /K. Messwiderstände Ni 100 können im Temperaturbereich von −60 ◦ C bis +250 ◦ C eingesetzt werden. Von den reinen Metallen eignet sich Kupfer nur in dem eingeschränkten Temperaturbereich von −50 ◦ C bis +150 ◦ C (max. +250 ◦ C) als Material für Widerstandsthermometer. Heißleiter
Für Heißleiter werden sinterfähige Metalloxide, im Besonderen oxidische Mischkristalle, verwendet. Die Abhängigkeit des elektrischen Widerstandes R eines Heißleiters von der Temperatur ϑ ist im Vergleich zu „Kaltleitern“ in Bild 3-31 dargestellt. Wegen ihres negativen Temperaturkoeffizienten werden Heißleiter häufig auch als NTC-Widerstände (negative temperature coefficient) bezeichnet. Im Umgebungstemperaturbereich ergeben sich Temperaturkoeffizienten von etwa −3 bis −6%/K. Heißleiter werden bis zu +250 ◦ C, in Sonderfällen bis zu +400 ◦ C und darüber, eingesetzt. Messschaltungen für Heißleiter: siehe 4.1.3. Silizium-Widerstandsthermometer
Reines monokristallines Silizium ist als Widerstandsmaterial für Temperatursensoren im Bereich
3 Messgrößenaufnehmer (Sensoren)
Bild 3-31. Kennlinien von Widerstandsthermometern
Er ist etwa doppelt so groß wie der von Metallen. Eine Linearisierung der Sensorkennlinie ist entweder in einer Spannungsteilerschaltung oder durch Parallelschalten eines konstanten Widerstandes Rp möglich. Silizium-Temperatursensoren werden gewöhnlich als Ausbreitungswiderstände realisiert. Der Widerstand zwischen einer kreisförmigen Kontaktierung mit dem Durchmesser d und dem flächigen Rückseitenkontakt einer Siliziumscheibe mit dem spezifischen Widerstand beträgt R = 12 /d und ist unabhängig von der Dicke und dem Durchmesser der Scheibe, solange diese beiden Größen groß gegen den Kontaktdurchmesser d sind. Praktisch ausgeführt wird ein symmetrischer Aufbau (Bild 3-32b), bei dem sich mit
= 0,06 Ω · m bei 25 ◦ C und d = 25 μm der Widerstand /d ≈ R ≈ 2 kΩ ergibt. 3.5.3 Thermoelemente als Temperaturaufnehmer
Verbindet man nach Bild 3-33a zwei Metalle A und B an ihren Enden durch Löten oder Schweißen, so erhält man ein Thermoelement (Thermopaar). Bringt man die Verbindungsstellen auf Messtemperatur ϑ bzw. Vergleichstemperatur ϑv , so entsteht zwischen den Drähten eine Thermospannung Uth , die in erster Näherung der Temperaturdifferenz (ϑ − ϑv ) zwischen Messstelle und Vergleichsstelle proportional ist: Bild 3-32. Silizium-Temperatursensor. a Kennlinie, b Auf-
Uth = kth (ϑ − ϑv ) .
bau
von −50 ◦ C bis +150 ◦ C gut geeignet. Mit steigender Temperatur nimmt die Leitfähigkeit ab, da die Beweglichkeit der Ladungsträger geringer wird. Silizium-Temperatursensoren haben einen positiven Temperaturkoeffizienten mit näherungsweise parabelförmiger Temperaturabhängigkeit (Bild 3-32a). Es gilt R = R0 + k(ϑ − ϑ0 )2 . Ein typischer Temperatursensor hat bei 25 ◦ C einen Widerstand von 2000 Ω. Im Bereich zwischen 0 und 100 ◦ C beträgt der mittlere Temperaturkoeffizient α=
R(100 ◦ C) − R(0 ◦ C) ≈ 1%/K . 100 K · R(0 ◦ C)
Die Thermoempfindlichkeit kth hängt im Wesentlichen von den verwendeten Metallen ab. Bei metallischen Thermopaaren liegen die Thermoempfindlichkeiten etwa bei kth =
k nB nB ln = 86 μV/K · ln . e nA nA
(k Boltzmann-Konstante, e Elementarladung, nA , nB Elektronenkonzentration in den beiden Metallen). Die Thermoempfindlichkeit kAB eines Metalls A gegen ein Metall B ergibt sich auch aus den Thermoempfindlichkeiten kACu und kBCu von A bzw. B gegen Kupfer zu kAB = kACu − KBCu .
H41
H42
H Messtechnik
Bild 3-33. Thermoelemente. a Verbindungsstellen eines Thermopaars, b Kennlinien verschiedener Thermopaare, c Mantel-Thermoelemente, d Prinzip der Thermoketten, e Kompensationsdose zur Korrektur der Vergleichsstellentemperatur
in eine Schutzarmatur eingebaut. Kürzere Einstellzeiten erhält man mit Mantelthermoelementen nach Bild 3-33c, bei denen die Thermopaare zur Isolation in Al2 O3 eingebettet und mit einem Edelstahlmantel umhüllt sind. Außendurchmesser von weniger als 3 mm sind dabei realisierbar. Zur Messung kleiner Temperaturdifferenzen können Thermoketten nach Bild 3-33d verwendet werden, bei denen z. B. mit n = 10 Mess- und Vergleichsstellen der Messeffekt entsprechend vergrößert ist. Bei Thermoelementmessungen handelt es sich im Prinzip um Differenztemperaturmessungen zwischen Messstelle und Vergleichsstelle. Soll die absolute Temperatur einer Messstelle bestimmt werden, dann muss entweder mit einem Vergleichsstellenthermostaten die Temperatur der Vergleichsstelle z. B. auf ϑv = 50 ◦ C konstant gehalten werden, oder man verwendet eine sog. Kompensationsdose nach Bild 3-33e, die den Einfluss einer veränderlichen Vergleichsstellentemperatur korrigiert. Die Kompensationsdose enthält im Wesentlichen eine Brückenschaltung im Ausschlagverfahren mit einem temperaturabhängigen Kupferwiderstand als Widerstandsthermometer. Abhängig von der Vergleichsstellentemperatur liefert die Brückenschaltung eine Kompensationsspannung UK , die zur Thermospannung addiert wird und dadurch die Temperaturänderung der Vergleichsstelle kompensiert. 3.5.4 Strahlungsthermometer (Pyrometer) Physikalische Grundlagen
Für ein Eisen-Konstantan-Thermoelement z. B. beträgt die Thermoempfindlichkeit bei ϑ = 100 ◦ C und ϑv = 0 ◦ C kFeKon = [+1,05 − (−4,1mV)]/(100 K) mV . ≈ 5,15 100 K Die obere Messgrenze liegt bei Kupfer-Konstantan bei etwa 500 ◦ C, bei Eisen-Konstantan bei etwa 700 ◦ C, bei Nickelchrom-Nickel bei etwa 1000 ◦ C und bei Platinrhodium-Platin bei etwa 1300 ◦ C (mit Einschränkungen bei 1600 ◦ C). Die Kennlinien dieser Thermopaare sind in Bild 3-33b eingetragen. Für industrielle Anwendungen werden die Thermopaardrähte z. B. mit Keramikröhrchen isoliert und
Strahlungsthermometer arbeiten im Gegensatz zu Widerstandsthermometern und Thermoelementen berührungslos und sind besonders zur Messung höherer Temperaturen (etwa 300 ◦ C bis 3000 ◦ C) geeignet. Die physikalische Grundlage für die Strahlungsthermometer bildet das Planck’sche Strahlungsgesetz. Danach beträgt die von der Fläche A des schwarzen Körpers bei der Temperatur T in den Halbraum (Raumwinkel 2π) ausgesandte spektrale spezifische Ausstrahlung Mλ (λ) im Wellenlängenbereich zwischen λ und λ + dλ Mλ (λ) =
c1 dM(λ) #c $ 5. = 4 2 dλ 5 λ exp −1 λT
Die Größen c1 und c2 sind dabei Konstanten.
3 Messgrößenaufnehmer (Sensoren)
Die spektrale spezifische Ausstrahlung Mλ (λ) des schwarzen Körpers ist in Bild 3-34a als Funktion der Wellenlänge λ mit der Temperatur T als Parameter dargestellt. Die spektrale spezifische Ausstrahlung besitzt abhängig von der Temperatur T ein ausgeprägtes Maximum bei einer bestimmten Wellenlänge λmax . Nach dem Wien’schen Verschiebungsgesetz verschiebt sich dieses Maximum mit wachsender Temperatur T nach kleineren Wellenlängen. Das Maximum der spektralen spezifischen Ausstrahlung liegt bei λmax = und hat den Wert
Mλ (λ) A
a T
= bT 5 . max
Die Größen a und b sind ebenfalls Konstanten.
Durch Integration über alle Wellenlängen ergibt sich das Stefan- Boltzmann’sche Gesetz für die gesamtspezifische Ausstrahlung M des schwarzen Körpers bei der Temperatur T "∞ "∞ M = Mλ (λ)dλ = c1 0
0
σ ist die Stefan-Boltzmann-Konstante: σ = 5, 67 · 10−8 W/m2 · K4 . Emissionsgrad technischer Flächen
Technische Flächen können i. Allg. nicht als schwarze Körper angesehen werden. Ihre spektrale (spezifische) Ausstrahlung ist um den spektralen Emissionsgrad ε(λ) kleiner als die aus dem Planckschen Strahlungsgesetz sich ergebende spektrale spezifische Ausstrahlung des schwarzen Körpers, der die gesamte auffallende Strahlung absorbiert. Der spektrale Emissionsgrad ε(λ) eines nichtschwarzen Körpers ist i. Allg. von der Wellenlänge λ abhängig. Als Integralwert verwendet man den Gesamtemissionsgrad εtot , der nur von der Temperatur abhängt. Für 20 ◦ C erhält man folgende Gesamtemissionsgrade εtot . Metalle, blank poliert Aluminiumblech, roh Nickel, matt Messing, matt Stahl, blank Stahlblech, Walzhaut Stahl, stark verrostet
Bild 3-34. Strahlungsthermometer. a Spektrale Strahlungsleistung nach dem Planck’schen Strahlungsgesetz (Mester), b Farbpyrometer (Siemens)
dλ = σT 4 , λ5 [exp(c2 /λT ) − 1]
3% 7% 11% 22% 24% 77% 85%
Mit Ausnahme der Metalle verhalten sich bei niedrigen Temperaturen alle Stoffe angenähert wie der schwarze Körper. Wasser hat z. B. bei 20 ◦ C einen Gesamtemissionsgrad von 96%. Für den Sonderfall, dass der spektrale Emissionsgrad unabhängig von der Wellenlänge ist, spricht man von einem grauen Strahler. Die spezifische Ausstrahlung von grauen Strahlen unterscheidet sich von der des schwarzen Körpers gleicher Temperatur nur durch einen konstanten Faktor ε.
H43
H44
H Messtechnik
Aufbau und Eigenschaften von Pyrometern
Praktisch ausgeführte Strahlungsthermometer (Pyrometer) unterscheiden sich in ihrem Aufbau im Wesentlichen durch die verwendete Optik zum Sammeln der Strahlung und durch die verwendeten Strahlungsempfänger. Mit einem Hohlspiegelpyrometer mit metallischer Oberfläche kann nahezu verlustlos und unabhängig von der Wellenlänge die Strahlung des Messobjekts auf den Strahlungsempfänger übertragen werden. Zur Messung höherer Temperaturen werden Linsenpyrometer bevorzugt. Linsen aus Glas, Quarz oder Lithiumfluorid besitzen jedoch eine obere Absorptionsgrenze bei 2,5 μm für Glas, bei 4 μm für Quarz und bei 10 μm für Lithiumfluorid. Linsenpyrometer mit Silizium-Fotoelement als Strahlungsempfänger besitzen einen beschränkten Wellenlängenbereich von 0,55 bis 1,15 μm. Wegen der kurzen Einstellzeiten von etwa 1 ms sind diese Pyrometer besonders zum Messen von Walzguttemperaturen geeignet. Beim Farbpyrometer nach Bild 3-34b wird das Verhältnis zweier spektraler Strahlungsleistungen, z. B. bei den beiden Wellenlängen 0,888 und 1,034 μm (oder bei zwei Spektralbereichen) bestimmt. Die beiden Wellenlängen(-bereiche) werden z. B. mit einem Indiumphosphid-Filter erzeugt, das Strahlen mit Wellenlängen bis 1 μm reflektiert und über 1 μm durchlässt. Die Strahlung dieser beiden Wellenlängen(-bereiche) trifft auf je ein Silizium-Fotoelement. Bei diesem Farbpyrometer wird das Verhältnis der beiden Ausgangssignale U1 und U2 gebildet und deshalb die Temperaturmessung unabhängig vom Emissionsgrad ε des Messobjekts, solange dieser für beide Wellenlängen gleich groß ist.
3.6 Mikrosensorik Unter Mikrosensoren versteht man Sensoren, bei denen mindestens eine Abmessung im Submillimeterbereich liegt. Diese Kleinheit ermöglicht eine hohe Funktionsdichte und Messungen mit hoher Orts- oder Zeitauflösung. Entsprechende Herstellungstechnologien führen zudem in der Massenfertigung zu niedrigen Preisen und reproduzierbaren Eigenschaften. Und schließlich lassen
sich die Mikrosensoren zusammen mit der Mikroelektronik auf ein gemeinsames Substrat integrieren, um „intelligente“ Sensoren zu realisieren. Aufgrund all dieser Vorteile wurden Mikrosensoren in den letzten zehn Jahren rasant weiterentwickelt. Einige kommerzielle Anwendungen konnten nur durch den Einsatz der Mikrosensorik realisiert werden, etwa der Auto-Airbag (Beschleunigungssensor). 3.6.1 Herstellungstechnologien
Die Herstellung von Mikrosensoren beruht in weiten Teilen auf Techniken, die von der Mikroelektronik her bekannt sind. Wichtige Prozessschritte sind: – die Bereitstellung geeigneter Substrate (Keramiken, Halbleiter, Piezoelektrika); – die Abscheidung von Schichten; – die Strukturübertragung von computergestützten Entwurfsdateien auf den Wafer (Lithografie); – die Entfernung von Schichten (Nassätzen in Ätzlösungen, Trockenätzen durch Beschuss mit physikalisch oder chemisch ätzenden Teilchen); – die Modifikation von Schichten (Oxidation, Dotieren). Bei der Dickschichttechnik wird eine Paste durch ein Sieb auf das Substrat (häufig Aluminiumdioxid, Al2 O3 ) gedrückt, getrocknet und eingebrannt. Die damit herstellbaren Strukturen sind typisch 10 μm dick und 100 μm breit. Sensorische Funktionen verwirklicht man etwa mit Pasten aus Pt oder Ni (Widerstandsthermometer), aus Au/PtAu (Thermoelement), aus MnO oder RuO2 (Heißleiter), aus Bi2 Ru2 O7 (piezoresistiver Drucksensor) oder aus SnO2 (Gassensoren). Bei der Dünnschichttechnik werden Schichten von in der Regel kleinerer Dicke als 1 μm auf das Substrat aufgebracht und strukturiert. Das weitaus am häufigsten benutzte Substrat ist einkristallines Silizium (Si), dem an Wichtigkeit Glas und Quarz (einkristallines Siliziumdioxid, SiO2 ) nachfolgen. Silizium selber zeigt zahlreiche Sensoreffekte; so ändert etwa eine Materialprobe aus Silizium ihren elektrischen Widerstand – mit der Temperatur (Thermowiderstandseffekt), – bei mechanischer Verzerrung (Piezowiderstandseffekt),
3 Messgrößenaufnehmer (Sensoren)
– bei Lichteinstrahlung (innerer lichtelektrischer Effekt) oder – in einem Magnetfeld (Hall-Effekt). Alternativ werden häufig Dünnschichten mit sensorischen Eigenschaften auf dem Substrat abgeschieden, etwa Pt oder Ni (Widerstandsthermometer), Cadmiumsulfid (Fotowiderstand), Zinkoxid oder andere Piezoelektrika (mechanische Sensoren), Metalloxide wie SnO2 (Gassensoren) und Ferromagnetika (Magnetfeldsensoren). Das Schichtwachstum geht entweder auf physikalische Effekte wie Kondensation oder auf chemische Reaktionen zurück und wird in der Regel im Vakuum durchgeführt (physikalische bzw. chemische Dampfabscheidung [PVD, physical vapor deposition, bzw. CVD, chemical vapor deposition]). Sensoren für mechanische Größen wie Druck, Kraft oder Beschleunigung erfordern bewegliche Elemente. Mikromembranen, -biegebalken und ähnliche Elemente lassen sich entweder durch sukzessive Abscheidung und Entfernung von Dünnschichten realisieren (Oberflächenmikromechanik) oder durch Hineinätzen in das Volumen eines Siliziumsubstrates (Volumenmikromechanik). 3.6.2 Mikrosensoren für mechanische Größen
Nahezu ein Viertel des Weltmarktes für SiMikrosysteme entfiel im Jahre 2005 auf Drucksensoren, ein weiteres Sechstel auf Beschleunigungsund Drehratensensoren (Anwendung in Kraftfahrzeugen und Mobiltelefonen). Große Steigerungsraten werden für kostengünstige Mikroschallaufnehmer vorhergesagt (Anwendung in Mobiltelefonen). Die meisten Mikrodruckaufnehmer nützen die Tatsache aus, dass der spezifische Widerstand von dotiertem Silizium stark von der mechanischen Verzerrung abhängt (Piezowiderstandseffekt). Daher lässt sich die druckabhängige Auslenkung einer Si-Membran über die Widerstandsänderung eines dotierten Bereiches der Membran detektieren (Prinzip der Kraft-Weg-Wandlung, Bild 3-35). Beschleunigungs- und Drehratensensoren erfassen die (Winkel-)Beschleunigung a indirekt über die Auslenkung einer seismischen Testmasse m infolge der Newton’schen Trägheitskraft F = m · a.
Bild 3-35. Drucksensor nach dem Piezowiderstandsprinzip, realisiert in Volumenmikromechanik
Bild 3-36. Kapazitiver Beschleunigungssensor, realisiert in Oberflächenmikromechanik
Als Messprinzip für die Auslenkung kommt der Piezowiderstandseffekt ebenso in Frage wie optische, magnetische, piezoelektrische, induktive, kapazitive und sogar thermische Prinzipien. Der erste kommerziell erhältliche Mikrobeschleunigungssensor (Analog Devices, 1991) verwendete ein kapazitives Prinzip (Bild 3-36). Die Testmasse liegt im μg-Bereich, und es müssen Kapazitätsänderungen von weniger als 1 fF detektiert werden. Dies ist nur durch eine sensornahe Signalverarbeitung möglich (Integration des Sensors und der Auswerteelektronik auf einem gemeinsamen Si-Substrat). 3.6.3 Mikrosensoren für Temperatur
Alle in 3.5 aufgeführten Prinzipien zur Temperaturmessung lassen sich miniaturisieren. Reine Halbleitersensoren verwenden entweder die Temperaturabhängigkeit der Leitfähigkeit homogener Halbleiterproben (Prinzip des Ausbreitungswiderstands 3.5.2), oder aber die Temperaturabhängigkeit der Kennlinie von PN-Übergängen (Dioden-, Tran-
H45
H46
H Messtechnik
sistorthermometer). So folgt etwa aus der Kennlinie eines PN-Übergangs von G 27.2.5 im Vorwärtsbetrieb (U > 4kT ): I kT ln . U= e I0 Um die Temperaturabhängigkeit des Sättigungssperrstromes I0 zu eliminieren, arbeitet man praktisch mit zwei möglichst identischen Dioden (räumliche Nähe auf einem gemeinsamen Si-Substrat!), welche mit verschiedenen Konstantströmen I1 , I2 betrieben werden. Dann hängt die Differenzspannung linear von der Temperatur ab: ΔU = U2 − U1 =
k I2 ln · T e I1
3.6.4 Mikrosensoren für (bio)chemische Größen
Bio- und Chemosensoren wandeln biologische bzw. chemische Größen in elektrische Signale. Meistens interessiert die Konzentration eines Stoffes (des Analyten) in einem gasförmigen oder flüssigen Medium. Die wichtigsten in Mikrosensoren verwendeten Prinzipien sind: – Konduktometrie: Leitfähigkeitsänderung nach Analytabsorption (Bsp.: Zinndioxid-Gassensor); – Potenziometrie: Änderung der elektromotorischen Kraft einer elektrochemischen Zelle nach Analytabsorption (Bsp.: ionenselektiver Feldeffekttransistor [ISFET] zur pH-Wertmessung); – Kapazitives Prinzip: Kapazitätsänderung nach Analytabsorption (Bsp.: Feuchtemessung mit hygroskopem Polymer); – Optische Prinzipien: Dämpfungs- oder Phasenänderungen bei Lichtwellen infolge des Einflusses des Analyten (Bsp.: Infrarotspektrometer); – Thermometrie: Wärmetönung einer chemischen Reaktion des Analyten (Bsp.: Si-Mikropellistor für brennbare Gase); – Gravimetrie: Änderung der Resonanzfrequenz eines Piezoschwingers nach Analytadsorption (Bsp.: Quarz-Mikrowaage). Stellvertretend wird im Weiteren das Prinzip der Gravimetrie erläutert. Dieses Sensorprinzip hat zwar bislang keine kommerzielle Bedeutung erlangt, ist aber im Labor beliebt, weil sich damit auch chemooder biosensorische Aufgaben lösen lassen, für die
Bild 3-37. Gravimetrische Sensoren. a Quarz-Mikrowaage (Schwingfrequenz bis zu einigen 10 MHz), b Oszillator aus SAW-Bauelement und Verstärker (Schwingfrequenz bis zu einigen GHz; SAW = surface acoustic wave, akustische Oberflächenwelle; IDT = interdigital transducer, Interdigitalwandler zur Umsetzung elektrischer Signale in akustische Oberflächenwellen und umgekehrt)
keine fertigen Lösungen auf dem Markt existieren. Dazu werden piezoelektrische Substrate, die mechanisch schwingen oder auf deren Oberfläche sich hochfrequente akustische Wellen ausbreiten, mit einer Schicht bedeckt, die selektiv nur den nachzuweisenden Analyten einlagert (Bild 3-37). Bei Anlagerung von Analytmolekülen verändert sich die Frequenz der mechanischen Resonatoren aufgrund veränderter elastischer oder elektrischer Eigenschaften der sensitiven Schicht. Im einfachsten Fall spielt nur die zusätzliche Masse Δm der angelagerten Moleküle eine Rolle. Dann gilt für die relative Änderung der Schwingfrequenz f die Sauerbrey-Gleichung Δf = −K f Δm . f Die Konstante K hängt dabei vom verwendeten Substrat, dem akustischen Wellentyp und der Wechselwirkung zwischen Analyt und sensitiver Schicht ab. In jedem Fall steigt der Messeffekt Δ f / f mit der Frequenz, sodass höhere Arbeitsfrequenzen und daher kleinere Bauelemente vorteilhaft sind. Ansätze, mithilfe von Matrixanordnungen aus mehreren Mikrosensoren Analytgemische zu erfassen, haben noch zu keinen kommerziellen Produkten geführt, werden aber mit Nachdruck weiterverfolgt (elektronische Nase). 3.6.5 Mikrosensoren für magnetische Größen
Alle praktisch relevanten Mikrosensoren für Magnetfelder beruhen auf der Wechselwirkung zwischen
3 Messgrößenaufnehmer (Sensoren)
elektrischen Strömen und Magnetfeldern (Galvanomagnetismus). Neben Hall-Sensoren und Feldplatten (3.2.4) haben in den letzten Jahren vor allem Sensoren eine große Bedeutung erlangt, die Materialeffekte in elektrisch leitfähigen Ferromagnetika ausnutzen. Die Leitfähigkeit solcher Stoffe ist senkrecht zur Magnetisierungsrichtung um einige Prozent größer als parallel dazu. Ein äußeres Magnetfeld, das die Magnetisierung des Ferromagnetikums aus ihrer Ruherichtung ablenkt, macht sich daher in einer Widerstandsänderung bemerkbar (anisotroper Magnetowiderstandseffekt, verwendet im AMR-Sensor [anisotropic magnetoresistance]). Der GMR-Sensor (giant magnetoresistance) basiert auf dem Umstand, dass sich der elektrische Widerstand von Vielschichtsystemen aus abwechselnd ferromagnetischen und unmagnetischen metallischen Dünnschichten abhängig von der relativen Orientierung der Magnetisierung in den ferromagnetischen Schichten um einige 10% ändert. Der Einsatz von GMR-Sensoren im Lesekopf von Computerfestplatten seit 1997 hat eine starke Zunahme der Speicherdichte und damit der Festplattenkapazität ermöglicht.
3.7 Sensorspezifische Messsignalverarbeitung 3.7.1 Analoge Messsignalverarbeitung
Zu den bisher vorherrschenden Verfahren der analogen Messsignalverarbeitung zählen neben den strukturellen Maßnahmen die mechanischkonstruktiven Verfahren und die analog-elektronische Messsignalverarbeitung. Von den mechanisch-konstruktiven Verfahren sind besonders bekannt geworden: – das sog. Radizierschwert, eingesetzt z. B. zur Radizierung des Differenzdrucks bei der Durchflussmessung nach dem Wirkdruckverfahren, – der Reibradintegrator zur Integration von Signalen, – Einrichtungen zur Linearisierung durch konstruktive Maßnahmen, z. B. der Teleperm-Abgriff als magnetischer Winkelaufnehmer.
– die Integration mit Integrationsverstärkern, – die Multiplikation (zur Leistungsmessung) mit Impulsflächenmultiplizierern, – die Division mithilfe von Kompensationsschreibern. 3.7.2 Inkrementale Messsignalverarbeitung
Zu den bisher vorherrschenden Verfahren der inkrementalen bzw. hybriden Messsignalverarbeitung zählen die Messsignalverarbeitung bei der Analog-Digital-Umsetzung und die rein inkrementale Messsignalverarbeitung. Bei der Analog-Digital-Umsetzung bestehen folgende Möglichkeiten der Signalverarbeitung: 1. Die Division bei der Spannungs-DigitalUmsetzung durch Ersatz der Referenzspannung durch eine veränderliche Eingangsspannung. 2. Die Division bei der Frequenz-Digital-Umsetzung durch Ersatz der Referenzfrequenz durch eine veränderliche Eingangsfrequenz. 3. Die zeitliche Integration einer zeitlich veränderlichen Frequenz durch Aufzählen in einem Zähler. 4. Die Subtraktion zweier Frequenzen durch Subtraktion zweier Impulszahlen, die bei gleichen Torzeiten von den beiden Eingangsfrequenzen erhalten wurden und nacheinander in einen VorwärtsRückwärts-Zähler einlaufen. Schließlich ist bei der rein inkrementalen Messsignalverarbeitung ein Impulslogarithmierer zu erwähnen, der immer dann einen Ausgangsimpuls abgibt, wenn die Zahl der Eingangsimpulse sich um die Zahl der bereits vorhandenen Impulse erhöht hat. 3.7.3 Digitale Grundverknüpfungen und Grundfunktionen
Bei der analog-elektronischen Messsignalverarbeitung haben sich bewährt
Neben den vier Grundrechenarten stehen bei Mikrorechnern mit arithmetischen Koprozessoren eine Reihe von Grundfunktionen in einem ROM (read-only memory) zur Verfügung. Dazu zählen z. B. Radizierung, Logarithmierung, trigonometrische Funktionen und deren Umkehrfunktionen. Die Grundverknüpfungen finden Anwendung bei der
– die Addition und Subtraktion mit Operationsverstärkern,
– Summation und Subtraktion für Verrechnungszwecke,
H47
H48
H Messtechnik
– Multiplikation für die Leistungsmessung, – Quotientenbildung zur Bezugnahme auf eine zweite Größe. Beispielsweise wird eine Frequenz bei der Multiperiodendauermessung durch die Division zweier Zählerstände ermittelt. Die Grundfunktionen finden Anwendung bei der Berechnung – des Durchflusses durch Radizierung des Differenzdruckes an einem Drosselgerät, – der Leistung eines Kernreaktors durch Logarithmierung seiner Aktivität, – des Winkels eines Resolversystems durch Bildung des Arcussinus bzw. Arcuscosinus.
Bild 3-38. Kennlinie eines induktiven Wegsensors
Integration über die Zeit ist durch genügend häufige Abtastung und Aufsummierung der Abtastwerte möglich oder besser durch Integration des durch Interpolation gewonnenen Funktionsverlaufes. Die Integration über die Zeit gehört also nicht zu den Grundfunktionen.
Für die gebrochen rationale Funktion 1. Grades ergibt sich L0 xm + L∞ x . L= xm + x
3.7.4 Physikalische Modellfunktionen für einen Sensor
Ist das statische Verhalten eines Sensors durch physikalische Gesetze hinreichend genau beschreibbar, so ist es natürlich zweckmäßig, eine so erhaltene Modellfunktion für die rechnergestützte Korrektur zu verwenden. Beispiel: Induktive Drosselsysteme als Wegauf-
nehmer lassen sich z. B. ohne Berücksichtigung des Streuflusses mit einer vereinfachten Theorie durch eine in Richtung des Messweges verschobene Hyperbel beschreiben. Bei Berücksichtigung von Streuflüssen ergibt sich jedoch auch bei sehr großem Luftspalt, der dem Messweg entspricht, eine von null verschiedene Induktivität. Der prinzipielle Kennlinienverlauf der Induktivität L, abhängig vom Messweg x, ist in Bild 3-38 dargestellt. Mit L0 und L∞ sind die Induktivitäten bei den Weglängen x = 0 bzw. x → ∞ bezeichnet, während die mittlere Induktivität 12 (L0 + L∞ ) die Weglänge xm bestimmt. Zwei Modellfunktionen bieten sich an, eine Exponentialfunktion und eine gebrochen rationale Funktion 1. Grades.
Für die Exponentialfunktion kann man ansetzen L = L∞ + (L0 − L∞ )e−(x/xm ) ln 2 .
Sind drei Punkte (xi , Li ) der Kennlinie bekannt, so lassen sich die Koeffizienten xm , L∞ und L0 berechnen zu (x3 L3 − x2 L2 )(x2 − x1 ) − (x2 L2 − x1 L1 )(x3 − x2 ) , (L2 − L1 )(x3 − x2 ) − (L3 − L2 )(x2 − x1 ) x3 L3 − x2 L2 + xm (L3 − L2 ) L∞ = , x3 − x2 1 . L0 = (x3 L3 − x3 L∞ + xm L3 ) xm xm =
Durch Vergleich mit den Messergebnissen an einem Sensor muss entschieden werden, welche der beiden Modellfunktionen besser geeignet ist. 3.7.5 Skalierung und Linearisierung von Sensorkennlinien durch Interpolation
Durch Konstantenaddition und Konstantenmultiplikation ist der Ausgleich herstellungsbedingter Streuungen von Nullpunkt und Steilheit bei im Übrigen linearer Sollkennlinie eines Sensors möglich. Man spricht hier von Skalierung. Nichtlineare Sollkennlinien können durch folgende Maßnahmen nachgebildet werden: 1. 2. 3. 4.
Tabellarische Abspeicherung (look-up tables), Polygonzug-Interpolation, Polynom-Interpolation (niedrigen Grades), Spline-Interpolation.
3 Messgrößenaufnehmer (Sensoren)
Geringeren Speicherbedarf und nur sehr geringe Rechenzeit benötigt die Polygonzug-Interpolation (Interpolation mit Geradenstücken, Bild 3-39b). Die Zahl der Definitionsbereiche bleibt jedoch meist verhältnismäßig hoch. Gewöhnlich wird zwischen mindestens 10 Stützwerten interpoliert. Polynom-Interpolation 2. Grades (Parabelinterpolation) ist in Bild 3-39c für Parabeln mit Symmetrieachse parallel zur y-Achse bzw. x-Achse dargestellt. Drei Wertepaare der Kennlinie legen die jeweilige Parabel fest. y = a + bx + cx2 x = d + ey + f y2
Symmetrieachse parallel zur y-Achse x-Achse
Mit einer Polynom-Interpolation 3. Grades (kubische Parabel) ist die Einbeziehung eines Wendepunktes in die Kennlinie möglich (Bild 3-39d). Mit vier Wertepaaren lassen sich die vier Koeffizienten a, b, c und d des Polynomus y = a + bx + cx2 + dx3
Bild 3-39. Nachbildung von Kennlinien und Polynominterpolation. a Tabellenverfahren, b Polygonzug-Interpolation, c Parabel-Interpolation, d Interpolation mit kubischer Parabel, e mangelnde Eignung von Polynomen höheren Grades
Der meiste Speicherplatz und die geringste Rechenzeit wird bei der tabellarischen Abspeicherung aller vorkommenden Wertepaare benötigt, wobei eine der gewünschten Genauigkeit entsprechende Quantisierung eingehalten werden muss (Bild 3-39a). Die tabellarische Abspeicherung ist für Kennlinienscharen (Kennfelder) wegen des hohen Speicherbedarfs weniger geeignet.
bestimmen. Für die Interpolation von Sensorkennlinien zwischen festen Stützwerten sind Polynome höheren als 3. Grades i. Allg. wenig geeignet, weil solche Polynome außerhalb der Intervallgrenzen schnell über alle Grenzen wachsen und meist alle k − 2 Wendepunkte des Polynoms k-ten Grades innerhalb des Interpolationsintervalles liegen. Diese Eigenschaften widersprechen dem eher glatten Verlauf realer Sensorkennlinien. Die mangelhafte Eignung eines Polynoms 4. Grades zur Interpolation einer Sensorkennlinie ist in Bild 3-39e an den Oszillationen des Interpolations-Polynoms deutlich zu erkennen. 3.7.6 Interpolation von Sensorkennlinien mit kubischen Splines
Glatte Kennlinienverläufe und höchstens ein Wendepunkt je Definitionsbereich ergeben sich bei kubischen Spline-Polynomen. Nach Bild 3-40 handelt es sich dabei um aneinandergesetzte Polynome 3. Grades (kubische Parabeln), die in den Übergangspunkten im Funktionswert, in der Steigung und in der Krümmung übereinstimmen.
H49
H50
H Messtechnik
überschaubar und liefert sehr gute Ergebnisse für die Kennlinieninterpolation. 3.7.7 Ausgleichskriterien zur Approximation von Sensorkennlinien
Bild 3-40. Interpolation mit kubischen Spline-Polynomen
Die Spline-Funktionen S i (x) zwischen zwei benachbarten Stützwerten xi , yi und xi+1 , yi+1 (i = 0,1, . . . , m-1) lauten Si (x) = ai + bi (x − xi ) + ci (x − xi )2 + di (x − xi )3 . Durch m + 1 Stützwerte werden also m SplinePolynome S0 (x) bis Sm−1 (x) gelegt. Die 4m Koeffizienten der m Spline-Polynome berechnen sich aus den 2m
m−1 m−1
Bedingungen für die Funktionswerte, da jedes Spline-Polynom am Anfang und am Ende des Definitionsbereiches durch die beiden dort vorhandenen Stützwerte gehen soll, Bedingungen für die Steigungsgleichheit in den Übergangspunkten und Bedingungen für Krümmungsgleichheit in den Übergangspunkten.
(4m − 2) Bedingungen sind also festgelegt. Es verbleiben zwei noch frei wählbare Bedingungen, die im einfachsten Fall so festgelegt werden, dass die Krümmungen (nicht die Steigungen!) am Anfang und Ende der Gesamtfunktion verschwinden (c0 = cm = 0). Mit yi+1 − yi = ym = const und xi+1 − xi = hi ergibt sich als Algorithmus zur Koeffizientenbestimmung: ai = S i (xi ) = yi , hi−1 ci−1 + 2ci (hi−1 + hi ) + hi ci+1 = 3ym (1/hi − 1/hi−1 ) , bi = ym /hi − (ci+1 + 2ci )hi /3 , di = (ci+1 − ci )/3hi . Dieser Algorithmus für die Bestimmung der Koeffizienten ai , bi , ci und di der m Spline-Polynome ist noch
Bei der Kennlinieninterpolation geht die approximierende Funktion exakt durch die Stützwerte. Da die Stützwerte jedoch in der Regel nicht genau bekannt und selbst mit Streuungen behaftet sind, ist eine Interpolation nicht immer die beste Approximation einer Kennlinie. Man benutzt daher gerne die Ausgleichsrechnung (Regression). Die Koeffizienten der Approximationsfunktion werden dabei gewöhnlich durch Minimierung eines Fehlermaßes gewonnen. Die erhaltene Approximationsfunktion verläuft dann i. Allg. nicht durch die Stützwerte. Häufig verwendete Fehlermaße sind das – Fehlermaß R für die L1 -Approximation, – Fehlermaß S für die L2 -Approximation, – Fehlermaß T für die L∞ -Approximation. Bezeichnet man die gemessenen Stützwerte mit (xk , yk ), die mit der Approximationsfunktion gewonnenen Werte mit f (xk ) und die Koeffizienten der Approximationsfunktion mit a1 , . . . , am , so berechnen sich die Fehlermaße R, S und T gemäß R(a1 , . . . , am ) =
n
!
pk |yk − f (a, . . . , am , xk )| = Min ,
k=1
S (a1 , . . . , am ) =
n
!
pk [ yk − f (a1 , . . . , am , xk )]2 = Min ,
k=1 !
T (a1 , . . . , am ) = max pk |yk − f (a1 , . . . , am , xk )| = Min . k
Die Gewichtsfaktoren pK werden im einfachsten Fall gleich eins gesetzt. Das Fehlermaß R ist die gewichtete Summe der Absolutbeträge der Abweichungen und ergibt die L1 Approximation bei minimaler Abweichung. Die L1 Approximation ist zur Ausreißererkennung gut geeignet. Liegt lediglich ein einziger Punkt außerhalb eines sonst linearen Zusammenhangs, so bleibt dieser Ausreißer unberücksichtigt und die Approximationsfunktion verläuft exakt durch alle anderen Punkte. Das Fehlermaß S ist die gewichtete Summe der quadratischen Abweichungen und liefert die
3 Messgrößenaufnehmer (Sensoren)
L2 -Approximation (least squares method) oder Gauß’sche Fehlerquadratmethode nach Minimierung. Diese Methode wird im Regelfall angewendet. Große Abweichungen gehen dabei besonders stark in die Fehlersumme ein. Das Fehlermaß T ergibt sich als die größte (gewichtete) vorkommende Abweichung. Man spricht von der L∞ -Approximation oder TschebyscheffApproximation, wenn die größte vorkommende Abweichung minimal ist. Für die Sensortechnik ist diese Approximation von besonderer Bedeutung. Für die Anwendungen gilt als Faustregel, dass die Zahl der Stützwerte 3- bis 5-mal so groß sein soll wie die Zahl der zu bestimmenden Parameter. Beispiel für die Ausgleichsrechnung
Die Steigung m einer linearen Kennlinie y = mx durch den Ursprung soll so bestimmt werden, dass die Summe der quadratischen Abweichungen von n Messpunkten (xk , yk ) minimal wird (Bild 3-41). Bei identischen Gewichtsfaktoren pk = 1 ergibt sich das Fehlermaß S (m) =
n
=
[ yk − mxk ]2
k=1
= dS = dm
n k=1 n
! y2k − 2mxk yk + (mxk )2 = Min , −2xk yk + 2mx2k = 0 .
k=1
Die Steigung ergibt sich zu n
m=
xk yk
k=1 n k=1
gung m
keine Veränderungen des qualitativen Verlaufs, so bewährt sich das Stammfunktionsverfahren zur Beschreibung des Einflusseffektes auf die Sensorkennlinie. Nach Bild 3-42a fungiert die Stammfunktion y0 = f (x1 , x20 ) bei konstanter Einflussgröße als Nennkennlinie. Bei veränderlicher Einflussgröße x2 wird beim Stammfunktionsverfahren das Ausgangssignal y abhängig von der Messgröße x1 y(x1 , x2 ) = c0 (x2 ) + [1 + c1 (x2 )]y0 (x1 , x20 ) +c2 (x2 )y20 (x1 , x20 ) + . . .
[ yk − f (m, xk )]2
k=1 n
Bild 3-41. Regressionsgerade durch Ursprung mit Stei-
. x2k
3.7.8 Korrektur von Einflusseffekten auf Sensorkennlinien
Ist der prinzipielle Verlauf einer Sensorkennlinie (Stammfunktion) bekannt und erfährt diese durch fertigungsbedingte Streuungen und Einflusseffekte
Die Funktionen c0 (x2 ), c1 (x2 ), c2 (x2 ), . . . beschreiben den Einflusseffekt und sind beim Nennwert x20 der Einflussgröße x2 gleich null. Beispiel: In Anlehnung an dieses Stammfunkti-
onsverfahren kann bei einem ausgeführten mikrorechnerorientierten Sensorsystem nach Bild 3-42b der Temperatureinfluss auf induktive Sensoren zur Messung von Weggrößen korrigiert werden. Die Weggröße steuert die Induktivität der Sensoren und damit die Frequenz eines LC-Oszillators, in dem die Sensoren betrieben werden. Die Einflussgröße Temperatur wird mit einem Silizium-Temperatursensor erfasst und steuert durch Veränderung des Widerstandes die Frequenz eines RC-Oszillators. Die beiden frequenzanalogen Ausgangssignale im MHz-Bereich (Messgröße) bzw. kHz-Bereich (Einflussgröße) werden zum Mikrorechnersystem übertragen. Dort wird sensorspezifisch die Kennlinie linearisiert und der Temperatureinfluss korrigiert. Auf diese Weise ist auch eine einfache Kalibrierung ohne Abgleichelemente möglich.
H51
H52
H Messtechnik
Bei einem ausgeführten rechnerkorrigierten Wegsensor ergaben sich gemäß Bild 3-42c bei einem Messbereich von 2,5 mm in einem Temperaturbereich von 25 bis 50 ◦ C Abweichungen vom Sollwert, deren Betrag 1 μm nicht überschritt. 3.7.9 Dynamische Korrektur von Sensoren
Mit geeigneten Algorithmen auf Mikrorechnern ist eine dynamische Korrektur von Sensoren möglich. Bei bekannten Systemparametern muss für die dynamische Korrektur linearer Systeme i. Allg. das Faltungsintegral ausgewertet werden (vgl. I 3.2.3). Mit den Bezeichnungen in Bild 3-43 wird die berechnete (rekonstruierte) Eingangsgröße zu x∗e (t)
"t =
xa (t − τ)g(τ) dτ = xa (t) ∗ g(t) . 0
Die Gewichtsfunktion g(t) ergibt sich dabei durch Laplace-Rücktransformation aus der reziproken Übertragungsfunktion 1/F(s) des Sensors: g(t) = L −1 [1/F(s)] . Einfacher wird die dynamische Korrektur, wenn sich der in der Differenzialgleichung enthaltene zeitliche Verlauf xe (t) der Eingangsgröße des Sensors explizit als Funktion der Ausgangsgröße xa (t) darstellen lässt. Bei vielen Sensoren ist dies der Fall. Sie verhalten sich in guter Näherung wie Verzögerungsglieder 1. oder 2. Ordnung. Für die Eingangsgröße xe (t) ergibt sich beim Verzögerungsglied 2. Ordnung ⎡ ⎤ 1 ⎢⎢⎢ 2ϑ 1 ⎥⎥⎥ x˙a + 2 x¨a ⎥⎦ . xe (t) = ⎢⎣ xa + k ω0 ω0 (ϑ Dämpfungsgrad, ω0 Kreisfrequenz der ungedämpften Eigenschwingung.)
Bild 3-42. Korrektur von Einflusseffekten. a Stammfunkti-
on und Einflusseffekt, b mikrorechnerorientiertes Sensorsystem, c Restfehler eines rechnerkorrigierten Wegsensors
Bild 3-43. Dynamische Korrektur durch Berechnung des
Faltungsintegrals
4 Messschaltungen und Messverstärker
Für ein Verzögerungsglied 1. Ordnung mit der Zeitkonstanten τ ist die Eingangsgröße xe (t) =
1 (xa + τ x˙a ) . k
Die Eingangsgröße xe (t) lässt sich also aus der Ausgangsgröße xa (t) und deren Ableitung(en) berechnen. Die Ausgangsgröße xa (t) wird dabei unter Verwendung mehrerer vorangegangener Abtastwerte approximiert. Auch hier erweisen sich bei Sensoren 2. Ordnung Spline-Polynome 3. Ordnung als vorteilhaft, da die 2. Ableitung der Ausgangsgröße xa (t) dann noch zumindest linear von der Zeit t abhängen kann.
4 Messschaltungen und Messverstärker Mit Messschaltungen und Messverstärkern werden analoge elektrische Signale verarbeitet, die entweder am Ausgang von Messgrößenaufnehmern für nichtelektrische Größen anfallen oder selbst elektrische Messgrößen darstellen.
4.1 Signalumformung mit verstärkerlosen Messschaltungen Mit verstärkerlosen Messschaltungen lassen sich analoge Messsignale proportional umformen oder gezielt verarbeiten. Bei der proportionalen Umformung wird entweder nur die Größe des Messsignals verändert, wie z. B. bei einem Spannungsteiler oder es wird die Art des Messsignals umgewandelt, wie z. B. bei der StromSpannungs-Umformung.
nicht nur möglichst exakt abgeglichen, sondern auch möglichst unabhängig sein vom Messstrom (Eigenerwärmung), von der Umgebungstemperatur (Fremderwärmung), von der Anschlusstechnik, von Alterungseffekten und von der Betriebsfrequenz. Daneben ist eine möglichst geringe Thermospannung gegen Kupfer und ein höherer spezifischer Widerstand erwünscht. Reine Metalle sind vorwiegend wegen ihres zu hohen Temperaturkoeffizienten von etwa 4 · 10−3 /K, teilweise auch wegen ihres zu geringen spezifischen Widerstandes für Messwiderstände ungeeignet. Bei geringeren Anforderungen verwendet man Kohleoder Metallschichtwiderstände; ebenso für hochohmige Messwiderstände, die gewendelt oder mäanderförmig ausgeführt werden. Eine Abgleichtoleranz und Langzeitstabilität von 0,5%, bestenfalls 0,1% wird dabei eingehalten. Widerstandswerte von ca. 10 Ω bis über 10 MΩ sind realisierbar. Bei höheren Anforderungen an die Genauigkeit und bei niederohmigen Widerständen sind Drähte oder Stäbe aus bestimmten Metalllegierungen üblich. Manganin (86 Cu, 12 Mn, 2 Ni; = 0,43 Ω · mm2 /m) ist gut bewährt. Gute Alternativen stellen die Legierungen Isaohm und Konstantan (54 Cu, 45 Ni, 1 Mn; = 0,5 Ω · mm2 /m) dar. Die Abhängigkeit des elektrischen Widerstandes dieser Legierungen von der Temperatur ist näherungsweise parabelförmig. Der Parabelscheitel liegt dabei gewöhnlich bei Temperaturen zwischen 30 ◦ C und 50 ◦ C (Bild 4-1). Der Betrag der relativen Widerstandsänderung liegt in dem Temperaturbereich von −20 bis +80 ◦ C im Mittel bei einigen 10−5 /K. In der Umgebung des Extremums sind die temperaturbedingten Widerstandsänderungen natürlich kleiner. Niederohmige Messwiderstände müssen in Vierleitertechnik ausgeführt werden, damit der Einfluss von
4.1.1 Strom-Spannungs-Umformung mit Messwiderstand
Die Aufgabe der linearen Umformung eines Messstromes I in eine Spannung U stellt sich bei der Darstellung des zeitlichen Verlaufs eines Stromes mithilfe eines Oszillografen, da dieser gewöhnlich nur Spannungseingänge besitzt. Die Güte der Umformung gemäß U = R · I hängt von der Präzision des Widerstandes R ab. Sein Wert soll
Bild 4-1. Typische Temperaturabhängigkeit von Legierungen für Präzisionswiderstände
H53
H54
H Messtechnik
Bild 4-2. Niederohmiger Messwiderstand in Vierleitertech-
nik
Übergangs- und Zuleitungswiderständen genügend klein gehalten werden kann. Nach Bild 4-2 fließt der Messstrom I durch die konstruktiv außen liegenden Stromklemmen, während an den innen angeordneten Spannungsklemmen (Potenzialklemmen) die Messspannung U abgegriffen wird. Der Messwiderstand R = U/I wird damit unabhängig von Übergangs- und Zuleitungswiderständen, die außerhalb der Potenzialklemmen wirksam sind. 4.1.2 Spannungsteiler und Stromteiler
Das Teilerverhältnis eines unbelasteten Spannungsteilers nach Bild 4-3 ist U2 R2 = U1 R1 + R2 R20 [1 + α2 (ϑ2 − ϑ0 )] , = R10 [1 + α1 (ϑ1 − ϑ0 )] + R20 [1 + α2 (ϑ2 − ϑ0 )] wobei die Temperaturabhängigkeit der beiden Teilerwiderstände explizit berücksichtigt wurde. Das Teilerverhältnis wird temperaturunabhängig gleich R20 /(R10 + R20 ), wenn α1 (ϑ1 − ϑ0 ) = α2 (ϑ2 − ϑ0 ), was bei gleichen Temperaturkoeffizienten α1 = α2 und gleichen Temperaturen ϑ1 = ϑ2 der Teilerwiderstände gegeben ist. Das Teilerverhältnis eines Stromteilers (Bild 4-3) ist R1 I2 = t= I1 R1 + R2
Bild 4-4. Einstellbarer Spannungsteiler und Ersatzschaltbild
Der als resistiver Weg- oder Winkelaufnehmer häufig verwendete einstellbare belastete Spannungsteiler (vgl. 3.2.1) nach Bild 4-4 verwendet ein lineares Präzisionspotenziometer mit dem Gesamtwiderstand R, das häufig als Mehrgangpotenziometer (z. B. für 10 volle Umdrehungen) ausgeführt ist. Das Teilerverhältnis U2 /U1 berechnet man mit dem Satz von der Zweipolquelle. Die Leerlaufspannung U1 und der Innenwiderstand Ri der Ersatzschaltung in Bild 4-4, sowie die der Original- und der Ersatzschaltung gemeinsame Ausgangsspannung U2 sind α α α U1 = U 1 , Ri = 1− R, α0 α0 α0 RL 1 U2 = U1 = U1 . Ri + RL 1 + Ri /RL Das Teilerverhältnis U2 /U1 hängt damit vom bezogenen Winkel α/α0 ab, bei Belastung aber auch vom Lastwiderstand RL : U2 = U1
1 α · . α0 R α α 1+ · 1− RL α0 α0
Diese Abhängigkeit ist in Bild 4-5 mit R/RL als Parameter aufgetragen.
und wird bei gleichen Temperaturen und Temperaturkoeffizienten der Teilerwiderstände ebenfalls temperaturunabhängig.
Bild 4-3. Spannungs- und Stromteiler
Bild 4-5. Teilerverhältnis U2 /U1 als Funktion des bezogenen Winkels α/α0 mit Lastwiderstand RL als Parameter
4 Messschaltungen und Messverstärker
Für α/α0 = 0 und für α/α0 = 1 ist der Innenwiderstand Ri = 0. Die Anfangs- und Endpunkte der Kennlinie sind deshalb unabhängig vom Lastwiderstand. Im Bereich 0 < α/α0 < 1 ergibt sich jedoch wegen des endlichen Lastwiderstands eine Durchbiegung der Kennlinie gegenüber dem unbelasteten Fall R/RL = 0. 4.1.3 Direktanzeigende Widerstandsmessung
Mit der in Bild 4-6 angegebenen Messschaltung können unbekannte Widerstände R im Bereich von ∞ bis 0 in eine Stromspanne von I = 0 bis I = I0 umgeformt werden. Mit dem Satz von der Ersatzspannungsquelle bezüglich der Klemmen A,B ergibt sich für den Strom R1 U0 U1 R1 + R = I= R1 R Ri + R0 + R0 R1 + R U0 . = R0 + (1 + R0 /R1 )R Vor der Messung wird für R = 0 der in Serie zum Messinstrument liegende Widerstand so eingestellt, dass Vollausschlag I = I0 angezeigt wird. Es ist dann R0 = U0 /I0 und der normierte Strom ist I = I0
1+
1
. 1 1 + R R0 R1
Widerständen R = R1/2 gerade halber Vollausschlag I = I0 /2 erreicht wird. 1 = 2
1+
1
1 1 + R1/2 R0 R1
oder
1 1 1 = − . R1 R1/2 R0
Da sich schwankende Versorgungsspannungen U0 auf R0 auswirken, ist die Bemessung von R1 nur für einen Wert von R0 möglich, der z. B. der mittleren Versorgungsspannung entsprechen kann. Bei konstanter Versorgungsspannung U0 , entsprechend eingestelltem Widerstand R0 und einem danach bemessenen Widerstand R1 ergibt sich für den normierten Strom (siehe Bild 4-6) I 1 = . I0 1 + R/R1/2 Der Vorteil dieses Verfahrens liegt in der nichtlinearen Transformation des Widerstandsbereiches 0 R < ∞ in den endlichen Strombereich 1 I/I0 > 0. Gegen R1/2 hochohmige bzw. niederohmige Widerstände lassen sich damit schnell erkennen. Nach diesem Schaltungsprinzip lassen sich Temperaturen mithilfe von Heißleitern (NTC-Widerstände) messen (siehe 3.5.2). Die Temperaturabhängigkeit des normierten Widerstandes eines Heißleiters lässt sich näherungsweise beschreiben durch 1 1 − Rϑ /R0 = exp B . ϑ ϑ0
Mit umschaltbaren Widerständen R1 sind verschiedene Strommessbereiche realisierbar. Die Bemessung der Widerstände R1 erfolgt so, dass bei bestimmten
Bild 4-6. Direktanzeigende Widerstandsmessung
Bild 4-7. Heißleiter-Thermometer. a Widerstands- und Stromverlauf, b Messschaltung
H55
H56
H Messtechnik
Eine Kennlinie für ϑ0 = 20 ◦ C und B = 3000 K ist in Bild 4-7a dargestellt. Betreibt man diesen Heißleiter in der Messschaltung von Bild 4-7b, so ist der normierte Strom I 1 = . U0 /R0 1 + Rϑ /R0 Der in Bild 4-7a eingetragene Stromverlauf besitzt einen Wendepunkt. In der Umgebung dieses Wendepunktes (etwa von −20 bis +50 ◦ C) ist die Empfindlichkeit dI/dϑ näherungsweise konstant.
4.2 Messbrücken und Kompensatoren 4.2.1 Qualitative Behandlung der Prinzipschaltungen
Kompensationsschaltungen zur Spannungs-, Stromoder Widerstandsmessung enthalten eine Spannungsquelle, mindestens zwei Widerstände zur Spannungsbzw. Stromteilung und ein Spannungs- bzw. Strommessinstrument, das bei Teilkompensation im Ausschlagverfahren, bei vollständiger Kompensation als Nullindikator betrieben wird (Bild 4-8). Teilkompensation oder vollständige Kompensation wird bei diesen mit Gleichspannung betriebenen Schaltungen durch geeignete Einstellung eines Widerstandes, z. B. des Widerstandes R1 , erzielt. In der Kompensationsschaltung nach Bild 4-8a kann eine unbekannte Spannung Ux durch die am Widerstand R2 anliegende Spannung UK kompensiert werden.
In der Kompensationsschaltung nach Bild 4-8b wird ein unbekannter Strom Ix kompensiert, indem Spannungsgleichheit an dem von (I0 − Ix ) durchflossenen Widerstand R2 und an dem von Ix durchflossenen Widerstand R4 erreicht wird. Schließlich wird in der Kompensationsschaltung nach Bild 4-8c – einer Wheatstone-Brücke – ein unbekannter Widerstand Rx dadurch bestimmt, dass die Spannung an Rx durch die Spannung UK an R2 kompensiert wird. Eine Wheatstone-Brücke kann man sich also entstanden denken aus zwei Spannungsteilern, die durch die gleiche Quelle gespeist werden und deren Teilspannungen miteinander verglichen werden. 4.2.2 Spannungs- und Stromkompensation
Bei vollständiger Spannungskompensation (U = 0) nach Bild 4-8a wird die Leerlaufspannung Ux der Messspannungsquelle belastungsfrei gemessen und ist R2 U0 . Ux = R1 + R2 Mit der in Bild 4-8b dargestellten Schaltung kann ein unbekannter Strom Ix rückwirkungsfrei kompensiert werden. Dazu wird der Widerstand R1 verändert, bis die Spannung U am Nullindikator (und damit auch der Strom durch den Nullindikator) zu null wird. Im abgeglichenen Zustand (U = 0) ist (I0 − Ix )R2 = UK = IK R4 . Der Strom ist damit Ix = I0
R2 . R2 + R4
4.2.3 Messbrücken im Ausschlagverfahren (Teilkompensation) Unterschiedliche Darstellungsmöglichkeiten von Messbrücken
Bild 4-8. Kompensationsschaltungen zur a Spannungsmes-
sung (Ux ), b Strommessung (Ix ), c Widerstandsmessung (Rx )
Die in Bild 4-8c angegebene Prinzipschaltung einer Messbrücke lässt sich auf unterschiedliche Weise darstellen. Die in Bild 4-9 angegebenen 6 Varianten a bis f sind funktionsgleich. Ausgehend von der Originalschaltung mit außenliegender Spannungsquelle in (a) ist in Schaltung (d) die
4 Messschaltungen und Messverstärker
Bild 4-10. Normierte Leerlauf-Ausgangsspannung U1 /U0
als Funktion von Rx /R0
Die spezielle Messschaltung und ihre Kennlinie sind in Bild 4-10 dargestellt. Die normierte Empfindlichkeit ist Bild 4-9. Varianten der Prinzipschaltung einer Messbrücke
Spannungsquelle nach innen verlegt und die Brückenausgangsspannung kann außen abgegriffen werden; Variante (e) lässt erkennen, warum die Brückenausgangsspannung auch als Brückendiagonalspannung bezeichnet wird. Variante (f ) bietet aufgrund der dreidimensionalen Darstellung einen besonders guten Einblick in den Aufbau der Schaltung. Brückenspeisung mit konstanter Spannung
Bei Teilkompensation kann aus der Brückenausgangsspannung nach Bild 4-9 einer der Brückenwiderstände bestimmt werden, wenn die Speisespannung U0 und die drei anderen Widerstände bekannt sind. Bei diesem Ausschlagverfahren ist die Ausgangsspannung U1 im Leerlauf U1 =
E=
−1 d(U1 /U0 ) = . d(Rx /R0 ) (1 + Rx /R0 )2
Die Empfindlichkeit bei Rx /R0 = 0 ist 4-mal so groß wie bei Rx /R0 = 1. Typisch für Brückenschaltungen dieser Art ist ihre nichtlineare Kennlinie. Bei Belastung der Brückendiagonalen mit dem endlichen Widerstand R5 berechnet man die Ausgangsspannung U an den Klemmen A,B am besten mit dem Satz von der Zweipolquelle (Bild 4-11). Die Leerlaufspannung U1 (ohne R5 !) ist bereits bestimmt, den Innenwiderstand R1 berechnet man, indem man die starre Spannungsquelle durch einen Kurzschluss ersetzt, zu Ri =
R1 R2 R3 R4 + . R1 + R2 R3 + R4
R3 R1 − U0 . R3 + R4 R1 + R2
Für den Spezialfall R1 = R2 = R3 = R0 und R4 = Rx ist die normierte Ausgangsspannung 1 1 U1 = − . U0 1 + Rx /R0 2
Bild 4-11. Mit konstanter Spannung gespeiste und am
Ausgang belastete Brückenschaltung. a Originalschaltung, b Ersatzschaltung
H57
H58
H Messtechnik
U1 (R0 + ΔR)2 − R20 ΔR = . = I0 2(2R0 + ΔR) 2
Nach Zwischenrechnung ergibt sich die Ausgangsspannung U=
R5 U1 , R5 + Ri
R2 R3 − R1 R4 U = U0 (R1 + R2 )(R3 + R4 ) + [R1 R2 (R3 + R4 ) + R3 R4 (R1 + R2 )]/R5 Brückenspeisung mit konstantem Strom
Bei Speisung der Brückenschaltung nach Bild 4-12a mit konstantem Strom I0 ergibt sich für die Spannung an der Brücke U 0 = I0
(R1 + R2 )(R3 + R4 ) . R1 + R2 + R3 + R4
Die Leerlauf-Ausgangsspannung U1 ist wie bei der spannungsgespeisten Brücke R3 R1 U1 = − U0 . R3 + R4 R1 + R2
Mit zwei gleichen Platin-Widerstandsthermometern, die die Brückenwiderstände R2 = R3 = R0 [1 + α(ϑ − ϑ0 )] bilden (Bild 4-12a), ist also eine lineare Temperaturmessung möglich gemäß U1 ΔR 1 = α(ϑ − ϑ0 )R0 . = I0 2 2 Bei belasteter Brückendiagonale benötigt man außer der bereits berechneten Leerlaufspannung U1 den Innenwiderstand, der
Damit ist die Leerlauf-Ausgangsspannung U1 bei Stromspeisung U1 =
R2 R3 − R1 R4 I0 . R1 + R2 + R3 + R4
Für den Spezialfall R1 = R4 = R0 und R2 = R3 = R0 + ΔR ist die auf den Speisestrom I0 bezogene LeerlaufAusgangsspannung
Ri =
(R1 + R3 )(R2 + R4 ) R1 + R2 + R3 + R4
ist, da die Stromquelle für die Bestimmung des Innenwiderstandes durch eine Unterbrechung ersetzt werden muss. Die Ausgangsspannung bei Belastung mit R5 beträgt damit U=
R5 U1 , R5 + Ri
R2 R3 − R1 R4 U = . I0 (R1 + R2 + R3 + R4 ) + (R1 + R3 )(R2 + R4 )/R5 4.2.4 Wheatstone-Brücke im Abgleichverfahren
Bild 4-12. Mit konstantem Strom gespeiste Brückenschaltung. a Im Leerlauf, b mit Lastwiderstand R5 am Ausgang, c Ersatzschaltung
Da ein Handabgleich von Messbrücken in Mess- und Automatisierungssystemen kaum mehr praktikabel ist, sind die heute verwendeten Abgleichverfahren entweder auf den Einsatz von Verstärkern, die in geeigneter Weise den Abgleich herbeiführen, oder aber auf den Laborbereich beschränkt, der in vielen Fällen an die Dynamik der Messungen keine höheren Anforderungen stellt. Bei vollständigem Abgleich wird die Brückenausgangsspannung U nach Bild 4-13a zu null und die zugehörige Abgleichbedingung lautet
4 Messschaltungen und Messverstärker
Toleranz-Messbrücke (Bild 4-13c)
Die Abweichungen unbekannter Widerstände Rx von ihrem Sollwert R3 können aus dem Einstellwinkel α des zum Abgleich benötigten linearen Potenziometers mit dem Gesamtwiderstand R2v ermittelt werden. Allgemein gilt Rx R20 + (α/α0 )R2v = . R3 R1 Mit α = 0 für Rx = R3 − ΔR und α = α0 für Rx = R3 + ΔR ergibt sich Bild 4-13. Wheatstone’sche Brücken im Abgleichverfah-
ren. a Prinzip, b Schleifdraht-Messbrücken, c ToleranzMessbrücke
R1 R3 = . R2 R4 Um den Abgleich möglichst genau durchführen zu können, ist außer einem hohen Brückenspeisestrom I0 eine hohe Empfindlichkeit des Nullindikators notwendig. Der Brückenspeisestrom kann jedoch wegen der Verlustleistung nicht beliebig hoch sein. Die Eigenerwärmung würde zu Widerstandsänderungen und damit zu Messfehlern führen. Die hohe Empfindlichkeit des Nullindikators wiederum wird am besten durch einen sog. nullpunktsicheren Verstärker erreicht. Schleifdraht-Messbrücke
Bei der sog. Schleifdraht-Messbrücke nach Bild 4-13b sind die Widerstände R1 und R2 durch einen möglichst homogenen Widerstandsdraht konstanten Querschnitts ersetzt. Die den Längen l1 und l2 proportionalen Widerstände R1 und R2 sind durch die Stellung des Schleifkontaktes gegeben. Die Abgleichbedingung lautet R3 /R4 = l1 /l2 . Der Schleifdraht wird gewöhnlich als Schleifdrahtwendel auf einer Walze in mehreren Windungen aufgebracht. Bei geringeren Anforderungen ist auch ein Schleifdrahtring geeignet. Für didaktische Zwecke wird gerne ein gestreckter Schleifdraht von 1 m Länge verwendet.
R3 − ΔR R20 = , R3 R1
R3 + ΔR R20 + R2v = . R3 R1
Bei gegebenen Werten von R3 , ΔR und R2v sind die Widerstände R1 =
R2v R3 , 2ΔR
R20 =
R2v (R3 − ΔR) . 2ΔR
Der Fehler Rx − R3 des unbekannten Widerstandes Rx ist damit Rx − R3 = ΔR(2α/α0 − 1) , er ist linear vom Einstellwinkel α abhängig. 4.2.5 Wechselstrombrücken Prinzip und Abgleichbedingungen
Wechselstrommessbrücken können zur Messung von Kapazitäten, Induktivitäten und deren Verlustwiderständen sowie ganz allgemein zur Messung komplexer Widerstände eingesetzt werden. Der grundsätzliche Aufbau einer Wechselstrombrücke (Bild 4-14a) besteht aus einer (meist niederfrequenten) Wechselspannungsquelle, aus einem Nullindikator (mit selektivem Verstärker) und aus den vier komplexen Widerständen Z 1 bis Z 4 . Wie bei den Gleichstrom-Messbrücken ergibt sich die Abgleichbedingung (U = 0) aus dem Verhältnis der entsprechenden Widerstände. Bei Wechselstrombrücken handelt es sich um die komplexe Gleichung Z Z1 = 3 . Z2 Z 4
H59
H60
H Messtechnik
1 R1 R4 jωC2 = . 1 Rx + jωLx R2 + jωC2 Daraus ergibt sich R2
Rx =
R1 R4 , R2
Lx = R1 R4C2 .
4.3 Grundschaltungen von Messverstärkern
Bild 4-14. Wechselstrom-Messbrücken. a Prinzipieller Auf-
bau, b Kapazitäts-Messbrücke, c Induktivitäts-Messbrücke
Mit Z i = |Z i |e jϕi resultieren die beiden reellen Abgleichbedingungen
Mit hochverstärkenden Operationsverstärkern lassen sich durch Substraktion einer dem Ausgangssignal proportionalen Größe vom Eingangssignal (Gegenkopplung) lineare Messverstärker mit konstanter Übersetzung realisieren. 4.3.1 Operationsverstärker
Kapazitäts- und Induktivitätsbrücken
In der Mess- und Automatisierungstechnik ist es häufig notwendig, kleine elektrische Spannungen oder Ströme zu verstärken. Eine Besonderheit dabei ist, dass Gleichgrößen und auch Differenzen von Gleichgrößen verstärkt werden müssen. Als Grundbausteine für derartige Messverstärker eignen sich sog. Operationsverstärker, die im Wesentlichen aus Widerständen und Transistoren aufgebaut sind und als analoge integrierte Schaltungen (sog. lineare ICs) verfügbar sind (Bild 4-15), vgl. G 8.2.2.
Eine Kapazitätsmessbrücke (nach Wien) ist im einfachsten Fall symmetrisch aufgebaut (Bild 4-14b). Aus der Abgleichbedingung
4.3.2 Anwendung von Operationsverstärkern als reine Nullverstärker
|Z | |Z 1 | = 3 |Z 2 | |Z 4 |
und ϕ1 + ϕ4 = ϕ2 + ϕ3 .
Für den Brückenabgleich werden im Allgemeinen zwei Einstellelemente benötigt. Ein Abgleich ist nur möglich, wenn die Summe der Phasenwinkel der beiden jeweils schräg gegenüberliegenden komplexen Widerstände gleich ist.
R2 + 1/( jωC2 ) Rx + 1/( jωCx ) = R1 R3
Da die Grundverstärkung v eines unbeschalteten Operationsverstärkers endlich ist und, z. B. aufgrund
ergibt sich sofort Rx = R2
R3 , R1
Cx = C2
R1 . R3
Ähnlich lassen sich entsprechende Parallelverlustwiderstände Rxp aus R2p bestimmen. Bei einer Induktivitätsmessbrücke (nach Maxwell und Wien) verwendet man bevorzugt Vergleichskapazitäten (Bild 4-14c), da sie einfacher und genauer herstellbar sind als Induktivitäten. Die Abgleichbedingung ist
Bild 4-15. Innenschaltung eines Operationsverstärkers (TBB 741, Siemens)
4 Messschaltungen und Messverstärker
von Temperaturänderungen, starken Schwankungen unterliegen kann, eignen sich Operationsverstärker grundsätzlich nur als Nullverstärker. Die Anwendung als Vergleicher (Komparator) ist sofort verständlich, da bei positiver bzw. negativer Übersteuerung die Ausgangsspannung angenähert die positive bzw. negative Versorgungsspannung erreicht. Auf diese Weise lässt sich leicht ein Grenzwertschalter aufbauen, dessen Ausgangssignal beim Über- oder Unterschreiten eines bestimmten Sollwertes den einen oder den anderen Pegel (logischen Zustand) annimmt. Nach Bild 4-16 kann mithilfe eines Operationsverstärkers auch ein automatischer (motorischer) Abgleich einer Kompensations- oder einer Brückenschaltung durchgeführt werden. Der Nullindikator zur Anzeige der Differenzspannung und der Mensch als Regler (a) werden dabei durch einen Operationsverstärker und einen Messmotor ersetzt (b), der den Abgriff des Potenziometers so lange verstellt, bis die Differenzspannung angenähert zu null geworden ist.
In ähnlicher Weise können Operationsverstärker zum automatischen Abgleich von Messbrücken eingesetzt werden (c). Die Stellung des Abgriffs am Potenziometer ist dabei ein Maß entweder für die unbekannte Spannung Ux (b) oder für den unbekannten Widerstand Rx (c), der wiederum zur Messung von Temperaturen als Widerstandsthermometer ausgeführt sein kann. Nach diesem Prinzip werden Kompensationsanzeiger, besonders aber Kompensationsschreiber aufgebaut, bei denen die Stellung des Abgriffes am Potenziometer auf einem mit konstanter Geschwindigkeit vorbeigezogenen Registrierpapier aufgezeichnet wird. Eine wichtige Anwendung von Operationsverstärkern besteht jedoch im Aufbau automatischer Kompensationsschaltungen (ohne Stellmotor). Durch Gegenkopplung lassen sich damit lineare Messverstärker mit konstanter Übersetzung realisieren. 4.3.3 Das Prinzip der Gegenkopplung am Beispiel des reinen Spannungsverstärkers
Ein auf Gegenkopplung beruhender Messverstärker mit Spannungseingang und Spannungsausgang besteht nach Bild 4-17 aus dem als rückwirkungsfrei (Re → ∞, Ra = 0) betrachteten Operationsverstärker mit der Grundverstärkung v = U2 /Ust und einem als Gegenkopplungsnetzwerk wirkenden Spannungsteiler mit dem Teilerverhältnis G = R2 /(R1 + R2 ). Der Operationsverstärker im Vorwärtszweig mit der Grundverstärkung v vergrößert die Ausgangsspannung U2 = vUst so lange, bis die vom Gegenkopplungsnetzwerk zurückgeführte Spannung R2 U2 R1 + R2
Bild 4-16. Operationsverstärker als Nullverstärker. a Hand-
abgleich einer Kompensationsschaltung, b motorischer Abgleich einer Kompensationsschaltung, c motorischer Abgleich einer Brückenschaltung, d Prinzip des Kompensationsschreibers (Siemens)
Bild 4-17. Gegenkopplung beim reinen Spannungsverstär-
ker
H61
H62
H Messtechnik
angenähert gleich der zu verstärkenden Eingangsspannung U1 geworden ist. Da die gegengekoppelte Spannung der Eingangsspannung entgegengeschaltet ist, verbleibt am Eingang des Operationsverstärkers nur die kleine Steuerspannung Ust = U2 /v Ust = U1 −
R2 U2 . U2 = R1 + R2 v
Die Übersetzung G = U2 /U1 des reinen Spannungsverstärkers ist damit G=
U2 = U1
1 . R2 1 + R1 + R2 v
Unter der Annahme eines idealen Operationsverstärkers mit sehr hoher Grundverstärkung v v
R1 + R2 R2
ist die ideale Übersetzung Gid =
U 2 R1 + R2 = . U1 R2
4.3.4 Die vier Grundschaltungen gegengekoppelter Messverstärker
Jede der vier Grundschaltungen für gegengekoppelte Messverstärker enthält im Vorwärtszweig einen, hier als ideal betrachteten Operationsverstärker. In der Rückführung liegt ein Gegenkopplungsnetzwerk aus einem oder aus zwei Widerständen, das die Spannung (den Strom) am Ausgang in eine proportionale Spannung (einen proportionalen Strom) umformt, die (der) der (dem) zu verstärkenden Eingangsspannung (Eingangsstrom) entgegengeschaltet wird (Bild 4-18). Schaltung (a) ist bereits erklärt. Die ideale Übersetzung übergab sich zu Gid =
U 2 R1 + R2 = . U1 R2
In Schaltung (b) fließt bei Vernachlässigung des Steuerstromes am Eingang des Operationsverstärkers der Ausgangsstrom I2 durch den Gegenkopplungswiderstand R und erzeugt an diesem die Spannung I2 R. Bei Vernachlässigung der Steuerspannung des Operationsverstärkers wird die gegengekoppelte
Bild 4-18. Grundschaltungen gegengekoppelter Messverstärker. a Reiner Spannungsverstärker, b Spannungsverstärker mit Stromausgang, c reiner Stromverstärker, d Stromverstärker mit Spannungsausgang
Spannung I2 R gleich der Eingangsspannung U1 . Deshalb ist die ideale Übersetzung Gid =
I2 1 = . U1 R
In Schaltung (c) fließt bei Vernachlässigung des Steuerstromes am Eingang des Operationsverstärkers der Eingangsstrom I1 durch den Widerstand R1 und erzeugt an diesem die Spannung I1 R1 . Durch den Widerstand R2 fließt der Differenzstrom I2 − I1 und bewirkt am Widerstand die Spannung (I2 − I1 )R2 . Bei Vernachlässigung der Steuerspannung des Operationsverstärkers sind die Spannungen an den beiden Widerständen gleich groß. Daraus ergibt sich die ideale Übersetzung zu Gid =
I2 R1 + R2 = . I1 R2
In Schaltung (d) fließt bei Vernachlässigung des Steuerstromes am Eingang des Operationsverstärkers der Eingangsstrom I1 durch den Widerstand R und bewirkt an diesem die Spannung I1 R. Bei Vernachlässigung der Steuerspannung des Operationsverstärkers ist diese Spannung I1 R gleich der Ausgangsspannung U2 . Die ideale Übersetzung ist also U2 =R. Gid = I1
4 Messschaltungen und Messverstärker
4.4 Ausgewählte Messverstärker-Schaltungen 4.4.1 Vom Stromverstärker mit Spannungsausgang zum Invertierer
Der Stromverstärker mit Spannungsausgang in Bild 4-19a besitzt im Idealfall die Übersetzung Gid =
U2 = R2 . I1
Der Eingangswiderstand RE geht bei genügend hoher Grundverstärkung v wegen Ust → 0 gegen 0. Schaltet man nun – wie in Bild 4-19b gezeigt – in Serie zum invertierenden Eingang einen Widerstand R1 , so entsteht ein Invertierer (Umkehrverstärker; der Name rührt daher, dass die auf Masse bezogene Ausgangsspannung das entgegengesetzte Vorzeichen trägt wie die auf Masse bezogene Eingangsspannung). Der Eingangsstrom I1 wird in eine proportionale Eingangsspannung U1 = I1 R1 umgeformt, und der Invertierer hat die Übersetzung Gid =
U2 U2 R2 = = . U1 I1 R1 R1
Der Eingangswiderstand beträgt in diesem Fall RE = U1 /I1 = R1 und ist also keineswegs besonders hochohmig, wie dies beim nichtinvertierenden reinen Spannungsverstärker der Fall ist. Wegen der einfachen Programmierbarkeit der Übersetzung wird diese Verstärkerschaltung jedoch gerne verwendet. Ein lineares Ohmmeter entsteht, wenn die Eingangsspannung U1 konstant gehalten wird und der Gegenkopplungswiderstand R2 durch den zu messenden Wi-
derstand Rx ersetzt wird. Die Ausgangsspannung U2 ist dem Widerstand Rx proportional und beträgt U2 =
U1 Rx . R1
Der Serienwiderstand R1 am Eingang kann zur Messbereichsumschaltung verwendet werden. Beträgt beispielsweise die Spannung U1 = 1 V und soll die Ausgangsspannung U2 im Bereich von 0 bis 1 V liegen, so ist für einen Messbereich von Rx = (0 . . . 1) kΩ ein Widerstand R1 = 1 kΩ erforderlich und der Messstrom beträgt I1 = 1 mA. Für einen Messbereich von Rx = (0 . . . 1) MΩ muss R1 = 1 MΩ gewählt werden, und der Messstrom ist I1 = 1 μA. 4.4.2 Aktive Brückenschaltung
Ein Beispiel möge verdeutlichen, wie Operationsverstärker mit Vorteil in Brückenschaltungen eingesetzt werden können. Bei der aktiven Brückenschaltung in Bild 4-20 erzwingt der Operationsverstärker in der Brückendiagonalen die Spannung null, indem er im Zweig des veränderlichen Widerstandes Rx eine Spannung Ux mit umgekehrter Polarität (für Rx > R) addiert. Diese Spannung Ux muss zusammen mit der Spannung an Rx gerade die halbe Versorgungsspannung der Brückenschaltung U0 /2 ergeben. Da der Strom im Widerstand Rx identisch mit dem Strom U0 /2R in jeder der beiden Brückenhälften sein muss, ist die Spannung U0 U0 Rx − . Ux = 2R 2 Mit Rx = R + ΔR ergibt sich $ 1 ΔR U x 1 # Rx −1 = · . = U0 2 R 2 R
Bild 4-19. a Stromverstärker mit Spannungsausgang, b Invertierer (Umkehrverstärker)
Bild 4-20. Aktive Brückenschaltung
H63
H64
H Messtechnik
Die Spannung Ux ist der Widerstandsänderung ΔR direkt proportional.
an dessen Plus-Eingang ein Spannungsteiler, bestehend aus den Widerständen R3 und R4 vorgeschaltet ist. Man erhält
4.4.3 Addier- und Subtrahierverstärker
Die Addition nach Bild 4-21a beruht auf der Addition der drei Ströme I1 , I2 und I3 am Knotenpunkt K zum Gesamtstrom I = I1 + I2 + I3 , der vom nachfolgenden Stromverstärker mit Spannungsausgang um den Faktor R verstärkt wird, der dem Gegenkopplungswiderstand entspricht. Da der Eingangswiderstand RE am Stromverstärker mit Spannungsausgang wegen der Gegenkopplung gegen null geht, berechnet sich die Ausgangsspannung zu U4 = IR =
R R R U1 + U2 + U3 . R1 R2 R3
Wählt man alle Widerstände gleich, so ist die Ausgangsspannung U4 direkt die Summe der Eingangsspannungen. Beim Subtrahierverstärker nach Bild 4-21b berechnet man die Ausgangsspannung U3 am besten durch Superposition der beiden Spannungen U31 und U32 , die sich ergeben, wenn U2 = 0 bzw. wenn U1 = 0 gesetzt wird. Für U2 = 0 handelt es sich um einen Invertierer, und es ergibt sich U31 = −
R2 U1 , R1
wenn U2 = 0 .
Für U1 = 0 entsteht ein nichtinvertierender Verstärker mit den Gegenkopplungswiderständen R1 und R2 ,
U32 =
R4 R1 + R2 · U2 , R3 + R4 R1
wenn U1 = 0 .
Durch Superposition berechnet man die Ausgangsspannung zu U3 = U31 + U32 =
R4 R1 + R2 R2 · U2 − U1 . R3 + R4 R1 R1
Wählt man alle Widerstände gleich groß, so ergibt sich die Ausgangsspannung direkt aus der Differenz U3 = U2 − U1 . 4.4.4 Der Elektrometerverstärker (Instrumentation Amplifier)
Wird ein besonders hochohmiger Eingangswiderstand benötigt, so wurde dies früher mit Elektrometerröhren im Eingangskreis erreicht. Aus drei Operationsverstärkern aufgebaute Messverstärker mit besonders hohem Differenz-Eingangswiderstand werden deshalb noch heute gerne als Elektrometerverstärker bezeichnet (Bild 4-22). Sind die Grundverstärkungen der verwendeten Operationsverstärker genügend hoch und deshalb die erforderlichen Steuerspannungen genügend klein, so wird die Differenz-Eingangsspannung U2 − U1 gleich der von der Ausgangsspannung Ua heruntergeteilten Spannung am Widerstand R2 : U2 − U1 =
R2 Ua . R2 + 2R1
Bild 4-22. Elektrometerverstärker (Instrumentation AmpliBild 4-21. a Addierverstärker, b Subtrahierverstärker
fier)
4 Messschaltungen und Messverstärker
Der nachgeschaltete Subtrahierer erzeugt lediglich eine der Spannung Ua proportionale, geerdete Ausgangsspannung U3 =
R4 Ua . R3
Die Übersetzung des Elektrometerverstärkers beträgt also U3 R4 2R1 = Gid = 1+ . U 2 − U 1 R3 R2 Ein solcher „Instrumentierungsverstärker“ ist z. B. bei der induktiven Durchflussmessung (siehe 3.4.3) sehr gut zur Messung der induzierten Spannung geeignet, da bei Flüssigkeiten mit geringer Leitfähigkeit der hohe Quellenwiderstand einen sehr hohen Eingangswiderstand des Messverstärkers erfordert. 4.4.5 Präzisionsgleichrichtung
Legt man nach Bild 4-23 an den Ausgang eines mit dem Widerstand R gegengekoppelten Spannungsverstärkers mit Stromausgang eine Diodenbrücke, die ein Drehspulmesswerk speist, so fließt durch dieses Anzeigeinstrument der gleichgerichtete Ausgangsstrom |I2 | = |U1 |/R. Die Eingangsspannung U1 wird also exakt gleichgerichtet. Den Spannungsbedarf der Dioden deckt der Operationsverstärker. Das Anzeigeinstrument hat keinen eindeutigen Bezug zum Massepotenzial; es liegt auf „schwebendem“ (floating) Potenzial, man spricht auch von einer Schwebespannung. Der Eingangswiderstand ist wegen der gewählten Gegenkopplungsschaltung sehr hochohmig. Als Tiefpassfilter fungiert das Anzeigeinstrument.
frequenzabhängige Bauelemente enthalten, die mithilfe von Operationsverstärkern rückwirkungsfrei bezüglich des Ein- und des Ausgangs betrieben werden können. Induktivitäten erheblicher Baugröße und mit nichtidealem Verhalten können vermieden werden. Hier soll nur das Prinzip aktiver Filter dargestellt werden. Ersetzt man nach Bild 4-24a den Gegenkopplungswiderstand beim Stromverstärker mit Spannungsausgang durch einen komplexen Widerstand Z 2 , so ist die komplexe Übersetzung G = U 2 /I 1 = Z 2 . Legt man in Serie zum Eingang einen weiteren komplexen Widerstand Z 1 , so resultiert daraus ein Eingangsstrom I 1 = U 1 /Z 1 . Mit der Eingangsspannung U 1 ergibt sich der Frequenzgang G( jω) des so entstandenen aktiven Filters G( jω) =
U 2 Z2 = . U 1 Z1
Beim aktiven Tiefpassfilter 1. Ordnung nach Bild 4-24b ist Z 1 durch den Widerstand R1 ersetzt und Z 2 durch die Parallelschaltung eines Widerstandes R2 und einer Kapazität C. Der Frequenzgang G( jω) dieses aktiven Tiefpassfilters ist U R2 1 . · G( jω) = 2 = U 1 R1 (1 + jωR2 C) Es besitzt die gleiche Frequenzabhängigkeit wie ein R2 C-Glied, hat aber bei niedrigen Frequenzen die Spannungsverstärkung R2 /R1 . Der Eingangswider-
4.4.6 Aktive Filter
Aktive Filter bestehen aus frequenzabhängigen Netzwerken, die Widerstände, Kapazitäten oder andere
Bild 4-23. Präzisionsgleichrichtung
Bild 4-24. Aktive Filter. a Mit den komplexen Widerständen Z 1 und Z 2 , b aktives Tiefpassfilter 1. Ordnung
H65
H66
H Messtechnik
stand ist konstant RE = R1 , der Ausgangswiderstand geht gegen RA = 0. Der Amplitudengang ist R2 1 · R1 1 + (ωR2C)2 R2 1 = · . R1 1 + (ω/ωg )2
|G( jω)| =
Er ist bei der Grenzkreisfrequenz ωg = 1/R2C auf √ 1/ 2 des Wertes bei ω = 0 abgesunken und geht für hohe Kreisfrequenzen gegen null. Die Phasenverschiebung ist bei niedrigen Frequenzen null, bei der Grenzfrequenz −45◦ und geht bei hohen Frequenzen gegen −90◦. Wegen des Tiefpasscharakters eignet sich dieses aktive RC-Filter zur Mittelwertbildung eines Eingangssignals u1 (t). Die hochfrequenten Signalanteile werden wegen ω ωg unterdrückt, und der langsam veränderliche Mittelwert wird am Ausgang ausgegeben. Bild 4-25. a Ladungsverstärker, b Integrationsverstärker,
4.4.7 Ladungsverstärker
Verlustarme Kapazitäten eignen sich vorzüglich zur (zeitlichen) Integration von Strömen. Die Spannung u(t) an einer Kapazität C ist 1 1 u(t) = q(t) = C C
"t i(τ) dτ . 0
Um diesen Zusammenhang zur Integration anwenden zu können, muss Rückwirkungsfreiheit zwischen dem Eingangsstrom i1 (t) und dem Strom i(t) durch den Kondensator sowie zwischen der Ausgangsspannung u2 (t) und der Spannung u(t) am Kondensator gewährleistet sein. Dies geschieht nach Bild 4-25a durch einen Stromverstärker mit Spannungsausgang, bei dem der Gegenkopplungswiderstand durch die Kapazität C ersetzt ist. Bei vernachlässigbarem Steuerstrom ist und vernachlässigbarer Steuerspannung ust ergibt sich wegen i1 (t) = i(t) und u2 (t) = u(t): 1 u2 (t) = C
"t i1 (τ) dτ =
1 q(t) . C
0
Die Ausgangsspannung u2 (t) ist also proportional dem Integral des Eingangsstroms i1 (t) und damit
c Erzeugung einer Sägezahnspannung, d Einfluss von Nullpunktfehlergrößen
proportional der Ladung q(t). Man bezeichnet diese Schaltung deshalb auch als Ladungsverstärker, obwohl nicht etwa die Ladung, sondern die am Ausgang verfügbare Leistung verstärkt wird. Der Eingangswiderstand beträgt im Idealfall RE = 0 und der Ausgangswiderstand RA = 0. 4.4.8 Integrationsverstärker für Spannungen
Zur Integration von Spannungen u1 (t) wird beim Ladungsverstärker am Eingang ein Widerstand R in Serie geschaltet, und es ergibt sich ein Integrationsverstärker für Spannungen nach Bild 4-25b. Mit u1 (t) = Ri1 (t) beträgt die Ausgangsspannung 1 u2 (t) = RC
"t u1 (τ) dτ (+U20 ) . 0
Integrationsverstärker werden zur Integration unbekannter Spannungsverläufe verwendet, wie z. B. zur Bestimmung der Flächenanteile des von einem Gaschromatografen gelieferten Messsignals, um daraus auf die verschiedenen Gaskonzentrationen
5 Analoge Messtechnik
schließen zu können. Andere typische Integrationsaufgaben sind die Bestimmung des magnetischen Flusses durch Integration der induzierten Spannung, die Bestimmung der Arbeit aus der Momentanleistung oder die Bestimmung von Geschwindigkeit und Weg aus der Beschleunigung (Trägheitsnavigation). Integrationsverstärker werden aber auch zur gezielten Erzeugung bestimmter Signalverläufe eingesetzt. Durch periodisch wiederholte Integration einer konstanten Eingangsspannung erhält man eine linear ansteigende Ausgangsspannung, die die Form einer Rampe besitzt und auch als Sägezahnspannung bezeichnet wird (Bild 4-25c). Integrationsverstärker werden auch in AnalogDigital-Umsetzern zur Erzeugung von Zeiten oder Frequenzen als Zwischengrößen eingesetzt, die dann leicht digitalisiert werden können. Ein Problem sind bei Integrationsverstärkern die Nullpunktfehlergrößen, die auch beim Eingangssignal Null eine Hochintegration der Ausgangsspannung bis zur Begrenzung durch eine der beiden Speisespannungen bewirken können, wenn keine geeigneten Gegenmaßnahmen getroffen werden. Mit der Nullpunktfehlerspannung U0 und dem Nullpunktfehlerstrom I01 nach Bild 4-25d ergibt sich die Ausgangsspannung u2 (t) =
1 RC
"t u1 (τ) dτ + 0
1 − RC
1 C
"t I01 dτ 0
"t U0 dτ (+U20 ) . 0
Besonders störend ist der Anstieg der Ausgangsspannung aufgrund des Integralanteils 1 C
"t
Parallelwiderstand zur Kapazität dafür gesorgt werden, dass die durch Nullpunktfehler bedingten, extrem langsamen Aufladungen der Integrationskapazität durch mindestens ebenso große Entladeströme ausgeglichen werden.
5 Analoge Messtechnik Analoges Messen ist immer dann zweckmäßig, wenn der Mensch in einen technischen Prozess eingebunden ist. Dies ist z. B. bei Abgleichvorgängen oder Arbeitspunkteinstellungen im Labor der Fall oder bei Nachlaufregelungen im Zusammenhang mit Fahrzeugen oder bei der optischen Überwachung von Prozessen in einer Messwarte. Immer müssen Abweichungen vom Sollwert schnell erkannt werden und zu einer entsprechenden Reaktion führen. Bei analogen Messwertausgaben werden diese Abweichungen gewöhnlich als Weg- oder Winkeldifferenzen dargestellt, da diese vom Menschen unmittelbar aufgenommen werden können.
5.1 Analoge Messwerke Analoge Weg- oder Winkelanzeigen können aus Gleichgewichtsbedingungen für Kräfte oder Drehmomente gewonnen werden, die elektrostatisch, elektromagnetisch oder thermisch erzeugt werden. Beispiele für Messwerke mit signalverarbeitenden Eigenschaften sind das Dreheisenmesswerk zur Effektivwertmessung, das elektrodynamische Messwerk zur Wirkleistungsmessung und das Kreuzspulmesswerk zur Widerstandsbestimmung über eine Quotientenbildung. Eine Sonderstellung unter allen Messwerken nimmt das lineare Drehspulmesswerk mit Außenmagnet ein.
(I01 − U0 /R) dτ , 0
der bei vorgegebener Integrationszeit t nur durch kleine Nullpunktfehlergrößen klein gehalten werden kann. Große Integrationskapazitäten C verringern dabei den Einfluss des Nullpunktfehlerstromes I01 . Im Dauerbetrieb ist entweder eine zyklische Rücksetzung der Spannung an der Integrationskapazität notwendig, oder es muss mit einem hochohmigen
5.1.1 Prinzip des linearen Drehspulmesswerks
Die Wirkungsweise des Drehspulmesswerks beruht auf der selbstständigen Kompensation des durch einen proportionalen Messstrom I in einer Drehspule elektrisch erzeugten Drehmomentes Mel mit einem über zwei Drehfedern mechanisch erzeugten Gegendrehmoment Mmech , das wiederum dem Ausschlagwinkel α der Drehspule proportional ist.
H67
H68
H Messtechnik
Im eingeschwungenen Zustand errechnet sich der Skalenverlauf aus Mel = Mmech zu α=
1 BdhNI . D
Der Ausschlagwinkel α ist damit linear vom Messstrom I abhängig und die stationäre Stromempfindlichkeit ist konstant: dα BdhN = . dI D
Bild 5-1. Prinzip eines linearen Drehspulmesswerks
Bei linearen Drehspulmesswerken (mit Außenmagneten) wird mithilfe eines im Magnetkreis angeordneten Permanentmagneten ein radialsymmetrisches Magnetfeld der Induktion B erzeugt. In diesem Feld können sich die Flanken einer drehbar gelagerten Spule (Drehspule) auf einer Kreisbahn bewegen (Bild 5-1). Innerhalb der Drehspule befindet sich ein Weicheisenkern, der den Luftspalt zwecks optimaler Ausnutzung des verwendeten Magneten verkleinert. Außerdem ergibt sich bei ebenfalls kreisförmig ausgebildeten Polschuhen ein etwa konstanter Luftspalt und damit näherungsweise das gewünschte radialsymmetrische Magnetfeld. Solange sich die Flanken der Drehspule im Luftspalt befinden, ist die magnetische Induktion unabhängig von der Winkelstellung der Drehspule. Bei dem Messstrom I, der magnetischen Induktion B, einer Windungszahl N der Drehspule, einem Rähmchendurchmesser d und einer Rähmchenhöhe h beträgt das elektrisch erzeugte Drehmoment Mel = 2Fel
d = BdhNI . 2
Diesem Moment entgegen wirkt das in zwei Drehfedern mit der gemeinsamen Drehfederkonstanten (Richtmoment) D mechanisch erzeugte Moment Mmech , das dem Ausschlagwinkel α der Drehspule und des mit ihr fest verbundenen Zeigers proportional ist: Mmech = Dα .
Die Drehspule ist gewöhnlich mit lackisoliertem Kupferdraht von 0,02 bis 0,3 mm Durchmesser bewickelt. Die Wicklung wird vom Rähmchen getragen, das in der Regel aus Aluminium gefertigt ist und eine Kurzschlusswindung darstellt. Bei Bewegung des Rähmchens wird durch die im Rähmchen induzierte Spannung und dem daraus resultierenden Kurzschlussstrom ein der Winkelgeschwindigkeit proportionales Bremsmoment erzeugt, das zur Dämpfung des Einstellvorgangs benötigt wird (Induktionsdämpfung). 5.1.2 Statische Eigenschaften des linearen Drehspulmesswerks
Typische Fehlerkurven von Drehspulmesswerken, die sich als Differenz zwischen den Istwerten αist und den Sollwerten αsoll ergeben, sind in Bild 5-2 dargestellt. Bezieht man den Fehler F = αist − αsoll auf den Messbereichsendwert α0 , so erhält man den dimensionslosen relativen Fehler Frel , der unter Nennbedingungen der Einflussgrößen (z. B. der Temperatur) für alle Messströme innerhalb des Messbereiches sicher unter einer bestimmten zulässigen Grenze (z. B. 1%) bleiben muss, damit ein Messwerk einer bestimmten Genauigkeitsklasse (z. B. Klasse 1) zugeordnet werden kann. Als Genauigkeitsklassen sind für Betriebsmessinstrumente die Klassen 1, 1,5, 2,5 und 5 üblich. Der Einflusseffekt darf einen zusätzlichen, der jeweiligen Klasse entsprechenden Fehler verursachen, wenn sich dabei die jeweilige Einflussgröße nur innerhalb festgelegter Grenzen ändert. Bei der Verwendung eines Drehspulmesswerks als Spannungsmessgerät muss die Temperaturabhängigkeit des Innenwiderstandes der Drehspulwicklung aus
5 Analoge Messtechnik
zur Leistungsmessung oder die Integralbildung zur Energiemessung möglich. Bestimmte Messwerkstypen werden überwiegend aus wirtschaftlichen Gründen oder wegen ihrer geringen Baugröße eingesetzt. So besitzen z. B. Kernmagnetmesswerke eine besonders kompakte Bauform, weisen aber gewöhnlich einen nichtlinearen Skalenverlauf auf. 5.2.1 Kernmagnetmesswerk mit radialem Sinusfeld
Beim Kernmagnetmesswerk mit radialem Sinusfeld beträgt nach Bild 5-3a die magnetische Induktion B am Ort der Drehspulflanke B = B0 cos(α − β) . Bild 5-2. Fehlerkurve eines linearen Drehspulmesswerks
Kupfer berücksichtigt werden. Näherungsweise genügt häufig die Berücksichtigung des linearen Temperaturkoeffizienten α, bei einer Übertemperatur ϑ gegenüber der Bezugstemperatur ϑ0 : Ri (ϑ) = Ri0 [1 + α(ϑ − ϑ0 )] . Der Innenwiderstand bei Bezugstemperatur ϑ0 beträgt dabei Ri (ϑ0 ) = Ri0 und der Temperaturkoeffizient α liegt für Kupfer bei etwas über 4 · 10−3 /K. Der Temperatureinfluss kann bei Spannungsmessgeräten durch Serienschaltung eines größeren temperaturunabhängigen Widerstandes verkleinert werden. Besonders für kleine Spannungsbereiche kann ein Vorwiderstand mit negativem Temperaturkoeffizienten den Temperatureinfluss in einem begrenzten Temperaturbereich näherungsweise aufheben, ohne den Gesamtwiderstand wesentlich zu erhöhen.
Dabei bedeutet B0 die maximale magnetische Induktion in Magnetisierungsrichtung des Kernes, α den Ausschlagwinkel und β den Magnetisierungswinkel zwischen der Ruhelage der Rähmchenflanke und der Magnetisierungsrichtung. Das elektrisch erzeugte Drehmoment Mel ist der wirksamen magnetischen Induktion B und dem Spulenstrom I proportional und ist gleich dem mechanischen Gegendrehmoment Mmech , das wiederum dem Ausschlagwinkel α proportional ist. Der Skalenverlauf folgt daher der Beziehung I=
kα , cos(α − β)
5.2 Funktionsbildung und Verknüpfung mit Messwerken Verschiedene Aufgaben der Messsignalverarbeitung können mit anderen Messwerkstypen, z. B. mit Kreuzspulmesswerken oder mit elektrodynamischen Messwerken gelöst werden. Neben der Bestimmung von Mittelwerten von Wechsel- und Mischgrößen ist auf diese Weise die Quotientenbildung zur Widerstandsmessung, die Produktbildung
Bild 5-3. Kernmagnetmesswerk mit radialem Sinusfeld. a Prinzip, b Skalenverlauf für β = 3α0 /4
H69
H70
H Messtechnik
wobei k eine Konstante ist. Der Skalenverlauf lässt sich durch den Magnetisierungswinkel β beeinflussen. Fordert man z. B. I = I0 /2 für α = α0 /2, so erhält man unter Berücksichtigung von I = I0 für α = α0 cos (α0 − β) = cos (α0 /2 − β) , β = 3α0 /4 . Unter dieser Annahme und mit α0 = 90◦ ergibt sich der in Bild 5-3b gezeichnete Skalenverlauf. 5.2.2 Quotientenbestimmung mit Kreuzspulmesswerken
Bei Kreuzspulmesswerken werden in den beiden unter dem Kreuzungswinkel 2δ fest miteinander verbundenen Drehspulen elektrisch zwei entgegengerichtete Drehmomente erzeugt, die im Gleichgewichtsfall gleich sind. Eine richtkraftlose Aufhängung ist möglich, da kein mechanisches Gegendrehmoment benötigt wird. Der radiale Verlauf des Permanentmagnetfeldes muss jedoch unsymmetrisch sein, damit bestimmten Werten für den Quotienten der beiden Ströme I1 und I2 durch die beiden gekreuzten Spulen definierte Ausschlagwinkel α zugeordnet werden können. Wegen der einfachen Konstruktion werden gerne Kreuzspulmesswerke mit Kernmagnet nach Bild 5-4a verwendet. Die Drehmomente in den beiden Spulen gleicher Windungsflächen sind den jeweiligen Strömen I1 und I2 , den jeweiligen Windungszahlen N1 und N2 und der am Ort der jeweiligen Spulenflanke herrschenden Induktion B0 cos(α − δ) bzw. B0 cos(α + δ) proportional. Der Skalenverlauf folgt wegen des sinusförmigen Feldverlaufs der Beziehung I1 N1 cos(α − δ) . = I2 N2 cos(α + δ)
Damit besteht ein eindeutiger Zusammenhang zwischen dem Winkel α und dem Quotienten I1 /I2 der Spulenströme. Kreuzspulmesswerke sind daher besonders für Widerstandsmessungen geeignet. Bei den Messschaltungen zur Widerstandsmessung mit Kreuzspulmesswerken nach Bild 5-4b sorgt man dafür, dass die Ströme I1 und I2 durch die beiden Spulen angenähert proportional der Spannung am bzw. dem Strom durch den zu messenden Widerstand Rx sind. Der Ausschlagwinkel α des Kreuzspulmesswerks ist dann näherungsweise unabhängig von der Versorgungsspannung der Messschaltungen, weil bei einer Änderung der Quotient konstant bleibt. 5.2.3 Bildung von linearen Mittelwerten und Extremwerten Linearer Mittelwert
Das dynamische Verhalten vieler Messwerke entspricht dem eines Messgliedes 2. Ordnung mit (gerade noch) schwingender Einstellung. Ändert sich der Messstrom nur langsam, dann ist die Anzeige proportional dem Messstrom. Bei hoher Frequenz des Messstromes geht die Anzeige gegen null. Ist einem Messstrom i(t) mit dem Gleichanteil I− ein höherfrequenter Messstrom I∼ = I0 sin ωt (Wechselanteil) überlagert, so wird aufgrund des dynamischen Verhaltens der lineare Mittelwert ¯i = 1 T
"T i(t) dt 0
angezeigt, der durch Integration über die Dauer T einer Periode bestimmt werden kann. Verzögernde Messglieder wirken wie Tiefpassfilter. Sind z. B. einem Gleichsignal störende netzfrequente Wechselanteile mit Frequenzen von 50 Hz, 150 Hz, usw. überlagert, so werden diese Störanteile von den üblichen Messwerken herausgefiltert, da sie den linearen Mittelwert anzeigen. Gleichrichtwert
Bild 5-4. Kreuzspulmesswerk. a Prinzip des Kreuzspul-
messwerks mit Kernmagnet, b Messschaltung für Widerstandsmessungen mit Kreuzspulmesswerk
Wechselströme und Wechselspannungen werden entweder aus dem quadratischen Mittelwert (Effektivwert) oder aus dem nach Gleichrichtung erhaltenen
5 Analoge Messtechnik
Mittelwert, dem sog. Gleichrichtwert, bestimmt. Der Gleichrichtwert |i| eines Stromes i(t) ist 1 |i| = T
"T |i(t)| dt 0
und berechnet sich für sinusförmige Wechselströme i(t) = I0 sin ωt zu "T/2 2 I0 sin ωt dt = I0 π 0 √ 2 2 Ieff = 0,9003 Ieff . = π
2 |i| = T
In Bild 5-5 sind verschiedene Gleichrichterschaltungen dargestellt. Unter der Annahme idealer Gleichrichter (Durchlasswiderstand gleich null, Sperrwiderstand unendlich) wird mit den Zweiweggleichrichterschaltungen und einem mittelwertanzeigenden Messwerk der Gleichrichtwert gebildet. Bei den Einweggleichrichterschaltungen erhält man bei reinen Wechselgrößen den halben Gleichrichtwert. Die Brückenschaltung in (a) wird auch als Graetzschaltung bezeichnet. In der Schaltung (b) sind zwei Dioden durch Widerstände ersetzt. Die reale, gekrümmte Diodenkennlinie wirkt sich hier nur einmal aus, und ein Teil des Messstromes fließt nicht durch das Messwerk. Bei der Mittelpunktschaltung (c) ist eine Mittelanzapfung der Sekundärwicklung des Wandlers notwendig. Der Einweggleichrichter in (d) ist nur für Spannungsgleichrichtung und der in (e) nur
Bild 5-5. Gleichrichterschaltungen. a bis c Zweiweggleichrichterschaltungen, d und e Einweggleichrichterschaltungen
für Stromgleichrichtung geeignet; in dieser Schaltung muss auch bei umgekehrter Polarität Stromfluss möglich sein. Spitzenwertgleichrichtung
Bei Spitzenwertgleichrichtung wird eine Kapazität über eine Diode auf den positiven oder negativen Extremwert einer Wechselspannung aufgeladen, bei sinusförmiger Wechselspannung im Idealfall auf den Scheitelwert U0 (Bild 5-6a). Bei realen Gleichrichterdioden ist der erhaltene Spitzenwert mindestens um die minimale Durchlassspannung der Diode vermindert. Außerdem sinkt bei Belastung der Kapazität C mit einem Lastwiderstand R die Spannung innerhalb einer Periode exponentiell um einen Anteil ΔU/U0 ab, der durch die Zeitkonstante RC und die Periodendauer T des Messsignals gegeben ist (Bild 5-6b). Für T RC gilt U0 − U U T ΔU . = =1− = 1 − e−T/RC ≈ U0 U0 U0 RC Bei einer Frequenz von 10 kHz (T = 0,1 ms) und einer Zeitkonstanten von RC = 100 kΩ · 100 nF = 10 ms ergibt sich für die Restwelligkeit ΔU/U0 = 1%. Die sog. Schwingungsbreite (Schwankung) einer Wechselspannung kann mit der Greinacherschaltung nach Bild 5-6c bestimmt werden, die bei sinusförmigen Wechselspannungen im Idealfall zu einer Verdoppelung des Scheitelwerts auf den Wert 2U0 führt. Spitzenwertgleichrichtung wird besonders bei höheren Frequenzen angewendet.
Bild 5-6. Spitzenwertgleichrichtung. a Prinzip, b Restwel-
ligkeit, c Greinacherschaltung (Spitze-Spitze-Wert)
H71
H72
H Messtechnik
5.2.4 Bildung von quadratischen Mittelwerten
Der quadratische Mittelwert (Effektivwert) I eines zeitlich veränderlichen, periodischen Stromes i(t) ist als der Strom definiert, der in einem Widerstand R während der Dauer einer Periode T die gleiche Energie umsetzt wie der periodische Strom. Für den Effektivwert erhält man daraus ; < < < = "T 1 i2 (t) dt . I= T 0
Für einen sinusförmigen Wechselstrom i(t) √ = I0 sin ωt ergibt sich für den Effektivwert I = I0 / 2. Will man mit Messinstrumenten, die den Gleichrichtwert bilden, den Effektivwert I anzeigen, dann muss der Gleichrichtwert |i| mit dem Formfaktor Fg = I/|i| multipliziert werden. Der Formfaktor hängt von der Kurvenform der Wechselgröße ab. Bei sinusförmigen Wechselgrößen ist Fg =
I |i|
=
messwerke verwendet. Das für didaktische Zwecke gerne benutzte translatorische Prinzip, bei dem ein Eisenstab in eine stromdurchflossene Spule gezogen wird, ist in der Praxis durch eine rotatorische Anordnung ersetzt. In dem in Bild 5-7a dargestellten Mantelkern-Dreheisenmesswerk magnetisiert die vom Messstrom durchflossene Rundspule ein festes und ein beweglich mit der Drehachse verbundenes zylinderförmiges Eisenteil. Aufgrund der gleichnamigen Magnetisierung stoßen die beiden Eisenteile einander ab und erzeugen so ein Drehmoment, das mit dem mechanischen winkelproportionalen Gegendrehmoment im Gleichgewicht steht. Zur Dämpfung des Messwerkes verwendet man bevorzugt eine Luftdämpfung.
π √ ≈ 1,111 . 2 2
In Effektivwerten geeichte Messgeräte mit linearer Mittelwertgleichrichtung zeigen also bei Gleichgrößen um 11,1% zu viel an, da der Formfaktor der Gleichgrößen gleich eins ist. Effektivwertmessung mit Thermoumformern
Bei Thermoumformern wird die Übertemperatur Δϑ eines vom Messstrom i(t) durchflossenen Heizleiters mit einem Thermoelement (siehe 3.5.3) und einem nachgeschalteten Drehspulinstrument gemessen. Wesentlich ist dabei, dass die Übertemperatur Δϑ näherungsweise der Joule’schen Wärme I 2 R proportional und die Thermospannung des Thermoelements ebenfalls näherungsweise dieser Übertemperatur proportional ist. Die Ausgangsspannung eines Thermoumformers ist also der Leistung und damit dem Quadrat des Effektivwertes des Messstromes proportional. Thermoumformer eignen sich bis zu sehr hohen Frequenzen zur Leistungs- bzw. Effektivwertmessung. Sie sind leider nur wenig überlastbar. Effektivwertmessung mit Dreheisenmesswerken
Zur Anzeige von Effektivwerten bei Netzfrequenz werden in Schaltwarten bis heute gerne Dreheisen-
Bild 5-7. Dreheisen-Messwerk. a Mantelkern-Dreheisenmesswerk (Hartmann & Braun), b Typische Drehmomentkurve (Palm)
5 Analoge Messtechnik
Das elektrisch erzeugte Drehmoment lässt sich durch Differenziation der Energie E nach dem Ausschlagwinkel α berechnen. Die gespeicherte magnetische Energie ist 1 Emag = LI 2 . 2 Dabei ist I der Messstrom und L die Selbstinduktivität des Messwerks. Das elektrisch erzeugte Drehmoment Mel ist bei konstantem Strom I abhängig vom Ausschlagwinkel α Mel =
dEmag 1 dL 2 = · I dα 2 dα
und steht mit dem mechanischen Gegendrehmoment Mmech = Dα im Gleichgewicht. Mit der Drehfederkonstanten D ergibt sich für den Skalenverlauf α=
1 dL 2 · I . 2D dα
Der Skalenverlauf hängt also vom Quadrat des Stromes und vom Verlauf dL/dα der Selbstinduktivität des Messwerks ab. Bei linearem Induktivitätszuwachs ergibt sich ein quadratischer Skalenverlauf, bei ungefähr logarithmischem Induktivitätszuwachs ergibt sich ein näherungsweise linearer Skalenverlauf (Bild 5-7b). Dreheisenmesswerke werden bevorzugt zur Effektivwertmessung von Strömen oder Spannungen bei niedrigen Frequenzen eingesetzt, sind aber auch für Gleichgrößenmessung geeignet. Der Eigenverbrauch liegt bei Strommessung bei mindestens 0,1 VA, bei Spannungsmessung wegen des notwendigen hohen, temperaturunabhängigen Vorwiderstandes bei mindestens 1 VA. Bei Spannungsmessern kann man den Frequenzfehler bis etwa 500 Hz durch einen geeignet dimensionierten Parallelkondensator zum Vorwiderstand kompensieren. 5.2.5 Multiplikation mit elektrodynamischen Messwerken
Zur Bestimmung der Wirkleistung in Wechselstromnetzen werden in Warten bevorzugt elektrodynamische Messwerke eingesetzt. Sie ähneln in ihrem Auf-
bau einem Drehspulmesswerk mit Außenmagnet (siehe 5.1.1), wobei der Permanentmagnet durch einen Elektromagneten ersetzt ist. Prinzip der Leistungsmessung mit elektrodynamischen Messwerken
Die in einem komplexen Verbraucher Z umgesetzte Momentanleistung p(t) berechnet sich aus der sinusförmigen Spannung u(t) = U0 sin ωt und dem phasenverschobenen sinusförmigen Strom i(t) = I0 sin(ωt + ϕ) zu p(t) = u(t) i(t) = U0 sin ωt I0 sin(ωt + ϕ) . Mit der Formel sin α sin β =
1 [cos(α − β) − cos(α + β)] 2
wird die Momentanleistung p(t) =
1 U0 I0 [cos ϕ − cos(2ωt + ϕ)] . 2
Der in der Momentanleistung enthaltene Gleichanteil ist die im Verbraucher umgesetzte Wirkleistung Pw =
1 U0 I0 cos ϕ = UI cos ϕ . 2
Der überlagerte Wechselanteil stellt eine mit der doppelten Frequenz pulsierende Leistung dar. Bei linearer Mittelwertbildung der Momentanleistung p(t) ergibt sich also die Wirkleistung Pw . Schickt man durch die Drehspule eines elektrodynamischen Messwerkes einen Strom iD , der der Spannung u(t) am Verbraucher und durch die Feldspule einen Strom iF , der dem Strom i(t) durch den Verbraucher proportional ist, so ist die Anzeige des mittelwertbildenden Messwerks der Wirkleistung proportional: 1 α∼ T
"T
1 iD iF dt ∼ T
0
"T u(t) i(t) dt = Pw , 0
Pw = UI cos ϕ ∼ α . Bei einem Phasenwinkel ϕ = 90◦ zwischen Spannung und Strom ist die von einem elektrodynamischen Messwerk angezeigte Wirkleistung null, da wegen fehlender Wirkwiderstände nur Blindleistung pendeln kann.
H73
H74
H Messtechnik
P = (U R0 − U S0 )I R + (U T0 − U S0 )I T = U RS I R + U T S I T
Bild 5-8. Wirkleistungsmessung mit elektrodynamischen
Messwerken. a Spannungsrichtige Verbraucherleistungsmessung, b stromrichtige Verbraucherleistungsmessung
Messschaltungen zur Leistungsmessung
Bei den in Bild 5-8 dargestellten Messschaltungen zur Bestimmung einer Leistung müssen die Vorwiderstände Rv so ausgelegt werden, dass bei Nennspannung der Strom in der Drehspule einen bestimmten Nennwert nicht überschreitet. Außerdem muss der Vorwiderstand Rv im Spannungspfad so angeordnet werden, dass zwischen Feld-(Strom-) und Dreh-(Spannungs-)spule möglichst keine Potenzialdifferenz entsteht, die zu Isolationsproblemen führen könnte. Mit Messschaltung (a) ist spannungsrichtige Verbraucherleistungsmessung oder aber stromrichtige Quellenleistungsmessung möglich. Bei Messschaltung (b) wird die Verbraucherleistung stromrichtig, die Quellenleistung jedoch spannungsrichtig gemessen. Leistungsmessung in Netzen
Zur Anpassung an die unterschiedlichen Nennströme und Nennspannungen werden Spannungs- und Stromwandler eingesetzt, die gleichzeitig eine galvanische Trennung vom Netz bewirken. In symmetrisch belasteten Drehstromnetzen braucht nur die Leistung einer Phase gemessen und mal drei genommen zu werden. Bei einem Dreileiternetz wird der fehlende Sternpunkt mithilfe dreier Widerstände künstlich gebildet. Bei einem beliebig belasteten Dreileiternetz genügen zwei Messwerke zur Bestimmung der Gesamtleistung, wenn die beiden mit der 3. Phase verketteten Spannungen an die jeweiligen Spannungspfade angeschlossen werden (Aron-Schaltung). Die komplexe Gesamtleistung P
umgeformt werden. Blindleistungsmessungen sind in Drehstromnetzen vergleichsweise einfach möglich, wenn bei symmetrischen Spannungsverhältnissen an den Spannungspfad eines wirkleistungsmessenden elektrodynamischen Messwerks statt der Phasenspannung die um 90◦ verschobene verkettete Spannung zwischen den beiden anderen Phasen angelegt wird. Bei der Aus√ wertung sind die Teilleistungen dann aber durch 3 zu dividieren. 5.2.6 Integralwertbestimmung mit Induktionszählern
Durch zeitliche Integration der an einen Verbraucher abgegebenen Wirkleistung Pw (t) lässt sich die während der Zeit t1 bis t2 verbrauchte Energie bestimmen: "t2 E=
Pw (t) dt . t1
Bei dem in Bild 5-9 skizzierten Induktionszähler wirkt auf eine drehbar gelagerte Aluminiumscheibe parallel zur Lagerachse ein von einer Spannungsspule erzeugter magnetischer Fluss ΦU und ein von einer Stromspule erzeugter Fluss ΦI . Die in der Scheibe induzierten Spannungen bewirken Wirbelströme in der Scheibe. Das elektromagnetisch erzeugte Moment Mel ergibt sich aus der Kraftwirkung der beiden Flüsse ΦU und ΦI mit den jeweils
P = U R0 I R + U S0 I S + U T0 I T kann nämlich wegen I S = −(I R + I T ) in
Bild 5-9. Prinzip eines Induktionszählers (Pflier)
5 Analoge Messtechnik
vom anderen Fluss erzeugten Wirbelströmen. Das resultierende Drehmoment Mel ist der Netzfrequenz f, den Flüssen ΦU und ΦI und dem Sinus des Phasenwinkels zwischen den beiden Flüssen proportional: Mel ∼ f ΦU ΦI sin (ΦU , ΦI ) . Um ein der Wirkleistung Pw proportionales Drehmoment Mel ∼ Pw = UI cos ϕ zu erzielen, muss der Stromfluss ΦI dem Strom I proportional sein. Der den Spannungsfluss ΦU erzeugende Strom durch die Spannungsquelle muss dem Betrage nach der Spannung U proportional sein, in der Phase jedoch um 90◦ gegenüber der Spannung U verschoben sein, was bei einer Drosselspule in etwa gegeben ist. Bei rein Ohm’schem Verbraucher muss also der Fluss ΦU gegenüber dem Fluss ΦI um genau 90◦ verschoben sein (90◦ -Abgleich). Da außerdem auf die Scheibe über einen Permanentmagneten ein der Winkelgeschwindigkeit ωS der Scheibe proportionales Bremsmoment Mb ∼ ωS ausgeübt wird, stellt sich die momentane Winkelgeschwindigkeit ωS (t) der Scheibe proportional zur momentanen Wirkleistung Pw (t) ein: ωS (t) ∼ Pw (t) . Die über ein mechanisches Untersetzungsgetriebe erhaltene Zahl N der Umdrehungen wird bei den in Haushalten üblichen Ein- und DreiphasenInduktionszählern mit einem mechanischen Zählwerk gezählt und ist dem während der Zeitdauer t2 − t1 erhaltenen Integral über die Winkelgeschwindigkeit ωS (t) der Scheibe proportional: "t2 t1
5.3.1 Elektronenstrahlröhre. Ablenkempfindlichkeit
Das Herz eines Oszilloskops stellt die Elektronenstrahlröhre dar, deren prinzipieller Aufbau in Bild 5-10 angegeben ist. Von einer meist indirekt geheizten Kathode werden Elektronen emittiert und in Richtung der positiven Anode beschleunigt, an der eine Spannung von einigen kV gegenüber der Kathode anliegt. Die Intensität des Elektronenstroms kann durch die Steuerelektrode, den negativ geladenen Wehneltzylinder, gesteuert werden. So ist es z. B. möglich, den Elek-
"t2 ωS (t) dt = k2
N = k1
ist ein gewöhnliches analoges Oszilloskop zur Darstellung periodischer Signalverläufe, da durch messsignalgesteuerte Auslösung (Triggerung) der Ablenkung des Elektronenstrahls ein stehendes Schirmbild erzielt werden kann. Seit der Markteinführung der ersten digitalen Echtzeit-Oszilloskope im Jahre 1998 ist der Marktanteil reiner Analogoszilloskope auf nur noch einige Prozent zurückgegangen (leichtere Speicherung, Weiterverarbeitung und Analyse digitaler Daten sowie Rekonfigurierbarkeit durch Software). Dennoch sollen im Folgenden die analogen Prinzipien vorgestellt werden, weil sie das Verständnis für das Oszilloskop als Messgerät erleichtern, gleichgültig ob es analog oder digital realisiert wird. Die besten Oszilloskope erreichen heute Bandbreiten von über 15 GHz.
Pw (t) dt . t1
5.3 Prinzip und Anwendung des Elektronenstrahloszilloskops Das Elektronenstrahloszilloskop, das klassische analoge elektronische Messgerät in Labor und Prüffeld, gestattet die Darstellung einer oder mehrerer Messgrößen in Abhängigkeit einer anderen Größe auf einem flächenförmigen Bildschirm. Besonders geeignet
Bild 5-10. Prinzipieller Aufbau einer Elektronenstrahlröhre
H75
H76
H Messtechnik
tronenstrahl zu bestimmten Zeiten dunkel zu steuern. Die Linsenelektrode dient zur Fokussierung des Elektronenstrahls auf dem fluoreszierenden Bildschirm. Dadurch wird ein scharfer Leuchtpunkt bzw. eine scharfe Leuchtspur erreicht. Die Ablenkung des Elektronenstrahls erfolgt elektrostatisch über die x- und y-Ablenkplatten, die an den Ablenkspannungen Ux und Uy liegen.
Der Tangens des Ablenkwinkels α ist damit
Berechnung der Ablenkempfindlichkeit
Mit der Auslenkung y, dem Abstand z der Platten vom Bildschirm und mit y = z tan α ist die Ablenkempfindlichkeit Ey y zl 1 · Ey = = . Uy 2d Uz
(Bild 5-11) Die von der Kathode emittierten Elektronen mit der Elementarladung e und der Ruhemasse me werden durch die Anodenspannung Uz auf die Geschwindigkeit vz beschleunigt. Da die kinetische Energie jedes Elektrons gleich der längs des Weges geleisteten Arbeit ist, ergibt sich
tan α =
Setzt man v2z = (2e/me )Uz ein, so wird tan α =
Im Bereich der Ablenkplatten wirkt wegen der Feldstärke Ey = Uy /d auf die Elektronen die Kraft F = eEy , die gleich dem Produkt aus Masse me und Beschleunigung ay ist: F = eEy = me ay . Mit der Verweilzeit t = l/vz ist die Geschwindigkeit in y-Richtung nach Verlassen der Ablenkplatten vy = ay t =
e Uy l · · . me d v2z
l Uy · . 2d Uz
Als Kenngröße ist jedoch der Reziprokwert der Ablenkempfindlichkeit, der sog. Ablenkkoeffizient ky =
me 2 v = e Uz . 2 z Daraus berechnet man mit e = 1, 602 · 10−19 A s und me = 9,109 · 10−31 kg die Geschwindigkeit 2e vz = Uz = Uz /V · 593 km/s . me
vy e Uy l · = · . vz me d v2z
Uy 1 , = Ey y
genormt. 5.3.2 Darstellung des zeitlichen Verlaufs periodischer Messsignale
Zur Darstellung des zeitlichen Verlaufs y(t) eines periodischen Messsignals auf einem Oszilloskop wird zunächst ein steuerbarer Zeitablenkgenerator als Zeitbasis benötigt, der – ausgehend von einer negativen Anfangsspannung – eine linear mit der Zeit ansteigende Sägezahnspannung für die x-Ablenkplatten liefert. Das Messsignal selbst wird an die y-Ablenkplatten gelegt. Das entstehende Schirmbild lässt sich nach Bild 5-12 aus dem zeitlichen Verlauf der Messsignalspannung y(t) – im Beispiel sinusförmig – und aus der Sägezahnspannung x(t) konstruieren. Durch die vom Messsignal y(t) gesteuerte Auslösung des Zeitablenkgenerators ergibt sich ein stehendes Schirmbild. Im einfachsten Fall erhält man aus der vertikalen Auslenkung y und dem Ablenkkoeffizienten ky (in V/cm) die Amplitude U y = ky y
Bild 5-11. Elektrostatische Ablenkung des Elektronen-
strahls
und aus dem horizontalen Abstand Δx und dem Zeitkoeffizienten kt (in s/cm) die Periodendauer T des Messsignals entsprechend T = Δt = kt Δx .
5 Analoge Messtechnik
Bild 5-12. Darstellung eines zeitlichen Verlaufs auf dem
Bildschirm
Der Zeitablenkgenerator besteht im Prinzip aus einem Integrationsverstärker, dessen Kapazität zu Beginn des Ablenkvorgangs negativ aufgeladen ist und dessen Ausgangsspannung bei konstantem negativen Eingangsstrom linear ansteigt. Die Auslösung oder Triggerung des Zeitablenkgenerators erfolgt im Regelfall durch das Messsignal, wenn dieses einen bestimmten einstellbaren Pegel bei einer bestimmten Flanke erreicht. 5.3.3 Blockschaltbild eines Oszilloskops in Standardausführung
Das Blockschaltbild eines typischen Oszilloskops ist in Bild 5-13 dargestellt.
Über je einen Vorverstärker, einen elektronischen Umschalter und einen y-Endverstärker gelangen die Messsignale y1 (t) und y2 (t) an die y-Ablenkplatten der Elektronenstrahlröhre. Die breitbandigen Vorverstärker mit einem Frequenzbereich von 0 bis etwa 20 (50) MHz (Grenzfrequenz) sind im Nullpunkt und in der Verstärkung einstellbar. Ablenkkoeffizienten bis herab zu etwa 5 mV/cm sind üblich. Im y,t-Betrieb kann die Triggerung entweder extern oder über eines der beiden Messsignale erfolgen. Bei fehlendem Triggersignal kann durch Freilauf des Zeitablenkgenerators die Nulllinie geschrieben werden. An der Triggereinrichtung sind der Signalpegel und die Signalflanke einstellbar. Besonders bei der Messung kurzer Anstiegszeiten ist eine einstellbare Verzögerungszeit für die Zeitablenkung von Vorteil. Bis kurz vor der ansteigenden Flanke eines Messsignals kann die Ablenkung verzögert und dann mit höherer Ablenkgeschwindigkeit dessen Anstiegsflanke, über den ganzen Bildschirm gedehnt, dargestellt werden. Der Elektronenstrahl kann bei Bedarf über eine negative Spannung am Wehneltzylinder dunkelgesteuert werden. Diese Dunkelsteuerung erfolgt immer dann, wenn der Elektronenstrahl am rechten Rand des Schirmes angelangt ist und an den linken Rand zurückgesetzt wird. Eine Dunkelsteuerung kann auch über einen getrennten Eingang, den sog. z-Eingang erfolgen. Mithilfe dieser z-Modulation können bestimmte Amplituden oder Zeitmarken eingeblendet werden. Die Umschaltung zwischen den beiden Messsignalen am y-Eingang erfolgt entweder alternierend oder
Bild 5-13. Blockschaltbild eines Oszilloskops in
Standardausführung
H77
H78
H Messtechnik
mit einer Rechteckfrequenz („Chopperfrequenz“) von etwa 1 MHz. Im alternierenden Betrieb steuert der Zeitablenkgenerator den Umschalter, wobei abwechselnd jedes der beiden Messsignale für einen Durchlauf durchgeschaltet wird. Schließlich kann die xAblenkung statt vom Zeitablenkgenerator auch über einen getrennten Eingang mit eigenem Vorverstärker angesteuert werden. Man spricht dann von einem x,yBetrieb. 5.3.4 Anwendung eines Oszilloskops im x,y-Betrieb
Im x,y-Betrieb sind eine Vielzahl von Anwendungen möglich. Hier soll auf die Darstellung von Spannungs-Strom-Kennlinien eingegangen werden. Für die Darstellung der Spannungs-Strom-Kennlinie eines nichtlinearen, passiven Zweipols muss nach Bild 5-14 eine Wechselspannung an die Serienschaltung eines Ohm’schen Widerstandes und des Zweipols gelegt werden. Die Spannung am Zweipol, z. B. einer Testdiode, wird an den x-Eingang und die Spannung am Widerstand an den y-Eingang gelegt. Da die Spannung am Widerstand dem Strom proportional ist, entsteht ein Schirmbild, das die Spannungs-Strom-Kennlinie des Zweipols darstellt. Die Kennlinie wird dabei mit der Frequenz der speisenden Wechselspannung durchfahren. Für ein stehendes Bild sind Frequenzen von mindestens etwa 25 Hz notwendig. Für didaktische Zwecke kann die Kennlinie langsam, z. B. mit 1 Hz durchfahren werden. Probleme machen die fast immer vorhandenen Bezugspotenziale, häufig das sog. Massepotenzial. Sind die Eingänge am Oszilloskop nicht massefrei, so muss eine massefreie Wechselspannung zur Ansteuerung verwendet werden. Die Verbindung von Widerstand und nichtlinearem Zweipol kann
Bild 5-14. Darstellung von Spannungs-Strom-Kennlinien
dann an Masse gelegt werden. Will man die aus dieser Schaltung resultierende Spiegelung der U,IKennlinie um die vertikale Stromachse vermeiden, so muss zusätzlich ein Umkehrverstärker (Invertierer) eingesetzt werden. 5.3.5 Frequenzkompensierter Eingangsteiler
Der Anschluss eines Messobjekts geschieht häufig über einen Tastteiler, der dieses mit dem Eingangsverstärker eines Oszillografen verbindet. Die Vorverstärker am Eingang eines Oszillografen besitzen eine Eingangsimpedanz, die durch die Parallelschaltung eines Widerstandes R2 und einer Kapazität C2 beschrieben werden kann (typische Werte: 1 MΩ, 27 pF). Der Tastteiler enthält nach Bild 5-15a einen Teilerwiderstand R1 und eine einstellbare Kapazität C1 . Durch geeigneten Abgleich der Kapazität C1 entsteht ein frequenzkompensierter Tastteiler mit erhöhtem Eingangswiderstand Rres und erniedrigter Eingangskapazität Cres , wie dies bei vielen Messaufgaben wünschenswert ist. Der komplexe Teilerfaktor ist t=
U1 R1 1 + jωR2C2 =1+ · . U2 R2 1 + jωR1C1
Bild 5-15. Frequenzkompensation des Eingangsteilers. a Ersatzschaltung eines Tastteilers am Verstärkereingang, b Unterkompensation, Kompensation und Überkompensation
6 Digitale Messtechnik
Bei gleichen Zeitkonstanten, R1C1 = R2C2 , wird der Teilerfaktor frequenzunabhängig: t=
U1 R1 C2 =1+ = 1+ . U2 R2 C1
Der erhöhte Eingangswiderstand Rres und die erniedrigte Eingangskapazität Cres sind im Falle der Frequenzkompensation Rres = R1 + R2 = tR2 , Cres =
C1C2 C2 . = C1 + C2 t
Bei einem Eingangswiderstand R2 = 1 MΩ, einer Eingangskapazität C2 = 27 pF und einem reellen Teilerfaktor t = 10 betragen der resultierende Eingangswiderstand Rres = 10 MΩ und die resultierende Eingangskapazität Cres = 2,7 pF. Der Abgleich des Tastteilers kann am besten durch eine Rechteckspannung überprüft werden. Bei Frequenzkompensation erscheint am Bildschirm eine saubere Rechteckspannung. Nach Bild 5-15b ergeben sich bei abweichender Kapazität C1 Abweichungen von der Rechteckform. Man spricht dann von Unterkompensation bzw. Überkompensation. Im ersten Augenblick sind nur die Kapazitäten wirksam, und das Spannungsverhältnis u2 (0)/U10 hat den gleichen Wert wie bei sehr hohen Frequenzen, nämlich C1 /(C1 + C2 ). Im eingeschwungenen Zustand sind nur die Widerstände wirksam und das Spannungsverhältnis u2 (T/2)/U10 hat den gleichen Wert wie bei niedrigen Frequenzen, nämlich R2 /(R1 + R2 ). Für den frequenzkompensierten Zustand R1 /C1 = R2C2 sind beide Spannungsverhältnisse gleich. Die Periodendauer des Testrechtecksignals soll so groß sein, dass der eingeschwungene Zustand während jeder Halbperiode praktisch erreicht wird. Dies ist etwa bei Frequenzen unter 5 kHz der Fall.
6 Digitale Messtechnik Wichtige Gründe für die Bedeutung der digitalen Messtechnik sind die kostengünstige Verfügbarkeit der Mikrorechner sowie damit verbunden die der digitalen Messsignalverarbeitung.
Digitale Messsignale besitzen außerdem Vorteile im Hinblick auf die Störsicherheit der Signalübertragung und die Einfachheit der galvanischen Trennung.
6.1 Quantisierung und digitale Signaldarstellung 6.1.1 Informationsverlust durch Quantisierung
Im Gegensatz zur analogen Signaldarstellung, bei der die Messgrößen auf stetige Messsignale abgebildet werden, sind bei der digitalen Messsignaldarstellung nur diskrete Messsignale vorhanden, die durch Abtastung, Quantisierung und Codierung erhalten werden. Bei der Quantisierung ist ein Informationsverlust unvermeidlich. Die sinnvolle Quantisierung hängt von der Art des physikalischen Messsignals und von der vorgesehenen Anwendung ab. Bei akustischen Signalen bietet sich z. B. eine ungleichförmige Quantisierung an. Durch logarithmische Quantisierung wird z. B. vermieden, dass sehr kleine Messsignale im sog. Quantisierungsrauschen untergehen (Anwendung beim Kompander). Die Quantisierung bei gleichförmiger Quantisierung wird i. Allg. so gewählt, dass sie in etwa dem zulässigen Fehler des Messsignals entspricht. Dadurch wird sichergestellt, dass weder durch übermäßige Quantisierung eine zu hohe Genauigkeit vorgetäuscht wird, noch durch zu geringe Quantisierung die vorhandene Genauigkeit des Messgrößenaufnehmers verschenkt wird. In Bild 6-1a ist eine Quantisierungskennlinie für 8 Quantisierungsstufen dargestellt. Bild 6-1b zeigt den Quantisierungsfehler, der gleich der Differenz von digitalem Istwert (Treppenkurve) und linear verlaufendem Sollwert ist. Er springt an den Sprungstellen von − 0,5 auf + 0,5 und sinkt dann wieder linear auf den Wert − 0,5 ab, wo die nächste Sprungstelle ist. Der mit der Quantisierung verbundene Informationsverlust ist deutlich in Bild 6-1c zu erkennen, da sämtlichen Analogwerten A im Bereich N − 0,5 < A N + 0,5 der eine diskrete Wert D = N zugeordnet ist. 6.1.2 Der relative Quantisierungsfehler
Im einfachsten Fall werden den bei der Quantisierung erhaltenen diskreten Quantisierungsstufen (posi-
H79
H80
H Messtechnik
Bild 6-2. Relativer Quantisierungsfehler abhängig von der Stellenzahl
Fq rel = 2−n . Bild 6-1. Quantisierung. a Kennlinie, b Quantisierungsfeh-
ler, c Informationsverlust
tive ganze n-stellige) Dualzahlen zugeordnet, für die gilt n−1 ai · 2i . N= i=0
(Weitere Codes zur Zahlendarstellung siehe J 4.1.) Mit einer n-stelligen Dualzahl lassen sich die Werte 0 bis 2n −1 darstellen, die Anzahl der darstellbaren Werte ist also 2n . Die Koeffizienten ai sind binäre Größen, die also nur die Werte 0 oder 1 annehmen können. Der größtmögliche Informationsgehalt H einer n-stelligen Dualzahl ist H = ld 2n = n Sh . Die Wortlänge (Stellenzahl) eines binären Datenworts wird häufig in der Einheit Bit als die Zahl der Binärstellen angegeben. Eine einzelne Binärstelle wird ebenfalls als Bit (binary digit) bezeichnet. Ein Datenwort mit einer Wortlänge von 8 Bit nennt man ein Byte. Ein Speicher mit einer Kapazität von 1 Kbyte (Kilobyte) kann 210 = 1024 Datenworte zu 8 Bit speichern. Setzt man bei ganzen Dualzahlen den Quantisierungsfehler gleich eins, so ist der relative Quantisierungsfehler bei Bezug auf den Codeumfang von 2n
Abhängig von der Stellenzahl n ist in Bild 6-2 der relative Quantisierungsfehler aufgetragen. Bei einem 10-stelligen Digitalsignal liegt der Quantisierungsfehler von 2−10 = 1/1024 also bereits unter 1 0/00.
6.2 Abtasttheorem und Abtastfehler 6.2.1 Das Shannon’sche Abtasttheorem
Ein kontinuierliches, analoges Messsignal x(t), dessen Funktionswerte für negative Zeiten verschwinden, besitzt das komplexe Spektrum X( jω), das sich mithilfe der Fourier-Transformation (vgl. A 23.1) zu "∞ X( jω) =
x(t)e−jωt dt
0
berechnen lässt. Wird das Signal x(t) nach Bild 6-3a zu äquidistanten Zeiten t = nT 0 (n = 0, 1, . . .) abgetastet, so erhält man eine Folge x(nT 0 ) von Messwerten. Mit der Abtastperiode T 0 , der Kreisfrequenz ω und der differenziellen Abtastdauer τ ergibt sich das Differenzial dXn ( jω) und das Spektrum Xn ( jω) des abgetasteten Signals zu dXn ( jω) = x(nT 0 )e−jωnT 0 τ , ∞ Xn ( jω) = τ x(nT 0 )e−jωnT 0 . n=0
6 Digitale Messtechnik
Für ein auf f < fm frequenzbandbegrenztes Signal ist der Betrag |Xn ( jω)| des Spektrums des abgetasteten Signals in Bild 6-3b dargestellt. Das Spektrum des zeitdiskreten Signals ist periodisch. Der spektrale Periodenabstand ist dabei gleich der Abtastfrequenz f0 = 1/T 0 = ω0 /2π. Das Spektrum Xn ( jω) ist im Bereich − fm f fm identisch mit dem Spektrum X(jω) des kontinuierlichen Analogsignals. Wenn sich also die Teilspektren von Xn ( jω) nicht überlappen, dann kann durch ideale Tiefpassfilterung ohne Informationsverlust das kontinuierliche Signal x(t) wiedergewonnen werden. Das Shannon’sche Abtasttheorem besagt daher, dass die halbe Abtastfrequenz f0 /2 größer sein muss als die höchste im Signal enthaltene (nicht: gewünschte!) Frequenz fm , damit der Verlauf eines Signals aus den Abtastwerten (im Idealfall vollständig) rekonstruiert werden kann. Für die Abtastfrequenz muss also gelten: f0 > 2 fm . Um bei überlappenden Teilspektren eine Mehrdeutigkeit zu vermeiden, muss gegebenenfalls ein analoges sog. Antialiasing-Filter vorgeschaltet werden, das Signalanteile mit Frequenzen f f0 /2 ausfiltert (sperrt).
6.2.2 Frequenzgang bei Extrapolation nullter Ordnung
Die vollständige Rekonstruktion eines bandbegrenzten Signals aus den Abtastwerten ist entsprechend dem Abtasttheorem mit einem idealen Rechteckfilter möglich, das zum Abtastzeitpunkt nT 0 den Wert 1 und zu allen anderen Abtastzeitpunkten den Wert 0 liefert. Im Regelfall begnügt man sich mit einem einfachen Abtast- und Haltekreis nach Bild 6-4a, bei dem der abgetastete Wert bis zur nächsten Abtastung beibehalten wird. Man spricht deshalb auch von einer Extrapolation nullter Ordnung. Das Spektrum Y( jω) des Ausgangssignals y(t) des Abtast- und Haltekreises berechnet sich durch Summation der Teilintegrale im jeweiligen Definitionsbereich nT 0 t < (n + 1)T 0 zu "∞ Y( jω) =
−jωt
y(t)e
dt =
(n+1)T " 0 ∞
x(nT 0 )e−jωt dt .
n=0 nT 0
0
Die Lösung des Integrals liefert zunächst Y(jω) =
∞ n=0
=
∞ n=0
=
∞
x(nT 0 )
1 −jωt (n+1)T 0 [e ]nT 0 −jω
x(nT 0 )e−jωnT 0
1 − e−jωT 0 jω
x(nT 0 )e−jωnT 0 e−jωT 0 /2 T 0 si(ωT 0 /2)
n=0
mit si(x) = sin(x)/x. Dabei wurde Gebrauch gemacht von ejϕ − e−jϕ = 2j sin ϕ.
Bild 6-3. a Abtastung eines Messsignals x(t) zu den Zeiten nT 0 , b Spektrum |X(jω)| eines frequenzbandbegrenzten, abgetasteten Messsignals
Bild 6-4. a Abtast- und Haltekreis, b Amplitudengang eines Haltekreises
H81
H82
H Messtechnik
Der Frequenzgang eines Haltekreises ergibt sich nach Division durch das oben berechnete Spektrum Xn ( jω) zu T0 Y( jω) = · si(ωT 0 /2)e−jωT 0 /2 . G( jω) = Xn ( jω) τ Mit ωT 0 /2 = π f / f0 ergibt sich der Amplitudengang zu T0 · si(π f / f0 ) . |G( jω)| = τ In Bild 6-4b ist der Frequenzbereich 0 f < f0 /2, in dem das Abtasttheorem erfüllt ist, gestrichelt dargestellt. 6.2.3 Abtastfehler eines Haltekreises
Der relative Abtastfehler Frel eines Abtastkreises beträgt Frel = si(π f / f0 ) − 1 . Dabei wurde für den Istwert die Funktion si(π f / f0 ) und für den Sollwert der Wert 1 eingesetzt, der sich bei der Frequenz f = 0 ergibt. Nach Reihenentwicklung ergibt sich der Abtastfehler (π f / f0 )2 (π f / f0 )4 + −... 3! 5! Für Frequenzen unter etwa 0,2 f0 genügt es, nur das erste Glied dieser Reihe zu berücksichtigen, da das zweite Glied mit weniger als 2% zum Abtastfehler beiträgt wegen (π f / f0 )2 (π f / f0 )2 · 1− +... . Frel = − 6 20 Frel = −
Bei einem zulässigen relativen Fehler Frel ergibt sich die maximale Frequenz fm als Funktion der Abtastfrequenz f0 zu 1 fm = 6(−Frel ) f0 . π Das Frequenzverhältnis fm / f0 ist in Bild 6-5 abhängig von Frel aufgetragen. Bei 5 Abtastungen pro Periode der höchsten Messsignalfrequenz ( f0 = 5 fm ) ist der relative Abtastfehler betragsmäßig noch 6,6%. Soll der zulässige Abtastfehler jedoch nur 1% oder 0,01% betragen, so sind 12,8 bzw. 128 Abtastungen pro Periode der höchsten Messsignalfrequenz erforderlich.
Bild 6-5. Bezogene Maximalfrequenz fm / f0 als Funktion des zulässigen relativen Fehlers Frel bei einem Haltekreis
6.3 Digitale Zeit- und Frequenzmessung Der Übergang von der analogen zur digitalen Signalstruktur erfordert prinzipiell eine Quantisierung mithilfe von Komparatoren oder Schmitt-Triggern (Grundschaltungen siehe G 25). 6.3.1 Prinzip der digitalen Zeitund Frequenzmessung
Bei der digitalen Zeitmessung werden die von einem Signal bekannter Frequenz während der unbekannten Zeit in einen Zähler einlaufenden Impulse gezählt. Bei der digitalen Frequenzmessung werden umgekehrt die während einer bekannten Zeit von dem Signal unbekannter Frequenz herrührenden Impulse gezählt. Nach Bild 6-6a gelangen Zählimpulse vom Frequenzeingang zum Impulszähler, solange durch eine logische Eins am Zeiteingang das UND-Gatter freigeschaltet ist. Im Ablaufdiagramm nach Bild 6-6b sind die Startund Stoppsignale im Abstand t am Eingang des Flipflops, das Zeitsignal mit der Zeitdauer t am Ausgang des Flipflops, das Frequenzsignal mit der Frequenz f bzw. der Periodendauer 1/ f und die begrenzte Impulsfolge am Ausgang des UND-Gatters, die in den Impulszähler einläuft, dargestellt. Schmale Impulse des Frequenzsignals vorausgesetzt, ist bei beliebiger Lage des Startzeitpunktes die Zeitdauer t=N
1 1 + (t1 − t2 ) = Nsoll . f f
Dabei ist N die ganzzahlige Impulszahl der begrenzten Impulsfolge, die in den Zähler einläuft, 1/ f die Periodendauer des Frequenzsignals sowie t1 und t2 die
6 Digitale Messtechnik
Beobachtet man also beispielsweise Zählerstände N + 1 mit der Wahrscheinlichkeit P und Zählerstände N mit der Wahrscheinlichkeit 1 − P, so ist bei einer genügenden Zahl von Beobachtungen der Sollwert Nsoll = N + P .
6.3.2 Der Quarzoszillator
Bild 6-6. Prinzip der digitalen Zeit- und Frequenzmessung.
a Blockschaltbild, b Ablaufdiagramm
kleinen Restzeiten zwischen Startsignal bzw. Stoppsignal und dem nächstliegenden Impuls des Frequenzsignals. Der Sollwert Nsoll ist eine rationale Zahl, die angibt, wie oft die Periodendauer 1/f in der Messzeit t enthalten ist. Durch Multiplikation mit der Frequenz f erhält man die Beziehung f t = N + f (t1 − t2 ) = Nsoll . Für große Messzeiten t t1 − t2 ergibt sich der Zählerstand N = ft . Der absolute Quantisierungsfehler ist Fq = N − Nsoll = f (t2 − t1 ) . Da der Betrag von t2 − t1 die reziproke Frequenz 1/ f nicht überschreiten kann, kann der Betrag des Quantisierungsfehlers eins nicht überschreiten: |Fq | 1 . Ist die Zeitdauer t zufällig ein ganzzahliges Vielfaches der reziproken Frequenz 1/ f , so sind die Restzeiten gleich groß (t1 = t2 ) und der Quantisierungsfehler – unabhängig vom Startzeitpunkt – gleich null. Bei gleichverteiltem Startzeitpunkt beträgt für t1 > t2 die Wahrscheinlichkeit P, dass statt N der Wert N + 1 ausgegeben wird P = (t1 − t2 ) f = f t − N .
Die Genauigkeit einer digitalen Zeit- oder Frequenzmessung hängt außer vom Quantisierungsfehler im Wesentlichen von der Genauigkeit der verwendeten Referenzfrequenz bzw. Referenzzeit ab. Ohne Berücksichtigung des Quantisierungsfehlers ist der Zählerstand N = f t sowohl der Messzeit als auch der Messfrequenz proportional. Bei der digitalen Zeitmessung muss also die Referenzfrequenz f und bei der digitalen Frequenzmessung die Referenzzeit t konstant gehalten werden. Dies wird in beiden Fällen durch einen Quarzoszillator geleistet, an dessen Frequenzkonstanz hohe Anforderungen gestellt werden müssen. Relative Frequenzabweichungen von weniger als 10−4 sind mit einfachsten Mitteln, Abweichungen von weniger als 10−8 noch mit vertretbarem Aufwand (Thermostatisierung) erreichbar. Typische Werte für relative Frequenzabweichungen liegen zwischen 10−6 und 10−5 . Von besonderer Bedeutung für die Frequenzkonstanz des Quarzes ist dessen Temperaturgang. Die relativen Frequenzabweichungen Δ f / f lassen sich in ihrer Abhängigkeit von der Temperatur mit guter Näherung durch Polynome 2. oder 3. Grades beschreiben: Δf = a(ϑ − ϑ0 ) + b(ϑ − ϑ0 )2 + c(ϑ − ϑ0 )3 . f Dabei ist ϑ die Temperatur und ϑ0 die Temperatur, bei der der Quarz abgeglichen wurde; a, b und c sind der lineare, quadratische bzw. kubische Temperaturkoeffizient. Das Schaltzeichen eines Schwingquarzes (a) und ein typischer Temperaturgang der Resonanzfrequenz für AT-Schnitte (b) sind in Bild 6-7 angegeben. Abweichungen vom Schnittwinkel Θ ≈ 35◦ führen zu unterschiedlichen Maxima und Minima im Temperaturgang. Dadurch lassen sich bei einem gegebenen
H83
H84
H Messtechnik
Bild 6-7. Schwingquarz. a Schaltzeichen, b Temperatur-
gang der Resonanzfrequenz
Temperaturbereich die Frequenzabweichungen minimieren. Die gestrichelte Kurve stellt den sog. optimalen AT-Schnitt dar, bei dem von −50 ◦ C bis +100 ◦ C die Frequenzabweichungen unter ±12 · 10−6 bleiben. 6.3.3 Digitale Zeitmessung
Bei der digitalen Zeitmessung werden nach Bild 6-8a die von der bekannten Frequenz fref /Nf während der zu messenden Zeit tx in einen Zähler einlaufenden Impulse gezählt. Die zu messende Zeit ist tx =
Nf N. fref
Bild 6-8. Digitale Zeitmessung. a Blockschaltbild, b Impulsformung bei Periodendauermessung
Die erreichbare Zeitauflösung hängt von der Quarzfrequenz ab und ist z. B. bei fref = 10 MHz und Nf = 1 gleich 1/ fref = 0,1 μs. Zur Messung längerer Zeiten wird dem Quarzoszillator ein digitaler Frequenzteiler mit dem ganzzahligen Teilerfaktor Nf nachgeschaltet. Bei Quarzuhren verwendet man z. B. einen Biegeschwinger-Quarz (Stimmgabelquarz) mit 32 768 Hz. Nach Frequenzteilung um den Faktor Nf = 215 = 32 768 ergibt sich eine Referenzfrequenz von 1 Hz, die zu der gewünschten Auflösung von 1 s führt. Fordert man für eine Quarzuhr einen zulässigen Fehler von weniger als 1 Sekunde pro Tag, so entspricht dem ein mittlerer relativer Fehler der Quarzfrequenz von Δ f 1 s = 1 ≈ 10−5 . f 1 d 86 400 Ein relativer Fehler von 10−5 darf dann also nicht überschritten werden, was durch die Unmöglichkeit einer Thermostatisierung erschwert ist. Zur digitalen Messung der Periodendauer eines Signals wird dieses nach Bild 6-8b zunächst über einen Schmitt-Trigger in ein Rechtecksignal umgeformt und dann wie bei der Differenzzeitmessung zur Bildung des Start- und des Stoppsignals benutzt. Kleine Frequenzen werden bevorzugt über die Periodendauer gemessen, um eine kleine Messzeit zu erhalten. 6.3.4 Digitale Frequenzmessung
Bei der digitalen Frequenzmessung werden nach Bild 6-9 die von einer unbekannten Frequenz fx während der bekannten Zeit tT (Torzeit) in einen Zähler einlaufenden N Impulse gezählt. Die Torzeit tT ist dabei identisch mit der Periodendauer der Frequenz, die durch digitale Teilung der
Bild 6-9. Digitale Frequenzmessung (Blockschaltbild)
6 Digitale Messtechnik
Quarzfrequenz fref durch den Faktor NT entsteht. Mit tT = NT / fref ergibt sich für die unbekannte Frequenz fx =
N fref = N. tT NT
Die erreichbare Frequenzauflösung hängt von der Torzeit (Messzeit) tT ab. Oft ist aus dynamischen Gründen die Torzeit auf 1 s oder 10 s begrenzt. Die Frequenzauflösung ist dann 1 Hz bzw. 0,1 Hz. Zur Messung von Frequenzen über 10 MHz bis in den GHz-Bereich kann die Messfrequenz mithilfe eines schnellen Teilers, z. B. in ECL-Technologie (emittercoupled logic), in einen Frequenzbereich herabgeteilt werden, der mit der herkömmlichen Technologie beherrscht wird (5 bis 10 MHz). Digitale Drehzahlmessung
Wichtig ist die digitale Frequenzmessung bei der digitalen Drehzahlmessung (vgl. 3.2.8). Auf einer mit der Drehzahl n (in U/min) rotierenden Messwelle sind m Marken gleichmäßig am Umfang verteilt. Über einen geeigneten Abgriff (z. B. optisch, magnetisch, induktiv oder durch Induktion) wird ein elektrisches Signal erzeugt, dessen Frequenz fx nach Impulsformung ausgewertet werden kann. Diese Zählfrequenz fx beträgt fx = m fD =
mn . 60
Dabei bedeutet fD die Drehfrequenz der Welle in Hz, die sich aus der Drehzahl n in U/min durch Division durch den Faktor 60 ergibt. Der Zusammenhang zwischen Zählerstand N und Drehzahl n in U/min berechnet sich aus fx =
sind, ergibt sich bei einer Markenzahl m von 600, 60 bzw. 6 Marken am Umfang ein der Drehzahl n in U/min zahlenmäßig entsprechender Zählerstand N. Bei m = 1000 oder 100 Marken am Umfang ist eine Torzeit tT von 60 ms bzw. 600 ms notwendig. 6.3.5 Auflösung und Messzeit bei der Periodendauer- bzw. Frequenzmessung
Unter der Annahme einer Quarz-Referenzfrequenz von 10 MHz sollen die bei der Periodendauer- bzw. Frequenzmessung sich ergebenden Quantisierungsfehler und die zugehörigen Messzeiten bestimmt und miteinander verglichen werden. Bei der digitalen Periodendauermessung beträgt der relative Quantisierungsfehler 1 1 fx = = . N fref T x fref In Bild 6-10 ist dieser relative Quantisierungsfehler 1/N abhängig von der Messfrequenz fx im doppeltlogarithmischen Maßstab aufgetragen. Die Messzeit ist identisch mit einer Periode T x = 1/ fx der Messfrequenz. Bei der digitalen Frequenzmessung ist der relative Quantisierungsfehler 1 1 = . N fx tT Er ist im Bild 6-10 für verschiedene Torzeiten tT als Parameter abhängig von der Messfrequenz aufgetragen. Man erkennt, dass bei einer zulässigen Messzeit
N mn . = tT 60
Der Zählerstand N ergibt sich damit zu N=
mtT n. 60
Drehzahl n und Zählerstand N stimmen also zahlenmäßig überein, wenn der Faktor m tT = 10i 60
(i = 0, 1, . . .)
einen dekadischen Wert einnimmt. Da bei Universalzählern Torzeiten tT von 0,1, 1 und 10 s üblich
Bild 6-10. Relativer Quantisierungsfehler als Funktion der Messfrequenz bei Periodendauermessung und bei Frequenzmessung
H85
H86
H Messtechnik
von z. B. 1 s unter 1 kHz die Periodendauermessung und über 10 kHz die Frequenzmessung zum kleineren Quantisierungsfehler führt. Vom Standpunkt der Genauigkeit her gesehen ist es sinnvoll, keinen wesentlich kleineren Quantisierungsfehler 1/N als den relativen Fehler Δ fref / fref der Quarzfrequenz anzustreben. 6.3.6 Reziprokwertbildung und Multiperiodendauermessung
Bei kleinen Messfrequenzen, wie z. B. der Netzfrequenz von 50 Hz, liefert die Periodendauermessung in wesentlich kürzerer Zeit einen Messwert mit hinreichender Auflösung. Zum Vergleich beträgt bei Frequenzmessung mit einer Torzeit von 1 s der relative Quantisierungsfehler maximal 1/50 = 2%. Bei Frequenzsignalen im kHz-Bereich wird bei digitaler Frequenzmessung zur Erzielung einer hohen Auflösung eine verhältnismäßig hohe Torzeit von etwa 10 s oder mehr benötigt. Im Vergleich dazu erfüllt die digitale Periodendauermessung zwar die Forderung nach einer geringen Messzeit, die Auflösung ist dann aber durch die maximale Referenzfrequenz beschränkt. Abhilfe schafft hier die Multiperiodendauermessung nach Bild 6-11a. Die Messfrequenz fx = 1/T x wird dabei um den Faktor NT digital geteilt. Als Messergebnis ergibt sich der Zählerstand N = NT fref T x = NT
fref . fx
Die Auflösung beträgt 1 fx 1 = · N NT fref und ist in Bild 6-11b als Funktion der Messfrequenz fx mit NT als Parameter aufgetragen. Die Messzeit ist NT T x =
NT . fx
Das Produkt Auflösung 1/N und Messzeit NT / fx ist konstant und beträgt 1 NT 1 · = . N fx fref
Bild 6-11. Multiperiodendauermessung. a Blockschaltbild, b Auflösung als Funktion der Messfrequenz
Der minimale Wert dieses Produkts ist durch die Höhe der Referenzfrequenz gegeben. Bei einer zulässigen Messzeit NT / fx = 0,1 s und einer Referenzfrequenz fref von 10 MHz ist eine Auflösung 1/N von 10−6 möglich. Bei einer Messfrequenz fx von 10 kHz müssen dazu NT = 1000 Perioden der Messfrequenz ausgewertet werden (Bild 6-11b). Der angezeigte Zählerstand N ist bei der Multiperiodendauermessung proportional der Periodendauer. Wird als Messergebnis die Frequenz gewünscht, so muss der Reziprokwert gebildet werden. Dies geschieht bei besseren Universalzählern mit einem Mikrorechner. Die Rechenzeit für die Bildung dieses Reziprokwertes liegt deutlich unter 100 μs. Die Multiperiodendauermessung ist deshalb heute für Frequenzmessungen in allen Frequenzbereichen bedeutungsvoll geworden. Die digitale Frequenzmessung mit voreingestellter Torzeit (preset time) wird deshalb in zunehmendem Maße durch die Multiperiodendauermessung mit voreingestellter Periodenzahl (preset count) ersetzt.
6.4 Analog-Digital-Umsetzung über Zeit oder Frequenz als Zwischengrößen Bei einer Reihe von Anwendungsfällen, z. B. bei Labor-Digitalvoltmetern, werden keine hohen
6 Digitale Messtechnik
Anforderungen an die Geschwindigkeit der AnalogDigital-Umsetzung gestellt. Dort können mit Vorteil Umsetzungsverfahren mit der Zeit oder der Frequenz als Zwischengröße eingesetzt werden, die teilweise eine sehr hohe Genauigkeit ermöglichen. 6.4.1 Charge-balancing-Umsetzer
Beim Charge-balancing-Umsetzer (Ladungskompensationsumsetzer) wird nach Bild 6-12 die umzusetzende Messspannung Ux fortlaufend integriert, während für eine konstante Zeit t1 zusätzlich eine negative Referenzspannung Uref an den Eingang des Integrationsverstärkers angelegt wird. Die Zeit t1 wird dabei gestartet, wenn die Ausgangsspannung durch Integration der Messspannung auf den Wert null abgesunken ist. Der wesentliche Unterschied zum einfachen Spannungs-Frequenz-Umsetzer besteht also darin, dass für eine konstante Zeit t1 auch eine am Eingang anliegende Referenzspannung Uref integriert wird. Die Ausgangsspannung, die nach Ablauf von t1 am Integratorausgang erreicht wird, ist Uref Ux t1 . − ua (t1 ) = R2 R1 C Sie wird durch Integration der Messspannung Ux während der Zeit t2 nach null abgebaut:
ua (t1 ) −
Ux t2 · =0. R1 C
Durch Elimination von ua (t1 ) ergibt sich:
Uref Ux R1 R1 Uref t2 = − t1 = · − 1 t1 . R2 R1 U x R2 U x Die Frequenz fx ist deshalb fx =
1 1 R2 U x = · · . t1 + t2 t1 R1 Uref
Die Frequenz fx ist also der Messspannung Ux proportional. Der Charge-balancing-Umsetzer ist gleichzeitig ein Spannungs-Frequenz-Umsetzer. Im Gegensatz zum einfachen Spannungs-FrequenzUmsetzer ist die Genauigkeit jedoch nicht von der Integrationskapazität abhängig. Über digitale Treiber wird aus einer Referenzfrequenz fref sowohl die Zeit t1 zur Integration gemäß t1 = N1 / fref als auch die Torzeit tT zur digitalen Frequenzmessung gemäß tT = NT / fref gewonnen. Das Digitalsignal entspricht dann der Zahl NT fref R2 Ux · · · fref N1 R1 Uref NT R2 Ux = · · . N1 R1 Uref
Nx = tT fx =
Langzeitschwankungen der Referenzfrequenz fref beeinflussen also die Messgenauigkeit nicht. 6.4.2 Dual-slope-Umsetzer
Beim Dual-slope-Umsetzer (Zweirampenumsetzer) nach Bild 6-13 wird die Messspannung Ux während einer konstanten Zeit t1 integriert. Nach Ablauf dieser Zeit t1 wird an den Eingang eine Referenzspannung Uref mit umgekehrter Polarität angelegt. Die für die Rückintegration bis zur Ausgangsspannung null benötigte Zeit tx ist dabei der Messspannung Ux proportional. Die Ausgangsspannung zur Zeit t = t1 ist nämlich Bild 6-12. Charge-balancing-Umsetzer. a Prinzip, b Ab-
laufdiagramm
1 ua (t1 ) = − RC
"t1 −Ux dt = 0
Ux t1 . RC
H87
H88
H Messtechnik
Nach der Zeit t = t1 + tx ist die Ausgangsspannung auf null zurückintegriert worden: 1 ua (t1 + tx ) = ua (t1 ) − RC
t1 +tx " Uref dt = 0 . t1
Mit der Beziehung ua (t1 ) =
Uref tx RC
ergibt sich die Zeit tx = t1
Ux . Uref
Sie ist unabhängig vom Wert der Integrationszeitkonstante RC. Über einen digitalen Teiler wird aus der Referenzfrequenz fref die Zeit t1 zur Hochintegration gemäß t1 = N1 / fref gewonnen. Das digitale Ausgangssignal entspricht dann der Zahl Nx = fref tx = fref
N1 Ux Ux · = N1 . fref Uref Uref
Wie beim Charge-balancing-Umsetzer beeinflussen also auch beim Dual-slope-Umsetzer Langzeitschwankungen der Referenzfrequenz die Umsetzungsgenauigkeit nicht.
6.4.3 Integrierende Filterung bei integrierenden Umsetzern
Da bei den integrierenden Analog-Digital-Umsetzern die Umsetzung durch Integration der umzusetzenden Eingangsspannung Ux erfolgt, können bei geeigneter Wahl der Integrationszeit überlagerte Störspannungen stark oder sogar vollständig unterdrückt werden. Dieser Effekt der integrierenden Filterung ist sowohl beim einfachen Spannungs-Frequenz-Umsetzer und beim Charge-balancing-Umsetzer als auch beim Dual-slope-Umsetzer anwendbar. Die integrierende Filterung soll am Beispiel des Dual-slope-Umsetzers erklärt werden. Einer umzusetzenden Messspannung U0 sei eine sinusförmige Störspannung mit der Frequenz fs und der Amplitude Usm überlagert. Die am Eingang anliegende Spannung ist damit ux (t) = U0 + Usm cos ωs t . Im Zeitbereich 0 t t1 erhält man für die Ausgangsspannung des Integrationsverstärkers 1 ua (t) = RC
"t (U0 + Usm cos ωs t) dt 0
=
1 sin ωs t U0 + Usm . RC RC · ωs
Der Verlauf von Eingangsspannung ux (t) und Ausgangsspannung ua (t) ist in Bild 6-14a dargestellt, wo angenommen ist, dass die Integrationszeit t1 gerade gleich der Periodendauer T s = 1/ fs der überlagerten Störwechselspannung ist. Eine überlagerte Störspannung wird vollständig unterdrückt, wenn die Integrationszeit t1 ein ganzes Vielfaches der Periodendauer 1/ fs der Störspannung ist. Der relative Fehler, der durch die überlagerte Störspannung verursacht wird, ist allgemein Frel =
Bild 6-13. Dual-slope-Umsetzer. a Prinzip, b Ablaufdia-
gramm
Usm sin ωs t1 · . U0 ωs t1
Da in der Praxis keine definierte Phasenbeziehung zwischen dem zeitlichen Verlauf der Störspannung und der Integrationszeit besteht, muss der ungünstigste Fall zugrunde gelegt werden. Dieser ergibt sich, wenn anstelle der Integrationsgrenzen 0 und t1 die
6 Digitale Messtechnik
tatsächlich eine Hochintegrationszeit t1 von 100 ms und ermöglichen wegen der Rückintegrationszeit gerade etwa 5 Messungen pro Sekunde, ein Wert, der für Laboranwendungen ausreichend ist.
6.5 Analog-Digital-Umsetzung nach dem Kompensationsprinzip
Bild 6-14. Integrierende Filterung. a Verlauf der Ein- und
Ausgangsspannung, b relativer Fehler als Funktion des Produktes fs t1
Grenzen −t1 /2 und +t1 /2 eingeführt werden. Der relative Fehler wird dann Frel =
Usm sin(π fs t1 ) · . U0 π fs t1
Der relative Fehler Frel ist abhängig von fs t1 = t1 /T s in Bild 6-14b aufgetragen. Bei netzfrequenten Störspannungen mit einer Frequenz fs von 50 Hz beträgt die kleinstmögliche Integrationszeit, für die die überlagerte Störspannung gerade vollständig unterdrückt wird, t1 = 1/ fs = 20 ms. Dual-slope-Umsetzer, die sowohl Störspannungen von 50 Hz als auch von 60 Hz (z. B. USA) integrierend filtern sollen, müssen also mindestens mit einer Integrationszeit t1 von 100 ms, dem kleinsten gemeinsamen Vielfachen der beiden Periodendauern 20 ms bzw. 16 32 ms, oder mit ganzzahligen Vielfachen von 100 ms ausgestattet sein. Die meisten Digitalvoltmeter nach dem Dual-slope-Prinzip besitzen
Neben den Analog-Digital-Umsetzern (ADUs) mit den Zwischengrößen Frequenz oder Zeit sind die direkten ADUs nach dem Kompensationsprinzip von Bedeutung. Diese enthalten gewöhnlich in der Rückführung Digital-Analog-Umsetzer (DAUs) mit bewerteten Leitwerten oder mit Widerstandskettenleiter. Abhängig von der Abgleichstrategie entstehen im einfachsten Fall Inkrementalumsetzer, die analogen Messsignalen in einer oder in beiden Richtungen (Nachlaufumsetzer) folgen können. Höherwertige Umsetzer arbeiten mit Zähleraufteilung oder erzeugen in jedem Takt ein Bit des digitalen Ausgangssignals. So entsteht der serielle ADU mit Taktsteuerung, der nach dem Prinzip der sukzessiven Approximation arbeitet. 6.5.1 Prinzip
Analog-Digital-Umsetzer nach dem Kompensationsprinzip enthalten nach Bild 6-15 in der Rückführung einen DAU. Mithilfe einer Abgleichschaltung wird dessen digitales Eingangssignal D in geeigneter Weise verändert, bis das analoge Ausgangssignal Uv das umzusetzende analoge Eingangssignal Ux praktisch vollständig kompensiert. Das notwendige Steuersignal S empfängt die Abgleichschaltung von einem Kompa-
Bild 6-15. Prinzip der Analog-Digital-Umsetzung nach dem
Kompensationsprinzip
H89
H90
H Messtechnik
rator K, der einer logische Eins liefert, solange die umzusetzende Eingangsspannung Ux größer ist als die rückgeführte Vergleichsspannung Uv . Im abgeglichenen Zustand ist das digitale Eingangssignal D des DAU identisch mit dem digitalen Ausgangssignal des gesamten ADU. Ein n-stelliges dualcodiertes Digitalsignal D lässt sich mit den n Koeffizienten a1 bis an darstellen als D = a1 2−1 + a2 2−2 + . . . + an−1 2−(n−1) + an 2−n . Der mögliche Quantisierungsfehler beträgt 2−n und entspricht dem Wert der Stelle mit der kleinsten Stellenwertigkeit (LSB, least significant bit). Die Stelle mit der größten Stellenwertigkeit (MSB, most significant bit) hat den Wert 2−1 = 1/2. Der Endwert Dmax ist erreicht, wenn alle Koeffizienten ai der n Stellen 1 sind und beträgt Dmax = 2−1 + 2−2 + . . . + 2−n = 1 − 2−n ≈ 1 . Dieser Endwert ist praktisch unabhängig von der Stellenzahl n und beträgt näherungsweise 1. 6.5.2 Digital-Analog-Umsetzer mit bewerteten Leitwerten
Digital-Analog-Umsetzer sind also eine wesentliche Komponente in ADUs nach dem Kompensationsprinzip. Unter den Digital-Analog-Umsetzern mit Widerstandsnetzwerken haben außer den Umsetzern mit Kettenleitern die Umsetzer mit bewerteten Leitwerten besondere Bedeutung erlangt. Nach Bild 6-16a besteht ein 1-Bit-DAU im Prinzip aus einem Leitwert Gi , der über einen digital gesteuerten Schalter von einer Referenzspannung Uref gespeist wird. Der Ausgangsstrom I ist abhängig vom digitalen Eingangssignal ai : I = Uref aiGi . Ist das digitale Eingangssignal ai = 0, so ist der Schalter geöffnet; für ai = 1 ist der Schalter geschlossen. Ein mehrstelliges digitales Eingangssignal D mit gewichteter Codierung kann nach Bild 6-16b durch Parallelschaltung entsprechend bewerteter Leitwerte umgesetzt werden. Der analoge Ausgangsstrom wird dabei über einen Stromverstärker rückwirkungsfrei in
Bild 6-16. Digital-Analog-Umsetzer mit bewerteten Leitwerten. a Prinzip bei 1-Bit-Umsetzung, b mehrstellige Digital-Analog-Umsetzung
ein proportionales Ausgangssignal, z. B. in eine Spannung Ua , umgeformt. Der wirksame Leitwert G berechnet sich durch Addition der jeweils zugeschalteten Leitwerte Gi zu G=
n
ai G i .
i=1
Mit I = Uref G und Ua = Rg I ergibt sich die analoge Ausgangsspannung Ua zu Ua = Rg Uref
n
ai G i .
i=1
Bei einem DAU für dualcodiertes Eingangssignal müssen also die Leitwerte G1 bis Gn gemäß G1 : G2 : . . . : Gn = 2−1 : 2−2 : . . . : 2−n dimensioniert werden. Der größte Leitwert ist der Stelle größter Wertigkeit zugeordnet. 6.5.3 Digital-Analog-Umsetzer mit Widerstandskettenleiter
Im Gegensatz zu den DAUs mit bewerteten Leitwerten sind beim DAU mit Widerstandskettenleiter die Stellenwertigkeiten durch die Lage der Einspeisepunkte gegeben. Nach Bild 6-17 enthält ein solcher Umsetzer in seiner einfachsten Form einen Kettenleiter mit Längswiderständen R und Querwiderständen 2R. Die Stellungen a1 bis an der n Schalter entsprechen dem digitalen Eingangssignal D. In der linksseitigen Stellung der Schalter
6 Digitale Messtechnik
Bild 6-17. Digital-Analog-Umsetzer mit Widerstands-
Kettenleiter
(ai = 1) werden die Querwiderstände 2R an die Referenzspannung Uref gelegt, und es fließt ein Strom in den jeweiligen Knotenpunkt des Kettenleiters. Dieser Strom trägt umso mehr zur analogen Ausgangsspannung Ua am Abschlusswiderstand Ra bei, je näher der Knotenpunkt am Ausgang des Umsetzers liegt. Ua ergibt sich durch Superposition der n Zustände, bei denen sich nur jeweils einer der n Schalter in der Stellung ak = 1 befindet und die anderen in der Position ai = 0: Ua =
Ra Uref (a1 2−1 + a2 2−2 + . . . + an 2−n ) . @ABC Ra + R D
Das digitale Eingangssignal D ist durch die Koeffizienten a1 bis an bestimmt und der analogen Ausgangsspannung Ua proportional. Beim DAU mit Widerstandskettenleiter gehen nicht die absoluten Fehler der Widerstände, sondern nur die Abweichungen voneinander in die Genauigkeit der Umsetzung ein. Es ist deshalb zulässig, Widerstände mit gleichen Fehlern einzusetzen. Ebenso muss der Temperaturkoeffizient der verwendeten Widerstände nicht möglichst klein gehalten werden. Wesentlich ist jedoch eine möglichst gute Übereinstimmung des Temperaturgangs der Einzelwiderstände. 6.5.4 Nachlaufumsetzer mit Zweirichtungszähler
Der einfachste ADU nach dem Kompensationsprinzip ist der Inkrementalumsetzer mit Einrichtungszähler. Da solche Umsetzer entweder nur steigenden oder nur fallenden Eingangsspannungen folgen können, werden Inkrementalumsetzer gewöhnlich mit Zweirichtungszählern gebaut. Diese Nachlaufumsetzer können sowohl steigenden als auch fallenden
Bild 6-18. Nachlaufumsetzer mit Zweirichtungszähler.
a Prinzip, b Ablaufdiagramm
Eingangssignalen folgen. Im Blockschaltbild nach Bild 6-18a ist gezeigt, wie mit einer geeigneten Logik der Vorwärts-Eingang des Zählers angesteuert wird, solange das Eingangssignal größer als das rückgeführte Signal Uv des DAU ist. Der Rückwärts-Eingang des Vorwärts-RückwärtsZählers wird angesteuert, wenn die umzusetzende Eingangsspannung kleiner als Uv ist. Ohne zusätzliche Maßnahmen springt das digitale Ausgangssignal immer um eine Quantisierungseinheit hin und her, da ständig an einem der beiden Zählereingänge Taktimpulse anliegen. Dieses Hin- und Herspringen lässt sich vermeiden, indem der Komparator als sog. Fensterkomparator ausgeführt wird, der innerhalb einer bestimmten Totzone keinen der beiden Zählereingänge ansteuert. Das Ablaufdiagramm nach Bild 6-18b zeigt, wie ein Nachlaufumsetzer steigenden und fallenden Eingangsspannungen folgt. Nur wenn die maximale Umsetzungsgeschwindigkeit überschritten ist, folgt der Umsetzer einer veränderlichen Eingangsspannung Ux mit Verzögerung. Maximalfrequenz bei Nachlaufumsetzung
Bei einem n-Bit-Umsetzer mit einer Referenzspannung Uref , die dem Messbereichsendwert entspricht,
H91
H92
H Messtechnik
und bei einer Taktfrequenz ft beträgt die maximale Änderungsgeschwindigkeit der Vergleichsspannung dUv = 2−n Uref ft . dt max Erfolgt die Änderung der umzusetzenden Eingangsspannung Ux sinusförmig mit der Frequenz f und der Amplitude Um , dann kann der Wechselanteil U∼ der Eingangsspannung durch U∼ (t) = Um sin(2π f t) beschrieben werden. Die maximale Änderungsgeschwindigkeit dieses Wechselanteils der Eingangsspannung ist dU = 2π f Um [cos(2π f t)]t=0 = 2π f Um . dt max Soll der Nachlaufumsetzer verzögerungsfrei folgen können, dann darf die maximale Änderungsgeschwindigkeit der Eingangsspannung die maximale Änderungsgeschwindigkeit der Vergleichsspannung nicht überschreiten. Die daraus resultierende Ungleichung lautet
verbreitet. Diese Umsetzer gehören zu den seriellen Umsetzern mit Taktsteuerung, bei denen in jeder Taktperiode eine Stelle des digitalen Ausgangssignals D gebildet wird (one bit at a time). Bei einem n-Bit-Umsetzer sind also n Schritte zur Umsetzung notwendig. Das Blockschaltbild eines ADUs nach dem Prinzip der sukzessiven Approximation ist in Bild 6-19a dargestellt. Die Umsetzung beginnt mit dem Versuch, in die höchste Stelle eine logische Eins einzuschreiben. Ist die Ausgangsspannung Uv des DAU kleiner als die umzusetzende Eingangsspannung Ux , so bleibt diese Eins erhalten. Ist jedoch Uv > Ux , dann ist der Ausgang des Komparators erregt und die Stufe wird auf null zurückgesetzt. Dieses Vorgehen wird nun mit der nächstniedrigeren Stelle fortgesetzt und schließlich mit der niedrigsten Stelle abgeschlossen. Nach jedem Schritt wird die Ausgangsspannung Uv des DAU mit der analogen Eingangsspannung Ux verglichen. Wird die Spannung Ux nicht überschritten, so verbleibt die Eins in der bistabilen Kippstufe BK. Bei Überkompensation jedoch wird die Kippstufe auf null zurückgesetzt (Bild 6-19b).
2−n Uref ft 2π f Um . Die maximal zulässige Frequenz fmax der Eingangsspannung ergibt sich daraus zu fmax =
2−n Uref · ft . 2π Um
Für einen 10-Bit-Umsetzer (n = 10) beträgt bei einer Taktfrequenz ft von 1 MHz und bei einer Amplitude von Um = 12 Uref des Wechselanteils der Eingangsspannung die maximal zulässige Frequenz der Eingangsspannung etwa 310 Hz. Kleinen Änderungen der Eingangsspannung kann ein Nachlaufumsetzer sogar schneller folgen als die seriellen Umsetzer, die in jeder Taktperiode 1 Bit des digitalen Ausgangssignals bilden, wie z. B. der ADU mit sukzessiver Approximation. 6.5.5 Analog-Digital-Umsetzer mit sukzessiver Approximation
Unter den Verfahren der Analog-Digital-Umsetzung ist die Methode der sukzessiven Approximation sehr
Bild 6-19. Analog-Digital-Umsetzer mit sukzessiver Approximation. a Prinzip, b Ablaufdiagramm
6 Digitale Messtechnik
Die Ablaufsteuerung wird mit einem Schieberegister ausgeführt, das sowohl das UND-Gatter zur Löschung der Kippstufen bei Überkompensation freigibt, als auch das Setzen der Kippstufe der nächstkleineren Stelle übernimmt. Die monostabile Kippstufe MK verzögert das Signal des Komparators genügend lange, damit das Einschwingen von Übergangsvorgängen abgewartet werden kann. Im Bild 6-19 ist am Beispiel einer Eingangsspannung von Ux = 7,014 V bei einer Referenzspannung Uref von 10,24 V der Anfang der Umsetzung dargestellt. Schnelle Umsetzer nach diesem Prinzip arbeiten mit einer Taktfrequenz von 1 MHz. Dies entspricht einer Taktperiode von 1 μs. Für die Umsetzung eines 10-stelligen Signals (10 Bits) werden dann 10 μs benötigt.
6.6 Schnelle Analog-Digital-Umsetzung und Transientenspeicherung Für die Analog-Digital-Umsetzung schneller Vorgänge sind Umsetzer mit entsprechend hoher Umsetzungsgeschwindigkeit erforderlich. Laufzeitumsetzer arbeiten seriell wie die ADUs mit sukzessiver Approximation, besitzen aber keine Taktsteuerung. Ihre Umsetzzeit ist nur durch die Signallaufzeiten bestimmt und daher vergleichsweise niedrig. Besonders kleine Umsetzzeiten werden mit den simultan arbeitenden Parallelumsetzern (flash converter) erreicht. Ein guter Kompromiss zwischen Aufwand und Umsetzzeit sind die Serien-Parallel-Umsetzer. Schnelle ADUs werden bei der Umsetzung von Videosignalen, besonders auch bei der sog. Transientenspeicherung in der Mess- und Versuchstechnik eingesetzt. Damit wird eine digitale Signalanalyse in Echtzeit oder auch in einem geeignet gedehnten Zeitmaßstab ermöglicht. 6.6.1 Parallele Analog-Digital-Umsetzer (Flash-Converter)
Die höchsten Umsetzungsgeschwindigkeiten können mit den simultan arbeitenden Parallelumsetzern erreicht werden. Der Aufwand wächst etwa proportional mit der Zahl der Quantisierungsstufen. Wie in Bild 6-20a gezeigt, sind für 2n Quantisierungsstufen 2n − 1 Komparatoren K notwendig, die die analoge Eingangsspannung Ux gegen 2n − 1, z. B. linear gestufte, Referenzspannungen vergleichen.
Bild 6-20. Paralleler Analog-Digital-Umsetzer. a Blockschaltbild, b Übertragungskennlinie
Die Ausgangssignale Ai der Komparatoren sind logisch null, wenn die Eingangsspannung Ux kleiner als die entsprechende Referenzspannung Uref i ist. Sie sind logisch eins für Ux > Uref i . Über einen Codeumsetzer erfolgt die Codeumsetzung in den Dualcode. Für einen Parallelumsetzer mit 8 Dualstellen am Ausgang sind 255 Komparatoren nötig. Für einen Umsetzer mit 3 Dualstellen ist in Bild 6-20b der Zusammenhang zwischen dem Dualzahl-Ausgangssignal und der auf die Referenzspannung Uref bezogenen Eingangsspannung Ux dargestellt. Die Tabelle beschreibt die Codierungsvorschrift (den Code) zwischen den Komparatorausgangssignalen Ai und dem Dualzahlsignal D. Mit den heute verfügbaren Integrationstechniken ist der Aufbau von Parallelumsetzern mit 10 Bit Auflösung möglich. Dabei müssen also 1023 Komparatoren und die erforderlichen Bauelemente zur Erzeugung der Referenzspannungen, die Umcodierung sowie der Ausgabespeicher auf einem Chip integriert werden. Dies bedeutet die Integration von über 60 000 Bauelementen auf einem Chip. Typische Frequenzen bei diesen Flash-Convertern liegen etwa bei 100 MHz. Die zugehörigen Umsetzzeiten betragen also 10 ns.
H93
H94
H Messtechnik
6.6.2 Transientenspeicherung
Die Aufzeichnung der Vorgeschichte einmalig verlaufender Vorgänge ist durch die Verfügbarkeit schneller ADUs und preiswerter Halbleiterspeicher hoher Kapazität mithilfe von Transientenspeichern möglich geworden. In Verbindung mit einem Oszillografen oder einem Schreiber als Ausgabegerät stellen diese Transientenrecorder einen Ersatz für Schnellschreiber und Speicheroszillografen dar. Sie eignen sich vorzüglich für Aufgaben der Störwerterfassung und Messwertanalyse, da mit ihnen die Betriebszustände vor, während und nach der Störung mit genügend hoher Abtastrate und Auflösung aufgezeichnet werden können. Darüber hinaus sind Transientenrecorder wertvoll in Forschung und Entwicklung, wenn der Verlauf von Messsignalen bei nicht reproduzierbaren Versuchen aufgezeichnet werden soll (Digitaloszilloskop). Gewöhnlich werden in einem Transientenrecorder über schnelle ADUs die interessierenden Signale mit Abtastfrequenzen im MHz-Bereich abgetastet, digitalisiert und in einen 8- oder 10-stelligen Schieberegisterspeicher bitparallel eingeschrieben (Bild 6-21).
Der Halbleiterspeicher besitzt in der Regel mindestens 210 Speicherzellen, sodass mindestens 1024 Datenworte eingespeichert werden können und darüber hinaus dann die jeweils zuerst eingespeicherten Datenworte verloren gehen. Ein Triggersignal stoppt beim Auftreten eines bestimmten Ereignisses nach Ablauf einer einstellbaren Verzögerungszeit tv das Einspeichern weiterer Werte in den Speicher. Dieses Triggersignal kann von einem bestimmten Pegel des aufzuzeichnenden Signals selbst abgeleitet oder über andere Startkriterien ausgelöst werden, die das Auftreten von Anomalien oder Überschreiten zulässiger Grenzwerte anzeigen. Mit einem variablen Auslesetakt kann dann der Transientenspeicher repetierend abgefragt werden. Mit einer erhöhten Taktfrequenz ist es so möglich, langsame Vorgänge flimmerfrei auf einem nichtspeichernden Oszillografen darzustellen oder einen sehr schnellen Vorgang mit hoher Auflösung auf einem einfachen Schreiber aufzuzeichnen, wenn dazu die Taktfrequenz entsprechend erniedrigt wird. Ähnlich wie bei anderen Signalanalysatoren wird durch eine kleine Verzögerungszeit nach dem Trig-
Bild 6-21. Prinzip des Transientenspeichers
6 Literatur
gerereignis eine sog. Pretriggerung und durch eine größere Verzögerungszeit eine sog. Posttriggerung erreicht, d. h., es wird der Signalverlauf vor bzw. nach dem Triggerereignis ausgewählt. Auf dem Raster-Scanner-Prinzip basiert ein extrem schneller Transientendigitalisierer. Ein Signal mit maximal 6 GHz Bandbreite wird auf ein Siliziumplättchen projiziert und hinterlässt eine Spur, die digital abgelesen wird. Für derartige Geräte besteht Bedarf u. a. in der Teilchenphysik und bei digitalen Kommunikationssystemen.
Kapitel 3
DIN 1319-1: Grundlagen der Messtechnik – Teil 1: Grundbegriffe (01.95) DIN 1319-4: Grundlagen der Messtechnik – Teil 4: Auswertung von Messungen: Messunsicherheit (02.99) Doebelin, E.O.: Measurement Systems. 5th ed. New York: McGraw-Hill 2003 Kiencke, U.; Kronmüller, H.; Eger, R.: Messtechnik: Systemtheorie für Elektrotechniker. 5. Aufl. Berlin: Springer 2001 Pichlmaier, J.: Kalibrierung von Gassensoren in befeuchteter Atmosphäre und Modellierung des Feuchteeinflusses auf kapazitive SO2 -Sensoren. Düsseldorf: VDI-Verl. 1994 Richter, W.: Elektrische Messtechnik, Grundlagen. 3. Aufl. Berlin: Verl. Technik 1994 Sydenham, P.H.: Handbook of Measurement Science. Wiley 1999 Tränkler, H.-R.: Taschenbuch der Messtechnik. 4. Aufl. München: Oldenbourg 1996
Czajor, A.: Modellierung der Temperatur- und Feuchteabhängigkeit des Nullpunkts von HalbleiterGassensoren. Düsseldorf: VDI-Verl. 1999 Eigler, H.: Mikrosensorik und Mikroelektronik. Renningen-Malmsheim: Expert-Verl. 2000 Forst, H.-J. (Hrsg.): Sensorik in der Prozessleittechnik. Berlin: VDE-Verl. 1994 Fraden, J.: AIP Handbook of Modern Sensors. Physics, Design and Application. Springer 2003 Gardner, J.W.: Microsensors. Chichester: Wiley 1995 Gardner, J.W.; Varadan, V.K.; Awadelkarim, O. O.: Microsensors, MEMS, and Smart Devices. Chichester: Wiley 2001 Gerlach, G.; Dötzel, W. (Hrsg.): Grundlagen der Mikrosystemtechnik. München: Hanser 1997 Heywang, W.: Sensorik. 4. Aufl. Berlin: Springer 1993 Holmer, R.: Untersuchungen zur Genauigkeitssteigerung der kalibrationsfreien Temperaturmessung mit Halbleiter-pn-Übergängen. Düsseldorf: VDIVerl. 1996 Reichl, H.; u. a.: Halbleitersensoren. Ehningen: Expert-Verl. 1989 Schaumburg, H.: Sensoren. Stuttgart: Teubner 1992 Schaumburg, H. (Hrsg.): Sensoranwendungen. Stuttgart: Teubner 1995 Schubert, J.: Physikalische Effekte. Weinheim: Physik-Verl. 1982 Tränkler, H.-R.; Obermeier, E. (Hrsg.): Sensortechnik. Berlin: Springer 1998 VDI/VDE-Technologiezentrum Informationstechnik GmbH: Technologietrends in der Sensorik. Teltow: VDI/VDE IT 1998 Westbrook, M.H.; Turner, J.D.: Automotive sensors. Bristol, Philadelphia: Inst. of Physics Publishing 1994
Kapitel 2
Kapitel 4
Mark, J.: Beschreibung und Korrektur der Einflusseffekte bei Differenzdruckaufnehmern. Düsseldorf: VDI-Verl. 1998 Profos, P.; Pfeifer, T. (Hrsg.): Handbuch der industriellen Messtechnik. München: Oldenbourg 2002 Schöne, A.: Messtechnik. 2. Aufl. Berlin: Springer 1997
Berlin, H.M.: Principles of Electronic Instrumentation and Measurement. Englewood Cliffs, N.J.: Prentice-Hall 1990 Felderhoff, R.; Freyer, U.: Elektrische und elektronische Messtechnik. München: 7. Aufl. Hanser 2002 Göpel, W.; Hesse, J.; Zemel, J.N. (Eds.): Sensors. Weinheim: VCH-Verl. 1989 ff.
Literatur Kapitel 1
H95
H96
H Messtechnik
Heyne, G.: Elektronische Messtechnik. München: Oldenbourg 1999 Klaasen, K.B.: Electronic Measurement and Instrumentation. Cambridge: Cambridge Univ. Pr. 1996 Klein, J.W.; Düllenkopf, P.; Glasmachers, A.: Elektronische Messtechnik. Stuttgart: Teubner 1992 Pfeiffer, W.: Simulation von Messschaltungen. Berlin: Springer 1994 Schrüfer, E.: Elektrische Messtechnik. 8. Aufl. München: Hanser 2003 Tietze, U.; Schenk, Ch.; Gamm, E.: HalbleiterSchaltungstechnik. Berlin: Springer 2002
Kapitel 5 Lerch, R.: Elektrische Messtechnik. 3. Aufl. Berlin: Springer 2006 Schrüfer, E.: Elektrische Messtechnik. 8. Aufl. München: Hanser 2003
Stöckl, M.; Winterling, K.H.: Elektrische Messtechnik. 8. Aufl. Stuttgart: Teubner 1987
Kapitel 6 Haas, M.: Korrektur von Hysteresefehlern bei Sensoren durch Signalverarbeitung auf der Basis mathematischer Modelle. Düsseldorf: VDI-Verl. 1994 Joppich, M.: Schätzverfahren zur Genauigkeitssteigerung der Geschwindigkeitsmessung über Grund nach dem Dopplerprinzip. Düsseldorf: VDI-Verl. 1994 Löschberger, C.: Modelle zur digitalen Einflussgrößenkorrektur an Sensoren. Düsseldorf: VDI-Verl. 1992 Pfeiffer, W.: Digitale Messtechnik. Berlin: Springer 1988 Schrüfer, E.: Signalverarbeitung. 2. Aufl. München: Hanser 1991
I1
I
Regelungs- und Steuerungstechnik
H. Unbehauen F. Ley
Regelungstechnik H. Unbehauen
1.1 Einordnung der Regelungsund Steuerungstechnik Automatisierte industrielle Prozesse sind gekennzeichnet durch selbsttätig arbeitende Maschinen und Geräte, die häufig sehr komplexe Anlagen oder Systeme bilden. Die Teilsysteme derselben werden heute durch die übergeordnete, stark informationsorientierte Leittechnik koordiniert. Zu ihren wesentlichen Grundlagen zählen die Regelungs- und Steuerungstechnik sowie die Prozessdatenverarbeitung. Ein typisches Merkmal von Regel- und Steuerungssystemen ist, dass sich in ihnen eine zielgerichtete Beeinflussung gewisser Größen (Signale) und eine Informationsverarbeitung abspielt, die N. Wiener [1] veranlasste, für die Gesetzmäßigkeiten dieser Regelungs- und Steuerungsvorgänge (in der Technik, Natur und Gesellschaft) den Begriff der Kybernetik einzuführen. Da Regelungs- und Steuerungstechnik weitgehend geräteunabhängig sind, soll im Weiteren mehr auf die systemtheoretischen als auf die gerätetechnischen Grundlagen eingegangen werden.
1.2 Darstellung im Blockschaltbild In einem Regel- oder Steuerungssystem erfolgt eine Verarbeitung und Übertragung von Signalen. Derartige Systeme werden daher auch als Übertragungssysteme (oder Übertragungsglieder) bezeichnet. Diese besitzen eine eindeutige Wirkungsrichtung, die durch die Pfeilrichtung der Ein- und Ausgangssignale angegeben wird, und sind rückwirkungsfrei. Bei einem Eingrößensystem wirkt jeweils
ein Eingangs- und Ausgangssignal xe (t) bzw. xa (t). Bei Mehrgrößensystemen sind es dementsprechend mehrere Größen am Eingang oder Ausgang des Übertragungsgliedes (auch Teilsystem genannt). Einzelne Übertragungsglieder werden dabei durch Kästchen dargestellt, die über Signale untereinander zu größeren Einheiten (Gesamtsystemen) verbunden werden können. Der Begriff des Systems reicht dabei vom einfachen Eingrößensystem über das Mehrgrößensystem bis hin zu hierarchisch gegliederten Mehrstufensystemen. Bild 1-1 zeigt ein einfaches Beispiel eines Blockschemas. Die wichtigsten bei Blockschaltbildern verwendeten Symbole sind in Tabelle 1-1 aufgeführt. Tabelle 1-1. Die wichtigsten Symbole für Signalverknüpfungen und Systeme im Blockschaltbild
I
Regelungs- und Steuerungstechnik
1 Einführung
I2
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 1-1. Beispiel für ein Blockschaltbild
1.3 Unterscheidung zwischen Regelung und Steuerung Nach DIN 19 226 [2] ist „Regeln ein Vorgang, bei dem eine Größe, die Regelgröße, fortlaufend erfasst (gemessen), mit einer anderen Größe, der Führungsgröße, verglichen und abhängig vom Ergebnis dieses Vergleichs im Sinne der Angleichung an die Führungsgröße beeinflusst wird. Der sich daraus ergebende Wirkungsablauf findet in einem geschlossenen Kreis, dem Regelkreis, statt“. Demgegenüber ist „Steuern“ der Vorgang in einem System, bei dem eine oder mehrere Größen als Eingangsgrößen andere Größen als Ausgangsgrößen aufgrund der dem System eigentümlichen Gesetzmäßigkeiten beeinflussen. Kennzeichnend für das Steuern ist der offene Wirkungsablauf über das einzelne Übertragungsglied oder die Steuerkette. Aus dem Blockschaltbild (Bild 1-2a) erkennt man leicht, dass die Regelung durch folgende Schritte charakterisiert wird: – Messung der Regelgröße y, – Bildung der Regelabweichung e = w−y durch Vergleich des Istwertes der Regelgröße y mit dem Sollwert w (Führungsgröße), – Verarbeitung der Regelabweichung derart, dass durch Verändern der Stellgröße u die Regelabweichung vermindert oder beseitigt wird. Vergleicht man nun eine Steuerung mit einer Regelung, so lassen sich folgende Unterschiede leicht feststellen:
Die Regelung – stellt einen geschlossenen Wirkungsablauf (Regelkreis) dar; – kann wegen des geschlossenen Wirkungsprinzips allen Störungen z entgegenwirken (negative Rückkopplung); – kann instabil werden, d. h., Schwingungen im Kreis klingen dann nicht mehr ab, sondern wachsen auch bei beschränkten Eingangsgrößen w und z (theoretisch) über alle Grenzen an. Die Steuerung – stellt einen offenen Wirkungsablauf (Steuerkette) dar; – kann nur den Störgrößen entgegenwirken, auf die sie ausgelegt wurde; andere Störeinflüsse sind nicht beseitigbar; – kann, sofern das zu steuernde Objekt selbst stabil ist, nicht instabil werden. Gemäß Bild 1-2a besteht ein Regelkreis aus 4 Hauptbestandteilen: Regelstrecke, Messglied, Regler und Stellglied. Anhand dieses Blockschaltbildes ist zu erkennen, dass die Aufgabe der Regelung einer Anlage oder eines Prozesses (Regelstrecke) darin besteht, die vom Messglied zeitlich fortlaufend erfasste Regelgröße y(t) unabhängig von äußeren Störungen z(t) entweder auf einem konstanten Sollwert w(t) zu halten (Festwertregelung oder Störgrößenregelung) oder y(t) einem veränderlichen Sollwert w(t) (Führungsgröße) nachzuführen (Folgeregelung, Nachlaufoder Servoregelung). Diese Aufgabe wird durch ein Rechengerät, den Regler R, ausgeführt. Der Regler bildet die Regelabweichung e(t) = w(t) − y(t), also die Differenz zwischen Sollwert w(t) und Istwert y(t) der Regelgröße, verarbeitet diese entsprechend seiner Funktionsweise (z. B. proportional, integral oder differenzial) und erzeugt ein Signal uR (t), das über
Bild 1-2. Gegenüberstellung a einer Regelung
und b einer Steuerung im Blockschaltbild
1 Einführung
das Stellglied als Stellgröße u(t) auf die Regelstrecke einwirkt und z. B. im Falle der Störgrößenregelung dem Störsignal z(t) entgegenwirkt. Durch diesen geschlossenen Signalverlauf ist der Regelkreis gekennzeichnet, wobei die Reglerfunktion darin besteht, eine eingetretene Regelabweichung e(t) möglichst schnell zu beseitigen oder zumindest klein zu halten. Die hier benutzten Symbole werden in Anlehnung an die international üblichen Bezeichnungen im Folgenden verwendet.
1.4 Beispiele von Regelund Steuerungssystemen Anhand einiger typischer Anwendungsfälle wird im Folgenden die Wirkungsweise einer Regelung und einer Steuerung gezeigt, ohne dass dabei bereits die interne Funktionsweise der Geräte erläutert wird. Bild 1-3 zeigt die schematische Gegenüberstellung einer Regelung und einer Steuerung für eine Raumheizungsanlage. Bei der Steuerung, Bild 1-3a, wird die Außentemperatur ϑA über einen Temperaturfühler gemessen und dem Steuergerät zugeführt. Das Steuergerät verstellt in Abhängigkeit von ϑA über den ˙ Motor M und das Ventil V den Heizwärmestrom Q. Am Steuergerät kann die Steigung der Kennlinie Q˙ = f (ϑA ) voreingestellt werden. Wie aus dem Blockschaltbild hervorgeht, kompensiert eine gut eingestellte Steuerung nur die Auswirkungen einer Änderung der Außentemperatur z2 =ˆ ϑA , jedoch nicht Störungen der Raumtemperatur, z. B. durch Öffnen eines Fensters oder durch starke Sonneneinstrahlung. Im Falle einer Regelung der Raumtemperatur ϑR , Bild 1-3b, wird diese gemessen und mit dem eingestellten Sollwert w (z. B. w = 20 ◦ C) verglichen. Weicht die Raumtemperatur vom Sollwert ab, so wird über einen Regler (R), der die Abweichung verarbeitet, der Heizwärmestrom Q˙ verändert. Sämtliche Änderungen der Raumtemperatur ϑR werden vom Regler verarbeitet und möglichst beseitigt. Anhand der Blockschaltbilder erkennt man wiederum den geschlossenen Wirkungsablauf der Regelung (Regelkreis) und den offenen der Steuerung (Steuerkette). Bild 1-4 zeigt einige weitere Anwendungsbeispiele für Regelungen. Daraus erkennt man anschaulich den Unterschied zwischen Festwertregelungen und Fol-
Bild 1-3. Gegenüberstellung a einer Steuerung und b einer Regelung für eine Raumheizung: Schemaskizzen und zugehörige Blockschaltbilder
geregelungen. So muss z. B. bei einer Dampfturbine die Drehzahl entsprechend dem fest eingestellten Sollwert eingehalten werden (Festwertregelung), während bei der Kursregelung der Sollwert bei der Umfahrung eines Hindernisses u. U. verändert wird und die Kursregelung dann die Aufgabe hat, das Schiff diesem Sollkurs nachzuführen (Folgeregelung). Wie diese Beispiele bereits zeigen, kann die Signalübertragung in Regel- und Steuerungssystemen in verschiedenen Formen, d. h. durch mechanische, hydraulische, pneumatische oder elektrische Hilfsenergie erfolgen. Unabhängig von der technischen Realisierung werden die Signale im Weiteren aber
I3
I4
I Regelungs- und Steuerungstechnik / Regelungstechnik
einzelnen Schritten erst dann weiter, wenn bestimmte Bedingungen erreicht sind, die durch Rückmeldesignale (nicht zu verwechseln mit der Rückkopplung in Regelkreisen), z. B. durch Endschalter, realisiert werden können. Ablaufsteuerungen sind durch ein bestimmtes festes oder variierbares Programm gekennzeichnet, das schrittweise abläuft, wobei die Einzelschritte durch Rückmeldesignale ausgelöst werden. Ein typisches Beispiel für eine kombinierte Zeitplan- und Ablaufsteuerung ist der Waschautomat. Da Programmsteuerungen heute weitgehend in digitaler Technik ausgeführt werden, bezeichnet man sie häufig auch als binäre Steuerungen. In diesen binären Steuerungen werden Signale verwendet, die nur zwei Werte annehmen können. Auf diesem Prinzip beruhen die modernen speicherprogrammierbaren Steuerungen (SPS), auf die ausführlich im Kapitel 14 eingegangen wird. Die Kapitel 2 bis 13 befassen sich mit der Behandlung regelungstechnischer Gesichtspunkte.
2 Modelle und Systemeigenschaften 2.1 Mathematische Modelle
Bild 1-4.a–d. Anwendungsbeispiele für Regelungen
nur hinsichtlich ihrer Information betrachtet und i. Allg. als reine (einheitenlose) mathematische Funktionen aufgefasst. Das eingangs gezeigte Beispiel der Raumheizungssteuerung stellt einen bestimmten Typ einer Steuerung dar, der in die Gruppe der Führungssteuerungen fällt, die im Beharrungszustand durch einen festen Zusammenhang zwischen Eingangs- und Ausgangsgrößen, z. B. durch die Heizkurve, charakterisiert sind. Daneben gibt es noch die so genannten Programmsteuerungen, zu denen die Zeitplansteuerungen, Wegplansteuerungen und Ablaufsteuerungen sowie deren Kombinationen zählen. Zeitplansteuerungen laufen nach einem festen Zeitplan ohne Rückmeldungen ab. Wegplansteuerungen schalten in
Das statische und dynamische Verhalten eines Regeloder Steuerungssystems kann entweder durch physikalische oder andere Gesetzmäßigkeiten analytisch beschrieben oder anhand von Messungen ermittelt und in einem mathematischen Modell, z. B. durch Differenzialgleichungen, algebraische oder logische Gleichungen usw. dargestellt werden. Die spezielle Form hängt hinsichtlich ihrer Struktur und ihrer Parameter dabei im Wesentlichen von den Systemeigenschaften ab. Die wichtigsten Eigenschaften von Regelsystemen sind im Bild 2-1 dargestellt. Mathematische Systemmodelle, die das Verhalten eines realen Systems in abstrahierender Form – eventuell vereinfacht, aber doch genügend genau – beschreiben, bilden gewöhnlich die Grundlage für die Analyse oder Synthese des realen technischen Systems sowie häufig auch für dessen rechentechnischer Simulation [1]. So lassen sich bereits im Entwurfsstadium verschiedenartige Betriebsfälle anhand einer Simulation des Systems leicht überprüfen.
2 Modelle und Systemeigenschaften
Bild 2-1. Gesichtspunkte zur Beschreibung der Eigenschaften von Regelungssystemen
weiteren Verwendung von (2-1) soll allerdings der einfacheren Darstellung wegen auf die Schreibweise xa,s = xa und xe,s = xe übergegangen werden, wobei xa und xe jeweils stationäre Werte von xa (t) und xe (t) darstellen. Beschreibt (2-1) eine Geradengleichung, so bezeichnet man das System als linear. Für ein lineares System gilt das Superpositionsprinzip, das folgenden Sachverhalt beschreibt: Lässt man nacheinander auf den Eingang eines Systems n beliebige Eingangsgrößen xei (t) einwirken und bestimmt man die Systemantworten xai (t), so ergibt sich die Systemantwort auf die Summe der n Eingangsgrößen als Summe der n Antworten xai (t). Ist das Superpositionsprinzip nicht erfüllt, so ist das System nichtlinear. Lineare kontinuierliche Systeme können gewöhnlich durch lineare Differenzialgleichungen beschrieben werden. Als Beispiel sei eine gewöhnliche lineare Differenzialgleichung betrachtet: n
2.2 Systemeigenschaften
i=0
2.2.1 Lineare und nichtlineare Systeme
Man unterscheidet bei Systemen gewöhnlich zwischen dem dynamischen und dem statischen Verhalten. Das dynamische Verhalten oder Zeitverhalten beschreibt den zeitlichen Verlauf der Systemausgangsgröße xa (t) bei vorgegebener Systemeingangsgröße xe (t). Somit stellen xe (t) und xa (t) zwei einander zugeordnete Größen dar. Als Beispiel dafür sei im Bild 2-2 die Antwort xa (t) eines Systems auf eine sprungförmige Veränderung der Eingangsgröße xe (t) betrachtet. In diesem Beispiel beschreibt xa (t) den zeitlichen Übergang von einem stationären Anfangszustand zur Zeit t 0 in einen stationären Endzustand (theoretisch für t → ∞) xa (∞). Variiert man nun – wie im Bild 2-3 dargestellt – die Sprunghöhe xe,s = const und trägt die sich einstellenden stationären Werte der Ausgangsgröße xa,s = xa (∞) über xe,s auf, so erhält man die statische Kennlinie xa,s = f (xe,s ) ,
di xa (t) d j xe (t) = b (t) . j dti dt j j=0 n
ai (t)
(2-2)
Wie man leicht sieht, gilt auch hier das Superpositionsprinzip. Da heute für die Behandlung linearer Systeme eine weitgehend abgeschlossene Theorie zur Verfügung steht, ist man beim Auftreten von Nichtlinearitäten i. Allg. bemüht, eine Linearisierung durchzuführen. In vielen Fällen ist es möglich, durch einen linearisierten Ansatz das Systemverhalten hinreichend genau zu beschreiben. Die Durchführung der Linearisierung hängt vom jeweiligen nichtlinearen Charakter des Systems ab. Daher wird im Weiteren zwischen der Linearisierung einer statischen Kennlinie und der Linearisierung einer nichtlinearen Differenzialgleichung unterschieden. (a) Linearisierung einer statischen Kennlinie Wird die nichtlineare Kennlinie für das statische Verhalten eines Systems durch xa = f (xe ), also durch
(2-1)
die das statische Verhalten oder Beharrungsverhalten des Systems in einem gewissen Arbeitsbereich beschreibt. Gleichung (2-1) gibt also den Zusammenhang der Signalwerte im Ruhezustand an. Bei der
Bild 2-2. Beispiel für das dynamische Verhalten eines Sys-
tems
I5
I6
I Regelungs- und Steuerungstechnik / Regelungstechnik
(b) Linearisierung nichtlinearer Differenzialgleichungen Ein nichtlineares dynamisches System mit der Eingangsgröße xe (t) = u(t) und der Ausgangsgröße xa (t) = y(t) werde beschrieben durch die nichtlineare Differenzialgleichung 1. Ordnung y˙ (t) = f [ y(t), u(t)] ,
Bild 2-3. Beispiel für a das dynamische und b das statische
Verhalten eines Systems
(2-1), beschrieben, so kann diese nichtlineare Gleichung im jeweils betrachteten Arbeitspunkt ( x¯e , x¯a ) in die Taylor-Reihe d f (xe − x¯e ) xa = f ( x¯e ) + dxe xe = x¯e 1 d2 f · 2 + (xe − x¯e )2 + . . . (2-3) 2! dx x = x¯ e
e
e
entwickelt werden, siehe A 9.2.1 und A 11.2.1. Sind die Abweichungen (xe − x¯e ) vom Arbeitspunkt klein, so können die Terme mit den höheren Ableitungen vernachlässigt werden, und aus (2-3) folgt die lineare Beziehung xa − x¯a ≈ K(xe − x¯e ) , mit
x¯a = f ( x¯e ) und
d f K= . dxe xe = x¯e
Dieselbe Vorgehensweise ist auch für eine Funktion mit zwei oder mehreren unabhängigen Variablen xa = f (xe1 , xe2 ) möglich. In diesem Fall erhält man analog zu (2-4) die lineare Beziehung xa − x¯a ≈ K1 (xe1 − x¯e1 ) + K2 (xe2 − x¯e2 ) .
die in der Umgebung einer Ruhelage ( y¯ , u¯ ) linearisiert werden soll. Eine Ruhelage y¯ zu einer konstanten Eingangsgröße u¯ ist dadurch gekennzeichnet, dass y(t) zeitlich konstant ist, d. h., es gilt y˙ (t) = 0. Man erhält zu einer gegebenen Eingangsgröße u¯ die Ruhelagen des Systems durch Lösen der Gleichung 0 = f ( y¯ , u¯ ). Bezeichnet man mit y∗ (t) die Abweichung der Variablen y(t) von der Ruhelage y¯ , dann gilt y(t) = y¯ + y∗ (t), und daraus folgt y˙(t) = y˙∗ (t). Ganz entsprechend ergibt sich für die zweite Variable u(t) = u¯ + u∗ (t). Die Taylor-Reihenentwicklung von (2-6) um die Ruhelage (¯y, u¯ ) liefert bei Vernachlässigung der Terme mit den höheren Ableitungen näherungsweise die lineare Differenzialgleichung y˙ ∗ (t) ≈ Ay∗ (t) + Bu∗(t) ,
(2-5)
(2-7)
mit
∂ f (y, u) ∂ f (y, u) y = y¯ und B = . ∂y ∂u u = u¯ u = u¯ y = y¯ Ganz entsprechend kann auch bei nichtlinearen Vektordifferenzialgleichungen A=
x˙ (t) = f [x(t), u(t)] ,
mit
x(t) = [x1 (t) . . . xn (t)] , T
u(t) = [u1 (t) . . . ur (t)]T
(2-8)
vorgegangen werden. Dabei stellen f (x, u), x(t) und u(t) Spaltenvektoren dar. Hierbei liefert die Linearisierung die lineare Vektordifferenzialgleichung x˙ ∗ (t) = Ax∗ (t) + Bu∗ (t) ,
(2-4)
(2-6)
(2-9)
wobei A und B als Jacobi-Matrizen die partiellen Ableitungen enthalten: ⎡ ⎤ ⎢⎢⎢ ∂ f1 (x, u) ∂ f1 (x, u) ⎥⎥⎥ ⎢⎢⎢ ⎥⎥ ... ⎢⎢⎢ ∂x1 ∂xn ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ .. .. ⎥⎥⎥ A = ⎢⎢⎢ (2-10) . . ⎢⎢⎢⎢ ⎥⎥⎥⎥ ∂ fn (x, u) ⎥⎥ ⎢⎢⎢ ∂ fn (x, u) ⎥⎦ ... ⎣ x = x¯ ∂x1 ∂xn u = u¯
2 Modelle und Systemeigenschaften
⎡ ⎤ ⎢⎢⎢ ∂ f1 (x, u) ∂ f1 (x, u) ⎥⎥⎥ ⎢⎢⎢ ⎥⎥ ... ⎢⎢⎢ ∂u1 ∂ur ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ .. .. ⎥⎥⎥ B = ⎢⎢⎢ . . ⎥⎥ ⎢⎢⎢⎢ ∂ fn (x, u) ⎥⎥⎥⎥ ⎢⎢⎢ ∂ fn (x, u) ⎥⎦ ... ⎣ x = x¯ ∂u1 ∂ur u = u¯
(2-11)
2.2.2 Systeme mit konzentrierten und verteilten Parametern
Man kann sich ein Übertragungssystem aus endlich vielen idealisierten einzelnen Elementen zusammengesetzt denken, z. B. Ohm’schen Widerständen, Kapazitäten, Induktivitäten, Dämpfern, Federn, Massen usw. Derartige Systeme werden als Systeme mit konzentrierten Parametern bezeichnet. Diese werden durch gewöhnliche Differenzialgleichungen beschrieben. Besitzt ein System unendlich viele, unendlich kleine Einzelelemente der oben angeführten Art, dann stellt es ein System mit verteilten Parametern dar, das durch partielle Differenzialgleichungen beschrieben wird. Ein typisches Beispiel hierfür ist eine elektrische Leitung. Der Spannungsverlauf auf einer Leitung ist eine Funktion von Ort und Zeit und damit nur durch eine partielle Differenzialgleichung beschreibbar. 2.2.3 Zeitvariante und zeitinvariante Systeme
Sind die Systemparameter nicht konstant, sondern ändern sie sich in Abhängigkeit von der Zeit, dann ist das System zeitvariant (zeitvariabel, nichtstationär). Ist das nicht der Fall, dann wird das System als zeitinvariant bezeichnet. Beispiele für zeitvariante Systeme sind: Rakete (Massenänderungen), Kernreaktor (Abbrand), chemische Prozesse (Verschmutzung). Häufiger und wichtiger sind zeitinvariante Systeme, deren Parameter konstant sind. Bei diesen Systemen hat z. B. eine zeitliche Verschiebung des Eingangssignals xe (t) um t0 eine gleiche Verschiebung des Ausgangssignals xa (t) zur Folge, ohne dass dabei xa (t) sonst verändert wird. 2.2.4 Systeme mit kontinuierlicher und diskreter Arbeitsweise
Ist eine Systemvariable (Signal) y, z. B. die Eingangsoder Ausgangsgröße eines Systems, zu jedem beliebigen Zeitpunkt gegeben, und ist sie innerhalb ge-
Bild 2-4. Unterscheidungsmerkmale für kontinuierliche und diskrete Signale a kontinuierlich, b quantisiert, c zeitdiskret, d zeitdiskret und quantisiert
wisser Grenzen stetig veränderlich, dann spricht man von einem kontinuierlichen Signalverlauf (Bild 2-4a). Kann das Signal nur gewisse diskrete Amplitudenwerte annehmen, dann liegt ein quantisiertes Signal vor (Bild 2-4b). Ist hingegen der Wert des Signals nur zu bestimmten diskreten Zeitpunkten bekannt, so handelt es sich um ein zeitdiskretes (oder kurz: diskretes) Signal (Bild 2-4c). Sind die Signalwerte zu äquidistanten Zeitpunkten mit dem Intervall T gegeben, so spricht man von einem Abtastsignal mit der Abtastperiode T . Systeme, in denen derartige Signale verarbeitet werden, bezeichnet man auch als Abtastsysteme. In sämtlichen Regelsystemen, in denen ein Digitalrechner z. B. die Funktionen eines Reglers übernimmt, können von diesem nur zeitdiskrete quantisierte Signale verarbeitet werden (Bild 2-4d). 2.2.5 Systeme mit deterministischen oder stochastischen Variablen
Eine Systemvariable kann entweder deterministischen oder stochastischen Charakter aufweisen. Die
I7
I8
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 2-5. a stabiles und b instabiles Systemverhalten xa (t) bei beschränkter Eingangsgröße xe (t)
deterministischen oder stochastischen Eigenschaften beziehen sich sowohl auf die in einem System auftretenden Signale als auch auf die Parameter des mathematischen Systemmodells. Im deterministi-
schen Fall sind die Signale und das mathematische Modell eines Systems eindeutig bestimmt. Das zeitliche Verhalten des Systems lässt sich somit reproduzieren. Im stochastischen Fall hingegen können sowohl die auf das System einwirkenden Signale als auch das Systemmodell, z. B. ein Koeffizient der Systemgleichung, stochastischen, also regellosen Charakter, besitzen. Der Wert dieser in den Signalen oder im System auftretenden Variablen kann daher zu jedem Zeitpunkt nur durch stochastische Gesetzmäßigkeiten beschrieben werden und ist somit nicht mehr reproduzierbar. 2.2.6 Kausale Systeme
Bei einem kausalen System hängt die Ausgangsgröße xa (t1 ) zu einem beliebigen Zeitpunkt t1 nur vom Verlauf der Eingangsgröße xe (t) bis zu diesem Zeitpunkt t1 ab. Es muss also erst eine Ursache auftreten,
Bild 2-6. Symbolische Darstellung des System-
begriffs: a Eingrößensystem, b Mehrgrößensystem, c Mehrstufensystem
3 Beschreibung linearer kontinuierlicher Systeme im Zeitbereich
bevor sich eine Wirkung zeigt. Alle realen Systeme sind daher kausal. 2.2.7 Stabile und instabile Systeme
Ein System ist genau dann stabil, wenn jedes beschränkte zulässige Eingangssignal xe (t) ein ebenfalls beschränktes Ausgangssignal xa (t) zur Folge hat. Ist dies nicht der Fall, dann ist das System instabil (Bild 2-5). 2.2.8 Eingrößen- und Mehrgrößensysteme
Ein System, welches genau eine Eingangs- und eine Ausgangsgröße besitzt, heißt Eingrößensystem. Ein System mit mehreren Eingangsgrößen und/oder Ausgangsgrößen heißt Mehrgrößensystem. Große Systeme sind häufig in mehreren Stufen angeordnet. Man bezeichnet sie deshalb auch als Mehrstufensysteme (Bild 2-6). Neben den hier diskutierten Systemeigenschaften gibt es noch einige weitere. So sind beispielsweise die Steuerbarkeit und Beobachtbarkeit eines Systems wesentliche Eigenschaften, die das innere Systemverhalten beschreiben.
3 Beschreibung linearer kontinuierlicher Systeme im Zeitbereich 3.1 Beschreibung mittels Differenzialgleichungen Das Übertragungsverhalten linearer kontinuierlicher Systeme kann durch lineare Differenzialgleichungen beschrieben werden. Im Falle von Systemen mit konzentrierten Parametern führt dies auf gewöhnliche lineare Differenzialgleichungen gemäß (3-2) in 2.2,
Bild 3-1. Ein elektrischer Schwingkreis
während bei Systemen mit verteilten Parametern sich partielle lineare Differenzialgleichungen als mathematische Modelle zur Systembeschreibung ergeben. Anhand einiger Beispiele soll die Aufstellung der das System beschreibenden Differenzialgleichungen gezeigt werden. 3.1.1 Elektrische Systeme
Für die Behandlung elektrischer Netzwerke benötigt man die Kirchhoff’schen Gesetze: 1. Die Summe der Ströme in einem Knotenpunkt ist gleich Null: ii = 0. 2. Die Summe der Spannungen bei einem Umlauf in einer Masche ist gleich Null: ui = 0. Wendet man diese Gesetze auf die beiden Maschen und den Knoten A des in Bild 3-1 dargestellten Schwingkreises an und setzt voraus, dass i3 = 0 ist, so erhält man nach kurzer Rechnung die lineare Differenzialgleichung 2. Ordnung mit konstanten Koeffizienten T 22
d2 xa dxa dxe + xa = xe + T 1 , + T1 dt dt dt2
(3-1)
√ mit den Abkürzungen T 1 = RC und T 2 = LC. Zur eindeutigen Lösung müssen noch die beiden Anfangsbedingungen xa (0) und x˙a (0) gegeben sein. 3.1.2 Mechanische Systeme
Zum Aufstellen der Differenzialgleichungen von mechanischen Systemen benötigt man die folgenden Gesetze: – Newton’sches Gesetz, – Kräfte- und Momentengleichgewichte, – Erhaltungssätze von Impuls, Drehimpuls und Energie. Als Beispiel für ein mechanisches System soll die Differenzialgleichung eines gedämpften Schwingers nach Bild 3-2 ermittelt werden. Dabei bezeichnen c die Federkonstante, d die Dämpfungskonstante und m die Masse desselben. Die Größen x1 (= xa ), x2 und xe beschreiben jeweils die Geschwindigkeiten in den gekennzeichneten Punkten. Die Anwendung obiger Gesetze liefert nach kurzer Zwischenrechnung dieselbe Differenzialgleichung (3-1) wie bei dem zuvor
I9
I10
I Regelungs- und Steuerungstechnik / Regelungstechnik
cF , cR α Di , Da
Bild 3-2. Gedämpfter mechanischer Schwinger
betrachteten elektrischen Schwingkreis, wobei aller√ dings T 1 = m/d und T 2 = m/c gilt. Beide Systeme sind daher analog zueinander. 3.1.3 Thermische Systeme
Zur Bestimmung der Differenzialgleichungen thermischer Systeme benötigt man – die Erhaltungssätze der inneren Energie oder Enthalpie sowie – die Wärmeleitungs- und Wärmeübertragungsgesetze. Als Beispiel soll das mathematische Modell des Stoffund Wärmetransports in einem dickwandigen, von einem Fluid durchströmten Rohr gemäß Bild 3-3 betrachtet werden. Zunächst werden die folgenden vereinfachenden Annahmen getroffen: – Die Temperatur, sowohl im Fluid, als auch in der Rohrwand, ist nur von der Koordinate z abhängig. – Der gesamte Wärmetransport in Richtung der Rohrachse wird nur durch den Massetransport, nicht aber durch Wärmeleitung innerhalb des Fluids oder der Rohrwand bewirkt. – Die Strömungsgeschwindigkeit des Fluids ist im ganzen Rohr konstant und hat nur eine Komponente in z-Richtung. – Die Stoffwerte vom Fluid und Rohr sind über die Rohrlänge konstant. – Nach außen hin ist das Rohr ideal isoliert. Mit folgenden Bezeichnungen ϑ(z, t) Fluidtemperatur Θ(z, t) Rohrtemperatur m ˙ Fluidstrom L Rohrlänge wF Fluidgeschwindigkeit
F , R Dichte (Fluid, Rohr)
spezifische Wärmekapazität (Fluid, Rohr) Wärmeübergangszahl Fluid/Rohr innerer und äußerer Rohrdurchmesser
sollen nun die Differenzialgleichungen des mathematischen Modells hergeleitet werden. Betrachtet wird ein Rohrelement der Länge dz. Das zugehörige Rohrwandvolumen sei dVR , das entsprechende Fluidvolumen sei dVF . Für die im Bild 3-3 eingetragenen Wärmemengen gilt: dQ1 = cF ϑm ˙ dt ∂ϑ dQ2 = cF ϑ + dz m ˙ dt ∂z dQ3 = α(ϑ − Θ)πDi dz dt . Während des Zeitintervalls dt ändert sich im Fluidelement dVF die gespeicherte Wärmemenge um π ∂ϑ dQF = F D2i dz cF dt . 4 ∂t Nun lässt sich die Wärmebilanzgleichung für das Fluid im betrachteten Zeitintervall dt angeben: dQF = dQ1 − dQ2 − dQ3 .
(3-2)
Für die Wärmespeicherung im Rohrwandelement dVR folgt andererseits im selben Zeitintervall: dQR = R
π 2 ∂Θ dt . Da − D2i dz cR 4 ∂t
Damit lässt sich nun die Wärmebilanzgleichung für das Rohrwandelement angeben. Es gilt dQR = dQ3 ,
(3-3)
da nach den getroffenen Voraussetzungen an der Rohraußenwand eine ideale Wärmeisolierung vor-
Bild 3-3. Ausschnitt aus dem untersuchten Rohr
3 Beschreibung linearer kontinuierlicher Systeme im Zeitbereich
handen ist. Werden in (3-2) und (3-3) die zuvor aufgestellten Beziehungen eingesetzt, so erhält man mit den Abkürzungen απDi K1 = π , D2i F cF 4
απDi K2 = π 2 Da − D2i R cR 4
m ˙ wF = π D2 QF 4 i die beiden partiellen Differenzialgleichungen ∂ϑ ∂ϑ + wF = K1 (Θ − ϑ) (3-4a) ∂t ∂z und (3-4b)
die das hier behandelte System beschreiben. Zur Lösung wird außer den beiden Anfangsbedingungen ϑ(z, 0) und Θ(z, 0) auch noch die Randbedingung ϑ(0, t) benötigt. Als Spezialfall ergibt sich das dünnwandige Rohr, bei dem dQ3 = 0 wird, da keine Wärmespeicherung stattfindet. Für diesen Fall geht (3-4a) über in ∂ϑ ∂ϑ + wF =0. ∂t ∂z
(3-5)
Bei Systemen mit örtlich verteilten Parametern braucht die Eingangsgröße xe (t) nicht unbedingt in den Differenzialgleichungen aufzutreten, sie kann vielmehr auch in die Randbedingungen eingehen. Im vorliegenden Fall wird als Eingangsgröße die Fluidtemperatur am Rohreingang betrachtet: xe (t) = ϑ(0, t) t > 0. Entsprechend wird als Ausgangsgröße xa (t) = ϑ(L, t) die Fluidtemperatur am Ende des Rohres der Länge L definiert. Unter der zusätzlichen Annahme ϑ(z, 0) = 0 erhält man als Lösung von (3-5) xa (t) = xe (t − T t ) mit T t =
L . wF
3.2.1 Die Übergangsfunktion (Normierte Sprungantwort)
Für die weiteren Überlegungen wird der Begriff der Sprungfunktion (auch Einheitssprung) benötigt: 1 für t ≥ 0 . σ(t) = (3-7) 0 für t < 0
und
∂Θ = K2 (ϑ − Θ) , ∂t
3.2 Beschreibung mittels spezieller Ausgangssignale
Die sogenannte Sprungantwort lässt sich definieren als die Reaktion xa (t) des Systems auf eine sprungförmige Veränderung der Eingangsgröße xe (t) = xˆe σ(t)
mit
xˆe = const ,
vgl. Bild 3-4. Die Übergangsfunktion stellt dann die auf die Sprunghöhe xˆe bezogene Sprungantwort h(t) =
1 xa (t) xˆe
(3-8)
dar, die bei einem kausalen System die Eigenschaft h(t) = 0 für t < 0 besitzt. 3.2.2 Die Gewichtsfunktion (Impulsantwort)
Die Gewichtsfunktion g(t) ist definiert als die Antwort des Systems auf die Impulsfunktion (Einheitsimpuls oder Dirac-Impuls) δ(t). Dabei ist δ(t) keine Funktion im Sinne der klassischen Analysis, sondern muss als verallgemeinerte Funktion oder Distribution aufgefasst werden [1], vgl. A 8.3. Der Einfachheit halber wird σ(t) näherungsweise als Rechteckfunktion
(3-6)
Diese Gleichung beschreibt somit den reinen Transportvorgang im Rohr. Die Zeit T t , um die die Ausgangsgröße xa (t) der Eingangsgröße xe (t) nacheilt, wird als Totzeit bezeichnet.
Bild 3-4. Zur Definition der Übergangsfunktion h(t) und der Gewichtsfunktion g(t)
I11
I12
I Regelungs- und Steuerungstechnik / Regelungstechnik
⎧ 1 ⎪ ⎪ ⎪ ⎪ ⎨ ε rε = ⎪ ⎪ ⎪ ⎪ ⎩0
für
0tε
(3-9)
sonst
mit kleinem positiven ε beschrieben (vgl. Bild 3-5). Somit ist die Impulsfunktion definiert durch δ(t) = lim rε (t)
(3-10)
ε→0
mit den Eigenschaften "∞ δ(t) = 0
für t 0 und
δ(t) dt = 1 . −∞
Gewöhnlich wird die δ-Funktion gemäß Bild 3-5b für t = 0 symbolisch als Pfeil der Länge 1 dargestellt. Man bezeichnet die Länge 1 als die Impulsstärke (zu beachten ist, dass für die Höhe des Impulses dabei weiterhin δ(0) = ∞ gilt). Im Sinne der Distributionentheorie besteht zwischen der δ-Funktion und der Sprungfunktion σ(t) der Zusammenhang dσ(t) . (3-11) dt Entsprechend gilt zwischen der Gewichtsfunktion g(t) und der Übergangsfunktion h(t) die Beziehung δ(t) =
d h(t) . (3-12a) dt Bezeichnet man den Wert von h(t) für t = 0+ mit h(0+), so lässt sich h(t) in der Form g(t) =
h(t) = h0 (t) + h(0+) σ(t) darstellen, wobei angenommen wird, dass der sprungfreie Anteil h0 (t) auf der gesamten t-Achse stetig und stückweise differenzierbar ist. Damit kann (3-12a) auch in der Form ˙ = h˙ 0 (t) + h(0+) δ(t) g(t) = h(t)
(3-12b)
geschrieben werden.
3.2.3 Das Faltungsintegral (Duhamel’sches Integral)
Bei den folgenden Überlegungen wird als das zu beschreibende dynamische System die Regelstrecke mit der Eingangsgröße xe (t) = u(t) und der Ausgangsgröße xa (t) = y(t) gewählt. Es sei jedoch darauf hingewiesen, dass diese Überlegungen selbstverständlich allgemein gültig sind. Das Übertragungsverhalten eines kausalen linearen zeitinvarianten Systems ist durch die Kenntnis eines Funktionspaares [yi (t); ui (t)] eindeutig bestimmt. Kennt man insbesondere die Gewichtsfunktion g(t), so kann für ein beliebiges Eingangssignal u(t) das Ausgangssignal y(t) mithilfe des Faltungsintegrals "t y(t) = g(t − τ)u(τ) dτ (3-13) 0
bestimmt werden, siehe A 25.6. Umgekehrt kann bei bekanntem Verlauf von u(t) und y(t) durch eine Umkehrung der Faltung die Gewichtsfunktion g(t) berechnet werden. Sowohl die Gewichtsfunktion g(t) als auch die Übergangsfunktion h(t) sind für die Beschreibung linearer Systeme von großer Bedeutung, da sie die gesamte Information über deren dynamisches Verhalten enthalten.
3.3 Zustandsraumdarstellung 3.3.1 Zustandsraumdarstellung für Eingrößensysteme
Am Beispiel des im Bild 3-6 dargestellten RLCNetzwerkes soll die Systembeschreibung in Form der Zustandsraumdarstellung in einer kurzen Einführung behandelt werden. Das dynamische Verhalten des Systems ist für alle Zeiten t t0 vollständig definiert, wenn – die Anfangswerte uC (t0 ), i(t0 ) und – die Eingangsgröße uK (t) für t t0 bekannt sind. Durch diese Angaben lassen sich die
Bild 3-5. a Annäherung der δ(t)-Funktion; b symbolische Darstellung der δ-Funktion
Bild 3-6. RLC-Netzwerk
3 Beschreibung linearer kontinuierlicher Systeme im Zeitbereich
Größen i(t) und uC (t) für alle Werte t t0 bestimmen. Die Größen i(t) und uC (t) charakterisieren den „Zustand“ des Netzwerkes und werden aus diesem Grund als dessen Zustandsgrößen bezeichnet. Für dieses Netzwerk gelten folgende Beziehungen: di + Ri + uC = uK , dt duC =i. C dt L
(3-14a) (3-14b)
Aus (3-14a,b) erhält man LC
d 2 uC duC + uC = uK . + RC 2 dt dt
Diese lineare Differenzialgleichung 2. Ordnung beschreibt das System bezüglich des EingangsAusgangs-Verhaltens vollständig. Man kann aber zur Systembeschreibung auch die beiden ursprünglichen linearen Differenzialgleichungen 1. Ordnung, also (3-14a,b), benutzen. Dazu fasst man diese beiden Gleichungen zweckmäßigerweise mithilfe der Vektorschreibweise zu einer linearen Vektordifferenzialgleichung 1. Ordnung ⎤ ⎤ ⎡ ⎡ ⎢⎢⎢ di ⎥⎥⎥ ⎢⎢⎢ R 1 ⎥⎥⎥ ⎡ ⎤ ⎥⎥⎥⎥ ⎢⎢⎢⎢ ⎢⎢⎢⎢ − − ⎥⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢ ⎥ ⎢⎢⎢ dt ⎥⎥⎥ ⎢ L L ⎥⎥⎥ i (3-15) + ⎢⎢⎢⎢⎢ L ⎥⎥⎥⎥⎥ uK ⎥⎥⎥ ⎥ = ⎢⎢⎢⎢⎢ ⎢⎢⎢ ⎣ ⎦ ⎥⎥⎥ uC ⎢⎢⎢ duC ⎥⎥⎥⎥⎥ ⎢⎢⎢ 1 0 0 ⎥⎦ ⎥ ⎢⎣ ⎢⎣ C dt ⎦ mit dem Anfangswertvektor i(t0 ) uC (t0 ) zusammen. Diese lineare Vektordifferenzialgleichung 1. Ordnung beschreibt den Zusammenhang zwischen der Eingangsgröße und den Zustandsgrößen. Man benötigt nun aber noch eine Gleichung, die die Abhängigkeit der Ausgangsgröße von den Zustandsgrößen und der Eingangsgröße angibt. In diesem Beispiel gilt, wie man direkt sieht, für die Ausgangsgröße y(t) = uC (t) . Gewöhnlich stellt die Ausgangsgröße eine Linearkombination der Zustandsgrößen und der Eingangsgröße dar. Allgemein hat die Zustandsraumdarstellung für Eingrößensysteme daher folgende Form:
x˙ = Ax + bu ,
x(t0 ) = x0 ,
(3-16)
y = c x + du . (3-17) Dabei beschreibt (3-16) ein lineares Differenzialgleichungssystem 1. Ordnung für die Zustandsgrößen x1 , x2 , . . . , xn , die zum Zustandsvektor x = [x1 . . . xn ]T zusammengefasst werden, wobei die Eingangsgröße u multipliziert mit dem Vektor b als Störterm auftritt. Gleichung (3-17) ist dagegen eine rein algebraische Gleichung, die die lineare Abhängigkeit der Ausgangsgröße von den Zustandsgrößen und der Eingangsgröße angibt. Mathematisch beruht die Zustandsraumdarstellung auf dem Satz, dass man jede lineare Differenzialgleichung n-ter Ordnung in n gekoppelte Differenzialgleichungen 1. Ordnung umwandeln kann, siehe A 26. Vergleicht man die Darstellung gemäß (3-16) und (3-17) mit den Gleichungen des oben betrachteten Beispiels, so folgt: ⎤ ⎡ ⎢⎢⎢⎢ i(t0 ) ⎥⎥⎥⎥ x1 i ⎥⎥⎦ , x= = , x0 = ⎢⎢⎣ uC x2 uC (t0 ) ⎤ ⎡ ⎡ ⎤ ⎢⎢⎢ R 1 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎢⎢⎢ − − ⎥⎥⎥ ⎢⎢⎢ L L ⎥⎥⎥ ⎢⎢ ⎥⎥ A = ⎢⎢⎢ ⎥⎥ , b = ⎢⎢⎢⎢⎢ L ⎥⎥⎥⎥⎥ ; u = uK , ⎥ ⎥ ⎢⎢⎢ 1 ⎢⎣ 0 ⎥⎦ 0 ⎥⎥⎦ ⎣ C T
cT = [0, 1] ;
d = 0.
3.3.2 Zustandsraumdarstellung für Mehrgrößensysteme
Für lineare Mehrgrößensysteme mit r Eingangsgrößen und m Ausgangsgrößen gehen (3-16), (3-17) in die allgemeine Form x˙ = Ax + Bu mit der Anfangsbedingung x(t0 ) , (3-18) y = Cx + Du (3-19) über, wobei die folgenden Beziehungen gelten: ⎡ ⎤ ⎢⎢⎢ x1 ⎥⎥⎥ ⎢⎢ . ⎥⎥ Zustandsvektor x = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , ⎢⎣ ⎥⎦ xn ⎡ ⎤ ⎢⎢⎢ u1 ⎥⎥⎥ Eingangsvektor ⎢⎢ . ⎥⎥ u = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , (Steuervektor) ⎢⎣ ⎥⎦ ur
I13
I14
I Regelungs- und Steuerungstechnik / Regelungstechnik
Ausgangsvektor
Systemmatrix A Steuermatrix B Ausgangs- oder C Beobachtungsmatrix Durchgangsmatrix D
⎡ ⎤ ⎢⎢⎢ y1 ⎥⎥⎥ ⎢⎢ . ⎥⎥ m = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥⎥⎥ , ⎢⎣ ⎥⎦ ym
Zustandskurve oder Trajektorie des Systems bezeichnet wird.
(n × n)-Matrix , (n × r)-Matrix , (m × n)-Matrix ,
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
(m × r)-Matrix .
4.1 Die Laplace-Transformation [1]
Selbstverständlich schließt die allgemeine Darstellung von (3-18) und (3-19) auch die Zustandsraumdarstellung des Eingrößensystems mit ein. Die Verwendung der Zustandsraumdarstellung hat verschiedene Vorteile, von denen hier einige genannt seien: 1. Ein- und Mehrgrößensysteme können formal gleich behandelt werden. 2. Diese Darstellung ist sowohl für die theoretische Behandlung (analytische Lösungen, Optimierung) als auch für die numerische Berechnung gut geeignet. 3. Die Berechnung des Verhaltens des homogenen Systems unter Verwendung der Anfangsbedingung x(t0 ) ist sehr einfach. 4. Schließlich gibt diese Darstellung einen besseren Einblick in das innere Systemverhalten. So lassen sich allgemeine Systemeigenschaften wie die Steuerbarkeit oder Beobachtbarkeit des Systems mit dieser Darstellungsform definieren und überprüfen. Durch (3-18) und (3-19) werden lineare Systeme mit konzentrierten Parametern beschrieben. Die Zustandsraumdarstellung lässt sich jedoch auch auf nichtlineare Systeme mit konzentrierten Parametern erweitern: x˙ = f 1 (x, u, t)
(Vektordifferenzialgleichung) , (3-20)
y = f 2 (x, u, t)
(Vektorgleichung) . (3-21)
Der Zustandsvektor x(t) stellt für den Zeitpunkt t einen Punkt in einem n-dimensionalen euklidischen Raum (Zustandsraum) dar. Mit wachsender Zeit t ändert dieser Zustandspunkt des Systems seine räumliche Position und beschreibt dabei eine Kurve, die als
Die Laplace-Transformation kann als wichtiges Hilfsmittel zur Lösung linearer Differenzialgleichungen mit konstanten Koeffizienten angesehen werden. Bei regelungstechnischen Aufgaben erfüllen die zu lösenden Differenzialgleichungen meist die zum Einsatz der Laplace-Transformation notwendigen Voraussetzungen. Die Laplace-Transformation ist eine Integraltransformation, die einer großen Klasse von Originalfunktionen f (t) umkehrbar eindeutig eine Bildfunktion F(s) zuordnet, siehe A 23.2. Diese Zuordnung erfolgt über das Laplace-Integral von f (t), also durch "∞ f (t)e−st dt = L { f (t)} , (4-1) F(s) = 0
wobei im Argument dieser Laplace-Transformierten F(s) die komplexe Variable s = σ + jω auftritt und L die Operatorschreibweise darstellt. Die Voraussetzungen für die Gültigkeit von (4-1) sind: (a) f (t) = 0 für t < 0; (b) das Integral in (4-1) muss konvergieren. Bei der Behandlung dynamischer Systeme ist die Originalfunktion f (t) gewöhnlich eine Zeitfunktion. Da die komplexe Variable s die Frequenz ω enthält, wird die Bildfunktion F(s) oft auch als Frequenzfunktion bezeichnet. Damit ermöglicht die Laplace-Transformation gemäß (4-1) den Übergang vom Zeitbereich (Originalbereich) in den Frequenzbereich (Bildbereich). Die sogenannte Rücktransformation oder inverse Laplace-Transformation, also die Gewinnung der Originalfunktion aus der Bildfunktion wird durch das Umkehrintegral c+j "∞ 1 F(s)est ds = L −1 {F(s)} , t > 0 f (t) = 2πj c−j ∞
(4-2)
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
ermöglicht, wobei f (t) = 0 für t < 0 gilt, siehe A 23.2. Die Laplace-Transformation ist eine umkehrbar eindeutige Zuordnung von Originalfunktion und Bildfunktion. Daher braucht in vielen Fällen das Umkehrintegral gar nicht berechnet zu werden; es können vielmehr Korrespondenztafeln verwendet werden, in denen für viele Funktionen die oben genannte Zuordnung enthalten ist, siehe Tabelle A 23.2. Die Lösung von Differenzialgleichungen mithilfe der Laplace-Transformation erfolgt gemäß Bild 4-1 in folgenden drei Schritten: 1. Transformation der Differenzialgleichung in den Bildbereich, 2. Lösung der algebraischen Gleichung im Bildbereich, 3. Rücktransformation der Lösung in den Originalbereich. Beispiel: Gegeben ist die Differenzialgleichung f¨(t) + 3 f˙(t) + 2 f (t) = e−t mit den Anfangsbedingungen f (0+) = f˙(0+) = 0. Die Lösung erfolgt in den zuvor angegebenen Schritten: 1. Schritt: s2 F(s) + 3sF(s) + 2F(s) =
1 . s+1
2. Schritt: F(s) =
1 1 · . s + 1 s2 + 3s + 2
3. Schritt: Vor der Rücktransformation wird F(s) in Partialbrüche zerlegt, da die Korrespondenztafeln nur bestimmte Standardfunktionen enthalten: F(s) =
1 1 1 − + . s + 2 s + 1 (s + 1)2
Mittels der Korrespondenzen aus Tabelle A 23-2 folgt durch die inverse Laplace-Transformation als Lösung der gegebenen Differenzialgleichung: f (t) = e−2t − e−t + te−t . Wie man leicht anhand dieses Beispiels erkennt, ist die Lage der Pole s1 , s2 und s3 für den Verlauf von f (t) ausschlaggebend. Da hier sämtliche Pole von F(s) negativen Realteil besitzen, ist der Verlauf von f (t) gedämpft, d. h., er klingt für t → ∞ auf null ab. Wäre jedoch der Realteil eines Poles positiv, dann würde für t → ∞ auch f (t) unendlich groß werden. Da bei regelungstechnischen Problemen die Originalfunktion f (t) stets den zeitlichen Verlauf einer im Regelkreis auftretenden Systemgröße darstellt, lässt sich das Schwingungsverhalten dieser Systemgröße f (t) durch die Untersuchung der Lage der Polstellen der zugehörigen Bildfunktion F(s) direkt beurteilen. Auf diese so entscheidende Bedeutung der Lage der Polstellen einer Bildfunktion wird im Kapitel 6 ausführlich eingegangen.
4.2 Die Fourier-Transformation [2] Oben wurde die Laplace-Transformation für Zeitfunktionen f (t) mit der Eigenschaft f (t) = 0 im Bereich t < 0 behandelt. Zeitfunktionen mit dieser Eigenschaft kommen hauptsächlich bei technischen Einschaltvorgängen vor. Für Zeitfunktionen im gesamten t-Bereich −∞ t +∞ wird die FourierTransformierte (F -Transformierte, Spektral- oder Frequenzfunktion) "∞ F( jω) = F { f (t)} =
(4-3)
−∞
und die inverse Fourier-Transformierte 1 f (t) = F {F( jω)} = 2π −1
Bild 4-1. Schema zur Lösung von Differenzialgleichungen mit der Laplace-Transformation
f (t)e−jωt dt
"∞ F( jω)e jωt dω
(4-4)
−∞
benutzt, wobei mit den Operatorzeichen F und F −1 formal die Fourier-Transformation bzw. ihre Inverse gekennzeichnet wird. Da die Fourier-Transformierte meist eine komplexe Funktion ist, können ebenfalls die Darstellungen
I15
I16
I Regelungs- und Steuerungstechnik / Regelungstechnik
F( jω) = R (ω) + jI (ω)
F( jω) = A (ω)ejϕ (ω)
und
(4-5) (4-6)
unter Verwendung von Real- und Imaginärteil R (ω) und I (ω) oder von Amplituden- und Phasengang A (ω) und ϕ (ω) gewählt werden, wobei A (ω) = |F( jω)| = R 2 (ω) + I 2 (ω) (4-7) auch als Fourier-Spektrum oder Amplitudendichtespektrum von f (t) bezeichnet wird, und außerdem für den Phasengang gilt: ϕ (ω) = arctan
I (ω) . R (ω)
(4-8)
Ähnlich wie die Laplace-Transformation stellt die Fourier-Transformation eine umkehrbar eindeutige Zuordnung zwischen Zeitfunktion f (t) und Frequenz- oder Spektralfunktion F( jω) her. Die wichtigsten Funktionspaare sind in Tabelle A 23.1 zusammengestellt. Wegen Analogien von Fourierund Laplace-Transformation vgl. A 23.1 und A 23.2.
4.3 Der Begriff der Übertragungsfunktion 4.3.1 Definition
Lineare, kontinuierliche, zeitinvariante Systeme mit konzentrierten Parametern, ohne Totzeit werden durch die Differenzialgleichung n m di xa (t) d j xe (t) ai = bj , mn (4-9) dti dt j i=0 j=0 beschrieben. Sind alle Anfangswerte gleich null und wendet man auf beide Seiten von (4-9) die LaplaceTransformation an, so folgt nach kurzer Umformung Z(s) Xa (s) b0 + b1 s + . . . + bm sm = , = G(s) = Xe (s) a0 + a1 s + . . . + an sn N(s) (4-10) wobei Z(s) und N(s) das Zähler- bzw. Nennerpolynom von G(s) sind. Die das Übertragungsverhalten des Systems vollständig charakterisierende Funktion G(s) wird Übertragungsfunktion des Systems genannt. Ist noch eine Totzeit T t zu berücksichtigen, dann erhält man anstelle von (4-9) n i=0
di xa (t) d j xe (t − T t ) = bj . dti dt j j=0 m
ai
(4-11)
Die Laplace-Transformation liefert in diesem Fall die transzendente Übertragungsfunktion Z(s) −sT t . (4-12) e N(s) Die Erregung eines linearen Systems durch einen Einheitsimpuls δ(t) liefert als Ausgangsgröße die Gewichtsfunktion: xa (t) = g(t), vgl. 3.2.2. Es ist nun wegen L {δ(t)} = 1 und mit (4-10) G(s) =
L {g(t)} = Xa (s) = Xa (s)/Xe (s) = G(s) ;
(4-13)
d. h., die Übertragungsfunktion G(s) ist identisch mit der Laplace-Transformierten der Gewichtsfunktion. Das Ergebnis (4-13) folgt auch durch LaplaceTransformation aus der Beziehung (4-3-4-13): ⎧ t ⎫ " ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎬ g(t − τ)x (τ)dτ L {xa (t)} = L ⎪ = G(s)Xe (s) . ⎪ e ⎪ ⎪ ⎪ ⎪ ⎩ ⎭ 0
(4-14) 4.3.2 Pole und Nullstellen der Übertragungsfunktion
Häufig ist es zweckmäßig, die rationale Übertragungsfunktion G(s) gemäß (4-10) faktorisiert in der Form (s − sN1 )(s − sN2 ) . . . (s − sNm ) Z(s) = k0 N(s) (s − sP1 )(s − sP2 ) . . . (s − sPn ) (4-15) darzustellen. Da aus physikalischen Gründen nur reelle Koeffizienten ai , bj vorkommen, können die Nullstellen sN j bzw. die Polstellen sPi von G(s) reell oder konjugiert komplex sein. Pole und Nullstellen lassen sich anschaulich in der komplexen s-Ebene entsprechend Bild 4-2 darstellen. Ein lineares zeitinvariantes System ohne Totzeit wird somit durch die Angabe der Pol- und Nullstellenverteilung sowie des Faktors k0 vollständig beschrieben. Darüber hinaus haben die Pole der Übertragungsfunktion eine weitere Bedeutung. Betrachtet man das ungestörte System (xe (t) ≡ 0) nach (4-9) und will man den Zeitverlauf der Ausgangsgröße xa (t) nach Vorgabe von n Anfangsbedingungen ermitteln, so hat man die zugehörige homogene Differenzialgleichung G(s) =
n i=0
ai
di xa (t) =0 dti
(4-16)
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
Bild 4-4. Parallelschaltung zweier Übertragungsglieder
Bild 4-2. Pol- und Nullstellenverteilung einer Übertra-
gungsfunktion in der s-Ebene
Bild 4-5. Kreisschaltung zweier Übertragungsglieder
zu lösen. Wird für (4-16) der Lösungsansatz xa (t) = e st gemacht, so erhält man als Bestimmungsgleichung für s die charakteristische Gleichung n ai si = 0 . (4-17)
b) Parallelschaltung: Für die Ausgangsgröße des Gesamtsystems nach Bild 4-4 erhält man
t=0
Diese Beziehung geht also unmittelbar durch Nullsetzen des Nenners (N(s) = 0) aus G(s) hervor, sofern N(s) und Z(s) teilerfremd sind. Die Nullstellen sk der charakteristischen Gleichung stellen somit Pole sP j der Übertragungsfunktion dar. Da das Eigenverhalten (xe (t) ≡ 0) allein durch die charakteristische Gleichung beschrieben wird, enthalten somit die Pole sP j der Übertragungsfunktion diese Information vollständig. 4.3.3 Das Rechnen mit Übertragungsfunktionen
Für das Zusammenschalten von Übertragungsgliedern lassen sich nun einfache Rechenregeln zur Bestimmung der Übertragungsfunktion herleiten. a) Hintereinanderschaltung: Aus der Schaltung entsprechend Bild 4-3 folgt Y(s) = G2 (s)G1 (s)U(s) . Damit ergibt sich als Gesamtübertragungsfunktion der Hintereinanderschaltung G(s) =
Y(s) = G1 (s)G2 (s) . U(s)
(4-18)
Y(s) = Xa (s) = Xa1 (s) + Xa2 (s) = [G1 (s) + G2 (s)] U(s) , und daraus ergibt sich als Gesamtübertragungsfunktion der Parallelschaltung G(s) =
Y(s) = G1 (s) + G2 (s) . U(s)
(4-19)
c) Kreisschaltung: Aus Bild 4-5 folgt unmittelbar für die Ausgangsgröße Y(s) = Xa (s) = [U(s)(∓)Xa2(s)]G1 (s) . Mit Xa2 (s) = G2 (s)Y(s) erhält man daraus die Gesamtübertragungsfunktion der Kreisschaltung G(s) =
G1 (s) Y(s) = . U(s) 1 + G1 (s)G2 (s) (−)
(4-20)
Da die Ausgangsgröße von G1 (s) über G2 (s) wieder an den Eingang zurückgeführt wird, spricht man auch von einer Rückkopplung. Dabei unterscheidet man zwischen positiver Rückkopplung (Mitkopplung) bei positiver Aufschaltung von Xa2 (s) und negativer Rückkopplung (Gegenkopplung) bei negativer Aufschaltung von Xa2 (s). 4.3.4 Zusammenhang zwischen G(s) und der Zustandsraumdarstellung
Bild 4-3. Hintereinanderschaltung zweier Übertragungs-
glieder
Wendet man auf die Zustandsraumdarstellung eines Eingrößensystems, in 3.3.1 beschrieben durch (4-16)
I17
I18
I Regelungs- und Steuerungstechnik / Regelungstechnik
und (4-17) mit x(t0 ) = 0, die Laplace-Transformation an, so folgt aus sX(s) = AX(s) + bU(s) und
4.4 Die Frequenzgangdarstellung
Y(s) = cT X(s) + dU(s)
4.4.1 Definition
nach Elimination von X(s) nach kurzer Rechnung die Übertragungsfunktion G(s) =
Y(s) = cT (sI − A)−1 b + d . U(s)
Ortskurve des Frequenzganges G( jω) des Systems bezeichnet.
(4-21)
I ist dabei die Einheitsmatrix. Gleichung (4-21) stimmt natürlich mit (4-10) überein, wenn beide mathematischen Modelle dasselbe System beschreiben. 4.3.5 Die komplexe G-Ebene
Die komplexe Übertragungsfunktion G(s) beschreibt eine lokal konforme Abbildung der s-Ebene auf die G-Ebene, vgl. A 19. Wegen der bei dieser Abbildung gewährleisteten Winkeltreue wird das orthogonale Netz achsenparalleler Geraden σ = const und ω = const der s-Ebene in ein wiederum orthogonales, aber krummliniges Netz der G-Ebene – wie im Bild 4-6 dargestellt – abgebildet. Dabei bleibt „im unendlich Kleinen“ auch die Maßstabstreue erhalten. Einen sehr wichtigen speziellen Fall erhält man für σ = 0 und ω 0. Er repräsentiert die konforme Abbildung der positiven Imaginärachse der s-Ebene und wird als
Wie bereits kurz erwähnt, geht für σ = 0, also für den Spezialfall s = jω, die Übertragungsfunktion G(s) in den Frequenzgang G( jω) über. Während die Übertragungsfunktion G(s) mehr eine abstrakte, nicht messbare Beschreibungsform zur mathematischen Behandlung linearer Systeme darstellt, kann der Frequenzgang G( jω) unmittelbar auch anschaulich physikalisch interpretiert werden. Dazu wird zunächst der Frequenzgang als komplexe Größe G( jω) = R(ω) + jI(ω) ,
(4-22)
mit dem Realteil R(ω) und dem Imaginärteil I(ω), zweckmäßigerweise durch seinen Amplitudengang A(ω) und seinen Phasengang ϕ(ω) in der Form G( jω) = A(ω)ejϕ(ω)
(4-23)
dargestellt. Denkt man sich nun die Systemgröße xe (t) sinusförmig mit der Amplitude xˆe und der Frequenz ω erregt, also durch xe sin ωt , xe (t) = /
(4-24)
dann wird bei einem linearen kontinuierlichen System die Ausgangsgröße mit derselben Frequenz ω mit anderer Amplitude / xa und mit einer gewissen Phasenverschiebung ϕ = ϕ(ω) ebenfalls sinusförmige Schwingungen ausführen: xa sin(ωt + ϕ) . xa (t) = /
(4-25)
Führt man dieses Experiment für verschiedene Frequenzen ω = ων (ν = 1, 2, . . .) mit / xe = const durch, dann stellt man eine Frequenzabhängigkeit der Amplitude / xa des Ausgangssignals sowie der Phasenverschiebung ϕ fest, und somit gilt für die jeweilige Frequenz ων / xa,ν = / xa (ων ) Bild 4-6. Lokal konforme Abbildung der Geraden σ = const und ω = const der s-Ebene in die G-Ebene
und ϕν = ϕ(ων ) .
xe lässt Aus dem Verhältnis der Amplituden / xa und / sich nun der Amplitudengang des Frequenzganges
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
/ xa (ω) = |G( jω)| = R2 (ω) + I 2 (ω) (4-26) / xe als frequenzabhängige Größe definieren. Weiterhin wird die frequenzabhängige Phasenverschiebung ϕ(ω) als Phasengang des Frequenzganges bezeichnet. Es gilt somit I(ω) . (4-27) ϕ(ω) = arg G( jω) = arctan R(ω) A(ω) =
Aus diesen Überlegungen ist ersichtlich, dass durch Verwendung sinusförmiger Eingangssignale xe (t) unterschiedlicher Frequenz der Amplitudengang A(ω) und der Phasengang ϕ(ω) des Frequenzganges G( jω) direkt gemessen werden können. Der gesamte Frequenzgang G( jω) für alle Frequenzen 0 ω ∞ beschreibt ähnlich wie die Übertragungsfunktion G(s) oder die Übergangsfunktion h(t) das Übertragungsverhalten eines linearen kontinuierlichen Systems vollständig. 4.4.2 Ortskurvendarstellung des Frequenzganges
Trägt man für das oben behandelte Experiment für jeden Wert von ων mithilfe von A(ων ) und ϕ(ων ) den jeweiligen Wert von G( jων ) = A(ων )e jϕ(ων ) in die komplexe G-Ebene ein, so erhält man die in ω parametrierte Ortskurve des Frequenzganges, die auch als Nyquist-Ortskurve bezeichnet wird. Bild 4-7 zeigt eine solche aus 8 Messwerten experimentell ermittelte Ortskurve. Die Ortskurvendarstellung von Frequenzgängen hat u. a. den Vorteil, dass die Frequenzgänge sowohl von hintereinander als auch von parallel geschalteten Übertragungsgliedern sehr einfach grafisch konstruiert werden können. Dabei werden die zu gleichen
Bild 4-7. Beispiel für eine experimentell ermittelte Frequenzgangortskurve
ω-Werten gehörenden Zeiger der betreffenden Ortskurven herausgesucht. Bei der Parallelschaltung werden die Zeiger addiert (Parallelogrammkonstruktion); bei der Hintereinanderschaltung werden die Zeiger multipliziert, indem die Längen der Zeiger multipliziert und ihre Winkel addiert werden. 4.4.3 Darstellung des Frequenzganges durch Frequenzkennlinien (Bode-Diagramm)
Trägt man den Betrag A(ω) und die Phase ϕ(ω) des Frequenzganges G( jω) = A(ω)e jϕ(ω) getrennt über der Frequenz ω auf, so erhält man den Amplitudengang oder die Betragskennlinie sowie den Phasengang oder die Phasenkennlinie des Übertragungsgliedes. Beide zusammen ergeben die Frequenzkennlinien oder das Bode-Diagramm (Bild 4-8). A(ω) (ggf. nach Normierung auf die Dimension 1) und ω werden logarithmisch und ϕ(ω) linear aufgetragen. Es ist dabei üblich, A(ω) auf die Einheit Dezibel (dB) zu beziehen. Laut Definition gilt AdB (ω) = 20 lg A(ω) . Die logarithmische Darstellung bietet besondere Vorteile bei der Hintereinanderschaltung von Übertragungsgliedern, zumal sich kompliziertere Frequenzgänge, wie sie beispielsweise aus G(s) = K
(s − sN1 ) . . . (s − sNm ) (s − sP1 ) . . . (s − sPn )
(4-28)
mit s = jω hervorgehen, als Hintereinanderschal-
Bild 4-8. Darstellung des Frequenzganges durch Frequenz-
kennlinien (Bode-Diagramm)
I19
I20
I Regelungs- und Steuerungstechnik / Regelungstechnik
tung der Frequenzgänge einfacher Übertragungsglieder der Form Gi ( jω) = ( jω − sNi )
für i = 1, 2, . . . , m
1 und Gm+i (ω) = jω − sPi
G( jω) = K .
(4-37)
(4-29)
für i = 1, 2, . . . , n (4-30)
darstellen lassen. Es gilt dann G( jω) = KG1 ( jω)G2 ( jω) . . . Gn+m ( jω) .
c) Frequenzgang:
Die Ortskurve von G(jω) stellt für sämtliche Frequenzen einen Punkt auf der reellen Achse mit dem Abstand K vom Nullpunkt dar, d. h., der Phasengang ϕ(ω) ist null für K > 0 oder −180◦ für K < 0, während für den logarithmischen Amplitudengang
(4-31)
Aus der Darstellung
AdB (ω) = 20 lg K = KdB = const gilt.
G( jω) = KA1 (ω)A2 (ω) . . . An+m (ω)e j[ϕ1 (ω)+ϕ2 (ω)+...+ϕn+m (ω)]
(4-32)
bzw. aus A(ω) = |G( jω)| erhält man den logarithmischen Amplitudengang AdB (ω) = KdB + A1dB (ω) + A2dB (ω) + . . . An+mdB (ω) (4-33) und den Phasengang ϕ(ω) = ϕ0 (ω) + ϕ1 (ω) + . . . + ϕn+m (ω) ,
(4-34)
wobei ϕ0 (ω) = 0◦ für K > 0 und ϕ0 (ω) = −180◦ für K < 0. Der Gesamtfrequenzgang einer Hintereinanderschaltung ergibt sich also durch Addition der einzelnen Frequenzkennlinien.
4.5.2 Das integrierende Glied (I-Glied)
a) Darstellung im Zeitbereich: 1 xa (t) = TI
a) Darstellung im Zeitbereich: xa (t) = K xe (t) .
G(s) =
1 . sT I
(4-39)
c) Frequenzgang: 1 1 −j π = e 2 , jωT I ωT I
(4-40)
mit dem Amplituden- und Phasengang A(ω) =
1 ωT I
und ϕ(ω) = −
π = const 2
(4-41)
und dem logarithmischen Amplitudengang AdB (ω) = −20 lg ωT I = −20 lg
ω , ωe
(4-42)
wobei ωe = 1/T I als Eckfrequenz definiert wird. (4-35)
K wird als Verstärkungsfaktor oder als Übertragungsbeiwert des P-Gliedes bezeichnet. b) Übertragungsfunktion: G(s) = K .
(4-38)
T I ist eine Konstante mit der Dimension Zeit und wird deshalb als Integrationszeitkonstante bezeichnet. b) Übertragungsfunktion:
G( jω) =
4.5.1 Das proportional wirkende Glied (P-Glied)
xe (τ) dτ + xa (0) . 0
4.5 Das Verhalten der wichtigsten Übertragungsglieder Für die nachfolgend behandelten Übertragungsglieder ist jeweils der Verlauf der Übergangsfunktion h(t) und des Frequenzganges G( jω) in Tabelle 4-1 zusammengestellt.
"t
(4-36)
4.5.3 Das differenzierende Glied (D-Glied)
a) Darstellung im Zeitbereich: xa (t) = T D
d xe (t) . dt
(4-43)
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
Tabelle 4-1. Übertragungsglieder mit Übergangsfunktion und Frequenzgang
I21
I22
I Regelungs- und Steuerungstechnik / Regelungstechnik
b) Übertragungsfunktion: G(s) = sT D .
(4-44)
c) Frequenzgang: π
G( jω) = jωT D = ωT D e j 2 ,
(4-45)
mit dem logarithmischen Amplitudengang ω (4-46) AdB (ω) = 20 lg ωT D = 20 lg ωe
Aus (4-51) lässt sich der logarithmische Amplitudengang 8 2 ω AdB (ω) = 20 lg K − 20 lg 1 + (4-53) ωe herleiten. Gleichung (4-53) kann asymptotisch durch zwei Geraden approximiert werden: α) Im Bereich ω/ωe 1 durch die Anfangsasymptote
und dem Phasengang
AdB (ω) ≈ 20 lg K = KdB ,
π ϕ(ω) = = const . 2
Es ist leicht ersichtlich, dass die Übertragungsfunktionen von I- und D-Glied durch Inversion ineinander übergehen. Daher können die Kurvenverläufe für den Amplituden- und Phasengang des D-Gliedes durch Spiegelung der entsprechenden Kurvenverläufe des I-Gliedes an der 0-dB-Linie bzw. an der Linie ϕ = 0 gewonnen werden. 4.5.4 Das Verzögerungsglied 1. Ordnung (PT1 -Glied)
a) Darstellung im Zeitbereich: xa (t) + T x˙a (t) = K xe (t) ,
mit
xa (0) = xa0 . (4-48)
b) Übertragungsfunktion: G(s) =
K . 1 + sT
(4-49)
c) Frequenzgang: ω 1−j ωe G( jω) = K 2 ω 1+ ωe
(4-50)
mit der Knickfrequenz ωe = 1/T . T wird als Zeitkonstante definiert. Als Amplitudengang ergibt sich 8 2 ω A(ω) = |G( jω)| = K/ 1 + (4-51) ωe ω I(ω) = − arctan . R(ω) ωe
β) Im Bereich ω/ωe 1 durch die Endasymptote AdB (ω) ≈ 20 lg K − 20 lg wobei ϕ(ω) ≈ −
ω , ωe
π gilt. 2
Der Verlauf der Anfangsasymptote ist horizontal, wobei die Endasymptote eine Steigung von –20/Dekade aufweist. Als Schnittpunkt beider Geraden ergibt sich ω/ωe = 1. Die maximale Abweichung des Amplitudenganges von den Asymptoten√tritt bei ω = ωe auf und beträgt ΔAdB (ωe ) = −20 lg 2 =ˆ − 3 dB. 4.5.5 Das Verzögerungsglied 2. Ordnung (PT2 -Glied und PT2 S-Glied)
Das Verzögerungsglied 2. Ordnung ist gekennzeichnet durch zwei voneinander unabhängige Energiespeicher. Je nach den Dämpfungseigenschaften bzw. der Lage der Pole von G(s) unterscheidet man beim Verzögerungsglied 2. Ordnung zwischen schwingendem und aperiodischem Verhalten. Besitzt ein Verzögerungsglied 2. Ordnung ein konjugiert komplexes Polpaar, dann weist es schwingendes Verhalten (PT2 S-Verhalten) auf. Liegen die beiden Pole auf der negativ reellen Achse, so besitzt das Übertragungsglied ein verzögerndes PT2 Verhalten. a) Darstellung im Zeitbereich:
und als Phasengang ϕ(ω) = arctan
wobei ϕ(ω) ≈ 0 wird.
(4-47)
(4-52)
T 22
d2 xa (t) dxa (t) + xa (t) = K xe (t) . + T1 2 dt dt
(4-54)
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
b) Übertragungsfunktion: G(s) =
K . 1 + T 1 s + T 22 s2
und der Phasengang (4-55)
Führt man nun Begriffe ein, die das Zeitverhalten charakterisieren, und zwar den Dämpfungsgrad D = T 1 /2T 2 sowie die Eigenfrequenz (der nicht gedämpften Schwingung) ω0 = 1/T 2 , so erhält man aus (4-55) K G(s) = . (4-56) 2D 1 1+ s + 2 s2 ω0 ω0
ω 2D ω0 ϕ(ω) = − arctan 2 . ω 1− ω0
(4-59)
Für den logarithmischen Amplitudengang ergibt sich aus (4-58) AdB (ω) = 20 lg K
; =⎡ 2 2 ⎤2 ⎢⎢⎢ ω ω ⎥⎥⎥⎥ − 20 lg ⎢⎢⎣1 − . ⎥⎦ + 2D ω ω 0
0
c) Frequenzgang:
⎡ 2 ⎤ ⎥ ⎢⎢⎢ ⎢⎢⎣1 − ω ⎥⎥⎥⎥⎦ − j · 2D ω ω0 ω0 G( jω) = K ⎡ ⎤ 2 . 2 2 ⎢⎢⎢ ⎥⎥⎥ ω ω ⎢⎢⎣1 − ⎥⎥ + 2D ω0 ⎦ ω0
(4-60)
Der Verlauf von AdB (ω) lässt sich durch folgende Asymptoten approximieren: (4-57)
AdB (ω) ≈ 20 lg K
Somit lautet der zugehörige Amplitudengang K A(ω) = ; =⎡ 2 2 ⎤2 ⎢⎢⎢ ⎥ ⎢⎢⎣1 − ω ⎥⎥⎥⎥⎦ + 2D ω ω0 ω0
α) Im Bereich ω/ω0 1 durch die Anfangsasymptote
(4-58)
mit ϕ(ω) ≈ 0 .
β) Im Bereich ω/ω0 1 durch die Endasymptote ω AdB (ω) ≈ 20 lg K − 40 lg ω0 mit
ϕ(ω) ≈ −π .
Bild 4-9. Bode-Diagramm eines Verzögerungs-
gliedes 2. Ordnung (K = 1)
I23
I24
I Regelungs- und Steuerungstechnik / Regelungstechnik
Die Endasymptote stellt im Bode-Diagramm eine Gerade mit der Steigung –40dB/Dekade dar. Als Schnittpunkt beider Asymptoten folgt die auf ω0 normierte Kreisfrequenz ω/ω0 = 1. Der tatsächliche Wert von AdB (ω) kann bei ω = ω0 beträchtlich vom Asymptotenschnittpunkt abweichen. Für D < 0,5 liegt der Wert oberhalb, für D > 0,5 unterhalb der Asymptoten. Bild 4-9 zeigt für 0 < D 2,5 und K = 1 den Verlauf von AdB (ω) und ϕ(ω) im Bode-Diagramm. Daraus ist ersichtlich, dass beim Amplitudengang ab einem bestimmten Dämpfungsgrad D für die einzelnen Kurvenverläufe jeweils ein Maximalwert existiert. Dieser Maximalwert tritt für die einzelnen DWerte bei der sogenannten Resonanzfrequenz
√ ωr = ω0 1 − 2D2
für 0 D 0,707
(4-61)
auf. Für den Maximalwert des Amplitudenganges mit K = 1 erhält man Amax (ω) = A(ωr ) =
1 . √ 2D 1 − D2
(4-62)
Das Eigenverhalten des Übertragungsgliedes wird durch die Pole der Übertragungsfunktion gemäß (4-56), also aus seiner charakteristischen Gleichung N(s) = 0 = 1 +
1 2D s + 2 s2 ω0 ω0
Tabelle 4-2. Lage der Pole und Übergangsfunktion für Übertragungsglieder 2. Ordnung (PT2 - und PT2 S-Verhalten)
(4-63)
4 Beschreibung linearer kontinuierlicher Systeme im Frequenzbereich
bestimmt. Als Pole der Übertragungsfunktion ergeben sich √ s1,2 = −ω0 D ± ω0 D2 − 1 . (4-64) In Abhängigkeit von der Lage der Pole in der s-Ebene lässt sich nun anschaulich das Schwingungsverhalten eines Verzögerungsgliedes 2. Ordnung beschreiben. Dazu wird zweckmäßigerweise der Verlauf der zugehörigen Übergangsfunktion h(t) gewählt. Tabelle 4-2 zeigt in Abhängigkeit von D die Lage der Pole der Übertragungsfunktion und die dazugehörigen Übergangsfunktionen dieses Systems. 4.5.6 Bandbreite eines Übertragungsgliedes
Einen wichtigen Begriff stellt die Bandbreite eines Übertragungsgliedes dar. Verzögerungsglieder mit Proportionalverhalten, wie z. B. PT1 -, PT2 - und PT2 S-Glieder sowie PTn -Glieder (Hintereinanderschaltung von n PT1 -Gliedern), besitzen so genannte Tiefpasseigenschaften, d. h., sie übertragen vorzugsweise tiefe Frequenzen, während hohe Frequenzen von Signalen entsprechend dem stark abfallenden Amplitudengang abgeschwächt übertragen werden. Zur Beschreibung dieses Übertragungsverhaltens führt man den Begriff der Bandbreite ein. Als Bandbreite eines Tiefpassgliedes bezeichnet man die Frequenz ωb , bei der der logarithmische Amplitudengang gegenüber der horizontalen Anfangsasymptote um –3 dB abgefallen ist, siehe Bild 4-10. 4.5.7 Systeme mit minimalem und nichtminimalem Phasenverhalten
Durch eine Übertragungsfunktion, die keine Pole und Nullstellen in der rechten s-Halbebene besitzt,
wird ein System mit Minimalphasenverhalten beschrieben. Es ist dadurch charakterisiert, dass bei bekanntem Amplitudengang A(ω) = |G(jω)| im Bereich 0 ω < ∞ der zugehörige Phasengang ϕ(ω) aus A(ω) mithilfe des Bode’schen Gesetzes [3] berechnet werden kann und das dabei ermittelte ϕ(ω) betragsmäßig den kleinstmöglichen Phasenverlauf zu dem vorgegebenen A(ω) besitzt. Weist eine Übertragungsfunktion in der rechten s-Halbebene Pole und/oder Nullstellen auf, dann hat das entsprechende System nichtminimales Phasenverhalten. Der zugehörige Phasenverlauf hat stets größere Werte als der bei dem entsprechenden System mit Minimalphasenverhalten, das denselben Amplitudengang besitzt. Die Übertragungsfunktion eines nichtminimalphasigen Übertragungsgliedes Gb (s) lässt sich immer durch Hintereinanderschaltung des zugehörigen Minimalphasengliedes und eines reinen phasendrehenden Gliedes, die durch die Übertragungsfunktionen Ga (s) und GA (s) beschrieben werden, darstellen: Gb (s) = GA (s)Ga (s) .
Ein phasendrehendes Glied, auch Allpassglied genannt, ist dadurch charakterisiert, dass der Betrag seines Frequenzganges GA (jω) für alle Frequenzen gleich eins ist. So lautet z. B. die Übertragungsfunktion des Allpassgliedes 1. Ordnung GA (s) =
1 − sT , 1 + sT
(4-66)
woraus als Amplitudengang AA (ω) = 1 und als Phasengang ϕA (ω) = −2 arctan ωT folgen. Dieses Allpassglied überstreicht einen Winkel ϕA (ω) von 0◦ bis −180◦. Die Bedingung für Allpassglieder, d. h. |GA ( jω)| = 1, wird nur von Übertragungsgliedern erfüllt, bei denen die Nullstellenverteilung von GA (s) in der s-Ebene spiegelbildlich zur Polverteilung bezüglich der jω-Achse ist. Ein typisches System mit nichtminimalem Phasenverhalten ist das Totzeitglied (PTt -Glied), das durch die Übertragungsfunktion G(s) = e−sT t
Bild 4-10. Zur Definition der Bandbreite ωb bei Übertragungssystemen mit Tiefpassverhalten (ωr Resonanzfrequenz, ω0 Eigenfrequenz der ungedämpften Schwingung)
(4-65)
(4-67)
und den Frequenzgang G(jω) = e−jωT t
(4-68)
I25
I26
I Regelungs- und Steuerungstechnik / Regelungstechnik
mit dem Amplitudengang A(ω) = |G( jω)| = | cos ωT t − j sin ωT t | = 1
(4-69)
sowie dem Phasengang (im Bogenmaß) ϕ(ω) = −ωT t
(4-70) Bild 5-1. Die Grundbestandteile eines Regelkreises
beschrieben wird. Die Ortskurve von G(jω) stellt somit einen Kreis um den Koordinatenursprung dar, der mit ω = 0 auf der reellen Achse bei R(ω) = 1 beginnend mit wachsenden ω-Werten fortwährend durchlaufen wird, da der Phasenwinkel ständig zunimmt. Bei Systemen mit Minimalphasenverhalten kann man eindeutig aus dem Amplitudengang A(ω) den Phasengang ϕ(ω) bestimmen. Dies gilt jedoch für Systeme mit nichtminimalem Phasenverhalten nicht. Die Überprüfung, ob ein System Minimalphasenverhalten aufweist oder nicht, lässt sich aus dem Verlauf von ϕ(ω) und AdB (ω) für hohe Frequenzen leicht abschätzen. Bei einem Minimalphasensystem, das durch die gebrochen rationale Übertragungsfunktion G(s) = Z(s)/N(s) dargestellt wird, wobei der Zähler Z(s) vom Grade m und der Nenner N(s) vom Grade n ist, erhält man nämlich für ω → ∞ den Phasengang ϕ(∞) = −90◦ (n − m) .
(4-71)
Bei einem System mit nichtminimalem Phasenverhalten wird dieser Wert stets größer. In beiden Fällen wird der logarithmische Amplitudengang für ω → ∞ die Steigung −20(n − m) dB/Dekade besitzen.
Bild 5-2. Blockschaltbild des Regelkreises
die Stellgröße u, stellt die Regelstrecke ein System mit mindestens zwei Eingangsgrößen dar (sofern nur eine Störung vorhanden ist). Im Allgemeinen wirkt auch jede dieser beiden Eingangsgrößen mit verschiedenem Übertragungsverhalten auf die Regelgröße y. Es wird daher unterschieden zwischen dem Stellverhalten und dem Störverhalten der Regelstrecke, die durch die Übertragungsfunktionen GSU (s) und GSZ (s) beschrieben werden. Weiterhin kennzeichnet die Übertragungsfunktion GR (s) das Übertragungsverhalten der Regeleinrichtung (im Weiteren meist wieder nur als „Regler“ bezeichnet). Wie aus Bild 5-2 leicht abzulesen ist, gilt im geschlossenen Regelkreis für die Regelgröße Y(s) =
5 Das Verhalten linearer kontinuierlicher Regelkreise 5.1 Dynamisches Verhalten des Regelkreises Bild 5-1 zeigt das Blockschema des geschlossenen Regelkreises mit den 4 klassischen Bestandteilen: Regler, Stellglied, Regelstrecke und Messglied. Meist ist es zweckmäßig, Regler und Stellglied zur Regeleinrichtung zusammenzufassen, während das Messglied oft der Regelstrecke zugerechnet wird. Man gelangt somit zur vereinfachten Beschreibung gemäß Bild 5-2. Da die Störgröße z gewöhnlich an einer anderen Stelle in der Regelstrecke eingreift als
GSZ (s) Z(s) 1 + GR (s) GSU (s) GR (s) GSU (s) W(s) . + 1 + GR (s) GSU (s)
(5-1)
Anhand dieser Beziehung lassen sich Übertragungsfunktionen für die beiden Aufgabenstellungen einer Regelung (vgl. 1.3) unterscheiden: a) Für W(s) = 0 erhält man als Übertragungsfunktion des geschlossenen Regelkreises für Störverhalten (Festwertregelung oder Störgrößenregelung) GZ (s) =
GSZ (s) Y(s) = . Z(s) 1 + GR (s) GSU (s)
(5-2)
b) Für Z(s) = 0 folgt entsprechend als Übertragungsfunktion des geschlossenen Regelkreises für Führungsverhalten (Nachlauf- oder Folgeregelung)
5 Das Verhalten linearer kontinuierlicher Regelkreise
beschreiben, wobei durch die (ganzzahlige) Konstante k = 0, 1, 2, . . . der Typ der Übertragungsfunktion G0 (s) im Wesentlichen charakterisiert wird. K0 = KR KS stellt die Verstärkung des offenen Regelkreises dar und wird auch als Kreisverstärkung bezeichnet; KR und KS sind die Verstärkungsfaktoren von Regler und Regelstrecke. G0 (s) weist somit z. B. für
Bild 5-3. Offener Regelkreis
GW (s) =
GR (s) GSU (s) Y(s) = . W(s) 1 + GR (s) GSU (s)
(5-3)
Beide Übertragungsfunktionen GZ (s) und GW (s) enthalten gemeinsam den dynamischen Regelfaktor
mit
R(s) = 1/[1 + G0 (s)]
(5-4)
G0 (s) = GR (s)GSU (s) .
(5-5)
Schneidet man für W(s) = 0 und Z(s) = 0 den Regelkreis gemäß Bild 5-3 an einer beliebigen Stelle auf, und definiert man unter Berücksichtigung der Wirkungsrichtung der Übertragungsglieder die Eingangsgröße xe (t) sowie die Ausgangsgröße xa (t), so erhält man als Übertragungsfunktion des offenen Regelkreises Goffen (s) =
Xa (s) = −GR (s)GSU (s) = −G0 (s) . (5-6) Xe (s)
Allerdings hat sich (inkorrekterweise) in der Regelungstechnik durchgesetzt, dass meist G0 (s) als Übertragungsfunktion des offenen Regelkreises definiert wird. Für den geschlossenen Regelkreis erhält man durch Nullsetzen des Nennerausdrucks in (5-2) und (5-3) aus der Bedingung 1 + G0 (s) = 0
(5-7)
die charakteristische Gleichung in der Form a0 + a1 s + a2 s2 + . . . + an sn = 0 ,
(5-8)
sofern G0 (s) eine gebrochen rationale Übertragungsfunktion darstellt.
5.2 Stationäres Verhalten des Regelkreises Sehr häufig lässt sich das Übertragungsverhalten des offenen Regelkreises durch eine allgemeine Standardübertragungsfunktion der Form G0 (s) =
K0 1 + β1 s + . . . + βm sm −T t s · e , sk 1 + α1 s + . . . + αn−k sn−k
mn (5-9)
k = 0: Proportionales Verhalten (P-Verhalten) k = 1: Integrales Verhalten (I-Verhalten) k = 2: Doppelt-integrales Verhalten (I2 -Verhalten) auf. Es sei nun angenommen, dass der in (5-9) auftretende Term der gebrochen rationalen Funktion nur Pole in der linken s-Halbebene besitzt. Damit kann im Weiteren für die einzelnen Typen der Übertragungsfunktion G0 (s) bei verschiedenen Signalformen der Führungsgröße w(t) oder der Störgröße z(t) das stationäre Verhalten des geschlossenen Regelkreises für t → ∞ untersucht werden. Mit E(s) = W(s) − Y(s) folgt aus (5-1) und (5-5) für die Regelabweichung E(s) =
1 [W(s) − Z(s)] . 1 + G0 (s)
(5-10)
Unter der Voraussetzung, dass der Grenzwert der Regelabweichung e(t) für t → ∞ existiert, gilt mithilfe des Grenzwertsatzes der Laplace-Transformation für den stationären Endwert der Regelabweichung lim e(t) = lim sE(s) .
t→∞
s→0
(5-11)
Für den Fall, dass alle Störgrößen auf den Streckenausgang bezogen werden, folgt aus (5-10), dass – abgesehen vom Vorzeichen – beide Arten von Eingangsgrößen, also Führungs- oder Störgrößen, gleich behandelt werden können. Im Folgenden wird daher stellvertretend für beide Signalarten die Bezeichnung Xe (s) als Eingangsgröße gewählt. Mithilfe von (5-10) und (5-11) lassen sich nun die stationären Endwerte der Regelabweichung für die unterschiedlichsten Signalformen von xe (t) bei verschiedenen Typen der Übertragungsfunktion G0 (s) des offenen Regelkreises berechnen. Diese Werte charakterisieren das statische Verhalten des geschlossenen Regelkreises. Sie sollen im Folgenden für die wichtigsten Fälle bestimmt werden. Bei den weiteren Betrachtungen werden gemäß Bild 5-4 folgende Testsignale zugrunde gelegt:
I27
I28
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 5-1. Bleibende Regelabweichung für verschiedene Systemtypen von G0 (s) und unterschiedliche Eingangsgrößen xe (t) (Führungs- und Störgrößen, falls alle Störgrößen auf den Ausgang der Regelstrecke bezogen sind)
Systemtyp von G0 (s) gemäß (5-9) k=0 (P-Verhalten)
Bild 5-4. Verschiedene Eingangsfunktionen xe (t), die häu-
fig für Störgrößen z(t) und Führungsgrößen w(t) zugrunde gelegt werden: a sprungförmiger, b rampenförmiger und c parabolischer Signalverlauf
k=1 (I-Verhalten)
a) Sprungförmige Erregung: xe0 , s wobei xe0 die Sprunghöhe darstellt. b) Rampenförmige Erregung: Xe (s) =
(5-12)
xe1 , (5-13) s2 wobei xe1 die Geschwindigkeit des rampenförmigen Anstiegs des Signals xe (t) beschreibt. c) Parabelförmige Erregung: xe2 Xe (s) = 3 , (5-14) s wobei xe2 ein Maß für die Beschleunigung des parabolischen Signalanstiegs xe (t) ist. Xe (s) =
Für die Regelabweichung gilt nach (5-10) E(s) =
1 Xe (s) , 1 + G0 (s)
(5-15)
wobei sich der Unterschied zwischen Führungs- und Störverhalten nur im Vorzeichen von Xe (s) bemerkbar macht (Störverhalten: Xe (s) = −Z(s); Führungsverhalten: Xe (s) = W(s)). Setzt man in diese Beziehung nacheinander (10) bis (14) ein, dann lässt sich damit die entsprechende Regelabweichung für verschiedene Typen der Übertragungsfunktion G0 (s) berechnen. Die Ergebnisse sind in Tabelle 5-1 dargestellt. Daraus folgt, dass die bleibende Regelabweichung e∞ , die das statische Verhalten des Regelkreises charakterisiert, in all den Fällen, wo sie einen endlichen Wert annimmt, um so kleiner gehalten werden kann,
k=2 (I2 -Verhalten)
Eingangsgröße Xe (s) xe0 s xe1 s2 xe2 s3 xe0 s xe1 s2 xe2 s3
Bleibende Regelabweichung e∞ 1 xe0 1 + K0 ∞ ∞ 0 1 xe1 K0 ∞
xe0 s xe1 s2 xe2 s3
0 0 1 xe2 K0
je größer die Kreisverstärkung K0 gewählt wird. Bei P-Verhalten des offenen Regelkreises bedeutet dies auch, dass die bleibende Regelabweichung e∞ um so kleiner wird, je kleiner der statische Regelfaktor R=
1 1 + K0
(5-16)
wird. Häufig führt jedoch eine zu große Kreisverstärkung K0 schnell zur Instabilität des geschlossenen Regelkreises, wie in Kapitel 6 ausführlich besprochen wird. Daher ist bei der Festlegung von K0 gewöhnlich ein entsprechender Kompromiss zu treffen, vorausgesetzt, dass nicht schon durch die Wahl eines geeigneten Reglertyps die bleibende Regelabweichung verschwindet.
5.3 Der PID-Regler und die aus ihm ableitbaren Reglertypen Die gerätetechnische Ausführung eines Reglers umfasst die Bildung der Regelabweichung, sowie deren
5 Das Verhalten linearer kontinuierlicher Regelkreise
auftreten. Diese drei Größen KR , T I und T D sind gewöhnlich in bestimmten Wertebereichen einstellbar; sie werden daher auch als Einstellwerte des Reglers bezeichnet. Durch geeignete Wahl dieser Einstellwerte lässt sich ein Regler dem Verhalten der Regelstrecke so anpassen, dass ein möglichst günstiges Regelverhalten entsteht. Aus (5-18) folgt für den zeitlichen Verlauf der Reglerausgangsgröße "t de(t) KR . (5-19) uR (t) = KR e(t)+ e(τ) dτ+KR T D TI dt 0
Bild 5-5. Zwei gleichwertige Blockschaltbilder des PID-
Reglers
weitere Verarbeitung zur Reglerausgangsgröße uR (t) gemäß Bild 5-1 oder direkt zur Stellgröße u(t), falls das Stellglied mit dem Regler zur Regeleinrichtung entsprechend Bild 5-2 zusammengefasst wird. Die meisten in der Industrie eingesetzten linearen Reglertypen sind Standardregler, deren Übertragungsverhalten sich auf die drei idealisierten linearen Grundformen des P-, I- und D-Gliedes zurückführen lässt. Der wichtigste Standardregler weist PID-Verhalten auf. Die prinzipielle Wirkungsweise dieses PID-Reglers lässt sich anschaulich durch die im Bild 5-5 dargestellte Parallelschaltung je eines P-, I- und D-Gliedes erklären. Aus dieser Darstellung folgt als Übertragungsfunktion des PID-Reglers GR (s) =
UR (s) KI = KP + + KD s . E(s) s
Damit lässt sich nun leicht für eine sprungförmige Änderung von e(t), also e(t) = σ(t), die Übergangsfunktion h(t) des PID-Reglers bilden. Sie ist im Bild 5-6a dargestellt. Bei den bisherigen Überlegungen wurde davon ausgegangen, dass sich das D-Verhalten im PID-Regler realisieren lässt. Gerätetechnisch kann jedoch das ideale D-Verhalten nicht verwirklicht werden. Bei tatsächlich ausgeführten Reglern ist das D-Verhalten stets mit einer gewissen Verzögerung behaftet, sodass anstelle des D-Gliedes in der Schaltung von Bild 5-5 ein DT1 -Glied mit der Übertragungsfunktion Ts GD (s) = KD (5-20) 1 + Ts
(5-17)
Durch Einführen der Größen KR = KP KP KI KD TD = KP TI =
Verstärkungsfaktor Integralzeit oder Nachstellzeit Differenzialzeit oder Vorhaltezeit
lässt sich (5-17) so umformen, dass neben dem dimensionsbehafteten Verstärkungsfaktor KR nur die beiden Zeitkonstanten T I und T D in der Übertragungsfunktion 1 + TD s GR (s) = KR 1 + (5-18) TI s
Bild 5-6. Übergangsfunktion a des idealen und b des realen
PID-Reglers
I29
I30
I Regelungs- und Steuerungstechnik / Regelungstechnik
zu berücksichtigen ist. Damit erhält man als Übertragungsfunktion des realen PID-Reglers oder genauer des PIDT1 -Reglers die Beziehung Ts KI + KD , (5-21) s 1 + Ts und durch Einführung der Reglereinstellwerte KR = KP , T I = KR /KI und T D = KD T/KR folgt daraus 1 s + TD (5-22) GR (s) = KR 1 + TI s 1 + Ts GR (s) = KP +
Die Übergangsfunktion h(t) des PIDT1 -Reglers ist im Bild 5-6b dargestellt. Als Sonderfälle des PID-Reglers erhält man für: a) T D = 0 den PI-Regler mit der Übertragungsfunktion 1 GR (s) = KR 1 + (5-23) ; TI s b) T I → ∞ den PD-Regler mit der Übertragungsfunktion GR (s) = KR (1 + T D s) (5-24) bzw. den PDT1 -Regler mit der Übertragungsfunktion # s $ (5-25) GR (s) = KR 1 + T D ; 1 + Ts c) für T D = 0 und T I → ∞ den P-Regler mit der Übertragungsfunktion GR (s) = KR .
(5-26)
Die Übergangsfunktionen dieser Reglertypen sind im Bild 5-7 dargestellt. Neben den hier behandelten Reglertypen, die durch entsprechende Wahl der Einstellwerte sich direkt aus einem PID-Regler (Universalregler) herleiten lassen, kommt manchmal auch ein reiner I-Regler zum Einsatz. Die Übertragungsfunktion des I-Reglers lautet KR 1 . (5-27) GR (s) = KI = s TI s Erwähnt sei noch, dass D-Glieder nicht direkt als Regler eingesetzt werden, sondern nur in Verbindung mit P-Gliedern beim PD- und PID-Regler auftreten. Wendet man die hier vorgestellten Regler z. B. auf Regelstrecken mit P-Verhalten an und stört den so entstandenen Regelkreis mit einem Sprung der Höhe z0 , so lassen sich folgende qualitative Aussagen machen [1]:
Bild 5-7. Übergangsfunktionen der aus dem PID-Regler ab-
leitbaren Reglertypen: a P-Regler, b PI-Regler, c PD-Regler (ideal) und d PDT1 -Regler (realer PD-Regler)
a) Der P-Regler weist ein relativ großes maximales Überschwingen ymax /KS z0 der normierten Regelgröße, eine große Ausregelzeit t3% (dies ist der Zeitpunkt, bei dem die Differenz |y(t)−y(∞)| < 3% des stationären Endwertes der Regelstreckenübergangsfunktion beträgt), sowie eine bleibende Regelabweichung auf. b) Der I-Regler besitzt aufgrund des langsam einsetzenden I-Verhaltens ein noch größeres maximales Überschwingen als der P-Regler, dafür aber keine bleibende Regelabweichung. c) Der PI-Regler vereinigt die Eigenschaften von P- und I-Regler. Er liefert ungefähr ein maximales Überschwingen und eine Ausregelzeit wie der P-Regler und weist keine bleibende Regelabweichung auf. d) Der PD-Regler besitzt aufgrund des „schnellen“ D-Anteils eine geringere maximale Überschwingweite als die unter a) bis c) aufgeführten Reglertypen. Aus demselben Grund zeichnet er sich auch durch die geringste Ausregelzeit aus. Aber auch
6 Stabilität linearer kontinuierlicher Regelsysteme
Tabelle 5-2. Realisierung der wichtigsten linearen Standardregler mittels Operationsverstärker
hier stellt sich eine bleibende Regelabweichung ein, die allerdings geringer ist als beim P-Regler, da der PD-Regler im Allgemeinen aufgrund der phasenanhebenden Wirkung des D-Anteils mit einer höheren Verstärkung KR betrieben wird. e) Der PID-Regler vereinigt die Eigenschaften des PI- und PD-Reglers. Er besitzt ein noch geringeres maximales Überschwingen als der PD-Regler und weist aufgrund des I-Anteils keine bleibende Regelabweichung auf. Durch den hinzugekommenen I-Anteil wird die Ausregelzeit jedoch größer als beim PD-Regler. Tabelle 5-2 zeigt mögliche Ausführungsformen der verschiedenen Reglertypen mit einem als Invertierer beschalteten Operationsverstärker.
6 Stabilität linearer kontinuierlicher Regelsysteme 6.1 Definition der Stabilität Ein lineares zeitinvariantes Übertragungssystem heißt (asymptotisch) stabil, wenn seine Gewichtsfunktion asymptotisch auf null abklingt, d. h., wenn gilt lim g(t) = 0 .
t→∞
(6-1)
Geht dagegen die Gewichtsfunktion betragsmäßig mit wachsendem t gegen unendlich, so nennt man das System instabil. Als Sonderfall sollen noch solche Systeme betrachtet werden, bei denen der Betrag der Gewichtsfunktion mit wachsendem t einen endlichen
I31
I32
I Regelungs- und Steuerungstechnik / Regelungstechnik
Wert nicht überschreitet oder einem endlichen Grenzwert zustrebt. Diese Systeme werden als grenzstabil bezeichnet. (Beispiele: ungedämpftes PT2 S-Glied, I-Glied.) Die Stabilitätsbedingung gemäß (6-1) kann auch als Bedingung für G(s) formuliert werden. Ist G(s) als rationale Übertragungsfunktion G(s) =
Z(s) Z(s) = N(s) a0 + a1 s + . . . + an sn
(6-2)
gegeben, und sind sk = σk + jωk die Pole der Übertragungsfunktion G(s), also die Wurzeln des Nennerpolynoms N(s) = an (s − s1 )(s − s2 ) . . . (s − sn ) =
n
ai si , (6-3)
i=0
so setzt sich die zugehörige Gewichtsfunktion g(t) =
n
g j (t)
j=1
aus n Summanden der Form g j (t) = cj t μ e si t
(μ = 0, 1, 2, . . . ; j = 1, 2, . . . , n) (6-4) zusammen. Dabei ist c j im Allgemeinen eine komplexe Konstante, und die Zahl μ wird für mehrfache Pole si größer als null. Bildet man den Betrag dieser Funktion, so erhält man |g j (t)| = |cj t μ esi t | = |cj |t μ eσi t . Ist nun σi < 0, so strebt die e-Funktion gegen 0, und damit der ganze Ausdruck, selbst wenn μ > 0 ist. Diese Überlegung macht deutlich, dass (6-1) genau dann erfüllt ist, wenn sämtliche Pole von G(s) einen negativen Realteil haben. Ist der Realteil auch nur eines Pols positiv, oder ist der Realteil eines mehrfachen Pols gleich null, so wächst die Gewichtsfunktion mit t über alle Grenzen. Es genügt also, zur Stabilitätsuntersuchung die Pole der Übertragungsfunktion G(s) des Systems, d. h. die Wurzeln si seiner charakteristischen Gleichung P(s) ≡ a0 + a1 s + a2 s + . . . + an sn = 0
(6-5)
zu überprüfen. Es lassen sich nun die folgenden notwendigen und hinreichenden Stabilitätsbedingungen formulieren:
a) Asymptotische Stabilität Ein lineares Übertragungssystem ist genau dann asymptotisch stabil, wenn für alle Wurzeln si (i = 1, 2, . . . , n) seiner charakteristischen Gleichung Re si < 0 gilt oder, anders ausgedrückt, wenn alle Pole seiner Übertragungsfunktion in der linken sHalbebene liegen. b) Instabilität Ein lineares System ist genau dann instabil, wenn mindestens ein Pol seiner Übertragungsfunktion in der rechten s-Halbebene liegt, oder wenn mindestens ein mehrfacher Pol (Vielfachheit μ 2) auf der imaginären Achse der s-Ebene liegt. c) Grenzstabilität Ein lineares System ist genau dann grenzstabil, wenn kein Pol der Übertragungsfunktion in der rechten s-Halbebene liegt, keine mehrfachen Pole auf der imaginären Achse auftreten und auf dieser mindestens ein einfacher Pol vorhanden ist. Für regelungstechnische Problemstellungen ist es oft nicht notwendig, die Wurzeln von (6-5) genau zu bestimmen. Für die Stabilitätsuntersuchung interessiert den Regelungstechniker nur, ob alle Wurzeln der charakteristischen Gleichung in der linken s-Halbebene liegen oder nicht. Hierfür gibt es einfache Kriterien, sog. Stabilitätskriterien, mit welchen dies leicht überprüft werden kann.
6.2 Algebraische Stabilitätskriterien 6.2.1 Das Hurwitz-Kriterium [1]
Mithilfe dieses Kriteriums lässt sich einfach prüfen, ob das durch (6-5) beschriebene charakteristische Polynom P(s) zu einem asymptotisch stabilen System gehört. Notwendige und hinreichende Bedingungen für asymptotisch stabiles Verhalten des betrachteten Systems sind, dass a) die Koeffizienten von P(s) alle von Null verschieden sind und positives Vorzeichen haben und b) folgende n Determinanten positiv sind, vgl. A 6.1: an−1 an >0, D1 = an−1 > 0 , D2 = an−3 an−2
6 Stabilität linearer kontinuierlicher Regelsysteme
an−1 D3 = an−3 an−5
Dn−1
an an−2 an−4
an−1 an−3 = · · 0
0 an−1 > 0 , an−3
an an−2 · ·
... 0 ... · ... · ... ·
0
. . . a1
(6-6)
> 0 ,
Dn = a0 Dn−1 > 0 . Während für ein System 2. Ordnung die Determinantenbedingungen von selbst erfüllt sind, sobald nur die Koeffizienten a0 , a1 , a2 positiv sind, erhält man für den Fall eines Systems 3. Ordnung als Hurwitzbedingungen a2 a3 = a1 a2 − a0 a3 > 0 D1 = a2 > 0 , D2 = a0 a1 a2 a3 0 und D3 = a0 a1 a2 = a0 D2 > 0 . 0 0 a0 6.2.2 Das Routh-Kriterium [2]
Sind die Koeffizienten ai des charakteristischen Polynoms P(s) zahlenmäßig vorgegeben, so kann man zur Überprüfung der Stabilität eines Systems anstelle des Hurwitz-Kriteriums auch das Routh’sche Verfahren verwenden. Dabei werden die Koeffizienten ai (i = 0, 1, . . . , n) in folgender Form in den ersten beiden Zeilen des Routh-Schemas angeordnet, das insgesamt (n + 1) Zeilen enthält: n n−1 n−2 n−3 .. .
an an−1 bn−1 cn−1
3 2 1 0
dn−1 dn−2 0 en−1 en−2 0 fn−1 0 gn−1
an−2 an−3 bn−2 cn−2
an−4 an−5 bn−3 cn−3
an−6 an−7 bn−4 cn−4
... 0 ... 0 ... 0 ... 0
Die Koeffizienten bn−1 , bn−2 , bn−3 , . . . in der dritten Zeile ergeben sich durch die Kreuzproduktbildung aus den beiden ersten Zeilen: an−1 an−2 − an an−3 , an−1 an−1 an−4 − an an−5 = , an−1 an−1 an−6 − an an−7 = ,... an−1
bn−1 = bn−2 bn−3
Bei den Kreuzprodukten wird immer von den Elementen der ersten Spalte ausgegangen. Die Berechnung dieser b-Werte erfolgt so lange, bis alle restlichen Werte null werden. Ganz entsprechend wird die Berechnung der c-Werte aus den beiden darüberliegenden Zeilen durchgeführt: bn−1 an−3 − an−1 bn−2 , bn−1 bn−1 an−5 − an−1 bn−3 = , bn−1 bn−1 an−7 − an−1 bn−4 = ,... bn−1
cn−1 = cn−2 cn−3
Aus diesen beiden neu gewonnenen Zeilen werden in gleicher Weise weitere Zeilen gebildet, wobei sich schließlich für die letzten beiden Zeilen die Koeffizienten en−1 dn−2 − dn−1 en−2 en−1 = en−2
fn−1 = gn−1
und
ergeben. Nun lautet das Routh-Kriterium: Das charakteristische Polynom P(s) mit den positiven Koeffizienten ai (i = 0, 1, 2, . . . , n) beschreibt genau dann ein asymptotisch stabiles System, wenn alle Koeffizienten in der ersten Spalte des Routh-Schemas positiv sind: bn−1 > 0 , cn−1 > 0 , . . . , dn−1 > 0 , en−1 > 0 , fn−1 > 0 , gn−1 > 0 . Beispiel: P(s) = 240 + 110s + 50s2 + 30s3 + 2s4 + s5
I33
I34
I Regelungs- und Steuerungstechnik / Regelungstechnik
P(s), mit αi und diejenigen des offenen Regelkreises mit βi , so ist folgende Darstellung möglich:
Das Routh-Schema lautet hierfür: 1 30 5 2 50 4 3 5 −10 2 54 240 1 −32, 44 0 0 240
110 240 0
0 0
n 9 (s − αi ) (s) N g i=1 = k0 n G (s) = 1 + G0 (s) = . (6-10) 9 N0 (s) (s − βi ) i=1
Da in der 1. Spalte des Routh-Schemas ein Koeffizient negativ wird, ist das zugehörige System instabil.
6.3 Das Nyquist-Verfahren [3] Dieses Verfahren ermöglicht, ausgehend vom Verlauf des Frequenzganges G0 (jω) des offenen Regelkreises, eine Aussage über die Stabilität des geschlossenen Regelkreises. Für die praktische Anwendung genügt es, dass der Frequenzgang G0 (jω) grafisch vorliegt, z. B. auch in Form experimentell ermittelter Frequenzgänge. Dieses Kriterium ist sehr allgemein anwendbar. Es ermöglicht nicht nur die Stabilitätsanalyse von Systemen mit konzentrierten Parametern, sondern auch von solchen mit verteilten Parametern oder Totzeit-Systemen. Das Kriterium kann entweder in der Ortskurvendarstellung oder in der Frequenzkennliniendarstellung formuliert werden. 6.3.1 Das Nyquist-Kriterium in der Ortskurvendarstellung
Der offene Regelkreis wird durch die Übertragungsfunktion G0 (s) = GS (s)GR (s) = Z0 (s)/N0 (s) ,
(6-7)
also durch die beiden teilerfremden Polynome Z0 (s) und N0 (s) beschrieben, für deren Grad gilt: Grad Z0 (s) = m < n = Grad N0 (s) .
(6-8)
Aus dem Nenner der Übertragungsfunktion des geschlossenen Regelkreises oder aus 1 + G0 (s) = 0 folgt das charakteristische Polynom des geschlossenen Regelkreises P(s) ≡ Ng (s) = N0 (s) + Z0 (s) = 0 ,
(6-9)
das den Grad n besitzt. Bezeichnet man die Pole des geschlossenen Regelkreises, also die Wurzeln von
Es sei nun angenommen, dass von den n Polen αi des geschlossenen Regelkreises N in der rechten s-Halbebene, ν auf der imaginären Achse und (n − N − ν) in der linken s-Halbebene liegen. Entsprechend sollen von den n Polen βi des offenen Regelkreises P in der rechten s-Halbebene, μ auf der imaginären Achse und (n − P − μ) in der linken s-Halbebene liegen. Bildet man aus (6-10) mit s = jω den Frequenzgang s( jω), so gilt für dessen Phasengang ϕ(ω) = arg [G ( jω)] = arg[Ng ( jω)] − arg[N0 ( jω)] . (6-11) Durchläuft ω den Bereich 0 ω ∞, so setzt sich die Änderung der Phase Δϕ = ϕ(∞) − ϕ(0) aus den Anteilen der Polynome Ng ( jω) und N0 ( jω) zusammen: Δϕ = Δϕg − Δϕ0 .
(6-12)
Zu Δϕ liefert jede Wurzel der Polynome Ng (s) oder N0 (s) einen Beitrag von +π/2 bzw. −π/2, wenn sie in der linken s-Halbebene liegt, und jede Wurzel rechts der imaginären Achse liefert einen Beitrag von −π/2 bzw. +π/2. Diese Phasenänderungen erfolgen stetig mit ω. Jede Wurzel jδ auf der imaginären Achse bewirkt dagegen eine sprungförmige Phasenänderung beim Durchlauf von jω durch jδ. Dieser unstetige Phasenanteil kann im Weiteren unberücksichtigt bleiben. Für den stetigen Anteil Δϕs der Phasenänderung Δϕ erhält man dann aus (6-12) Δϕs = [2(P − N) + μ − ν]π/2 .
(6-13)
Da der Frequenzgang des offenen Regelkreises G0 ( jω) vorgegeben ist, sind die Werte von P und μ meist bekannt. Mit dem Verlauf von G0 ( jω) ist aber auch Δϕs bekannt. Deshalb kann aus (6-13) ermittelt werden, ob N > 0 oder/und ν > 0 ist, d. h., ob und wie viele Pole des geschlossenen Regelkreises in der
6 Stabilität linearer kontinuierlicher Regelsysteme
rechten s-Halbebene und auf der imaginären Achse liegen. Zur Ermittlung von Δϕs wird die Ortskurve von G ( jω) = 1 + G0 ( jω) gezeichnet und der Phasenwinkel überprüft. Zweckmäßigerweise verschiebt man jedoch diese Kurve um den Wert 1 nach links und verlegt den Drehpunkt des Zeigers vom Koordinatenursprung nach dem Punkt (−1, j0) der G0 ( jω)-Ebene, der nun auch als kritischer Punkt bezeichnet wird. Somit braucht man gemäß Bild 6-1 nur die Ortskurve G0 ( jω) des offenen Regelkreises zu zeichnen, um die Stabilität des geschlossenen Regelkreises zu überprüfen. Dabei gibt nun Δϕs die stetige Winkeländerung des Fahrstrahls vom kritischen Punkt (−1, j0) zum laufenden Punkt der Ortskurve G0 ( jω) für 0 ω ∞ an. Da der geschlossene Regelkreis genau dann asymptotisch stabil ist, wenn N = ν = 0 ist, und außerdem die Größen N und ν nichtnegativ sind, folgt aus (6-13) die allgemeine Fassung des Nyquist-Kriteriums: Der geschlossene Regelkreis ist dann und nur dann asymptotisch stabil, wenn die stetige Winkeländerung (6-14) Δϕs = Pπ + μπ/2 ist. Das Nyquist-Kriterium gilt auch dann, wenn der offene Regelkreis eine Totzeit enthält. Es ist das einzige
Bild 6-2. Ortskurve des Frequenzganges eines reinen Totzeitgliedes mit der Verstärkung K0 für a stabiles und b instabiles Verhalten des geschlossenen Regelkreises
der hier behandelten Stabilitätskriterien, das für diesen Fall anwendbar ist. Beispiel: Bei einem Regelkreis, der aus einem P-Regler und einer reinen Totzeitregelstrecke besteht, lautet die charakteristische Gleichung 1 + G0 (s) = 1 + KR KS e−sT t = 0 . Die Ortskurve von G0 (jω) = K0 e−jωT t (mit K0 = KR KS ) beschreibt einen Kreis mit dem Radius |K0 |, der für 0 ω ∞ unendlich oft im Uhrzeigersinn durchlaufen wird. Da der offene Regelkreis stabil ist, gilt P = 0 und μ = 0. Gemäß Bild 6-2 können zwei Fälle unterschieden werden: a) K0 < 1: Δϕs = 0. Der geschlossene Regelkreis ist somit stabil. b) K0 > 1: Δϕs = −∞. Der geschlossene Regelkreis weist instabiles Verhalten auf. 6.3.2 Das Nyquist-Kriterium in der Frequenzkennliniendarstellung
Bild 6-1. Ortskurve von G (jω) und G0 (jω)
Der zur Ortskurve von G0 ( jω) gehörende logarithmische Amplitudengang A0dB (ω) ist für die Schnittpunktfrequenzen der Ortskurve mit der reellen Achse im Intervall (−∞, −1) stets positiv. Andererseits entspricht diesen Schnittpunkten der Ortskurve jeweils der Schnittpunkt des Phasenganges ϕ0 (ω)
I35
I36
I Regelungs- und Steuerungstechnik / Regelungstechnik
mit den Geraden ±180◦ , ±540◦ usw., also einem ungeraden Vielfachen von 180◦ . Im Falle eines „positiven“ Schnittpunktes der Ortskurve erfolgt der Übergang des Phasenganges über die entsprechende ±(2k + 1)180◦-Linie von unten nach oben und umgekehrt von oben nach unten bei einem „negativen“ Schnittpunkt gemäß Bild 6-3. Diese Schnittpunkte sollen im Weiteren als positive (+) und negative (–) Übergänge des Phasenganges ϕ0 (ω) über die jeweilige ±(2k + 1)180◦-Linie definiert werden, wobei k = 0, 1, 2, . . . gilt. Beginnt die Phasenkennlinie bei −180◦, so zählt dieser Punkt als halber Übergang mit dem entsprechenden Vorzeichen. Damit lässt sich das Nyquist-Kriterium in der für die Frequenzkennliniendarstellung passenden Form aufstellen: Der offene Regelkreis mit der Übertragungsfunktion G0 (s) besitze P Pole in der rechten s-Halbebene und möglicherweise einen einfachen oder doppelten Pol bei s = 0. Wenn für die ω-Werte, bei denen A0dB > 0 ist, S + die Anzahl der positiven und S − die Anzahl der negativen Übergänge des Phasenganges ϕ0 (ω) über ±(2k + 1)180◦-Linien ist, so ist der geschlossene Regelkreis genau dann asymptotisch stabil, wenn für die Differenz D = S + − S − die Beziehung ⎧ P ⎪ ⎪ ⎪ für μ = 0, 1 ⎪ ⎪ ⎨ 2 + − (6-15) D=S −S =⎪ ⎪ ⎪ P+1 ⎪ ⎪ ⎩ für μ = 2 2 gilt. Für den speziellen Fall, dass der offene Regelkreis stabil ist (P = 0, μ = 0) muss also die Anzahl
Bild 6-3. Frequenzkennliniendarstellung von G0 ( jω) =
der positiven und negativen Schnittpunkte gleich groß sein (D = 0). 6.3.3 Vereinfachte Formen des Nyquist-Kriteriums
In vielen Fällen ist der offene Regelkreis stabil, also P = 0 und μ = 0. In diesem Fall folgt aus (6-14) für die Winkeländerung Δϕs = 0. Dann kann das Nyquist-Kriterium wie folgt formuliert werden: Ist der offene Regelkreis asymptotisch stabil, so ist der geschlossene Regelkreis genau dann asymptotisch stabil, wenn die Ortskurve des offenen Regelkreises den kritischen Punkt (−1, j0) weder umkreist noch durchdringt. Eine andere Fassung des vereinfachten NyquistKriteriums, die auch angewandt werden kann, wenn G0 (s) Pole bei s = 0 besitzt, ist die sogenannte Linke-Hand-Regel: Der offene Regelkreis habe nur Pole in der linken s-Halbebene außer einem 1- oder 2-fachen Pol bei s = 0 (P-, I- oder I2 -Verhalten). In diesem Fall ist der geschlossene Regelkreis genau dann asymptotisch stabil, wenn der kritische Punkt (−1, j0) in Richtung wachsender ω-Werte gesehen links der Ortskurve von G0 ( jω) liegt. Die Linke-Hand-Regel lässt sich auch für das BodeDiagramm formulieren: Der offene Regelkreis habe nur Pole in der linken s-Halbebene, außer möglicherweise einen 1- oder 2-fachen Pol bei s = 0 (P-, I- oder I2 -Verhalten). In diesem Fall ist der geschlossene Regelkreis genau dann asymptotisch stabil, wenn G0 ( jω) für die Durchtrittsfrequenz ωD bei A0dB (ωD ) = 0 den Phasenwinkel ϕ0 (ωD ) = arg G0 ( jωD ) > −180◦ hat. Dieses Stabilitätskriterium bietet auch die Möglichkeit einer praktischen Abschätzung der „Stabilitätsgüte“ eines Regelkreises. Je größer der Abstand der Ortskurve vom kritischen Punkt ist, desto weiter ist der geschlossene Regelkreis vom Stabilitätsrand entfernt. Als Maß hierfür benutzt man die Begriffe Phasenrand und Amplitudenrand, die in Bild 6-4 erklärt sind. Der Phasenrand ϕR = 180◦ + ϕ0 (ωD )
(6-16)
jϕ0 (ω)
und Definition der positiven (+) und negatiA0 (ω) e ven (–) Übergänge des Phasenganges ϕ0 (ω) über die −180◦ Linie
ist der Abstand der Phasenkennlinie von der −180◦ Geraden bei der Durchtrittsfrequenz ωD , d. h. beim
7 Das Wurzelortskurvenverfahren
der der Betrag des Frequenzganges des geschlossenen Regelkreises nahezu den Wert Null erreicht hat.
7 Das Wurzelortskurvenverfahren 7.1 Der Grundgedanke des Verfahrens [1]
Bild 6-4. Phasen- und Amplitudenrand ϕR bzw. AR a in der Ortskurvendarstellung und b im Bode-Diagramm
Durchgang der Amplitudenkennlinie durch die 0-dB-Linie (|G0 | = 1). Als Amplitudenrand AR dB = A0 dB (ωS )
(6-17)
wird der Abstand der Amplitudenkennlinie von der 0-dB-Linie beim Phasenwinkel ϕ0 = −180◦ bezeichnet. Für eine gut gedämpfte Regelung, z. B. im Sinne der weiter unten behandelten betragsoptimalen Einstellung, sollten etwa folgende Werte eingehalten werden: −12 dB bis − 20 dB bei Führungsverhalten AR dB =ˆ −3,5 dB bis − 9,5 dB bei Störverhalten ◦ 40 bis 60◦ bei Führungsverhalten ϕR = 20 bis 50◦ bei Störverhalten . Die Durchtrittsfrequenz ωD stellt ein Maß für die dynamische Güte des Regelkreises dar. Je größer ωD , desto größer ist die Grenzfrequenz des geschlossenen Regelkreises, und desto schneller die Reaktion auf Sollwertänderungen oder Störungen. Als Grenzfrequenz ist dabei jene Frequenz ωg zu betrachten, bei
Das Wurzelortskurvenverfahren erlaubt, aus der bekannten Pol- und Nullstellenverteilung der Übertragungsfunktion G0 (s) des offenen Regelkreises in der s-Ebene in anschaulicher Weise einen Schluss auf die Wurzeln der charakteristischen Gleichung des geschlossenen Regelkreises zu ziehen. Variert man beispielsweise einen Parameter des offenen Regelkreises, so verändert sich die Lage der Wurzeln der charakteristischen Gleichung des geschlossenen Regelkreises in der s-Ebene. Die Wurzeln beschreiben somit in der s-Ebene Bahnen, die man als Wurzelortskurven (WOK) des geschlossenen Regelkreises definiert. Die Kenntnis der Wurzelortskurve, die meist in Abhängigkeit von einem Parameter dargestellt wird, ermöglicht neben der Aussage über die Stabilität des geschlossenen Kreises auch eine Beurteilung der Stabilitätsgüte, z. B. durch den Abstand der Pole von der imaginären Achse. Die WOK eignet sich daher nicht nur zur Analyse, sondern vorzüglich auch zur Synthese von Regelkreisen. Zur Bestimmung der WOK geht man von der Übertragungsfunktion des offenen Regelkreises m 9
G0 (s) =
(s − sNμ )
μ=1 k0 n 9
= k0G(s)
(s − sPν )
(7-1a)
ν=1
aus, wobei k0 > 0, m n und sNμ sPν gelte. Gleichung (7-1a) kann auch in der Form m 9
G0 (s) =
μ=1 k0 n 9 ν=1
|s − sNμ |
j
e
m
μ=1
ϕNμ −
n ν=1
ϕPν
(7-1b)
|s − sPν |
dargestellt werden. Die charakteristische Gleichung des geschlossenen Regelkreises ergibt sich mit (7-1) aus (7-2) 1 + k0G(s) = 0 .
I37
I38
I Regelungs- und Steuerungstechnik / Regelungstechnik
Hieraus folgt G(s) = −1/k0 .
(7-3)
Die Gesamtheit aller komplexen Zahlen si = si (k0 ), die diese Beziehung für 0 k0 ∞ erfüllen, stellen die gesuchte WOK dar. Durch Aufspalten von (7-1b) in Betrag und Phase erhält man die Amplitudenbedingung m 9 |s − sNμ | μ=1 1 = n (7-4) |G(s)| = 9 k0 |s − sPν | ν=1
Bild 7-1. Überprüfung der Phasenbedingung
und die Phasenbedingung ϕ(s) = arg[G(s)] =
m
ϕNμ −
μ=1
n
ϕPν
(7-5)
ν=1
= ±180◦(2k + 1) mit k = 0, 1, 2, . . . . Hierbei kennzeichnen ϕNμ und ϕPν die zu den komplexen Zahlen (s − sNν ) bzw. (s − sPν ) gehörenden Winkel. Offensichtlich ist die Phasenbedingung von k0 unabhängig. Alle Punkte der komplexen s-Ebene, die die Phasenbedingung erfüllen, stellen also den geometrischen Ort aller möglichen Pole des geschlossenen Kreises dar, die durch die Variation des Vorfaktors k0 entstehen können. Die Kodierung dieser WOK, d. h. die Zuordnung zwischen den Kurvenpunkten und den Werten von k0 , erhält man durch Auswertung der Amplitudenbedingung entsprechend (7-4).
7.2 Regeln zur Konstruktion von Wurzelortskurven Wie Bild 7-1 zeigt, könnte die Konstruktion von Wurzelortskurven unter Verwendung von (6-5) grafisch durchgeführt werden. Dieses Vorgehen ist jedoch nur zur Überprüfung der Phasenbedingung einzelner Punkte der s-Ebene zweckmäßig. Für die Konstruktion einer WOK werden daher folgende Regeln angewandt: 1. Die WOK ist symmetrisch zur reellen Achse. 2. Die WOK besteht aus n Ästen. (n − m) Äste enden im Unendlichen. Alle Äste beginnen mit k0 = 0 in den Polen der charakteristischen Gleichung des offenen Regelkreises, m Äste enden mit k0 → ∞ in den Nullstellen des offenen Regelkreises. Die Anzahl der in einem Pol beginnenden bzw. in einer
Nullstelle endenden Äste der WOK ist gleich der Vielfachheit der Pol- bzw. Nullstelle. 3. Es gibt n − m Asymptoten mit Schnitt im Wurzelschwerpunkt auf der reellen Achse (σa , j0) mit ⎧ ⎫ ⎪ ⎪ n m ⎪ ⎪ ⎪ 1 ⎪ ⎨ ⎬ Re s − Re s σa = . (7-6) ⎪ ⎪ Pν Nμ ⎪ ⎪ ⎪ ⎪ n − m ⎩ ν=1 ⎭ μ=1 4. Ein Punkt auf der reellen Achse gehört dann zur WOK, wenn die Gesamtzahl der rechts von ihm liegenden Pole und Nullstellen ungerade ist. 5. Mindestens ein Verzweigungs- bzw. Vereinigungspunkt existiert dann, wenn ein Ast der WOK auf der reellen Achse zwischen zwei Pol- bzw. Nullstellen verläuft; dieser reelle Punkt genügt der Beziehung n m 1 1 = (7-7) s − s s − sNμ Pν r=1 μ=1 für s = σv als Verzweigungs- bzw. Vereinigungspunkt. Sind keine Pol- oder Nullstellen vorhanden, so ist der entsprechende Summenterm gleich null zu setzen. 6. Austritts- und Eintrittswinkel aus Pol- bzw. in Nullstellenpaaren der Vielfachheit rp bzw. rN : ⎫ ⎧ ⎪ ⎪ ⎪ ⎪ n m ⎪ ⎪ ⎪ ⎪ 1 ⎨ ⎬ ◦ ϕP ,A = ϕ + ϕ ± 180 (2k + 1) − ⎪ ⎪ Pν Nμ ⎪ ⎪ ⎪ rP ⎪ ⎪ ⎪ ⎭ ⎩ ν=1 μ=1 ν±
ϕN ,E
(7-8a) ⎧ ⎫ ⎪ ⎪ ⎪ ⎪ n m ⎪ ⎪ ⎪ ⎪ 1 ⎨ ⎬ ◦ = ϕ + ϕ ± 180 (2k + 1) − . ⎪ ⎪ Nμ Pν ⎪ ⎪ ⎪ ⎪ rN ⎪ ⎪ ⎩ μ=1 ⎭ ν=1 μ±
(7-8b)
7 Das Wurzelortskurvenverfahren
Tabelle 7-1. Typische Beispiele für Pol- und Nullstellenverteilungen von G0 (s) und zugehörige Wurzelortskurve des geschlossenen Regelkreises
7. Belegung der WOK mit k0 -Werten: Zum Wert s gehört der Wert n 9 |s − sPν | ν=1 k0 = m , (7-9) 9 |s − sNμ | μ=1
(für m = 0 ist der Nenner gleich eins). 8. Asymptotische Stabilität des geschlossenen Regelkreises liegt für alle k0 -Werte vor, die auf der WOK links von der imaginären Achse liegen. Die Schnittpunkte der WOK mit der imaginären Achse liefern die kritischen Werte k0, krit . Ein typisches Beispiel für den Verlauf der WOK für den Fall der Übertragungsfunktion des offenen Systems k0 (s + 1) G0 (s) = s(s + 2)(s2 + 12s + 40)
Bild 7-2. Die Wurzelortskurve des Regelkreises mit der Übertragungsfunktion des offenen Systems k0 (s + 1) G0 (s) = . s(s + 2)(s + 6 + 2j)(s + 6 − 2j)
I39
I40
I Regelungs- und Steuerungstechnik / Regelungstechnik
zeigt Bild 7-2. Aus dem Verlauf dieser WOK kann z. B. entnommen werden, dass für k0 > 644 der geschlossene Regelkreis Pole in der rechten s-Halbebene aufweist und daher instabil wird. Weitere typische Fälle sind in Tabelle 7-1 aufgeführt.
Gründen nicht möglich, da hierzu unendlich große Stellgrößen erforderlich wären. Für eine praktische Anwendung muss daher stets überlegt werden, welche Abweichung vom idealen Fall zugelassen werden kann.
8.2 Entwurf im Zeitbereich
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
8.2.1 Gütemaße im Zeitbereich
8.1 Problemstellung Eine der wichtigsten Aufgaben stellt für den Regelungstechniker der Entwurf oder die Synthese eines Regelkreises dar. Diese Aufgabe, zu der streng genommen auch die komplette gerätetechnische Auslegung gehört, sei im Folgenden auf das Problem beschränkt, für eine vorgegebene Regelstrecke einen geeigneten Regler zu entwerfen, der die an den Regelkreis gestellten Anforderungen möglichst gut oder mit geringstem technischen Aufwand erfüllt. An den Regelkreis werden gewöhnlich folgende Anforderungen gestellt: 1. Als Mindestforderung muss der Regelkreis selbstverständlich stabil sein. 2. Störgrößen z(t) sollen einen möglichst geringen Einfluss auf die Regelgröße y(t) haben. 3. Die Regelgröße y(t) soll einer zeitlich sich ändernden Führungsgröße w(t) möglichst genau und schnell folgen. 4. Der Regelkreis soll möglichst unempfindlich (robust) gegenüber nicht zu großen Parameteränderungen sein.
Bei der Beurteilung der Güte einer Regelung erweist es sich als zweckmäßig, den zeitlichen Verlauf der Regelgröße y(t) bzw. der Regelabweichung e(t) unter Einwirkung wohldefinierter Testsignale zu betrachten. Als das wohl wichtigste Testsignal wird dazu gewöhnlich eine sprungförmige Erregung der Eingangsgröße des untersuchten Regelkreises verwendet. So kann man beispielsweise für eine sprungförmige Erregung der Führungsgröße den im Bild 8-1a dargestellten Verlauf der Regelgröße y(t) = hW (t) beobachten. Zur Beschreibung dieser Führungsübergangsfunktion werden die folgenden Begriffe eingeführt: – Die maximale Überschwingweite emax gibt den Betrag der maximalen Regelabweichung an, die nach erstmaligem Erreichen des Sollwertes (100%) auftritt.
Um die unter 2. und 3. gestellten Anforderungen zu erfüllen, müsste gemäß Forderung 3 im Idealfall für die Führungsübertragungsfunktion G0 (s) Y(s) = =1 (8-1) W(s) 1 + G0 (s) und bei einer Störung z. B. am Ausgang der Regelstrecke für die Störungsübertragungsfunktion gemäß Forderung 2 GW (s) =
GZ (s) =
1 Y(s) = =0 Z(s) 1 + G0 (s)
(8-2)
gelten. Eine strenge Verwirklichung dieser Beziehungen ist jedoch aus physikalischen und technischen
Bild 8-1. Typische Antwort eines Regelkreises bei einer
sprungförmigen Änderung a der Führungsgröße und b der Störgröße
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
– Die tmax -Zeit beschreibt den Zeitpunkt des Auftretens der maximalen Überschwingweite. – Die Anstiegszeit T a ergibt sich aus dem Schnittpunkt der Tangente im Wendepunkt W von hW (t) mit der 0%- und 100%-Linie. Häufig wird allerdings die Tangente auch im Zeitpunkt t50 verwendet, bei dem hW (t) gerade 50% des Sollwertes erreicht hat. Zur besseren Unterscheidung soll dann für diesen zweiten Fall die Anstiegszeit mit T a,50 bezeichnet werden. – Die Verzugszeit T u ergibt sich aus dem Schnittpunkt der oben definierten Wendetangente mit der t-Achse. – Die Ausregelzeit tε ist der Zeitpunkt, ab dem der Betrag der Regelabweichung kleiner als eine vorgegebene Schranke ε ist (z. B. ε = 3%, also ±3% Abweichung vom Sollwert). – Als Anregelzeit tan bezeichnet man den Zeitpunkt, bei dem erstmalig der Sollwert (100%) erreicht wird. Es gilt näherungsweise tan ≈ T u + T a . In ähnlicher Weise lässt sich gemäß Bild 8-1b auch das Störverhalten charakterisieren. Hierbei werden ebenfalls die Begriffe „maximale Überschwingweite“ und „Ausregelzeit“ definiert. Von den hier eingeführten Größen kennzeichnen im Wesentlichen emax und tε die Dämpfung und tan , T a und tmax die Schnelligkeit, also die Dynamik des Regelverhaltens, während die bleibende Regelabweichung e∞ das statische Verhalten charakterisiert.
einzuführen, wobei für fk [e(t)] gewöhnlich die in Tabelle 8.1 angegebenen verschiedenen Funktionen, wie z. B. e(t), |e(t)|, e2 (t) usw., verwendet werden. In einem derartigen integralen Gütemaß lassen sich zeitliche Ableitungen der Regelabweichung sowie zusätzlich die Stellgröße u(t) berücksichtigen. Die wichtigsten dieser Gütemaße Ik sind in Tabelle 8-1 zusammengestellt. Mithilfe solcher Gütemaße lassen sich die Integralkriterien folgendermaßen formulieren: Eine Regelung ist im Sinne des jeweils gewählten Integralkriteriums umso besser, je kleiner Ik ist. Somit erfordert ein Integralkriterium stets die Minimierung von Ik , wobei dies durch geeignete Wahl der noch freien Entwurfsparameter oder Reglereinstellwerte r1 , r2 , . . . geschehen kann. Damit lautet das Integralkriterium schließlich "∞ ! fk [e(t)] dt = Ik (r1 , r2 , . . .) = Min . (8-4) Ik =
8.2.2 Integralkriterien
Aufgrund der verschiedenartigen Anforderungen, die beim Entwurf von Regelkreisen gestellt werden, ist es nicht möglich, für alle Anwendungsfälle ein einziges, gleichermaßen gut geeignetes Gütemaß festzulegen. In sehr vielen Fällen hat sich jedoch das Minimum der quadratischen Regelfläche als Gütekriterium sehr gut bewährt. Es besitzt außerdem den Vorteil, dass es für die wichtigsten Fälle auch leicht berechnet werden kann. Zur Berechnung der quadratischen Regelfläche wird die Parseval’sche Gleichung
Aus Bild 8-1a ist ersichtlich, dass die Fläche zwischen der 100%-Geraden und der Führungsübergangsfunktion hW (t) sicherlich ein Maß für die Abweichung des Regelkreises vom idealen Führungsverhalten darstellt. Ebenso ist in Bild 8-1b die Fläche zwischen der Störübergangsfunktion hZ (t) und der t-Achse ein Maß für die Abweichung des Regelkreises vom Fall der idealen Störungsunterdrückung. In beiden Fällen handelt es sich um die Gesamtfläche unterhalb der Regelabweichung e(t) = w(t) − y(t), mit der man die Abweichung vom idealen Regelkreis beschreiben kann. Es liegt nahe, als Maß für die Regelgüte ein Integral der Form "∞ fk [e(t)] dt (8-3) Ik = 0
0
Dabei kann das gesuchte Minimum sowohl im Innern als auch auf dem Rand des durch die möglichen Einstellwerte begrenzten Definitionsbereiches liegen. Dies ist zu beachten, da beide Fälle eine unterschiedliche mathematische Behandlung erfordern. Im ersten Fall handelt es sich gewöhnlich um ein absolutes Optimum, im zweiten um ein Randoptimum. 8.2.3 Quadratische Regelfläche
"∞ I3 =
1 e (t) dt = 2πj 2
0
"+j∞ E(s)E(−s) ds
(8-5)
−j∞
verwendet. Ist E(s) eine gebrochen rationale Funktion E(s) =
C(s) c0 + c1 s + . . . + cn−1 sn−1 = , D(s) d0 + d1 s + . . . + dn sn
(8-6)
I41
I42
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 8-1. Die wichtigsten Gütemaße für Integralkriterien
Gütemaß .∞
Eigenschaft
Lineare Regelfläche : Eignet sich zur Beurteilung stark 0 gedämpfter monotoner Regelverläufe; einfache mathematische Behandlung. ∞ Betragslineare Regelfläche : . I2 = |e(t)| dt Geeignet für nichtmono0 tonen Schwingungsverlauf. Umständliche Auswertung. Quadratische Regelfläche : .∞ Berücksichtigung großer I3 = e2 (t) dt Regelabweichungen; liefert 0 größere Ausregelzeiten als I2 . In vielen Fällen analytische Berechnung möglich. ∞ Zeitbeschwerte betragslineare . I4 = |e(t)|t dt Regelfläche : Wirkung wie 0 I2 ; berücksichtigt aber zusätzlich die Dauer der Regelabweichung. Zeitbeschwerte quadratische .∞ I5 = e2 (t)t dt Regelfläche : Wirkung wie 0 I3 ; berücksichtigt zusätzlich die Dauer der Regelabweichung. ∞ Verallgemeinerte quadratische . I6 = [e2 (t) + α˙e2 (t)] dt Regelfläche : Wirkung gün0 stiger als bei I3 , allerdings Wahl des Bewertungsfaktors α subjektiv. ∞ Quadratische Regelfläche und . I7 = [e2 (t) + βu2 (t)] dt Stellaufwand : Etwas größe0 rer Wert von emax , jedoch tε wesentlich kürzer; Wahl des Bewertungsfaktors β subjektiv. Anmerkung: Besitzt der betrachtete Regelkreis eine bleibende Regelabweichung e∞ , dann ist e(t) durch e(t) − e∞ zu ersetzen, da sonst die Integrale in der obigen Form nicht konvergieren. Entsprechendes gilt auch für die Stellgröße u(t). I1 =
e(t) dt
deren sämtliche Pole in der linken s-Halbebene liegen, dann lässt sich das Integral in (8-5) durch Residu-
enrechnung bestimmen. Bis n = 10 liegt die Auswertung dieses Integrals in tabellarischer Form vor [1]. Tabelle 8-2 enthält die Integrale bis n = 4. 8.2.4 Ermittlung optimaler Einstellwerte eines Reglers nach dem Kriterium der minimalen quadratischen Regelfläche [2]
Bei vorgegebenem Führungs- bzw. Störsignal ist die quadratische Regelfläche "∞ I3 =
[e(t) − e∞ ]2 dt = I3 (r1 , r2 , . . .)
(8-7)
0
nur eine Funktion der zu optimierenden Reglerparameter r1 , r2 , . . . . Die optimalen Reglerparameter sind nun diejenigen, durch die I3 minimal wird. Zur Lösung dieser einfachen mathematischen Extremwertaufgabe ! (8-8) I3 (r1 , r2 , . . .) = Min gilt unter der Voraussetzung, dass der gesuchte Optimalpunkt (r1 opt , r2 opt , . . .) nicht auf dem Rand des möglichen Einstellbereichs liegt, somit für alle partiellen Ableitungen von I3 ∂I3 ∂I3 = 0, = 0 , . . . (8-9) ∂r1 r2 opt r 3 opt ,... ∂r2 r1 opt r3 opt ,... Diese Beziehung stellt einen Satz von Bestimmungsgleichungen für die Extrema von (8-7) dar. Im Optimalpunkt muss I3 ein Minimum werden. Ein derartiger Punkt kann nur im Bereich stabiler Reglereinstellwerte liegen. Beim Auftreten mehrerer Punkte, die (8-8) erfüllen, muss u. U. durch Bildung der zweiten partiellen Ableitungen von I3 geprüft werden, ob der betreffende Extremwert ein Minimum ist. Treten mehrere Minima auf, dann beschreibt das absolute Minimum den Optimalpunkt der gesuchten Reglereinstellwerte ri = ri opt (i = 1, 2, . . .). Am Beispiel einer Reglerstrecke mit der Übertragungsfunktion GS (s) =
1 , (1 + s)3
(8-10)
die mit einem PI-Regler mit der Übertragungsfunktion 1 GR (s) = KR 1 + (8-11) , TI s
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
Tabelle 8-2. Quadratische Regelfläche I3,n für n = 1 bis n = 4
I3,1 = I3,2 = I3,3 = I3,4 =
c20 2d0 d1 c21 d0 + c20 d2 2d0 d1 d2 2 c2 d0 d1 + c21 − 2c0 c2 d0 d3 + c20 d2 d3 c23
2d0 d3 (−d0 d3 + d1 d2 ) + d0 d1 d2 + c22 − 2c1 c3 d0 d1 d4 + c21 − 2c0 c2 d0 d3 d4 + c20 −d1 d42 + d2 d3 d4 2d0 d4 −d0 d32 − d12 d4 + d1 d2 d3
−d02 d3
zu einem Regelkreis zusammengeschaltet wird, soll die Ermittlung von KR opt und T I opt nach der minimalen quadratischen Regelfläche I3 für eine sprungförmige Störung am Eingang der Regelstrecke gezeigt werden. 1. Schritt: Bestimmung des Stabilitätsrandes: Aus der charakteristischen Gleichung dieses Systems 4. Ordnung, T I s4 + 3T I s3 + 3T I s2 + T I (1 + KR)s + KR = 0 , (8-12) erhält man nach Anwendung z. B. des HurwitzKriteriums als Grenzkurven des Stabilitätsbereichs KR = 0 und T I stab = 9KR /[(1+ KR)(8− KR)] . (8-13) Der Bereich stabiler Reglereinstellwerte ist in Bild 8-2 dargestellt.
2. Schritt: Bestimmung der quadratischen Regelfläche: Die Laplace-Transformierte der Regelabweichung E(s) lautet im vorliegenden Fall E(s) =
−T I · (1/s) . KR + (1 + KR )T I s + 3T I s2 + 3T I s3 + T I s4
Wendet man darauf den entsprechenden Ausdruck aus Tabelle 8-2 an, so erhält man die quadratische Regelfläche I3 =
T I (8 − KR )
2 KR (1 + KR )(8 − KR ) −
9KR TI
' .
(8-14)
3. Schritt: Bestimmung des Optimalpunktes (KR opt , T I opt ): Da der gesuchte Optimalpunkt im Innern des Stabilitätsbereichs liegt, muss dort notwendigerweise ∂I3 = 0 und ∂KR
∂I3 =0 ∂T I
(8-15a,b)
gelten. Jede dieser beiden Bedingungen liefert eine Optimalkurve T I (KR ) in der (KR , T I )-Ebene, deren Schnittpunkt, falls er existiert und im Innern des Stabilitätsbereichs liegt, der gesuchte Optimalpunkt ist. Aus (8-15a,b) erhält man die Optimalkurven 9KR (16 − KR ) (8 − KR )2 (1 + 2KR ) (8-16a,b) 18KR . = (1 + KR )(8 − KR )
T I opt 1 = und
Bild 8-2. Das Regelgütediagramm für das untersuchte Bei-
spiel
T I opt 2
Beide Optimalkurven gehen durch den Ursprung (Maximum von I3 auf dem Stabilitätsrand) und haben, wie die Kurve für den Stabilitätsrand nach (8-13), bei KR = 8 einen Pol. Durch Gleichsetzen der
I43
I44
I Regelungs- und Steuerungstechnik / Regelungstechnik
beiden rechten Seiten von (16a) und (16b) erhält man den gesuchten Optimalpunkt mit den Koordinaten KR opt = 5
und T I opt = 5 .
Der Optimalpunkt liegt im Bereich stabiler Reglereinstellwerte. 4. Schritt: Zeichnen des Regelgütediagramms: Vielfach will man den Verlauf von I3 (KR , T I ) in der Nähe des gewählten Optimalpunktes kennen, um das Verhalten des Regelkreises bei Veränderung der Reglerparameter abschätzen zu können. Ein Optimalpunkt, in dessen Umgebung I3 (KR , T I ) stark ansteigt, kann nur dann gewählt werden, wenn die einmal eingestellten Werte möglichst genau eingehalten werden. Nun ermittelt man Kurven T Ih (KR ), auf denen die quadratische Regelfläche konstante Werte annimmt (Höhenlinien), und zeichnet einige in das Stabilitätsdiagramm ein. Gleichung (8-14), nach T I aufgelöst, liefert als Bestimmungsgleichung für die gesuchten Höhenlinien ⎡ ⎤ ⎢⎢⎢ 18I3 ⎥⎥⎥ 2 2 T Ih1,2 = KR ⎣⎢I3 (KR + 1) ± I3 (KR + 1) − ⎦⎥ . 8 − KR (8-17) Die Höhenlinien I3 = const stellen geschlossene Kurven in der (KR , T I )-Ebene dar. Zusammen mit der Grenzkurve des Stabilitätsrandes bilden sie das Regelgütediagramm nach Bild 8-2. Die optimalen Reglereinstellwerte hängen von der Art und dem Eingriffsort der Störgröße ab. Auch sind diese Werte für Führungsverhalten anders als für Störverhalten.
Die Berechnung optimaler Reglereinstellwerte nach dem quadratischen Gütekriterium ist im Einzelfall recht aufwändig. Daher wurden für die Kombinationen der wichtigsten Regelstrecken mit Standardreglertypen (PID-, PI-, PD- und P-Regler) die optimalen Einstellwerte in allgemein anwendbarer Form berechnet und für Regelstrecken bis 4. Ordnung tabellarisch dargestellt [2]. 8.2.5 Empirisches Vorgehen
Viele industrielle Prozesse weisen Übergangsfunktionen mit rein aperiodischem Verhalten gemäß Bild 8-3 auf, d. h., ihr Verhalten kann durch PTn -Glieder sehr gut beschrieben werden. Häufig können diese Prozesse durch das vereinfachte mathematische Modell KS −T t s e , (8-18) GS (s) = 1 + Ts das ein Verzögerungsglied 1. Ordnung und ein Totzeitglied enthält, hinreichend gut approximiert werden. Bild 8-3 zeigt die Approximation eines PTn -Gliedes durch ein derartiges PT1 Tt -Glied. Dabei wird durch die Konstruktion der Wendetangente die Übergangsfunktion hS (t) mit folgenden drei Größen charakterisiert: KS (Übertragungsbeiwert oder Verstärkungsfaktor der Regelstrecke), T a (Anstiegszeit) und T u (Verzugszeit). Bei einer groben Approximation nach (8-18) wird dann meist T t = T u und T = T a gesetzt. Für Regelstrecken der hier beschriebenen Art wurden zahlreiche Einstellregeln für Standardregler in der Literatur [3] angegeben, die teils empirisch, teils
Tabelle 8-3. Reglereinstellwerte nach Ziegler und Nichols
Reglertypen Methode I
P PI PID
Methode II
P PI PID
Reglereinstellwerte KR 0,5 KR krit 0,45 KR krit 0,6 KR krit 1 Ta · KS T u 0,9 T a · KS T u 1,2 T a · KS T u
TI − 0,85 T krit 0,5 T krit
TD − − 0,12 T krit
−
−
3,33 T u
−
2 Tu
0,5 T u
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
Dabei ist zu beachten, dass die Messung der Übergangsfunktion hS (t) nur bis zum Wendepunkt W erforderlich ist, da die Steigung der Wendetangente bereits das Verhältnis KS /T a beschreibt. Anhand der Messwerte T u und KS /T a sowie mithilfe der in Tabelle 8-3 angegebenen Formeln lassen sich dann die Reglereinstellwerte einfach berechnen. Bild 8-3. Beschreibung der Übergangsfunktion hS (t) durch
KS , T a und T u
durch Simulation an entsprechenden Modellen gefunden wurden. Die wohl am weitesten verbreiteten empirischen Einstellregeln sind die von Ziegler und Nichols [4]. Diese Einstellregeln wurden empirisch abgeleitet, wobei die Übergangsfunktion des geschlossenen Regelkreises je Schwingungsperiode eine Amplitudenabnahme von ca. 25% aufwies. Bei der Anwendung dieser Einstellregeln kann zwischen folgenden zwei Fassungen (Tabelle 8-3) gewählt werden: a) Methode des Stabilitätsrandes (I): Hierbei geht man in folgenden Schritten vor: 1. Der jeweils im Regelkreis vorhandene Standardregler wird zunächst als reiner P Regler geschaltet. 2. Die Verstärkung KR dieses P-Reglers wird so lange vergrößert, bis der geschlossene Regelkreis Dauerschwingungen ausführt. Der dabei eingestellte KR -Wert wird als kritische Reglerverstärkung KR krit bezeichnet. 3. Die Periodendauer T krit (kritische Periodendauer) der Dauerschwingung wird gemessen. 4. Man bestimmt nun anhand von KR krit und T krit mithilfe der in Tabelle 8-3 angegebenen Formeln die Reglereinstellwerte KR , T I und T D . b) Methode der Übergangsfunktion (II): Häufig wird es bei einer industriellen Anlage nicht möglich sein, den Regelkreis zur Ermittlung von KR krit und T krit im grenzstabilen Fall zu betreiben. Im Allgemeinen bereitet jedoch die Messung der Übergangsfunktion hS (t) der Regelstrecke keine Schwierigkeiten. Daher erscheint in vielen Fällen die zweite Form der Ziegler-NicholsEinstellregeln, die direkt von der Steigung der Wendetangente KS /T a und der Verzugszeit T u der Übergangsfunktion ausgeht, als zweckmäßiger.
8.3 Entwurf im Frequenzbereich [5] 8.3.1 Kenndaten des geschlossenen Regelkreises im Frequenzbereich und deren Zusammenhang mit den Gütemaßen im Zeitbereich
Ein Regelkreis, dessen Übergangsfunktion hW (t) einen Verlauf entsprechend Bild 8-1a aufweist, besitzt gewöhnlich einen Frequenzgang GW ( jω) mit einer Amplitudenüberhöhung, der sich qualitativ im Bode-Diagramm nach Bild 8-4 darstellen lässt. Zur Beschreibung dieses Verhaltens eignen sich folgende teilweise bereits eingeführten Kenndaten: (a) Resonanzfrequenz ωr , (b) Amplitudenüberhöhung AW max dB , (c) Bandbreite ωb und (d) Phasenwinkel ϕb = ϕ(ωb ). Für die weiteren Überlegungen wird die Annahme gemacht, dass der geschlossene Regelkreis näherungsweise durch ein PT2 S-Glied mit der Übertragungsfunktion GW (s) =
ω20 G0 (s) = 2 1 + G0 (s) s + 2 Dω0 s + ω20
(8-19)
beschrieben werden kann, wobei die Kenndaten der Eigenfrequenz ω0 und des Dämpfungsgrades D das Regelverhalten vollständig charakterisieren. Dies ist sicherlich dann mit guter Näherung möglich, wenn die reale Führungsübertragungsfunktion ein dominierendes Polpaar besitzt, das in der s-Ebene der jωAchse am nächsten liegt, somit die langsamste Eigenbewegung beschreibt und damit das dynamische Eigenverhalten des Systems am stärksten beeinflusst, sofern die übrigen Pole hinreichend weit links davon liegen. Aus der zu (19) gehörenden Übergangsfunktion hW (t) können folgende dämpfungsabhängige Größen berechnet werden: a) Maximale Überschwingweite: emax = hW (tmax ) −1 = e
− √D
1−D2
π
= f1 (D) . (8-20)
I45
I46
I Regelungs- und Steuerungstechnik / Regelungstechnik
b) Anstiegszeit T a, 50 : Die Anstiegszeit wird nachfolgend nicht über die Wendetangente, sondern über die Tangente im Zeitpunkt t = t50 (vgl. Bild 8-1a) bestimmt, bei dem hW (t) gerade 50% des stationären Wertes hW∞ = 1 erreicht hat. Die Berechnung liefert √ 1 − D2 ω0 T a, 50 = √ ∗ e−D f 2 (D) sin 1 − D2 f2∗ (D) = f2 (D) ,
(8-21)
wobei f2∗ (D) = ω0 t50 numerisch bestimmt werden muss [8].
Bild 8-4. Bode-Diagramm des geschlossenen Regelkreises
bei Führungsverhalten
c) Ausregelzeit tε : Wählt man ε = 3%, dann erhält man über die Einhüllende des Schwingungsverlaufs ω0 t3% ≈
1 [3,5 − 0,5 ln(1 − D2 )] = f3 (D) . (8-22) D
d) Bandbreite ωb und Phasenwinkel ϕb : Aus der in Bild 8-4 dargestellten Definition der Bandbreite folgt
ωb = (1 − 2D2 ) + (1 − 2D2 )2 + 1 = f4 (D) ω0 (8-23) und
2D (1 − 2D2 ) + (1 − 2D2 )2 + 1 ϕb = arctan 2D2 − (1 − 2D2 )2 + 1 (8-24) = f5 (D) .
Bild 8-5. Abhängigkeit der Kenngrößen f1 (D) bis f6 (D) von der Dämpfung D des geschlossenen Regelkreises mit PT2 SVerhalten
Weiterhin erhält man mit (8-21) aus (8-23) ωb T a,50 = f2 (D) f4 (D) = f6 (D).
(8-25)
Der Verlauf der Funktionen f1 (D) bis f6 (D) ist im Bild 8-5 dargestellt. Durch Approximation von f4 (D), f5 (D) und f6 (D) lassen sich dann folgende Faustformeln ableiten: 1.
ωb ≈ 1,8 − 1,1D ω0
für 0,3 < D < 0,8 , (8-26)
2.
|ϕb | ≈ π − 2,23D
für 0 D 1,0 ,
(8-27)
(ϕb im Bogenmaß) 3.
ωb T a, 50 ≈ 2,3 für 0,3 < D < 0,8 .
(8-28)
8.3.2 Kenndaten des offenen Regelkreises und deren Zusammenhang mit den Gütemaßen des geschlossenen Regelkreises im Zeitbereich
Im Folgenden wird davon ausgegangen, dass der offene Regelkreis Verzögerungsverhalten besitzt und somit ein Bode-Diagramm gemäß Bild 8-6 aufweist. Zur Beschreibung dieses Frequenzganges G0 ( jω) werden folgende Kenndaten verwendet: (a) Durchtrittsfrequenz ωD , (b) Phasenrand ϕR und (c) Amplitudenrand AR dB . Es sei wiederum angenommen, dass das dynamische Verhalten des geschlossenen Regelkreises angenähert durch ein
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
dominierendes konjugiert komplexes Polpaar charakterisiert werden kann und somit durch (8-19) beschrieben wird. In diesem Fall folgt aus (8-19) als Übertragungsfunktion des offenen Regelkreises ω20 GW (s) = . (8-29) 1 − GW (s) s(s + 2Dω0 ) Das zu (8-29) gehörende Bode-Diagramm weicht von dem in Bild 8-6 dargestellten wesentlich ab, da dieses offensichtlich keinen I-Anteil besitzt und von höherer als 2. Ordnung ist. In der Nähe der Durchtrittsfrequenz ωD weisen allerdings beide Bode-Diagramme einen ähnlichen Verlauf auf und somit lässt sich G0 ( jω) gemäß Bild 8-6 in der Nähe der Durchtrittsfrequenz ωD durch (8-29) approximieren. Damit erhält die zugehörige Führungsübertragungsfunktion GW (s) ein dominierendes konjugiert komplexes Polpaar. Um die für ein System 2. Ordnung hergeleiteten Gütespezifikationen auch auf Regelsysteme höherer Ordnung übertragen zu können, sollte man daher beim Entwurf anstreben, dass deren Betragskennlinien |G0 ( jω)| in der Nähe von ωD mit etwa 20dB/Dekade abfallen. Für (8-29) ist dies nur erfüllt, wenn ωD < ω0 ist. Aus (8-29) erhält man mit der Bedingung |G0 ( jωD )| = 1 die Kenngröße
√ ωD = 4D4 + 1 − 2D2 = f7 (D) , (8-30) ω0 aus der für ωD < ω0 schließlich die Bedingung D > 0,42 folgt. Wählt man also als Dämpfungsgrad einen Wert D > 0,42, dann ist gewährleistet, dass die Beitragskennlinie |G0 |dB des offenen Regelkreises in der Umgebung der Durchtrittsfrequenz ωD mit 20 dB/Dekade abfällt. Außerdem zeigt Bild 8-7, dass für den geschlossenen Regelkreis gerade das Intervall 0,5 < D < 0,7 einen Bereich günstiger Dämpfungswerte darstellt, da hierbei sowohl die Anstiegszeit als G0 (s) =
Bild 8-7. Übergangsfunktion hW (t) des geschlossenen Regelkreises mit PT2 S-Verhalten
auch die maximale Überschwingweite vom Standpunkt der Regelgüte aus akzeptable Werte annehmen. Dies bedeutet aber andererseits, dass dann auch Phasen- und Amplitudenrand ϕR und AR dB günstige Werte besitzen. Die Durchtrittsfrequenz ωD stellt ein wichtiges Gütemaß für das dynamische Verhalten des geschlossenen Regelkreises dar. Je größer ωD , desto größer ist gewöhnlich die Bandbreite ωb von GW ( jω) und desto schneller ist auch die Reaktion auf Sollwertänderungen. Neben (8-30) lassen sich weitere wichtige Zusammenhänge zwischen den Kenndaten für das Zeitverhalten des geschlossenen Regelkreises und den Kenndaten für das Frequenzverhalten des offenen und damit teilweise auch des geschlossenen Regelkreises angeben. So folgt aus (8-30) unter Verwendung von (8-21) direkt ωD T a, 50 = f2 (D) f7 (D) = f8 (D) .
(8-31)
Der Verlauf von f8 (D) ist im Bild 8-8 dargestellt. Es lässt sich leicht nachprüfen, dass dieser Kurvenverlauf in guter Näherung im Bereich 0 < D < 1 durch die Näherungsformel ωD T a, 50 ≈ 1,5 −
emax [in %] 250
(8-32a)
oder ωD T a, 50 ≈ 1,5 für emax 20% oder D > 0,5 (8-32b) Bild 8-6. Bode-Diagramm des offenen Regelkreises
beschrieben werden kann. Ein weiterer Zusammenhang ergibt sich aus der Durchtrittsfrequenz ωD für
I47
I48
I Regelungs- und Steuerungstechnik / Regelungstechnik
quenz ωD und über (8-34) ϕR [in ◦ ] ≈ 70 − emax [in %] der Phasenrand ϕR berechnet, sowie zweckmäßigerweise aus f1 (D) der Dämpfungsgrad D bestimmt.
Bild 8-8. Abhängigkeit der Kenndaten f7 (D) bis f9 (D) von der Dämpfung D des geschlossenen Regelkreises mit PT2 SVerhalten
den Phasenrand ω0 1 ϕR = arctan 2D = arctan 2D = f9 (D) ωD f7 (D) (8-33) Bild 8-8 enthält den grafischen Verlauf dieser Funktion. Man kann hier durch Überlagerung von f9 (D) mit f1 (D) zeigen, dass im Bereich 0,3 D 0,8, also für die hauptsächlich interessierenden Werte der Dämpfung, die Näherungsformel ϕR [in ◦ ] + emax [in %] ≈ 70
(8-34)
gilt. 8.3.3 Reglerentwurf nach dem Frequenzkennlinien-Verfahren
Ausgangspunkt dieses Verfahrens ist die Darstellung des Frequenzganges G0 ( jω) des offenen Regelkreises im Bode-Diagramm. Die zu erfüllenden Spezifikationen des geschlossenen Regelkreises werden zunächst als Kenndaten des offenen Regelkreises formuliert. Die eigentliche Syntheseaufgabe besteht dann darin, durch Wahl einer geeigneten Reglerübertragungsfunktion GR (s) den Frequenzgang des offenen Regelkreises so zu verändern, dass er die geforderten Kenndaten erfüllt. Das Verfahren läuft im Wesentlichen in folgenden Schritten ab: 1. Schritt: Gewöhnlich sind bei einer Syntheseaufgabe die Kenndaten für das Zeitverhalten des geschlossenen Regelkreises, also emax , T a, 50 und e∞ vorgegeben. Aufgrund dieser Werte werden mithilfe von Tabelle 5-1 der Verstärkungsfaktor K0 , aus der Faustformel für ωD T a, 50 ≈ 1,5 gemäß (32b) die Durchtrittsfre-
2. Schritt: Zunächst wird als Regler ein reines PGlied gewählt, sodass der im 1. Schritt ermittelte Wert von K0 eingehalten wird. Durch Einfügen weiterer geeigneter Reglerübertragungsglieder (oft auch als Kompensations- oder Korrekturglieder bezeichnet) verändert man G0 so, dass man die übrigen im 1. Schritt ermittelten Werte ωD und ϕR erhält, und dabei in der näheren Umgebung der Durchtrittsfrequenz ωD der Amplitudenverlauf |G0 ( jω)|dB mit etwa 20 dB/Dekade abfällt. Diese zusätzlichen Übertragungsglieder des Reglers werden meist in Reihenschaltung mit den übrigen Regelkreisgliedern angeordnet. 3. Schritt: Es muss nun geprüft werden, ob das ermittelte Ergebnis tatsächlich den geforderten Spezifikationen entspricht. Dies kann entweder durch Simulation an einem Rechner direkt durch Ermittlung der Größen von emax , T a, 50 und e∞ erfolgen oder indirekt unter Verwendung der Formeln zur Berechnung der Amplitudenüberhöhung √ AW max = 1/(2D 1 − D2 ) und der Bandbreite ωb ≈ 2,3/T a, 50 . Diese Werte werden eventuell noch überprüft, indem man anhand der Frequenzkennlinien des offenen Regelkreises die Frequenzkennlinien des geschlossenen Regelkreises berechnet. Hieraus ist ersichtlich, dass dieses Verfahren nicht zwangsläufig im ersten Durchgang bereits den geeigneten Regler liefert. Es handelt sich hierbei vielmehr um ein systematisches Probierverfahren, das gewöhnlich erst bei mehrmaligem Wiederholen zu einem befriedigenden Ergebnis führt. Zum Entwurf des Reglers reichen bei diesem Verfahren die im Kapitel 5 vorgestellten Standardreglertypen gewöhnlich nicht mehr aus. Der Regler muss – wie oben bei Schritt 2 gezeigt wurde – aus verschiedenen Einzelübertragungsgliedern synthetisiert werden. Dabei sind die in 8.3.4 behandelten beiden Übertragungsglieder, die eine Phasenanhebung bzw. eine Phasenabsenkung ermöglichen, von besonderem Interesse. 8.3.4 Korrekturglieder für Phase und Amplitude
Derartige Übertragungsglieder, meist als Phasenkorrekturglieder bezeichnet, werden verwendet, um in
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
gewissen Frequenzbereichen die Phase oder Amplitude anzuheben oder abzusenken. Die Übertragungsfunktion dieser Glieder ist s 1+ 1 + Ts 1/T = . GR (s) = (8-35) s 1 + αT s 1 + 1/(αT ) Daraus ergibt sich für s = jω der Frequenzgang ω ωZ GR ( jω) = ω 1+j ωN 1+j
(8-36)
mit den beiden Eckfrequenzen ωZ =
1 T
und ωN =
1 . αT
(8-37a,b)
Hierbei gilt für das phasenanhebende Glied (LeadGlied) 1 0 < α < 1 und mh = = ωN /ωZ > 1 . α und für das phasenabsenkende Glied (Lag-Glied) α>1
und ms = α = ωZ /ωN > 1 .
Bild 8-9 zeigt für beide Übertragungsglieder das zugehörige Bode-Diagramm. Man erkennt leicht die Symmetrieeigenschaften beider Korrekturglieder, die eine gleichartige Darstellung mit den entsprechenden Kenngrößen gemäß Tabelle 8-4 und dem Phasendiagramm nach Bild 8-10 ermöglichen. Für beide Glieder wird die untere Eckfrequenz mit ωu , die obere Eckfrequenz mit ωo bezeichnet.
Bild 8-9. Bode-Diagramm a des phasenanhebenden und b
des phasenabsenkenden Übertragungsgliedes
8.3.5 Reglerentwurf mit dem Wurzelortskurvenverfahren
Der Reglerentwurf mithilfe des Wurzelortskurvenverfahrens schließt unmittelbar an die Überlegungen in 8.3.1 an. Dort wurden die Forderungen an die Überschwingweite, die Anstiegszeit und die Ausregelzeit für den geschlossenen Regelkreis mit einem dominierenden Polpaar in Bedingungen für den Dämpfungsgrad D und die Eigenfrequenz ω0 der zugehörigen Übertragungsfunktion GW (s) umgesetzt.
Tabelle 8-4. Gemeinsame Darstellung des phasenanhebenden und phasenabsenkenden Gliedes
Gemeinsame Kenngröße
m ωu ωo ϕ Extremwert des Phasenwinkels bei Extremwert der Amplitude
phasenanhebendes Glied (0 < α < 1) 1 mh = α ωZ mh ω Z ϕ > 0◦ √ ωmax = ωZ mh
phasenabsenkendes Glied (α > 1)
|ΔGR|dB = 20 lg mh
|ΔGR |dB = −20 lg ms
ms = α ωN ms ω N ϕ < 0◦
√ ωmin = ωN ms
I49
I50
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 8-10. Phasendiagramm für Phasenkorrek-
turglieder
Mit D und ω0 liegen aber unmittelbar die Pole der Übertragungsfunktion GW (s) fest. Es muss nun eine Übertragungsfunktion G0 (s) des offenen Regelkreises so bestimmt werden, dass der geschlossene Regelkreis ein dominierendes Polpaar an der gewünschten Stelle erhält, die durch die Werte ω0 und D vorgegeben ist. Einen solchen Ansatz bezeichnet man auch als Polvorgabe. Mit dem Wurzelortskurvenverfahren besitzt man ein grafisches Verfahren, mit dem eine Aussage über die Lage der Pole des geschlossenen Regelkreises gemacht werden kann. Es bietet sich an, das gewünschte dominierende Polpaar zusammen mit der Wurzelortskurve (WOK) des fest vorgegebenen Teils des Regelkreises in die komplexe s-Ebene einzuzeichnen und durch Hinzufügen von Pol- und Nullstellen des Reglers im offenen Regelkreis die
WOK so zu verformen, dass zwei ihrer Äste bei einer bestimmten Verstärkung K0 das gewünschte dominierende, konjugiert komplexe Polpaar schneiden. Bild 8-11 zeigt, wie man prinzipiell durch Hinzufügen eines Pols die WOK nach rechts und durch Hinzufügen einer Nullstelle die WOK nach links verformen kann.
8.4 Analytische Entwurfsverfahren 8.4.1 Vorgabe des Verhaltens des geschlossenen Regelkreises
Die gewünschte Führungsübertragungsfunktion ! GW (s) = KW (s) des Regelkreises wird im einfachsten Falle durch KW (s) =
β0 β0 + β1 s + . . . + βu su
(8-38)
festgelegt. Für einen derartigen Regelkreis existieren verschiedene Möglichkeiten, sogenannte Standardformen, um die Übergangsfunktion hW (t) sowie die Polverteilung von KW (s) bzw. die Koeffizienten des Nennerpolynoms β(s) aus tabellarischen Darstellungen zu entnehmen [5]. Eine dieser Standardformen ist z. B. gegeben durch KW (s) =
Bild 8-11. Verbiegen der Wurzelortskurve a nach rechts durch Hinzufügen eines zusätzlichen Pols, b nach links durch eine zusätzliche Nullstelle im offenen Regelkreis
5k (1 + κ2 )ωk+2 0
, (s + ω0 + jκω0 )(s + ω0 − jκω0 )(s + 5ω0 )k (8-39) also durch einen reellen k-fachen Pol (k = u − 2) und ein komplexes Polpaar. Tabelle 8-5 enthält für ver-
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
Tabelle 8-5. Übertragungsverhalten bei Vorgabe eines komplexen Polpaares und eines reellen k-fachen Pols für (39)
schiedene Werte von k und κ die zeitnormierten Übergangsfunktionen hW (ω0 t). Durch geeignete Wahl von k, κ und ω0 lässt sich für zahlreiche Anwendungsfälle meist eine Führungsübertragungsfunktion finden, die die gewünschten Gütemaße im Zeitbereich erfüllt. 8.4.2 Das Verfahren nach Truxal-Guillemin [6]
Bei dem im Bild 8-12 dargestellten Regelkreis sei das Verhalten der Regelstrecke durch die gebrochen rationale Übertragungsfunktion GS (s) =
d0 + d1 s + d2 s2 + . . . + dm sm D(s) = C(s) c0 + c1 s + c2 s2 + . . . + cn sn (8-40)
gegeben. Dabei sollen das Zähler- und Nennerpolynom D(s) und C(s) keine gemeinsamen Wurzeln besitzen; weiterhin sei GS (s) auf cn = 1 normiert, und es gelte m < n. Zunächst wird angenommen, dass GS (s) stabil sei und minimales Phasenverhalten besitze. Für
den zu entwerfenden Regler wird die Übertragungsfunktion b0 + b1 s + b2 s2 + . . . + bw sw B(s) = GR (s) = 2 z A(s) a0 + a1 s + a2 a + . . . + az s (8-41) angesetzt und ebenfalls normiert mit az = 1. Aus Gründen der Realisierbarkeit des Reglers muss w z gelten. Der Regler soll nun so entworfen werden, dass sich der geschlossene Regelkreis entsprechend einer gewünschten, vorgegebenen Führungsübertragungsfunktion α0 + α1 s + . . . + αv sv α(s) u>v = KW (s) = β0 + β1 s + . . . + βu su β(s) (8-42)
Bild 8-12. Blockschaltbild des zu entwerfenden Regelkrei-
ses
I51
I52
I Regelungs- und Steuerungstechnik / Regelungstechnik
verhält, wobei KW (s) unter der Bedingung der Realisierbarkeit des Reglers frei wählbar sein soll. Aus der Führungsübertragungsfunktion des geschlossenen Regelkreises, GW (s) =
GR (s)GS (s) ! = KW (s) , 1 + GR (s)GS (s)
(8-43)
erhält man die Reglerübertragungsfunktion GR (s) =
KW (s) 1 · GS (s) 1 − KW (s)
(8-44)
oder mit den oben angegebenen Zähler- und Nennerpolynomen GR (s) =
C(s)α(s) B(s) = . A(s) D(s)[β(s) − α(s)]
(8-45)
8.4.3 Algebraisches Entwurfsverfahren
Bei diesem Verfahren soll entsprechend Bild 8-12 für eine durch (8-40) beschriebene Regelstrecke ein Regler gemäß (8-41) so entworfen werden, dass der geschlossene Regelkreis sich nach einer gewünschten, vorgegebenen Führungsübertragungsfunktion, (8-42), verhält. Dabei wird die Ordnung von Zähler- und Nennerpolynom der Reglerübertragungsfunktion gleich groß gewählt (w = z). Die Pole des geschlossenen Regelkreises sind die Wurzeln der charakteristischen Gleichung, die man aus 1 + GR (s)GS (s) = 0 unter Berücksichtigung der in (8-40) und (8-41) definierten Polynome zu β(s) = A(s)C(s) + B(s)D(s) = 0 erhält. Daraus folgt mit (8-42)
Die Realisierbarkeitsbedingung für den Regler
u
Grad B(s) = w = n + v Grad A(s) = z = u + m liefert somit u−vn−m.
(8-46)
Der Polüberschuss (u − v) der gewünschten Übertragungsfunktion KW (s) für das Führungsverhalten des geschlossenen Regelkreises muss also größer oder gleich dem Polüberschuss (n − m) der Regelstrecke sein. Im Rahmen dieser Forderung ist die Ordnung von KW (s) zunächst frei wählbar. Nach (8-44) enthält der Regler die reziproke Übertragungsfunktion 1/GS (s) der Regelstrecke; es liegt hier also eine vollständige Kompensation der Regelstrecke vor. Dies lässt sich auch in einem Blockschaltbild veranschaulichen, wenn man in (8-44) KW (s) explizit als „Modell“ einführt (Bild 8-13). Bei der physikalischen Realisierung des Reglers GR (s) ist natürlich von (8-45) auszugehen, da eine direkte Realisierung von 1/GS (s) nicht möglich ist. Dieses Verfahren ist in erweiterter Form auch für minimalphasige und instabile Regelstrecken anwendbar [5].
Bild 8-13. Kompensation der Regelstrecke
(8-47)
β(s) = β0 + β1 s + . . . + βu su = βu
(s − si ) = 0 . i=1
(8-48) Dieses Polynom besitzt die Ordnung u = z + n; seine Koeffizienten hängen von den Parametern der Regelstrecke und des Reglers ab und sind lineare Funktionen der gesuchten Reglerparameter. Andererseits ergeben sich die Koeffizienten βi unmittelbar aus den vorgegebenen Polen si des geschlossenen Regelkreises. Der Koeffizientenvergleich von (8-47) und (8-48) liefert die eigentlichen Synthesegleichungen, nämlich ein lineares Gleichungssystem für die 2z + 1 unbekannten Reglerkoeffizienten a0 , a1 , . . . , az−1 , b0 , b1 , . . . , bz :
βi = b0 di + b1 di−1 + . . . + bw di−w + a0 ci + a1 ci−1 + . . . + az ci−z ,
(8-49)
wobei dk = 0 für k < 0 und k > m, ck = 0 für k < 0 und k > n sowie w = z nach Voraussetzung gilt. Die Zahl der Gleichungen ist u = z + n. Daraus ergibt sich als Bedingung für die eindeutige Auflösbarkeit die Ordnung des Reglers zu z = n − 1. Für Regelstrecken mit integralem Verhalten genügt die Reglerordnung z = n − 1; bei Regelstrecken mit proportionalem Verhalten, oder wenn Störgrößen am Eingang integraler Regelstrecken berücksichtigt werden müssen, sollte die Verstärkung des Reglers beeinflussbar sein. Dies geschieht dadurch, dass man die Reglerordnung um 1 erhöht, d. h. z = n setzt, sodass
8 Entwurfsverfahren für lineare kontinuierliche Regelsysteme
das Gleichungssystem unterbestimmt wird. Der so erzielte zusätzliche Freiheitsgrad erlaubt nun eine freie Wahl der Reglerverstärkung KR , die zweckmäßig als reziproker Verstärkungsfaktor eingeführt wird: 1/KR = cR = a0 /b0 .
(8-50)
Allerdings erhöht sich damit auch die Ordnung des geschlossenen Regelkreises; sie ist jetzt doppelt so groß wie die Ordnung der Regelstrecke. a) Berücksichtigung der Nullstellen des geschlossenen Regelkreises Bei dem oben beschriebenen Vorgehen ergeben sich die Nullstellen der Führungsübertragungsfunktion !
KW (s) = GW (s) =
B(s)D(s) A(s)C(s) + B(s)D(s)
(8-51)
von selbst. Zwar können die Nullstellen der Regelstrecke, also die Wurzeln von D(s), bei der Wahl der Polverteilung berücksichtigt und eventuell kompensiert werden, das Polynom B(s) entsteht aber erst beim Reglerentwurf und muss nachträglich beachtet werden. Dies geschieht am einfachsten dadurch, dass man vor den geschlossenen Regelkreis, also in die Wirkungslinie der Führungsgröße, entsprechend Bild 8-14a ein Korrekturglied (Vorfilter) mit der Übertragungsfunktion GK (s) = cK /BK(s)
(8-52)
schaltet, mit dem sich die Nullstellen des Reglers und der Regelstrecke kompensieren lassen. Dies lässt sich
aus Stabilitätsgründen allerdings nur für Nullstellen durchführen, deren Realteil negativ ist. Bezeichnet man die Teilpolynome von B(s) und D(s), deren Wurzeln in der linken s-Halbebene liegen als B+ (s) und D+ (s) sowie die Teilpolynome, deren Wurzeln in der rechten s-Halbebene bzw. auf der imaginären Achse liegen entsprechend als B− (s) und D− (s), so lassen sich die Zählerpolynome B(s) und D(s) wie folgt aufspalten: B(s) = B− (s)B+ (s)
und
D(s) = D− (s)D+ (s) .
Für den Fall, dass B(s) und C(s) sowie A(s) und D(s) teilerfremd sind, also im geschlossenen Regelkreis der Regler weder Pol- noch Nullstellen der Regelstrecke kompensiert, lässt sich das Nennerpolynom der Übertragungsfunktion des Korrekturgliedes wie folgt bestimmen: BK(s) = B+ (s)D+ (s) .
(8-53)
Damit erhält man als Führungsübertragungsfunktion GW (s) =
cK B− (s)D− (s) . A(s)C(s) + B(s)D(s)
(8-54)
Wenn sowohl der Regler als auch die Regelstrecke minimalphasiges Verhalten und deren Übertragungsfunktionen keine Nullstellen auf der imaginären Achse aufweisen, lassen sich sämtliche Nullstellen des geschlossenen Regelkreises kompensieren, sodass man anstelle von (8-54) die Beziehung GW (s) =
cK . A(s)C(s) + B(s)D(s)
(8-55)
erhält. Soll der geschlossene Regelkreis auch vorgegebene Nullstellen enthalten, so ist in der Übertragungsfunktion GK (s) des Korrekturgliedes ein entsprechendes Zählerpolynom vorzusehen. Der Zählerkoeffizient cK des Korrekturgliedes dient dazu, den Verstärkungsfaktor KW der Führungsübertragungsfunktion GW (s) gleich 1 zu machen. Dies erreicht man mit cK = β0 /(b−0 d0− ) .
(8-56)
Bild 8-14. Kompensation der Reglernullstellen a mit Reg-
Im Falle eines Reglers mit I-Anteil wird a0 = 0 und cR = 0. Dann folgt direkt
ler im Vorwärtszweig und b mit Regler im Rückkopplungszweig
cK = b+0 d0+ .
(8-57)
I53
I54
I Regelungs- und Steuerungstechnik / Regelungstechnik
Wird der Regler gemäß Bild 8-14b in den Rückkopplungszweig des Regelkreises geschaltet, so ändert das am Eigenverhalten des so entstandenen Systems gegenüber dem der Konfiguration nach Bild 8-14a nichts. Allerdings erscheinen nun nicht mehr die Nullstellen der Übertragungsfunktion des Reglers, sondern deren Polstellen als Nullstellen in der Übertragungsfunktion des geschlossenen Regelkreises. Es gelten jetzt analoge Überlegungen bei der Bestimmung des Nennerpolynoms in der Übertragungsfunktion des Korrekturgliedes AK (s) = A+ (s)D+ (s) .
und an−1 = βu .
(8-61b)
Für Regelstrecken mit proportionalem Verhalten oder bei Störungen am Eingang integraler Regelstrecken, bei der man die Reglerordnung auf z = n erhöht, erhält man mit den Beziehungen a 0 = cR b 0
und b0 = β0 /(d0 + cR c0 )
(8-58)
Als Führungsübertragungsfunktion erhält man GW (s) =
cK A− (s)D− (s) , A(s)C(s) + B(s)D(s)
(8-59)
wobei für einen proportional wirkenden Regler cK (s) = β0 / a−0 d0− (8-60) gilt. Es sei darauf hingewiesen, dass für einen integrierenden Regler im Rückkopplungszweig keine Führungsregelung realisierbar ist. b) Lösung der Synthesegleichungen Das durch (8-49) beschriebene Gleichungssystem kann leicht in Matrixschreibweise dargestellt werden. Dabei werden die gesuchten Reglerparameter in einem Parametervektor zusammengefasst. Für integrale Regelstrecken (c0 = 0) mit der Reglerordnung z = n − 1 und Normierung cn = 1 lautet damit das Synthese-Gleichungssystem: ⎤ ⎡ ⎤ ⎡ ⎤ ⎤⎡ ⎡ |0 ⎥⎥⎥ ⎢⎢⎢ b0 ⎥⎥⎥ ⎢⎢⎢ β0 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢ d0 ⎥ ⎢ ⎥ ⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢⎢ d1 d0 0 | c1 0 0 ⎥⎥⎥ ⎢⎢⎢ b1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ β1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎥ ⎥ ⎢ ⎢ ⎢ ⎥⎥⎥ ⎢⎢⎢ b2 ⎥⎥⎥ ⎢⎢⎢ β2 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎢⎢⎢ d2 d1 d0 | c2 c1 0 ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . ⎢⎢⎢ . . . . . . . . .. . . . . .. .. .. .. ⎥⎥⎥ ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎢ .. ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ .. ⎢⎢⎢ .. | ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ | cn−2 cn−3 . . . c1 0 ⎥⎥⎥⎥ ⎢⎢⎢⎢ bn−2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ βn−2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥⎢ ⎢⎢⎢ dn−1 dn−2 d1 d0 | cn−1 cn−2 . . . c2 c1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ bn−1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ βn−1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎢⎢⎢ ⎥ ⎥ ⎥ ⎢ ⎢ ⎢ ⎢⎢⎢ – – – – – – – – – – – – – – – – – – – – – – – – –⎥⎥⎥⎥ ⎢⎢⎢⎢ – – ⎥⎥⎥⎥ = ⎢⎢⎢⎢ – – ⎥⎥⎥⎥ − ⎢⎢⎢⎢ – – ⎥⎥⎥⎥⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥⎢ ⎢⎢⎢ ⎢⎢⎢ 0 dn−1 dn−2 . . . d1 | 1 cn−1 cn−2 . . . c2 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ a0 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ βn ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ c1 ⎥⎥⎥⎥⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥⎢ ⎢⎢⎢ ⎢⎢⎢ dn−1 . . . d2 | 1 cn−1 . . . c3 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ a1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ βn+1 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ c2 ⎥⎥⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎢ .. ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ .. ⎢⎢⎢ . . . . .. .. . ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . ⎢⎢⎢ | . ⎥ ⎥ ⎥⎥ ⎥ ⎢⎢⎢ ⎢ ⎢ ⎢ .. . ⎥ ⎢ ⎥ ⎢ ⎥⎢ .. ⎢⎢⎢ 0 | 0 cn−1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ an−3 ⎥⎥⎥⎥ ⎢⎢⎢⎢ β2n−3 ⎥⎥⎥⎥ ⎢⎢⎢⎢ cn−2 ⎥⎥⎥⎥ ⎦ ⎣ ⎦ ⎣ ⎦ ⎦⎣ ⎣ an−2 β2n−2 cn−1 dn−1 | 1
(8-61a)
9 Nichtlineare Regelsysteme
das Synthese-Gleichungssystem ⎡ ⎤ ⎡ ⎤⎡ | c0 ⎢⎢⎢ d0 ⎥⎥⎥ ⎢⎢⎢ b1 ⎥⎥⎥ ⎢⎢⎢ β1 ⎢⎢⎢ ⎥ ⎢ ⎥⎥⎥ ⎢⎢⎢ 0 | c1 c0 0 ⎢⎢⎢ d1 d0 ⎥⎥⎥ ⎢⎢⎢ b2 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ β2 ⎥ ⎢ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢⎢ d2 d1 d0 | c2 c1 c0 3 ⎥⎥⎥ ⎢⎢⎢ b. 3 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ β ⎢⎢⎢ . . . . . ⎥⎥⎥ ⎢⎢⎢ .. ⎥ ⎢ . . . . . . ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . . . . | . . ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ | c 0 ⎥⎥ ⎢⎢ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎢ dn−1 dn−2 . . . d1 d0 | cn−1 cn−2 ⎥⎥⎥ ⎢⎢⎢ bn ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ βn . . . c 1 ⎢⎢⎢ ⎥ ⎢ ⎥⎢ ⎢⎢⎢ – – – – – – – – – – – – – – – – – – – – – – – – – –⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ – – ⎥⎥⎥⎥⎥ = ⎢⎢⎢⎢⎢ – – – ⎢⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥ ⎢⎢ ⎢⎢⎢ 0 dn−1 dn−2 . . . d1 | 1 cn−1 . . . c2 ⎥⎥⎥⎥ ⎢⎢⎢⎢ a1 ⎥⎥⎥⎥ ⎢⎢⎢⎢ βn+1 ⎢⎢⎢ ⎥⎥ ⎢⎢ ⎥⎥⎥ ⎢⎢⎢ | 1 ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢⎢⎢ a. 2 ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ . . . .. .. .. ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . .. .. . . . | ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢ ⎥ ⎢ 0 | 0 cn−1 ⎥⎥⎥ ⎢⎢⎢ ⎢⎢⎣ ⎥⎥⎦ ⎢⎢⎣ ⎦⎣ dn−1 | 1 an−1 β2n−1
⎤ ⎡ ⎤ ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ d1 + cR c1 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ d2 + cR c2 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . .. ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . . . ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ dn−1 + cR cn−1 ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ c ⎥⎥⎥ cR ⎥⎥⎥ ⎢ ⎥ ⎢ 0 ⎥ ⎥⎥⎥ −b ⎢⎢⎢⎢⎢ – – – – – – – ⎥⎥⎥⎥⎥ − ⎢⎢⎢⎢⎢ – – ⎥⎥⎥⎥⎥ ⎥⎥⎥ 0 ⎢⎢⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ c1 ⎥⎥⎥⎥⎥ 0 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . . . . ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ . . ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎦ ⎢⎣ ⎥⎦ ⎥⎦ ⎢⎣ 0 cn−1 (8-62a)
und an = βu .
(8-62b)
Die Matrizen jeweils der linken Seiten von (8-61a) und (8-62a) sind regulär. Damit sind die Synthesegleichungen eindeutig lösbar. Die Lösung kann bei Systemen niedriger Ordnung noch von Hand durchgeführt werden, zweckmäßigerweise wird aber die numerische Progammiersprache MATLAB hierzu verwendet.
9 Nichtlineare Regelsysteme 9.1 Allgemeine Eigenschaften nichtlinearer Regelsysteme Die Einteilung nichtlinearer Übertragungssysteme erfolgt entweder nach mathematischen Gesichtspunkten (Form der das Regelsystem beschreibenden Differenzialgleichung) oder nach den wichtigsten nichtlinearen Eigenschaften, die insbesondere bei technischen Systemen auftreten. Hierzu zählen die stetigen und nichtstetigen nichtlinearen Systemkennlinien, die in Tabelle 9-1 zusammengestellt sind. Dabei unterscheidet man zwischen eindeutigen Kennlinien (z. B. die Fälle 1 bis 4) und doppeldeutigen Kennlinien (z. B. die Fälle 5 bis 7). Die Kennlinien können symmetrisch oder unsymmetrisch zur xe -Achse sein. Oftmals empfiehlt sich auch eine Unterteilung in ungewollte und gewollte Nichtlinearitäten. Zur Behandlung nichtlinearer Regelkreise, insbesondere
zur Stabilitätsanalyse eignen sich – in Anbetracht des Fehlens einer allgemeinen Theorie – folgende spezielle Methoden: a) Methode der harmonischen Linearisierung, b) Methode der Phasenebene, c) Zweite Methode von Ljapunow sowie das d) Stabilitätskriterium von Popov. Im Übrigen wird man oft bei der Analyse und Synthese nichtlinearer Systeme direkt von der Darstellung im Zeitbereich ausgehen, d. h., man muss versuchen, die Differenzialgleichungen zu lösen. Hierbei ist die Simulation, z. B. mittels Simulink einer blockorientiertnen grafischen Erweiterung der numerischen Programmiersprache MATLAB ein wichtiges Hilfsmittel.
9.2 Regelkreis mit Zweiund Dreipunktreglern Während bei einem stetig arbeitenden Regler die Reglerausgangsgröße im zulässigen Bereich jeden beliebigen Wert annehmen kann, stellt sich bei Zwei- oder Dreipunktreglern gemäß Bild 9-1 die Reglerausgangsgröße jeweils nur auf zwei oder drei bestimmte Werte (Schaltzustände) ein. Bei einem Zweipunktregler können dies z. B. die beiden Stellungen „Ein“ und „Aus“ eines Schalters sein, bei einem Dreipunktregler z. B. die drei Schaltzustände „Vorwärts“, „Rückwärts“ und „Ruhestellung“ zur Ansteuerung eines Stellgliedes in Form eines Motors.
I55
I56
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 9-1. Zusammenstellung der wichtigsten nichtlinearen Regelkreisglieder
Bild 9-1. Regelkreis mit Zwei- oder Dreipunktregler
Somit werden diese Regler durch einfache Schaltglieder realisiert, deren Kennlinien in Tabelle 9-1 enthalten sind. Zweipunktregler werden häufig bei einfachen Temperatur- oder Druckregelungen (z. B. Bügeleisen, Pressluftkompressoren u. a.) verwendet. Dreipunktregler eignen sich hingegen zur Ansteuerung von Motoren, die als Stellantriebe in zahlreichen Regelkreisen eingesetzt werden. Ein typisches Kennzeichen der Arbeitsweise dieser Regler, insbesondere der Zweipunktregler, ist, dass sie bei Erreichen des Sollwertes kleine periodische Schwingungen (auch Arbeitsbewegung genannt) um diesen herum ausführen. Damit diese stabile Arbeitsbewegung zustande kommt und keine zu hohe Schalthäufigkeit auftritt, dürfen reine Zweipunktregler entweder nur mit totzeitbehafteten Regelstrecken zusammengeschaltet werden, oder aber das Zweipunktverhalten muss durch eine möglichst einstellbare Hysteresekennlinie erweitert werden. Regelkreise mit einem Zwei- oder Dreipunktregler werden auch als Relaissysteme bezeichnet. Gemäß Bild 9-2 können diese Reglertypen zusätzlich auch durch eine innere Rückführung mit einem einstellbaren Zeitverhalten versehen werden. Das Rückführnetzwerk ist dabei linear. Die so entstehenden Regler weisen annähernd das Verhalten linearer Regler mit PI-, PD- und PID-Verhalten auf. Daher werden sie oft als quasistetige Regler bezeichnet. Diese Reglertypen besitzen näherungsweise folgende Übertragungsfunktionen [1]: a) Zweipunktregler mit verzögerter Rückführung (PD-Verhalten): Nach Bild 9-2a gilt GR (s) ≈
1 (1 + T r s) . KR
(9-1)
b) Zweipunktregler mit verzögert-nachgebender Rückführung (PID-Verhalten): Nach Bild 9-2b gilt T r1 T r2 T r1 + T r2 1 + · 1+ s . GR (s) ≈ KR T r1 (T r1 + T r2 )s T r1 + T r2 (9-2)
9 Nichtlineare Regelsysteme
Tabelle 9-1. (Fortsetzung)
Bild 9-2. Die wichtigsten Zwei- und Dreipunktregler mit interner Rückführung
c) Dreipunktregler mit verzögerter Rückführung und nachgeschaltetem integralem Stellglied (PI-Verhalten): Nach Bild 9-2c gilt 1 Tr 1 GR (s) ≈ Gm (s) = 1+ . (9-3) Gr (s) Kr T m Tr s
den Anfangsbedingungen bzw. von der Erregung abhängig ist. Es gibt gewöhnlich stabile und instabile Zustände eines nichtlinearen Systems. Dazwischen existieren bestimmte stationäre Dauerschwingungen oder Eigenschwingungen, die man als Grenzschwingungen bezeichnet, weil unmittelbar benachbarte Einschwingvorgänge für t → ∞ von denselben entweder weglaufen oder auf sie zustreben. Diese Grenzschwingungen können stabil, instabil oder semistabil sein. Zum Beispiel stellt die „Arbeitsbewegung“ von Zwei- und Dreipunktreglern eine stabile Grenzschwingung dar. Das Verfahren der harmonischen Linearisierung, oft auch als Verfahren der harmonischen Balance bezeichnet, dient nun dazu, bei nichtlinearen Regelkreisen zu klären, ob solche Grenzschwingungen auftreten können, welche Frequenz und Amplitude sie haben und ob sie stabil oder instabil sind. Es handelt sich – dies sei ausdrücklich betont – um ein Näherungsverfahren zur Untersuchung des Eigenverhaltens nichtlinearer Regelkreise. Bei diesem Verfahren wird für das nichtlineare Regelkreiselement die Beschreibungsfunktion als eine Art „Ersatzfrequenzgang“ eingeführt. Erregt man ein nichtlineares Übertragungsglied mit ursprungssymmetrischer Kennlinie am Eingang sinusförmig, so ist das Ausgangssignal eine periodische Funktion mit derselben Frequenz, jedoch keine Sinusschwingung. Bezieht man die Grundschwingung des Ausgangssignals xa (t) – wie bei der Bildung des Frequenzganges – auf das sinusförmige Eingangssignal xe (t) = xˆe sin ωt, so erhält man die Beschreibungsfunktion N( xˆe , ω). In der komplexen Ebene ist die Beschreibungsfunktion als eine Schar von Ortskurven mit xˆe und ω als Parameter darstellbar. Betrachtet man jedoch nur statische Nichtlinearitäten, so ist deren Beschreibungsfunktion frequenzunabhängig und durch eine Ortskurve N( xˆe ) darstellbar. Die Beschreibungsfunktionen sind für zahlreiche einfache Kennlinien tabelliert [2].
9.3 Analyse nichtlinearer Regelsysteme mithilfe der Beschreibungsfunktion
9.3.2 Stabilitätsuntersuchung mittels der Beschreibungsfunktion
9.3.1 Definition der Beschreibungsfunktion
Die Methode der harmonischen Linearisierung stellt ein Näherungsverfahren zur Untersuchung von Frequenz und Amplitude der Dauerschwingungen in nichtlinearen Regelkreisen dar, die ein nichtlineares Übertragungsglied enthalten bzw. auf eine solche
Nichtlineare Systeme sind unter anderem wesentlich dadurch gekennzeichnet, dass ihr Stabilitätsverhalten – im Gegensatz zu dem linearer Systeme – von
I57
I58
I Regelungs- und Steuerungstechnik / Regelungstechnik
Struktur zurückgeführt werden können. Geht man davon aus, dass die linearen Übertragungsglieder – bedingt durch die meist vorhandene Tiefpasseigenschaft – die durch das nichtlineare Glied bedingten Oberwellen der Stellgröße u unterdrücken, dann kann – ähnlich wie für lineare Regelkreise – eine „charakteristische Gleichung“ N( xˆe )G( jω) + 1 = 0 ,
(9-4)
auch Gleichung der harmonischen Balance genannt, aufgestellt werden. Diese Gleichung beschreibt die Bedingung für Dauerschwingungen oder Eigenschwingungen. Jedes Wertepaar xˆe = xG und ω = ωG das (9-4) erfüllt, beschreibt eine Grenzschwingung des geschlossenen Kreises mit der Frequenz ωG und der Amplitude xG . Die Bestimmung solcher Wertepaare (xG , ωG ) aus dieser Gleichung kann analytisch oder grafisch erfolgen. Bei der grafischen Lösung benutzt man das Zweiortskurvenverfahren, wobei (9-4) auf die Form N( xˆe ) = −
1 G( jω)
(9-5)
gebracht wird. In der komplexen Ebene stellt man nun die beiden Ortskurven N( xˆe ) und −1/G( jω) dar. Durch deren Schnittpunkt ist die Grenzschwingung gegeben. Die Frequenz ωG der Grenzschwingung wird an der Ortskurve des linearen Systemteils, die Amplitude xG an der Ortskurve der Beschreibungsfunktion abgelesen. Besitzen beide Ortskurven keinen gemeinsamen Schnittpunkt, so gibt es keine Lösung von (9-4) und es existiert keine Grenzschwingung des Systems. Allerdings gibt es aufgrund methodischer Fehler des hier betrachteten Näherungsverfahrens Fälle, in denen das Nichtvorhandensein von Schnittpunkten beider Ortskurven sogar zu qualitativ falschen Resultaten führt [2]. Ein Schnittpunkt der beiden Ortskurven stellt gewöhnlich eine stabile Grenzschwingung dar, wenn mit wachsendem xˆe der Betrag der Beschreibungsfunktion abnimmt. Eine instabile Grenzschwingung ergibt sich, wenn |N( xˆe )| mit xˆe zunimmt. Diese Regel gilt nicht generell, ist jedoch in den meisten praktischen Fällen anwendbar. Sie gilt insbesondere bei mehreren Schnittpunkten (mit verschiedenen ω-Werten) nur für denjenigen mit dem kleinsten ω-Wert.
9.4 Analyse nichtlinearer Regelsysteme in der Phasenebene Die Analyse nichtlinearer Regelsysteme im Frequenzbereich ist, wie oben gezeigt wurde, nur mit mehr oder weniger groben Näherungen möglich. Um exakt zu arbeiten, muss man im Zeitbereich bleiben, also die Differenzialgleichungen des Systems unmittelbar benutzen. Hierbei eignet sich besonders die Beschreibung in der Phasen- oder Zustandsebene als zweidimensionalem Sonderfall des Zustandsraumes [3]. 9.4.1 Zustandskurven
Es sei ein System betrachtet, das durch die gewöhnliche Differenzialgleichung 2. Ordnung y¨ − f ( y, y˙, u) = 0
(9-6)
beschrieben wird, wobei f (y, y˙, u) eine lineare oder nichtlineare Funktion sei. Durch die Substitution x1 ≡ y und x2 ≡ y˙ führt man (9-6) in ein System zweier simultaner Differenzialgleichungen 1. Ordnung ' x˙1 = x2 (9-7) x˙2 = f (x1 , x2 , u) über. Die beiden Größen x1 und x2 beschreiben den Zustand des Systems in jedem Zeitpunkt vollständig. Trägt man in einem rechtwinkligen Koordinatensystem x2 als Ordinate über x1 als Abszisse auf, so stellt jede Lösung y(t) der Systemgleichung (9-6) eine Kurve in dieser Zustands- oder Phasenebene dar, die der Zustandspunkt (x1 , x2 ) mit einer bestimmten Geschwindigkeit durchläuft (Bild 9-3a). Man
Bild 9-3. Systemdarstellung in der Phasenebene: a Trajek-
torie mit Zeitkodierung, b Phasenporträt
9 Nichtlineare Regelsysteme
bezeichnet diese Kurve als Zustandskurve, Phasenbahn oder auch als Trajektorie. Wichtig ist, dass zu jedem Punkt der Zustandsebene bei gegebenem u(t) eine eindeutige Trajektorie gehört. Insbesondere für u(t) = 0 beschreiben die Trajektorien das Eigenverhalten des Systems. Zeichnet man von verschiedenen Anfangsbedingungen (x10 , x20 ) aus die Phasenbahnen, so erhält man eine Kurvenschar, das Phasenporträt (Bild 9-3b). Damit ist zwar der entsprechende Zeitverlauf von y(t) nicht explizit bekannt, er lässt sich jedoch leicht aus (9-7) berechnen. Allgemein besitzen Zustandskurven folgende Eigenschaften [2]: 1. Jede Trajektorie verläuft in der oberen Hälfte der Phasenebene (x2 > 0) von links nach rechts und in der unteren Hälfte der Phasenebene (x2 < 0) von rechts nach links. 2. Trajektorien schneiden die x1 -Achse gewöhnlich senkrecht. Erfolgt der Schnitt der Trajektorien mit der x1 -Achse nicht senkrecht, dann liegt ein singulärer Punkt vor. 3. Die Gleichgewichtslagen eines dynamischen Systems werden stets durch singuläre Punkte gebildet. Diese müssen auf der x1 -Achse liegen, da sonst keine Ruhelage möglich ist. Dabei unterscheidet man verschiedene singuläre Punkte: Wirbelpunkte, Strudelpunkte, Knotenpunkte und Sattelpunkte. 4. Im Phasenporträt stellen die in sich geschlossenen Zustandskurven Dauerschwingungen dar. Die früher erwähnten stationären Grenzschwingungen bezeichnet man in der Phasenebene als Grenzzyklen. Diese Grenzzyklen sind wiederum dadurch gekennzeichnet, dass zu ihnen oder von ihnen alle benachbarten Trajektorien konvergieren bzw. divergieren. Entsprechend dem Verlauf der Trajektorien in der Nähe eines Grenzzyklus unterscheidet man stabile, instabile und semistabile Grenzzyklen [2]. 9.4.2 Anwendung der Methode der Phasenebene zur Untersuchung von Relaissystemen
Je nach Regelstrecke und Reglertyp erfolgt die Umschaltung der Stellgröße auf einer speziellen Schaltkurve. Zwei derartige Beispiele sind in den Bildern 9-4 und 9-5 für eine I2 -Regelstrecke dargestellt. Bei dem im Bild 9-5 dargestellten Fall wird
Bild 9-4. Blockschaltbild und Phasendiagramm einer Relaisregelung mit geneigter Schaltgerade
Bild 9-5. Blockschaltbild und Phasendiagramm einer zeitoptimalen Regelung für x1 (0) 0 und x2 (0) = 0
die Regelstrecke in möglichst kurzer Zeit von einem beliebigen Anfangszustand x1 (0) in die gewünschte Ruhelage (x1 = 0 und x2 = 0) gebracht. Dieses Problem tritt bei technischen Systemen recht häufig auf, besonders bei der Steuerung bewegter Objekte (Luft- und Raumfahrt, Förderanlagen, Walzantriebe, Fahrzeuge). Wegen der Begrenzung der Stellamplitude kann diese Zeit nicht beliebig klein gemacht werden. Bei diesem Beispiel befindet sich während des zeitoptimalen Vorgangs die Stellgröße immer an einer der beiden Begrenzungen; für das System 2. Ordnung ist eine Umschaltung erforderlich. Dieses
I59
I60
I Regelungs- und Steuerungstechnik / Regelungstechnik
Verhalten ist für zeitoptimale Regelsysteme charakteristisch. Diese Tatsache wird durch den Satz von Feldbaum [4] bewiesen. Im vorliegenden Beispiel vom Bild 9-5 ergibt sich das optimale Regelgesetz nach Struktur und Parametern von selbst [3]. Entgegen den bisherigen Gewohnheiten, einen bestimmten Regler vorzugeben (z. B. mit PID-Verhalten) und dessen Parameter nach einem bestimmten Kriterium zu optimieren, wird in diesem Fall über die Reglerstruktur keine Annahme getroffen. Sie ergibt sich vollständig aus dem Optimierungskriterium (minimale Zeit) zusammen mit den Nebenbedingungen (Begrenzung, Randwerte, Systemgleichung). Man bezeichnet diese Art der Optimierung, im Gegensatz zu der Parameteroptimierung vorgegebener Reglerstrukturen, gelegentlich auch als Strukturoptimierung. Diese Art von Problemstellung lässt sich mathematisch als Variationsproblem formulieren und zum Teil mithilfe der klassischen Variationsrechnung oder mithilfe des Maximumprinzips von Pontrjagin [5] lösen.
9.5 Stabilitätstheorie nach Ljapunow Mithilfe der direkten Methode von Ljapunow [6] (siehe A 32.2) ist es möglich, eine Aussage über die Stabilität der Ruhelage (x = 0) also des Ursprungs des Zustandsraumes, zu machen, ohne dass man die explizite Lösung x(t) der das nichtlineare Regelsystem beschreibenden Differenzialgleichung (9-8) x˙ = f [x(t), u(t), t], x(t0 ) = x0 kennt. Man bezeichnet dann alle Lösungen x(t) als einfach stabil, deren Trajektorien in der Nähe einer stabilen Ruhelage beginnen und für alle Zeiten in der Nähe der Ruhelage bleiben. Sie müssen nicht gegen diese konvergieren. Die Ruhelage x(t) = 0 des Systems gemäß (9-8) heißt asymptotisch stabil, wenn sie stabil ist und wenn für alle Trajektorien x(t), die hinreichend nahe bei der Ruhelage beginnen, lim x(t) = 0 t→∞
gilt. 9.5.1 Der Grundgedanke der direkten Methode von Ljapunow
Eine Funktion V(x) heißt positiv definit in einer Umgebung Ω des Ursprungs x = 0, falls
V(x) > 0
für alle
V(x) = 0
für
x ∈ Ω, x 0 und
x=0
gilt. V(x) heißt positiv semidefinit in Ω, wenn sie auch für x 0 den Wert null annehmen kann, d. h., wenn V(x) 0
für alle
V(x) = 0
für
x ∈ Ω und
x=0
wird. Eine wichtige Klasse von Funktionen V(x) hat die quadratische Form V(x) = xT Px ,
(9-9)
wobei P eine symmetrische Matrix ist. Die quadratische Form ist positiv definit, falls alle Hauptdeterminanten von P positiv sind. 9.5.2 Stabilitätssätze von Ljapunow
Satz 1: Stabilität im Kleinen. Das System x˙ = f (x) besitze die Ruhelage x = 0. Existiert eine Funktion V(x), die in einer Umgebung Ω der Ruhelage folgende Eigenschaften besitzt: 1. V(x) und der dazugehörige Gradient ∇V(x) sind stetig, 2. V(x) ist positiv definit, ˙ 3. V(x) = [∇V(x)]T f (x) ist negativ semidefinit, dann ist die Ruhelage stabil. Eine solche Funktion V(x) wird als Ljapunow-Funktion bezeichnet. Satz 2: Asymptotische Stabilität im Kleinen. ˙ Ist V(x) in Ω negativ definit, so ist die Ruhelage asymptotisch stabil. Der Zusatz „im Kleinen“ soll andeuten, dass eine Ruhelage auch dann stabil ist, wenn die Umgebung Ω, in der die Bedingungen erfüllt sind, beliebig klein ist. Man benutzt bei einer solchen asymptotisch stabilen Ruhelage mit sehr kleinem Einzugsbereich, außerhalb dessen nur instabile Trajektorien verlaufen, den Begriff der „praktischen Instabilität“. Satz 3: Asymptotische Stabilität im Großen. Das System x˙ = f (x) habe die Ruhelage x = 0. Es sei V(x) eine skalare Funktion und Ωk ein Gebiet des Zustandsraums, definiert durch V(x) < k, k > 0. Ist nun
9 Nichtlineare Regelsysteme
1. 2. 3. 4.
Ωk beschränkt, V(x) und ∇V(x) stetig in Ωk , V(x) positiv definit in Ωk , ˙ V(x) = [∇V(x)]T f (x) negativ definit in Ωk ,
dann ist die Ruhelage asymptotisch stabil und Ωk gehört zu ihrem Einzugsbereich. Wesentlich hierbei ist, dass der Bereich Ωk , in dem V(x) < k ist, beschränkt ist. In der Regel ist der gesamte Einzugsbereich nicht identisch mit Ωk , d. h., er ist größer als Ωk . Satz 4: Globale asymptotische Stabilität. Das System x˙ = f (x) habe die Ruhelage x = 0. Existiert eine Funktion V(x), die im gesamten Zustandsraum folgende Eigenschaften besitzt: 1. V(x) und ∇V(x) sind stetig, 2. V(x) ist positiv definit, ˙ 3. V(x) = [∇V(x)]T f (x) ist negativ definit, und ist außerdem 4. lim V(x) = ∞, x→∞
so ist die Ruhelage global asymptotisch stabil. Mit diesen Kriterien lassen sich nun die wichtigsten Fälle des Stabilitätsverhaltens eines Regelsystems behandeln, sofern es gelingt, eine entsprechende Ljapunow-Funktion zu finden. Gelingt es nicht, so ist keine Aussage möglich. 9.5.3 Ermittlung geeigneter Ljapunow-Funktionen
Hat man beispielsweise eine Ljapunow-Funktion gefunden, die zwar nur den Bedingungen von Satz 1 genügt, so ist damit noch keineswegs ausgeschlossen, dass die Ruhelage global asymptotisch stabil ist, denn das Verfahren nach Ljapunow liefert nur eine hinreichende Stabilitätsbedingung. Ein systematisches Verfahren, das mit einiger Sicherheit zu einem gegebenen nichtlinearen System die beste Ljapunow-Funktion liefert, gibt es nicht. Für lineare Systeme mit der Zustandsraumdarstellung x˙ = Ax
von V(x) liefert mit (9-10) T ˙ [ AT P + PA]x . V(x)x
(9-11)
Diese Funktion besitzt wiederum eine quadratische Form, die bei asymptotischer Stabilität negativ definit sein muss. Mit einer positiv definiten Matrix Q gilt also (9-12) AT P + PA = −Q . Man bezeichnet diese Beziehung auch als LjapunowGleichung. Gemäß Satz 4 gilt folgende Aussage: Ist die Ruhelage x = 0 des Systems nach (9-10) global asymptotisch stabil, so existiert zu jeder positiv definiten Matrix Q eine positiv definite Matrix P, die (9-12) erfüllt. Man kann also ein beliebiges positiv definites Q vorgeben, die Ljapunow-Gleichung nach P auflösen und anhand der Definitheit von P die Stabilität überprüfen. Für nichtlineare Systeme ist ein solches Vorgehen nicht unmittelbar möglich. Es gibt jedoch verschiedene Ansätze, die in vielen Fällen zu einem befriedigenden Ergebnis führen. Hierzu gehören die Verfahren von Aiserman [7] und Schultz-Gibson [8].
9.6 Das Stabilitätskriterium von Popov Es ist naheliegend, bei einem nichtlinearen Regelkreis den linearen Systemteil mit der Übertragungsfunktion G(s) vom nichtlinearen abzuspalten. Dabei ist der Fall eines Regelkreises mit einer statischen Nichtlinearität entsprechend Bild 9-6 von besonderer Bedeutung. Für diesen Fall wurde von V. Popov [9] ein Stabilitätskriterium angegeben, das anhand des Frequenzgangs G( jω) des linearen Systemteils ohne Verwendung von Näherungen eine hinreichende Bedingung für die Stabilität liefert. 9.6.1 Absolute Stabilität
Die nichtlineare Kennlinie des im Bild 9-6 dargestellten Standardregelkreises darf in einem Bereich ver-
(9-10)
kann man allerdings zeigen, dass der Ansatz einer quadratischen Form entsprechend (9-9) mit einer positiv definiten symmetrischen Matrix P immer eine Ljapunow-Funktion liefert. Die zeitliche Ableitung
Bild 9-6. Standardregelkreis mit einer statischen Nichtlinea-
rität
I61
I62
I Regelungs- und Steuerungstechnik / Regelungstechnik
9.6.2 Formulierung des Popov-Kriteriums
Bild 9-7. Zur Definition der absoluten Stabilität
laufen, der durch zwei Geraden begrenzt wird, deren Steigung K1 und K2 > K1 sei (Bild 9-7). Man bezeichnet ihn als Sektor [K1 , K2 ]. Es gilt also für eine Kennlinie, die in diesem Sektor liegt K1
F(e) K2 , e
e0.
Diese Kennlinie geht außerdem durch den Ursprung (F(0) = 0) und sei im Übrigen eindeutig und stückweise stetig. Unter diesen Bedingungen ist folgende Definition der Stabilität des betrachteten nichtlinearen Regelkreises zweckmäßig: Definition: Absolute Stabilität. Der nichtlineare Regelkreis in Bild 9-6 heißt absolut stabil im Sektor [K1 , K2 ], wenn es für jede Kennlinie F(e), die vollständig innerhalb dieses Sektors verläuft, eine global asymptotisch stabile Ruhelage des geschlossenen Regelkreises gibt. Zur Vereinfachung ist es zweckmäßig, den Sektor [K1 , K2 ] auf einen Sektor [0, K] zu transformieren. Dies geschieht, ohne dass sich das Verhalten des Regelkreises ändert, dadurch, dass anstelle von F(e) und G(s) die Beziehungen F (e) = F(e) − K1 e
und
G (s) = G(s)/[1 + K1G(s)] eingeführt werden. F (e) verläuft nun im Sektor [0, K] mit K = K2 − K1 . Für die weiteren Betrachtungen wird davon ausgegangen, dass diese Transformation bereits durchgeführt ist, wobei jedoch nicht die Bezeichnungen F (e) und G (s) verwendet werden sollen, sondern der Einfachheit halber F(e) und G(s) beibehalten werden.
Für das lineare Teilsystem in Bild 9-6 gelte b0 + b1 s + . . . + bm sm G(s) = m 0 K erfüllt ist. Da der Sektor [0, K] auch die Möglichkeit zulässt, dass F(e) = 0 und somit u = 0 sein darf, entspricht dies der Untersuchung des Stabilitätsverhaltens des linearen Teilsystems. Absolute Stabilität im Sektor [0, K] setzt jedoch voraus, dass dann im vorliegenden Fall das lineare Teilsystem asymptotisch stabil ist. Dies ist aber beim Vorhandensein von Polen auf der imaginären Achse nicht mehr der Fall. Deshalb muss der Fall F(e) = 0 ausgeschlossen werden, indem man als untere Sektorgrenze eine Gerade mit beliebig kleiner positiver Steigung γ benutzt, also den Sektor [γ, K] betrachtet. Damit gilt das Popov-Kriterium auch für solche Systeme, wobei jedoch zusätzlich gefordert werden muss, dass der geschlossene Regelkreis mit der Verstärkung γ (linearer Fall) asymptotisch stabil ist. Dies ist immer erfüllt, wenn das lineare Teilsystem einen einfachen Pol bei s = 0 besitzt. 9.6.3 Geometrische Auswertung der Popov-Ungleichung
Schreibt man die Popov-Ungleichung (9-14) in der Form 1 Re[G( jω)] − qω Im[G( jω)] + > 0 , (9-15) K so lässt sich Re [G( jω)] als Realteil und ω Im [G( jω)] als Imaginärteil einer modifizierten Ortskurve, der sogenannten Popov-Ortskurve, definieren, die demnach beschrieben wird durch G∗ ( jω) = Re[G( jω)] + jω Im[G( jω)] = X + jY . (9-16)
10 Lineare zeitdiskrete Systeme: Digitale Regelung
Indem man nun allgemeine Koordinaten X und Y für den Real- und Imaginärteil von G∗ ( jω) ansetzt, erhält man aus der Ungleichung (9-15) die Beziehung X − qY + 1/K > 0 .
(9-17)
Diese Ungleichung wird durch alle Punkte der X, YEbene erfüllt, die rechts von einer Grenzlinie mit der Gleichung (9-18) X − qY + 1/K = 0 liegen. Diese Grenzlinie ist eine Gerade, deren Steigung 1/q beträgt und deren Schnittpunkt mit der X-Achse bei −1/K liegt. Man nennt diese Gerade die Popov-Gerade. Ein Vergleich von (10-15) mit (10-18) zeigt, dass das Popov-Kriterium genau dann erfüllt ist, wenn die Popov-Ortskurve vollständig rechts der Popov-Geraden verläuft. Diese Zusammenhänge sind in Bild 9-8 dargestellt. Daraus ergibt sich folgendes Vorgehen bei der Anwendung des Popov-Kriteriums: 1. Man zeichnet gemäß (9-16) die Popov-Ortskurve G∗ ( jω) in der X, jY-Ebene. 2a. Ist K gegeben, so versucht man, eine Gerade durch den Punkt −1/K auf der X-Achse zu legen, mit einer solchen Steigung 1/q, dass die Popov-Gerade vollständig links der Popov-Ortskurve liegt. Gelingt dies, so ist der Regelkreis absolut stabil. Gelingt es nicht, so ist keine Aussage möglich. Hier zeigt sich die Verwandtschaft zum NyquistKriterium, bei dem zumindest der kritische Punkt −1/K der reellen Achse ebenfalls links der Ortskurve liegen muss. Oft stellt sich auch die Aufgabe, den größten Sektor [0, Kcrit ] der absoluten Stabilität zu ermitteln. Dann wird der zweite Schritt entsprechend modifiziert:
Bild 9-9. Ermittlung des maximalen Wertes Kkrit
2b. Man legt eine Tangente von links so an die Popov-Ortskurve, dass der Schnittpunkt mit der X-Achse möglichst weit rechts liegt. Dies ergibt die maximale obere Grenze Kkrit . Man nennt diese Tangente auch die kritische Popov-Gerade (Bild 9-9). Der maximale Sektor [0, Kkrit ] wird als Popov-Sektor bezeichnet. Da das Popov-Kriterium nur eine hinreichende Stabilitätsbedingung liefert, ist es durchaus möglich, dass der maximale Sektor der absoluten Stabilität größer als der Popov-Sektor ist. Er kann jedoch nicht größer sein als der Hurwitz-Sektor [0, KH ], der durch die maximale Verstärkung KH des entsprechenden linearen Regelkreises begrenzt wird und der sich aus dem Schnittpunkt der Ortskurve mit der X-Achse ergibt.
10 Lineare zeitdiskrete Systeme: Digitale Regelung 10.1 Arbeitsweise digitaler Regelsysteme Beim Einsatz digitaler Regelsysteme erfolgt die Abtastung eines gewöhnlich kontinuierlichen Prozesssignals f (t) meist zu äquidistanten Zeitpunkten, also mit einer konstanten Abtastperiodendauer oder auch Abtastzeit T bzw. Abtastfrequenz ωp = 2π/T . Ein solches Abtastsignal oder zeitdiskretes Signal wird somit beschrieben durch die Zahlenfolge f (kT ) = { f (0), f (T ), f (2T ), . . .}
Bild 9-8. Zur geometrischen Auswertung des Popov-
Kriteriums
(10-1)
mit k 0 und f (kT ) = 0 für k < 0, die meist auch abgekürzt als f (k) bezeichnet wird. Den prinzipiellen
I63
I64
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 10-1. Prinzipieller Aufbau eines Abtastre-
gelkreises
Aufbau eines Abtastsystems, bei dem ein Prozessrechner als Regler eingesetzt ist, zeigt Bild 10-1. Bei dieser digitalen Regelung, oft auch DDC-Betrieb genannt (DDC, direct digital control), wird der analoge Wert der Regelabweichung e(t) in einen digitalen Wert e(kT ) umgewandelt. Dieser Vorgang entspricht einer Signalabtastung und erfolgt periodisch mit der Abtastzeit T . Infolge der beschränkten Wortlänge des hierfür erforderlichen Analog-Digital-Umsetzers (ADU) entsteht eine Amplitudenquantisierung. Diese Quantisierung oder auch Diskretisierung der Amplitude, die ähnlich auch beim Digital-Analog-Umsetzer (DAU) auftritt, ist im Gegensatz zur Diskretisierung der Zeit ein nichtlinearer Effekt. Allerdings können die Quantisierungsstufen im Allgemeinen so klein gemacht werden, dass der Quantisierungseffekt vernachlässigbar ist. Die Amplitudenquantisierung wird deshalb in den folgenden Ausführungen nicht berücksichtigt. Der digitale Regler (Prozessrechner) berechnet nach einer zweckmäßig gewählten Rechenvorschrift (Regelalgorithmus) die Folge der Stellsignalwerte u(kT ) aus den Werten der Folge e(kT ). Da nur diskrete Signale auftreten, kann der digitale Regler als diskretes Übertragungssystem betrachtet werden. Die berechnete diskrete Stellgröße u(kT ) wird vom Digital-Analog-Umsetzer in ein analoges Signal u(t) umgewandelt und jeweils über eine Abtastperiode kT t < (k + 1)T konstant gehalten. Dieses Element hat die Funktion eines Haltegliedes, und u(t) stellt – sofern das Halteglied nullter Ordnung ist – ein treppenförmiges Signal dar. Eine wesentliche Eigenschaft solcher Abtastsysteme besteht darin, dass das Auftreten eines Abtastsignals in einem linearen kontinuierlichen System an der Linearität nichts ändert. Damit ist die theoretische Behandlung linearer diskreter Systeme in weitgehender Analogie zu der Behandlung linearer kontinuierlicher Systeme möglich. Dies wird dadurch erreicht, dass auch die kontinuierlichen Signale nur zu den Abtastzeitpunkten kT , also als Abtastsignale betrachtet werden. Damit ergibt sich für den gesamten Regelkreis
eine diskrete Systemdarstellung, bei der alle Signale Zahlenfolgen sind.
10.2 Darstellung im Zeitbereich Werden bei einem kontinuierlichen System Eingangsund Ausgangssignal mit der Abtastzeit T synchron abgetastet, so erhebt sich die Frage, welcher Zusammenhang zwischen den beiden Folgen u(kT ) und y(kT ) besteht. Geht man von der das kontinuierliche System beschreibenden Differenzialgleichung aus, so besteht die Aufgabe in der numerischen Lösung derselben. Beim einfachsten hierfür in Frage kommenden Verfahren, dem EulerVerfahren, werden die Differenzialquotienten durch Rückwärts-Differenzenquotienten mit genügend kleiner Schrittweite T approximiert: f (kT ) − f [(k − 1)T ] d f ≈ (10-2a) dt t=kT T f (kT ) − 2 f [(k − 1)T ] + f [(k − 2)T ] d2 f ≈ . dt2 t=kT T2 (10-2b) Dadurch geht die Differenzialgleichung in eine Differenzengleichung über. Mithilfe einer solchen Differenzengleichung kann die Ausgangsfolge y(k) rekursiv aus der Eingangsfolge u(k) für k = 0, 1, 2, . . . berechnet werden. Allerdings handelt es sich dabei um eine Näherungslösung, die nur für kleine Schrittweiten T genügend genau ist. Die allgemeine Form der Differenzengleichung zur Beschreibung eines linearen zeitinvarianten Eingrößensystems n-ter Ordnung mit der Eingangsfolge u(k) und der Ausgangsfolge y(k) lautet: y(k) + α1 y(k − 1) + α2 y(k − 2) + . . . + αn y(k − n) = β0 u(k) + β1 u(k − 1) + . . . + βn u(k − n) . (10-3a) Durch Umformen ergibt sich eine rekursive Gleichung für y(k), n n βν u(k − ν) − αν y(k − ν) , (10-3b) y(k) = ν=0
ν=1
10 Lineare zeitdiskrete Systeme: Digitale Regelung
die gewöhnlich zur numerischen Berechnung der Ausgangsfolge y(k) verwendet wird. Die Größen y(k − ν) und u(k − ν), ν = 1, 2, . . . , n, sind die zeitlich zurückliegenden Werte der Ausgangs- bzw. Eingangsgröße, die im Rechner gespeichert werden. Wie bei einer Differenzialgleichung werden auch bei einer Differenzengleichung Anfangswerte für k = 0 berücksichtigt. Ähnlich wie bei linearen kontinuierlichen Systemen die Gewichtsfunktion g(t) zur Beschreibung des dynamischen Verhaltens verwendet wurde, kann für diskrete Systeme als Antwort auf den diskreten Impuls 1 für k = 0 (10-4) u(k) = δd (k) = 0 für k 0 die Gewichtsfolge g(k) eingeführt werden. Zwischen einer beliebigen Eingangsfolge u(k), der zugehörigen Ausgangsfolge y(k) und der Gewichtsfolge g(k) besteht für lineare diskrete Systeme analog zu (3-3) der Zusammenhang über die Faltungssumme y(k) =
∞
u(ν)g(k − ν) ,
(10-5)
ν=0
wobei anstelle der oberen Summengrenze auch die Variable k gesetzt werden darf.
Der Übergang zwischen kontinuierlichen und zeitdiskreten Signalen wird bei dem im Bild 10-1 dargestellten Abtastsystem durch den Analog-Digital-Umsetzer realisiert. Für eine mathematische Beschreibung eines solchen Systems ist jedoch eine einheitliche Darstellung der Signale erforderlich. Dazu wird eine Modellvorstellung entsprechend Bild 10-2 benutzt. Es wird also ein δ-Abtaster eingeführt, der eine Folge von gewichteten δ-Impulsen erzeugt. Diese Folge wird beschrieben durch die Pseudofunktion f ∗ (t) = f (t)
∞
δ(t − kT ) =
k=0
∞
f (kT )δ(t − kT ) ,
k=0
(10-6) bei der die δ-Impulse durch Pfeile repräsentiert werden, deren Höhe jeweils dem Gewicht, also der „Fläche“ des zugehörigen δ-Impulses, entspricht. Die Pfeilhöhe ist somit gleich dem Wert von f (t) zu den Abtastzeitpunkten t = kT , also gleich f (kT ). Diese Pseudofunktion f ∗ (t) stellt neben der Zahlenfolge entsprechend (9-1) eine weitere Möglichkeit zur mathematischen Beschreibung eines Abtastsignals dar. Die Bildung des im Bild 10-2 dargestellten treppenförmigen Signals f (t) aus dem Signal f ∗ (t) erfolgt durch ein Halteglied nullter Ordnung mit der Übertragungsfunktion
H0 (s) = (1 − e−Ts )/s .
(10-7)
Mit diesem Halteglied lässt sich der Abtastregelkreis durch eine der im Bild 10-3 dargestellten Blockstrukturen beschreiben. Fasst man jetzt Halteglied, Regelstrecke und δ-Abtaster zu einem Block zusammen (Bild 10-3b), so treten im Regelkreis nur noch Abtastsignale auf. Man erhält damit eine vollständige diskrete Darstellung des Regelkreises. Bild 10-2. δ-Abtaster und Halteglied
Bild 10-3. Äquivalente Blockschaltbilder eines
Abtastregelkreises
I65
I66
I Regelungs- und Steuerungstechnik / Regelungstechnik
10.3 Die z-Transformation
Da Fz (z) die z-Transformierte der Zahlenfolge f (k) für k = 0, 1, 2, . . . darstellt, liefert die inverse z-Transformation von Fz (z),
10.3.1 Definition der z-Transformation
Für die Darstellung der Abtastung eines kontinuierlichen Signals wurden oben bereits zwei äquivalente Möglichkeiten beschrieben: entweder die Zahlenfolge f (k) gemäß (10-1) oder die Impulsfolge f ∗ (t) als Zeitfunktion gemäß (10-6). Durch LaplaceTransformation von (10-6) erhält man die komplexe Funktion ∞ F ∗ (s) = f (kT )e−kTs . (10-8) k=0
Da in dieser Beziehung die Variable s immer nur in Verbindung mit eTs auftritt, wird deshalb anstelle von eTs die komplexe Variable z eingeführt, indem man 1 ln z T setzt. Damit geht F ∗ (s) in die Funktion eTs = z ,
s=
(10-9)
f (kT )z−k
(10-10)
bzw.
Fz (z) =
∞ k=0
über, wobei wegen der Substitution entsprechend (10-9) die Beziehungen ∗ Ts ∗ 1 F (s) = Fz (e ) und Fz (z) = F ln z T (10-11) gelten. Man bezeichnet die Funktion Fz (z) als zTransformierte der Folge f (kT ), siehe A 23.3. Da für die weiteren Überlegungen anstelle von f (kT ) meist die abgekürzte Schreibweise f (k) benutzt wird, erfolgt die Definition der z-Transformation für diese Form durch Z { f (k)} = Fz (z) =
∞
−k
f (kT )z
,
(10-12)
k=0
wobei das Symbol Z als Operator der z-Transformation zu verstehen ist. Der Index z dient zur Unterscheidung dieser Transformierten gegenüber der Laplace-Transformierten F(s) von f (t). Für die wichtigsten Zeitfunktionen f (t) sind in Tabelle A 23.3 die z-Transformierten zusammengestellt. Die Haupteigenschaften und Rechenregeln der z-Transformation sind denen der LaplaceTransformation analog, siehe A 23.2.
Z −1 {Fz (z)} = f (k) ,
(10-13)
wieder die Zahlenwerte f (k) dieser Folge, also die diskreten Werte der zugehörigen Zeitfunktion f (t)|t=kT für die Zeitpunkte t = kT . Da, die z-Transformation umkehrbar eindeutig ist, kommen für die inverse z-Transformation zunächst natürlich die sehr ausführlichen Tabellenwerke [4-1, 4-2] in Betracht, aus denen unmittelbar korrespondierende Transformationen entnommen werden können. Für kompliziertere Fälle, die nicht in den Tabellen enthalten sind oder auf solche in den Tabellen zurückgeführt werden können, kann die Berechnung auf verschiedene Arten durchgeführt werden. Hierzu gehören die Potenzreihenentwicklung von (10-12), die Partialbruchzerlegung von Fz (z) in Standardfunktionen und die Auswertung des komplexen Kurvenintegrals 0 1 f (k) = Fz (z)zk−1 dz , k = 1, 2, . . . (10-14) 2πj mithilfe der Residuenberechnung [3] Res {Fz (z)zk−1 }z=ai . f (k) =
(10-15)
i
Hierbei sind die Größen ai die Pole von Fz (z)zk − 1, also die Pole von Fz (z).
10.4 Darstellung im Frequenzbereich 10.4.1 Die Übertragungsfunktion diskreter Systeme
Ein lineares diskretes System n-ter Ordnung wird durch die Differenzengleichung (10-3) beschrieben. Wendet man hierauf den Verschiebungssatz der z-Transformation an, so erhält man Yz (z)(1 + α1 z−1 + α2 z−2 + . . . + αn z−n ) = Uz (z)(β0 + β1 z−1 + . . . + βn z−n )
(10-16)
woraus direkt als Verhältnis der z-Transformierten von Eingangs- und Ausgangsfolge die zÜbertragungsfunktion des diskreten Systems Gz (z) =
Yz (z) β0 + β1 z−1 + . . . + βn z−n = Uz (z) 1 + α1 z−1 + . . . + αn z−n
(10-17)
10 Lineare zeitdiskrete Systeme: Digitale Regelung
definiert werden kann. Dabei sind die Anfangswerte der Differenzengleichung als null vorausgesetzt. In Analogie zu den kontinuierlichen Systemen ist die z-Übertragungsfunktion Gz (z) auch als z-Transformierte der Gewichtsfolge g(k) definiert: Gz (z) = Z {g(k)} .
(10-18)
Dies folgt unmittelbar aus der z-Transformation der Faltungssumme gemäß (10-5) und dem Vergleich mit (10-17). Mit der Definition der z-Übertragungsfunktion hat man die Möglichkeit, diskrete Systeme formal ebenso zu behandeln wie kontinuierliche Systeme. Beispielsweise lassen sich zwei Systeme mit den z-Übertragungsfunktionen G1z (z) und G2z (z) hintereinander schalten, und man erhält dann als Gesamtübertragungsfunktion Gz (z) = G1z (z)G2z (z) .
(10-19)
Entsprechend ergibt sich für eine Parallelschaltung Gz (z) = G1z (z) + G2z (z) .
(10-20)
Wie im kontinuierlichen Fall kann bei Systemen mit P-Verhalten (Systemen mit Ausgleich) auch der Verstärkungsfaktor K bestimmt werden, der sich bei sprungförmiger Eingangsfolge u(k) = 1 für k 0 als stationärer Endwert der Ausgangsfolge y(∞) über den Endwertsatz der z-Transformation zu ⎞ D⎛ ⎞ ⎛ n n ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ αν ⎟⎟⎟⎠ (10-21) K = Gz (1) = ⎜⎜⎜⎝ βν ⎟⎟⎟⎠ ⎜⎜⎜⎝1 + ν=0
ν=1
ergibt. 10.4.2 Die z-Übertragungsfunktion kontinuierlicher Systeme
Zur theoretischen Behandlung von digitalen Regelkreisen wird auch für die kontinuierlichen Teilsysteme eine diskrete Systemdarstellung benötigt, also eine z-Übertragungsfunktion. Dazu betrachtet man den gestrichelt dargestellten Teil des Abtastregelkreises von Bild 10-3b. Gesucht ist nun das Übertragungsverhalten zwischen den Abtastsignalen u∗ (t) und y∗ (t). Betrachtet man zunächst die Gewichtsfunktion gHG (t) des kontinuierlichen Systems einschließlich Halteglied, also gHG (t) = L −1 {H(s)G(s)} ,
so erhält man hierzu durch Abtasten die Gewichtsfolge gHG (kT ) = L −1 {H(s)G(s)}|t=kT .
(10-22)
Damit ergibt sich die z-Transformierte HGz (z) = Z {L −1 {H(s)G(s)}|t=kT }
(10-23)
für die Bestimmung von HGz (z) aus G(s), die häufig auch als HGz (z) = Z{H(s)G(s)} (10-24) geschrieben wird, wobei das Symbol Z die in (10-23) enthaltene doppelte Operation Z {L −1 {. . .}|t=kT } kennzeichnet. Es wäre somit falsch, HGz (z) als z-Transformierte der Übertragungsfunktion H(s)G(s) zu betrachten; richtig ist vielmehr, dass HGz (z) die z-Transformierte der Gewichtsfolge gHG (kT ) ist. Außerdem ist zu beachten, dass die durch (10-24) beschriebene Operation nicht umkehrbar eindeutig ist. Verwendet man in (10-24) ein Halteglied nullter Ordnung gemäß (10-7), so folgt mit H(s) = H0 (s) anstelle von (10-24) speziell ' ' G(s) G(s) z−1 Z H0Gz (z) = (1 − z−1 )Z = . s z s (10-25) Generell stellt HGz (z) die diskrete Beschreibung des kontinuierlichen Systems mit der Übertragungsfunktion G(s) dar. Besitzt G(s) noch eine Totzeit G(s) = G (s) e−T t s ,
(10-26)
so ergibt sich – sofern T t = dT gewählt wird (d ganzzahlig) – für die zugehörige diskrete Übertragungsfunktion (10-27) HGz (z) = HGz (z) z−d . Hieraus ist ersichtlich, dass die Totzeit nur eine Multiplikation von HGz (z) mit z−d bewirkt, d. h., die z-Übertragungsfunktion bleibt eine rationale Funktion. Dies vereinfacht natürlich die Behandlung von Totzeit-Systemen im diskreten Bereich außerordentlich. Die mithilfe des Euler-Verfahrens ermittelte Differenzengleichung lässt sich leicht in eine z-Übertragungsfunktion umwandeln. Zur Verallgemeinerung wird (10-2a) auf ein I-Glied angewandt, das durch die Beziehung y˙ (t) = u(t) bzw. Y(s) =
1 U(s) s
(10-28)
I67
I68
I Regelungs- und Steuerungstechnik / Regelungstechnik
beschrieben wird. Daraus folgt als Differenzengleichung y(k) = y(k − 1) + T u(k) , die bekannte Beziehung für die Rechteck-Integration. Die Anwendung der z-Transformation auf diese Beziehung liefert −1
Yz (z)(1 − z ) = T Uz (z) , und hieraus folgt Yz (z) =
Tz Uz (z) . z−1
Durch Vergleich mit (10-28) ergibt sich für die entsprechenden Übertragungsfunktionen somit die Korrespondenz Tz 1 → . (10-29) s z−1 Bei Systemen höherer Ordnung geht man nun bei der Anwendung der approximierten z-Transformation so vor, dass man aus der Korrespondenz von (10-29) die Substitutionsbeziehung s≈
z−1 Tz
(10-30)
bildet und in G(s) einsetzt, woraus sich die approximierte z-Übertragungsfunktion Gz (z) ergibt. Allerdings ist nun Gz (z) nicht mehr mit der Funktion vergleichbar, die durch die exakte Transformation mit Halteglied entsteht. Eine etwas genauere Approximationsbeziehung erhält man aus (10-9), s=
1 lnz , T
durch die Reihenentwicklung der ln-Funktion: ⎡ ⎤ ' ' ⎢⎢⎢ z − 1 1 z − 1 3 1 z − 1 5 ⎥⎥ 1 ⎢ + s = · 2 ⎣⎢ + + . . .⎥⎥⎥⎦ . T z+1 3 z+1 5 z+1 (10-31) Durch Abbruch nach dem ersten Glied entsteht die Tustin-Formel 2 z−1 s≈ · , (10-32) T z+1 mit der wiederum durch Substitution Gz (z) aus G(s) näherungsweise für kleine Werte von T berechnet werden kann [4].
10.5 Stabilität diskreter Regelsysteme 10.5.1 Stabilitätsbedingungen
Ein diskretes Regelsystem, beschrieben durch (10-3b) oder (10-5) oder auch in der Form Gz (z) =
β0 zn + β1 zn−1 + . . . + βn , zn + α1 zn−1 + . . . + αn
(10-33)
°ist stabil, wenn zu jeder beschränkten Eingangsfolge u(k) auch die Ausgangsfolge y(k) beschränkt ist. Unter Benutzung dieser Stabilitätsdefinition kann man nun mithilfe der Faltungssumme (10-5) folgende notwendige und hinreichende Stabilitätsbedingung formulieren: Ist g(k) die Gewichtsfolge eines diskreten Systems, so ist dieses System genau dann stabil, wenn ∞
|g(k)| < ∞
(10-34)
k=0
ist. Diese Stabilitätsbedingung im Zeitbereich ist allerdings recht unhandlich. Durch Übergang in den komplexen Bereich der z-Transformierten Gz (z) von g(k) erhält man folgende notwendige und hinreichende Stabilitätsbedingung in der z-Ebene: Das durch die rationale Funktion Gz (z) gemäß (10-33) bestimmte Abtastsystem ist genau dann stabil, wenn alle Pole zi von Gz (z) innerhalb des Einheitskreises der z-Ebene liegen, d. h., wenn gilt |zi | < 1
für i = 1, 2, . . . , n .
(10-35)
Diese Stabilitätsbedingung folgt unmittelbar aus der Analogie zwischen der s-Ebene für kontinuierliche und der z-Ebene für diskrete Systeme. Die linke s-Halbebene wird mithilfe der Substitution (10-9), z = eTs
mit
s = σ + jω ,
in das Innere des Einheitskreises der z-Ebene abgebildet, wobei und
|z| = eT σ
(10-36a)
ϕ = arg z = ωT
(10-36b)
gilt. Da im kontinuierlichen Fall für asymptotische Stabilität alle Pole si der Übertragungsfunktion G(s) in der linken s-Halbebene (Re(si ) < 0) liegen müssen, folgt aus den Abbildungsgesetzen der
10 Lineare zeitdiskrete Systeme: Digitale Regelung
z-Transformation, dass entsprechend bei einem diskreten System alle Pole zi der z-Übertragungsfunktion Gz (z) im Innern des Einheitskreises liegen müssen, wie oben bereits festgestellt wurde. Anhand von (10-36a,b) lässt sich leicht zeigen, dass die gesamte linke s-Halbebene (σ < 0) in das Innere des Einheitskreises 0 |z| < 1 und die rechte s-Halbebene (σ > 0) in das Äußere des Einheitskreises |z| > 1 abgebildet wird. Der jω-Achse der s-Ebene entspricht der Einheitskreis der z-Ebene (|z| = 1), der bei deren Abbildung unendlich oft durchlaufen wird. Anhand dieser Überlegungen ist leicht ersichtlich, dass Linien konstanter Dämpfung (σ = const) in der s-Ebene bei dieser Abbildung in Kreise um den Ursprung der z-Ebene übergehen. Linien konstanter Frequenz (ω = const) in der s-Ebene werden in der z-Ebene als Strahlen abgebildet, die im Ursprung der z-Ebene mit konstantem Winkel ϕ = ωT beginnen. Je größer die Frequenz, desto größer wird also auch der Winkel ϕ dieser Geraden (Bild 10-4).
10.5.2 Stabilitätskriterien
Zur Überprüfung der oben definierten Stabilitätsbedingungen, dass alle Pole zi von Gz (z) innerhalb des Einheitskreises der z-Ebene liegen müssen, stehen auch bei diskreten Systemen Kriterien zur Verfügung, die ähnlich wie bei linearen kontinuierlichen Systemen von der charakteristischen Gleichung f (z) = γ0 + γ1 z + . . . + γn zn = 0 .
(10-37)
ausgehen. Diese Beziehung folgt aus (10-33) durch Nullsetzen und triviale Umbenennung des Nennerpolynoms. Eine einfache Möglichkeit, die Stabilität eines diskreten Systems zu überprüfen, besteht in der Verwendung der w-Transformation w=
z−1 z+1
oder z =
1+w . 1−w
(10-38)
Diese Transformation bildet das Innere des Einheitskreises der z-Ebene in die linke w-Ebene ab. Damit werden bei einem stabilen System alle Wurzeln zi der charakteristischen Gleichung in der linken wHalbebene abgebildet. Mit (10-38) erhält man als charakteristische Gleichung in der w-Ebene n 1+w 1+w γ0 + γ1 = 0 . (10-39) + . . . + γn 1−w 1−w Hierauf kann das Routh- oder Hurwitz-Kriterium (siehe 6.2) angewandt werden. Dieser Weg ist jedoch nicht erforderlich, wenn speziell für diskrete Systeme Tabelle 10-1. Koeffizienten zum Jury-Stabilitätskriterium
Bild 10-4. Abbildung der s-Ebene in die z-Ebene. a Abbildung der linken s-Halbebene in das Innere des Einheitskreises der z-Ebene, b Abbildung der Linien σ = const in Kreise der z-Ebene, c Abbildung der Linien ω = const in Strahlen aus dem Ursprung der z-Ebene
Reihe 1 2 3 4 5 6 .. . 2n − 5 2n − 4 2n − 3
z0 γ0 γn b0 bn−1 c0 cn−2
z1 γ1 γn−1 b1 bn−2 c1 cn−3
z2 γ2 γn−2 b2 bn−3 c2 cn−4
r0 r3 s0
r1 r2 s1
r2 r1 s2
... ... ... ... ... ... ... .. . r3 r0
zn−2 γn−2 γ2 bn−2 b1 cn−2 c0
zn−1 γn−1 γ1 bn−1 b0
zn γn γ0
I69
I70
I Regelungs- und Steuerungstechnik / Regelungstechnik
entwickelte Stabilitätskriterien verwendet werden, wie beispielsweise das Kriterium von Jury [5] oder das Schur-Cohn-Kriterium [6]. Im Folgenden sei kurz das Vorgehen beim Jury-Stabilitätskriterium gezeigt. Zunächst wird in (10-37) das Vorzeichen so gewählt, dass yn > 0 (10-40) wird. Dann berechnet man das in Tabelle 10-1 dargestellte Koeffizientenschema. Zu diesem Zweck schreibt man die Koeffizienten γi in den ersten beiden Reihen vor- und rückwärts – wie dargestellt – an. Jeder nachfolgende Satz zweier zusammengehöriger Reihen wird berechnet aus folgenden Determinanten: γ0 γn−k b0 bn−1−k , ck = bk = γn γk bn−1 bk c0 cn−2−k dk = , . . . cn−2 ck r0 r3 r0 r2 r0 r1 , s1 = , s2 = . s0 = r3 r0 r3 r1 r3 r2 Die Berechnung erfolgt solange, bis die letzte Reihe mit den drei Zahlen s0 , s1 und s2 erreicht ist. Das JuryStabilitätskriterium besagt nun, dass für asymptotisch stabiles Verhalten folgende notwendigen und hinreichenden Bedingungen erfüllt sein müssen: a)
f (1) > 0 und (−1)n f (−1) > 0
0
n−1
|c0 | > |cn−2 |
in einen diskreten Algorithmus umgewandelt werden. Da hierbei der Zeitverlauf des Eingangssignals, nämlich die Regelabweichung e(t) beliebig sein kann, ist die Bestimmung der z-Übertragungsfunktion des diskreten PID-Reglers nur näherungsweise möglich. Für die Berechnung des I-Anteils wird die TustinFormel (10-32) benutzt, wodurch eine Integration nach der Trapezregel beschrieben wird. Zur Diskretisierung des D-Anteils erweist sich eine Substitution nach (10-30) als günstiger, sodass man insgesamt für den PID-Algorithmus die z-Übertragungsfunktion T z+1 DPID (z) = KR 1 + · 2T I z − 1 z−1 TD · (10-44) + T z(1 + T v /T ) − T v /T erhält. Fasst man die einzelnen Terme zusammen, so ergibt sich eine z-Übertragungsfunktion 2. Ordnung mit den Polen z = 1 und z = −c1
(10-41)
DPID (z) =
b) außerdem folgende (n − 1) Bedingungen: |γ0 | < γn > 0 |d0 | > |dn−3 | . |b | > |b | ..
besteht darin, die Funktion des konventionellen analogen PID-Reglers einem Prozessrechner zu übertragen. Dazu muss der PID-Regler mit verzögertem DVerhalten und der Übertragungsfunktion TD s 1 + (10-43) GPID (s) = KR 1 + TI s 1 + Tv s
(10-42)
|s0 | > |s2 | .
Ist eine dieser Bedingungen nicht erfüllt, dann ist das System instabil. Bevor das Koeffizientenschema aufgestellt wird, muss zuerst f (z = 1) und f (z = −1) berechnet werden. Erfüllt eine dieser Beziehungen die zugehörige obige Ungleichung nicht, dann liegt bereits instabiles Verhalten vor.
10.6 Regelalgorithmen für die digitale Regelung 10.6.1 PID-Algorithmus
Eine der einfachsten Möglichkeiten, einen Regelalgorithmus für die digitale Regelung zu realisieren,
d0 + d1 z−1 + d2 z−2 Uz (z) = , Ez (z) (1 − z−1 )(1 + c1 z−1 )
(10-45)
deren Koeffizienten aus den Parametern KR , T I , T D und T v wie folgt berechnet werden: KR T + Tv TD + Tv d0 = + 1+ , (10-46a) 1 + T v /T 2T I T KR 2(T D + T v ) T d1 = − −1 + , 1 + T v /T 2T I T (10-46b) TD + Tv Tv KR − , d2 = (10-46c) 1 + T v /T T 2T I c1 = −
Tv . T + Tv
(10-46d)
Die zugehörige Differenzengleichung u(k) = d0 e(k) + d1 e(k − 1) + d2 e(k − 2) +(1 − c1 )u(k − 1) + c1 u(k − 2)
(10-47)
10 Lineare zeitdiskrete Systeme: Digitale Regelung
Tabelle 10-2. Einstellwerte für diskrete Regler nach Takahashi
erhält man direkt aus (10-45) durch inverse zTransformation. Gleichung (10-47) wird auch als Stellungs- oder Positionsalgorithmus bezeichnet, da hier die Stellgröße direkt berechnet wird. Im Gegensatz dazu wird beim Geschwindigkeitsalgorithmus jeweils die Änderung der Stellgröße Δu(k) = u(k) − u(k − 1)
(10-48)
berechnet, wobei die entsprechende Differenzengleichung lautet: Δu(k) =
d0 e(k) + d1 e(k − 1) +d2 e(k − 2) − c1 Δu(k − 1) .
(10-49)
Durch Anwendung der z-Transformation folgt aus (10-49) direkt die z-Übertragungsfunktion des Geschwindigkeitsalgorithmus DPID (z) =
ΔUz (z) d0 + d1 z−1 + d2 z−2 = . (10-50) Ez (z) 1 + c1 z−1
In der Praxis wird der Geschwindigkeitsalgorithmus immer dann angewendet, wenn das Stellglied speicherndes Verhalten hat, wie es z. B. bei einem Schrittmotor der Fall ist.
Die hier besprochenen PID-Algorithmen stellen aufgrund ihrer Herleitung quasistetige Regelalgorithmen dar. Wählt man dabei die Abtastzeit T mindestens 1/10 kleiner als die dominierende Zeitkonstante des Systems, so können unmittelbar die Parameter des kontinuierlichen PID-Reglers in (10-46a) bis (10-46d) eingesetzt werden, wie sie durch Optimierung, aufgrund von Einstellregeln oder Erfahrungswerten bekannt sind. Am meisten verbreitet sind die von Takahashi [7] für diskrete Regler entwickelten Einstellregeln, die sich weitgehend an die Regeln von ZieglerNichols (siehe 8) anlehnen. Die Reglerparameter können entweder anhand der Kennwerte des geschlossenen Regelkreises an der Stabilitätsgrenze bei Verwendung eines P-Reglers (Methode I) oder anhand der gemessenen Übergangsfunktion der Regelstrecke (Methode II) ermittelt werden. Die hierfür notwendigen Beziehungen sind in Tabelle 10-2 für den P-, PI- und PID-Regler zusammengestellt. Dabei beschreiben die Größen KR krit den Verstärkungsfaktor eines P-Reglers an der Stabilitätsgrenze und T krit die Periodendauer der sich einstellenden Dauerschwingung. Bezüglich der Wahl der Größe von T v ist darauf zu achten, dass bei
I71
I72
I Regelungs- und Steuerungstechnik / Regelungstechnik
kleinen Abtastzeiten das durch den Analog-DigitalUmsetzer verursachte „Quantisierungsrauschen“ am Reglereingang nicht zu sehr verstärkt wird. Selbstverständlich kann der PID-Algorithmus auch mit größeren Abtastzeiten eingesetzt werden. Allerdings ist es dann nicht mehr möglich, die Parameter nach den zuvor erwähnten Regeln einzustellen. Sehr gute Ergebnisse erhält man in diesem Fall durch Optimierung der Parameter. 10.6.2 Der Entwurf diskreter Kompensationsalgorithmen
Der diskrete Entwurf ist besonders dann interessant, wenn die Abtastzeit so groß gewählt wird, dass nicht mehr von einem quasistetigen Betrieb ausgegangen werden kann. In diesem Fall erhält man aus dem Prinzip der Kompensation der Regelstrecke ein sehr einfaches und leistungsfähiges Syntheseverfahren für diskrete Regelalgorithmen, das es ermöglicht, die diskrete Führungsübertragungsfunktion des geschlossenen Regelkreises nahezu beliebig vorzugeben. Ausgangspunkt ist ein Abtastregelkreis in diskreter Darstellung gemäß Bild 10-5, wobei die Regelstrecke, die kein sprungfähiges Verhalten besitzen soll (b0 = 0), durch die z-Übertragungsfunktion (der einfacheren Beschreibung halber wird im Folgenden auf den Index z verzichtet) b1 z−1 + . . . + bn z−n −d B(z)z−d = z A(z) 1 + a1 z−1 + . . . + an z−n (10-51) und der diskrete Regler durch D(z) beschrieben werden. Hierbei ist d die diskrete Totzeit der Regelstrecke, für die d = T t /T gilt. Die Führungsübertragungsfunktion dieses Regelkreises lautet: G(z) =
GW (z) =
D(z)G(z) Y(z) = . W(z) 1 + D(z)G(z)
(10-52)
Nun gibt man für GW (z) ein gewünschtes Übertragungsverhalten in Form einer „Modellübertragungsfunktion“ KW (z) vor mit der Forderung
Bild 10-5. Diskreter Regelkreis
!
GW (z) = KW (z) . Damit löst man (10-52) nach D(z) auf und erhält analog zu (8-44) die Übertragungsfunktion des Reglers D(z) =
KW (z) 1 · . G(z) 1 − KW (z)
(10-53)
Diese Beziehung stellt die Grundgleichung der diskreten Kompensation dar. Treten in G(z) Pole und/oder Nullstellen außerhalb des Einheitskreises der z-Ebene auf, so muss KW (z) die folgenden Bedingungen erfüllen KW (z) = B− (z)K1 (z)z−d und
(10-54)
1 − KW (z) = A− (z)K2 (z) ,
(10-55)
wobei A− (z) und B− (z) die Teilpolynome von A(z) = A+ (z)A− (z) und B(z) = B+ (z)B− (z) darstellen, deren Wurzeln außerhalb und auf dem Einheitskreis liegen, d. h., es gilt |zi | 1, während für A+ (z) und B+ (z) die Beziehung |zi | < 1 gilt. Bei der Wahl von K1 (z) und K2 (z) ist weiter – wegen der stationären Genauigkeit für Führungsverhalten – die Bedingung KW (1) = 1 einzuhalten. Diese Bedingung wird mit (10-54) und (10-55) gerade erfüllt durch die Ansätze K1 (z) = K2 (z) =
und
BK (z)P(z) N(z) 1 − z−1 Q(z) N(z)
(10-56)
.
(10-57)
In diesen beiden Beziehungen können die Polynome N(z) und BK (z) noch frei gewählt werden. Damit ist KW (z) vollständig festgelegt. Die unbekannten Polynome P(z) und Q(z) werden mit minimaler Ordnung so bestimmt, dass BK (z) und N(z) alle frei wählbaren Parameter enthalten. Durch Einsetzen von (10-54) in (10-55) folgt unter Berücksichtigung von (10-56) und (10-57) die Polynomgleichung N(z) − A− (z)(1 − z−1 )Q(z) = B−(z)BK (z)P(z)z−d (10-58) zur Bestimmung von P(z) und Q(z). Durch Einsetzen von (10-54) bis (10-57) und (10-51) in (10-53) erhält man schließlich als Beziehung für den allgemeinen Kompensationsalgorithmus D(z) =
A+ (z)BK (z)P(z) . B+ (z)Q(z)(1 − z−1 )
(10-59)
11 Zustandsraumdarstellung linearer Regelsysteme
Für den Fall, dass alle Pole und Nullstellen von G(z) im Bereich |zi | < 1 liegen, werden (10-54) bis (10-59) vereinfacht, indem die Polynome A+ (z), A− (z), B+ (z) und B− (z)BK (z)P(z) ersetzt werden durch A(z), 1, B(z) und P (z) [3], wobei P (z) und N(z) frei wählbar sind. 10.6.3 Kompensationsalgorithmus für endliche Einstellzeit
Das Verfahren der diskreten Kompensation bietet die Möglichkeit, Regelkreise mit endlicher Einstellzeit (deadbeat response) zu entwerfen. Dies ist eine für Abtastsysteme typische Eigenschaft, die bei kontinuierlichen Regelsystemen nicht erreicht werden kann. Es soll also KW (z) nun so gewählt werden, dass der Einschwingvorgang nach einer sprungförmigen Sollwertänderung innerhalb von nE = q + d Abtastschritten abgeschlossen ist. Offensichtlich wird diese Bedingung erfüllt, wenn KW (z) ein endliches Polynom in z−1 der Ordnung nE ist. Dies ist gewährleistet, wenn
B∗ (z) = B(z)BK(z) =
q
b∗i z−1 ,
(10-63)
i=0
dann erhält man für die Übertragungsfunktion des zugehörigen Reglers [3] A(z)BK (z)/B∗(1) . (10-64) D(z) = 1 − [B∗ (z)/B∗(1)] z−d Wählt man beispielsweise BK(z) = 1, so wird q = n, also gleich der Ordnung der Regelstrecke. Damit ergibt sich als minimale Anzahl von Abtastschritten nE = n + d für die Ausregelung eines Sollwertsprunges, wodurch die minimale Ausregelzeit festgelegt wird. Bezüglich der Wahl von BK (z) können verschiedene Kriterien angewendet werden. Einerseits erhöht sich mit der Ordnung von BK (z) die Reglerordnung und damit bei einem Sollwertsprung die Anzahl der Abtastschritte bis zum Erreichen des stationären Endwertes der Regelgröße. Andererseits kann aber auch durch geeignete Wahl von BK (z) das Stellverhalten verbessert werden [3].
N(z) = 1 gewählt wird. Außerdem muss auch die Stellgröße nach nE Abtastwerten einen konstanten Wert annehmen [3]. Somit ergibt sich für die Modellübertragungsfunktion des Führungsverhaltens des geschlossenen Regelkreises KW (z) = B(z)BK(z)P(z)z−d .
(10-60)
Nach kurzer Zwischenrechnung erhält man für die Übertragungsfunktion des Reglers mit endlicher Einstellzeit A+ (z)BK(z)P(z) D(z) = (10-61) Q(z)(1 − z−1 ) und als Bestimmungsgleichung für P(z) und Q(z) 1 − A− (z)(1 − z−1 )Q(z) = B(z)BK(z)P(z)z−d . (10-62) P(z) und Q(z) können bei entsprechender Wahl von BK (z) mit (10-62) durch Koeffizientenvergleich gewonnen werden und ermöglichen so einen Entwurf, der den Anteil A− (z) der Streckenübertragungsfunktion berücksichtigt. Für den speziellen Fall stabiler Regelstrecken führt das folgende Vorgehen auf sehr einfache Weise unmittelbar zum Entwurf eines Reglers mit endlicher Einstellzeit. Benutzt man in (10-60) noch die Abkürzung
11 Zustandsraumdarstellung linearer Regelsysteme 11.1 Allgemeine Darstellung Aufgrund ihrer Gemeinsamkeiten werden nachfolgend kontinuierliche und diskrete Systeme gemeinsam dargestellt und – soweit erforderlich – durch (a) und (b) in den Gleichungsnummern unterschieden. Eine Mehrgrößenregelstrecke wird durch die Zustandsgleichung x˙ (t) = Ax(t) + Bu(t) , x(t0 ) = x0 (11-1a) x(k + 1) = Ad x(k) + Bd u(k) , x(0) = x0 (11-1b) und durch die Ausgangsgleichung y(t) = Cx(t) + Du(t) (11-2a) y(k) = Cd x(k) + Dd u(k) (11-2b) beschrieben, vgl. 3.3. Bei der Umrechnung eines kontinuierlichen Systems der Darstellung (a) in dem diskreten Fall von (b) existiert folgender Zusammenhang: Cd = C und Dd = D, sowie Ad = I + SA und Bd = SB (11-3) mit
S=T
∞ n=0
An
Tn , (n + 1)!
(11-4)
I73
I74
I Regelungs- und Steuerungstechnik / Regelungstechnik
wobei T die Abtastzeit ist, und I die Einheitsmatrix kennzeichnet. Die unendliche Reihe in (11-4) muss bei der praktischen Auswertung nach einer endlichen Zahl von Gliedern abgebrochen werden. Dabei wird zweckmäßigerweise ein zulässiger Abbruchfehler durch die Norm des Zuwachsterms vorgeschrieben. Die Lösung von (11-1) lautet "t x(t) = Φ(t)x0 +
Φ(t − τ)Bu(τ)dτ ,
(11-5a)
G(s) = C(sI − A)−1 B + D , −1
G(z) = Cd (zI − Ad ) Bd + Dd .
x(k) = Φ(k)x0 +
Adk− j−1 Bd u( j)
,
(11-10b)
Im Falle eines Eingrößensystems geht z. B. (11-10a) über in die Übertragungsfunktion: G(s) = cT (sI − A)−1 b + d .
(11-11)
Aus (11-10) bzw. (11-11) erhält man unmittelbar die charakteristische Gleichung des offenen Systems durch Berechnung der Determinanten
0 k−1
(11-10a)
P∗ (s) = |(sI − A)| = 0 , P∗ (z) = |(zI − Ad )| = 0 ,
(11-5b)
(11-12a) (11-12b)
j=0
wobei Φ(t) = e , At
Φ(k) =
Akd
(11-6a,b)
als Fundamental- oder Übergangsmatrix bezeichnet wird. Diese Matrix spielt bei den Methoden des Zustandsraums eine wichtige Rolle. Sie ermöglicht auf einfache Weise die Berechnung des Systemzustands für alle Zeiten t allein aus der Kenntnis eines Anfangszustands x0 und des Zeitverlaufs des Eingangsvektors. Der Term Φx0 in (11-5) beschreibt die homogene Lösung der Zustandsgleichung, die auch als Eigenbewegung oder als freie Reaktion des Systems bezeichnet wird. Der zweite Term entspricht der partikulären Lösung, also dem durch die äußere Erregung gegebenen Anteil (erzwungene Reaktion). Zur Berechnung von Φ existieren verschiedene Methoden [1]. Eine einfache Möglichkeit besteht in der Berechnung im Frequenzbereich: Φ(t) = L −1 {(sI − A)−1 } , Φ(k) = Z
−1
−1
{(zI − Ad ) z} .
(11-7a) (11-7b)
Andererseits bietet sich für diskrete Systeme die rekursive Form Φ(k + 1) = Ad Φ(k)
mit Φ(0) = I
(11-8)
zur einfachen Berechnung an. Das Übertragungsverhalten der durch (11-1) beschriebenen Mehrgrößenregelstrecke lässt sich auch durch die Übertragungsmatrix G in der Darstellung Y(s) = G(s)U(s) ,
Y(z) = G(z)U(z)
(11-9a,b)
beschreiben, wobei die Elemente Gi j von G(i = 1, 2, . . . , m; j = 1, 2, . . . , r) die Teilübertragungsfunktionen des Mehrgrößensystems sind. Für G gilt
wobei die sich aus diesem Polynom ergebenen Wurzeln die Pole des Systems darstellen, die auch als Eigenwerte von A bzw. Ad anzusehen sind. Zur Beurteilung der Stabilität kann die Lage dieser Pole in der s- oder z-Ebene herangezogen werden.
11.2 Normalformen für Eingrößensysteme Der kürzeren Schreibweise wegen erfolgt im Weiteren die Darstellung nur für kontinuierliche Systeme, die durch die Übertragungsfunktion b0 + b1 s + . . . + bn−1 sn−1 + bn sn Y(s) = U(s) a0 + a1 s + . . . + an−1 sn−1 + sn (11-13) beschrieben werden. Um für derartige Systeme eine Zustandsraumdarstellung anzugeben, können Standardformen gewählt werden: G(s) =
a) Regelungsnormalform: ⎡ ⎢⎢⎢ 0 1 0 ⎢⎢⎢ ⎢⎢⎢ 0 0 1 ⎢⎢⎢ ⎢⎢ 0 0 0 A = ⎢⎢⎢⎢ . ⎢⎢⎢ .. ⎢⎢⎢ ⎢⎢⎢ 0 0 0 ⎢⎣ −a0 −a1 −a2 ⎡ ⎤ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢⎢⎢⎢ 0 ⎥⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎢ ⎥ B = b = ⎢⎢⎢⎢ . ⎥⎥⎥⎥ , ⎢⎢⎢ .. ⎥⎥⎥ ⎢⎢⎢⎢ ⎥⎥⎥⎥ ⎢⎢⎢ 0 ⎥⎥⎥ ⎣ ⎦ 1
⎤ 0 . . . 0 ⎥⎥ ⎥⎥ 0 0 ⎥⎥⎥⎥ ⎥⎥ 1 0 ⎥⎥⎥⎥ . ⎥⎥⎥ , .. . .. ⎥⎥⎥⎥⎥ ⎥⎥ 0 · · · 1 ⎥⎥⎥⎥ ⎦ −a3 · · · −an−1 (11-14a,b)
11 Zustandsraumdarstellung linearer Regelsysteme
C = cT = [(b0 − bn a0 ), (b1 − bn a1 ), . . . (bn−1 − bn an−1 )] , D = d = bn .
(11-14c,d)
Die Struktur der Matrix A wird als FrobeniusForm oder Regelungsnormalform bezeichnet. Sie ist dadurch gekennzeichnet, dass sie in der untersten Zeile genau die negativen Koeffizienten ihres charakteristischen Polynoms (normiert auf an = 1) enthält. b) Beobachtungsnormalform: ⎡ ⎢⎢⎢ 0 ⎢⎢⎢⎢ ⎢⎢⎢ 1 ⎢⎢⎢ ⎢⎢⎢ A = ⎢⎢⎢⎢⎢ 0 ⎢⎢⎢ 0 ⎢⎢⎢ ⎢⎢⎢ .. ⎢⎢⎢ . ⎣ 0
0 ... 0 0 .. .. 0 . . .. .. 1 . . 0 ... 0 0 .. . 10 0 ... 0 1
⎡ ⎢⎢⎢ b0 ⎢⎢⎢ ⎢⎢⎢ b1 ⎢⎢⎢ ⎢⎢ b = ⎢⎢⎢⎢ ⎢⎢⎢ bn−3 ⎢⎢⎢ ⎢⎢⎢ bn−2 ⎣⎢ bn−1
⎤ −a0 ⎥⎥⎥ .. ⎥⎥⎥⎥⎥ . ⎥⎥⎥ ⎥ .. ⎥⎥⎥⎥ . ⎥⎥⎥ , ⎥⎥ −an−3 ⎥⎥⎥⎥ ⎥⎥⎥ −an−2 ⎥⎥⎥⎥⎥ ⎦ −an−1
⎤ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ ⎥⎥⎥ , − bn an−3 ⎥⎥⎥⎥ ⎥⎥ − bn an−2 ⎥⎥⎥⎥ ⎦ − bn an−1
(11-15a,b)
− bn a0 − bn a1 .. .
C = cT = [0 0 . . . 0 1] , D = d = bn . (11-15c,d) Man erkennt unmittelbar, dass diese Systemdarstellung dual zur Regelungsnormalform ist, insofern als die Vektoren b und c gerade vertauscht sind, während die Matrix A eine transponierte Frobenius-Form besitzt, in der die negativen Koeffizienten des charakteristischen Polynoms als Spalte auftreten. c) Diagonalform: Für einfache reelle Pole folgt: ⎤ ⎡ ⎡ ⎤ ⎢⎢⎢ s1 0 . . . 0 ⎥⎥⎥ ⎢⎢⎢ 1 ⎥⎥⎥ ⎥ ⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥ .. ⎥⎥⎥ ⎢⎢⎢ 0 s ⎥ ⎢⎢ 1 ⎥⎥ . ⎥⎥⎥ 2 ⎢ ⎢ A = ⎢⎢⎢ . ⎥⎥⎥ , b = ⎢⎢⎢⎢⎢ . ⎥⎥⎥⎥⎥ .. ⎢⎢⎢ . ⎢⎢⎢ .. ⎥⎥⎥ . 0 ⎥⎥⎥⎥⎥ ⎢⎢⎣ . ⎢⎣ ⎥⎦ ⎦ 1 0 . . . 0 sn
(11-16a,b)
cT = [c1 c2 . . . cn ] .
(11-16c)
und
In dieser Darstellung sind die Zustandsgleichungen entkoppelt. Das System zerfällt in n voneinander unabhängige Einzelsysteme 1. Ordnung, wobei jedem dieser Teilsysteme genau ein Pol des Systems zugeordnet ist. Die Systemmatrix hat Diagonalform und besitzt die Pole als Diagonalelemente. Treten mehrfache und/oder komplexe Pole auf, so ist eine blockdiagonale Struktur der Matrix in Form einer JordanMatrix [1] erforderich.
11.3 Steuerbarkeit und Beobachtbarkeit Das dynamische Verhalten eines Übertragungssystems wird, wie oben gezeigt wurde, durch die Zustandsgrößen vollständig beschrieben. Bei einem gegebenen System sind diese jedoch in der Regel nicht bekannt; man kennt gewöhnlich nur den Ausgangsvektor y(t) sowie den Steuervektor u(t). Dabei sind für die Analyse und den Entwurf eines Regelsystems folgende Fragen interessant, die eine erste Näherung der Begriffe Steuerbarkeit und Beobachtbarkeit ergeben: – Gibt es irgendwelche Komponenten des Zustandsvektors x(t) des Systems, die keinen Einfluss auf den Ausgangsvektor y(t) ausüben? Ist dies der Fall, dann kann aus dem Verhalten des Ausgangsvektors y(t) nicht auf den Zustandsvektor x(t) geschlossen werden, und es liegt nahe, das betreffende System als nicht beobachtbar zu bezeichnen. – Gibt es irgendwelche Komponenten des Zustandsvektors x(t) des Systems, die nicht vom Eingangsvektor (Steuervektor) u(t) beeinflusst werden? Ist dies der Fall, dann ist es naheliegend, das System als nicht steuerbar zu bezeichnen. Die von Kalman [2] eingeführten Begriffe Steuerbarkeit und Beobachtbarkeit spielen in der modernen Regelungstechnik eine wichtige Rolle und ermöglichen eine schärfere Definition dieser soeben erwähnten Systemeigenschaften. Definition der Steuerbarkeit: Das durch (11-1) beschriebene lineare System ist vollständig zustandssteuerbar, wenn es für jeden Anfangszustand x(t0 ) eine Steuerfunktion u(t) gibt, die das System innerhalb einer beliebigen endlichen Zeitspanne t0 t t1 in den Endzustand x(t1 ) = 0 überführt.
I75
I76
I Regelungs- und Steuerungstechnik / Regelungstechnik
Für die Steuerbarkeit eines linearen zeitinvarianten Systems ist folgende Bedingung notwendig und hinreichend: Rang [B| AB| . . . | An−1 B] = n .
(11-17)
Das bedeutet, die (n × nr)-Hypermatrix
und (11-2), y = Cx + Du , gegeben, so bieten sich für ihre Regelung folgende zwei wichtige Möglichkeiten an: a) Rückführung des Zustandsvektors x, b) Rückführung des Ausgangsvektors y.
S1 = [B| AB| . . . | An−1 B] muss n linear unabhängige Spaltenvektoren enthalten. Bei Eingrößensystemen ist S1 eine quadratische Matrix, deren n Spalten linear unabhängig sein müssen. In diesem Fall kann der Rang von S1 anhand der Determinante |S1 | überprüft werden. Ist |S1 | 0 dann besitzt S1 den vollen Rang.
Die Blockstrukturen beider Möglichkeiten sind in Bild 11-1 dargestellt. Die Rückführung erfolge in beiden Fällen über konstante Verstärkungs- oder Reglermatrizen
Definition der Beobachtbarkeit: Das durch (11-1) und (11-2) beschriebene lineare System ist vollständig beobachtbar, wenn man bei bekannter Steuerfunktion u(t) und bekannten Matrizen A und C aus der Messung des Ausgangsvektors y(t) über ein endliches Zeitintervall t0 t t1 den Anfangszustand x(t0 ) eindeutig bestimmen kann.
die oft auch als Rückführmatrizen bezeichnet werden. Beide Blockstrukturen weisen des Weiteren für die Führungsgröße je ein Vorfilter auf, das ebenfalls durch eine konstante Matrix
Zur Prüfung der Beobachtbarkeit eines linearen zeitinvarianten Systems bildet man die (n × nm)Hypermatrix ST2 = [CT |(C A)T | . . . |(C An−1 )T ] . Das System ist genau dann beobachtbar, wenn gilt Rang S2 = n .
(11-18)
Diese Bedingung kann auch mithilfe der transponierten Matrix ST2 ausgedrückt werden: Rang[CT | AT CT | . . . |( AT )n−1 CT ] = n , woraus man durch Vergleich mit (11-17) erkennt, dass Beobachtbarkeit und Steuerbarkeit duale Systemeigenschaften sind.
11.4 Synthese linearer Regelsysteme im Zustandsraum 11.4.1 Das geschlossene Regelsystem
Ist eine Regelstrecke in der Zustandsraumdarstellung nach (11-1), x˙ = Ax + Bu
mit
x0 = x(0) ,
F(r × n)
V (r × m)
oder
F(r × m) ,
oder V (r × m)
beschrieben wird. Dieses Vorfilter sorgt dafür, dass der Ausgangsvektor y im stationären Zustand mit dem Führungsvektor w(m×1) übereinstimmt. Für jede der beiden Regelkreisstrukturen lässt sich nun ebenfalls eine Zustandsraumdarstellung angeben. Bei dem Regelsystem mit Rückführung des Zustandsvektors erhält man die Zustandsraumdarstellung x˙ = ( A − BF)x + BVw und y = (C − DF)x + DVw .
(11-19) (11-20)
Diese beiden Beziehungen haben eine ähnliche Struktur wie (11-1) und (11-2). Somit gelten für den Übergang vom offenen zum geschlossenen Regelsystem die früher bereits eingeführten Beziehungen, nur dass nun die entsprechenden Korrespondenzen zwischen (11-1) und (11-19), bzw. (11-2) und (11-20), verwendet werden müssen. So erhält man z. B. mit der Systemmatrix ( A − BF) die zur Stabilitätsuntersuchung des geschlossenen Systems erforderliche charakteristische Gleichung P(s) = |sI − ( A − BF)| = 0 ,
(11-21)
aus der die Pole bzw. Eigenwerte des Regelkreises bestimmt werden können. Bei dem Regelsystem mit
11 Zustandsraumdarstellung linearer Regelsysteme
Bild 11-1. Regelung durch Rückführung a des Zustandsvektors x und b des Ausgangsvektors y
Rückführung des Ausgangsvektors erhält man die Zustandsraumdarstellung x˙ = [ A − BF (I + DF )−1 C]x
−1
(11-22)
+ B(I + F D) V w . und
y = (I + DF )−1 (Cx + DV w) . (11-23)
Im Folgenden soll für den Fall der Zustandsvektorrückführung die Berechnung der Matrix V des Vorfilters angegeben werden. Dabei werden folgende Voraussetzungen gemacht: – Die Regler- oder Rückführmatrix F sei bereits bekannt. – Die Anzahl von Stell- und Führungsgrößen sei gleich (r = m). – Zusätzlich gelte D = 0. Das Ziel des Entwurfs des Vorfilters ist, V so zu berechnen, dass im stationären Zustand Führungsund Regelgrößen übereinstimmen. Als Lösung ergibt sich [1] V = [C(BF − A)−1 B]−1 .
(11-24)
11.4.2 Der Grundgedanke der Reglersynthese
Im Gegensatz zur klassischen Ausgangsgrößenregelung gehen die Verfahren zur Synthese linearer Regelsysteme im Zustandsraum von einer Rückführung der Zustandsgrößen gemäß Bild 11-1a aus, da diese ja das gesamte dynamische Verhalten der Regelstre-
cke beschreiben. Diese Struktur nennt man Zustandsgrößenregelung. Der Regler wird hierbei durch die konstante (r × n)-Matrix F beschrieben. Er entspricht bezüglich der Zustandsgrößen einem P-Regler. Während man bei der klassischen Synthese dynamische Regler benutzt, um aus der Ausgangsgröße beispielsweise einen D-Anteil zu erzeugen, kann hier der DAnteil direkt oder indirekt als Zustandsgröße der Regelstrecke entnommen werden. Die Standardverfahren im Zustandsraum gehen zunächst davon aus, dass für t > 0 keine Führungs- und Störungssignale vorliegen. Damit hat der Regler F die Aufgabe, die Eigendynamik des geschlossenen Regelsystems zu verändern. Die homogene Differenzialgleichung, die das Eigenverhalten des geschlossenen Regelsystems beschreibt, erhält man aus (11-19): ˜ x˙ = ( A − BF)x = Ax
mit
x(0) = x0 .
(11-25)
Die Aufgabe der Regelung besteht nun darin, das System von einem Anfangszustand x(0) in einen gewünschten Endzustand x(te ) = 0 überzuführen. Dazu haben sich im Wesentlichen die nachfolgend aufgeführten drei Verfahren besonders bewährt. Gewöhnlich wird für deren Anwendung vorausgesetzt, dass die Regelstrecke steuerbar ist und dass ihre Zustandsgrößen verfügbar (z. B. messbar) sind. Allerdings genügt meist bereits die Voraussetzung, dass die Regelstrecke stabilisierbar ist, d. h., dass instabile Pole der Regelstrecke durch den Regler stabilisiert, also in die linke s-Halbebene verschoben werden können.
I77
I78
I Regelungs- und Steuerungstechnik / Regelungstechnik
[Ψ(s1 )Ψ(s2 ) . . . Ψ(sn )]
11.4.3 Die modale Regelung
Der Grundgedanke der modalen Regelung besteht darin, die bestehenden Zustandsgrößen xi (t) des offenen Systems geeignet zu transformieren, sodass die neuen Zustandsgrößen x∗i (t) möglichst entkoppelt werden und getrennt geregelt werden können. Da der Steuervektor u nur r Komponenten besitzt, können nicht mehr als r modale Zustandsgrößen x∗i (t) unabhängig voneinander beeinflusst werden. Jede der r ausgesuchten modalen Zustandsgrößen x∗i (t) wirkt genau auf eine modale Steuergröße u∗i (t), sodass die Reglermatrix F Diagonalform erhält, sofern die Eigenwerte des offenen Systems einfach sind. Bei mehrfachen Eigenwerten ist eine derartige vollständige Entkopplung der Zustandsgleichungen im Allgemeinen nicht mehr möglich. Unter Verwendung der Jordan-Form lässt sich dennoch eine weitgehende Entkopplung erreichen.
gebildet wird und daraus n linear unabhängige Spaltenvektoren Ψ j1 (s1 ), . . .Ψ jn (sn ) für die Berechnung von F ausgewählt werden, wobei j beliebige Werte von 1 bis r annehmen darf. Bei Eingrößensystemen (r = 1) ist die Wahl der (n × n)-Matrix [Ψ 1 (s1 ) . . . Ψ(sn )] eindeutig. Bei Mehrgrößensystemen bieten sich zum Aufbau der entsprechenden Matrix mehrere Möglichkeiten an. Aufgrund dieser Mehrdeutigkeit kann es verschiedene Reglermatrizen F geben, die zur gleichen charakteristischen Gleichung führen. Bei einer Eingrößenregelstrecke, die in der Regelungsnormalform nach (11-14c,d) vorliegt, deren charakteristische Gleichung P∗ (s) = a0 + a1 s + . . . + an−1 sn−1 + sn lautet und die durch einen Zustandsregler u = vw − f T x
11.4.4 Das Verfahren der Polvorgabe
Das dynamische Eigenverhalten des geschlossenen Regelsystems wird im Wesentlichen durch die Lage der Pole bzw. durch die Lage der Eigenwerte der zugehörigen Systemmatrix bestimmt. Durch die Elemente fi j der Reglermatrix F können die Pole des offenen Systems aufgrund der Rückkopplung von x(t) an bestimmte gewünschte Stellen in der s-Ebene verschoben werden. Will man alle Pole verschieben, so muss das offene System steuerbar sein. Praktisch geht man so vor, dass die gewünschten Pole si des geschlossenen Regelsystems vorgegeben und dazu die Reglerverstärkungen fi j ausgerechnet werden. Ein allgemein anwendbares Verfahren [1] für Einund Mehrgrößensysteme liefert die Reglermatrix F = −[ej1 ej2 . . . ejn ][Ψ j1 (s1 )Ψ j2 (s2 ) . . . Ψ jn (sn )]−1 , (11-26) wobei ejν Einheitsvektoren sind und alle Pole si bei der Berechnung der Spaltenvektoren Ψ ji (si ) berücksichtigt werden müssen. Diese Spaltenvektoren erhält man mit Φ(s) = L {Φ(t)} nach (7a) aus der (n × r)Matrix Ψ(s) = Φ(s)B = [Ψ 1 (s) . . . Ψ r (s)] ,
(11-28)
(11-27)
indem für alle n vorgegebenen Pole si die (n × nr)Matrix
so geregelt werden soll, dass der geschlossene Regelkreis mit den vorgegebenen Polen si die charakteristische Gleichung P(s) = p0 + p1 s + . . . + pn−1 sn−1 + sn
(11-29)
erfüllt, ergeben sich die gesuchten Elemente des Rückführvektors zu f T = [(p0 − a0 )(p1 − a1 ) . . . (pn−1 − an−1 )] . (11-30) 11.4.5 Optimaler Zustandsregler nach dem quadratischen Gütekriterium
In Anlehnung an das klassische, für Eingrößenregelsysteme eingeführte Kriterium der quadratischen Regelfläche unter Einbeziehung des Stellgrößenaufwandes lässt sich generell für Mehrgrößenregelsysteme die Gütevorschrift (11-31) I = xT (te )Sx(te ) t "e ! + [xT (t)Qx(t) + uT (t)R u(t)] dt = Min t0
verwenden. Das Problem des Entwurfs eines optimalen Zustandsreglers lässt sich nach diesem Kriterium
11 Zustandsraumdarstellung linearer Regelsysteme
nun wie folgt formulieren: Für eine in der Zustandsraumdarstellung (11-1) und (11-2) gegebene Regelstrecke ist eine Reglermatrix F so zu ermitteln, dass ein optimaler Stellvektor u∗ (t) = −F∗ x
(11-32)
das System von einem Anfangswert x(t0 ) derartig in die Ruhelage x(te ) = 0 überführt, dass das obige Kriterium (11-31) erfüllt wird. Q ist eine positiv semidefinite, R eine positiv definite jeweils symmetrische Bewertungsmatrix, die häufig in Diagonalform gewählt wird, S ist eine symmetrische positiv semidefinite Matrix, die den Endzustand bewertet. Das Problem hierbei besteht in der günstigen Wahl dieser drei Matrizen. Hierbei sollten weniger mathematische als vielmehr ingenieurmäßige Gesichtspunkte berücksichtigt werden. Als optimale Reglermatrix ergibt sich bei der Lösung dieser Aufgabe F∗ = R−1 BT K ,
(11-33)
wobei K die positiv definite, symmetrische und zeitlich konstante Lösungsmatrix der algebraischen Matrix-Riccati-Gleichung K A + AT K − KBR−1 BT K + Q = 0
(11-34)
ist. Die Lösung lässt sich mittels MATLAB [4] einfach ermitteln. 11.4.6 Das Messproblem
Bis jetzt wurde bei der Reglersynthese vorausgesetzt, dass alle Zustandsgrößen messbar sind. In vielen Fällen stehen jedoch die Zustandsgrößen nicht unmittelbar zur Verfügung. Oft sind sie auch nur reine Rechengrößen und damit nicht direkt messbar. In diesen Fällen verwendet man einen so genannten Beobachter, der aus den gemessenen Stell- und Ausgangsgrößen einen Näherungswert xˆ (t) für den Zustandsvektor x(t) liefert. Dieser Näherungswert xˆ (t) konvergiert im Falle deterministischer Signale gegen den wahren Wert x(t), d. h., es gilt lim [x(t) − xˆ (t)] = 0 .
t→∞
(11-35)
Die so entstehende Struktur eines Zustandsreglers mit Beobachter zeigt Bild 11-2. Für den Entwurf eines Beobachters eignen sich ähnlich wie beim Reglerentwurf Verfahren der Polvorgabe [1].
Bild 11-2. Zustandsregler mit Beobachter
Die Anordnung eines Zustandsbeobachters in Form eines Identitätsbeobachters (der im Wesentlichen ein Modell der Regelstrecke darstellt) zeigt Bild 11-3. Dabei erhält die Reglermatrix F als Eingangsgröße anstelle von x den geschätzten Zustandsvektor xˆ . Das Gesamtsystem besitzt nun die Ordnung 2n. Das Gesamtsystem kann durch folgende Zustandsraumdarstellung für die beiden Teilsysteme direkt anhand von Bild 11-3 angegeben werden: x˙ˆ ( A − BF) BF xˆ BV = + w, e˙˜ 0 ( A − FB C) e˜ 0 (11-36) wobei e˜ = x − xˆ als Rekonstruktionsfehler oder Schätzfehler bezeichnet wird. Zur Untersuchung der Stabilität des Gesamtsystems verwendet man die charakteristische Gleichung ( A − BF) BF PG (s) = sI − 0 ( A − FB C) sI − ( A − BF) −BF = =0. 0 sI − ( A − FB C) Hieraus folgt schließlich PG (s) = |sI − A + BF| · |sI − A + FB C| = P(s)PB (s) = 0 ,
(11-37)
wobei P(s) die charakteristische Gleichung des geschlossenen Regelsystems ohne Beobachter und PB (s) die charakteristische Gleichung des Beobachters darstellt. Gleichung (11-37) enthält als wichtige Aussage das Separationsprinzip: Sofern das durch die Matrizen A, B, C vorgegebene offene System vollständig steuerbar und beobachtbar ist, können die n Eigenwerte der charakteristischen Gleichung des Beobachters und die n Eigenwerte der charakteristischen Gleichung des
I79
I80
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 11-3. Geschlossenes Regelsystem mit Zu-
standsbeobachter
geschlossenen Regelsystems (ohne Beobachter) separat vorgegeben werden. Anders formuliert besagt das Separationsprinzip auch, dass das Gesamtsystem stabil ist, sofern der Beobachter und das geschlossene Regelsystem (ohne Beobachter) je für sich stabil sind. Hieraus folgt, dass stets eine Reglermatrix F durch eine gewünschte Polvorgabe so entworfen werden kann, als ob alle Zustandsgrößen messbar wären. Dann kann in einem getrennten Entwurfsschritt durch entsprechende Polvorgabe der Beobachter ermittelt werden, wobei im Allgemeinen die Beobachterpole etwas links von den Polen des geschlossenen Regelsystems gewählt werden. Die hier dargestellten optimalen Entwurfsverfahren für Zustandsregler lassen sich z. B. durch Ausgangsrückführungen erweitern und modifizieren, sodass sie auch direkt für Störgrößen- und Führungsgrößenregelungen eingesetzt werden können [3].
Messung der Zeitverläufe der Ein- und Ausgangssignale eine deterministische oder statistische Auswertung mit dem Ziel der Ermittlung eines mathematischen Modells anschließt.
12.1 Deterministische Verfahren zur Systemidentifikation Bei diesen Verfahren werden bestimmte leicht reproduzierbare Testsignale zur Erregung der Eingangsgrößen eines dynamischen Systems verwendet. Die Auswertung des zugehörigen Ausgangssignals ermöglicht dann meist eine einfache Ermittlung eines mathematischen Modells. Als Testsignale werden gewöhnlich sprungförmige, rechteckimpulsförmige, rampenförmige oder sinusförmige Signale verwendet [1]. Speziell für aperiodische Übergangsfunktionen kann die Identifikation schnell und meist mit hinreichender Genauigkeit durchgeführt werden.
12 Systemidentifikation
12.1.1 Wendetangentenund Zeitprozentkennwerte-Verfahren
Die Systemidentifikation hat zum Ziel, für ein dynamisches System, z. B. die Regelstrecke, ein mathematisches Modell zu ermitteln. Dies kann einerseits durch Beschreibung der in einem System sich abspielenden Elementarvorgänge mittels physikalischer Gesetzmäßigkeiten, z. B. mit Bilanzgleichungen, erfolgen. Andererseits besteht aber bei einer experimentellen Identifikation die Möglichkeit, einfacher, schneller und hinreichend genau ein für regelungstechnische Zwecke geeignetes mathematisches Modell zur Beschreibung des Eingangs-Ausgangs-Verhaltens eines Übertragungssystems zu ermitteln, wobei sich an die
Bei diesen Verfahren wird versucht, eine vorgegebene Übergangsfunktion h0 (t) durch bekannte einfache Übertragungsglieder anzunähern, wobei die Modellstruktur gewöhnlich angenommen wird und die darin enthaltenen Koeffizienten zu bestimmen sind. Als Zeitprozentkennwert wird der Zeitpunkt tm bezeichnet, bei dem h0 (tm )/K jeweils den Wert m% des stationären Endwertes bei 100% erreicht, wobei K den Verstärkungsfaktor des Systems darstellt. Bei der Wendetangentenkonstruktion ergeben sich aus h0 (t) als Systemkennwerte die Verzugszeit T u und die Anstiegszeit T a . Liegt für eine PTn -Regelstrecke (bestehend
12 Systemidentifikation
Bild 12-1. Diagramm zur Umrechnung der Verzugszeit T u
und der Anstiegszeit T a auf die Einzelzeitkonstanten T 1 und T 2
aus n hintereinander geschalteten PT1 -gliedern) eine gemessene Übergangsfunktion vor, so kann aus dem Verhältnis T a /T u der Wendetangentenkonstruktion (siehe Bild 12-1) beurteilt werden, ob sie sich zu einer Approximation durch ein PT2 -Glied mit G(s) =
K (1 + T 1 s)(1 + T 2 s)
(12-1)
Bild 12-2. Bezogene Zeitprozentkennwerte für das mathematische Modell gemäß (12-2) in Abhängigkeit von der
Systemordnung n eignet. Dies ist möglich für T a /T u 9,64. Durch die Approximation mittels eines PTn -Gliedes mit gleichen Zeitkonstanten, G(s) = K/(1 + T s)n ,
(12-2)
lassen sich Übergangsfunktionen auch mit wesentlich kleineren T a /T u -Werten anhand von Tabelle 12-1 und
I81
I82
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 12-1. Zur Approximation einer Übergangsfunktion durch ein mathematisches Modell gemäß (12-2)
n 1 2 3 4 5
T a /T 1 2,72 3,70 4,46 5,12
T a /T u ∞ 9,65 4,59 3,13 2,44
n 6 7 8 9 10
T a /T 5,70 6,23 6,71 7,16 7,59
T a /T u 2,03 1,75 1,56 1,41 1,29
antwort h∗ (t) und somit gilt definitionsgemäß für die Übergangsfunktion h(t) = h∗ (t)/K ∗ . Der exakte Zusammenhang zwischen h(t) und dem Realteil R(ω) und Imaginärteil I(ω) von G( jω) lautet: "∞ R(ω) = ω
G(s) =
K , (1 + T s)(1 + μT s)n−1
(12-3)
im Bereich n = 1, 2, . . . , 6 und 1/20 μ 20 durchgeführt wird [2]. 12.1.2 Identifikation im Frequenzbereich
Mithilfe des oben dargestellten FrequenzkennlinienVerfahrens (Bode-Diagramm) lässt sich für einen gemessenen Frequenzgang bei minimalphasigen Systemen bereits aus dem Verlauf des Amplitudenganges durch grafische Ermittlung der Eckfrequenzen ein gutes mathematisches Modell herleiten. Allgemein und auch bei nichtminimalphasigen Systemen anwendbar sind Verfahren, mit deren Hilfe der gemessene Verlauf z. B. der Ortskurve durch eine gebrochen rationale Funktion approximiert wird [3]. 12.1.3 Berechnung des Frequenzganges aus der Übergangsfunktion [4]
Wird ein Regelkreisglied durch eine Sprungfunktion der Höhe K ∗ erregt, dann erhält man die Sprung-
(12-4a)
h(t) cos ωt dt .
(12-4b)
0
"∞ I(ω) = ω
der Wendetangentenkonstruktion durch (12-2) gut annähern. Da die Wendetangentenkonstruktion oft nicht hinreichend genau durchgeführt werden kann, wird man in vielen Fällen besser die genauer ablesbaren Zeitprozentkennwerte benutzen. Für das mathematische Modell gemäß (12-2) sind im Bild 12-2 die entsprechenden bezogenen Zeitprozentkennwerte in Abhängigkeit von n dargestellt. Sehr gute Ergebnisse liefert eine weitere Zeitprozentkennwertmethode, bei der die Approximation mit einem PTn -Glied mit zwei unterschiedlichen Zeitkonstanten,
h(t) sin ωt dt
0
und daraus folgt durch Approximation ⎡ ⎤ N ⎥⎥ 1 1 ⎢⎢⎢⎢ pν sin(ων Δt)⎥⎥⎥⎦ R(ω) ≈ ∗ ⎢⎣h0 − K ωΔt ν=0 ⎡ ⎤ N ⎥⎥ 1 ⎢⎢⎢⎢ 1 I(ω) ≈ ∗ ⎢⎣ pν cos(ων Δt)⎥⎥⎥⎦ , K ωΔt ν=0
(12-5a)
(12-5b)
wenn man die Übergangsfunktion in N + 2 Punkten, also im Intervall t0 t tN+1 , durch einen Geradenzug stückweise in äquidistanten Zeitintervallen Δt approximiert. Dabei gilt für die Hilfsgröße h1 − h0 für ν = 0 pν = hν−1 − 2hν + hν+1 für ν = 1, 2, . . . , N , wobei die Werte hi (i = 0, 1, . . . , N + 1) direkt aus h(t) abgelesen werden. Dieses Verfahren kann für jede beliebige Übergangsfunktion angewandt werden, die sich für t → ∞ einer Geraden mit beliebiger endlicher Steigung nähert. Das Verfahren lässt sich für beliebige Eingangssignale erweitern [1]. 12.1.4 Berechnung der Übergangsfunktion aus dem Frequenzgang [5]
Zwischen der Übergangsfunktion h(t) und dem Frequenzgang G( jω) = R(ω) + jI(ω) besteht der exakte Zusammenhang [1]: 2 h(t) = R(0) + π
"∞ 0
I(ω) cos ωt dω , ω
t > 0 (12-6a)
oder 2 h(t) = π
"∞ 0
R(ω) sin ωt dω , ω
t>0.
(12-6b)
12 Systemidentifikation
Verwendet man z. B. (12-6a), so wird der Verlauf von v(ω) =
I(ω) , ω
ω 0,
v(0) ∞ ,
(12-7)
als gegeben vorausgesetzt. Durch einen Geradenzug wird v(ω) im Bereich 0 ω ωN so approximiert, dass für ω ωN der Verlauf von v(ω) ≈ 0 wird. Dann folgt für die Übergangsfunktion unter Verwendung von (12-6a) die Approximation N 2 h(t) ≈ R(0) − 2 bν cos ων t , πt ν=0
t>0,
(12-8)
mit
⎧ v −v 1 0 ⎪ ⎪ ; ω0 = 0 für ν = 0 ⎪ ⎪ ⎪ ⎨ ω1 − ω0 bv = ⎪ . ⎪ vν+1 − vν vν − vν−1 ⎪ ⎪ ⎪ − für ν = 1, 2, . . . , N ⎩ ων+1 − ων ων − ων−1
Die Werte von vν (ν = 0, 1, . . . , N) werden dabei direkt aus dem Verlauf von v(ω) bei geeignet gewählten Frequenzwerten ω = ων entnommen, wobei vN = vN+1 = 0 gewählt wird.
12.2 Statistische Verfahren zur Systemidentifikation [6] Bei stochastisch gestörten Regelsystemen kann meist die Voraussetzung gemacht werden, dass der stochastische Prozess stationär und ergodisch ist. Dies bedeutet einerseits, dass die Berechnung der die Signale beschreibenden Verteilungs- und Dichtefunktionen unabhängig vom gewählten Anfangszeitpunkt der Messung ist, und andererseits, dass die über ein Ensemble von gleichartigen Messungen gebildeten Erwartungswerte mit den zeitlichen Mittelwerten jeder einzelnen Messung übereinstimmen. Unter diesen Voraussetzungen kann für ein Regelkreisglied aus den stochastischen Signalverläufen der Ein- und Ausgangsgröße ein mathematisches Modell für das Übertragungsverhalten bestimmt werden.
und die Kreuzkorrelationsfunktion (KKF) "T 1 x(t)y(t + τ) dt R xy (τ) = lim T →∞ 2T
(12-10)
−T
beschreiben die gegenseitige Abhängigkeit bzw. den Verwandtschaftsgrad zwischen x(t) und x(t + τ) bzw. y(t + τ). Diese Funktionen haben folgende Eigenschaften: (12-11) a) R xx (τ) = R xx (−τ) . (12-12) b) R xx (0) R xx (τ) . R xx (0) beschreibt die mittlere Signalleistung von x(t). c) Für verschwindenden Mittelwert von x(t) gilt bei nicht periodischen Signalen (12-13) lim R xx (τ) = 0 . τ→∞
d) Für das stochastische Signal v(t) = x(t) + A cos(ωt + ϑ) ω 0 folgt A2 cos ωτ , Rvv (τ) = R xx (τ) + 2 und für v(t) = x(t) + A0 ergibt sich Rvv (τ) = R xx (τ) + A20 . g) R xy (τ) = Ryx (−τ) . h) Sofern x(t) oder y(t) mittelwertfrei ist, gilt lim R xy (τ) = 0 . τ→±∞
(12-14) (12-15) (12-16) (12-17)
Die AKF und KKF sind leicht messbare Funktionen. Sie können entweder mit einer digitalen Messwerterfassungsanlage oder mit einem speziellen Korrelator ermittelt werden. 12.2.2 Spektrale Leistungsdichte
Die spektrale Leistungsdichte eines Signals x(t) (auch als Leistungsdichtespektrum oder Leistungsspektrum bezeichnet) ergibt sich formal aus der Fourier-Transformation von R xx (τ), also "∞ S xx (ω) = F {R xx (τ)} = 2 R xx (τ) cos ωτ dτ . (12-18) 0
12.2.1 Korrelationsanalyse
Die Autokorrelationsfunktion (AKF) 1 R xx (τ) = lim T →∞ 2T
"T x(t)x(t + τ) dt −T
(12-9)
Durch inverse Fourier-Transformation erhält man umgekehrt "∞ 1 −1 R xx (τ) = F {S xx (ω)} = S xx (ω) cos ωτ dω. π 0
(12-19)
I83
I84
I Regelungs- und Steuerungstechnik / Regelungstechnik
In entsprechender Weise kann für die KKF zwischen zwei stochastischen Signalen x(t) und y(t) das Kreuzleistungsspektrum "∞ S xy ( jω) = F {R xy (τ)} =
R xy (τ) e−jωτ dτ (12-20)
−∞
mit 1 R xy (τ) = F {S xy ( jω)} = 2π −1
Suy ( jω) = Suu (ω)G( jω)
"∞ S xy ( jω) e
jωτ
dω
−∞
(12-21) definiert werden. Da gewöhnlich R xy (τ) keine gerade Funktion ist, stellt S xy im Gegensatz zu S xx eine komplexe Funktion dar.
Für ein lineares dynamisches System mit dem stochastischen Eingangssignal u(t) und dem stochastischen Ausgangssignal y(t) lässt sich über das Faltungsintegral unter Verwendung der oben definierten Korrelationsfunktionen folgende grundlegende Beziehung angeben: "∞ Ruu (τ − σ)g(σ) dσ ,
(12-22)
0
wobei g(·) die Gewichtsfunktion des Systems beschreibt. Diese wichtige Beziehung bietet die Möglichkeit, bei bekannter AKF Ruu (τ) und KKF Ruy (τ) durch eine Entfaltung von (12-22) die das untersuchte System beschreibende Gewichtsfunktion zu ermitteln. Ein wichtiger Sonderfall von (12-22) liegt dann vor, wenn das erregende Eingangssignal u(t) des untersuchten Systems als ideales weißes Rauschen beschrieben werden kann. Dann gilt für Ruu (τ) = δ(τ), und somit folgt aus (12-22) aufgrund der Ausblendeigenschaft der δ-Funktion "∞ Ruy (τ) =
δ(τ − σ)g(σ) dσ = g(τ) .
(12-23)
0
Dies bedeutet, dass hier die Messung der KKF identisch ist mit der Messung von g(t). Verschiedene Signale, insbesondere quantisierte zwei- und dreistufige
(12-24)
darzustellen. Liegen die Spektren Suy ( jω) oder Suu (ω) vor, z. B. indem die zugehörige AKF und KKF numerisch transformiert wurden, so lässt sich aus (12-24) der Frequenzgang des untersuchten Systems in nichtparametrischer Form G( jω) = Suy ( jω)/Suu (ω)
12.2.3 Statistische Bestimmung dynamischer Eigenschaften linearer Systeme
Ruy (τ) =
Signale (binäre und ternäre Signale), stehen zur Realisierung eines angenähert weißen Rauschsignals zur Verfügung. Mit diesen lässt sich (12-23) leicht realisieren. Für beliebige Rauschsignale u(t) und y(t) ist es häufig zweckmäßig, (12-22) durch eine FourierTransformation im Frequenzbereich in der Form
(12-25)
berechnen. In diesem Zusammenhang ist eine zweite Beziehung für die Berechnung des Betrages des Frequenzganges wichtig: S yy (ω) = |G( jω)|2 Suu (ω) .
(12-26)
Bei Systemen mit minimalphasigem Verhalten lässt sich dazu auch der Phasengang ϕ(ω) von G( jω) ermitteln. Die für die Messung von Frequenzgängen eingesetzten Frequenzgangmessplätze beruhen auf dem Prinzip einer Kreuzkorrelationsmessung [6]. Wird das untersuchte System am Eingang sinusförmig erregt, dann erhält man für die betreffende Erregerfrequenz ω den Real- und Imaginärteil R(ω) und I(ω) von G( jω) durch die Messung der KKF-Werte R(ω) = Ruy (0) , # π $ I(ω) = Ruy − . 2ω
(12-27a) (12-27b)
12.2.4 Systemidentifikation mittels Parameterschätzverfahren
Gegeben sind zusammenhängende Datensätze oder Messungen des zeitlichen Verlaufs der Ein- und Ausgangssignale u(t) und y(t) eines dynamischen Systems. Gesucht sind Struktur und Parameter eines geeigneten mathematischen Modells. Zur Lösung dieser Aufgabe wird meist die Modellstruktur festgelegt und
12 Systemidentifikation
dann werden die zugehörenden Parameter geschätzt. Durch Strukturprüfverfahren lässt sich die günstigste Form des Modells überprüfen. Für Parameterschätzverfahren werden gerne mathematische Modelle in diskreter Form gewählt. Dies erscheint zumindest im Hinblick auf die numerische Behandlung zweckmäßig. Bei der Parameterschätzung geht man gewöhnlich von der Vorstellung aus, dass dem tatsächlichen (zu identifizierenden) System ein Modell möglichst gleicher Struktur und mit zusätzlich noch frei einstellbaren Parametern, die in dem Parametervektor p zusammengefasst werden, parallel geschaltet sei. Beide Systeme werden durch u(t) erregt. Die Qualität des Modells wird durch Vergleich der Ausgangsgrößen y und yM , also durch den Modellausgangsfehler e∗ (k) = y(k) − yM (k)
(12-28)
überprüft. Das messbare Ausgangssignal y(k) = ys (k) + rs (k)
(12-29)
setzt sich aus dem ungestörten Ausgangssignal ys (k) und dem stochastischen Störsignal rs (k) zusammen. Das parallel geschaltete Modell wird durch die Differenzengleichung yM (k) = −
n ν=1
aν yM (k − ν) +
n
bν u(k − ν) (12-30a)
ν=0
bzw. durch die zugehörige Übertragungsfunktion Z {yM (k)} YM (z) = GM (z) = Z {u(k)} U(z) B(z−1 ) b0 + b1 z−1 + . . . + bn z−n = = −1 −n 1 + a1 z + . . . + an z A(z−1 ) (12-30b) beschrieben, wobei die Modellparameter aν und bν identifiziert (geschätzt) werden müssen. Der Modellausgangsfehler e∗ (k) wird gewöhnlich für das angepasste Modell nur dann verschwinden oder minimal werden, wenn das Modell einen zusätzlichen Teil für die Nachbildung des stochastischen Störsignals rs (k) besitzt (Bild 12-3), der durch die Übertragungsfunktion Gr (z) = RM (z)/E (z)
(12-31)
Bild 12-3. Vollständige Modellstruktur für das System und das stochastische Störsignal
beschrieben wird. Dieses Störmodell erzeugt das stochastische Störsignal rM (k) durch Filterung von diskretem weißen Rauschen ε(k), dessen Mittelwert Null ist. Im Fall der vollständigen Anpassung gilt dann y(k) = yM (k) + rM (k) ,
(12-32)
oder im z-Bereich Y(z) = YM (z) + Gr (z)E (z) bzw. mit Gr (z) = G∗r (z)/A(z−1 ) und (12-30b) in der meist gebräuchlicheren Form A(z−1 )Y(z) − B(z−1 )U(z) = G∗r (z)E (z) = V(z) , (12-33) wobei v(k) = Z −1 [V(z)] ein autokorreliertes (farbiges) Rauschsignal ist. Mit G∗r (z) = V(z)/E (z) = C(z−1 )
(12-34)
stellt (12-33) die allgemeine Form eines ARMAXModells (auto-regressive moving average with exogenious variable) dar. Durch spezielle Wahl von G∗r (z) lassen sich damit direkt die wichtigsten Modellstrukturen zur Parameterschätzung angeben [6]. Das LS-Verfahren (Verfahren der kleinsten Quadrate, least squares) erhält man z. B. für G∗r (z) = 1 als ARX-Modellstruktur. Für dieses Verfahren folgt aus (12-33) durch inverse z-Transformation y(k) = mT (k) p + ε(k) mit dem Datenvektor
(12-35)
mT (k) = [−y(k − 1) . . . − y(k − n)|u(k − 1) . . . u(k − n)]T und dem Parametervektor p = [a1 . . . an |b1 . . . bn ]T ,
I85
I86
I Regelungs- und Steuerungstechnik / Regelungstechnik
wobei b0 = 0 gesetzt wurde (d. h., es werden nichtsprungförmige Systeme betrachtet). Die Minimierung von n+N 1 1 2 ! ε (k) = εT (N)ε(N) = Min (12-36) I( p) = 2 k=n+1 2
liefert mit (12-35) als direkte analytische Lösung des Schätzproblems pˆ ≡ pˆ (N) = [MT (N)M(N)]−1 MT (N)y(N) (12-37) aufgrund der endlichen Anzahl N der Messdaten, wobei
und
⎡ T ⎤ ⎡ ⎤ ⎢⎢⎢ m (n + 1) ⎥⎥⎥ ⎢⎢⎢ y(n + 1) ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎢⎢⎢ . ⎥⎥⎥ ⎥⎥⎥ , y(N) = ⎢⎢⎢ .. ⎥⎥⎥ M(N) = ⎢⎢⎢⎢ .. ⎥⎥⎦ ⎢⎢⎣ ⎥⎥⎦ ⎢⎣ mT (n + N) y(n + N) ⎡ ⎤ ⎢⎢⎢ ε(n + 1) ⎥⎥⎥ ⎢⎢ . ⎥⎥⎥⎥ ε(N) = ⎢⎢⎢⎢⎢ .. ⎥⎥⎥ ⎢⎣ ⎥⎦ ε(n + N)
die Datenmatrix der Messwerte von u(k) und y(k), sowie y(N) und ε(N) entsprechende Vektoren darstellen. Die Schätzung gemäß (12-37) ist konsistent. Der Parametervektor pˆ lässt sich auch durch eine rekursive Lösung bestimmen (RLS-Verfahren): pˆ(k + 1) = p(k) + q(k + 1)ε(k ˆ + 1) q(k + 1) =
P(k)m(k + 1) 1 + mT (k + 1)P(k)m(k + 1)
(12-38a) (12-38b)
P(k + 1) = P(k) − q(k + 1)mT (k + 1)P(k) (12-38c) ε(k ˆ + 1) = y(k + 1) − mT (k + 1) pˆ(k) .
(12-38d)
Bei dieser Lösung kann man nach einer gewissen Anlaufphase eine ständige Schätzung der Parameter zu jedem Zeitpunkt (k + 1) unter Verwendung der um einen Zeitpunkt zurückliegenden Information erhalten. Dem Vorteil, dass die Inversion einer Matrix bei der rekursiven Lösung entfällt, steht als Nachteil die freie Wahl der Startwerte für pˆ(0) und P(0) (Kovarianzmatrix) gegenüber. Während gewöhnlich pˆ(0) = 0 gesetzt wird, sollte für P(0) = αI mit α = 104 gewählt werden.
13 Weitere Reglerentwurfsverfahren 13.1 Übersicht In den vorherigen Abschnitten wurden die wichtigsten klassischen Grundlagen zur Analyse und Synthese von Regelsystemen behandelt. Als wichtigste Regler wurden dabei der klassische PID-Regler sowie die aus ihm ableitbaren PI-, PD- und P-Regler und deren zweckmäßige Parametereinstellung eingeführt. Weiterhin wurden der Reglerentwurf nach dem Frequenzkennlinien- und dem WurzelortskurvenVerfahren sowie analytische Kompensationsverfahren zum Entwurf kontinuierlicher und zeitdiskreter linearer Regler vorgestellt. Auch die Arbeitsweise von Zwei- und Dreipunktregler wurde gezeigt. Schließlich wurde für lineare Mehrgrößenregestrecken ein Verfahren zum Entwurf eines Polvorgabe-Reglers und eines Zustandsbeobachters hergeleitet. Der beschränkte Umfang dieses Kapitels ließ es leider nicht zu, näher auf weitere wichtige klassische und insbesondere moderne Reglerentwurfsverfahren einzugehen. Dennoch wird nachfolgend versucht, auf einige der wichtigsten Verfahren hinzuweisen.
13.2 Einige weitere klassische Regelkreisstrukturen Klassische einschleifige Regelkreise können auch bei optimaler Auslegung besonders hohe Anforderungen bezüglich maximaler Überschwingweite, Anstiegszeit und Ausregelzeit bei Regelstrecken höherer Ordnung und eventuell vorhandener Totzeit häufig nicht erfüllen, insbesondere dann, wenn große Störungen und zwischen Stell- und Messglied große Verzögerungen auftreten. Eine Verbesserung des Regelverhaltens lässt sich jedoch erzielen, wenn die Signalwege zwischen Störung und Stelleingriff verkürzt werden, oder wenn Störungen bereits vor ihrem Eintritt in eine Regelstrecke weitgehend durch eine getrennte Vorregelung kompensiert werden, wozu allerdings die Störungen messbar und über ein Stellglied beeinflussbar sein müssen. Eine Verkürzung der Signalwege innerhalb eines Regelsystems führt zu einer strukturellen Erweiterung des Grundregelkreises und damit zu einem vermaschten Regelsystem. Nachfolgend werden einige dieser Regelkreisstruk-
13 Weitere Reglerentwurfsverfahren
turen erwähnt; bezüglich Details muss aber auf die tiefer gehende Fachliteratur zurückgegriffen werden. 13.2.1 Vermaschte Regelkreise
Störgrößenaufschaltung. Diese Struktur (Tabelle 13-1) besteht aus einem Regelkreis, dem eine Steuerglied (GST ) mit dem Ziel so überlagert wird, dass die Störung weitgehend durch dieses kompensiert wird, bevor sie sich voll auf die Regelgröße Y auswirkt. Diese Schaltung lässt sich jedoch nur dann realisieren, wenn die Störung Z am Eingang der Regelstrecke (GS ) messbar ist und somit im Steuerglied „verarbeitet“ werden kann. Das vom Steuerglied erzeugte Kompensationssignal kann dann entweder auf den Eingang des Reglers (GR ) oder auf die Stellgröße U aufgeschaltet werden. Regelsysteme mit Hilfsregelgröße. Bei Regelstrecken mit ausgeprägtem Verzögerungsverhalten kann häufig neben der eigentlichen Regelgröße Y eine Zwischengröße gemessen und als Hilfsregelgröße YH in einem Hilfsregler (GRH ) verwendet werden (Tabelle 13-1). Der dadurch entstehende Hilfsregelkreis besteht damit aus dem ersten Abschnitt der Regelstrecke (GS1 ) und diesem Hilfsregler. Das Ausgangssignal des Hilfsreglers wird mit negativem Vorzeichen dem Ausgangssignal des Hauptreglers zugeschaltet. Die so entstehende Stellgröße U wirkt wiederum auf den Eingang der Regelstrecke. Kaskadenregelung. Diese Regelung (Tabelle 13-1) kann als Sonderfall des Regelverfahrens mit Hilfsregelgröße betrachtet werden. Hierbei bildet der Hilfsregler (GR2 ) direkt die Stellgröße U am Eingang der Regelstrecke. Die Eingangsgröße des Hilfsreglers wird aus der Differenz zwischen dem Ausgangssignal des Hauptreglers und der Hilfsregelgröße YH gebildet. Es entsteht so ein Hauptregelkreis, dem der Hilfsregelkreis unterlagert ist. Störungen im ersten Regelstreckenabschnitt (GS1 ) werden durch den Hilfsregler bereits so weit ausgeregelt, dass sie im zweiten Regelstreckenabschnitt (GS2 ) gar nicht oder nur stark reduziert bemerkbar sind. Der Hauptregler (GR1 ) muss dann nur noch geringfügig eingreifen. Werden in einer Regelstrecke mehrere Hilfsregelgrößen gemessen und in unterlagerten Hilfsregelkreisen verarbeitet, so spricht man von Mehrfachkaskaden.
Regelsysteme mit Hilfsstellgröße (Tabelle 13-1). Einer Störung innerhalb zweier Regelstreckenabschnitte kann auch dadurch entgegengewirkt werden, indem außer der vom Hauptregler erzeugten Stellgröße U, die auf den ersten Regelstreckenabschnitt (GS1 ) wirkt, am Eingang des zweiten Regelstreckenabschnitts (GS2 ) eine Hilfsstellgröße UH aufgeschaltet wird. Dieses von einem Hilfsregler (GRH ) erzeugte Signal soll, möglichst nahe dem Eingriffsort der Störung durch den Einbau eines zusätzlichen Stellgliedes der Störung entgegenwirken. Der Hilfsregler ist dem Hauptregler parallel geschaltet und verarbeitet wie dieser dieselbe Regelabweichung. 13.2.2 Smith-Prädiktor
Dieser bereits 1959 vorgeschlagene Regler [1] (Tabelle 13-1) ist speziell zum Einsatz bei Regelstrecken mit aperiodischem Verhalten und großen Totzeiten geeignet. Für die Regelstrecke wird ein aus zwei in Reihe geschalteten Teilen (GM1 ) und (GM2 ) bestehendes Modell angesetzt, wobei das zweite Teilmodell nur die Totzeit nachbildet. Das Modell wird parallel zur Regelstrecke (GS ) geschaltet. Die zugehörende Regelungsstruktur besteht aus zwei Regelkreisen. Im inneren Regelkreis wird das erste Teilmodell (GM1 ) zur Bestimmung („Prädiktion“) der Modellausgangsgröße YM1 verwendet, die dem eigentlichen Regler (GR ) aufgeschaltet wird, der dann die Stellgröße U liefert und dafür sorgt, dass die Regelgröße Y dem Sollwert W folgt. Da dieser innere Regelkreis keine Totzeit enthält, sollte die Reglerverstärkung so groß gewählt werden, dass man schnelle, aber noch gut gedämpfte Einschwingvorgänge bei Sollwertänderungen erhält. Die Auswirkungen einer nicht messbarer Störung Z oder auch kleinerer Modellungenauigkeiten werden über den „Prädiktionsfehler“ Y − YM im äußeren Regelkreis korrigiert. Diese Regelungsstruktur, die keine eigentliche Signalprädiktion enthält kann auch angewandt werden bei Regelstrecken mit ausgeprägtem nichtminimalem Phasenverhalten und durch gewisse Modifikationen bei instabilen Regestrecken [2]. 13.2.3 IMC-Regler
Aus der in Tabelle 13-1 dargestellten Blockstruktur ist zu ersehen, dass ein Regelkreis mit IMC-Regler zwei identische Modelle (GM ) der Regelstrecke be-
I87
I88
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 13-1. Strukturen einiger wichtiger Regelkreisschaltungen (Bedeutung der Indizes der Übertragungsfunktionen Gi : ST Steuerglied; S Regelstrecke; SZ Störverhalten der Regelstrecke; M Modell; R Regler; RH Hilfsregler; 1 und 2 Teilregelstrecke/Teilmodell/Regler)
13 Weitere Reglerentwurfsverfahren
sitzt, von denen das eine parallel zur Regelstrecke das das andere in den direkten Rückkopplungszweig des Reglers (GR ) geschaltet ist. Die Stellgröße U dieses Reglers, der z. B. ein klassische PID-Verhalten aufweisen kann, wirkt sowohl auf die Regelstrecke (GS ) als auch auf beide Modelle. Fasst man nun GM in der Rückkopplung mit GR in einen Block zusammen, so erhält man den eigentlichen Internal Model Controller (IMC), der im Weiteren als IMC-Regler (GIMC ) bezeichnet werden soll. Das Kennzeichen dieses Reglers ist also, dass er intern ein Modell der Regelstrecke besitzt. Im Idealfall, wenn GM = GS wäre, würde die Störung Z direkt auf den Reglereingang wirken und könnte somit rasch beseitigt werden. Bei den normalerweise stets vorhandenen Modellunsicherheiten (Ungenauigkeiten und Parameteränderungen) ist ein systematischer Entwurf von GIMC erforderlich, der im wesentliche aus zwei Schritten besteht und einen zweckmäßigen Kompromiss zwischen Regelgüte und Robustheit darstellt. Im Schritt 1 wird im Falle einer stabilen Regelstrecke ein stabiler, kausaler Regler GIMC unter Vorgabe der Empfindlichkeitsfunktion S = 1/(1+G0 ), siehe auch (5-4) und (8-2) sowie deren Komplementärer T = G0 /(1 + G0 ), siehe auch (5-3) und (8-1), mit G0 = GRGS entworfen, z. B. auf der Basis eines Integralkriterium und unter Verwendung eines PID-Reglers für GR . Im Schritt 2 wird der entworfene Regler GIMC durch ein zugeschaltetes Filter so erweitert, dass seine Übertragungsfunktion proper wird, d. h. sie muss für |s| → ∞ den Wert null annehmen und liefert damit bei einer sprungförmigen Erregung ein nichtsprungfähiges Ausgangsverhalten. Häufig eignet sich als Filterübertragungsfunktion ein PTn -Glied nach (12-2) mit K = 1 und einstellbarer Zeitkonstante T . Der IMC-Regler wurde in zahlreichen Varianten sowohl für Eingrößensysteme oder SISO (Single-Input/Single-Output)-Systeme als auch Mehrgrößensysteme oder MIMO (Multi-Input/MultiOutput)-Systeme für stabile, nichtminimalphasige und instabile Regelstrecken entwickelt [3] und wird vor allem in der Verfahrenstechnik eingesetzt.
13.3 Robuste Regler Stabilität und Regelgüte sind zwei der wichtigsten Forderungen an eine Regelung (siehe 8.1). Eine ganz wesentliche weitere Forderung besteht darin, dass
Stabilität und Regelgüte auch dann gewährleistet werden, wenn in der Regelstrecke Unsicherheiten oder Änderungen, z. B. in den Parametern oder bei verschiedenen Arbeitspunkten, auftreten. Weitere Unsicherheiten können Ausfälle von Komponenten (Mess- oder Stellgliedern) darstellen. In allen diesen Situationen sollte ein robustes oder möglichst unempfindliches Regelsystem zuverlässig arbeiten. Seit den 1980er Jahren wurde dem Entwurf robuster Regler in Fachkreisen besondere Aufmerksamkeit gewidmet [4–6]. Bei der Lösung dieses Problems zeigte sich, dass die optimale Zustandsregelung (siehe 8) zur Formulierung der robusten Stabilität sich nicht eignete. Da etwa zur gleichen Zeit für die Analyse von MIMO-Systemen sich wesentliche Entwicklungen in der Frequenzbereichsdarstellung vollzogen, wie z. B. die Polynommatrizendarstellung von MIMO-Systemen oder auch die Erweiterungen von Wurzelortskurven, Nyquist- und Bode-Diagrammen auf MIMO-Systeme, lag es nahe, auch für das Robustheitsproblem Lösungen im Frequenzbereich zu formulieren. Zames [7] schlug zur Lösung des Problems der optimalen Unterdrückung einer ganzen Klasse von Störungen vor, nicht nur die Minimierung der Empfindlichkeitsfunktion S zu betrachten, sondern auch diese in geeigneter Weise zu optimieren. Das Minimierungsproblem von S ist mathematisch äquivalent mit dem Problem der Minimierung der Norm der Fehlerübertragungsfunktion. Zames führte dazu die so genannte H∞-Norm ein, deren optimaler Wert zum gewünschten robusten Regler führt, der auch als H∞-optimaler Regler bezeichnet wird und sowohl für SISO- als auch MIMO-Regelstrecken entworfen werden kann. Sofern keine geschlossene Lösung für dieses Problem möglich ist, empfiehlt sich die Anwendung der numerischen LMI (Linear Matrix Inequalities)-Technik [8]. Ein von Kharitonov bereits 1978 vorgestelltes Stabilitätskriterium ermöglicht auf der Basis von nur vier festen „charakteristischen Polynomen“ die Analyse und Synthese von linearen Regelsystemen mit großen Parameterunsicherheiten [9].
13.4 Modellbasierte prädiktive Regler Modellbasierte prädiktive(MBP)-Regler werden in der Praxis als digitale Regler realisiert. Sie
I89
I90
I Regelungs- und Steuerungstechnik / Regelungstechnik
verwenden gewöhnlich ein festes Modell der Regelstrecke im On-line-Betrieb, mit dessen Hilfe die zukünftigen Werte y(k + j|k) der Regelgröße y(k) für j = 1, 2, . . ., Nk zum Zeitpunkt k vorausberechnet, also prädiziert werden, wobei Nk den Prädiktionshorizont beschreibt. Die Prädiktion hängt jedoch nicht nur von dem Modellverhalten ab, sondern auch von den für j = 0, 1, 2, . . ., Nk−1 sich ergebenden Werten u(k + j|k) der Stellgröße. Optimale Stellgrößenwerte erhält man aus der Minimierung einer geeignet gewählten Gütefunktion, zweckmäßig einer quadratischen Summenfunktion, die bei diskreten Systemen einem der quadratischen Integral-Gütemaße in Tabelle 8-1 entspricht. Die zu minimierende Gütefunktion muss die Regelabweichung e(k) und den Stellaufwand, ähnlich wie I7 in Tabelle 8-1, berücksichtigen. Die Optimierungsaufgabe wird in jedem Abtastintervall – eventuell auch unter Berücksichtigung von Begrenzungen der Regelkreissignale – neu gelöst, jedoch wird von der berechneten optimalen Stellgrößenfolge gewöhnlich nur der erste Wert als Stellgröße im nächsten Abtastintervall verwendet. Diese Prozedur wird in derselben Weise im übernächsten Abtastintervall weitergeführt bis schließlich die Regelabweichung verschwindet. Da die hier beschriebene Optimierungsaufgabe nur selten analytisch gelöst werden kann, werden zur Lösung nummerische Verfahren eingesetzt. Die zahlreichen seit etwa 1980 vorgeschlagenen linearen MBP-Regler [10–12] unterscheiden sich im Wesentlichen durch die Art des Ansatzes für das gewählte Modell sowie durch die Wahl des Gütekriteriums und des numerischen Lösungswegs. Dennoch weisen sie viele Gemeinsamkeiten auf und können teilweise direkt ineinander übergeführt werden. Hinzu stehen MBP-Regler in einem engen Zusammenhang mit dem optimalen Zustandsregler (siehe 11.4.5) sowie mit dem IMC-Regler und dem Smith-Prädiktor, da sie ebenfalls – wie die beiden letztgenannten – sich besonders für Regelstrecken mit Totzeitverhalten eignen. Auch lassen sich MBP-Regler auf einfache Weise mittels einer Adaption des Regelstreckenmodells im laufenden Betrieb zu einem adaptiven Regelsystem (siehe 13.6) erweitern [13]. Mittels eines solchen adaptiven MBP-Reglers können dann auch zeitvariante und zahlreiche nichtlineare Regelstrecken beherrscht werden. Für allgemeine Nichtli-
nearitäten liegen ebenfalls entsprechende Entwurfskonzepte vor [14; 15]. In zahlreichen industriellen Anwendungen haben sich die MBP-Regler bewährt. Dies war möglich durch die Einführung dezentraler offener Strukturen bei Prozessleitsystemen (siehe 14), die charakterisiert sind durch eine horizontale und vertikale Durchgängigkeit und die Einbeziehung speicherprogrammierbarer Steuerungen und spezieller Controller, für die heute leistungsfähige Programmiersprachen für die Realisierung auch anspruchsvoller Regelalgorithmen zur Verfügung stehen (siehe 14.5.1).
13.5 GMV-Regler Dieser Regler basiert auf dem Minimum-Varianz (MV)-Regler [16], dessen Arbeitsweise als linearer diskreter stochastischer Regler darin besteht, die Varianz σe2 der Regelabweichung e(k + d ) bei einer Regelstrecke mit der Totzeit d bzw. den Erwartungswert E{e(k + d )} mittels einer zum Zeitpunkt k optimal ermittelten Stellgröße u(k) zu minimieren. Der MV-Regler stellt einen Spezialfall des verallgemeinerten (generalized) GMV-Reglers [17] dar, bei dem anstelle von σe2 jedoch die Varianz eines Signals ye (k + d) minimiert wird, das sich aus der Summe der gefilterten Regelgröße y(k), Stellgröße u(k) und Führungsgröße w(k) zusammensetzt. Die Filterung dieser Signale erfolgt über Polynome in z−1 , die in die Entwurfsgleichungen mit eingehen. Dieser Regler hat den Vorteil, dass er für stabile und instabile sowohl minimalphasige als auch nichtminimalphasige Regelstrecken eingesetzt werden kann. Sowohl der MV-Regler als auch der GMV-Regler basieren auf einer Einschritt-Vorhersage der Regelgröße und benötigen dazu ein explizites Modell der Regelstrecke und der Störgrößen, die auf die Regelstrecke einwirken, sowie die Kenntnis der aktuellen und zurückliegenden Messsignale der Einund Ausgangsgröße (im SISO-Fall) der Regelstrecke. Insofern existiert eine enge Verwandtschaft mit dem MBP-Regler, für den es übrigens eine äquivalente Verallgemeinerung, den GMBP-Regler, wie für den hier dargestellten GMV-Regler gibt. Dieser Regler kann ebenfalls wie der MBP-Regler bei unbekannter oder zeitvarianter Regelstrecke durch eine On-line-Identifikation mittels eines rekursiven
13 Weitere Reglerentwurfsverfahren
Parameterschätzverfahrens (siehe 12.2.4) zu einem adaptiven GMV-Regler [13] erweitert werden.
13.6 Adaptive Regler In einem adaptiven Regelsystem hat der Regler die Aufgabe, sich entweder an die unbekannten Eigenschaften einer invarianten Regelstrecke oder bei zeitvarianten Regelstrecken – bedingt z. B. durch unterschiedliche Arbeitsbedingungen, Störungen, Lastwechsel, Alterung usw. – selbsttätig im Sinne eines Optimierungskriteriums oder einer Einstellvorschrift anzupassen. Im ersten Fall erfolgt die Anpassung meist nur einmalig oder gelegentlich nach Bedarf, im zweiten Fall ist gewöhnlich eine ständige Anpassung des Reglers erforderlich. Diese selbsttätige Anpassung oder Adaption des Reglers erfolgt meist über dessen Parameter, seltener über die Reglerstruktur. Selbsteinstellend, selbstanpassend, selbstoptimierend oder gar selbstlernend sind nur häufig benutzte Synonyme für den Begriff „adaptiv“. Bei der adaptiven Regelung wird dem klassischen Grundregelkreis (Bild 5-1) ein Anpassungssystem überlagert, das aus den drei charakteristischen Teilprozessen Identifikation, Entscheidungsprozess und Modifikation gebildet wird. Die Identifikation erfolgt im „On-line“-Betrieb meist mittels rekursiver Parameterschätzverfahren (12.2.4) unter Verwendung der Ein- und Ausgangssignale der Regelstrecke. Dabei werden entweder die Parameter der Regelstrecke oder direkt diejenigen des Reglers bestimmt. Im Entscheidungsprozess wird mittels der bei der Identifikation erhaltenen Information der Regler auf der Basis vorgegebener Gütekriterien berechnet und seine Anpassung festgelegt. Je nach der Art der Anpassung unterscheidet man zwischen indirekter Adaption – sofern ein explizites Regelstreckenmodell dem Reglerentwurf zugrunde liegt – und direkter Adaption bei Umgehung dieses Zwischenschrittes. Die Modifikation stellt die Realisierung der Resultate des Entscheidungsprozesses dar. Dem Anpassungssystem kann noch ein Überwachungssystem überlagert werden, dessen Aufgabe in der Sicherstellung einer fehlerfreien Funktion des Gesamtsystems besteht. Adaptive Regelsysteme lassen sich entsprechend ihrer Struktur und Funktionsweise unterscheiden in Modellvergleichsverfahren, Self-tuning (ST)-Ver-
fahren und Verfahren der gesteuerten Adaption. Beim Modellvergleichsverfahren [18] wird meist dem Grundregelkreis ein paralleles, festes Modell zugeschaltet, welches das gewünschte Verhalten darstellt. Der Modellfehler, also die Differenz zwischen der Regelgröße und dem Modellausgangssignal, wird dem Adaptivregler zugeführt und von diesem gemäß einem Gütekriteriums minimiert. Der ST-Regler [19] arbeitet ohne Vergleichsmodell. Sein Entwurfsprinzip besteht in einer „On-line“-Reglersynthese für eine Regelstrecke, deren Parameter entweder ständig identifiziert werden oder direkt in den Reglerentwurf eingehen. Als Basis des Entwurfs eignen sich zahlreiche unterschiedliche Regler, z. B. MV-, GMV-, PID-Regler, Polvorgaberegler, optimale Zustandsregler u. a. Die gesteuerte Adaption [20] wird dann eingesetzt, wenn das Verhalten eines Regelsystems für unterschiedliche messbare Parameteränderungen und Störungen der Regelstrecke bekannt ist. Dann kann die zugehörige Regleradaption über eine zuvor berechnete feste Zuordnung ( parameter scheduling) ausgeführt werden. Adaptive Regelsysteme weisen stets eine nichtlineare Struktur auf. Dadurch bedingt stellte die Garantie ihrer Stabilität lange ein unbefriedigend gelöstes Problem dar, das aber heute als grundsätzlich gelöst betrachtet werden kann [21]. Neben der Lösung vieler signifikanter theoretischer Probleme haben die spektakulären Fortschritte der modernen Rechentechnik dazu geführt, dass viele adaptive Regler sich sehr erfolgreich in der industriellen Praxis bewährt haben. So reichen die Anwendungen vom einfachen, auf den Ziegler-Nichols-Regeln und einer Relaisumschaltung basierenden PID-ST-Regler (auch als Autotuning-Regler bezeichnet) [22] bis hin zur theoretisch anspruchsvollen adaptiven dualen Regelung [23], bei der die Parameterunsicherheit durch eine „vorsichtige“ Systemkomponente sowie eine ständige Erregungskomponente zur besseren Identifikation im Regelgesetz berücksichtigt werden.
13.7 Nichtlineare Regler Neben den klassischen Methoden zur Analyse und Synthese nichtlinearer Regelsysteme soll nachfolgend auf einige der neueren Entwurfsverfahren für nichtlineare Regler noch kurz eingegangen werden.
I91
I92
I Regelungs- und Steuerungstechnik / Steuerungstechnik
Die Singular perturbation-Methode [24] wird schon länger zur Vereinfachung des Entwurfs nichtlinearer Regler eingesetzt. Sie ist dann anwendbar, wenn das dynamische Verhalten der Regelstrecke durch zwei unterschiedliche Zeitmaßstäbe beschrieben werden kann, z. B. erfolgt beim Flugzeug ein relativ langsamer Regeleingriff bei Reisegeschwindigkeit und eine schnellere Reaktion beim Manöverflug. Der Reglerentwurf erfolgt dann in zwei Schritten: Zunächst wird ein Regler für das langsame Verhalten entworfen, dann erfolgt der Entwurf für das schnelle Verhalten. Der gesamte Regler setzt sich dann aus beiden Teilreglern zusammen. Ein anderer nichtlinearer Regler ist der Sliding-mode (SM)-Regler, auch als Variable Structure (VS)Regler bezeichnet. Dieser Regler [25; 26] arbeitet diskontinuierlich als spezieller Zweipunktregler, der aufgrund äußerer Signale seine Struktur umschaltet, um ein gewünschtes Regelverhalten zu erzielen. Die Aufgabe eines SM-Reglers besteht darin, den Zustandsvektor x des betreffenden Regelsystems entlang einer Trajektorie auf die Schaltebene σ(x) = 0 zu bringen, um ihn dann auf dieser in den Ursprung des Zustandsraumes gleiten zu lassen, der nun dem gewünschten Sollwert entspricht. Die Dynamik der zugehörigen Regelstrecke beeinflusst das Regelverhalten im Gleitzustand nicht. Zur Ermittlung der Schaltfunktion σ(x) existieren verschiedene Methoden. Dieser Regler hat sich aufgrund seiner Robustheit und Unempfindlichkeit gegenüber Parameteränderungen der Regelstrecke und äußeren Störungen in der Praxis besonders bewährt. Die nichtlineare differenzial-geometrische Methode [27], die im Wesentlichen seit Anfang der 1990er Jahre entwickelt wurde, liefert interessante Möglichkeiten zur Stabilitätsanalyse und Untersuchung der Steuerbarkeit und Beobachtbarkeit nichtlinearer Systeme. Diese Methode ist aber nur anwendbar bei Systemen, deren Nichtlinearität stetig differenzierbar ist. Diese Voraussetzung ist jedoch bei vielen Nichtlinearitäten, wie z. B. bei fast allen in Tabelle 9-1 aufgelisteten Kennlinien, nicht gegeben. Andererseits liefert diese Methode die Basis der exakten Linearisierungsmethode, die oft auch als externe Linearisierung mittels Zustands- und Ausgangsrückführung bezeichnet wird. Durch Anwendung dieser Methode können einige nichtlineare
Systeme in ein äquivalentes lineares System gleicher Ordnung übergeführt werden. Dies wird erreicht durch eine nichtlineare Koordinatentransformation sowie einer daraus resultierenden nichtlinearen Rückkopplung. Dann kann im nächsten Schritt für das exakt linearisierte System ein linearer Regler entworfen werden. Leider ist diese Methode nur auf wenige nichtlineare Systeme anwendbar. Größere praktische Bedeutung haben jedoch die in letzter Zeit entwickelten angenäherten Linearisierungsmethoden erlangt. Verschiedene Verfahren stehen hierfür zur Verfügung, doch der erforderliche Rechenaufwand ist teilweise sehr groß.
13.8 „Intelligente“ Regler Expertensysteme oder wissensbasierte Systeme (WBS) werden seit den 1980er Jahren zur Regelung technischer Anlagen eingesetzt. Generell handelt es sich bei diesen Systemen um intelligente Rechenprogramme, die ein detailliertes Wissen auf einem eng begrenzten Spezialgebiet gespeichert haben und Entscheidungsregeln enthalten, sowie die Fähigkeit besitzen, logische Schlussfolgerungen zu ziehen ähnlich der Arbeitsweise eines menschliche Experten. Ein WBS kann sowohl für Überwachungsfunktionen in komplexen Automatisierungssystemen als auch direkt im geschlossenen Regelkreis als spezieller Regler eingesetzt werden. Der Fuzzy-Regler kann als ein spezielles Realzeit-WBS interpretiert werden. Bei diesem Regler [28] muss das Expertenwissen des Regelungsingenieurs in eine Reihe von Handlungsanweisungen in Form bestimmter Regeln, auch als Regelbasis bezeichnet, zur Verfügung gestellt werden. Der Fuzzy-Regler arbeitet intern mit Operatoren, z. B. „WENN“, „UND“ und „DANN“, sowie den (unscharfen) Fuzzy-Variablen, wie z. B. groß, klein, mittel. Die gewünschte Arbeitsweise lässt sich leicht als Rechenalgorithmus darstellen. Das analoge Eingangssignal dieses Reglers muss zunächst einer Fuzzifizierung unterzogen werden, während das Ausgangssignal erst über eine Defuzzifizierung die Stellgröße liefert. Während früher der Entwurf eines Fuzzy-Reglers meist heuristisch erfolgte, verwendet man heute bewährte systematische Entwurfsmethoden, die auch eine vielseitige Kombination dieses Reglers mit anderen Regelungskonzepten,
14 Binäre Steuerungstechnik
z. B. adaptiven und prädiktiven Reglern oder Slidingmode-Reglern, ermöglichen. Fuzzy-Regler stellen eine wertvolle Ergänzung zu den klassischen Regelverfahren dar. Durch ihre universale Approximationseigenschaft erweisen sie sich als besonders geeignet zur Regelung nichtlinearer Regelstrecken. Auch künstlich neuronale Netzwerke (KNN) weisen als Hauptmerkmal eine universale Approximationsfähigkeit [29] auf. Sie sind daher besonders für die Regelung von linearen und nichtlinearen Regelstrecken mit unbekannter Struktur geeignet. Ein KNN besitzt die Eigenschaften der Lernfähigkeit und Adaption und wird daher in einer Trainingsphase dazu benutzt, anhand von Messwerten der Ein- und Ausgangssignale einer Regelstrecke ein dynamisches Modell derselben zu erstellen. Aber auch im On-line-Betrieb lässt sich ein KNN zur ständigen Identifikation einer stark zeitvarianten Regelstrecke oder zur Fehlerüberwachung einsetzen. Dann ist es möglich, einen geeigneten modellbasierten Regler unter Verwendung eines weiteren KNN zu entwerfen. Sowohl durch die in den letzten Jahren entwickelten speziellen, sehr
schnellen und effizienten Lernalgorithmen als auch durch die Verfügbarkeit enormer prozessnaher Rechnerleistung haben KNN-Regler eine große Bedeutung in der industriellen Praxis erlangt. Zum Abschluss soll noch erwähnt werden, dass KNN und Fuzzy-Systeme viele gemeinsame Eigenschaften aufweisen und daher auch – bei bestimmten Konfigurationen – unter dem Begriff der NeuroFuzzy-Systeme [30] zusammengefasst werden können, z. B. lässt sich zeigen, dass ein auf radialen Basis-Funktionen (RBF) beruhendes KNN als Spezialfall eines Fuzzy-Systems betrachtet werden kann. Neuro-Fuzzy-Regler werden u. a. in der Robotik mit Erfolg eingesetzt. Im Zusammenhang mit Fuzzy-, Neuro-Fuzzy- und KNN-Reglern taucht seit kurzer Zeit immer häufiger auch der Begriff der evolutionären oder genetischen Regler auf [31]. Dahinter verbirgt sich eine Reihe sehr leistungsfähiger Algorithmen zur Optimierung der zuvor genannten Regler. Alle diese Regler werden neuerdings unter dem Begriff der „intelligenten“ Regler zusammengefasst.
Steuerungstechnik F. Ley 14 Binäre Steuerungstechnik Die binäre Steuerungstechnik behandelt die Beeinflussung von Prozessen durch Binärsignale, also Signale, die entweder den Zustand „0“ oder den Zustand „1“ annehmen können. Diese Steuerung verarbeitet binäre Eingangssignale vorwiegend mit Verknüpfungs-, Zeit- und Speichergliedern zu binären Ausgangssignalen. Aufgabe einer binären Steuerung ist die Realisierung von vorgegebenen (zustandsoder zeitabhängigen) Abläufen, die Verriegelung von nicht erlaubten Stelleingriffen oder die Kombination von beiden. Zu den wichtigsten theoretischen Grundlagen der Steuerungstechnik zählen die auf der Boole’schen Aussagenlogik aufbauende Theorie der kombinatorischen Schaltungen und die von den Modellvorstellungen der Automatentheorie ausgehende Theorie der sequentiellen Schaltungen.
14.1 Grundstruktur binärer Steuerungen 14.1.1 Signalflussplan
Jede binäre Steuerung verarbeitet einen Vektor von binären Eingangssignalen zu einem Vektor binärer Ausgangssignale. Wie Bild 14-1 zeigt, setzt sich der Eingangsvektor aus den Signalen zusammen, die von den Bedienelementen erzeugt werden, und den Signalen der den Prozess beobachtenden Sensoren (Messglieder). Der Ausgangsvektor steuert die Anzeigeel-
Bild 14-1. Elemente einer binären Steuerung
I93
I94
I Regelungs- und Steuerungstechnik / Regelungstechnik
emente und die Aktoren (Stellglieder) an, mit deren Hilfe der Prozess beeinflusst wird. Beispiele für die Elemente einer binären Steuerung sind: Bedienelemente: Schalter, Wahlschalter, Taster, Notausschalter, Meisterschalter (,Joysticks‘), Schlüsselschalter, Schlüsseltaster, Tastaturen, Lichtgriffel. Sensoren: Endschalter, Näherungsinitiatoren, Druckschalter, Lichtschranken, Kopierwerke (Endschalter an Kurvenscheiben, z. B. für Maschinenpressen), Temperaturschalter, Niveauschalter, Überstromschalter. Anzeigeelemente: Kontrolllampen (Glühlampen, LEDs), Sichtmelderelais, Warnhupen, rechnergesteuerte Displays und Fließbilder, Protokolldrucker. Aktoren: Motoren, Motorschieber, Magnetventile (hydraulisch, pneumatisch), Leistungsschalter, Magnetkupplungen, Magnetbremsen. 14.1.2 Klassifizierung binärer Steuerungen
– Eine Verknüpfungssteuerung ordnet im Sinne Boole’scher Verknüpfungen den Signalzuständen von Eingangsgrößen, Zwischenspeichern und Zeitgliedern Zustandsbelegungen der Ausgangssignale zu. – Eine Ablaufsteuerung folgt einem festgelegten schrittweisen Ablauf (in dem auch bedingte Verzweigungen und Schleifen vorhanden sein dürfen), bei dem jeder Schritt einen Ausführungsteil und eine Weiterschaltbedingung enthält. Das Weiterschalten auf den jeweils nächsten Schritt erfolgt immer dann, wenn die aktuelle Weiterschaltbedingung erfüllt ist. Nach der Art der technischen Realisierung wird zunächst, wie im Bild 14-2 dargestellt, zwischen verbindungs- und speicherprogrammierbaren Steuerungseinrichtungen unterschieden. Die gebräuchlichsten verbindungsprogrammierbaren Steuerungen sind die elektromechanischen Schütz- oder Relaissteuerungen. Bei speicherprogrammierbaren Steuerungen (SPS) wird die Funktion nicht durch eine Verschaltung einzelner Elemente, sondern durch ein im Speicher abgelegtes Programm realisiert. Ihr Vorteil liegt in der einfachen Modifizierbarkeit der Programme. Bei ihnen kann über eine Schnittstelle
Bild 14-2. Einteilung binärer Steuerungen
vom Programmiergerät oder Personal-Computer das entwickelte Programm direkt in die Steuerung geladen werden. Man spricht deshalb von freiprogrammierbaren Steuerungen (FPS). Jede binäre Steuerung kann durch einen MealyAutomaten beschrieben werden. Bei diesem automatentheoretischen Modell geht man von der Vorstellung aus, dass es in jeder Steuerungseinrichtung gespeicherte binäre Zustände gibt, deren Veränderung von ihrer Vorgeschichte und der Signalbelegung abhängt. Die Signalbelegung des Ausgangsvektors lässt sich aus diesen Zuständen und der Eingangsbelegung bilden. Bild 14-3 zeigt die Struktur eines Mealy-Automaten. Die Funktionen G(U, X) und F(U, X) stellen kombinatorische Verknüpfungen dar. Die speichernde Eigenschaft des Automaten ergibt sich erst durch die Rückführung des Zustandsvektors X. Eine Sonderform des Mealy-Automaten stellt der Moore-Automat dar. Bei ihm wird der Ausgangsvektor Y ausschließlich aus dem Zustandsvektor X gebildet. (Anmerkung: Bei Binärsteuerungen werden Vektoren mit großen Buchstaben charakterisiert.)
Bild 14-3. Struktur des Mealy-Automaten
14 Binäre Steuerungstechnik
14.2 Grundlagen der kombinatorischen und der sequentiellen Schaltungen 14.2.1 Kombinatorische Schaltungen
Eine kombinatorische Schaltung ist dadurch gekennzeichnet, dass der Signalzustand ihrer Ausgänge nur von der Signalbelegung ihrer Eingänge, nicht Tabelle 14-1. Symbole für binäre Verknüpfungen
aber von der Vorgeschichte dieser Signalbelegungen abhängt. Eine kombinatorische Schaltung hat also keine Speichereigenschaften. Innerhalb einer solchen Struktur liegen nur logische Signalverknüpfungen, aber keine Signalrückführungen vor. Zur Beschreibung von logischen Funktionen ist es üblich, sogenannte Wahrheitstabellen aufzustellen, aus denen für jede Eingangssignalbelegung die kor-
I95
I96
I Regelungs- und Steuerungstechnik / Regelungstechnik
respondierende Ausgangssignalbelegung ersichtlich ist, siehe A 1.3. Tabelle 14-1 zeigt die für logische Verknüpfungen festgelegte Symbolik, wie sie z. B. in Logik- und Funktionsplänen verwendet wird. 14.2.2 Synthese und Analyse sequentieller Schaltungen
Die meisten binären Steuerungen werden als sequentielle Schaltung ausgeführt. Dabei hängt die Signalbelegung des Ausgangsvektors nicht nur von der aktuellen Belegung des Eingangsvektors ab, sondern auch von dessen Vorgeschichte, also von der Sequenz der Eingangsbelegungen. Solche Schaltungen lassen sich nicht mehr nur mithilfe der Boole’schen Aussagenlogik (siehe A 1.3) beschreiben, da diese nicht die Behandlung von Signalspeichern, wie sie in jeder sequentiellen Schaltung enthalten sind, umfasst. Es ist aber möglich, jede Speicherschaltung auf logische Grundverknüpfungen mit mindestens einer Rückkopplung eines Signales auf den Eingang einer vorgeschalteten Verknüpfung zurückzuführen. Trennt man alle Rückkopplungen einer sequentiellen Schaltung auf, so sind die verbleibenden Elemente einer Behandlung durch die Boole’sche Logik zugänglich. Allerdings hat diese Schaltung dann nur noch kombinatorischen Charakter. Der Ansatz, die rückgekoppelten Signale in einem System zu einem Vektor zusammenzufassen und die logischen Verknüpfungen von Signalvektoren zu Funktionsblöcken, führt zu den Modellen, wie sie auch in der Automatentheorie Verwendung finden. Für die weiteren Betrachtungen soll daher der zuvor eingeführte Mealy-Automat vorausgesetzt werden. Bei einem Mealy-Automaten mit aufgetrennter Zustandsrückführung hängen die logischen Funktionen F und G nun von den Signalvektoren U und X ab, wobei X den Ausgangszustand von X beschreibt. Das wichtigste Verfahren, das auf diesen Modellen aufbaut, ist das Huffman-Verfahren zur Analyse und Synthese sequentieller Schaltkreise [1]. Beispiel: Es soll eine Steuerung für eine Zweihandeinrückung an einer Maschinenpresse entworfen werden. Der Hub der Maschine (Y) darf hier nur dann ausgelöst
werden, wenn beide Handtaster (U1 und U2 ) betätigt sind, sodass die Gefahr einer Verletzung des Bedienungspersonals ausgeschlossen ist. Zusätzlich soll jedoch überwacht werden, dass beide Taster nach einer Hubauslösung wieder losgelassen worden sind. Zunächst wird für dieses Beispiel eine Flusstabelle (Tabelle 14-2) aufgestellt, in der alle Schritte des zu realisierenden Ablaufes, die Übergänge zwischen den Schritten in Abhängigkeit von der Belegung der Eingangssignale U1 und U2 und die den Schritten zugeordnete Belegung des Ausgangssignals Y eingetragen sind. Die Schritte werden im Allgemeinen auch Zustände des Automaten genannt. Jede Zeile der Flusstabelle entspricht einem Zustand und jede Spalte für U1 und U2 einer Eingangsbelegung. Es sind drei Zustände vorgesehen. Im Zustand 1 ist das Ausgangssignal mit 0 belegt. Ein Übergang zum Zustand 2 ist nur bei der Eingangssignalbelegung U1 = 1 und U2 = 1 möglich, also nur dann, wenn beide Handtaster betätigt sind. In diesem Zustand ist auch das Ausgangssignal mit 1 belegt, sodass der Hub ausgelöst wird. Beim Loslassen nur eines der beiden Taster wird auf den Zustand 3 weitergeschaltet, bei dem der Hub abgeschaltet wird. Dieser Zustand kann nur verlassen werden, wenn beide Handtaster wieder losgelassen worden sind, also U1 = 0 und U2 = 0 sind. Nach dem Aufstellen der Flusstabelle ist zu überprüfen, ob die Anzahl der spezifizierten Schritte minimal ist, oder ob die zu realisierende Funktion nicht auch durch eine geringere Anzahl von Zuständen verwirklicht werden kann. Nach der Minimierung der Zustände erfolgt die Codierung. Darunter versteht man die Zuordnung der Zustände zu den möglichen Binärkombinationen des Zustandsvektors. Da im vorliegenden Beispiel drei Zustände zu realisieren sind, muss der Zustandsvektor mindestens die Dimension 2 haben. (Mit der Dimension n können 2n Zustände realisiert werden.) Die Zustände der Zweihandeinrückung sollen wie in Tabelle 14-3 dargestellt codiert werden. Tabelle 14-2. Flusstabelle für eine Zweihandeinrückung
U1 0
U2 1 1 1 1
U1 0
U2 1 1 3 3
U1 1
U2 0 1 3 3
U1 1
U2 1 2 2 3
Y 0 1 0
14 Binäre Steuerungstechnik
Tabelle 14-3. Zustandscodierung
Zustand 1 2 3 r
X1 , X2 →0 →1 →1 →0
0 0 1 1
(redundant, weil nicht genutzt).
Bei der Codierung ist darauf zu achten, dass keine Wettläufe entstehen können. Diese Wettlauferscheinungen treten immer dann auf, wenn sich bei einer Zustandsänderung mehr als ein Bit innerhalb des Zustandsvektors ändert und – bedingt durch unterschiedliche Signallaufzeiten in der kombinatorischen Schaltung, – der Signalübergang in diesen Binärpositionen nicht gleichzeitig erfolgt, sodass sich ein falscher Folgezustand einstellt. Zur Bestimmung der kombinatorischen Gleichungen X = F(U, X )
und Y = G(U, X )
(14-1a,b)
empfiehlt es sich, die Funktionen in Form von Karnaugh-Diagrammen darzustellen. Wesentliches Kennzeichen dieser Diagramme ist, dass sich bei einem Übergang von einem Feld zum Nachbarfeld nur eine der unabhängigen Binärgrößen ändern darf. Bild 14-4 zeigt die für die Zweihandeinrückung aufgestellten F- und G-Tabellen des Karnaugh-Diagramms. Die redundanten Ele-
Bild 14-4. F- und G-Tabelle für Zweihandeinrückung
mente der Tabellen sind mit „r“ gekennzeichnet worden. Diese Redundanz kann man bei der sich anschließenden Schaltungsminimierung nutzen. Um einen kritischen Wettlauf zu vermeiden, ist in der untersten Zeile der F-Tabelle der Zustand [X1 X2 ] = [0 0] eingetragen. In der G-Tabelle ist, um den durch den verbleibenden nichtkritischen Wettlauf hervorgerufenen „Hazard“ zu vermeiden, eine 0 eingetragen. Mithilfe des Karnaugh-Verfahrens können nun die kombinatorischen Gleichungen gewonnen werden. Sie lauten: X1 = X1 ∧ (U1 ∨ U2 ) ∨ U1 ∧ U2 X2 = X2 ∧ (U1 \ U2 ) ∨ X1 ∧ (U¯ 1 ∧ U2 ∨ U1 ∧ U¯ 2 ) (14-2) Y = X1 ∧ X2 ∧ U1 ∧ U2 Zusammen mit der Schließbedingung X1 = X1 ;
X2 = X2
(14-3)
beschreiben sie die synthetisierte Steuerungsschaltung.
14.3 Darstellung von Zuständen durch Zustandsgraphen und Petri-Netze Bild 14-5 zeigt einen Zustandsgraphen, der die oben entwickelte Zweihandeinrückung darstellt. Bei diesen Zustandsgraphen wird jedem Zustand des Automaten ein Platz zugeordnet, der gewöhnlich durch einen Kreis dargestellt wird. An den Zustandsübergängen sind die Eingangsbelegungen eingetragen, die zu einem Schalten auf den nächsten Zustand führen. Bei diesem Graphen ist zunächst keine Parallelarbeit darstellbar. Eine andere Möglichkeit der Darstellung von
Bild 14-5. Zustandsgraph für Zweihandeinrückung
I97
I98
I Regelungs- und Steuerungstechnik / Regelungstechnik
Steuerungsabläufen bieten die Petri-Netze [2]. Mit ihnen können auch parallele Prozesse beschrieben werden. Bei den Petri-Netzen handelt es sich um gerichtete Graphen, bei denen zwei Elemente immer einander abwechseln: Transitionen und Plätze (oder Stellen). Die Plätze stellen im Allgemeinen die Zustände eines Systems dar, während die Transitionen die möglichen Übergänge charakterisieren. Bild 14-6 zeigt einen einfachen Graphen, der den Zyklus der vier Jahreszeiten beschreibt. Ein Platz kann ein- oder mehrfach belegt werden. Man spricht hierbei meistens von einer Markierung. Für die Beschreibung steuerungstechnischer Prozesse eignen sich Petri-Netze, in denen nur eine Markierung pro Platz zugelassen ist. Man nennt solche Netze auch Einmarkennetze. Sie entsprechen dem Umstand, dass ein Automat einen Zustand annehmen oder auch nicht annehmen kann, der Zustand also nur markiert oder nicht markiert sein kann. Ein Übergang von einem Platz auf einen folgenden kann dann erfolgen, wenn die Transition „feuert“. Vorbedingung ist hierzu eine Markierung des vorher-
gehenden Platzes. Bei Einmarkennetzen muss außerdem der nachfolgende Platz zunächst leer sein. Man spricht hier auch von einer Nachbedingung. Von großer Bedeutung sind bei Petri-Netzen die Möglichkeiten der Aufspaltung und der Zusammenführung von Abläufen. In Bild 14-7 sind die möglichen Verzweigungen und Zusammenführungen in Petri-Netzen dargestellt. Grundsätzlich lassen sich diese Elemente beliebig kombinieren. Wichtige Standardformen stellen die in Bild 14-8 abgebildeten Verzweigungstypen dar. Bei der Alternativverzweigung wird nur ein einziger Zweig durchlaufen. Welcher Zweig dies ist, entscheidet sich an der ersten Transition eines jeden Zweiges. Die Transition, die zuerst feuert, leitet die Markierung des zugeordneten Pfades ein. Feuern mehrere Transitionen zur gleichen Zeit, so gilt die Konvention, dass der Pfad, der am
Bild 14-6. Einfaches Petri-Netz
Bild 14-7. Verzweigungen und Zusammenführungen in Petri-Netzen
Bild 14-8. Verzweigungstypen in Petri-Netzen
14 Binäre Steuerungstechnik
weitesten ,links‘ steht, durchlaufen wird. Bei der Parallelverzweigung werden alle Zweige gleichzeitig durchlaufen, wobei die abschließende Transition t2 nur feuern kann, wenn alle letzten Plätze der Parallelpfade markiert sind. Probleme ergeben sich allerdings im Falle einer Parallelverzweigung bei der Zuordnung der Zustände eines Automaten. Beispiel: Funktionsschema einer Coilanlage, Bild 14-9. Von einem Blechhaspel (Coil) wird ein Blechband abgewickelt. Ein Zangenvorschub greift das Band und befördert es um die gewünschte Schnittlänge zur Schere, die eine Blechtafel abschneidet. Damit an der Schnittkante das Blech plan aufliegt und beim Zurückfahren des Vorschubes nicht zurückrutscht, spannt ein Niederhalter das Blechband fest. Nachdem der Niederhalter gespannt hat, kann einerseits der Zangenvorschub lösen, zurückfahren und wieder spannen, andererseits, unabhängig davon, kann die Schere sich absenken und wieder hochfahren. In Bild 14-10 ist das zugehörige Petri-Netz dargestellt. Die Bedeutungen der Plätze und Transitionen ergeben sich aus Tabelle 14-4. Wie aus Tabelle 14-5 hervorgeht, sind genau 7 Kombinationen (man spricht auch von ,Fällen‘) mög-
Bild 14-11. Übergeordneter Fallgraph für die Coilanlage Tabelle 14-4. Bedeutung der Plätze und Transitionen der
Coilanlage Platz
Bedeutung
p1 p2
Vorschub fährt vor Vorschub fährt zurück Schere fährt ab Vorschub stoppt Schere fährt hoch Schere stoppt
p3 p4 p5 p6
Transition t1 t2
Bedeutung
t3 t4 t5
Schere unten Schere oben immer erfüllt
Vorschub vorne Vorschub hinten
Tabelle 14-5. Mögliche Fälle der Steuerung einer Coilanla-
ge
Bild 14-9. Coilanlage als steuerungstechnisches Beispiel
Bild 14-10. Petri-Netz für die Coilanlage
Fall 1 2 3 4 5 6 7
Markierungen 1 2 × × × ×
3
4
5
6
× × × ×
× × ×
× ×
lich. Man kann nun diesen Fällen wiederum Plätze in einem übergeordneten Fallgraphen zuordnen. Bild 14-11 zeigt den entsprechenden Fallgraphen. Wählt man die Abbildung der Zustände so, dass jedem Zustand des Automaten ein Platz im Fallgraphen, also einem Fall, entspricht, so lässt sich mit einem Automaten der gesamte Steuerungsprozess realisieren.
I99
I100
I Regelungs- und Steuerungstechnik / Regelungstechnik
14.4 Technische Realisierung von verbindungsprogrammierten Steuerungseinrichtungen 14.4.1 Relaistechnik
Die ältesten Steuerungseinrichtungen waren ausschließlich in Relaistechnik ausgeführt. Die logischen Grundverknüpfungen werden durch die Art der Zusammenschaltung der Kontakte eines Relais realisiert. Die Hintereinanderschaltung von Kontakten bewirkt eine UND-Verknüpfung, die Parallelschaltung eine ODER-Verknüpfung. Außerdem ist eine Negation einzelner Signale dadurch möglich, dass man Kontakte verwendet, die bei Betätigung des Relais öffnen. Diese Kontakte werden Öffner genannt, im Gegensatz zu den Schließern, die beim Anziehen des Relais schließen. 14.4.2 Diskrete Bausteinsysteme (DTL- und TTL-Logikfamilien)
Mitte der sechziger Jahre entstanden die ersten elektronischen Logikbausteine. Sie waren zumeist zunächst in Dioden-Transistor-Logik (DTL) aufgebaut, später in integrierter Transistor-TransistorLogik (TTL). Das Kennzeichen dieser Systeme ist die Anordnung verschiedener kombinatorischer Standardverknüpfungsglieder oder Speicher auf einem Modul. Die Module sind entweder als einfache Europakartensysteme aufgebaut oder in Form von vergossenen Blöcken für raue Umgebungsbedingungen. Die Programmierung geschieht durch die Zusammenschaltung der einzelnen Elemente.
Zählen, arithmetische Befehle, Zeitgliedverwaltung, Formulierung von Ablaufsteuerungen, Kopplungsmöglichkeiten an Rechner, Protokollieren, Regeln. 14.5.1 Sprachen für Steuerungen nach der Norm IEC61131-3 Übersicht über die Sprachen
Mit der Norm IEC61131-3 ist eine gemeinsame Plattform geschaffen worden, die eine Portierung zwischen den Systemen verschiedener Anbieter gestattet. Bild 14-12 zeigt eine erste Übersicht über die in dieser Norm definierten Sprachen. Da sich in der Praxis die englischen Fachausdrücke durchgesetzt haben, werden sie auch im Folgenden verwendet. Innerhalb der IEC61131-3 gibt es für alle Sprachen gemeinsame Elemente, zu denen die Variablen-Typen und die „Literals“ zählen, die im Folgenden näher erläutert werden. Hieraus ergibt sich die überaus wichtige Eigenschaft, dass für eine bestimmte Anwendung Programmiersprachen je nach Eignung gemischt eingesetzt werden können. Das Software-Modell
SPS-Software ist – zumindest bei größeren Systemen – Multitasking- und Echtzeit-Software. Bild 14-13 gibt einen Überblick über die in der IEC61131-3 vorgesehenen Möglichkeiten, wie die Anbindung der
14.5 Speicherprogrammierbare Steuerungen Seit Anfang der siebziger Jahre gibt es spezielle, auf steuerungstechnische Problemstellungen zugeschnittene Kleinrechner. Bei ihnen war es erstmals (sieht man von den schon länger existierenden Prozessrechnern ab) möglich, die Funktion einer Steuerungseinrichtung durch ein im Speicher abgelegtes Programm zu bestimmen. Die ersten speicherprogrammierbaren Steuerungen waren nur auf die Abarbeitung von kombinatorischen Verknüpfungen ausgelegt. Später kamen an Erweiterungen hinzu:
Bild 14-12. Übersicht über die Programmiersprachen nach IEC61131-3
14 Binäre Steuerungstechnik
Tabelle 14-6. Elementare Datentypen
Bild 14-13. Software-Modell der IEC61131-3
einzelnen Programmteile und die Kommunikation dieser Blöcke untereinander organisiert werden soll. Allerdings sollte beachtet werden, dass nicht jede Implementierung alle diese Möglichkeiten umfassen muss. Die Verwendung von Teilen davon, also Subsets, ist durchaus möglich. So sind z. B. in der IEC61131-3 als eine Form der Kapselung Programme vorgesehen, obwohl diese nicht unbedingt erforderlich sind. Eine „Resource“ entspricht i. Allg. einer SPS oder einem Rechner. Eine „Configuration“ könnte einem Rechnerverbund (z. B. SPS mit mehreren Zentraleinheiten) entsprechen. Es ist nun möglich, sowohl einzelne Funktionsbausteine (FB) als auch – wenn implementiert – Programme komplett mit den darin eingeschlossenen Funktionsbausteinen an eine „Task“ zur Abarbeitung anzubinden. Variablen, Literals und Konstanten
1) Elementare Datentypen: Tabelle 14-6 gibt die Grunddatentypen der IEC61131-3 wieder. 2) Abgeleitete Datentypen: – Arrays: Diese werden aus Elementen des Gunddatentyps oder vom Benutzer definierter Datentypen definiert. Beispiel: VAR Vector16 : ARRAY[1..16] OF REAL; END_VAR
– Strukturierte Datentypen: Hiermit können – wie bei anderen höheren Programmiersprachen auch – Grunddatentypen oder auch bereits strukturierte Datentypen („Structs“) in einer neuen Struktur zusammengefasst werden. Beispiel: TYPE PIDT1_Parameters : STRUCT P : LREAL; Ti : LREAL; Td : LREAL; Tv : LREAL; END_STRUCT PIDT1_Controller_Items : STRUCT Para : PIDT1_Parameters; manualOperation : BOOL; Umin, Umax : LREAL; END_STRUCT END_TYPE 3) Literals: – Numerische Literals: Im Wesentlichen stimmen die Literals der IEC61131-3, die in Tabelle 14-7 dargestellt sind, mit denen anderer Rechnerhochspachen überein. Für hardwarenahe Problemstellungen ist es günstig, binäre, oktale oder hexadezimale Darstellungen zu
I101
I102
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 14-7. Literals
verwenden. Diese werden deshalb bei der Darstellung als Literals unterstützt. – Zeitdauer-Literals: Die Angabe der Zeitdauer (Duration) wird wahlweise durch die „Keywords“ T# TIME# eingeleitet. Beispiele: T#14ms T#14.7s T#14.7m T#14.7h t#14.7d t#25h15m t#5d14h12m18s2.5ms 4) Variablen: – Darstellung: (i) Single-element Variablen: Eine Singleelement Variable besteht aus keinem Array oder Struct sondern nur aus einem elementaren Datentyp oder einem davon direkt abgeleiteten Datentyp. Wichtig sind die direkt dargestellten (directly represented) Datentypen, wie sie für das Ansprechen des Prozessinterfaces Verwendung finden. Sie werden mit einem %-Zeichen eingeleitet. Beispiel: %IX5.7 (* Eingangsbit 7 innerhalb von Byte 5 *) %QX1.2 (* Ausgangsbit 2 innerhalb von Byte 1 *)
(ii) Multi-element Variablen: MultielementVariablen sind Arrays und Structs. Hier ist kein großer Unterschied zu den Programmiersprachen PASCAL und C festzustellen. Der indizierte Zugriff auf Array-Elemente erfolgt über eckige Klammern und die Bezeichner der hierarchischen Struktur eines Structs werden durch Punkte von einander getrennt. Beispiel: TempControllerData.Umin : = −10.0 ; TempControllerData.Para.P : = 3.47 ; – Deklaration: Vor der Variablenliste muss mithilfe eines entsprechenden Keywords spezifiziert werden, wie die Variable vom System behandelt werden soll. Dabei ergeben sich die in Tabelle 14-8 dargestellten Möglichkeiten. Beispiel: VAR_INPUT W, Y : LREAL; END_VAR VAR_OUTPUT U : LREAL; END_VAR (i) Type assignment: Diese Variablendeklaration lässt sich leicht aus den nachfolgend aufgeführten Beispielen ersehen.
14 Binäre Steuerungstechnik
Tabelle 14-8. Variablendeklaration
Bild 14-14. Function Block Darstellung
VAR_GLOBAL (* Weist das entsprechende Input-Bit der Variable Nothalt zu *) Nothalt : BOOL AT %IX2.7; (* Einzelne Variable vom Typ LREAL *) Setpoint_Temp : LREAL; (* eindimensionales Array *) StateVector : ARRAY[0..5] OF LREAL; END_VAR (ii) Anfangswertzuweisung: Variablen ohne spezifizierte Anfangswerte sind nach IEC61131-3 grundsätzlich mit ,Null‘ vorbelegt. Strings sind anfangs leer. Andere Anfangswerte lassen sich aber immer deklarieren. Beispiel: AutomaticMode : BOOL := TRUE;
Function Blocks und Function Block Diagram (FBD)
1) Darstellung und Instanzierung: Function Blocks stellen Programmorganisationseinheiten dar, die eine Kapselung erlauben, Ein- und Ausgänge besitzen und im Inneren Variablen aufweisen können, die über den Aufrufzeitraum hinweg gespeichert bleiben. Es handelt sich also um Klassen im Sinne der objektorientierten Programmierung. Die grafische Darstellung einer Verknüpfung dieser Bausteine stellt eine Programmiersprache der IEC61131-3, das sogenannte Function Block Diagram (FBD) dar. Es entspricht dem alten Logikplan (LOP) bzw. dem Funktionsplan (FUP). Wie nachfolgend gezeigt, kann ein Function Block nicht nur grafisch, sondern auch in einer textuellen Programmiersprache instanziert
I103
I104
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 14-15. Beispiele für Deklarationen von Function Blocks
14 Binäre Steuerungstechnik
Tabelle 14-9. Erlaubte und nicht erlaubte Zuweisungen auf Ein-Ausgangsvariablen
werden. Bei der textuellen Deklaration wird das Sprachkonstrukt VAR FB_NAME : FB_TYPE; END_VAR verwendet. Bei der grafischen Darstellung gilt die Regel, dass der Klassenname (Typ des Function Block) und die Namen der Ein- und Ausgänge innerhalb des Blocks dargestellt werden. Der Name der Instanz (des Exemplars) und die aktuelle Belegung der Ein- und Ausgänge stehen außerhalb, wie in Bild 14-14 dargestellt. Man beachte auch die in Tabelle 14-9 gezeigten Zuweisungen auf die Ein- und Ausgangsvariablen. 2) Deklarierung: Die Function Blocks können textuell und grafisch deklariert werden. Die IEC61131-3 sieht eine Vielzahl von Möglichkeiten vor, wie Function Blocks verschachtelt angeordnet und miteinander verschaltet werden
Bild 14-16. Eigenschaften von Function Block Deklarierungen
können. Dies wird anhand der in den Bildern 14-16 und 14-17 dargestellten Beispiele, die direkt der Norm entnommen wurden, gezeigt. 3) Standard Function Blocks: In einer IEC61131-3Implementierung sind herstellerseits gewöhnlich eine Reihe von Funktionsblocks mit enthalten. Die Norm gibt eine Reihe von Standard Function Blocks vor, die nachfolgend definiert werden. – Flip-Flops: Bei RS-Flip-Flops ist grundsätzlich zwischen setz- und rücksetzdominanten Flip-Flops zu unterscheiden (Bild 14-17). Nach der Instanzierung soll der Ausgang Q immer gleich 0 sein. – Timer: Als Standard-Timer sind eine Einschaltverzögerung (TON-Timer) und eine Ausschaltverzögerung (TOF-Timer) in der Norm vorgesehen. Bild 14-18 zeigt die Symbole in der FBD und die Timing-Diagramme.
I105
I106
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 14-17. Flip-Flop–Function Blocks
Bild 14-18. Darstellung und Timing eines a TON-Timers und eines b TOF-Timers
14 Binäre Steuerungstechnik
Bild 14-19. Task in FBD-Darstellung
Bild 14-20. Graphische Darstellung von FunktionsblockInstanzen in Taskliste
– Tasks: In der Norm IEC61131-3 können Tasks auch wie Function Blocks dargestellt werden. Die Bilder 14-19 und 14-20 zeigen eine solche FBD-Darstellung. Es können sowohl Programme als auch Function Blocks an Tasks angebunden werden. Grundsätzlich gelten – im Wesentlichen – folgende Regeln: 1. Eine Task, deren Intervallzeit auf Null gesetzt ist (INTERVAL=T#0s) führt genau dann einen Zyklus aus, wenn am Eingang SINGLE ein positiver Flankenwechsel erfolgt. 2. Liegt am Eingang INTERVAL eine von Null verschiedene Zeit an, so arbeitet die Task alle mit ihr verbundenen Elemente mit dieser Zykluszeit ab, solange der Eingang SINGLE mit 0 (FALSE) belegt ist. Bei einer Belegung mit 1 (TRUE) stoppt die Task. 3. Es ist sowohl ein preemptives als auch ein non-preemptives scheduling möglich.
von (Schütz-) Kontakten realisiert. Dabei wird ein Schließer durch das Symbol —| |— und ein Öffner (Negation) durch —| / |— dargestellt. Bei den Spulen gibt es – im Wesentlichen – die in Tabelle 14-10 aufgeführten Möglichkeiten. Bild 14-21 zeigt als kleines Beispiel einen Motor, der innerhalb eines Funktionsbausteines ausoder eingeschaltet wird. Man kann Speicherfunktionen – wie in der Schütztechnik gewohnt – durch Selbsthaltekontakte realisieren. Bild 14-21 zeigt diese Realisierungsmöglichkeit. Man benutzt dann nur die direkte Zuweisung auf die Spule. Einfacher geht es, wenn man die Möglichkeit der speichernden Zuweisung nutzt. Diese Variante ist in Bild 14-22 dargestellt. 2) Instruction List (IL): Die Instruction List kommt der früher gebrauchten Anweisungsliste (AWL) sehr nahe. Allerdings sind hier alle Anwei-
Bild 14-21. Beispiel eines in LD mit Selbsthaltekontakt geschalteten Ausgangs
Die Sprachen
1) Ladder Diagram (LD): Das Ladder Diagram (früher Kontaktplan KOP genannt) stellt einen formalisierten Stromlaufplan einer Schütz- oder Relaisschaltung dar. Hierbei werden logische Verknüpfungen durch die Reihen- und Parallelschaltung
Bild 14-22. Wirkungsweise eines Verknüpfungsergebnisses bei verschiedener Art der Zuweisung
I107
I108
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 14-10. Zuweisungsmöglichkeiten bei Spulen
Tabelle 14-11. Operatoren der IL
sungen einschließlich der zugehörigen Regeln genormt. Die entsprechenden Operatoren sind in Tabelle 14-11 dargestellt.
Nachfolgend werden zwei Beispiele für Anwendungen in IL vorgestellt. Das erste Beispiel nach Bild 14-24 zeigt eine Zuweisung mit Haltekontakt
14 Binäre Steuerungstechnik
Bild 14-23. Beispiel eines mit setzender und rücksetzender
Zuweisung geschalteten Ausgangs
Bild 14-25. Beispiel einer Bool’schen Verknüpfung mit setzender und rücksetzender Zuweisung in IL
Bild 14-24. Beispiel einer Bool’schen Verknüpfung mit einem Selbsthaltekontakt in IL
und entspricht dem im Bild 14-21 gezeigten Beispiel. Im zweiten Beispiel nach Bild 14-25 wird das gleiche Problem mit einer setzenden und rücksetzenden Zuweisung gemäß Bild 14-22 gelöst. Diese Art von Anweisungen werden immer
Bild 14-26. Beispiel einer Bool’schen Verknüpfung mit einem Selbsthaltekontakt in ST
nur dann ausgeführt, wenn das vorhergehende Verknüpfungsergebnis vom Typ BOOL und vom Wert 1 (TRUE) ist. Da nur der zuletzt zugewiesene Wert bleibt, ist die Wirkung des Aus-Tasters hier dominant.
I109
I110
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 14-12. Operatoren der Sprache ST
3) Structured Text (ST): Structured Text ist eine textuelle Hochsprache mit starker Ähnlichkeit zu Pascal. Sie bietet die meisten Freiheitsgrade. Durch die Sprache ST ist es möglich geworden, benutzerdefinierte, intelligente regelungstechnische Algorithmen auf speicherprogrammierbare Steuerungen zu bringen. Tabelle 14-12 zeigt die möglichen Operatoren in logischen oder arithmetischen Verknüpfungen. Operationen mit der zahlenmäßig geringsten Zuordnung haben die höchste Priorität und werden daher zuerst ausgeführt. Auch die Kontrollstrukturen, die in Tabelle 14-13 dargestellt sind, sehen der Sprache Pascal sehr ähnlich. Geklammert werden hier mehrere Statements nicht mit ,begin‘ und ,end‘ wie in Pascal oder mit ,{‘ und ,}‘ wie in C, sondern werden mit einem typisierten ,end_xyz‘ abgeschlossen, das auf den Typ des einleitenden Kontrollstatements xyz hinweist. Auch hier sollen die beiden zuvor behandelten Beispiele eines Motors, der mit einem Austaster ausgeschaltet und mit einem Einschalter eingeschaltet wird, wieder verwendet werden. Die lo-
gischen Verknüpfungen nach Bild 14-26 beschreiben die gewünschte Struktur. Beim Aufruf einer Instanz eines Funktionsbausteins – in Bild 14-27 ist es ,M‘ – müssen nicht alle Parameter übergeben werden. Die Identifikation der Parameter erfolgt hierbei nicht durch die Reihenfolge, sondern durch die explizite Zuweisung. Ein Aufruf des FB bedeutet auch immer zugleich, dass dieser operiert wird. Die Ausgänge des FB können dann einzeln in einem Ausdruck des entsprechenden Datentyps abgefragt werden. In der Realisierung des FB nach Bild 14-28 werden die Eingänge in einer geschachtelten IF-Abfrage behandelt. Da das Einschalten nur im ELSE-Teil der Abfrage des Aussignals erfolgt, hat dieses Signal Vorrang. 4) Sequential Function Chart (SFC): Die Sprache Sequential Function Chart basiert auf der Beschreibung sequentieller Prozesse durch PetriNetze. Sie ist besonders zur Programmierung von Steuerungsabläufen geeignet und basiert auf den Elementen Step, Transition, Action und ActionAssociation.
14 Binäre Steuerungstechnik
Tabelle 14-13. Statements der Sprache ST
I111
I112
I Regelungs- und Steuerungstechnik / Regelungstechnik
Tabelle 14-14. Step-Eigenschaften
Bild 14-27. Aufruf des Funktionsbausteins in ST
– Steps: Tabelle 14-14 zeigt die grafische Darstellung von Steps. – Transitions: Tabelle 14-15 zeigt die grafische Darstellung von Transitions. – Actions: In den meisten Fällen stellt eine gewöhnliche Variable vom Typ BOOL eine Action innerhalb einer SFC dar. Möglich sind
Bild 14-28. ST Beispiel mit IF-Abfragen
aber auch unterlagerte Strukturen, die in beliebigen Sprachen der IEC61131-3 formuliert sein können. Sie werden dann pro Taskzyklus jeweils einmal abgearbeitet, so lange die Action aktiv ist. – Action-Associations mit Steps: ActionAssociations stellen die Verbindung eines Step
14 Binäre Steuerungstechnik
Tabelle 14-15. Transitionen und Transitionsbedingungen
zu den korrespondierenden Actions dar. Sie legen fest, was jeweils mit einer dieser Actions geschehen soll, wenn ein solcher Step markiert ist. – Action-Qualifier: Die Sequential Function Chart bietet eine große Pallette von Möglichkeiten hinsichtlich des Modus des Actions-Controls. Tabelle 14-17 enthält die vorgesehenen Qualifier. Bild 14-29 zeigt ein Schaltbild, das die Funktion der Qualifier anschaulich beschreibt. Der Qualifier R be-
wirkt ein sofortiges Rücksetzen der hiermit assoziierten Action. Nachfolgend ist im Bild 14-30 als abschließendes Beispiel die SFC-Realisierung der Steuerung der Coilanlage nach Bild 14-9 angegeben. 14.5.2 SPS und Prozessrechner
Speicherprogrammierbare Steuerungen sind seit ihrem ersten Auftreten immer leistungsfähiger geworden. Damit ist allerdings die Grenze zum Prozessrechner mehr und mehr fließend, weil die
I113
I114
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 14-29. Action_Control function block body
leistungsfähigen speicherprogrammierbaren Steuerungen (SPS) immer mehr Funktionen übernehmen, die bisher Prozessrechnern bzw. Prozessleitsystemen (PLS) vorbehalten waren. Die Aufgaben eines PLS
und einer SPS unterscheiden sich heute nicht mehr vom Inhalt, sondern durch den Umfang der zu lösenden Automatisierungsaufgabe. Herkömmliche SPS verarbeiten nicht nur binäre, sondern auch
14 Binäre Steuerungstechnik
Tabelle 14-16. Action-Associations
digitalisierte analoge Signale. Die mitgelieferten Funktionsbibliotheken umfassen z. B. auch Module für diskrete PID-Regelalgorithmen (vergl. Abschn. 10.6.1). Moderne SPS bieten außerdem die Möglichkeit, verschiedene Programmteile – für den Anwender quasi gleichzeitig – abzuarbeiten (vergl. Bild 14-13). Dadurch kann eine Gesamtaufgabe in struktuierte Teilaufgaben zerlegt werden, wobei z. B. eine Task verknüpfungsorientierte binäre Variablen verarbeitet, während eine andere Task z. B. für das Hochfahren einer Maschine oder deren Drehzahlregelung abhängig von äußeren Randbedingungen zuständig ist. Tabelle 14-17. Action-Qualifiers
14.5.3 Prozesssignale von Speicherprogrammierbaren Steuerungen
Für die analogen Spannungs-Ein-/Ausgangssignale hat sich zumeist ein Standardwertebereich von +/−10 V oder 0. . . 10 V eingebürgert. Bei den analogen Strom-Ein-/Ausgangssignalen sind es 0 . . . 20 mA bzw. 4–20 mA. Bei letzteren Schnittstellen lassen sich auf einfache Weise Drahtbrüche erkennen, wenn der eingeprägte Strom unter 4 mA sinkt. Bei analogen Eingängen unterscheidet man die beiden Betriebsarten Single-Ended-Mode und Differenzial-Mode. Im Differenzial-Mode werden zum Anschluss von Hin- und Rückleitung eines Analogsignals zwei Kanäle benutzt, die vor der AD-Wandlung auf einen Differenzverstärker gegeben werden. Eingekoppelte Störsignale, die sich gegen Massepotenzial aufbauen, werden so weitgehend eliminiert. Digitale Ein-/Ausgänge werden größtenteils in 24 V-Technik ausgeführt. Die digitalen Ausgänge können dabei meistens einen Strom treiben, der ausreichend ist, ein 24 V-Gleichstromschütz anzusteuern. Für die elektrische Betriebssicherheit der Anlage, ist es oft von Bedeutung, dass die Prozessschnittstellen galvanisch entkoppelt sind.
I115
I116
I Regelungs- und Steuerungstechnik / Regelungstechnik
Bild 14-30. Beispiel Coil-Anlage
Formelzeichen der Regelungsund Steuerungstechnik a) Allgemeine Darstellung e(t), f (t), . . . kontinuierliche Zeitfunktionen, Signale e(k), f (k), . . . diskrete Zeitfunktionen, Folgen E(s), F(s), . . . Laplace-Transformierte von e(t), f (t), . . . E( jω), f ( jω), . . . Fourier-Transformierte von e(t), f (t), . . . z-Transformierte von e(k), EZ (z), FZ (z), . . . f (k) . . . x, x(t) Vektoren (konstant bzw. zeitabhängig) (anders in Kap. 14!)
A, A(t), Φ(t)
Matrizen (konstant bzw. zeitabhängig)
| A| Determinante der Matrix A X(s), U(s), . . . Laplace-Transformierte der Vektoren x(t), u(t), . . . Matrizen, deren Elemente FunkG(s), Φ(s) tionen, z. B. Polynome, von s sind L Operator der Laplace-Transformation F Operator der Fourier-Transformation Z Operator der z-Transformation Z doppelter Operator für Z {L −1 {. . .}|t=kT }
Literatur
xT , AT
Transponierte des Vektors x bzw. der Matrix A A−1 Inverse der Matrix A xˆ, pˆ Schätzwert oder rekonstruierter Wert von x oder p b) Spezielle Kennzeichnungen t kontinuierliche Zeitvariable σ(t) Sprungfunktion δ(t) Impulsfunktion h(t) Übergangsfunktion g(t) Gewichtsfunktion k diskrete Zeitvariable δd (k) diskreter Impuls h(k) Übergangsfolge g(k) Gewichtsfolge u Stellgröße Reglerausgangsgröße uR w Führungsgröße y Regelgröße z Störgröße s = σ+jω, komplexe Bildvariable für die Laplace-Transformation, auch als Frequenzvariable bezeichnet ω = 2π/T , Kreisfrequenz G(s) Übertragungsfunktion G( jω) Frequenzgang (allgemein) G0 (s), G0 ( jω) Übertragungsfunktion bzw. Frequenzgang des offenen Regelkreises Führungsübertragungsfunktion GW (s) Störungsübertragungsfunktion GZ (s) z komplexe Bildvariable der z-Transformation G(z) z-Übertragungsfunktion R(ω) Realteil von G( jω) I(ω) Imaginärteil von G( jω) x(t) Vektor der Zustandsgrößen, Zustandsvektor u(t) Vektor der Stellgrößen, Stellvektor (auch Steuervektor) y(t) Vektor der Ausgangsgrößen, Ausgangsvektor Korrelationsfunktion Rab (τ) Spektrum Sab ( jω)
c) International genormte Formelzeichen (in Klammern die in Deutschland bevorzugten Ausweichzeichen) nach DIN 19221 u Eingangsgröße w Führungsgröße v, (z) Störgröße e Regeldifferenz, Regelabweichung m, (y) Stellgröße y, (x) Regelgröße Aufgabengröße q, (xA ) f, (r) Rückführgröße
Literatur Allgemeine und weiterführende Literatur insbesondere zu den Kapiteln 1 bis 8 Angermann, A.; Beuschel, M.; Rau, M.; Wohlfarth, U.: Matlab – Simulink – Stateflow. München: 4. Aufl. Oldenbourg 2005 Antsaklis, P.; Michel, A.: Linear systems. New York: McGraw-Hill 1997 Belanger, P.: Control Engineering, Orlando, Fla.: Saunders 1995 Bode, H.: MATLAB in der Regelungstechnik. Stuttgart: Teubner 1998 Böttiger, A.: Regelungstechnik. 3. Aufl. München: Oldenbourg 1998 Cremer, M.: Regelungstechnik. 2. Aufl. Berlin: Springer 1995 De Carvalho, J.: Dynamical systems and automatic control. New York: Prentice-Hall 1993 Dickmanns, E.D.: Systemanalyse und Regelkreisynthese. Stuttgart: Teubner 1985 Dörrscheidt, F.; Latzel, W.: Grundlagen der Regelungstechnik. 2. Aufl. Stuttgart: Teubner 1993 Föllinger, O.: Regelungstechnik. 8. Aufl. Heidelberg: Hüthig 1994 Franke, D.; Krüger, K.; Knoop, M.: Systemdynamik und Reglerentwurf. München: Oldenbourg 1992 Geering, H.P.: Regelungstechnik. 3. Aufl. Berlin: Springer 1994 Grantham, W.: Modern control systems. New York: Wiley 1993 Leonhard, W.: Einführung in die Regelungstechnik. 6. Aufl. Wiesbaden: Vieweg 1992
I117
I118
I Regelungs- und Steuerungstechnik / Regelungstechnik
Levine, W.: The control handbook, Boca Raton, Fla.: CRC Press 1996 Litz, L.: Grundlagen der Automatisierungstechnik. München: Oldenbourg 2005 Ludyk, G.: Theoretische Regelungstechnik, 2 Bde. Berlin: Springer 1995 Lunze, J.: Regelungstechnik, 2 Bde. Berlin: Springer 2006, 2007 Mann, H.; Schiffelgen, H.; Froriep, R.: Einführung in die Regelungstechnik. München: 9. Aufl. Hanser Merz, L.; Jaschek, H.: Grundkurs der Regelungstechnik. 14. Aufl. München: Oldenbourg 2003 Ogata, K.: Modern control engineering. 2nd. Englewood Cliffs, N.J.: Prentice-Hall 1990 Olsson, G.; Piani, G.: Steuern, Regeln, Automatisieren. München: Hanser 1993 Oppelt, W.: Kleines Handbuch technischer Regelvorgänge. 5. Aufl. Weinheim: Verl. Chemie 1972 Philips, C.; Harbor, R.D.: Feedback control systems. 3rd ed. Englewood Cliffs, N.J.: Prentice-Hall 1996 Reinhardt, H.: Automatisierungstechnik. Berlin: Springer 1996 Reinisch, K.: Analyse und Synthese kontinuierlicher Steuerungssysteme. Berlin: Verl. Technik 1979 Reinschke, K.: Lineare Regelungs- u. Steuerungstheorie. Berlin: Springer 2006 Roppenecker, G.: Zeitbereichsentwurf linearer Regelungen. München: Oldenbourg 1990 Samal, E.; Becker, W.: Grundriß der praktischen Regelungstechnik. München: 21. Aufl. Oldenbourg 2004 Schlitt, H.: Regelungstechnik. 2. Aufl. Würzburg: Vogel 1993 Schmidt, G.: Grundlagen der Regelungstechnik. 2. Aufl. Berlin: Springer 1987 Schneider, W.: Regelungstechnik für Maschinenbauer. 2. Aufl. Wiesbaden: Vieweg 1994 Schulz, G.: Regelungstechnik Bd. 1 u. Bd. 2. München: Oldenbourg 2002 u. 2004 Solodownikow, W.W.: Analyse und Synthese linearer Systeme. Berlin: Verl. Technik 1971 Solodownikow, W.W.: Stetige lineare Systeme. Berlin: Verl. Technik 1971 Stefani, R.T. et al.: Design of feedback control systems. Orlando: Saunders College Publishing 1994
Unbehauen, H.: Regelungstechnik I: Klassische Verfahren zur Analyse und Synthese linearer kontinuierlicher Regelsysteme. 14. Aufl. Wiesbaden: Vieweg 2007 Weinmann, A.: Regelungen, Bd. I: Systemtechnik linearer und linearisierter Regelungen. 3. Aufl. Wien: Springer 1994 Wolovich, W.: Automatic control systems. Orlando, Fla.: Saunders 1994 Kahlert, J.; Frank, H.: Fuzzy-Logik und FuzzyControl. Braunschweig, Wiesbaden: Vieweg 1993 Kahlert, J.: Fuzzy Control für Ingenieure. FuzzyRegelsystemen. Braunschweig, Wiesbaden: Vieweg 1995 Zimmermann, H.: Fuzzy set theory and its applications. 2nd ed. Boston: Kluwer 1992 Boullart, L.: Krijgsman, A.: Vingerhoeds, R.A.: Application of artificial intelligence in process control. Oxford: Pergamon 1992 Hrycej, T.: Neurocontrol. New York: Wiley 1997
Spezielle Literatur zu Kapitel 1 1. Wiener, N.: Cybernetics; or, Control and communication in the animal and the machine. New York: Wiley 1948 2. DIN 19226-1/6: Leittechnik; Regelungstechnik und Steuerungstechnik
Spezielle Literatur zu Kapitel 2 1. Schöne, A.: Simulation technischer Systeme, 3 Bde. München: Hanser 1974
Spezielle Literatur zu Kapitel 3 1. Unbehauen, R.: Systemtheorie, Bd. 1 u. 2. München: Oldenbourg 1998/2002
Spezielle Literatur zu Kapitel 4 1. Doetsch, G.: Anleitung zum praktischen Gebrauch der Laplace-Transformation und der z-Transformation. 5. Aufl. München: Oldenbourg 1985 2. Föllinger, O.: Laplace- und Fourier-Transformation. Berlin: Elitera-Verl. 1977 3. [Unbehauen, Regelungstechnik I]
Literatur
Spezielle Literatur zu Kapitel 5 1. [Unbehauen, Regelungstechnik I] 2. Tietze, U.; Schenk, Ch.: Halbleiter-Schaltungstechnik. 10. Aufl. Berlin: Springer 1993
Spezielle Literatur zu Kapitel 6 1. Hurwitz, A.: Über die Bedingungen, unter welchen eine Gleichung nur Wurzeln mit negativen reellen Teilen besitzt. Math. Ann. 46 (1895) 273– 284 2. Routh, E.J.: A treatise on the stability of a given state of motion. London: Macmillan 1877 3. Nyquist, H.: Regeneration theory. Bell Syst. Tech. J. 11 (1932) 126–147
Spezielle Literatur zu Kapitel 7 1. Evans, W.R.: Control system dynamics. New York: McGraw-Hill 1954
Spezielle Literatur zu Kapitel 8 1. Newton, G.C.; Gould, L.A.; Kaiser, J.F.: Analytical design of linear feedback control. New York: Wiley 1957 2. Unbehauen, H.: Stabilität und Regelgüte linearer und nichtlinearer Regler in einschleifigen Regelkreisen bei verschiedenen Streckentypen mit Pund I-Verhalten. (Fortschr.-Ber., R. 8, 13) Düsseldorf: VDI-Verl. 1970 3. [Oppelt], S. 462–476 4. Ziegler, J.G.; Nichols, N.B.: Optimum settings for automatic controllers. Trans. ASME 64 (1942) 759–768 5. [Unbehauen, Regelungstechnik I] 6. Truxal, J.G.: Entwurf automatischer Regelsysteme. Wien, München: Oldenbourg 1960, S. 297– 338
Allgemeine Literatur zu Kapitel 9 Atherton, D.: Nonlinear control engineering. London: Van Nostrand 1981 Föllinger, O.: Nichtlineare Regelung, 7. Aufl. München: Oldenbourg 1993 Khalil. K.: Nonlinear systems. New York: Macmillan 1992
Nijmeijer, H.; van der Schaft, A.: Nonlinear dynamical control systems. Berlin: Springer 1990 Parks, P.C.: Hahn, V.: Stabilitätstheorie. Berlin: Springer 1981 Schwarz, H.: Nichtlineare Regelungssysteme. München: Oldenbourg 1991 Unbehauen, H.: Regelungstechnik II: Zustandsregelungen, digitale und nichtlineare Regelsysteme. 9. Aufl. Wiesbaden: Vieweg 2007 Vidyasagar, M.: Nonlinear systems analysis. Englewood Clifs, N.J.: Prentice-Hall 1993
Spezielle Literatur zu Kapitel 9 1. Siehe [2] zu Kap. 8 2. [Unbehauen, Regelungstechnik II] 3. Gille, J.; Pelegrin, M.; Decaulne, O.: Lehrgang der Regelungstechnik, Bd. I. München: Oldenbourg 1960 4. Feldbaum, A.: Rechengeräte in automatischen Systemen. München: Oldenbourg 1962 5. Boltjanski, W.G.: Mathematische Methoden der optimalen Steuerung. München: Hanser 1972 6. Hahn, W.: Theorie und Anwendung der direkten Methode von Ljapunov. Berlin: Springer 1959 7. Aiserman, M.; Gantmacher, F.: Die absolute Stabilität von Regelsystemen. München: Oldenbourg 1965 8. Schultz, D.; Gibson, J.: The variable gradient method for generating Liapunov functions. Trans. AIEE 81, Part II (1962) 203–210 9. Popov, V.: Absolute stability of nonlinear systems of automatic control. Autom. Remote Control 22(1961) 961–978
Allgemeine Literatur zu Kapitel 10 Ackermann, J.: Sampled-data control systems. Berlin: Springer 1985 Braun, A.: Digitale Regelungstechnik. München: Oldenbourg 1997 Feindt, E.: Regeln mit dem Rechner. 2. Aufl. München: Oldenbourg 1994 Föllinger, O.: Lineare Abtastsysteme. 5. Aufl. München: Oldenbourg 1993 Franklin, G.; Powell, J.; Workman, M.: Digital control of dynamic systems. London: Addison-Wexley 1990
I119
I120
I Regelungs- und Steuerungstechnik / Regelungstechnik
Gausch, F.; Hofer, A.: Schlachter, K.: Digitale Regelkreise. 2. Aufl. München: Oldenbourg 1993 Günther, M.: Zeitdiskrete Steuerungssysteme. Berlin: Verl. Technik 1986 Isermann, R.: Digitale Regelsysteme, 2 Bde. 2. Aufl. Berlin: Springer 1987 Kuo, B.: Digital control systems. Orlando, Fla.: Saunders 1992 Latzel, W.: Einführung in die digitalen Regelungen. Düsseldorf: VDI-Verlag 1995 Ogata, K.: Discrete-time control systems. 2nd ed. Englewood Cliffs, N.J.: Prentice-Hall 1995 Phillips, C.; Nagle, H.: Digital control system analysis and design. Englewood Cliffs, N.J.: Prentice-Hall 1984 Santina, M.; Stubberud, A.; Hostetter, G.: Digital control system design. Orlando, Fla.: Saunders 1994 Unbehauen, H.: Regelungstechnik II; siehe zu Kap. 9 Van den Enden, A.; Verhoeckx, N.: Digitale Signalverarbeitung. Wiesbaden: Vieweg 1990
Spezielle Literatur zu Kapitel 10 1. Siehe [1] zu Kap. 4 2. Zypkin, S.: Theorie der linearen Impulssysteme. München: Oldenbourg 1967 3. [Unbehauen, Regelungstechnik II] 4. Tustin, A.: Method of analysing the behaviour of linear systems in terms of time series. J. IEE 94, Part IIA (1947) 130–142 5. Jury, E.: Theory and application of the z-transform method. New York: Wiley 1964 6. [Föllinger, Abtastsysteme] 7. Takahashi, Y.; Chan, C.; Auslander, D.: Parametereinstellung bei linearen DDC-Algorithmen. Regelungstechnik 19 (1971) 237–244
Allgemeine Literatur zu Kapitel 11 Hippe, P.; Wurmthaler, Ch.: Zustandsregelung. Berlin: Springer 1985 Ludyk, G.: Theoretische Regelungstechnik Bd. 1 und Bd. 2. Berlin: Springer 1995 Ogata, K.: State space analysis of control systems. Englewood Cliffs, N.J.: Prentice-Hall 1967 Unbehauen, H.: Regelungstechnik II; siehe zu Kap. 9
Spezielle Literatur zu Kapitel 11 1. [Unbehauen, Regelungstechnik II] 2. Kalman, R.: On the general theory of control systems. Proc. 1st IFAC Congress, Moskau 1960, Bd. 1. München: Oldenbourg 1961, S. 481–492 3. [Unbehauen, Regelungstechnik III; siehe zu Kap. 12] 4. [Angermann, A., Beuschel, M.; Rau, M.; Wohlfarth, U.]
Allgemeine Literatur zu Kapitel 12 Eykhoff, P.: System identification. London: Wiley 1974 Gevers, M.; Li, G.: Parametrizations in control, estimation and filtering problems. Berlin: Springer 1993 Isermann, R.: Identifikation dynamischer Systeme. 2 Bde. 2. Aufl. Berlin: Springer 1992 Johansson, R.: System modeling and identification. New York: Prentice-Hall 1992 Juang, J.: Applied system identification. Englewood Cliffs, N.J.: Prentice-Hall 1994 Ljung, J.: System identification. 2nd ed. Englewood Cliffs, N.J.: Prentice-Hall 1999 Natke, H.G.: Einf. in Theorie und Praxis der Zeitreihen und Modalanalyse. 3. Aufl. Wiesbaden: Vieweg 1992 Sinha, N.; Rao, G.P.: Identification of continuoustime systems. Dortrecht: Kluwer 1991 Söderström, T.; Stoica, P.: System identification. New York: Prentice-Hall 1989 Unbehauen, H.: Regelungstechnik III: Identifikation, Adaption, Optimierung. 6. Aufl. Wiesbaden: Vieweg 2000 Unbehauen, H.; u.a.: Parameterschätzverfahren zur Systemidentifikation. München: Oldenbourg 1974 Unbehauen, H.; Rao, G. P.: Identification of continuous systems. Amsterdam: North-Holland 1987
Spezielle Literatur zu Kapitel 12 1. [Unbehauen, Regelungstechnik III] 2. Schwarze, G.: Algorithmische Bestimmung der Ordnung und Zeitkonstanten bei P-, I- und
Literatur
3. 4.
5.
6.
D-Gliedern. messen, steuern, regeln 7 (1964) 10–18 [Unbehauen/Rao] Unbehauen, H.: Kennwertermittlung von Regelsystemen an Hand des gemessenen Verlaufs der Übergangsfunktion. messen, steuern, regeln 9 (1966) 188–191 Unbehauen, H.: Bemerkungen zu der Arbeit von W. Bolte „Ein Näherungsverfahren zur Bestimmung der Übergangsfunktion aus dem Frequenzgang“. Regelungstechnik 14 (1966) 231–233 [Unbehauen, Regelungstechnik III]
Allgemeine Literatur zu Kapitel 13 Ackermann, J.: Robust control: Systems with uncertain physical parameters. New York: Springer 1993 Aström, K.; Wittenmark, B.: Adaptive control. Reading (Ma.): Addison-Wesley 1989 Aström, K.; Wittenmark, B.: Computer-controlled systems: Theory and design. London: Prentice-Hall 1990 Chalam, V.: Adaptive control systems. New York: Dekker 1987 Cichocki A.; Unbehauen, R.: Neural networks for optimization and signal processing. Chichester (UK): Wiley 1993 De Keyser, R.; Van de Velde, P.; Dumortier, F.: A comparative study of self-adaptive long-range predictive control methods. Automatica 24 (1988) 149–163 Goodwin, G.; Sin, K.: Adaptive filtering and control. Englewood Cliffs (N.J.): Prentice-Hall 1984 Harris, C.; Billings, S.: Self-tuning and adaptive control. London: P. Peregrinus 1981 Ioannou, P.; Sun, J.: Robust adaptive control. Upper Saddle River (N.J.): Prentice-Hall 1996 Isermann, R.; Lachmann, K.; Matko, D.: Adaptive control systems. New York: Prentice-Hall 1992 Kahlert, J.; Frank, H.: Fuzzy-Logik und FuzzyControl. Braunschweig: Vieweg 1993 Kiendl, H.: Fuzzy Control methodenorientiert. München: Oldenbourg 1997 King, R.: Computational intelligence in control engineering. New York: Dekker 1999 Koch, H.; Kuhn, T.; Wernstedt, J.: Fuzzy Control. München: Oldenbourg 1996
Krstic, M.; Kanellakopoulos, I.; Kokotovic, P.: Nonlinear and adaptive control design. New York: Wiley 1995 Landau, Y.: Adaptive control. New York: Dekker 1979 Levine, W. (ed.): The control handbook. Boca Raton (Fl.): CRC Press 1996 Lin, C.: Advanced control systems design. Englewood Cliffs: Prentice-Hall 1994 Maciejowski, J.: Predictive control with constraints. London: Prentice-Hall 2002 Martin-Sanchez, J; Rodellar, J.: Adaptive predictive control. London: Prentice-Hall 1996 Mosca, E.: Optimal predictive and adaptive control. London: Prentice-Hall 1995 Mutambara, A.: Design and analysis of control systems. Boca Raton (Fl.): CRC Press 1999 Narendra, K.; Annaswami, A.: Stable adaptive systems. Englewood Cliffs (N.J.): Prentice-Hall 1989 Nijmeijer, H.; van der Schaft, A.: Nonlinear dynamic control systems. Berlin: Springer 1990 Nise, N.: Control systems engineering. New York: Wiley 2000 Rawlings, J.: Tutorial overview of model predictive control. IEEE Contr. Syst. Magazine 20-3 (2000) 38–52 Sastry, S.; Bodson, M.: Adaptive control – Stability, convergence and robustness. Englewood Cliffs: Prentice-Hall (N.J.) 1998 Strietzel, R.: Fuzzy-Regelung. München: Oldenbourg 1996 Unbehauen, H.: Regelungstechnik III; siehe zu Kap. 12 Wellstead, P.; Zarrop, M.: Self-tuning systems. Chichester (UK): Wiley 1991 Zilouchian, A.; Jamshidi, M. (eds.): Intelligent control systems using soft computing methodologies. Boca Raton (Fl.): CRC Press 2001
Spezielle Literatur zu Kapitel 13 1. Smith, O.: A controller to overcome dead-time. ISA Journal 6-2 (1959) 28–33 2. Hang, C.C.: Smith predictor and modifications. In: H. Unbehauen (ed.): Control systems, robotics and automation–UNESCO-Encyclopedia of
I121
I122
I Regelungs- und Steuerungstechnik / Regelungstechnik
3.
4. 5. 6.
7.
8.
9.
10. 11. 12. 13.
14.
15. 16. 17.
18.
Life Support Systems (EOLSS). Oxford (UK): Eolss-Publishers (Internet) 2003 Francis, B.; Wonham, W.: The internal model principle for linear multivariable regulators. Applied Mathematics and Optimization 2 (1975) 170–194 Morari, M.; Zafiriou, E.: Robust process control. Englewood Cliffs (N.J.): Prentice-Hall 1989 Barmish, B.: New tools for robustness of linear systems. New York: Macmillan 1994 Bhattacharyya, S.; Chappelat, H.; Keel, L.: Robust control: The parametric approach. Upper Saddle River (N.J.): Prentice-Hall 1995 Zames, G.: Feedback and optimal sensitivity: Model reference transformations, multiplicative seminorms, and approximate inverses. IEEE Trans. AC 26 (1981) 301-320 Boyd, S.; Barratt, C.: Linear controller design: Limits of performance. Englewood Cliffs (N.J.): Prentice- Hall 1991 Kharitonov, V.: Über eine Verallgemeinerung eines Stabilitätskriteriums (russ.). Izvetiy Akademii Nauk Kazakhskoi SSR, Seria Fizikomatematicheskaia 26 (1978) 53–57 Camacho, E.; Bordons, C.: Model predictive control. London: Springer 1999 Soeterboek, A.: Predictive control: A unified approach. New York: Prentice-Hall 1992 Clarke, D.: Advances in model-based predictive control. New York: Oxford University Press 1994 Krämer, K.: Ein Beitrag zur Analyse und Synthese adaptiver prädiktiver Regler. Düsseldorf: VDIVerlag 1992 Chen, H.; Allgöwer, F.: Nonlinear model predictive control schemes with guaranteed stability. In: Berber, R.; Kravaris, C. (eds.): Nonlinear model based process control.Dordrecht: Kluwer Academic Publishers 1998 Halldorsson, U.: Synthesis of multirate nonlinear predictive control. Düsseldorf: VDI-Verlag 2003 [Unbehauen, Regelungstechnik III] Clarke, D.; Gawthrop, P.: Self-tuning controller. IEE Proc. Pt.D: Control Theory and Applications 122-9 (1975) 929–934 Annaswamy, A.: Model reference adaptive control. In: H. Unbehauen (ed.): Control systems, robotics and automation–UNESCO-Encyclopedia of Life Support Systems (EOLSS). Oxford (UK): Eolss-Publishers (Internet) 2003
19. Gawthrop, P.: Continuous-time self-tuning control. Vol. 1: Design. Lechworth (UK): Research Study Press 1987 20. [Unbehauen, Regelungstechnik III] 21. Anderson, B. et al.: Stability of adaptive systems. Cambridge (Ma.): M.I.T. Press, 1986 22. Aström, K.; Hägglund, T.: Automatic tuning of simple regulators with specification on phase and amplitude margins. Automatica 20 (1984) 645– 651 23. Filatov, N.; Unbehauen, H.: Adaptive dual control. Berlin: Springer 2004 24. Kokotovic, P.; Khalil, H.; O’Reilly, J.: Singular perturbation methods in control: Analysis and design. Philadelphia: SIAM 1999 25. Utkin, V.: Variable structure systems with sliding modes. IEEE Trans. AC 22 (1977) 212–222 26. Hung, J.Y.; Gao, W.; Hung, J.C.: Variable structure control. IEEE Trans. IE 40-1 (1993) 2–22 27. Khalil, H.: Nonlinear systems. Upper Saddle River (N.J.): Prentice-Hall 2002 28. Driankov, D.; Hellendorn, H.; Reinfrank, M.: An introduction to fuzzy control. Berlin: Springer 1993 29. Funahashi, K.: On the approximate realization of continuous mapping by neural networks. Neural Networks 2 (1989) 183–192 30. Harris, C.; Brown, M.; Bossley, M.; Milis, D.; Feng, M.: Advances in neurofuzzy algorithms for real-time modelling and control. Engng. Applic. Artif. Intell. 9 (1996) 1–16 31. Linkens, D.; Nyongesa, H.: Learning systems in intelligent control: An appraisal of fuzzy, neural and genetic control applications. IEE Proc. CTA 143 (1996) 367–386
Allgemeine Literatur zu Kapitel 14 Bonfatti, F.; Monari, P.D.; Sampieri, U.: IEC 1131-3 programming methodology. Seyssins: CJ International 1997 John, K.-H.; Tiegelkamp, M.: SPS-Programmierung mit IEC 1131-3. Berlin: Springer 1997 Lewis, R.W.: Programming industrial control systems using IEC 1131-3. London: The Institution of Electrical Engineers 1998 Pickhardt, R.: Grundlagen und Anwendungen der Steuerungstechnik. Braunschweig: Vieweg 2000
Literatur
Allgemeine Literatur zu Kapitel 1 bis 14 Früh, K.F. (ed.): Handbuch der Prozeßautomatisierung. München: Oldenbourg 2000 Singh, M.G. (ed.): Systems and control encyclopedia. Oxford: Pergamon Press 1987
Levine, W.S. (ed.): The Control Handbook. Boca Raton (Fl): CRC Press 1996 Unbehauen, H. (ed.): Component Encyclopedia of Control Systems Rolotics and Automation (ECSRA) of UNESCO-Encyclopedia of Life Support Systems (EOLSS). Oxford (UK): EOLSS-Publishes (Internet) 2003
I123
J1
Technische Informatik
In der Informatik verbindet sich das axiomatische, logisch-strukturtheoretische Denken der Mathematik mit dem konstruktiven und ökonomischen, d. h. praktisch-ingenieurmäßigen Handeln der Technik. Die Informatik ist daher sowohl eine Strukturwissenschaft, die abstrakt (und immateriell) betrieben wird, als auch eine Ingenieurwissenschaft, die sich konkret (und materiell) mit der Entwicklung, dem Bau und dem Betrieb technischer Produkte befasst. Von anderen Gebieten der Wissenschaften und der Technik unterscheidet sich die Informatik durch die Art dieser Produkte. Sie sind zum einen Hardware, die aufgrund ihrer materiellen Beschaffenheit nur schwer verändert werden kann, und zum andern Software, die – mechanistisch betrachtet – leicht zu verändern ist. Trotz ihrer gegensätzlichen Erscheinung sind Hardware und Software jedoch im Prinzip bis auf ein unvermeidliches Minimum an Rechenmaschine gegeneinander austauschbar.
In der Praxis existieren Hardware und Software nicht getrennt für sich, sondern bilden eine Einheit, wobei die Grenzziehung zwischen beiden von konstruktiven und ökonomischen Bedingungen abhängt. Diese Hardware-Software-Systeme erstrecken sich von kleinsten bis hin zu größten Anwendungen, die in ihrer Komplexität an die Grenzen der physikalischen Realisierbarkeit wie der intellektuellen Beherrschbarkeit stoßen. Wie in anderen Wissenschaften, so versucht man auch in der Informatik, das millionenfache Zusammenwirken ihrer „Atome“ (bei der Hardware die elektronischen Schalter, bei der Software die Befehle der Programme) durch modulare und hierarchische Gliederung, d. h. durch wiederholte Abstraktion zu beherrschen. Dieser mit Technische Informatik überschriebene Teil J orientiert sich am Computer als dem technischen Repräsentanten der Informatik. Er beginnt mit einer kurzen Einführung in wichtige theoretische
Tabelle. Historische Entwicklung von Hardware und Software
Generation 1
Entwicklung der Hardware Bis Ende der fünfziger Jahre Elektronenröhren als Schaltelemente; zentrale Speicher von wenigen hundert Maschinenwörtern.
Entwicklung der Software Bis Ende der fünfziger Jahre Assemblercode; einfachste Betriebssysteme; lochkartenorientierter Einzelbetrieb.
2
Seit Anfang der sechziger Jahre Transistorschaltkreise; Ferritkern-, Band-, Trommel-, Plattenspeicher.
Seit Anfang der sechziger Jahre FORTRAN, ALGOL 60, COBOL; umfangreichere Betriebssysteme; lochkartenorientierter Stapelbetrieb.
3
Seit Mitte der sechziger Jahre Teilweise integrierte Schaltkreise.
Seit Mitte der sechziger Jahre PL/I, Pascal, APL, C; Hochkomplexe Betriebssysteme; dialogorientierter Mehrbenutzerbetrieb.
J Technische Informatik
J
H. Liebig Th. Flik P. Rechenberg H. Mössenböck
J2
J Technische Informatik / Mathematische Modelle
Tabelle. (Fortsetzung)
Generation 4
Entwicklung der Hardware Seit Anfang der siebziger Jahre Überwiegend hochintegrierte Schaltkreise; Halbleiterspeicher; 8-Bit-Prozessoren auf einem Chip, 1 000 bis 10 000 Transistorfunktionen, Taktfrequenzen um 1 MHz.
Entwicklung der Software Seit Anfang der achtziger Jahre Programmiersprachen: Modula-2, Ada, Lisp, Prolog; Programmierumgebungen mit grafischer Benutzeroberfläche; hochentwickelte Textverarbeitungs- und Grafikprogramme.
5
Seit Anfang der achtziger Jahre Hochintegrierte Schaltkreise; 16- und 32-Bit-Prozessoren auf einem Chip, bis zu 200 000 Transistorfunktionen, Taktfrequenzen um 8 MHz.
Seit Anfang der neunziger Jahre Vordringen der objektorientierten Programmierung; Programmiersprachen: C++ und Java; Vereinigung der Verarbeitung von Text-, Audio- und Videodaten (Multimedia); Ausnutzung des Internets und seiner Kommunikationsmöglichkeiten (z. B. elektronische Post).
Seit den neunziger Jahren 32- und 64-Bit-Prozessoren mit integrierten Caches und interner Parallelverarbeitung, bis zu 500 Millionen Transistorfunktionen, Taktfrequenzen von mehreren GHz. Im neuen Jahrhundert Stromsparende Prozessoren; mehrere Prozessorkerne auf einem Chip, Kerne mit Multithreading, bis zu 2 Milliarden Transistorfunktionen.
Konzepte, den Mathematischen Modellen, fährt fort mit der Beschreibung des Zusammenwirkens der elektronischen Schaltungen, den Digitalen Systemen, behandelt dann Struktur- und Betriebsaspekte in Rechnern, d. h. die Rechnerorganisation, und schließt mit der Nutzbarmachung von Rechenanlagen für die verschiedensten Anwendungen, d. h. mit ihrer Programmierung. Dabei bleiben ent-
Im neuen Jahrhundert C#; Integrierte Softwareentwicklungsumgebungen; Programmkommunikation über das Internet.
sprechend dem Grundlagencharakter des Werkes besondere, nur für bestimmte Anwendungsgebiete relevante Computersysteme und -programme ausgespart. Zur Kennzeichnung der historischen Entwicklung von Hardware und Software hat sich eine Einteilung in Generationen eingebürgert, die in der voranstehenden Tabelle skizziert ist.
1 Boole’sche Algebra
Mathematische Modelle H. Liebig, P. Rechenberg 1 Boole’sche Algebra Die Boole’sche Algebra wurde 1854 von G. Boole zur Formalisierung der Aussagenlogik formuliert und 1938 von C. Shannon auf die Beschreibung von Funktion und Struktur sog. kombinatorischer Relais-Schaltungen angewendet. Seither wird sie zum Entwurf digitaler Rechensysteme eingesetzt. – Die Entsprechung zwischen falschen und wahren Aussagen in der Logik (Aussage x = falsch/wahr) und offenen und geschlossenen Schaltern in der Technik (Schalter x = offen/geschlossen) bildet die Grundlage des Rechnerbaus. Mit der Boole’schen Algebra können nämlich sowohl Aussagenverknüpfungen als auch Schalterverknüpfungen beschrieben werden (Boole’sche Variable x = 0/1).
oder ⊕), die Äquivalenz (ÄQUIVALENT; Operationszeichen: ↔ oder ≡) sowie die Implikation (IMPLIZIERT, Operationszeichen: → oder ⊃). Antivalenz y = x1 ↔ | x2 : y = 1, wenn entweder x1 = 1 oder x2 = 1 (d. h., x1 ist ungleich x2 ). Äquivalenz y = x1 ↔ x2 : y = 1, wenn x1 äquivalent x2 (d. h., x1 ist gleich x2 ). Implikation y = x1 → x2 : y = 1, wenn x1 impliziert x2 (d. h., x2 bezieht x1 ein bzw. x2 ist größer/gleich x1 ). Tabelle 1-1. Logische Operationen; Wahrheitstabellen, Formeln, Symbole
1.1 Logische Verknüpfungen und Rechenregeln 1.1.1 Grundverknüpfungen
Die wichtigsten Grundoperationen sind in Tabelle 1-1 dargestellt. Zu ihnen zählen die Negation (NICHT, NOT; Operationszeichen: Überstreichungen oder vorangestelltes ¬), die Konjunktion (UND, AND; Operationszeichen: · oder ∧) und die Disjunktion (ODER, OR; Operationszeichen + oder ∨). Diese sog. Boole’schen Grundverknüpfungen stehen einerseits für Verbindungen von „Ja-/Nein-Aussagen“ (z. B. umgangssprachlichen Sätzen, die nur wahr oder falsch sein können), können aber andererseits auch als Verknüpfungen binärer Systemzustände (z. B. von elektrischen Signalen) angesehen werden (siehe 3.1). Negation y = x¯ : y = 1, wenn nicht x = 1 (d. h., y = 1, wenn x = 0). Konjunktion y = x1 · x2 : y = 1, wenn x1 = 1 und x2 = 1. Disjunktion y = x1 + x2 : y = 1, wenn x1 = 1 oder x2 = 1. Weitere Grundverknüpfungen sind die Antivalenz (ENTWEDER ODER, XOR; Operationszeichen: ↔ |
1.1.2 Ausdrücke
Logische Konstanten, Aussagenvariablen, Grundverknüpfungen und aus ihnen zusammengesetzte komplexere Verknüpfungen werden zusammenfassend als Ausdrücke bezeichnet. In Analogie zu arithmetischen Ausdrücken ist festgelegt, dass · Vorrang vor + hat.
J3
J4
J Technische Informatik / Mathematische Modelle
Ferner ist es weithin üblich, den Bereich einer Negation durch Überstreichung anzugeben und, wenn es nicht zu Verwechslungen kommen kann, Malpunkte wegzulassen. Klammern dürfen jedoch nur dann weggelassen werden, wenn für die eingeklammerte Verknüpfung das Assoziativgesetz gilt (das ist für ·, +, ↔ und ↔ | der Fall, nicht jedoch für →). – Werden Ausdrücke mit den Symbolen der Tabelle 1-1 dargestellt, so wird ihre „Klammerstruktur“ durch die Symbolstufung besonders anschaulich (vgl. z.B. die Gleichung und das Blockbild für y1 in Bild 1-1). Die Vielfalt der Darstellungsmöglichkeiten erlaubt es, einzelne Operationen durch andere zu beschreiben. Eine gewisse Standardisierung ergibt sich, wenn nur die Operationen − , · und + benutzt werden; ↔ | ,↔ und → lassen sich damit folgendermaßen ausdrücken (vgl. die Tabellen 1-1d bis f für die drei Grundverknüpfungen Antivalenz, Äquivalenz und Implikation) x1 ↔ | x2 = x¯1 · x2 + x1 · x¯2 , x1 ↔ x2 = x¯1 · x¯2 + x1 · x2 , x1 → x2 = x¯1 + x2 . Zur Auswertung von Ausdrücken legt man Tabellen an: Links werden im Spaltenkopf die im Ausdruck vorkommenden Variablen und zeilenweise sämtliche Kombinationen von 0 und 1 eingetragen. Rechts werden für alle diese Kombinationen die Werte der Teilausdrücke so lange ausgewertet und niedergeschrieben, bis der Wert des Ausdrucks feststeht. Tabelle 1-2 gibt ein Beispiel.
Auswertung.
Tabelle 1-2. Auswertung der Ausdrücke a · b + c und (a +
c) · (b + c); beide haben für alle 0/1-Kombinationen von a, b und c die gleichen Werte, d. h., es gilt a·b+c = (a+c)·(b+c)
1.1.3 Axiome
Die folgenden Axiome (1-1a) bis (1-5b) definieren mit den Variablen a, b, c, den Konstanten 0, 1 und den Operationen −, ·, + die Boole’sche Algebra, die sich durch abweichende Rechenregeln und Operationen sowie durch das Fehlen von Umkehroperationen von der gewöhnlichen Algebra unterscheidet. a·b=b·a,
(1-1a)
a+b=b+a,
(1-1b)
(a · b) · c = a · (b · c) ,
(1-2a)
(a + b) + c = a + (b + c) ,
(1-2b)
(a + b) · c = a · c + b · c ,
(1-3a)
a · b + c = (a + c) · (a + c) ,
(1-3b)
a·1=a,
(1-4a)
a+0=a,
(1-4b)
a · a¯ = 0 ,
(1-5a)
a + a¯ = 1 .
(1-5b)
Axiome (1-1a) und (1-1b) erlauben das Vertauschen von Operanden (Kommutativgesetze); Axiome (1-2a) und (1-2b) das Weglassen von Klammern (Assoziativgesetze), solange nicht + und ·, wie in den Axiomen (1-3a) und (1-3b), gemischt auftreten (Distributivgesetze). Der durch (1-3a) beschriebene Vorgang wird auch als „Ausmultiplizieren“, in Analogie dazu der durch (1-3b) beschriebene als „Ausaddieren“ bezeichnet. Axiome (1-4a) und (1-4b) definieren das 1-Element und das 0-Element (Existenz der neutralen Elemente); Axiom (1-5a) mit (1-5b) definiert die „Überstreichung“ (Existenz des Komplements). – Dass die Axiome für die in Tabelle 1-1 definierten logischen Operationen gültig sind, lässt sich durch Auswertung der Ausdrücke auf beiden Seiten des Gleichheitszeichens zeigen (siehe z. B. Tabelle 1-2 für (1-3b)). Dualität. Den Axiomen ist eine Symmetrie zu ei-
gen, die durch ihre paarweise Nummerierung betont ist. Sie ist gekennzeichnet durch Vertauschen von · und + sowie 0 und 1 und wird als Dualität bezeichnet. Wenn, wie in (1-1a) bis (1-5b), zwei Ausdrücke äquivalent sind, so sind es auch die jeweiligen dualen
1 Boole’sche Algebra
Ausdrücke. Dieses Dualitätsprinzip gilt nicht nur für die Axiome, sondern auch für alle Sätze. 1.1.4 Sätze
Aus den Axiomen der Boole’schen Algebra lässt sich eine Reihe von Sätzen ableiten, die zusammen mit den Axiomen als Rechenregeln zur Umformung von Ausdrücken dienen. (Einfacher als aus den Axiomen sind die Sätze durch Auswertung beider Gleichungsseiten zu beweisen.) a·a=a, 0·a=0,
a+a=a, 1+a=1,
a + a · b = a , a · (a + b) = a , a + a¯ · b = a + b , a · (¯a + b) = a · b , a · b = a¯ + b¯ , a + b = a¯ · b¯ ,
Tabelle 1-3. Tabellendarstellungen einer Funktion. a Darstellung von f : E → A mit Elementen von Mengen; b Darstellung von f, aufgefasst als eine Funktion y = f (x) mit den Werten Boole’scher Vektoren bzw. als zwei Funktionen y1 = f1 (x1 , x2 , x3 ) und y2 = f2 (x1 , x2 , x3 ) mit den Werten Boole’scher Variablen
(6a,b) (7a,b) (8a,b) (9a,b) (10a,b)
a¯ = a .
(11)
Sätze (6) bis (9) erlauben es, Boole’sche Ausdrücke zu vereinfachen bzw. Schaltungen hinsichtlich ihres Aufwands zu minimieren; (10a) und (10b), die De-Morgan’schen Regeln, erlauben es zusammen mit (11), die Operationen NICHT, UND und ODER durch NAND (negated AND) oder NOR (negated OR) auszudrücken, d. h. Schaltungen nur aus NAND-Schaltkreisen (siehe Bild 1-2c) oder nur aus NOR-Schaltkreisen (siehe Bild 1-2d) aufzubauen.
1.2 Boole’sche Funktionen 1.2.1 Von der Mengen- zur Vektordarstellung
Eine Funktion f bildet eine Menge E von Eingangselementen (Eingabemenge, Urmenge) in eine Menge A von Ausgangselementen (Ausgabemenge, Bildmenge) ab, formal beschrieben durch (vgl. A 2.5.1) f: E → A , wobei es sich hier stets um Mengen mit diskreten Elementen handelt. Zur Beschreibung von Funktionen gibt es eine Vielzahl an Darstellungsmitteln. Wenn die Anzahl der Eingangselemente nicht zu groß ist, bedient man sich gerne der Tabellendarstellung. Bei der in Tabelle 1-3a definierten Funktion sind zwar alle Eingangs- und Ausgangselemente aufgeführt, aber
über ihre Art ist nichts ausgesagt; sie ergibt sich aus der jeweiligen Anwendung. In der elektronischen Datenverarbeitung sind die Elemente wegen der heute verwendeten Schaltkreise binär codiert, d. h., jedes Element von E und von A ist umkehrbar eindeutig durch 0/1-Kombinationen verschlüsselt; auf diese Weise entstehen aus den Eingangselementen Boole’sche Eingangsvariablen. Tabelle 1-3b zeigt eine Codierung für die in Tabelle 1-3a definierte Funktion. Beschreibung mit Boole’schen Vektoren. Funktio-
nen mit binär codierten Elementen lassen sich durch Boole’sche Ausdrücke beschreiben, sie heißen dann Boole’sche Funktionen. Ihre Realisierung mit Schaltern (i. Allg. Transistoren) bezeichnet man als Schaltnetze (siehe 3). Im einfachsten Fall ist eine Boole’sche Funktion von n Veränderlichen eine Abbildung der 0/1Kombinationen der n unabhängigen Variablen x1 , x2 , . . . , xn (Eingangsvariablen, zuweilen auch kurz: Eingänge) in die Werte 0 und 1 einer abhängigen Variablen y (Ausgangsvariable, zuweilen kurz: Ausgang). Fasst man die Eingangsvariablen zu einem Boole’schen Vektor zusammen (Eingangsvektor x), so lässt sich dies kompakt durch y = f (x) beschreiben. Liegen m Funktionen y1 = f1 (x), . . . , ym = fm (x) mit m Ausgangsvariablen vor (Ausgangsvektor y), so lassen sich diese ebenso zusammenfassen und durch y = f (x) beschreiben. Es entsprechen sich also f: E → A
und
y = f (x) .
J5
J6
J Technische Informatik / Mathematische Modelle
Darin sind die binär codierten Elemente von E die Werte von x und die binär codierten Elemente von A die Werte von y. Eine Funktion, bei der für sämtliche 0/1-Kombinationen ihrer Eingangsvariablen die Funktionswerte ihrer Ausgangsvariable(n) definiert sind heißt vollständig definiert (totale Funktion), andernfalls unvollständig definiert (partielle Funktion). 1.2.2 Darstellungsmittel
Für Boole’sche Funktionen sind verschiedene Darstellungsformen möglich, die meist ohne Informationsverlust ineinander transformierbar sind. Deswegen bedeutet der Entwurf eines Schaltnetzes i. Allg. die Transformation von verbalen Angaben über die Funktion in eine wirtschaftlich akzeptable Schaltung für die Funktion; d. h. die Transformation der Beschreibung ihrer Funktionsweise in die Beschreibung ihrer Schaltungsstruktur.
Tafeln, wie der Vektor Komponenten hat. – Bei unvollständig definierten Funktionen entsprechen den nicht definierten Wertezuordnungen leere Felder (Leerstellen), sie werden auch als „don’t cares“ bezeichnet und spielen bei der Minimierung von Funktionsgleichungen eine wichtige Rolle. (Bild 1-1b). In der Gleichungsdarstellung stehen die Ausgangsvariablen links des Gleichheitszeichens, und die Eingangsvariablen erscheinen innerhalb von Ausdrücken rechts des Gleichheitszeichens. Bei mehreren Ausgangsvariablen hat das Gleichungssystem so viele Gleichungen, wie der Ausgangsvektor Komponenten hat. – Bei unvollständig definierten Funktionen kann der eingeschränkte Gültigkeitsbereich einer Gleichung als Bedingung ausgedrückt werden.
Gleichungen
Tabellen (Wertetabellen, Wahrheitstabellen; Tabel-
le 1-3b). In der Tabellendarstellung steht in jeder Zeile links eine 0/1-Kombination der Eingangsvariablen (ein Wert des Eingangsvektors, Eingangswert), der rechts die zugehörigen Werte der Ausgangsvariablen (der Wert des Ausgangsvektors, Ausgangswert) zugeordnet sind. Tabellenzeilen mit demselben Ausgangswert werden manchmal zu einer Zeile zusammengefasst, wobei eine Eingangsvariable, die den Ausgangswert nicht beeinflusst, durch einen Strich in der Tabelle gekennzeichnet wird. – Bei unvollständig definierten Funktionen sind die nicht definierten Wertezuordnungen nicht in der Tabelle enthalten. Tafeln (Karnaugh-,Veitch-, auch kurz KV-Diagramme; Bild 1-1a). Bei der Tafeldarstellung sind die Eingangsvariablen entsprechend der matrixartigen Struktur der Tafeln in zwei Gruppen aufgeteilt. Die 0/1-Kombinationen der einen Gruppe werden nebeneinander den Spalten, die der anderen Gruppe zeilenweise untereinander den Zeilen der Tafel zugeordnet. Jede Tafel hat so viele Felder, wie es mögliche Kombinationen der Eingangswerte gibt, d. h. bei n Variablen 2n Felder. In die Felder werden die Ausgangswerte eingetragen: entweder zusammengefasst als Vektor in eine einzige Tafel oder als dessen einzelne Komponenten in so viele
Bild 1-1. Darstellungsmittel für Boole’sche Funktionen am Beispiel der Funktion in Tabelle 1-3b. a Tafeln; b Glei-
chungen; c Blockbilder. Die abgebildeten Funktionen sind in mehrfacher Weise interpretierbar: 1. y1 = 1, wenn 2 oder mehr der 3 Kandidaten xi zustimmen (2-aus-3-Voter), 2. y2 = 1, wenn die Quersumme der Dualzahl x3 x2 x1 ungerade ist (Paritätsprüfung), 3. y1 als Übertrag und y2 als Summe bei der Addition der drei Dualziffern x1 , x2 , x3 (Volladdierer, siehe 3.2.2)
1 Boole’sche Algebra
Blockbilder (Strukturbilder, Schaltbilder; Bild 1-1c).
Blockbilder beschreiben sowohl die formelmäßige Gliederung wie die schaltungsmäßige Struktur einer Boole’schen Funktion und haben somit eine Brückenfunktion beim Schaltnetzentwurf. Sie werden z. B. mit den in Tabelle 1-1 dargestellten Symbolen gezeichnet, die entsprechend der „Klammerstruktur“ miteinander zu verbinden sind. Die Eingangsvariablen sind die Eingänge des Schaltnetzes. Die Negation einer Variablen wird entweder durch einen Punkt am Symbol oder durch Überstreichung der Variablen dargestellt. Die Ausgangsvariablen sind die Ausgänge des Schaltnetzes. – Im Blockbild kann die Eigenschaft einer Funktion, unvollständig definiert zu sein, nicht zum Ausdruck gebracht werden. Nicht alle der aufgeführten Darstellungsmittel sind unbeschränkt anwendbar. Tabellen sind durch ihre Zeilenzahl begrenzt. Zeilen mit gleichen Ausgangswerten werden deshalb gerne zu einer Zeile zusammengefasst. Tafeln sind auf etwa sechs bis acht Eingangsvariablen begrenzt. Gleichungen bedürfen einer gewissen Übersichtlichkeit; sie lassen vektorielle Beschreibungen nur sehr eingeschränkt zu. – Bei umfangreichen Aufgabenstellungen abstrahiert man deshalb von der Boole’schen Algebra und wählt anwendungsspezifische Beschreibungsformen, z. B. die in höheren Programmiersprachen oder auf der sog. Registertransfer-Ebene üblichen Ausdrucksmittel (siehe 4), wie die Gleichung Z = X + Y bzw. ein „+“-Kästchen oder das „+“-Zeichen für die Addition von zwei Dualzahlen (siehe z. B. in Bild 4-10). Sie sind Ausgangspunkt für den Entwurf von operativen Schaltnetzen, wie die folgende Kette von Darstellungstransformationen zeigt: „+“-Zeichen in Bild 4-10 → Bild 3-1a → Bild 3-1b → Bild 1-1a → Bild 1-1b → Bild 1-1c in der 3. Interpretation.
Verallgemeinerung der Darstellungsmittel.
1.3 Normal- und Minimalformen 1.3.1 Kanonische Formen Boole’scher Funktionen
Unter den zahlreichen Möglichkeiten, eine Boole’sche Funktion durch einen Boole’schen Ausdruck zu beschreiben, gibt es bestimmte, die sich durch Übersichtlichkeit und Einfachheit besonders auszeichnen.
Normalformen. Jede Boole’sche Funktion kann in zwei charakteristischen Formen geschrieben werden: 1. als disjunktive Normalform, das ist eine i. Allg. mehrstellige Disjunktion (ODER-Verknüpfung) von i. Allg. mehrstelligen Konjunktionstermen (UNDVerknüpfungen): Bild 1-2a; 2. als konjunktive Normalform, das ist eine i. Allg. mehrstellige Konjunktion (UND-Verknüpfung) von i. Allg. mehrstelligen Disjunktionstermen (ODER-Verknüpfungen): Bild 1-2b. Die disjunktive Normalform kann mit NANDGliedern (Bild 1-2c) und die konjunktive Normalform mit NOR-Gliedern (Bild 1-2d) dargestellt werden. Das ist deshalb wichtig, weil in der Technik vielfach nur NOR- oder NAND-Schaltkreise zur Verfügung stehen. Die Eingangsvariablen sind unmittelbar in normaler oder negierter Form an die Verknüpfungsglieder angeschlossen (man beachte den Wechsel der Überstreichung bei x4 ).
Enthalten alle Terme einer Normalform sämtliche Variablen der
Ausgezeichnete Normalformen.
Bild 1-2. Blockbilder von Normalformen sowie davon ab-
geleiteter Formen. a Disjunktive Normalform (hier y1 = x1 x2 x3 + x2 x¯3 + x¯4 ); b konjunktive Normalform (hier y2 = (x1 + x2 + x3 ) · (x2 + x¯3 ) · x¯4 ); c NAND/NAND-Form; d NOR/NOR-Form. Die in a und b bzw. c und d abgebildeten Formen sind jeweils dual, nicht äquivalent. Die in a und c bzw. b und d abgebildeten Formen sind hingegen äquivalent
J7
J8
J Technische Informatik / Mathematische Modelle
Funktion genau einmal (normal oder negiert) und sind gleiche Terme nicht vorhanden, so liegt eine eindeutige Struktur vor, die als ausgezeichnete disjunktive bzw. ausgezeichnete konjunktive Normalform bezeichnet wird. – Jede Boole’sche Funktion lässt sich von einer in die andere Normalform umformen, mit den angegebenen Rechenregeln allerdings z. T. nur unter erheblichem Rechenaufwand; besser geht es unter Zuhilfenahme von Tafeln. 1.3.2 Minimierung von Funktionsgleichungen
Die Minimierung von Funktionsgleichungen dient zur Vereinfachung von Schaltnetzen. Sie hat heute wegen der geringeren Kosten der Transistoren innerhalb hochintegrierter Schaltungen nicht mehr die Bedeutung wie früher. Trotzdem wird sie beim Schaltungsentwurf, insbesondere beim automatisierten, computergestützten Entwurf, zur optimalen Nutzung der Chipfläche eingesetzt; und auch in der Programmierung, z. B. zur übersichtlicheren Formulierung bedingter Anweisungen, kann sie nützlich sein. Die Minimierung besteht aus zwei Teilen: 1. dem Aufsuchen sämtlicher Primimplikanten, das ergibt UND-Verknüpfungen mit wenigen Eingängen, und 2. der Ermittlung der minimalen Überdeckung der Funktion, das ergibt wenige UND-Verknüpfungen und damit auch eine ODER-Verknüpfung mit wenigen Eingängen. Primimplikant. Für jeden Konjunktionsterm einer
Boole’schen Funktion in disjunktiver Normalform gilt, dass, wenn er den Wert 1 hat, auch die Funktion selbst den Wert 1 hat. Mit anderen Worten, jeder Konjunktionsterm impliziert die Funktion, man sagt, er ist Implikant der Funktion. Lässt sich aus einem solchen Implikanten keine Variable herausstreichen, ohne den Funktionswert zu ändern, so heißt er Primimplikant oder Primterm. In der Tafel sind Primterme anschaulich „rechteckige“ Felder (ggf. unzusammenhängend) mit „maximal vielen“ Einsen unter Einbeziehung von Leerstellen, die sich durch einen einzigen Konjunktionsterm darstellen lassen ¯ cd, ¯ abc ¯ und ad (auch abc ¯ und bd), (z. B. sind a¯ b¯ ¯ ¯ nicht aber z. B. abcd Primterme der Funktion f entsprechend den drei (fünf) umrandeten Feldern in Bild 1-3).
Bild 1-3. Tafeln unvollständig definierter Funktionen f und
f¯ mit vier Variablen. Die gestrichelt eingerahmten Primtermfelder sind zur Gleichungsdarstellung der Funktion unnötig
Minimale Überdeckung. Alle Konjunktionsterme
einer Funktion, disjunktiv zusammengefasst, stellen die Funktion in ihrer Gesamtheit dar, man sagt, sie bilden eine Überdeckung der Funktion. Lässt sich aus einer solchen Überdeckung kein Term streichen, ohne die Funktion zu ändern, so heißt sie minimale Überdeckung. In der Tafel gibt es dann kein umrandetes Feld, das durch zwei oder mehrere ¯ cd¯ + a¯ bc + ad, andere „erzeugt“ wird (z. B. ist f = a¯ b¯ ¯ ¯ nicht aber f = a¯ b¯cd + a¯ bc + ad + bd, eine minimale Überdeckung der Funktion f aus Bild 1-3). Minimale Normalform. Die
Minimierung führt gewöhnlich auf minimale disjunktive Normalformen. Programmierbare Verfahren zur exakten Minimierung folgen strikt der oben beschriebenen Zweiteilung (siehe z. B. [1]). Bei programmierten heuristischen Verfahren (siehe z. B. [2]) sowie bei manuellen grafischen Verfahren werden hingegen meist beide Teile zusammengefasst, wobei in Kauf genommen wird, gelegentlich nicht ganz das absolute Minimum an Verknüpfungen zu erhalten. Zur grafischen Minimierung wird die Funktion als Tafel dargestellt, und es werden alle jene Konjunktionsterme disjunktiv verknüpft herausgeschrieben, die jeweils maximal viele Einsen/Leerstellen umfassen, und zwar so lange, bis alle Einsen der Tafel berücksichtigt sind (z. B. entsteht gemäß Bild 1-3 ¯ – Der hier skizzierte Minimief = ad + a¯ bc + a¯ d¯c¯ d). rungsprozess bezieht sich auf Funktionen mit einem Ausgang. Funktionen mit mehreren Ausgängen werden grafisch komponentenweise, algorithmisch hingegen als Ganzes minimiert. Solche Funktionen spielen bei der Chipflächenreduzierung von Steuerwerken (siehe 4.4.1) eine gewisse Rolle.
1 Boole’sche Algebra
Die Minimierung wird auch beim Rechnen mit Boole’schen Funktionen angewendet, da es anderenfalls äußerst mühsam wäre, „don’t cares“ in den Rechenprozess einzubeziehen. ¯ cd¯ + a¯ bc + ad negierBeispiel: Es soll die zu f = a¯ b¯ te Funktion f¯ gebildet werden, und zwar unter Berücksichtigung der „don’t cares“ aus Bild 1-3. Nach Ablesen der „günstigsten“ Primterme ergibt sich f¯ = ¯ + ad¯ + b¯c + c¯d. a¯ bc „Rechnen“ mit Tafeln.
1.4 Boole’sche Algebra und Logik In der mathematischen Logik wird die Boole’sche Algebra zur Beschreibung der logischen Struktur von Aussagen benutzt. Statt der Symbole 0 und 1 benutzt man deshalb meist falsch und wahr, F und W bzw. in den Programmiersprachen false und true oder F und T. In der mathematischen Logik sind die folgenden Symbole üblich: Negation ¬, Konjunktion ∧, Disjunktion ∨, Implikation →, Äquivalenz ↔. Aus Gründen der Einheitlichkeit wird im Folgenden hier auch die Symbolik der Boole’schen Algebra, d. h. auch die der Schaltalgebra benutzt. Der Satz: „Wenn die Sonne scheint und es warm ist oder wenn ich müde bin und nicht schlafen kann, gehe ich spazieren.“ ist eine logische Verknüpfung der elementaren Aussagen „Die Sonne scheint“ (A), „Es ist warm“ (B), „Ich bin müde“ (C), „Ich kann schlafen“ (D), „Ich gehe spazieren“ (E). Er wird als Formel der Aussagenlogik so geschrieben:
Beispiel.
(A ∧ B) ∨ (C ∧ ¬D) → E
bzw. (A · B +C · D) → E .
betrachtet nur die Verknüpfungen elementarer Aussagen, d. h. ganzer Sätze. In der Prädikatenlogik kommt die Aufteilung der Sätze in Subjekte (Individuen) und Prädikate (Boole’sche Funktionen von Subjekten) und die Einführung von Quantoren hinzu. Da sich logische Formeln nach den Regeln der Boole’schen Algebra kalkülmäßig transformieren, z. B. vereinfachen oder in Normalformen überführen lassen, spricht man auch von Aussagen- und Prädikatenkalkül. Die folgenden Ausführungen beziehen sich hauptsächlich auf die einfachere, für viele Anwendungen aber ausreichende Aussagenlogik. Die Wahrheit einer zusammengesetzten Formel der Aussagenlogik hängt nur von der Wahrheit ihrer Elementaraussagen ab. Dabei sind drei Fälle zu unterscheiden: Allgemeingültigkeit (Tautologie): Die Formel ist, unabhängig von der Wahrheit ihrer Elementaraussagen, immer wahr. Beispiel: „Wenn der Hahn kräht auf dem Mist, ändert sich das Wetter, oder es bleibt, wie es ist.“ (H → W + W). Unerfüllbarkeit (Kontradikation): Die Formel ist, unabhängig von der Wahrheit oder Falschheit ihrer Elementaraussagen, immer falsch. Beispiel: „Der Hahn kräht auf dem Mist und kräht nicht auf dem Mist.“ (H · H). Erfüllbarkeit: Es gibt mindestens eine Belegung der Elementaraussagen mit wahr oder falsch, die die Formel wahr macht. Beispiel: „Wenn der Hahn kräht auf dem Mist, ändert sich das Wetter.“ (H → W). Wenn X eine Formel der Aussagen- oder Prädikatenlogik ist, gelten folgende wichtige Beziehungen: X ist allgemeingültig ↔ X ist unerfüllbar
1.4.1 Begriffe
X ist unerfüllbar ↔ X ist allgemeingültig
In der formalen Logik wird allein die Struktur von Aussagen betrachtet, nicht die Frage, ob sie inhaltlich wahr oder falsch sind. Die klassische formale Logik lässt für jede Aussage nur die beiden Möglichkeiten wahr und falsch zu („tertium non datur“); andere Logiksysteme (intuitionistische Logik, mehrwertige Logik, modale Logik) lockern diese Einschränkung. In der klassischen Logik unterscheidet man Aussagenlogik und Prädikatenlogik. Die Aussagenlogik
X ist erfüllbar ↔ X ist nicht allgemeingültig Die große Bedeutung der formalen Logik für Mathematik und Informatik beruht vor allem darauf, dass sich mit ihr die Begriffe des logischen Schließens und des mathematischen Beweisens formal fassen lassen. Darauf bauen Verfahren zum automatischen Beweisen und die sog. logischen Programmiersprachen, wie Prolog, auf.
J9
J10
J Technische Informatik / Mathematische Modelle
1.4.2 Logisches Schließen und mathematisches Beweisen in der Aussagenlogik
Die einfachste Form des logischen Schließens bildet die Implikation A → B (Bild 1-4). Sie spielt deshalb eine zentrale Rolle in der Logik. Axiome sind ausgewählte wahre Aussagen. Ein (mathematischer) Satz ist eine Aussage, die durch logisches Schließen aus Axiomen folgt. Die Aussage „B folgt aus den Axiomen A1 , A2 , . . . , An “ lautet damit A1 · A2 · . . . · An → B . Sie ist dann und nur dann ein Satz (Theorem), wenn mit der Wahrheit von A1 , A2 , . . . , An , zugleich auch B wahr ist, d. h., wenn sie allgemeingültig ist. Umgekehrt gilt: Wenn man zeigen kann, dass eine Formel X allgemeingültig ist, so ist X ein Satz, und man hat X bewiesen. Der Beweis kann auch indirekt geführt werden, indem man nachweist, dass X unerfüllbar ist. Aus diesem Grund ist der Nachweis der Allgemeingültigkeit oder der Unerfüllbarkeit von zentraler Bedeutung. Alle Axiome der Boole’schen Algebra (siehe 1.1.3) sind allgemeingültige Aussagen. Weitere wichtige Beispiele aussagenlogischer Sätze: ((A → B) · A) → B ((A → B) · B) → A (A · (B → A)) → B (A → B) ↔ (B → A) ((A + B) · (A + C)) → (B + C)
Modus ponens (Abtrennungsregel) Modus tollens Indirekter Beweis (durch Widerspruch) Kontraposition Resolution
Für das Beweisen einer Formel X der Aussagenlogik stehen folgende vier Verfahren zur Verfügung, die alle in jedem Fall zum Ziel führen. Da sich aus n beteiligten Elementaraussagen maximal 2n Kombinatio-
nen von wahr und falsch bilden lassen, wächst ihre Ausführungszeit in ungünstigen Fällen exponentiell mit n (Zeitkomplexität O(2n ), vgl. 10.4). 1. Durch Exhaustion. Man belegt die n Elementaraussagen mit den Werten wahr und falsch in allen Kombinationen und prüft, ob X für alle Belegungen wahr ist. 2. Mit der konjunktiven Normalform. Man transformiert X in die konjunktive Normalform. X ist dann allgemeingültig, wenn in der konjunktiven Normalform alle Disjunktionen eine Elementaraussage und zugleich ihre Negation enthalten. 3. Mit der disjunktiven Normalform. Man transformiert X in die disjunktive Normalform. X ist dann allgemeingültig, wenn in der disjunktiven Normalform von X alle Konjunktionen eine Elementaraussage und zugleich ihre Negation enthalten. 4. Durch Resolution. Man transformiert X in die konjunktive Normalform. In ihr sucht man ein Paar von Disjunktionen, in denen eine Elementaraussage bejaht und negiert vorkommt, zum Beispiel (A + B) · . . .· (A+C). Da (A + B) · (A+C) → (B +C) gilt, kann man die „Resolvente“ (B + C) der Gesamtformel als neue Konjunktion hinzufügen, ohne ihren Wahrheitswert zu ändern. Entsprechend haben die Formeln (A + B) · A und (A + B) · A jede für sich die Resolvente B. Man wiederholt die Resolventenbildung („Resolution“) in allen möglichen Kombinationen unter Einbeziehung der hinzugefügten Resolventen so lange, bis entweder alle Möglichkeiten erschöpft sind oder sich schließlich zwei Resolventen der Form A und A ergeben. Da A · A falsch ist, bekommt dadurch die ganze konjunktive Normalform den Wert falsch. Somit ist X unerfüllbar und X allgemeingültig. Wenn dieser Fall nicht auftritt, ist X nicht allgemeingültig. Die Resolution ist in der Aussagenlogik von untergeordneter Bedeutung. In der Prädikatenlogik ist sie aber oft das einzige Verfahren, das zum Ziel führt. 1.4.3 Beispiel für einen aussagenlogischen Beweis
Bild 1-4. Implikation. a Definition; b Ersatz durch Negation und Disjunktion; c sprachliche Formulierungen
(Aufgabe aus [3].) Gegeben sind die Aussagen: 1. Paul oder Michael haben heute Geburtstag.
2 Automaten
2. Wenn Paul heute Geburtstag hat, bekommt er heute einen Fotoapparat. 3. Wenn Michael heute Geburtstag hat, bekommt er heute ein Briefmarkenalbum. 4. Michael bekommt heute kein Briefmarkenalbum. Folgt daraus der Satz „Paul hat heute Geburtstag“? Elementaraussagen: „Paul hat heute Geburtstag“ (P); „Michael hat heute Geburtstag“ (M); „Paul bekommt heute einen Fotoapparat“ (F); „Michael bekommt heute ein Briefmarkenalbum“ (B). Es soll mit den in 1.4.2 angegebenen vier Methoden geprüft werden, ob die Formel X ((P + M) · (P → F) · (M → B) · B) → P
(1-12)
allgemeingültig ist. Zum leichteren Rechnen beseitigt man in 1-12 zuerst alle Implikationen A → B durch die Disjunktionen A + B (vgl. Bild 1-4b) und erhält (P + M) · (P + F) · (M + B) · B + P .
1.4.4 Entscheidbarkeit und Vollständigkeit
Da sich von jeder aussagenlogischen Formel feststellen lässt, ob sie allgemeingültig ist oder nicht, bilden die Formeln der Aussagenlogik hinsichtlich ihrer Allgemeingültigkeit eine entscheidbare Menge. Man sagt, die Aussagenlogik ist entscheidbar. Darüber hinaus kann man Axiomensysteme angeben, aus denen sich sämtliche Sätze (d. h. alle allgemeingültigen Formeln) der Aussagenlogik ableiten lassen. Diese Eigenschaft bezeichnet man als Vollständigkeit. Es ergibt sich somit der Satz:
(1-13)
4
Exhaustion. Prüfung aller 2 Wertekombinationen in verkürzter Weise: B wahr ergibt sofort für X wahr. B falsch ergibt: P wahr ergibt sofort für X wahr. P falsch ergibt für X: M · wahr · M · wahr, und das ist wahr. Konjunktive Normalform. Eine der konjunktiven Normalformen von (1-13) lautet: (P+ P+ B+ M)·(M+ P+ B + M). Die erste Disjunktion ist wahr wegen P + P, die zweite wegen M + M. Somit ist X allgemeingültig. Disjunktive Normalform. Man bildet die Negation von (1-13): (P + M) · (P + F) · (M + B) · B · P
Resolution. Man bildet die Negation von X und erhält (1-14). In (1-14) ergeben (P + M) und P die Resolvente M und (M + B) und B die Resolvente M. M und M ergeben die Resolvente falsch. Das heißt, X ist unerfüllbar und somit X allgemeingültig.
(1-14)
multipliziert aus und vereinfacht. Eine der dabei entstehenden disjunktiven Normalformen lautet M ·B·P· M+M·B·P·F · M +M·B·P·B+M·B·P·F ·B. Sie enthält in jeder Konjunktion eine Elementaraussage und deren Negation.
– Die Aussagenlogik ist entscheidbar und vollständig. Für die Prädikatenlogik gelten die Sätze: – Die Prädikatenlogik 1. Stufe ist vollständig. (Gödels Vollständigkeitssatz, 1930). – Die Prädikatenlogik 1. Stufe ist nicht entscheidbar (Church, 1936). – Die Prädikatenlogik 2. Stufe ist nicht vollständig. (Gödels Unvollständigkeitssatz, 1931). Da man bereits für die formale Beschreibung der Grundgesetze der Arithmetik die Prädikatenlogik 2. Stufe benötigt, kann man die letzte Aussage so interpretieren, dass es arithmetische Sätze (d. h. wahre Aussagen über natürliche Zahlen) gibt, die sich nicht mit den Mitteln der Prädikatenlogik beweisen lassen.
2 Automaten Automaten wurden in den fünfziger Jahren insbesondere von E.F. Moore als Modelle „mathematischer Maschinen“ diskutiert, aber auch von G.H. Mealy 1955 auf die formale Beschreibung sog. sequentieller elektrischer Schaltungen angewendet. Aus diesen Ansätzen hat sich die Automatentheorie entwickelt. Ihre Ergebnisse sind grundlegend insbesondere für die
J11
J12
J Technische Informatik / Mathematische Modelle
Konstruktion von Digitalschaltungen in Rechenanlagen und zur Definition der syntaktischen Struktur von Programmiersprachen.
2.1 Endliche Automaten 2.1.1 Automaten mit Ausgabe
Endliche Automaten haben endliche Speicher und somit eine endliche Menge von Zuständen. Nichtendliche Automaten haben demgegenüber einen unbegrenzten Speicher, bei der in 2.4 behandelten Turingmaschine in der Form eines unendlich langen Bandes. Ein endlicher Automat mit Ausgabe ist durch zwei Funktionen erklärt. Die Übergangsfunktion f bildet die Zustände (Zustandsmenge Z), im allgemeinen Fall kombiniert mit Eingangselementen (Eingangsgrößen, Eingabesymbolen; Eingabemenge E), auf die Zustände ab: f: E×Z → Z . Die Ausgangsfunktion g bildet entweder (nach Moore) die Zustände allein oder (nach Mealy) die Zustands-Eingangs-Kombinationen in die Ausgangselemente (Ausgangsgrößen, Ausgabesymbole; Ausgabemenge A) ab: g: Z → A (Moore-Automat) , g: E × Z → A (Mealy-Automat) . Dabei handelt es sich um Mengen mit diskreten Elementen. Beide Modelle sind zur Beschreibung von Automaten geeignet. Moore-Automaten erfordern i. Allg. mehr Zustände als die äquivalenten MealyAutomaten. Sie sind etwas leichter zu verstehen, aber etwas aufwändiger zu realisieren. Die Wahl des Modells hängt letztlich von der Anwendung ab.
2.1.2 Funktionsweise
In Bild 2-1 ist das Verhalten beider Automatenmodelle illustriert und dem Verhalten der in 1.3 beschriebenen Funktionen gegenübergestellt. Darin bezeichnet 1 die zeitliche Folge der Eingangselemente, 2 die Folge der Zustände und 3 die Folge der Ausgangselemente. Die Eingangselemente werden gemäß den Teilbildern a, c und d folgendermaßen verarbeitet: Bei Funktionen (a) wird in jedem Schritt zu jedem Eingangselement entsprechend f ein Ausgangselement erzeugt. Bei Automaten (c und d) wird in jedem Schritt – ausgehend von einem vorgegebenen Anfangszustand – zu einem Eingangselement in Kombination mit einem Zustand gemäß f der für den nächsten Schritt benötigte Zustand (Folgezustand) erzeugt. Weiterhin wird im selben Schritt ein Ausgangselement erzeugt, beim Moore-Automat (c) gemäß g nur vom jeweiligen Zustand abhängig und beim Mealy-Automat (d) gemäß g von der Kombination von Eingangselement und Zustand abhängig. Wie Bild 2-1b zeigt, gibt es auch Automaten ohne Eingangselemente, sog. autonome Automaten, deren Zustandsfortschaltung von selbst erfolgt. Auch gibt es Automaten, bei denen die Zustände gleichzeitig die Ausgangselemente sind; dann kann die Angabe der Ausgangsfunktion entfallen.
2.2 Hardwareorientierte Automatenmodelle 2.2.1 Von der Mengen- zur Vektordarstellung
Zur Beschreibung eines Automaten in Mengendarstellung gibt es eine Reihe an Darstellungsmitteln,
Bild 2-1. Gegenüberstellung des Verhaltens.
a Funktion f : E → A; b autonomer Automat f : Z → Z und g: Z → A; c Moore-Automat f : E × Z → Z und g: Z = A; d Mealy-Automat f : E × Z → Z und g: E × Z → A. 1 Eingabe, 2 Zustände, 3 Ausgabe. Die bei d eingetragenen Symbole geben einen Ausschnitt der Eingangs-Ausgangs-Transformation für den in Tabelle 2-1a definierten Automaten mit z0 als Anfangszustand wieder
2 Automaten
wie Tabellen, Tafeln, Graphen; in Tabelle 2-1a ist nur die Tabellendarstellung gezeigt, und zwar für einen Mealy-Automaten mit Z = {z0 , z1 , z2 }, E = {e0 , e1 , e2 , e3 } und A = {a0 , a1 , a2 }. Bei der Definition des Automaten in Mengendarstellung ist über die Art und die Wirkung der Elemente von E und A (und Z) nichts ausgesagt; sie wird durch die jeweilige Anwendung bestimmt. Bei einem Fahrkartenautomaten z. B. sind die Eingangselemente Münzen und die Ausgangselemente Fahrkarten. Das Erscheinen der Eingangselemente bewirkt hier gleichzeitig die Zustandsfortschaltung. Bei einem Ziffernrechenautomaten, einem Digitalrechner, sind Eingangs- wie Ausgangselemente Ziffern bzw. Zahlen; hier werden die vorhandenen Eingangselemente abgefragt, und die Zustandsfortschaltung erfolgt automatenintern durch ein Taktsignal. – In der elektronischen Datenverarbeitung sind die Elemente wegen der heute verwendeten Schaltkreise binär codiert. Tabelle 2-1b zeigt den Automaten von Tabelle 2-1a mit den Codierungen [x1 x2 ] = [00], [01], [10], [11] für e0 , e1 , e2 , e3 , [y1 y2 y3 ] = [000], [101], [010] für a0 , a1 , a2 und [u1 u2 ] = [00], [01], [10] für z0 , z1 , z2 . Beschreibung mit Boole’schen Vektoren. Automa-
ten mit binär codierten Elementen lassen sich durch Boole’sche Funktionen beschreiben, und dementsprechend wird von Boole’schen Automaten gesprochen. Ihre Realisierung mit Schaltern (i. Allg. Transistoren) bezeichnet man als Schaltwerke (siehe 4). Durch die Binärcodierung entstehen aus den Eingangselementen Boole’sche Eingangsvariablen x1 , x2 , . . . , xn (im Folgenden kurz Eingänge), aus den Tabelle 2-1. Tabellendarstellungen eines Automaten, a mit Elementen von Mengen, b mit den Werten Boole’scher Vektoren
Ausgangselementen Boole’sche Ausgangsvariablen y1 , y2 , . . . , ym (kurz Ausgänge) und aus den Zuständen Boole’sche „Übergangsvariablen“ u1 , u2 , . . . , uk . Sie werden jeweils zu Boole’schen Vektoren zusammengefasst: zum Eingangsvektor x, zum Ausgangsvektor y und zum Übergangsvektor u. Es entsprechen sich also (vgl. 1.3.1) f:
E×Z →Z
g:
E×Z → A
und
u := f (u, x) , y = g(u, x) .
Darin sind die binär codierten Elemente von E die Werte von x (Eingangswerte), die binär codierten Elemente von A die Werte von y (Ausgangswerte) und die binär codierten Zustände von Z die Werte von u (Übergangswerte). 2.2.2 Darstellungsmittel
Auch für Boole’sche Automaten gibt es eine Reihe von Darstellungsformen, die ineinander transformierbar sind und jeweils für unterschiedliche Zwecke besonders geeignet sind, z. B. zur Darstellung der Abläufe in einem Automaten oder zur Darstellung seines Aufbaus. Der Entwurf eines Schaltwerkes – eine Hauptaufgabe der Digitaltechnik – kann unter diesem Aspekt aufgefasst werden als Transformation einer Funktionsbeschreibung des geforderten Verhaltens in eine Struktur einer verdrahteten oder programmierten Logikschaltung. Graphen (Zustandsgraphen,
Zustandsdiagramme; Bilder 2-2a und 2-2b). Die Graphendarstellung ist besonders nützlich zur Veranschaulichung der Funktionsweise von Automaten; sie beruht – mathematisch ausgedrückt – auf der Interpretation der Übergangsfunktion als bezeichneter gerichteter Graph in seiner zeichnerischen Darstellung mit Knoten und Kanten. Graphen machen die Verbindungen zwischen den Zuständen sichtbar und verdeutlichen so Zustandsfolgen, d. h. Abläufe im Automaten. Kreise (Knoten) stehen für jeden einzelnen Zustand. Sie werden ohne Eintrag gelassen, wenn dieser nach außen hin uninteressant ist, andernfalls werden sie symbolisch bezeichnet oder binär codiert (codierte Zustände, Übergangswerte). An den Übergangspfeilen (den Kanten) werden links die Eingänge berücksichtigt,
J13
J14
J Technische Informatik / Mathematische Modelle
ten (ausführliche Form, Tabelle 2-1b) bzw. nur mit den relevanten Eingangswerten (komprimierte Form, Bild 2-2c). Rechts stehen die Folgezustände sowie die Ausgangswerte. Tafeln (Bild 2-2d). Zur Tafeldarstellung werden gemäß den beiden Funktionen des Automaten, der Übergangsfunktion und der Ausgangsfunktion, zwei Tafeln benötigt. An den Tafeln werden wegen ihrer unterschiedlichen Bedeutung die codierten Zustände und die Eingangswerte zweidimensional angeschrieben, i. Allg. vertikal die Zustände und horizontal die Eingänge. In die eine Tafel werden die Folgezustände und in die andere die Ausgangswerte eingetragen. Gleichungen (Bild 2-2e). Zur Gleichungsdarstel-
lung werden die Übergangsfunktion und die Ausgangsfunktion komponentenweise mit den Eingangs-, Ausgangs- und Übergangsvariablen niedergeschrieben. Um zu verdeutlichen, dass es sich bei der Übergangsfunktion auf der linken Seite der Gleichungen um den Folgezustand handelt, wird das Ergibtzeichen := anstelle des Gleichheitszeichens benutzt. (Strukturbilder, Schaltbilder; Bild 2-2f). Blockbilder illustrieren gleichermaßen die formelmäßige Gliederung wie den schaltungsmäßigen Aufbau eines Boole’schen Automaten und sind somit Bindeglied beim Schaltwerksentwurf. Im Gegensatz zum Graphen, bei dem jeder Wert des Übergangsvektors einzeln als Kreis dargestellt wird, treten in Blockbildern die einzelnen Komponenten des Übergangsvektors, d. h. die Übergangsvariablen selbst, in Erscheinung, und zwar als Kästchen für eine jede Variable. Die Inhalte der Kästchen sind die Übergangswerte, die bei jedem Schritt durch ihre Nachfolger ersetzt werden.
Blockbilder
Bild 2-2. Darstellungsmittel Boole’scher Automaten am Beispiel des Automaten in Tabelle 2-1b. a Graph mit Boole’schen Werten für die Ein-/Ausgänge; b Graph mit Boole’schen Ausdrücken für die Eingänge und Boole’schen Variablen für die Ausgänge; c Tabelle in verkürzter Form; d Tafeln; e Gleichungen; f Blockbild. Der Automat dient als Steuerwerk für die Carry-save-Addition (siehe 4.4.2)
oft nur mit ihren relevanten Werten (Teilbild a) oder als Boole’sche Ausdrücke (Teilbild b); rechts werden die Ausgänge berücksichtigt, entweder mit ihren Werten (Teilbild a) oder oft nur deren aktive Komponenten (Teilbild b). Tabellen (Tabelle 2-1b und Bild 2-2c). In der Ta-
bellendarstellung erscheinen links die Kombinationen der Zustände mit allen möglichen Eingangswer-
Verallgemeinerung der Graphendarstellung. Die
in Bild 2-2 angegebenen Darstellungsmittel eignen sich für Automaten mit Steuerfunktion (Steuerwerke, Programmwerke, siehe 4.4). Von diesen wiederum eignen sich besonders die Graphendarstellung und die Blockbilder zur Verallgemeinerung (Abstraktion), insbesondere für Darstellungen auf der Registertransfer-Ebene. Beim Graphen werden in Anlehnung an höhere Programmiersprachen die
2 Automaten
Eingänge als parallel abfragbare Bedingungen und die Ausgänge als parallel ausführbare Anweisungen formuliert. Mit dieser Einbeziehung von operativen Funktionen in die ablauforientierte Darstellung erhält man eine implementierungsneutrale grafische Darstellungsform von Algorithmen, in der der Fluss einer Zustandsmarke durch die Knoten des Graphen den Ablauf des Algorithmus veranschaulicht (siehe Bild 4-21a). Diese Darstellung dient insbesondere als Ausgangspunkt zum Entwurf der (Steuer-)Schaltnetze in den Steuerwerken, wie die folgende Kette von Darstellungstransformationen zeigt: Bild 4-21a → Bilder 2-2a oder b → Bild 2-2c → Bild 2-2d → Bild 2-2e → Bild 2-2f. – Solche „Programmflussgraphen“ gibt es in vielerlei Varianten, z. B. auch als Flussdiagramme (siehe Bild 4-22a). Sie charakterisieren den typischen Datenverarbeitungsprozess in heutigen sog. v.-Neumann-Rechnern und werden auch bei der (imperativen) Programmierung verwendet. Verallgemeinerung der Blockbilder. Mit Blockbil-
dern lassen sich zwar auch Automaten mit Steuerfunktion darstellen, sie sind aber besonders für Automaten mit operativer Funktion geeignet (Operationswerke, Datenwerke, siehe 4.3). Charakteristisch für diese Werke ist die sehr große Anzahl von Zuständen, sodass diese nicht mehr wie bei Graphen einzeln dargestellt werden können. Stattdessen wird der gesamte Übergangsvektor als Einheit betrachtet und für ihn ein Kästchen gezeichnet. Das soll die Vorstellung der Zustände als veränderlicher Inhalt eines Registers im Automaten ausdrücken. In den Registern werden also die Übergangswerte gespeichert; über die mit Pfeilen versehenen Pfade werden sie übertragen und dabei ggf. verarbeitet. Dabei gelangt der neue Wert entweder in dasselbe Register, wobei der alte Wert überschrieben wird (Ersetzen des Wertes), oder in ein anderes Register, wobei der alte Werte gespeichert bleibt (Kopieren des Wertes). Bei der Darstellung dieser Transfer- und Verarbeitungsfunktionen spricht man von der Registertransfer-Ebene. Dabei wird (ähnlich den verallgemeinerten Graphen bezüglich der Ein- und Ausgänge) von der Boole’schen Algebra abstrahiert und zu anwendungsspezifischen Beschreibungsweisen übergegangen, z. B. durch
Angabe der Steuertabelle oder durch Benutzung von logischen und arithmetischen Operationszeichen in den Blockbildern oder Hardware-Programmen (siehe 4.4.2). Im Allgemeinen arbeiten viele solcher operativer Automaten zusammen, sodass komplexe Verbindungs-/ Verknüpfungsstrukturen zwischen den Registern der Automaten entstehen (siehe Bilder 5-4 und 5-7, auch 5-9). 2.2.3 Netzdarstellungen
In technischen Systemen arbeitet praktisch immer eine Reihe von verschiedenen Werken (abstrakt gesehen: Automaten) zusammen. An ihren Schnittstellen entstehen Probleme hinsichtlich ihrer Synchronisation, gleichgültig ob die Werke in ein und derselben Technik oder unterschiedlich aufgebaut sind. Beispiele sind zwei Prozessoren, die einen gemeinsamen Speicher benutzen, oder ein (elektronischer) Prozessor und ein (mechanisches) Gerät, die gemeinsam Daten übertragen. Synchronisationsprobleme dieser Art sind 1962 von C.A. Petri automatentheoretisch behandelt worden. Auf dieser abstrakten Ebene werden sie mit den nach ihm benannten Petri-Netzen gelöst. In der Software werden dazu spezielle Variablen benutzt, die man als Semaphore bezeichnet. In der Hardware werden spezielle Signale ausgetauscht, was als Handshaking bezeichnet wird. Während Netzdarstellungen in der Software eine eher untergeordnete Rolle spielen, sind sie in der Hardware vielerorts in Gebrauch (auch in der Steuerungstechnik, siehe I 14.3). Beispiele zur Synchronisation von Prozessen. Syn-
chronisation dient allgemein zur Abstimmung von Handlungen parallel arbeitender Werke bzw. ihrer „Prozesse“. Die Aufgabe besteht darin, den Ablauf der Prozesse in eine bestimmte zeitliche Beziehung zueinander zu bringen, gewissermaßen zur Gewährleistung einer zeitlichen Ordnung im Gesamtprozess. Synchronisation kann erforderlich werden (1.) zur Bewältigung von Konfliktsituationen zwischen den Prozessen oder (2.) zur Herstellung einer bestimmten Reihenfolge im Ablauf der Prozessaktivitäten. Die folgenden zwei Beispiele illustrieren den Einsatz von Petri-Netzen zur Behandlung von Problemen
J15
J16
J Technische Informatik / Mathematische Modelle
und beim Verlassen des Abschnitts wieder in den gemeinsamen Zustand zurückgebracht. Auf diese Weise ist gewährleistet, dass sich immer nur genau einer der beiden Prozesse in dem kritischen Abschnitt befindet (Vermeidung der Konfliktsituation).
Bild 2-3. Petri-Netze. a Illustration des Problems des gegenseitigen Ausschlusses; b Illustration des ErzeugerVerbraucher-Problems
dieser Art (zu Petri-Netzen sowie zu deren Symbolik siehe I 14.3). Problem des gegenseitigen Ausschlusses (mutual exclusion). In Bild 2-3a sind zwei Prozesse miteinander vernetzt. Sie beschreiben zwei Werke, die einen gemeinsamen Abschnitt des Gesamtprozesses nur exklusiv benutzen dürfen (zur Veranschaulichung: zwei unabhängige Fahrzeuge, die auf eine Engstelle zufahren). – In einem Rechner bildet z. B. einen solchen kritischen Abschnitt (critical region) das gleichzeitige Zugreifen zweier Prozesse auf ein gemeinsames Betriebsmittel, wie den Systembus mit dem daran angeschlossenen Speicher (Problem der Busarbitration). Die Prozesse in Bild 2-3a sind über einen gemeinsamen Zustand gekoppelt, der nur dann eine Marke enthält, wenn der kritische Abschnitt frei ist. Bei einem Zugriff auf diesen wird die Marke entweder von dem einen oder dem anderen Prozess mitgenommen
Erzeuger-Verbraucher-Problem (producer consumer problem). In Bild 2-3b sind drei Prozesse miteinander vernetzt. Der linke und der rechte Prozess beschreiben mit T 1 und T 2 getaktete Werke, von denen das linke Daten erzeugt und das rechte Daten verbraucht (zur Veranschaulichung: von denen das eine eine Ware produziert und das andere die Ware konsumiert). Der mittlere Prozess beschreibt ein ungetaktetes, d. h. asynchron zu den beiden anderen arbeitendes Werk, einen Puffer, der imstande ist, eine Dateneinheit (die Ware) zwischenzulagern. – In einem Rechner ist z. B. der Erzeuger ein Prozessor und der Verbraucher ein Ausgabegerät; und der Puffer ist das Datenregister eines Interface-Bausteins (gepufferte, asynchrone Datenübertragung). Der Puffer ist entweder leer (Marke im oberen Zustand) oder voll (Marke im unteren Zustand). Der Erzeuger produziert eine Dateneinheit und wartet, sofern der Puffer nicht leer ist, anderenfalls füllt er ihn. Der Verbraucher wartet, solange der Puffer nicht voll ist, sodann leert er ihn und konsumiert die Dateneinheit. Auf diese Weise ist gewährleistet, dass das im Puffer befindliche Datum vom Erzeuger nie überschrieben und vom Verbraucher nie doppelt gelesen werden kann (Einhaltung der Reihenfolge). Grenzen der Anwendbarkeit von Petri-Netzen.
In Bild 2-3 kommen die Vor- und Nachteile von Petri-Netzen gut zum Ausdruck. Petri-Netze zeigen das Zusammenwirken der Prozesse in einer abstrakten, das Verständnis des Gesamtprozessgeschehens fördernden Form; Konflikte werden deutlich, da eine Marke nur über einen von mehreren Wegen laufen darf (vgl. in Bild 2-3a die Aktionen „kritischer Abschnitt betreten“); es dominiert die Reihenfolge der Handlungen, d. h., ob sie nebeneinander (parallel) ausgeführt werden können oder nacheinander (sequentiell) ausgeführt werden müssen (vgl. in Bild 2-3b die Aktionen „Puffer füllen“ bzw. „Puffer leeren“). Darüber hinaus erlauben die beiden gezeigten Petri-Netze eine Verallgemeinerung der jeweiligen Aufgabenstellung: Wenn das Netz in
2 Automaten
Bild 2-3a auf n Prozesse erweitert wird und der allen gemeinsame Zustand mit m Marken initialisiert wird (m < n), so beschreibt es die Freigabe des kritischen Abschnitts für m von n Prozessen. Wenn im Netz in Bild 2-3b der obere Pufferzustand mit n Marken statt mit einer initialisiert wird, so beschreibt es die Daten-/Materialübertragung für einen Puffer mit einer Kapazität von n Speicher-/Lagerplätzen. Die Teilbilder zeigen auch die Grenzen der Anwendbarkeit von Petri-Netzen: Während vernetzte Automatengraphen räumlich verbundenen Funktionseinheiten entsprechen und aufgrund ihrer als Eingänge und Ausgänge gekennzeichneten Synchronisationssignale auf diverse Blätter verteilt werden können, ist das bei Petri-Netzen wegen der gemeinsamen Übergangsbalken gar nicht beabsichtigt. Daher werden Petri-Netze schon bei wenig komplexen Aufgabenstellungen sehr unübersichtlich. Eine gewisse Abhilfe bringen sog. höhere Petri-Netze, die aber schwieriger zu interpretieren sind. PetriNetze werden deshalb hauptsächlich zur Darstellung grundsätzlicher Zusammenhänge benutzt. In der Programmierung paralleler, verteilter Prozesse wird hingegen sprachlichen Formulierungen der Vorzug gegeben.
2.3 Softwareorientierte Automatenmodelle 2.3.1 Erkennende Automaten und formale Sprachen
In der theoretischen Informatik und im Übersetzerbau benutzt man Automaten als mathematische Modelle zur Erkennung der Sätze formaler Sprachen, d. h. zur Feststellung der Struktur von Zeichenketten. Man nennt diese Automaten deshalb auch erkennende Automaten und unterscheidet vier Arten, die in engster Korrespondenz mit den verschiedenen Arten formaler Sprachen stehen: – Endliche Automaten erkennen reguläre Sprachen. – Kellerautomaten erkennen kontextfreie Sprachen. – Linear beschränkte Automaten erkennen kontextsensitive Sprachen. – Turingmaschinen erkennen unbeschränkte Sprachen. Softwareorientierte Automaten weisen gegenüber hardwareorientierten folgende charakteristische Unterschiede auf:
Sie liefern während des Lesens und Verarbeitens einer Eingabe-Zeichenkette keine Ausgabe. Sie haben ausgezeichnete Zustände: den Anfangszustand, in dem sie starten, und Endzustände, in denen sie anhalten und die eingegebene Zeichenkette als erkannt signalisieren. Sie existieren alle in einer deterministischen und in einer nichtdeterministischen Variante. Die Unterscheidungen von synchroner und asynchroner Arbeitsweise und von Moore- und MealyAutomat entfallen. 2.3.2 Erkennende endliche Automaten
Ein erkennender endlicher Automat (Bild 2-4) besteht aus einer endlichen Anzahl von Zuständen z1 bis zn , einem Eingabeband mit den Zeichen s1 bis sm , einem Lesekopf und einer Ja-Nein-Anzeige (Lampe). Ein Zustand ist als Startzustand, ein oder mehrere Zustände sind als Endzustände ausgezeichnet. Das Band enthält eine Kette von Zeichen eines gegebenen Alphabets, und der Automat hat die Aufgabe, durch schrittweises Lesen der Zeichenkette festzustellen, ob sie eine bestimmte, durch die Übergangsfunktion des Automaten festgelegte Struktur hat. Die Kette wird dazu vom Lesekopf von links nach rechts abgetastet. Die Erkennung geht folgendermaßen vor sich: 1. Am Anfang befindet sich der Automat im Anfangszustand, und das erste Zeichen s1 der Kette steht über dem Lesekopf. 2. Der Automat führt Züge aus, indem er, gesteuert durch den augenblicklichen Zustand zi und das aktuelle Zeichen s j , in den nächsten Zustand übergeht und den Lesekopf um eine Stelle nach rechts bewegt. 3. Die Erkennung endet, wenn die Übergangsfunktion für den aktuellen Zustand und das aktuelle Bandzeichen undefiniert ist. (Das ist u. a. dann der Fall, wenn das Band vollständig gelesen ist. Die auf das letzte Bandzeichen folgende Kette ist die
Bild 2-4. Erkennender endli-
cher Automat
J17
J18
J Technische Informatik / Mathematische Modelle
leere Kette, durch ε bezeichnet.) Wenn dann der aktuelle Zustand ein Endzustand ist, ist die Kette erkannt (die Lampe leuchtet), wenn nicht, ist die Kette nicht erkannt. Die vorstehende Beschreibung lässt sich durch folgende Definitionen präzisieren: Ein deterministischer endlicher Automat DFA (deterministic finite automaton) ist ein Quintupel DFA = (Z, VT , δ, z1 , F) . Darin ist Z eine endliche Menge von Zuständen, VT eine endliche Menge von Eingabesymbolen, δ die Übergangsfunktion (eine Abbildung Z × VT → Z), z1 ∈ Z der Anfangszustand, F ⊆ Z die Menge der Endzustände. Eine Konfiguration, geschrieben (z, α), ist das Paar aus dem gegenwärtigen Zustand z und dem noch ungelesenen Teil α der Eingabekette. Dabei ist das am weitesten links stehende Zeichen von α dasjenige, das als nächstes gelesen wird. Ein Zug, dargestellt durch das Zeichen *, ist der Übergang von einer Konfiguration in die nächste. Wenn die gegenwärtige Konfiguration (zi , bα) lautet, und es ist δ(zi , b) = z j , dann führt der endliche Automat den Zug (zi , bα) * (z j , α) aus. Eine Zugfolge von n ≥ 0 Zügen wird durch *∗ ausgedrückt. Eine Zeichenkette σ ist erkannt, wenn es eine Zugfolge (z1 , σ) *∗ (p, ε) für irgendein p ∈ F gibt. Als Sprache L(DFA) eines endlichen Automaten definiert man die Menge aller Zeichenketten, die der Automat erkennt; formal L(DFA) = {α : α ∈ VT∗ ∧ ((z1 , α) *∗ (p, ε) ∧ p ∈ F)} . Ein Automat zur Erkennung aller Zeichenketten aus Nullen und Einsen mit einer durch 3 teilbaren Anzahl von Einsen lautet:
Beispiel.
DFA = ({z1 , z2 , z3 }, {0, 1}, δ, z1 , {z1 }) Bild 2-5 zeigt die Übergangsfunktion δ als Tabelle und als Graph. Bei der Erkennung der Kette 110010 führt der Automat folgende Züge aus: (z1 , 110010) * (z2 , 10010) * (z3 , 0010) * (z3 , 010) * (z3 , 10) * (z1 , 0) * (z1 , ε)
Bild 2-5. Übergangsfunktion eines erkennenden endlichen Automaten. a Tabelle, b Graph. z1 ist Startzustand und zugleich einziger Endzustand
Nichtdeterministischer Automat. Ein nichtdeter-
ministischer endlicher Automat kann von einem Zustand aus bei einem bestimmten Eingabewert in mehrere Folgezustände übergehen. Seine Übergangsfunktion wird dadurch i. Allg. mehrwertig; sie ist eine Abbildung von Z × VT in Teilmengen der Potenzmenge von Z. Jeder nichtdeterministische endliche Automat lässt sich in einen äquivalenten deterministischen endlichen Automaten transformieren. Grenzen der Anwendbarkeit. Endliche Automaten
sind zur Beschreibung von formalen Sprachen nur beschränkt tauglich. Sie können nur Sätze von Grammatiken ohne Klammerstruktur, wie Bezeichner, Zahlen und einige andere erkennen. 2.3.3 Turingmaschinen
Die Turingmaschine (A.M. Turing, 1936) besteht aus einer endlichen Anzahl von Zuständen z1 bis zn , einem einseitig unendlichen Band, einem Schreib-/Lese-Kopf und einer Ja-Nein-Anzeige (Lampe). Im Unterschied zum endlichen Automaten wird das Band bei jedem Zug um eine Stelle nach links oder rechts bewegt und ein Zeichen gelesen und geschrieben. Alles Übrige ist wie beim endlichen Automaten. Die Übergangsfunktion hat zwei Argumente: den aktuellen Zustand und das aktuelle Bandsymbol; und sie hat drei Werte: den nächsten Zustand, das Bandsymbol, mit dem das aktuelle überschrieben werden soll, und die zweiwertige
2 Automaten
Angabe {L, R}, ob der Schreib-/Lese-Kopf nach links oder rechts bewegt werden soll (Bild 2-6). Formal ist eine Turingmaschine (TM) ein 6-Tupel: TM = (Z, VT , V, δ, z1 , F) Darin ist Z eine endliche Menge von Zuständen; VT eine endliche Menge von Eingabesymbolen; V eine endliche Menge von Bandsymbolen, eines von ihnen, + (blank), bedeutet das Leerzeichen (es ist VT ⊆ V − {+}), δ die Übergangsfunktion, eine Abbildung von Z × V nach Z × V × {L, R}, z1 ∈ Z der Anfangszustand und F ⊆ Z, die Menge der Endzustände. Eine Konfiguration, geschrieben (z, a.β) ist das Tripel aus dem gegenwärtigen Zustand z, dem links vom Schreib-/Lese-Kopf liegenden Teil α des Bandes und dem Bandrest β. Das erste Zeichen von β befindet sich über dem Schreib-/Lese-Kopf, alle übrigen Zeichen von β rechts von ihm. Ein Zug, dargestellt durch *, ist der Übergang von einer Konfiguration in die nächste. Eine Zeichenkette σ ist erkannt, wenn es eine Zugfolge (z1 , .σ) *∗ (p, α.β) für irgendein p ∈ F und beliebigen Bandinhalt α.β gibt. Beispiel. Gesucht ist eine Turingmaschine TM, die ihren anfänglichen Bandinhalt aus Nullen und Einsen – eingerahmt durch die Begrenzungszeichen A (Anfang) und E (Ende) – hinter diesen kopiert/transportiert. Strategie: 1. Zeichen (0 oder 1) merken und durch Hilfszeichen $ überschreiben (Position merken). 2. Bis zum ersten Leerzeichen (+) vorwärtsgehen und + durch Zeichen überschreiben. 3. Zu $ zurückgehen und $ durch Zeichen überschreiben; zum nächsten Zeichen gehen. Schritte 1 bis 3 wiederholen, bis E erreicht ist. TM hat 7 Zustände (Menge Z), die Eingabesymbole lauten 0, 1, A, E (Menge VT ), die Bandsymbole lauten 0, 1, A, E, $, + (Menge V). Die Übergangsfunktion (δ)
Bild 2-6. Turingmaschine
ist in Bild 2-7 als Zustandsgraph wiedergegeben; der Startzustand ist z1 , der Endzustand ist z7 . Im Graphen bedeutet die Anschreibung x → y, z Überschreiben von Bandsymbol x durch Eingabesymbol y (aus x wird y) und Weiterrücken des Schreib-/Lesekopfes nach links oder rechts (z = L bzw. R). – Aus einer beispielsweisen Anfangsbandbeschriftung A 0 1 0 0 1 0 E entsteht die Endbandbeschriftung A 0 1 0 0 1 0 E 0 1 0 0 1 0. Das Beispiel verdeutlicht gleichermaßen die Stärken und die Schwächen der Turingmaschine, wenn man an einen technischen Aufbau zur elektronischen Datenverarbeitung denkt (vgl. die Diskussion in [4]). Das ist allerdings für ihre Anwendung in der theoretischen Informatik weder beabsichtigt noch notwendig! – Ihre Stärke ist die Abfragbarkeit aller Bandsymbole auf einen Schlag (und somit die Ausführung von Programmverzweigungen in einem Schritt). Ihre Schwäche ist das Fehlen jeglicher arithmetischer und logischer Operationen. Wie am Beispiel zu sehen, muss selbst eine so elementare Operation wie Kopieren/Transportieren äußerst umständlich programmiert werden: Die Inspektion des Zustandsgraphen ergibt 20 Zeilen für die Tabellenform der Übergangsfunktion (20 Anschreibungen im Graphen); diese Tabelle bildet gewissermaßen das Programm der Turingmaschine. Zum Kopieren/Transportieren eines einzigen Zeichens sind für die oben gewählte Bandbeschriftung allein 15 Schritte notwendig (7 vor, 8 zurück). Trotzdem: Man kann zeigen, dass Turingmaschinen auch addieren und alle anderen arithmetischen Operationen ausführen können. Der unbeschränkt große Bandspeicher und die Möglichkeit, Bandfelder wiederholt zu besuchen und ihren Inhalt zu ersetzen, verleihen der Turingmaschine theoretisch die Fähigkeit, alle Algorithmen auszuführen. Erweiterungen von Turingmaschinen auf mehrere Bänder, mehrere Schreib-/Lese-Köpfe und nichtdeterministische Turingmaschinen bringen keinen Zuwachs an algorithmischen Fähigkeiten. Turingmaschinen werden in der theoretischen Informatik vor allem zu zwei Zwecken herangezogen: Zur Definition der Begriffe Algorithmus und Berechenbarkeit: Zu jedem denkbaren Algorithmus (jeder berechenbaren Funktion) gibt es eine Turingmaschine, die ihn ausführt. Man
J19
J20
J Technische Informatik / Digitale Systeme
Bild 2-7. Graph für die BeispielTuringmaschine. Die entsprechende Tabelle kann durch Software (z.B. mit Excel) oder durch Hardware (binär codiert mit dem Steuerwerk) verwirklicht werden (siehe 4.4). Dabei wird anstelle des Bands besser ein Speicher mit wahlfreiem Zugriff mit vorgeschaltetem Vor/Rückwärtszähler verwendet. Das Programm des Steuerwerks ist im Logikfeld „fest verdrahtet“ oder mit Logikgattern „fest verdrahtet“. Zum Hardware-Aufbau siehe auch [1]
schreibt die Eingangsparameter (Argumente) auf das Band, startet die Turingmaschine, und die Turingmaschine hält nach endlich vielen Schritten mit den Ausgabeparametern (dem Funktionswert) auf dem Band an. Man macht die Ausführbarkeit durch eine Turingmaschine sogar zur Definition des Algorithmusbegriffs, indem man sagt: Turingmaschinen sind formale Modelle von Algorithmen, und kein Berechnungsverfahren kann algorithmisch genannt werden, das nicht von einer Turingmaschine ausführbar ist (Churchsche These). Zur Erkennung der allgemeinsten Klasse formaler Sprachen: Diese Klasse ist dadurch charakterisiert, dass es für jede zu ihr gehörende Sprache eine Turingmaschine gibt, die eine Zeichenkette, die ein Satz der Sprache ist, erkennt. Zur Erkennung wird die Kette auf das Band der Turingmaschine geschrieben und die Turingmaschine gestartet. Wenn die Kette ein Satz der Sprache ist, hält die Turingmaschine nach endlich vielen Schritten in einem Endzustand an; wenn sie kein Satz ist, hält die Turingmaschine entweder in einem Nicht-Endzustand oder überhaupt nicht an. Universelle Turingmaschinen. Verschiedenen Algo-
rithmen entsprechen verschiedene Turingmaschinen. Ihre Übergangsfunktionen kann man sich als
ihre fest verdrahteten Programme denken (siehe Bildunterschrift zu Bild 2-7). Man kann jedoch als Gegenstück zum Computer auch universelle Turingmaschinen konstruieren, die eine beliebige auf ihr Band geschriebene Übergangsfunktion interpretieren und somit imstande sind, alle Turingmaschinen zu simulieren. Bedeutung für die Programmierungstechnik. Ob-
wohl Turingmaschinen nur mathematische Modelle ohne jede praktische Anwendbarkeit sind, liefern sie wertvolle Einsichten und haben deshalb Bedeutung z. B. in folgenden Fragestellungen: Wenn man Algorithmen, die in verschiedenen Programmiersprachen geschrieben sind, hinsichtlich bestimmter Eigenschaften miteinander vergleichen will, bietet sich die Turingmaschine als einfachster gemeinsamer Standard an. Um zu zeigen, dass eine neue Programmiersprache universell ist, d. h. alle Algorithmen zu formulieren gestattet, braucht man nur zu zeigen, dass man mit ihr eine Turingmaschine simulieren kann. Es gibt Probleme, die sich algorithmisch prinzipiell nicht lösen lassen, was sich am Modell der Turingmaschine besonders einfach zeigen lässt. Darunter ist von größtem allgemeinen Interesse das Halteproblem, d. i. die
3 Schaltnetze
Frage „Gibt es einen Algorithmus, der entscheidet, ob ein beliebiges gegebenes Programm für beliebig gegebene Eingabedaten nach endlich vielen Schritten anhält? “ Die Antwort lautet „Nein.“ Viele andere Probleme der Berechenbarkeit lassen sich auf das Halteproblem zurückführen. 2.3.4 Grenzen der Modellierbarkeit
Endliche Automaten und Turingmaschinen sind autonome Modelle, d. h., sie modellieren nur Abläufe, die, einmal gestartet, unbeeinflusst durch die Außenwelt
bis zu ihrem Ende ablaufen. Die Abläufe in Computern sind dagegen nicht autonom, sondern können durch Signale von außen unterbrochen werden (Interrupt, siehe 8.2.2). Zur Kommunikation einer Zentraleinheit mit der Außenwelt (E/A-Geräte, andere Computer in Computernetzen und verteilten Systemen) ist die Möglichkeit wesentlich, einen Ablauf in der Zentraleinheit durch ein von außen kommendes Signal zu unterbrechen. Mathematische Modelle von ähnlicher Einfachheit wie die Turingmaschine, die die Unterbrechbarkeit berücksichtigen, sind bisher nicht bekannt geworden.
Digitale Systeme H. Liebig Digitale Systeme sind wohlstrukturierte, sehr komplexe Zusammenschaltungen ganz elementarer, als Schalter wirkender Bauelemente. Am Anfang der Computertechnik Relais, heute fast ausschließlich Transistoren, haben solche elektronischen Schalter funktionell betrachtet nur zwei Zustände: Sie sind entweder offen oder geschlossen. Dementsprechend operieren digitale Systeme im mathematischen Sinn nur mit binären Größen. Bit steht dabei als Kurzform für „binary digit“. Auch arithmetische Operationen und logische Verknüpfungen lassen sich auf das „Rechnen“ mit binären Größen zurückführen: die Ziffern von Dualzahlen sind entweder 0 oder 1; als Aussagen aufgefasste Sätze sind entweder falsch oder wahr. Diese Gemeinsamkeit ermöglicht es, arithmetische und logische Prozesse mit digitalen Systemen, d. h. durch das Zusammenwirken ihrer Schalter, nachzubilden. Digitale Systeme können nach steigender Komplexität ihrer Struktur und ihrer Funktion in Schaltnetze, Schaltwerke und Prozessoren eingeteilt werden. Schaltnetze sind imstande, den Kombinationen ihrer Eingangsgrößen einmal festgelegte Kombinationen ihrer Ausgangsgrößen zuzuordnen; sie werden deshalb auch Zuordner oder im Englischen „combinational circuits“ genannt.
Schaltwerke sind darüber hinaus in der Lage, vorgegebene Sequenzen ihrer Eingangsgrößen in vorgegebene Sequenzen ihrer Ausgangsgrößen abzubilden; sie werden deshalb auch Automaten oder im Englischen „sequential machines“ genannt. Sie bilden die Hardware-Implementierungen von Automaten/Algorithmen. Prozessoren entstehen aus der Zusammenschaltung von arithmetisch-logischen Schaltnetzen mit operativen und steuernden Schaltwerken. Sie eignen sich primär zur Durchführung numerischer Berechnungen, insbesondere für die Verarbeitung großer Datenmengen. Prozessoren bilden somit die zentralen Verarbeitungseinheiten der elektronischen Rechenanlagen (central processing units, CPUs).
3 Schaltnetze Ihrer Struktur nach sind Schaltnetze rückwirkungsfreie Zusammenschaltungen von Schaltgliedern. Ihre Funktion folgt den Gesetzen der Boole’schen Algebra (Boole’sche Funktionen). Damit lässt sich der Begriff Schaltnetz wie folgt definieren: Ein Schaltnetz ist die schaltungstechnische Realisierung einer Boole’schen Funktion, mathematisch ausgedrückt durch die Abbildung f mit dem Eingangsvektor x und dem Ausgangsvektor y: (3-1)
J21
J22
J Technische Informatik / Digitale Systeme
3.1 Signaldurchschaltung und -verknüpfung Binär codierte Information wird durch Signale repräsentiert (z. B. elektrische Spannungen), die nur zwei Pegel annehmen können (z. B. 0 V/+3 V, kurz /+ als „Potenziale“). Die Bezeichnung der Signale erfolgt durch beliebige Namen; die der Pegel durch die beiden Ziffern 0 und 1, üblicherweise 0 für und 1 für + („positive Logik“). Entsprechend den in der Mathematik gebräuchlichen Bezeichnungsweisen sind die Signale Variablen und ihre Pegel deren Werte („das Signal x hat den Pegel 3 V“ hat so die gleiche Bedeutung wie „die Variable x hat den Wert 1“). Die Übertragung und Verarbeitung von Signalen erfolgt mit Schaltern, die zu komplexen Gebilden verbunden sind (Schalterkombinationen). Dabei können mehrere Schalter mit ein und demselben Eingangssignal gesteuert werden. In Schaltbildern wird das dadurch ausgedrückt, dass an jedem dieser Schalter derselbe Signalnamen geschrieben wird; und der Bequemlichkeit halber gibt man den Schaltern selbst auch gleich die Namen ihrer Steuersignale (das Signal x schaltet alle mit x bezeichneten Schalter bei x = 1 auf „ein“). In digitalen Systemen dienen Schalter und Schalterkombinationen (1.) zum Durchschalten von Signalen (Durchschaltglieder, transmission gates), (2.) zum Verknüpfen von Signalen (Verknüpfungsglieder, combinational gates). Beide Arten von Schaltgliedern (Gattern) erscheinen in Digitalschaltungen in großer Mannigfaltigkeit und werden innerhalb eines Systems auch gemischt eingesetzt. Beispiel. Ein Schaltnetz zur Addition von zwei
Dualzahlen entsteht aus einer kettenförmigen Zusammenschaltung von „Kästchen“ (Bild 3-1a), von denen jedes seinerseits Zusammenschaltungen von Durchschalt- und Verknüpfungsgliedern enthält (siehe Bild 3-9 und Bild 3-10). Jedes der Kästchen führt die Addition eines Ziffernpaares aus. Sie besteht aus der Berechnung der Ergebnisziffer zi und des in Stelle i entstehenden Übertrags ui+1 aus den Summandenziffern xi , yi und dem von der Stelle i − 1 kommenden Übertrag ui (Bild 3-1b).
Bild 3-1. Addition von zwei Dualzahlen Z = X+Y. a Schaltnetz mit Zahlenbeispiel; b Definition einer Teilschaltung (Volladdierer)
Ende der Schaltung herzustellen, und zwar nach Maßgabe der an den Schaltern liegenden Eingangssignale. Somit kann ein an dem einen Ende anliegendes variables oder konstantes Potenzial entweder an das andere Ende übertragen werden (Leitung durchgeschaltet) oder nicht übertragen werden (Leitung nicht durchgeschaltet). Operationen mit Schaltern. Es gibt Schalter mit
normaler und Schalter mit inverser Funktion; weiter können Schalter mit normalen und invertierten Signalen gesteuert werden; und schließlich können Schalter seriell und parallel verbunden werden. Diese Operationen erlauben die planmäßige Konstruktion von Schalterkombinationen. Normalfunktion/-ansteuerung eines Schalters (Identität): Die Leitungsverbindung ist durchgeschaltet, wenn der Schalter geschlossen ist; das ist bei x = 1 der Fall (bei x = 0 ist er geöffnet), in Formeln durch x ausgedrückt (Bild 3-2a);
3.1.1 Schalter und Schalterkombinationen
Inversfunktion/-ansteuerung eines Schalters (Negation, NICHT-Operation): Die Leitungsverbindung ist durchgeschaltet, wenn der Schalter geschlossen ist; das ist nicht bei x = 1 der Fall (sondern bei x = 0), in Formeln x¯ (Bild 3-2b);
Schalter und Schalterkombinationen haben die Aufgabe, Leitungsverbindungen von einem zum anderen
Serienschaltung von Schaltern (Konjunktion, UNDVerknüpfung): Die Leitungsverbindung ist durchge-
3 Schaltnetze
Bild 3-2. Schalterkombinationen. a Identität (Schalter nor-
mal arbeitend und normal angesteuert); b Negation (Schalter invers arbeitend bzw. invers angesteuert); c Konjunktion (Schalter in Serie geschaltet); d Disjunktion (Schalter parallelgeschaltet)
schaltet, wenn Schalter x1 geschlossen ist (x1 = 1) und Schalter x2 geschlossen ist (x2 = 1), als Formel x1 · x2 (Bild 3-2c); Parallelschaltung von Schaltern (Disjunktion, ODERVerknüpfung): Die Leitungsverbindung ist durchgeschaltet, wenn Schalter x1 geschlossen ist (x1 = 1) oder Schalter x2 geschlossen ist (x2 = 1), als Formel x1 + x2 (Bild 3-2d). Bei ausschließlicher Verwendung dieser Operationen zum Aufbau einer Schalterkombination lässt sich aus der Struktur einer Formel eine Schaltung „derselben“ Struktur entwickeln. Andere als mit diesen Elementaroperationen aufgebaute Schaltungen lassen sich zwar auch durch Formeln beschreiben, jedoch sind ihre Strukturen nicht mehr von gleicher Gestalt. Schaltung Bild 3-3a wird z. B. durch die darunter angegebene Formel strukturgetreu wiedergegeben, während für Schaltung Bild 3-3b lediglich die vier Möglichkeiten von Leitungsverbindungen aus der Formel abgelesen werden können (eine oben, eine unten, zwei über Kreuz).
Bild 3-3. Zwei äquivalente Schalterkombinationen, a strukturgetreu, b nicht strukturgetreu durch Formeln beschreibbar. Die eingetragenen Schalterstellungen illustrieren den Fall a = 1, b = 0, c unbestimmt
Bild 3-4. Durchschaltglieder (die Schalter stehen auch
stellvertretend für Schalterkombinationen). a UND-ODERGatter; b Ladungsspeicherung (bei a = 0); c Kurzschlussstrom (bei z. B. x1 = 1 und x2 = 0)
3.1.2 Durchschaltglieder
Durchschaltglieder schalten die variablen Potenziale ihrer Eingangssignale xi (siehe Bild 3-4a) entsprechend den Werten ihrer Eingangssignale ai auf den Ausgang y entweder rückwirkungsfrei durch (y = x1 , wenn a1 = 1 und a2 = 0; y = x2 , wenn a1 = 0 und a2 = 1), gar nicht durch (y = ?, wenn a1 = 0 und a2 = 0) oder rückwirkungsbehaftet durch (y = !, wenn a1 = 1 und a2 = 1). Im Falle y = x1 oder x2 gilt a1 a2 , und der Ausgang hat denselben Wert wie der durchgeschaltete Eingang, d. h., y = 1, wenn a1 = 1 und x1 = 1 oder a2 = 1 und x2 = 1. Im Falle y = ? „hängt“ der Ausgang „in der Luft“. Dieser (neben 0 und 1) dritte Zustand ist entweder unzulässig, weil undefiniert, oder er hat wegen der Leitungskapazität des Ausgangs denjenigen Wert y = 0 oder 1, den er vor der „Abtrennung“ des Eingangssignals xi hatte (Ladungsspeicherung). In Schaltung Bild 3-4b z. B. bleibt y = 1 bei a = 0 nur dann konstant, wenn sich die aufgeladene Kapazität nicht entladen kann, d. h., wenn kein Strom in die nachfolgende Schaltung fließt. Diese Annahme ist jedoch etwas unrealistisch, denn selbst bei sehr hohem Eingangswiderstand der Folgeschaltung (Eingang „hochohmig“) fließen in Wirklichkeit – wenn auch sehr geringe – Leckströme, sodass sich die Kapazität entladen kann. Deswegen muss, wenn der Wert der Variablen y über einen längeren Zeitraum „gespeichert“ werden soll, die Ladung periodisch durch ein Taktsignal erneuert werden oder durch Rückkopplung wieder aufgefrischt werden (siehe 4, insbesondere Bilder 4-3a bzw. 4-4a).
J23
J24
J Technische Informatik / Digitale Systeme
Bild 3-5. Durchschaltglieder. a Funktion y = a1 · x1 + a2 ·
x2 + a¯ 1 · a¯ 2 · v (Ausgang auch bei a1 = 0, a2 = 0 definiert); b Dioden-ODER-Gatter; c Dioden-UND-Gatter
Im Fall y = ! „verkoppelt“ der Ausgang die Eingänge. Dieser Fall unterliegt der Bedingung, dass niemals zu hohe Ströme von 1 = + nach 0 = fließen dürfen, da sonst Schalter zerstört werden können (Kurzschlussströme). In Schaltung Bild 3-4c kann das bei a1 = 1, a2 = 1, a3 = 0 eintreten, wenn mit x1 = 1 in der vorhergehenden Schaltung (z. B. über einen Schalter ohne Widerstand – Ausgang „niederohmig“) unmittelbar der Pluspol und mit x2 = 0 unmittelbar der Massepol durchgeschaltet wird (z. B.,wenn Bild 3-8a Ausgangsschaltung ist). Grundschaltungen mit Dioden. Ladungsspeicherung
wird verhindert, wenn ein Zweig im Durchschaltglied mit einem Widerstand versehen wird. In Bild 3-5a z. B. ist bei a1 = 0 und a2 = 0 y = v = 0/1 = /+. (Da kein Strom durch den Widerstand fließt, entsteht an ihm kein Spannungsabfall, und das jeweilige Potenzial von v überträgt sich auf y.) Kurzschlussströme werden verhindert, indem selbststeuernde Schalter mit Ventilverhalten (Dioden) benutzt werden. Beim ODER-Gatter, Bild 3-5b, wird v = gewählt, sodass die Dioden (Schalter ai ) bei x1 = 1 durchgeschaltet sind (d. h. Normalsteuerung der Schalter: ai = xi ); daraus folgt y = 1, wenn x1 = 1 oder x2 = 1. Beim UND-Gatter, Bild 3-5c, wird v = + gewählt, sodass die Dioden (Schalter ai ) bei xi = 1 gesperrt sind (d. h. Inverssteuerung der Schalter: ai = x¯i ); daraus folgt y = 1, wenn x1 = 1 und x2 = 1. In beiden Schaltungen ist bei ungleichen Eingangspotenzialen immer eine Diode gesperrt; und wie die Symbole zeigen, können Kurzschlussströme nicht auftreten. Sowohl Ladungsspeicherung als auch Kurzschlussströme
Ein Durchschaltglied in MOS-Technik.
Bild 3-6. Universal-Durchschaltglied mit der Funktion
y = x0 · a¯ 1 a¯ 0 + x1 · a¯ 1 a0 + x2 · a1 a¯ 0 + x3 · a1 a0 . a MOSUND-ODER-Gatter; b Verwendung als Multiplexer; c Verwendung als Logikeinheit. Die Schaltung kann auch in umgekehrter Richtung zum Demultiplexen oder Decodieren verwendet werden
werden verhindert, wenn alle Zweige im Durchschaltglied mit Serienschaltungen von Schaltern ausgestattet sind (UND-Funktion) und die Schalter so gesteuert werden, dass immer genau ein Zweig durchgeschaltet ist. Bild 3-6 zeigt eine solche Schaltung mit MOS-Transistoren als Schalter (MOS, metal oxide semiconductor). Darin werden die Transistoren alle normal betrieben, jedoch mit normalen und invertierten Signalen gesteuert. – Die Schaltung kann als Multiplexer oder als Logikeinheit eingesetzt werden. Als Multiplexer hat sie die Aufgabe, genau eine der vier Eingangsleitungen x0 bis x3 mit den Steuersignalen a1 und a0 auf den gemeinsamen Ausgang y durchzuschalten, z. B. bei [a1 a0 ] = [11] die unterste Leitung, d. h., y = x3 . Als Logikmodul kann sie durch Wahl der Steuersignale x3 , x2 , x1 , x0 sämtliche 24 = 16 Verknüpfungsmöglichkeiten mit den zwei Eingangsvariablen a0 und a1 bilden und der Ausgangsvariablen y zuordnen, z. B. bei [x3 x2 x1 x0 ] = [1000] die UND-Funktion, d. h., y = a0 · a1 und bei [x3 x2 x1 x0 ] = [1110] die ODER-Funktion, d. h., y = a0 + a1 . 3.1.3 Verknüpfungsglieder
Verknüpfungsglieder verknüpfen die Werte ihrer Eingangssignale xi durch Schalterkombinationen (in den Bildern 3-7a,b und 3-8a steht ein Schalter jeweils stellvertretend für eine Schalterkombination) und schalten entweder das Pluspotenzial auf den Ausgang durch (y = 1 = +) oder das Massepotenzial (y = 0 = ). Die Durchschaltung der konstanten Potenziale + und der Stromversorgung bei Verknüp-
3 Schaltnetze
fungsgliedern anstelle der variablen Potenziale 1 bzw. 0 bei Durchschaltgliedern ermöglicht eine Regenerierung der Spannungspegel des Ausgangssignals. Deshalb können Verknüpfungsglieder (als „aktive“ Schaltungen) im Gegensatz zu Durchschaltgliedern (als „passive“ Schaltungen) problemlos hintereinandergeschaltet werden (vgl. G 26.1). Begrenzungen ergeben sich durch die Anzahl an Folgeschaltungen, die der Ausgang eines Verknüpfungsgliedes zu „treiben“ hat (fan-out) in Bezug auf den Strom, der zum Umladen der kapazitiven Last nötig ist (Lastfaktor). mit Transistoren. Bild 3-7a dient als Grundschaltung für logische Operationen in der Relaistechnik; in der Transistortechnik wird sie hauptsächlich als Ausgangsschaltung verwendet (z. B. als Stromtreiber bei ECL, emitter coupled logic). In der Transistortechnik dient Bild 3-7b als Grundschaltung für logische Operationen ( y = 1, wenn nicht x = 1). Dabei erscheint die Wirkung des Schalters (bzw. der Schalterkombination) am Ausgang in invertierter Form (Inverterschaltung). In Schaltungen mit bipolaren Transistoren werden nur die Schalter, in Schaltungen mit unipolaren Transistoren (MOS-Technik) darüber hinaus auch die Widerstände mit Transistoren aufgebaut (die dann nicht als Schalter arbeiten). Die in den Bildern 3-7c bis f dargestellten MOS-Schaltungen erklären sich aus der Invertierungseigenschaft der Grundschaltungen in Verbindung mit nur einem Schalter (Negation, NICHT-Gatter), mit mehreren parallelen Schaltern (negiertes ODER, negated OR, NOR-Gatter) bzw. mit mehreren seriellen Schaltern (negiertes UND, negated AND, NAND-Gatter).
Grundschaltungen
Verknüpfungsglieder in CMOS-Technik. Bild 3-8a
dient in der Transistortechnik gleichermaßen als Ausgangsschaltung (z. B. als Stromtreiber bei TTL, transistor transistor logic) wie als Grundschaltung für logische Operationen ( y = 1, wenn nicht x = 1). Dabei muss die Wirkung der beiden Schalter (bzw. der Schalterkombinationen) immer gegensätzlich (komplementär) zueinander sein. In CMOS-Technik (CMOS, complementary MOS) werden dazu MOS-Transistoren mit komplementärer
Bild 3-7. Verknüpfungsglieder. a Transmitter-, b Inver-
ter-Grundschaltung; c, d NICHT-Gatter; e NOR-Gatter; f NAND-Gatter; g Komplexgatter. Der Lastwiderstand in e bis g ist entweder wie in c durch einen nMOS-Transistor (nMOS-Technik) oder wie in d durch einen (komplementären) pMOS-Transistor (Pseudo-nMOS-Technik) realisiert
Funktion benutzt und ihre Verbindungsstrukturen „unten“ und „oben“ dual zueinander aufgebaut: in Bild 3-8b Transistor unten normal, oben invers (NICHT-Gatter), in Bild 3-8c Transistoren unten parallel/normal, oben seriell/invers (NOR-Gatter), in Bild 3-8d unten seriell/normal oben parallel/invers (NAND-Gatter). Symbolik. Anstelle der vorgestellten, aufwändigen
Zeichnungen der logischen Gatter kann man in logischen Blockbildern die in Tabelle 1-1 wiedergegebenen traditionellen Symbole nach der früheren DIN 40 700-14 benutzen. Die in DIN 40 900-12 definierte neue Symbolik sowie in USA vielfach benutzte Schaltzeichen sind in Tabelle I 14-1 dargestellt. – Das in (3-1) angewandte allgemeine Halbkreissymbol dient sowohl zum Ausdrücken des komplexen logischen Aufbaus elektronischer Schaltkreise (Abstraktion von Elektronik-Details) als auch der zusammenfassenden Darstellung von durch Tabellen oder Gleichungen definierten Schaltnetzen (Abstraktion von Logik-Details).
J25
J26
J Technische Informatik / Digitale Systeme
behalten werden, jedoch sind aus technischen Gründen zusätzliche Schaltungsmaßnahmen nötig. Insbesondere wird zur Steigerung der Schaltgeschwindigkeit das Verkettungssignal ui+1 der Schaltung „aufgeladen“ sowie nach vier Serienschaltungen „verstärkt“, siehe z. B. [1]. – Funktion. Mit xi = 0 und yi = 0 wird ui+1 = 0 (Übertrag „killed“ – Ki = 1), mit xi = 0 und yi = 1 oder xi = 1 und yi = 0 wird ui+1 = ui (Übertrag „propagated“ – Pi = 1), und mit xi = 1 und yi = 1 wird ui+1 = 1 (Übertrag weder „killed“ noch „propagated“, d. h. Übertrag „generated“ – Gi = 1). Mit Pi = 1 und ui = 0 oder Pi = 0 und ui+1 = 1 wird zi = 1, anderenfalls wird zi = 0 (Summenziffer gleich 1 bzw. 0), in Gleichungsform ui+1 = xi yi + (xi ↔ | yi )ui , Bild 3-8. Komplementär-Verknüpfungsglieder (Inversbe-
trieb durch Punkt gekennzeichnet). a Inverter-Grundschaltung; b NICHT-Gatter; c NOR-Gatter; d NAND-Gatter; e Mischgatter (Durchschalt-/Verknüpfungsglied)
3.2 Schaltungen für Volladdierer Beginnend mit Addierern in sog. zweistufiger Logik für Rechner der ersten und z. T. auch der zweiten Generation (Carry-save-Addition, siehe 4.4.2) sind in den späteren Generationen Addierer in mehrstufiger Logik entwickelt worden (Carry-ripple-Addition, siehe 3.2.1). Um eine Vorstellung vom Aufbau und dem Zusammenwirken der einzelnen Teilschaltungen gemäß Bild 3-1a, den sog. Volladdierern, zu vermitteln, sind in den Bildern 3-9 und 3-10 zwei von zahlreichen Schaltungsvarianten dargestellt. Anhand der Tabelle Bild 3-1b lässt sich ihre Funktion überprüfen, indem für jede Zeile die entsprechenden Schalterstellungen bzw. Gatterbelegungen eingetragen und daraus die Werte für ui+1 und zi ermittelt werden. 3.2.1 Volladdierer mit Durchschaltgliedern
Die in Bild 3-9a wiedergegebene Schaltung enthält neben den vier NICHT-Gattern Bild 3-7c drei Durchschaltglieder gemäß Bild 3-6a und ein Durchschaltglied gemäß Bild 3-5a. Der Anschaulichkeit halber ist der Volladdierer mit Schaltersymbolen gezeichnet. Für eine funktionsfähige elektronische Schaltung in MOS-Technik kann seine Struktur grundsätzlich bei-
zi = xi ↔ | yi ↔ | ui .
(3-2) (3-3)
Bemerkung. Die MOS-Schaltung in Bild 3-9a ist auf (normal arbeitende) nMOS-Transistoren zugeschnitten. Diese schalten 0 schneller durch als 1, was beim Aufbau der Übertragungskette im Volladdierer berücksichtigt ist (Durchschalten von und ggf. Weiterleitung). Die in CMOS verwendeten (invers arbeitenden) pMOS-Transistoren schalten hingegen 1 schneller als 0 durch, weshalb in CMOS die Schalter in Durchschaltgliedern, sollen sie Variablen durchschalten, als Paar komplementär angesteuerter, parallel geschalteter nMOS/pMOSTransistoren realisiert werden. Solche „Komplementär“schalterkombinationen werden nicht nur in Schaltnetzen, z. B. für Volladdierer, sondern auch in CMOS-Speichergliedern, wie z. B. in Bild 4-4, eingesetzt. 3.2.2 Volladdierer mit Verknüpfungsgliedern
Die in Bild 3-10a dargestellte Schaltung enthält vier Verknüpfungsglieder der Struktur Bild 3-7b, von denen zwei anstelle der einzelnen Schalter Schalterkombinationen enthalten. Der Anschaulichkeit halber sind die Verknüpfungsglieder mit Schalter- und Widerstandssymbolen gezeichnet. Für eine funktionsfähige Schaltung in MOS-Technik werden Schalter wie Widerstände durch Transistoren realisiert; in CMOS-Technik werden für die Schalter normal arbeitende Schalttransistoren und anstelle
3 Schaltnetze
Bild 3-9. Volladdierer mit Übertragsweiterleitung über Durchschaltglieder. a Schaltung; b Blockbild mit Gattersymbolen
Bild 3-10. Volladdierer mit Übertragsweiterleitung über Verknüpfungsglieder. a Schaltung; b Blockbild mit Bezug auf Gleichungen
J27
J28
J Technische Informatik / Digitale Systeme
der Widerstände die zu diesen Schalterkombinationen dualen Schalterkombinationen mit invers arbeitenden Schalttransistoren eingesetzt. Es gibt zahlreiche Schaltungsvarianten von Volladdierern, siehe z. B. [2]. – Funktion: Mit xi = 1 und yi = 1 oder mit ui = 1 und xi = 1 oder yi = 1 wird ui+1 = 1, anderenfalls wird ui+1 = 0 (Übertrag gleich 1 bzw. 0). Mit ui+1 = 0 und xi = 1 oder yi = 1 oder ui = 1 oder mit xi = 1 und yi = 1 und ui = 1 wird zi = 1, anderenfalls wird zi = 0 (Summenziffer gleich 1 bzw. 0), in Gleichungsform ui+1 = xi yi + ui (xi + yi ) , zi = u¯ i+1 (xi + yi + ui ) + xi yi ui .
Prozessoren sind ihre Operationen hingegen einer strengen Auswahl unterzogen, nur diese werden codiert (und ALU-intern decodiert; Bild 3-11a). Aus der in Bild 3-9 dargestellten Volladdiererschaltung entsteht die Schaltung einer „1-Bit-Scheibe“ einer arithmetisch-logischen Einheit, wenn die in der Volladdiererschaltung implizit enthaltenen konstanten Steuervektoren durch explizit aus der Schaltung herausgeführte variable Steuervektoren ersetzt werden; n solche ALU-Scheiben werden zu einer n-Bit-ALU zusammengesetzt, und es entsteht Bild 3-11b.
(3-4) (3-5)
Bemerkung. Der Volladdierer (zur Addition von Dualziffern) bildet eine Art Keimzelle elektronischer Datenverarbeitungswerke: n-mal gemäß Bild 3-1a aufgebaut, entsteht ein Schaltnetz zur Addition von Dualzahlen; aus diesem, gemäß Bild 3-11 verallgemeinert, entsteht ein Schaltnetz zur Durchführung arithmetischer und logischer Operationen; aus diesem wiederum, gemäß Bild 4-19b mit Registern zusammengeschaltet, entstehen Schaltwerke zur Datenverarbeitung mit in elektronischer Geschwindigkeit operierenden Schaltungen (universelle Datenwerke), wie sie für Prozessoren in Rechenanlagen benötigt werden (vgl. die Strukturbilder in 5, jeweils unterer Teil).
3.3 Schaltnetze zur Datenverarbeitung und zum Datentransport Datenverarbeitung und -transport bildet den Kern des operativen Teils programmgesteuerter datenverarbeitender Geräte. 3.3.1 Arithmetisch-logische Einheiten
Arithmetisch-logische Einheiten werden oft nach Gesichtspunkten guter technischer Integrierbarkeit gebaut und enthalten deshalb neben sinnvollen arithmetischen und logischen Operationen auch eine große Anzahl sinnloser arithmetisch-logischer Mischoperationen. Als eigenständige Chips erlauben solche ALUs (arithmetic and logic units) die Ausführung auch dieser Mischoperationen; als Teile von
Arithmetik- und Logikoperationen. Mit den Steu-
ervektoren k = [k0 k1 k2 k3 ] zur Erzeugung der KillFunktion Ki (speziell k = [1000] in Bild 3-9), p = [p0 p1 p2 p3 ] zur Erzeugung der Propagate-Funktion Pi , (speziell p = [0110] in Bild 3-9) und r = [r0 r1 r2 r3 ] zur Erzeugung der Result-Funktion zi (speziell r = [0110] in Bild 3-9) lauten die Funktionsgleichungen zur Beschreibung von Bild 3-9 als ALU-Glied (zu seiner symbolischen Darstellung siehe auch Bild 3-9b mit (3-6) für Ki , (3-7) für Pi und (3-9) für zi ): Ki = k0 x¯i y¯ i + k1 x¯i yi + k2 xi y¯i + k3 xi yi ,
(3-6)
Pi = p0 x¯i y¯ i + p1 x¯i yi + p2 xi y¯ i + p3 xi yi ,
(3-7)
u¯ i+1 = Ki + Pi u¯ i
oder ui+1 = K i · (Pi + ui ) , (3-8)
zi = r0 u¯ i Pi + r1 u¯ i Pi + r2 ui Pi + r3 ui Pi .
(3-9)
Für arithmetische Operationen ist r = [0110] oder r = [1001] zu wählen; in diesem Fall ist zi nach (3-9) von ui abhängig, d. h., zi = Pi ↔ | ui bzw. zi = Pi ↔ ui . Für logische Operationen ist r = [0101] zu wählen; in diesem Fall ist zi nach (3-9) von ui unabhängig, d. h., zi = Pi . Mit der Zusammenschaltung von n solchen ALU-Gliedern entsprechend Bild 3-11b lassen sich arithmetische und logische Operationen mit n-stelligen 2-Komplement-Zahlen und Bitvektoren der Länge n durchführen, eine Auswahl zeigt Tabelle 3-1. Bedingungsoperationen. Zu ihnen zählen Operationen mit arithmetischen Operanden (Zahlen) und logischem (Boole’schem) Ergebnis (wahr, falsch),
3 Schaltnetze
Bild 3-11. Arithmetisch-logische Einheit (ALU) für n Stellen mit Zahlenbeispiel Z = X − Y (X = +5, Y = −4). Die
Schrägstriche an den Leitungen geben deren Anzahl an (bei n = 4 entsteht – Z als 2-Komplement-Zahl interpretiert – das „falsche“ Ergebnis Z = −7). a Symbol; b Schaltbild
z. B. X = Y, X Y, X < Y, X < 0 usw. Die Boole’schen Werte dieser Relationen werden beim Anlegen des Operationscodes für die Subtraktion Z = X − Y aus den zum Condition-Code CC zusammengefassten Bedingungsbits z, n, c und v der ALU gewonnen (Bild 3-11b): das Zero-Bit z zeigt an, ob das Ergebnis null ist (z = z¯n−1 z¯n−2 . . . z¯1 z¯0 ), das Negative-Bit n zeigt an, ob das Ergebnis negativ ist (n = zn−1 ), das Carry-Bit c zeigt an, ob ein Übertrag in der höchsten Stelle entsteht (c = un ), das Overflow-Bit v zeigt an, ob der Zahlenbereich für 2-Komplement-Zahlen von n Stellen (vgl. 6.3.3) überschritten wird (v = vn = un ↔ | un−1 ).
Funktionsgleichungen mit Propagate-Funktion, wie sie bei Arithmetik- und Vergleichsoperationen auftreten, beschreiben die stufenförmige Ausbreitung des Übertragssignals (carry) durch eine ganze Kette von Schaltgliedern (carry ripple). Der Übertrag ist für jede Stufe erforderlich und benötigt mit steigender Stufenanzahl immer höhere Laufzeiten (vgl. z. B. die Beeinflussung der ui durch u0 in Bild 3-11b). Um dies in Grenzen zu halten, wird er für eine gewisse Stufenzahl (z. B. 4) in jeder Stufe (d. h. der 2., der 3. und der 4.) vorausschauend berechnet (carry look-ahead, CLA). Dadurch verringert sich die Laufzeit (hier auf ein Viertel), und der Aufwand erhöht sich (nur auf etwas mehr als das Doppelte). Diese Aussage ist jedoch ggf. unter Berücksichtigung der Schaltungs-
Carry-look-ahead-Technik.
Tabelle 3-1. Auswahl an ALU-Operationen (+ Addition, – Subtraktion, · Multiplikation)
k0 1 0 1 0 1 0 0 0 0 0
k1 0 0 1 0 1 0 0 0 0 0
k2 0 1 0 1 0 0 0 0 0 0
k3 0 0 0 1 0 0 0 0 0 0
p0 0 1 0 1 0 0 0 1 0 0
p1 1 0 0 1 0 0 1 1 0 0
p2 1 0 1 0 0 0 1 0 1 0
p3 0 1 1 0 0 1 1 0 1 0
r0 0 1 0 1 0 0 0 0 0 0
r1 1 0 1 0 0 1 1 1 1 0
r2 1 0 1 0 1 0 0 0 0 0
r3 0 1 0 1 1 1 1 1 1 0
Z= X + Y + u0 X − Y − u0 X + u0 X − u0 X · 2 + u0 X UND Y X ODER Y NICHT Y X 0
J29
J30
J Technische Informatik / Digitale Systeme
technik zu relativieren. Zu weiteren Techniken zur Beschleunigung des Übertrags siehe z. B. [3]. 3.3.2 Multiplexer
Multiplexer dienen zum Durchschalten von mehreren Leitungsbündeln (im Folgenden kurz Leitungen genannt) auf eine Sammelleitung; und zwar wird diejenige Leitung durchgeschaltet, deren Steuereingang aktiv ist bzw. deren Adresse am Adresseingang anliegt (Bild 3-12a). Im Grenzfall hat der Multiplexer nur einen einzigen solchen Dateneingang (Torschaltung), der uncodiert oder mit einer Adresse angewählt wird (Bild 3-12b). Funktionsgleichungen. Zu ihrer Darstellung in all-
gemeiner Form wäre die Einführung von Matrixoperationen nützlich [2]. Für den speziellen Fall eines Multiplexers mit 3 Dateneingängen [c01 c00 ], [c11 c10 ], [c21 c20 ], 3 Steuereingängen k0 , k1 , k2 ohne Decodierung und [y0 y1 ] als Datenausgang lauten sie y0 = k0 c00 + k1 c10 + k2 c20 , y1 = k0 c01 + k1 c11 + k2 c21 .
(3-10) (3-11)
Um die beschriebene Funktionsweise zu erfüllen, darf nur ein Steuereingang ki = 1 sein; anderenfalls würde je nach Realisierung des Multiplexers die Eingangsinformation ODER-verknüpft (beim Aufbau mit Verknüpfungsgliedern), oder es können Kurzschlussströme entstehen (z. B. über die Schalter in Bild 3-12c). Sind andererseits alle ki = 0, so entsteht entweder am Ausgang ein definierter Boole’scher Wert (z. B. 0 in (3-10)), oder der Ausgang ist von den Eingängen abgetrennt (z. B. in Bild 3-12c). – Bei Multiplexerschaltungen mit integrierter Decodierung treten diese Fälle nicht auf, da immer genau ein ki = 1 ist (siehe z. B. Bild 3-6a).
Tristate-Technik. Schaltungen der in Bild 3-12c
wiedergegebenen Art lassen sich zur Dezentralisierung der Multiplexerfunktion benutzen. Die Schalter (früher Dioden, heute Transistoren) dienen als Ausgänge verstreut angeordneter (verteilter) Informationsquellen und brauchen nur noch verdrahtet zu werden. Entsprechend der Multiplexerdefinition darf nur ein einziger Schalter „seine“ Quelle durchschalten (Ausgang niederohmig), während alle anderen Schalter ihre Quellen von dem gemeinsamen Sammelpunkt abkoppeln müssen (Ausgänge hochohmig). Diese Quellen liefern weder 0 noch 1, befinden sich also in einem dritten Zustand (tristate). Sind die Ausgänge sämtlicher Quellen im dritten Zustand, so ist es i. Allg. auch der Zustand auf der Sammelleitung (in Signaldiagrammen als dritter Pegel zwischen dem 0- und dem 1-Pegel gezeichnet). Während zur Erzielung geringer elektrischer Leistung Tristate-Ausgänge mit „passiven“ Schaltern (Durchschaltglieder) ausreichen (Bild 3-12d oben), werden für größere Leistungen, z. B. zur Überbrückung größerer Entfernungen zwischen Informationsquelle und -senke, Tristate-Ausgänge mit „aktiven“ Schaltern (Verknüpfungsglieder) benötigt (Bild 3-12d, unten). Solche Tristate-Treiber findet man bei Bausteinausgängen oder als Sonderbausteine in Anwendungen, bei denen die Multiplexerfunktion der Quellen über die einzelnen Bausteine hinweg auf das gesamte System verteilt ist, wie z. B. in Bus-Systemen. 3.3.3 Shifter
Shifter entstehen aus matrixförmigen Zusammenschaltungen von Multiplexern, mit denen durch geeignete Wahl ihrer Steuereingänge mannigfaltige Operationen ausführbar sind: z. B. mit dem LinksRechts-Shifter in Bild 3-13a die Multiplikation mit 2, 4, 8 (durch Linksshift bei „Nachziehen“ der
Bild 3-12. Datenweg-/Datentransportschaltungen. a Symbolische Darstellung eines Multiplexers; b Symbole für ein Tor; c 1-Bit-Multiplexer mit Schaltern (ohne Decodierer); d Tristate-Ausgang bzw. -Treiber (beide logisch äquivalent), in CMOS arbeitet der obere Treiber-Schalter invers und wird durch ein NAND-Gatter angesteuert
3 Schaltnetze
Konstanten 0), die Division durch 2, 4, 8 (durch Rechtsshift bei „Stehenlassen“ der Variablen x3 ) oder ein Rund-Shift nach links oder rechts (durch Nachziehen von x3 bzw. x0 ). Das angegebene Schema lässt sich auf n-stellige Operanden verallgemeinern sowie durch die Einbeziehung weiterer Leitungen, z. B. eines Eingangs für die Konstante 1, eines Carry-Eingangs oder eines Overflow-Ausgangs, erweitern. Um die Anzahl der Steuereingänge zu reduzieren, werden wie bei ALUs oft nur die relevanten Shiftoperationen codiert (und shifterintern decodiert). Spezielle Shifter mit nur einer einzigen Shiftoperation enthalten keine Gatter oder Schalter (z. B. werden bei k01 , k12 , k23 , k40 immer gleich 1 und alle anderen ki j immer gleich 0 in Bild 3-13a zur Bildung der Operation [y3 y2 y1 y0 ] = [x2 x1 x0 0] keine Schalter benötigt). Funktionsgleichungen. Für den speziellen Fall des Shifters Bild 3-13a lauten sie ausschnittweise
y0 = x0 k00 + x1 k10 + x2 k20 + x3 k30 + 0 · k40 , (3-12) y1 = x0 k01 + x1 k11 + x2 k21 + x3 k31 + 0 · k41 . (3-13) Der jeweils letzte Term kann entfallen, wenn die Ansteuerung der Multiplexer mit ki j alle gleich 0 erlaubt ist. Das ist z. B. der Fall, wenn die Multiplexer mit Verknüpfungsgliedern, jedoch nicht, wenn sie als Durchschaltglieder aufgebaut sind. Barrel-Shifter. Das
sind spezielle Shifter, die zwei Operanden (ggf. auch dieselben) miteinander zu einem Bitvektor doppelter Länge verbinden (konkatenieren) und daraus einen Bitvektor einfacher Wortlänge ausblenden (extrahieren). Wegen ihres matrixförmigen Aufbaus (Zeilendrähte, Spaltendrähte, Transistoren in den Kreuzungspunkten)
eignen sie sich besonders gut für hochintegrierte Schaltungen (Bild 3-13b). Je nach Ansteuerung der Transistoren lassen sich die konkatenierten Operandenteile an die Ausgänge durchschalten, z. B. [z3 z2 z1 z0 ] = [x1 x0 y3 y2 ] bei x und y als Operanden oder [z3 z2 z1 z0 ] = [x1 x0 x3 x2 ] bei y = x als Operanden (2. und 6. Diagonale von links unten in Bild 3-13b). Shifter dieser Art benötigt man zur schnellen Durchführung von Shiftoperationen über zwei Register, wie sie in Rechnern bei den Shiftbefehlen, aber auch innerhalb arithmetischer Befehle auftreten, z. B. beim Multiplikations- oder beim Divisionsbefehl. 3.3.4 Busse
Busse entstehen durch Zusammenschaltung verteilter Informationsquellen (Sender) und -senken (Empfänger) über dezentralisierte Multiplexer und Torschaltungen. Bild 3-14a zeigt z. B. einen Bus, der die Sender (Index S) und die Empfänger (Index E) von sechs Systemkomponenten A bis F miteinander verbindet. – Ein Bus ist also eine Vorrichtung zum Transport von Information: Funktionell ein Knoten mit sternförmig angeordneten Schaltern und Abgriffen, technisch eine Leitung mit verteilt angeschlossenen Schaltungen für die (oft paarweise auftretenden) Sender und Empfänger der Systemkomponenten (z. B. ALUs, Register usw. innerhalb eines Mikroprozessors; Prozessoren, Speicher usw. innerhalb eines Mikroprozessorsystems). Aufgrund der Multiplexerfunktion eines Busses (Bild 3-14b) darf immer nur eine Quelle senden, d. h. ihre Information auf den Bus schalten. Die Senken sind je nach Funktion ohne Tore ausgestattet, d. h. empfangen diese Information immer
Funktionsweise.
Bild 3-13. Shifter. a Prinzipschaltung für 4-BitOperand x und Konstante 0; b Barrel-Shifter in MOS-Technik für zwei 4-Bit-Operanden x und y (y0 nicht ausgewertet)
J31
J32
J Technische Informatik / Digitale Systeme
(broadcasting), oder sie sind mit Toren ausgestattet und empfangen die Information nur, wenn sie angewählt werden (selective addressing). Unidirektionale Busse haben nur eine Quelle oder nur eine Senke – die Information läuft von der Quelle aus bzw. zur Senke hin in nur einer Richtung. Anderenfalls handelt es sich um bidirektionale Busse – die Information läuft mal in der einen, mal in der anderen Richtung. Die Systemkomponenten können unidirektional und bidirektional an einen bidirektionalen Bus angeschlossen werden. Die Auflösung der Richtungen erfolgt i. Allg. innerhalb der Systemkomponenten. Busse werden im Rechnerbau benutzt (1.) zum Informationsaustausch zwischen den Schaltungen innerhalb eines Chips (chipinterne Busse), (2.) zum Verbinden der Chips zu Systemen (chipübergreifende oder Systembusse).
Bild 3-15. Datencodier-/-decodierschaltungen mit Andeu-
tung ihrer Programmierbarkeit. a Codierer; b Decodierer; c ROM (read-only memory); d PAL (programmable array logic); e PLA (programmable logic array)
Technischer Aufbau.
Bei chipinternen Bussen (vgl. Bild 4-13 als Beispiel für die Zusammenschaltung von Speicher und ALUGliedern innerhalb eines Prozessorchips) dienen für Sender wie Empfänger einfache Schalter als Tore, die über die Phasen eines internen Takts gesteuert werden; zur Beschleunigung der Signalübertragung werden die Busleitungen ggf. vorgeladen. Bei chipübergreifenden Bussen (vgl. Bild 7-1a als Beispiel einer Zusammenschaltung von Prozessor und Speicherchips zu einem Mikroprozessorsystem) dienen in den Sendern Tristate-Treiber und in den Empfängern Schalter oder Gatter als Tore, die auf chipintern getaktete Speicherschaltungen wirken. Die zeitliche Abfolge der (nicht getakteten) Bussignale zwischen den einzelnen (intern getakteten) Systemkomponenten ist durch bestimmte Regeln festgelegt (Busprotokolle, siehe 7.1.3).
3.4 Schaltnetze zur Datencodierung/ -decodierung und -speicherung Datencodierung/-decodierung bildet – obwohl auch im operativen Teil zu finden – den Kern des steuernden Teils programmgesteuerter datenverarbeitender Geräte. 3.4.1 Codierer, Decodierer
Codierer dienen zum Verschlüsseln (Codieren) von Information im 1-aus-n-Code (genau 1 Bit von n Bits gesetzt) durch die Codewörter eines Binärcodes fester Wortlänge (i. Allg. viel weniger als n Bits). Der Codierer, Bild 3-15a, gibt dasjenige Codewort aus, dessen zugeordneter Eingang (genau einer von n) aktiv ist. – Decodierer dienen zum Entschlüsseln von Codewörtern eines Binärcodes fester Wortlänge in den 1-aus-n-Code. Der Decodierer, Bild 3-15b, aktiviert denjenigen Ausgang (genau einen von n), dessen Codewort an seinen Eingängen anliegt. In den Symbolen kann der Code unmittelbar binär oder in symbolischer Entsprechung eingetragen werden (siehe z. B. Bild 4-22). Funktionsgleichungen. Sie lauten für die Spezial-
Bild 3-14. Bus (ausgezogen) mit Anschlüssen von Systemkomponenten (gestrichelt). a Technische Struktur, b logisches Äquivalent. Bidirektionaler Informationsfluss erfordert verdrahtete Logik
fälle der Codierung/Decodierung der ersten vier Wörter des Dualcodes mit k0 bis k3 als Eingangs- und y0 , y1 als Ausgangsgrößen (Codierer) bzw. x0 , x1 als Eingangs- und k0 bis k3 als Ausgangsgrößen (Decodierer) in ausführlicher Form (links), sodass man die Codewörter [00], [01], [10] und [11] erkennen kann, und in vereinfachter Form (rechts), sodass ih-
3 Schaltnetze
re logische Struktur zum Ausdruck kommt (ODERVerknüpfungen beim Codierer, UND-Verknüpfungen beim Decodierer) y1 = k0 · 0 + k1 · 0 + k2 · 1 + k3 · 1 ; y1 = k2 + k3 , (3-14) y0 = k0 · 0 + k1 · 1 + k2 · 0 + k3 · 1 ; y0 = k1 + k3 , (3-15) k0 = (x1 ↔ 0) · (x0 ↔ 0) ; k0 = x¯1 x¯0 , (3-16)
Sie entstehen für den speziellen Fall eines Festwertspeichers mit der Wortlänge 2 und der Kapazität 4 aus (3-14) und (3-15), wenn darin die ki durch (3-16) bis (3-19) ersetzt werden, wobei anstelle der unveränderlichen Konstanten 0 und 1 veränderliche, d. h. programmierbare „Konstanten“ ci j treten:
Funktionsgleichungen.
y1 = x¯1 x¯0 c01 + x¯1 x0 c11 + x1 x¯0 c21 + x1 x0 c31 , (3-20)
k1 = (x1 ↔ 0) · (x0 ↔ 1) ; k1 = x¯1 x0 ,
(3-17)
y0 = x¯1 x¯0 c00 + x¯1 x0 c10 + x1 x¯0 c20 + x1 x0 c30 . (3-21)
k2 = (x1 ↔ 1) · (x0 ↔ 0) ; k2 = x1 x¯0 ,
(3-18)
Jede dieser Gleichungen beschreibt nach Einsetzung bestimmter Werte für ci j , d. h. nach der Programmierung, die gespeicherte Funktion in ausgezeichneter disjunktiver Normalform.
k3 = (x1 ↔ 1) · (x0 ↔ 1) ; k3 = x1 x0 . (3-19) Für die angegebene Funktionsweise des Codierers ist es erforderlich, dass genau ein Eingang ki = 1 ist; anderenfalls werden die durch die Eingangssignale angewählten Codewörter ODER-verknüpft. 3.4.2 Festwertspeicher
Festwertspeicher entstehen durch Zusammenschaltung eines Decodierers (zur Entschlüsselung der Adressen) und eines Codierers (zur Speicherung der unter den Adressen stehenden Wörter). Im Gegensatz zu Schreib-/Lesespeichern kann die in einem Festwertspeicher stehende Information nur gelesen werden, weshalb er als ROM (read-only memory) bezeichnet wird. Das heißt aber nicht, dass sein Inhalt überhaupt nicht verändert werden kann. Beim ROM steht zwar der Decodierinhalt fest, aber der Codierer ist „programmierbar“ (Bild 3-15c). Sein Inhalt wird von der Herstellerfirma festgelegt (factory ROM, FROM) oder vom Kunden mithilfe von Entwurfs-Software programmiert (programmable ROM, PROM), gegebenenfalls gelöscht und wieder programmiert (erasable PROM, EPROM). Dieser Vorgang geschieht vor der Inbetriebnahme des Gerätes, in dem der Festwertspeicher eingebaut ist. Der Decodierteil enthält bei einer Adresslänge von n Bit die Adressen 0, 1 . . . 2n − 1. Im Codierteil können demnach 2n Wörter untergebracht werden; bei einer Wortlänge von m Bit beträgt die Kapazität des ROM dann 2n m-Bit-Wörter, d. h. 2n · m Bit. – Die Zeit, die vom Anlegen der Adresse bis zum Erscheinen des Worts vergeht, heißt Zugriffszeit. (Zur Kennzeichnung von Speichern durch technische Daten siehe auch 4.2.3.)
3.4.3 Logikfelder
Logikfelder entstehen – wie ROMs – durch Zusammenschaltung eines Decodierers und eines Codierers. Ihre industriellen Bezeichnungen sind PAL (programmable array logic) und PLA (programmable logic array). Beim PAL ist der Decodierer programmierbar, und der Codierinhalt steht fest (Bild 3-15d). Schaltungstechnisch wird das erreicht, indem die UND-Gatter im Decodierteil mit einem PAL-Eingang unmittelbar (Programmierung von 1), negiert (Programmierung von 0) oder überhaupt nicht verbunden werden (Programmierung von –, d. h., die entsprechende Variable wird nicht zur Decodierung herangezogen). Die ODER-Gatter im Codierteil sind nicht programmierbar, sondern mit einer festen Anzahl UND-Gatter verdrahtet. Ein PLA kombiniert die Programmierbarkeit des PAL hinsichtlich seines Decodierteils mit der des ROM hinsichtlich seines Codierteils und ist damit der flexibelste Logikbaustein (Bild 3-15e). PLAs haben seit der Einführung der Mikroprogrammierung – zuerst als Diodenmatrizen, später mit Transistoren aufgebaut – im Rechnerbau eine große Bedeutung erlangt. Ihr Vorteil liegt im matrixförmigen Aufbau, was insbesondere bei ihrer Verwendung innerhalb hochintegrierter Schaltungen zum Tragen kommt. Ihr Einsatz als Bausteine in der Form „draußen“ programmierbarer Felder (field PLA, FPLA) wird mehr und mehr durch universellere, d. h. intern mit Speichergliedern
J33
J34
J Technische Informatik / Digitale Systeme
versehene Bausteine, z. B. FPGAs (field programmable gate arrays), abgelöst. Funktionsweise. Das Logikfeld gibt diejenigen
„Codewörter“ ODER-verknüpft aus, deren (gegebenenfalls unvollständige und mehrdeutige) „Adressen“ hinsichtlich ihrer 0- und 1-Bits mit der eingangs anliegenden 0/1-Kombination übereinstimmen. Die hier benutzte Speicherterminologie ist streng genommen nur anwendbar, wenn die ODER-Verknüpfung der Codewörter nicht ausgenutzt wird. Das trifft bei vielen Anwendungen zu, z. B. bei der Speicherung von Funktionstabellen in Steuerwerken. Mit einem PAL oder einem PLA lassen sich so viele Funktionen unmittelbar in disjunktiver Normalform verwirklichen, wie ODER-Gatter im Baustein enthalten sind, wobei die Anzahl der UND-Gatter beim PAL pro ODER-Gatter (Minimierung durchführen) und beim PLA in seiner Gesamtheit (Kapazität beachten) vorgegeben ist. 3.4.4 Beispiel eines PLA-Steuerwerks
Bild 3-16 zeigt ein PLA, dessen Struktur für eine bestimmte Anwendung programmiert ist. Dabei handelt es sich um die Speicherung der Tabelle einer Boole’schen Steuerungsfunktion (in Bild 4-21 im PLA-Symbol eingetragen). Die Anordnung der Transistoren ist in ihrer Gestalt gleich der Anordnung der 0/1-Werte in der Tabelle: Links ist überall dort ein Transistor mit einem normalen PLA-Eingang verbunden, wo in der Tabelle eine 0 steht, und überall dort mit einem negierten Eingang, wo in der Tabelle eine 1 steht. Rechts ist an all denjenigen Stellen ein Transistor vorhanden, an denen in der Tabelle eine 1 steht. Wenn das PLA Teil einer integrierten Schaltung ist, werden dazu vom Hersteller an den entsprechenden Kreuzungspunkten von Zeilen- und Spaltendrähten Transistoren eingebaut. Bei einem PLA-Baustein sind dagegen an allen Kreuzungspunkten Transistoren vorhanden: sie werden jedoch an den Stellen, an denen keine Transistoren sein sollen, mithilfe eines Programmiergerätes von ihren Eingängen abgetrennt und so wirkungslos gemacht (fusible links) oder dort, wo sie wirksam werden sollen, mit ihren Eingängen angeschlossen (antifuse technique).
Obwohl die linke wie die rechte Transistormatrix als NORFunktionen verwirklicht sind (vgl. Bild 3-7d), lassen sich wegen der Negationsglieder an den Ein- und Ausgängen die linke Matrix als UND-Matrix (AND plane) und die rechte Matrix als ODER-Matrix (OR plane) interpretieren. Zum Beispiel sind in der 2. Zeile die NOR-Verknüpfung u0 + u1 + x¯0 der UND-Verknüpfung u¯ 0 u¯ 1 x0 und in der 5. Zeile die NOR-Verknüpfung u¯ 0 + u1 der UND-Verknüpfung u0 u¯ 1 äquivalent. In der 2. Spalte rechts werden diese Terme durch die NOR-Verknüpfung u¯ 0 u¯ 1 x0 + u0 u¯ 1 zusammengefasst und anschließend negiert, was der ODER-Verknüpfung u¯ 0 u¯ 1 x0 + u0 u¯ 1 äquivalent ist. Jede einzelne Funktion, hier an u∗1 gezeigt, ist also durch UND-ODER-Verknüpfungen, d. h. in disjunktiver Normalform beschreibbar. Auf diese Weise ist es möglich, mit einem PLA beliebige Boole’sche Funktionen in minimaler, in ausgezeichneter oder in irgendeiner disjunktiven Normalform „dazwischen“ zu verwirklichen. Aus der in Bild 3-16 wiedergegebenen Schaltung eines Steuerschaltnetzes lässt sich auf einfache Weise ein Steuerschaltwerk verwirklichen. Dazu werden die Ausgänge u∗0 und u∗1 mit den Eingängen u0 bzw. u1 verbunden, sodass die gestrichelt gezeichneten Schalttransistoren mit ihren nachgeschalteten Invertern zusammengenommen zwei sog. D-Flipflops gemäß Bild 4-3a bilden. Das PLA enthält das Steuerprogramm, und in den Flipflops wird der Zustand gespeichert, der den momentanen Stand des Programmablaufs widerspiegelt; vgl. Bild 4-21. Funktionsdarstellung/-speicherung.
Bemerkung. Solche PLA-Steuerwerke bilden den Ausgangspunkt der Entwicklung elektronischer Programmsteuerwerke: Ein PLA, wie beschrieben rückgekoppelt, ergibt gemäß Bild 4-20a ein speziell auf eine bestimmte Aufgabenstellung zugeschnittenes Steuerwerk. Wird das Register in der Rückkopplungsschleife als Zähler ausgebildet und anstelle des PLA ein ROM verwendet, so ergibt sich gemäß Bild 4-20b ein universell für viele Anwendungen einsetzbares Steuerwerk. Wird darüber hinaus das ROM ersetzt durch ein RAM (Schreib-/Lesespeicher, siehe 4.2.3) oder ein CAM (Assoziativspeicher) mit der Funktion eines Cache (siehe 5.4.1), so entstehen Schaltwerke zur Programmsteuerung mit in elektronischer Geschwindigkeit austauschbaren
4 Schaltwerke
Bild 3-16. Transistorstruktur eines PLA. Zur Einsparung von Transistoren, Zeilendrähten oder ausgangsseitigen Spaltendrähten lassen sich die Matrizen komprimieren, was in etwa einer Minimierung der Funktionsgleichungen entspricht. Die Widerstande sind in Wirklichkeit wieder wie in Bildern 3-7c oder d mit Transistoren realisiert. Im Grunde handelt es sich bei PLAs innerhalb eines VLSI-Chips um eine Aufbautechnik, d. h. um eine von vielen Möglichkeiten der Transistorplatzierung und -verdrahtung. Man vergegenwärtige sich beispielsweise, dass die einzelnen Funktionen auch dezentralisiert aufgebaut werden können und dann als normale Gatterlogik erscheinen
Programmen (universelle Programmwerke), wie sie für Prozessoren in Rechenanlagen benötigt werden (vgl. die Strukturbilder in 5, jeweils oberer Teil).
4 Schaltwerke Ihrer Struktur nach sind Schaltwerke rückgekoppelte Schaltnetze. Ihre Funktion wird beschrieben durch rückwirkungsbehaftete (rekursive) Boole’sche Funktionen (Boole’sche Automaten/Algorithmen). Damit lässt sich der Begriff Schaltwerk auch wie folgt definieren: Ein Schaltwerk ist die schaltungstechnische Realisierung eines Boole’schen Automaten bzw. Algorithmus, mathematisch ausgedrückt durch das Paar f, g einer rekursiven Funktion f für den Übergangsvektor u (Übergangsfunktion) und einer gewöhnlichen Funktion g für den Ausgangsvektor y (Ausgangsfunktion), beide abhängig vom Übergangsvektor u und vom Eingangsvektor x. Im Gegensatz zu einer Funktion, deren Ergebnis nur vom Argument abhängt, hängt das Ergebnis eines Algorithmus außerdem vom Zustand, d. h. dem Wert von u ab, der sich i. Allg. von Schritt zu Schritt ändert. Diese „Zustandsrekursion“ wird – wie in höheren Programmiersprachen bei der Schreibweise von Anweisungen üblich – durch das Zeichen „:=“ ausgedrückt (lies (4-1): Der Wert von u wird ersetzt durch den Wert von f (u, x)).
Schaltwerke verwirklichen verschiedene Arten von Algorithmen: (1.) operative, die aufgrund von Anweisungen bestimmte Operationen ausführen (Operationswerke), und (2.) steuernde, die solche Anweisungen in zeitlicher Reihenfolge ausgeben (Steuerwerke). Operative und steuernde Algorithmen sind in technischen Geräten als einzelne Schaltwerke realisiert (z. B. in Taschenrechnern zur Ausführung bestimmter Operationen oder in Werkzeugmaschinen zur Steuerung bestimmter Abläufe). Sie kommen aber auch – insbesondere in der elektronischen Datenverarbeitung – als zusammenwirkende Schaltwerke vor. Dann wird das Operationswerk oft Datenwerk genannt (es führt die Datenverarbeitung aus) und das Steuerwerk oft Programmwerk genannt (es führt die Programmabarbeitung durch). In dieser Konstellation bilden sie ein in gewisser Hinsicht autonomes Schaltwerk: ein programmgesteuertes Datenverarbeitungswerk (Prozessor, Rechner). Zur Ermöglichung der durch das Zeichen := in (4-1) ausgedrückten Rekursion, d. h. des fortwährenden Modularer Aufbau.
J35
J36
J Technische Informatik / Digitale Systeme
Bild 4-1. Informationsfluss in einem programmgesteuerten Datenverarbeitungswerk; die beiden Teilwerke sind untereinander zum Signalaustausch über ihre Eingangs- und Ausgangsleitungen verbunden. 1 Befehle zur Programmverzweigung, 2 Befehle zur Datenverarbeitung (operative Signale), 3 Bedingungen für Programmverzweigung (steuernde Signale), 4 Ergebnisse der Datenverarbeitung und -veränderung
schrittweisen Ersetzens des Zustands, dienen die natürlichen Signallaufzeiten im Übergangsschaltnetz, oder es bedarf für jede Komponente u von u des künstlichen Einbaus von Schaltungen, sog. Speicherglieder (kurz: Flipflops), die ihre Eingangswerte (den Zustand) mithilfe eines Taktsignals um eine Taktperiode verzögern oder über mehrere Taktperioden speichern (taktsynchrone Schaltwerke, kurz Synchronschaltwerke). Da diese Art von Schaltwerken von weitaus größerer Bedeutung ist, wird der Zusatz taktsynchron bzw. Synchron- i. Allg. weggelassen. – In Datenwerken dienen die Speicherglieder zum Speichern des Zustands der Daten, d. h. der Werte der zu verarbeitenden Größen, und in Programmwerken zum Speichern des Zustands von Programmen, d. h. ihres gegenwärtigen Ausführungsstands. Programmgesteuerte Datenverarbeitung lässt sich demnach erklären als Komposition aus zwei sich gegenseitig beeinflussenden Zustandstransformationen (Bild 4-1).
4.1 Signalverzögerung und -speicherung Bei den Speichergliedern in den Synchronschaltwerken handelt es sich gewöhnlich um getaktete Flipflops in vielerlei Varianten, die je nach Schaltung ihre Eingangsinformation über eine Taktperiode verzögern (D-Flipflops, D delay), über mehrere Takte speichern (SR-Flipflops, S set, R reset) und darüber hinaus ggf. invertieren (z. B. JK-Flipflops; J jump, K kill).
Bild 4-2. D-Flipflop in der Rückkopplung von f . a Ausschnitt aus (4-1) für eine Komponente von u; b Verhalten mit Einbeziehung des Taktsignals
4.1.1 Flipflops, Darstellung mit Taktsignalen
Das D-Flipflop dient zur Verzögerung des Wertes genau einer Komponente u von u in (4-1) um genau ein Taktintervall (Bild 4-2). Mit dem Takt T tastet es den Pegel von u ab und hält ihn ab der negativen Taktflanke T = 1 → 0 für die Dauer eines Taktintervalls stabil (Signal w). In getakteten digitalen Systemen erfolgen sämtliche Signaländerungen gleichzeitig, und zwar zu den z. B. durch die negative Taktflanke definierten Zeitpunkten, sodass neben w auch alle anderen Eingangswerte von f sich nur zu diesen Zeitpunkten ändern können, d. h., dass u nach einer gewissen Zeit (elektronisch gesprochen der Einschwingzeit von f ) stabil ist und danach für die nächste Abtastung zur Verfügung steht. Grundschaltungen in Master-Slave-Technik. Das
Signaldiagramm Bild 4-2b illustriert die Funktion des D-Flipflops anhand des zeitlichen Verlaufs von Eingangs- und Ausgangssignalen, sodass die Wirkung der Signalflanken unmittelbar zur Geltung kommt. Um seine Funktion durch Boole’sche Gleichungen beschreiben zu können, muss jedoch auf die Signalpegel zurückgegriffen werden. Die Funktion lautet in Worten (vgl. Bild 4-2b): Der Wert von u wird mit T = 1 einer (in Bild 4-2 nicht gezeichneten) Zwischengröße v zugewiesen (Vorspeicher, Master) und mit T = 0 gehalten, gleichzeitig erscheint er als Wert von v mit T = 0 als Ausgangsgröße w (Haupt-
4 Schaltwerke
Ungetaktete Flipflops. Die
Bild 4-3. Schaltungen des D-Flipflops, a mit Schaltern, Invertern und deren natürlicherweise vorhandenen Eingangskapazitäten, b mit Latches, c mit Flipflops
speicher, Slave) und wird mit T = 1 gehalten. Die Funktion lautet in Gleichungsform (die Verwendung von „ud = . . . “ anstelle von „u := . . . “ entsprechend (4-1) soll auf die gatterinternen Signalverzögerungen in Schaltwerken hinweisen; d delay): vd = T u + T v ,
(4-3)
w = T v + T w .eq − j : 4
(4-4)
d
Gleichungen (4-3) und (4-4) lassen sich in zahlreichen Varianten als Schaltungen verwirklichen: Bild 4-3a eignet sich für Anwendungen, in denen der Eingang nicht mit einer Steuergröße geschaltet wird, d. h. T unmittelbar auf u wirkt, z. B. in den Registern von Steuerwerken. Bild 4-3b eignet sich für Anwendungen, in denen der Eingang mit einer Steuergröße geschaltet wird, d. h. T über ein UND-Gatter auf u wirkt, wie z. B. bei Registern in Operationswerken. Bild 4-3c ist die Grundschaltung von mit Verknüpfungsgliedern aufgebauten Master-Slave-Flipflops; durch Variation ihrer Eingangsbeschaltung entstehen verschiedene Typen getakteter Speicherglieder (siehe Bild 4-7).
beiden elementaren rückgekoppelten Bausteine in den Bildern 4-3b und 4-3c werden (ohne Bezug auf ein Taktsignal) Fangschaltung oder (ungetaktetes) Latch bzw. Kippschaltung oder (ungetaktetes) Flipflop genannt (Bild 4-4). Sie dienen als Grundbausteine für Register- und Speicherelemente. Kennzeichnend für sie ist die Schleife mit den beiden hintereinandergeschalteten Invertern (in Bild 4-4a unmittelbar sichtbar, in Bild 4-4b in den NOR-Gattern versteckt). Diese elektrotechnisch „positive“ Rückkopplung ermöglicht es, den Wert einer Boole’schen Variablen u, der vorher „gefangen“ (ud = d bei l = 1) bzw. „gesetzt“ (ud = 1 bei s = 1) oder „rückgesetzt“ wurde (ud = 0 bei r = 1), in den Schaltungen zu speichern (ud = u bei l = 0 bzw. s = 0 und r = 0). Mit diesen Funktionsbeschreibungen der beiden ungetakteten Speicherglieder lässt sich die Funktion der Schaltungen Bilder 4-3b und 4-3c sowie die daraus entstehenden getakteten Speicherglieder in Bild 4-7 folgendermaßen erklären: Während T = 1 übernimmt der Master die eingangsseitig anstehende Information; und mit T = 0 übergibt er sie dem Slave, der sie am Ausgang zur Verfügung stellt. Zweiphasentakt. Beim Entwurf von Schaltwerken
mit Reaktion auf Signalflanken – man spricht auch von Asynchronschaltwerken (siehe z. B. [1]) – muss die Wirkung der ungleichmäßigen Signallaufzeiten durch die Gatter des Übergangsschaltnetzes berücksichtigt werden. Sie können zu strukturellen oder funktionellen Hazards führen (das sind zufällig auftretende, unerwünschte Signalflanken bei eigentlich konstantem Signalverlauf), oder sie können zu konkurrenten Hazards führen (z. B. zwischen zwei sich „gleichzeitig“ ändernden Rückkopplungswerten, sodass zufällige, unerwünschte Wertekombinationen auftreten). Die Schaltungen in Bild 4-3 sind frei von Hazards, wenn anstelle von T und T die Phasen ϕ1 und ϕ2 eines Zweiphasentakts benutzt werden (Bild 4-5). Bei einem solchen Takt dürfen sich die 1-Pegel der beiden Taktphasen zu keinem Zeitpunkt überlappen, auch nicht in unmittelbarer Nähe der Taktflanken. Dann ist sichergestellt, dass bei ihrer Verwendung in Synchronschaltwerken zu keinem Zeitpunkt der „Kreislauf“ der über sie rückgekoppelten Zustandsgrößen „geschlossen“ ist.
J37
J38
J Technische Informatik / Digitale Systeme
Bild 4-3 zeigt drei Schaltungsbeispiele für das D-Flipflop in Master-Slave-Technik. Master-Slave-Schaltungen für das SR-Flipflop und das JK-Flipflop entstehen durch geringfügige Änderungen der Schaltung Bild 4-3c: Das SR-Flipflop entsteht durch Weglassen des Negationsgatters am Eingang der Schaltung; das JK-Flipflop entsteht aus dem SR-Flipflop, indem seine Ausgänge über Kreuz rückgekoppelt und zusätzlich auf die Eingangs-UNDGatter geschaltet werden. Alle diese Flipflops können durch Symbole dargestellt werden, und ihr Verhalten lässt sich durch Tabellen beschreiben (Bild 4-7).
D-, SR-, JK-Flipflop.
Bild 4-4. Schaltungen und Funktion ungetakteter Speicher-
glieder. a Latch (d data, l latch); b Flipflop (s set, r reset)
Einsatz in Synchronschaltwerken. Betrachtet man 4.1.2 Flipflops, Abstraktion von Taktsignalen
Wie erläutert, wird vom Takt abstrahiert, indem er in seiner „logischen“ Erscheinungsform als Boole’sche Variable ersetzt wird durch sein „technisches“ Äquivalent in der Form hochgestellter Zeitindizes. Flipflops dienen als Bausteine beim Aufbau von Synchronschaltwerken. Signalverlauf im Bild 4-6b zeigt das Verhalten des D-Flipflops, aber in einer gegenüber Bild 4-2b von Einschwingvorgängen abstrahierten Form. Daraus lässt sich seine Funktion unmittelbar ablesen. Sie lautet in Worten: Der Wert von u wird über genau ein Taktintervall verzögert und der Ausgangsgröße w zugewiesen. Sie lautet als Gleichung (die Verwendung von „ut+1 /ut “ anstelle von „u :=“ entsprechend (4-1) weist auf die gatterexterne Signalverzögerung in Synchronschaltwerken hin; t, t + 1 zwei aufeinanderfolgende Taktzeitintervalle): (4-5) wt+1 = ut .
Bild 4-6a z. B. im Intervall t + 1, so steht am Eingang des D-Flipflops ut+1 an, und an seinem Ausgang erscheint wt+1 , d. h. wegen (4-5) ut . Da sich in Synchronschaltwerken die Ausgangssignale aller D-Flipflops (Vektor ut ) mit allen Eingangssignalen des Schaltwerks nur gleichzeitig ändern können (Vektor xt ), schreibt man die Übergangsfunktion (4-1) in der Form (4-6) ut+1 = f (ut , xt ) .
D-Flipflop als Baustein. Der
Bild 4-6. D-Flipflop. a Symbol für eine Komponente von u; b von den Taktsignalen abstrahiertes Verhalten
Die Beschreibung des Verzögerungsgliedes erfolgt also in 4.1.1 wie in 4.1.2 durch Boole’sche Gleichungen, jedoch dort mit und hier ohne T (vgl. (4-3), (4-4) gegenüber (4-5)).
Bild 4-7. Symbole und Funktion getakteter Speicherglieder.
Bild 4-5. Zweiphasentakt mit den Taktphasen ϕ1 und ϕ2
a D-Flipflop; b SR-Flipflop (S = 1 und R = 1 verboten); c JK-Flipflop (universelles Logik-/Speicherglied)
4 Schaltwerke
Bezüglich der Ausgangsfunktion lassen sich zwei Fälle unterscheiden (vgl. 2.1.1): 1. Die Ausgangssignale (Vektor yt ) hängen nur von den Zuständen ab (Moore-Automat). 2. Sie hängen auch von den Eingangssignalen ab (Mealy-Automat); in Gleichungsform: yt = g(ut ) ,
(4-7)
y = g(u , x ) . t
t
t
(4-8)
Beide Schaltwerksstrukturen lassen sich ineinander überführen. Während die Schaltwerksstruktur (4-6) allein (Flipflopausgänge gleich Schaltwerksausgänge) typisch für Register und Speicher ist (siehe 4.2), findet die Struktur (4-6), (4-7) insbesondere in Datenwerken (siehe 4.3) und die Struktur (4-6), (4-8) insbesondere in Programmwerken Anwendung (siehe 4.4). Bemerkung. Der Vorteil von Synchronschaltwerken ist, dass sämtliche „Einschwingvorgänge“ am Ausgang des Übergangsschaltnetzes f beim Schaltwerksentwurf ignoriert werden können. Deshalb werden in der industriellen Praxis komplexe digitale Systeme entweder vollständig in Synchrontechnik aufgebaut (z. B. Prozessoren, ganze Rechner), oder sie werden in Asynchrontechnik mit sog. Handshake-Signalen versehen (z. B. zur Abstimmung der einzelnen Komponenten, wie Prozessoren, Speicher, Controller, Interfaces innerhalb eines Rechners).
4.2 Registertransfer und Datenspeicherung Flipflops sind die kleinsten Einheiten zum Speichern von Information: die Speicherelemente. Sie dienen zur Speicherung einzelner Bits, z. B. des Zustands Boole’scher Variablen. Register dienen zur Speicherung von aus Bits zusammengesetzten Wörtern, z. B. der Werte Boole’scher Vektoren oder arithmetischer Größen. Speicher schließlich dienen zur Speicherung von aus solchen Wörtern aufgebauten Sätzen, z. B. zur kurz- oder längerfristigen Aufbewahrung von Daten jeglicher Art. 4.2.1 Flipflops auf der Registertransfer-Ebene
Zur Speicherung eines Bits wird bei D-Flipflops der Wert der Variablen rückgekoppelt, bei SR- oder JKFlipflops ist das nicht nötig. Außerdem muss der Wert
Bild 4-8. Speicherelement. a Schaltung mit D- bzw. SRFlipflop; b Darstellung auf der Registertransfer-Ebene. Zur Hervorhebung der Speicherelemente ist das Schaltnetz op ohne sein (halbkreisförmiges) Funktionssymbol gezeichnet
der Variablen verändert werden können, z. B. indem ihr der Wert einer anderen Variablen oder einer Funktion zugewiesen wird. Bild 4-8a zeigt entsprechende Schaltungen und Bild 4-8b das Symbol für die „Ansteuerung“ eines Flipflops als Speicherelement z (gleichzeitig der Name der Variablen des Speicherelements sowie die Bezeichnung seines Ausgangs) mit einer Variablen x und, im Vorgriff auf 4.3, einer Funktion op(z, y) über einen Multiplexer (mit den Steuergrößen a und b). Das Gleichheitszeichen in diesem wie in den folgenden Bildern weist auf die Äquivalenz der Schaltungen hin, während der gebogene Pfeil den Übergang auf eine höhere Abstraktionsebene, hier die Registertransfer-Ebene, anzeigt. In den Formeln stellt sich diese Abstraktion durch eine detailärmere, dafür aber übersichtlichere Ausdrucksweise mit den Mitteln algorithmischer Sprachen dar (Registertransfer-Sprachen, Hardware-Sprachen). Die in Bild 4-8 dargestellte Schaltung lässt sich als Gleichung mit der Boole’schen Algebra beschreiben, und zwar mit implizit dargestelltem Takt bzw. vom Takt abstrahiert (a = 1 und b = 1 verboten): zt+1 = at · xt + bt · op(zt , yt ) = at · bt · zt , z := a · x + b · op(z, y) + a¯ · b¯ · z .
(4-9) (4-10)
Die Schaltung lässt sich auch als Zuweisung in einer algorithmischen Sprache beschreiben, zuerst unüblich ausführlich und dann wie üblich abgekürzt in drei verschiedenen Formen: z := if a then x else if b then op(z, y) else z (4-11) z := if a then x else if b then op(z, y) if a then z := x else if b then z := op(z, y)
(4-12)
if a then z := x, if b then z := op(z, y)
(4-14)
(4-13)
J39
J40
J Technische Informatik / Digitale Systeme
Die letzte Form wird zur Beschreibung von Schaltungen bevorzugt. Sie gibt die in der Schaltung enthaltene Gleichzeitigkeit der Auswertung der Bedingungsgrößen durch die Verwendung des Kommas als Zeichen für (gleichberechtigte) Aufzählungen am besten wieder. In dieser Eigenschaft wird das Komma sowohl für die taktsynchron gleichzeitige Ausführung von bedingten wie von bedingungslosen Anweisungen benutzt (in der Programmierung guarded commands bzw. compount statements genannt).
und ggf. unter welchen Bedingungen sie ausgeführt werden, geht nur daraus hervor, an welchen Stellen sie im Hardware-Programm erscheinen. Operationen. Zur Kennzeichnung einzelner Re-
gisterelemente werden in spitze Klammern gesetzte Indizes verwendet; z. B. ist Z%i& das Element Nr. i des Registers Z. Die mit diesem Register Z ausführbaren Operationen lassen sich explizit beschreiben durch Z%i& := . . . oder Z := . . . (Schreiben) sowie
4.2.2 Register, Speicherzellen
Zur Speicherung eines Wortes (von Bits) wird eine Anzahl von Speicherelementen „horizontal“ aneinandergesetzt und als Einheit betrachtet. Die Speicherelemente werden parallel betrieben: bei n-maligem Aufbau einer Schaltung aus Bild 4-8 entsteht die Schaltung in Bild 4-9. Dann lautet (4-14) zuerst in einer auf Boole’sche Vektoren verallgemeinerten und dann in einer höheren Programmiersprachen angepassten Form (mit a und b als Steuergrößen, X, Y und Z als Rechengrößen und ADD z. B. als der arithmetischen Operation „Addition“):
Bild 4-10. Komplexe Register-Schaltnetz-Kombination auf
der Registertransfer-Ebene. a mit Steuersignalen; b ohne Steuersignale
(4-15) if a then z := x, if b then z := op(z, y) if a then Z := X, if b then Z := ADD(Z, Y) (4-16)
In Formeln wie Bildern wird die mit dem Übergang zur Registertransfer-Ebene verbundene Abstraktion vom Detail unterstützt, indem auf die explizite Angabe der Steuergrößen verzichtet wird und die Operationen durch ihre üblichen Operationszeichen wiedergegeben werden, z. B. ADD durch „+“. Mit Z := X, Z := Z + Y entsprechend (4-16) bzw. Bild 4-9b wird dann lediglich das Vermögen der Schaltung beschrieben, die Transport- oder die Additionsoperation auszuführen. Zu welchen Zeitpunkten
Bild 4-9. Einfache Register-Schaltnetz-Kombination auf der Registertransfer-Ebene. a mit Steuersignalen; b ohne Steuersignale
Bild 4-11. Beschaltung der Registerelements Z%i& aus Bild 4-10 mit D-Flipflop Bild 4-3b und z. B. Addierglied Bild 3-9a
4 Schaltwerke
implizit durch Verwendung von Z auf der rechten Seite solcher Anweisungen (Lesen). Allein aufgrund des Vorkommens solcher Anweisungen in ein und demselben Hardware-Programm entstehen die für die Registertransfer-Ebene typischen komplexen Zusammenschaltungen von Registern und Schaltnetzen (z. B. X := Z, Y := Z, Z := X, Z := Z + A in Bild 4-10). Bild 4-11 zeigt eine „Scheibe“ von 1 Bit der in Bild 4-10 dargestellten RegisterSchaltnetz-Kombination. Die eigentlich notwendige Rückkopplung des Flipflopinhalts auf sich selbst entfällt hier, da bei a = 0 und c = 0 sowie ϕ2 = 0 die Eingangskapazität des ersten Inverters kurzzeitig die Speicherung der Master-Information übernimmt.
Schaltungsbeispiel.
4.2.3 Schreib-/Lesespeicher
Zur Speicherung eines Satzes (von Wörtern) wird eine Anzahl von Registern/Speicherzellen „vertikal“ untereinandergesetzt und als Einheit betrachtet. Die Speicherzellen werden über Torschaltungen/Multiplexer auf Schreib-/Lesebusse geschaltet, z. B. wie in Bild 4-12a dargestellt. Von den Speicherzellen ist immer nur eine auf einmal adressierbar, wobei alle hinsichtlich ihres Zugriffs gleichberechtigt sind. Zur Unterscheidung von Speichern mit anderen Zugriffsarten werden Schreib-/Lesespeicher deshalb als Speicher mit wahlfreiem Zugriff (random access memory, RAM) bezeichnet. Operationen und Kenngrößen. Zur
Kennzeichnung einzelner Speicherzellen werden in eckige Klammern gesetzte Indizes verwendet; z. B. ist Z[i] die Speicherzelle Nr. i des Speichers Z. Die mit diesem Speicher Z ausführbaren Operationen lassen sich explizit darstellen durch Z[Adresse] := Datum (Schreiben) sowie implizit durch Verwendung von Z[Adresse] innerhalb von Anweisungen in Hardware-Programmen (Lesen). Der Inhalt einer Speicherzelle wird als Wort bezeichnet, ihre Kenn-Nummer als Adresse. Die Anzahl der Bits pro Wort heißt Wortlänge oder -breite, die der Bits pro Adresse Adresslänge oder -breite. Die Anzahl der Zellen pro Speicher heißt Kapazität; sie beträgt das 2n -fache der Anzahl n der Adressbits. Die
Zugriffszeit ist die Zeit vom Anlegen der Adresse bis zum Erscheinen des gelesenen Worts. – Mit diesen technischen Daten werden auch Festwertspeicher (ROMs) gekennzeichnet. Einsatz im Rechnerbau. RAMs dienen (1.) haupt-
sächlich zur Speicherung von ausführbereiten Daten und Programmen innerhalb von Rechenanlagen (prozessorexterne Speicher) und (2.) zur Zwischenspeicherung von Operanden und Ergebnissen innerhalb von Prozessoren (prozessorinterne Speicher). Als prozessorexterne Speicher (Hauptspeicher, Primärspeicher) haben RAMs große Kapazitäten. Ihre Speicherelemente sind nicht getaktet. Sie werden mit Signalen für die Bausteinanwahl (Select) und die Übertragungsrichtung (Read/Write) angesteuert (Symbol siehe Bild 4-12b). Eine im Baustein integrierte Steuerlogik sorgt für den ordnungsgemäßen zeitlichen Ablauf der Lese- und Schreiboperationen und schaltet die bidirektionalen Datenbustreiber durch. Aufbau und Schaltungstechnik prozessorexterner Speicher, insbesondere von Sekundärspeichern, folgen den unterschiedlichsten Prinzipien und Technologien (siehe 7.2). Als prozessorinterne Speicher (Registerspeicher, Registersätze) haben RAMs kleine Kapazitäten, sind getaktet und i. Allg. als sog. Multiport-Speicher ausgelegt (Symbole für 2- und 3-Port-Speicher siehe Bilder 4-12c und d). Sie erlauben gleichzeitiges Lesen und Schreiben über mehrere Tore. Dazu dienen mehrere unabhängige interne Multiplexer/Demultiplexer einschließlich ihrer Adressdecodierer. Aufbau und Schaltungstechnik sind an die Struktur des Prozessors angepasst. Die einzelnen Speicherelemente bestehen i. Allg. nicht aus vollständigen MasterSlave-Flipflops, sondern z. B. nur aus den Mastern, während die Slaves für alle Speicherzellen und jeden Ausgang nur einmal aufgebaut werden (entweder im Symbol mit enthalten oder als Register an anderer Stelle im Prozessor vorhanden). Bild 4-13 zeigt links einen 2-Port-Speicher der „Wortlänge“ 1 Bit mit als Schalter gezeichneten Transistoren. Die Speicherelemente einer solchen „Speicherebene“ sind eindimensional untereinander angeordnet und haben unterschiedliche Adressen. Ein Element wird durch seine Zeilen-
Schaltungsbeispiel.
J41
J42
J Technische Informatik / Digitale Systeme
Bild 4-12. Schreib-/Lesespeicher auf der Registertransfer-Ebene. a Blockbilder mit Steuersignalen; b Symbol ohne Steuersignale; c Symbol eines 2-Port-Speichers mit 2 Schreib-/Lesebussen; d Symbol eines 3-Port-Speichers mit 1 Schreibbus und 2 Lesebussen
adresse und Angabe der Richtung angewählt und mit der Leitung Bus1 oder Bus2 verbunden. Zur Erzielung einer Wortlänge von mehr als einem Bit werden mehrere solcher Speicherebenen nebeneinander aufgebaut und mit denselben Adressleitungen angesteuert. 4.2.4 Speicher mit speziellem Zugriff
Zwei wichtige Speicher dieser Art sind LIFOSpeicher (kurz LIFOs) und FIFO-Speicher (kurz FIFOs). Mit LIFO (last in first out) bezeichnet man einen Zugriffsalgorithmus, bei dem das jeweils als letztes in den Speicher eingegebene Wort am Speicherausgang als erstes wieder verfügbar ist. Man kann sich einen solchen Speicher als Stapel (stack) vorstellen, ähnlich einem Tellerstapel, oder als Keller (cellar), der oben (entspricht dem Speichereingang) gefüllt und auch oben (entspricht dem Speicherausgang) geleert wird. Mit Speichern dieser Zugriffsart ist es möglich, Information, die wegen wichtigerer Aufgaben zunächst nicht weiterverarbeitet werden soll, in einer Reihenfolge aufzubewahren, die bei der Rückkehr umgekehrt durchlaufen wird. Mit FIFO (first in first out) bezeichnet man einen Zugriffsalgorithmus, bei dem das jeweils als erstes in den Speicher eingegebene Wort am Speicherausgang auch als erstes wieder verfügbar ist. Man kann sich einen solchen Speicher als Schlange (queue) vorstel-
len, ähnlich einer Menschenschlange, oder als Röhre (pipe), die hinten (entspricht dem Speichereingang) gefüllt und vorn (entspricht dem Speicherausgang) geleert wird. Mit Speichern dieser Zugriffsart ist es möglich, Information, die pulsierend ankommt, zum Durchsatzausgleich in derselben Reihenfolge zu puffern, in der sie später weiterverarbeitet werden soll.
4.3 Schaltwerke zur Datenverarbeitung Wenn Schaltnetze zur Datenverarbeitung und zum Datentransport (3.3), z. B. zur Durchführung arithmetischer Operationen, mit Registern rückgekoppelt zusammengeschaltet werden, entstehen mannigfache Schaltwerke zur Datenverarbeitung (Datenwerke). Die Schaltnetze enthalten die Verarbeitungsfunktionen, und die Register speichern die momentanen Werte der Operanden (den Datenzustand). 4.3.1 Zähler
Zähler sind elementare Datenwerke, deren Registerelemente untereinander durch „Zähllogik“ verknüpft sind. Im Register steht ein variabler Operand (die zu verändernde Zahl), zu/von dem durch das Schaltnetz ein konstanter Operand (die Zähleinheit) addiert/substrahiert wird. – Bild 4-14 zeigt eine Schaltung für den einfachsten Fall eines Vorwärtszählers für Dualzahlen (Symbol dieses Zählers siehe Bild 4-15a).
4 Schaltwerke
Bild 4-13. Zusammenschaltung eines 2-PortSpeichers mit einer ALU über 2 bidirektionale Busse für eine 1-Bit-Scheibe gemäß Bild 4-19b (die Punkte hinter den ϕ1 und ϕ2 bedeuten UND-Verknüpfungen mit Steuersignalen; zur Schaltung des ALU-Gliedes siehe z. B. Bild 3-9). Ein Speicher- und ein ALU-Latch zusammengenommen gleichen in ihrer Wirkung einem Master-Slave-Flipflop. Mit ϕ1 wird die am ALU-Ausgang anstehende und auf einen der Busse durchgeschaltete Information in ein Speicher-Latch (Master) übernommen; und mit ϕ2 wird der Inhalt eines dieser Latches über einen der Busse in ein Register-Latch (Slave) übertragen und erscheint damit am ALUEingang (in MOS-Technik wegen des Voraufladens von Bus und ALU etwas komplizierter in 4 Taktphasen [2])
Bild 4-14. Schaltung des Zählers Bild 4-15a (Steuergröße
zhl = 1: Zählen; zhl = 0: nicht Zählen, d. h. Speichern)
A := A − 1). Zähler – wie überhaupt alle Schaltwerke – werden beim Einschalten in einen bestimmten Zustand versetzt. Dies erfolgt durch asynchron wirkende Set-/Reset-Signale, die wie Stromversorgung und Takt zu den „technischen“ Signalen zählen und deren Leitungen in logischen Blockbildern nicht gezeichnet werden. Auch während des Betriebs kann ein Zähler auf bestimmte Werte gestellt werden (A := X). Wird der Zählmodus nicht geändert, so kehrt der Zähler nach n Schritten wieder in seinen Ausgangszustand zurück; er arbeitet modulo n. Auf der Registertransfer-Ebene wird die in Bild 4-15 dargestellte Symbolik benutzt, wobei von den Steuersignalen abstrahiert wird. 4.3.2 Shiftregister
Bild 4-15. Zähler
auf der Registertransfer-Ebene. a Vorwärtszähler; b Rückwartszähler mit Stelleingang; c Vor-/Rückwärtszähler mit Stelleingang
Operationen. Beim Vorwärtszählen wird die Zähl-
einheit Inkrement und beim Rückwärtszählen Dekrement genannt; Vorwärtszählen und Rückwärtszählen können in einem Zähler vereinigt sein (A := A + 1,
Shiftregister, auch als Schieberegister bezeichnet, sind elementare Datenwerke, deren Registerelemente untereinander durch „Shiftlogik“ verbunden sind. Der im Register stehende Bitvektor kann durch das Schaltnetz um eine Position nach links oder nach rechts geschoben werden. – Bild 4-16 zeigt eine Schaltung für den einfachsten Fall eines Linksshiftregisters (Symbol dieses Shiftregisters siehe Bild 4-17a).
J43
J44
J Technische Informatik / Digitale Systeme
Bild 4-16. Schaltung des Shiftregisters Bild 4-17a (Steu-
ergröße sh f = 1: Shiften; sh f = 0: nicht Shiften, d. h. Speichern)
Mehrere Shiftregister können untereinander über Serienein- und -ausgänge verbunden werden. Besitzen sie darüber hinaus auch Parallelein- und -ausgänge, so kann parallel in seriell dargestellte Information umgeformt werden und umgekehrt. Auf der Registertransfer-Ebene wird die in Bild 4-17 dargestellte Symbolik benutzt, wobei von den Steuersignalen abstrahiert wird. 4.3.3 Logik-/Arithmetikwerke
Bild 4-17. Shiftregister auf der Registertransfer-Ebene. a Linksshiftregister; b Rechtsshiftregister mit Paralleleingang; c Links-/Rechtsshiftregister mit Paralleleingang
Operationen. Beim arithmetischen Linksshift um
eine Stelle wird in die Registerstelle rechts außen eine Null nachgezogen; dies entspricht der Multiplikation mit 2 bei „Abschneiden“ des Überlaufs, wenn die im Register stehende 0/1-Kombination als Dualzahl in 2-Komplement-Darstellung aufgefasst wird (A := A · 2). Beim arithmetischen Rechtsshift behält die Registerstelle links außen ihren Wert bei; dies entspricht der Division durch 2 mit „Abschneiden“ des Rests (A := A/2). Beim Rundshift sind die beiden äußeren Registerstellen gekoppelt, sodass beim Linksrundshift um eine Stelle in die Registerstelle rechts außen der Inhalt der Registerstelle links außen und beim Rechtsrundshift in die Registerstelle links außen der Inhalt der Registerstelle rechts außen hineingeschoben wird (A := linksrund A bzw. A := rechtsrund A). Werden Rundshiftregister der Länge n Bit mit nur einer 1 initialisiert, so können sie zum Zählen modulo n benutzt werden (Ringzähler). Auch andere als die beschriebenen Möglichkeiten können für die Ansteuerung der äußersten rechten oder linken Stelle vorgesehen werden; so kann z. B. die Rückführung beim Rundshift negiert erfolgen, dann entsteht ein Zähler modulo 2n (Möbiusringzähler, auch Johnsonzähler genannt).
Logik-/Arithmetikwerke sind elementare bis komplexe Datenwerke, deren Register-/Speicherelemente über eine arithmetisch-logische Einheit (ALU) verbunden sind. Zu einer im Register stehenden Zahl können mit der ALU z. B. laufend weitere Zahlen addiert werden; man sagt, die Zahlen werden akkumuliert. – Bild 4-18 zeigt eine Schaltung für den einfachen Fall einer Kette aus Volladdierern (VA) als „ALU“ (Symbol dieses Akkumulators siehe Bild 4-19a). Operationen. Bei den arithmetischen Operationen
wird die im Register stehende 0/1-Kombination als Dualzahl interpretiert und je nach Operation allein oder mit einer weiteren Dualzahl „verknüpft“. An Operationen sind i. Allg. vorgesehen: Inkrementierung (A := A + 1), Dekrementierung (A := A − 1), Komplementbildung (A := −A), Linksshift (A := A · 2), Rechtsshift (A := A/2), Addition (A := A + X), Subtraktion (A := A − X). Dabei wird das Zwischenergebnis Y der jeweiligen Operation getestet: i. Allg. auf „zero“ (z = (Y = 0)), auf
Bild 4-18. Schaltung des Akkumulators Bild 4-19a (Steu-
ergröße add = 1: Addieren; add = 0: nicht Addieren, d. h. Speichern)
4 Schaltwerke
4.4.1 PLA- und ROM-Steuerwerke
Bild 4-19. Logik-/Arithmetikwerke auf der Registertrans-
fer-Ebene. a Addierwerk, Akkumulator; b Rechenwerk, oft auch als Integer-Unit bezeichnet
„negative“ (n = %Y − 1&), auf „carry“ (c Übertrag), auf „overflow“ (v Überschreitung des Zahlenbereichs bei 2-Komplement-Zahlen). Bei den Boole’schen Operationen wird die im Register stehende 0/1-Kombination als Bitvektor aufgefasst. In der ALU sind entweder alle Operationen, die mit zwei Boole’schen Variablen möglich sind, oder eine bestimmte Auswahl aus diesen vorgesehen: Löschen (A := 0), Negation (A := NOT A), Transport (A := X), Konjunktion (A := A AND X), Disjunktion (A := A OR X), Antivalenz (A := A XOR X). Auf der Registertransfer-Ebene wird die in Bild 4-19 dargestellte Symbolik benutzt.
4.4 Schaltwerke zur Programmsteuerung und zur programmgesteuerten Datenverarbeitung Wenn Schaltnetze zur Datencodierung/-decodierung und -speicherung (3.4), z. B. zur Speicherung feststehender Steuerfunktionen, mit Registern rückgekoppelt zusammengeschaltet werden, entstehen Schaltwerke zur Programmsteuerung (Programmwerke). Die Schaltnetze enthalten die Steuerprogramme, und die Register speichern deren momentanen Ausführungsstand (Programmzustand). Sie reichen von elementaren, nur mit 0/1-Mustern programmierbaren bis zu komplexen, mit einem umfangreichen Befehlsvorrat programmierbaren Werken. Zusammengeschaltet mit den in 4.3 behandelten Datenwerken entstehen Werke zur programmgesteuerten Datenverarbeitung (siehe Bild 4-1).
PLA-Steuerwerke sind elementare Programmwerke, bei denen der Programmspeicher auf der Basis von Logikfeldern (vgl. 3.4.3) ausgeführt und über ein Register rückgekoppelt ist (Bild 4-20a). Typisch ist das gleichzeitig mögliche (parallele) Abfragen der Eingangssignale, sodass Mehrfachverzweigungen unmittelbar programmierbar sind. Technisch gesehen eignen sich PLA-Steuerwerke dann als Programmwerke, wenn die Anzahl der Ein-/Ausgänge und die Kapazität des PLA beim Entwurf frei wählbar sind, wie z. B. innerhalb eines hochintegrierten digitalen Systems, etwa eines Mikroprozessors. Bei der Programmierung des Steuerspeichers geht man unmittelbar von einer die Gleichzeitigkeit von Abfragen und Anweisungen betonenden Darstellung des Steuerungsalgorithmus aus, z. B. einem Zustandsgraphen (Bild 4-21a als Beispiel). Anstelle der „regular logic“ des PLA können auch andere Schaltnetzformen zur Verwirklichung der Steuertabelle verwendet werden, z. B. „random logic“ in der Form von Gatternetzen. Dann ist das Programm in der Schaltnetzstruktur versteckt, und man spricht von fest verdrahteten Programmen bzw. Steuerwerken. ROM-Steuerwerke sind komplexe Programmwerke, bei denen der Programmspeicher auf der Basis von Festwertspeichern (siehe 3.4.2) ausgebildet ist und vielfach mit einem Zähler (sequencer) adressiert wird (Bild 4-20b). Typisch ist die nur nacheinander mögliche (serielle) Auswertung der Eingangssignale, sodass nur Einfachverzweigungen unmittelbar programmierbar sind. ROM-Steuerwerke werden vorteilhaft dann als Programmwerke eingesetzt, wenn die Modifizierbarkeit der Steuerprogramme im Vordergrund steht, z. B. um Fehler im Programm korrigieren oder es an geänderte Anforderungen anpassen zu können. Die Programmierung des Steuerspeichers erfolgt in ähnlicher Weise wie bei einem Digitalrechner, d. h., man geht von einer die zeitliche Abfolge von Abfragen und Anweisungen betonenden Darstellung des Steuerungsalgorithmus aus, z. B. einem Flussdiagramm (Bild 4-22a als Beispiel). Anstelle von ROMs können auch andere Speicher für die Steuertabelle eingesetzt werden, z. B. RAMs. Dann lassen sich Programme während des Betriebs
J45
J46
J Technische Informatik / Digitale Systeme
Bild 4-20. Programmwerke. a PLA-Steuerwerk; b ROM-
Steuerwerk (1 Operationen, 2 Code und 3 Adresse für Programmverzweigungen; MXC Multiplexer Control, steuert die Datenwege im Steuerwerk)
nachladen oder auswechseln, und man spricht von dynamisch programmierbaren Steuerwerken. 4.4.2 Beispiele für programmgesteuerte Datenverarbeitungswerke (Prozessoren)
Die Bilder 4-21 und 4-22 zeigen zwei Zusammenschaltungen von Programm- und Datenwerken (vgl. Bild 4-1) als speziell auf die Aufgabenstellung zugeschnittener (konstruierter) Prozessor bzw. als universell für verschiedene Aufgaben verwendbarer (programmierter) Prozessor.
Bild 4-22. Carry-save-Addition von zwei Dualzahlen.
a Flussdiagramm, b Blockbild, Codes: ld – load, no – no operation, xr – exclusive or, an – and, sh – shift, bn – branch never, ba – branch always, bx – branch if external, bz – branch if zero, Initialisierung von I mit „no – – ba 0“. Zur Optimierung und zu weiteren Varianten siehe [1]
Es handelt sich dabei um „Maschinen“ für die Berechnung der Summe von in zwei Registern A und C gespeicherten Dualzahlen nach einem Algorithmus, der von Burks, Goldstine und von Neumann für die Addition in ihrem Universalrechner der ersten Generation vorgesehen war und der in verallgemeinerter Form heute bei der Verwirklichung von Multiplikationsalgorithmen angewendet wird, siehe z. B. [1]. Dieser – weil die Überträge in allen Stellen gleichzeitig gebildet und für den jeweils nächsten Schritt gerettet werden – Carry-save-Addition genannte Algorithmus tritt hier in zwei charakteristischen Darstellungen auf. Horizontale Darstellung. In Bild 4-21a ist der Al-
Bild 4-21. Carry-save-Addition von zwei Dualzahlen. a Zu-
standsgraph, b Blockbild auf der Registertransfer-Ebene. Initialisierung von I mit [00 000]. Zur Optimierung siehe [1]
gorithmus als „horizontales Programm“ in der Form eines Zustandsgraphen wiedergegeben. Das Attribut „horizontal“ soll darauf hinweisen, dass – wenn immer möglich – die Operationen „nebeneinander“, d. h. parallel, ausgeführt werden. Zum Beispiel wird im Zustand 1 (siehe Graph) der Operand C auf Null abgefragt, und bei C = 0 werden gleichzeitig die beiden
4 Schaltwerke
Operationen A := A XOR C (XOR für alle Stellen) und C := C AND A (AND für alle Stellen) ausgeführt und nach Zustand 2 verzweigt. Im Programmwerk in Bild 4-21b findet sich dieser Programmausschnitt in der 3. Zeile des PLA in binär codierter Form wieder. Wenn dieser „Befehl“ im Register I (instruction register) steht, so wird damit der Zustand [10] = 2 als Folgezustand festgelegt und gleichzeitig mit [101] im Datenwerk die parallele Ausführung der beiden oben genannten Operationen veranlasst. Die Bedingung C = 0 wird im Datenwerk in jedem Schritt ermittelt und steht so dem Programmwerk dauernd zur Auswertung zur Verfügung. Die Bedingung Addieren hingegen kommt von „außen“, sie kann man sich vorstellen als von der Add-Taste eines Taschenrechners abgeleitet oder dem Add-Befehl eines Universalrechners decodiert (dann heißt das Addiere-Programm Mikroprogramm). Schaltungsdetails folgen den früher behandelten Prinzipien (siehe z. B. Bild 3-16 oder Bild 2-2f für das PLA-Steuerwerk).
Hardware-/Software-Programme. Sowohl das ho-
rizontale als auch das vertikale Programm in den Bildern enthalten einen operativen Anteil, die Datenanweisungen, und einen steuernden Anteil, die Programmverzweigungen, die in den Programmen nicht modular getrennt in Erscheinung treten, sondern ineinander verwoben sind. Mit der Abstraktion von diesen beiden Teilwerken eines programmgesteuerten Datenverarbeitungswerkes wird die Registertransfer-Ebene verlassen und die Ebene der Beschreibungsformen algorithmischer Programmiersprachen erreicht. Die Art der Realisierung des Algorithmus, ob als Schaltung (Hardware) oder als Programm (Software) tritt in den Hintergrund. Hardware- und Software-Beschreibung des Algorithmus unterscheiden sich nur durch mehr oder weniger Parallelität, z. B. in (1) und (2) durch die unterschiedliche Verwendung von Kommas und Semikolons.
Vertikale Darstellung. In Bild 4-22a ist der Algo-
rithmus als „vertikales Programm“ in der Form eines Flussdiagramms dargestellt. Das Attribut „vertikal“ soll darauf hinweisen, dass die Operationen – so gut wie immer – nacheinander, d. h. seriell, ausgeführt werden. Zum Beispiel wird in Schritt 2 (siehe Diagramm) der Operand C auf Null abgefragt, und bei C 0 wird Schritt 3 ausgeführt. Dort und in den Schritten 4 und 5 werden nacheinander die drei Operationen X := A, A := A XOR C und C := C AND X ausgeführt. Im Programmwerk in Bild 4-22b findet man diesen Programmausschnitt unter den Adressen 1 bis 4 des ROM wieder. Wenn z. B. der Befehl Nr. 1 in I steht, so wird mit „no“ im Datenwerk keine Operation veranlasst, mit „bz 0“ wird jedoch das Z-Bit abgefragt (zuvor mit „1d C C“ oder „sh C“ beeinflusst). Bei Z = 0 wird bei Adresse 2 fortgefahren, und die drei oben genannten Operationen werden seriell ausgeführt. Auch hier wird die Abfrage auf 0 im Datenwerk dauernd ermittelt; die Bedingung Addieren kommt wieder von „außen“. Wegen seines Befehlsformates, bei dem jeder Befehl neben der logischen Operation eine bedingte Sprungoperation enthält, ist ein solcher Prozessor gewissermaßen die Minimalform eines Superskalarprozessors.
Auf die in den Beispielen beschriebene Weise kann man für technisch-mathematische Probleme spezielle Rechner konstruieren oder diese auf universellen Rechnern programmieren. „Eingekapselt“ unterscheiden sie sich nur durch ihre Geschwindigkeit bei der Bearbeitung des Problems. Komplexere als in diesem Beispiel behandelte Probleme enthalten anstelle solcher elementarer (logischer) komplexere (arithmetische) Operationen, sodass ihre Beschreibungen mehr den üblichen Rechenprogrammen technisch-wissenschaftlicher Anwendungen ähneln. Die Konstruktion solcher Spezialrechner erfolgt heute von ihrer algorithmischen Beschreibung ausgehend, z. B. in VHDL [3], einer HardwareBeschreibungssprache, in Zukunft evtl. über sog. Silicon-Compiler, ähnlich wie heute ihre Program-
J47
J48
J Technische Informatik / Digitale Systeme
mierung auf einem Universalrechner z. B. von einem C/C++-Programm ausgehend über einen C/C++-Compiler läuft. Praktisch relevante Aufgabenstellungen, wie z. B. der Bau eines Spezialrechners für die Schnelle FourierTransformation oder der Bau eines Universalrechners zur Programmierung aller möglichen Anwendungsfälle, unterscheiden sich von diesem Beispiel hauptsächlich durch eine drastische Steigerung der Komplexität.
5 Prozessorstrukturen Während Kapitel 4 Spezialprozessoren behandelt, also Prozessoren, die aus Anwendersicht nicht programmierbar sind, sondern nur auf ihren Bestimmungszweck hin aufgebaut sind, behandelt Kapitel 5 Universalprozessoren, also Prozessoren, die voll programmierbar und somit keinen Einschränkungen hinsichtlich ihrer Bestimmung unterworfen sind. – Die Formulierung „aus Anwendersicht“ ist interpretierbar. Es kann sich um irgendeine Anwendung handeln: die Simulation einer „Welt“, die programmiert werden soll. Es kann sich auch um eine besondere Anwendung handeln: die Simulation eines „Prozessors“ oder eines „Rechners“, die programmiert werden soll. Dann handelt es sich um Prozessor- bzw. Rechnerbau.
5.1 Überblick Dieser erste Abschnitt vermittelt eine grundlegende und übergreifende Sicht des Universalprozessorbaus; für den nicht an grundsätzlichen Fragestellungen Interessierten ist er entbehrlich. Ausgehend von den beiden CSA-Spezialprozessoren Bilder 4-21b und 4-22b gelangt man auf zwei ganz unterschiedlichen Wegen zu Universalprozessoren, wobei die entstehenden Architekturformen zwar im Prinzip den CSA-Prozessoren folgen, aber von einer drastischen Komplexitätssteigerung begleitet sind: Weg 1. Zusätzlich zum Addiere-Programm („oben“ in den Bildern) wird eine Reihe weiterer operativer Programme eingebracht, die zusammengenommen den Befehlssatz (instruction set) des auf diese Weise entstehenden Rechners bilden.
Weiterhin wird ein übergeordnetes Simulationsprogramm eingebracht, das die Befehle eines Anwenderprogramms samt der durch sie zu verarbeitenden Daten aus einem zusätzlichen, i. Allg. prozessorexternen Speicher holt und den Aufruf der diesen Befehlen zugeordneten operativen Programme organisiert. Das so entstehende Gesamtprogramm wird Mikroprogramm genannt, wobei dieser Begriff gleichfalls auch für ein einzelnes operatives Programm benutzt wird. Die Entwicklung des Mikroprogramms ist Aufgabe des Hardware-Ingenieurs. Ein mit den Befehlen des Befehlssatzes geschriebenes Programm wird Maschinenprogramm genannt. Mit diesem Ansatz entstehen universell programmierbare Rechner: durch Verallgemeinerung von Bild 4-21b die klassische Akkumulator-Rechnerarchitektur, traditionell als v.-Neumann-Rechner bezeichnet, durch Verallgemeinerung von Bild 4-22b die klassische Register-Rechnerarchitektur, seit dem Aufkommen der RISCs als CISC bezeichnet (complex instruction set computer). Die angesprochene Komplexitätssteigerung betrifft oben in den beiden Bildern das Interpretationsprogramm des Rechners, das Mikroprogramm: beim v.-Neumann-Rechner unveränderlich gespeichert im PLA (horizontal mikroprogrammiert, d. h. Mikrooperationen mehr neben- als untereinander), beim CISC veränderbar gespeichert im ROM (vertikal mikroprogrammiert, d. h. Mikrooperationen mehr unter- als nebeneinander), unten in den Bildern das Maschinenprogramm und seine Daten in Kopie als extrem kleiner Ausschnitt: beim v.-Neumann-Rechner in den Registern, beim CISC im Registerblock. Die Originale von Maschinenprogramm und Daten befinden sich im zusätzlichen Speicher. Bild 5-1 illustriert die Zusammenhänge. Obwohl verallgemeinert zu Universalprozessoren, interpretiert die geschilderte Sicht der Dinge die entstehenden Prozessoren im Grunde doch als Spezialprozessoren, nämlich Instruktionsinterpretationsprozessoren. Sie werden für einen bestimmten Zweck, nämlich zur Interpretation (allgemeiner: Simulation) der Architektur des zu „bauenden“ Universalprozessors konstruiert. Davon unbenommen
5 Prozessorstrukturen
bleibt, dass wirkungsvollere Elementaroperationen vorgesehen werden und dass man durch Programmierbarkeit des jetzt Mikroprogrammspeicher oder Steuerspeicher (control store) genannten Programmspeichers das Mikroprogramm in gewissen Grenzen ändern kann – man spricht von Mikroprogrammierbarkeit – und so ohne Hardwareänderungen Prozessorvarianten herstellen kann. Weg 2. Anstelle des Addiere-Programms („oben“ in Bild 4-22b) wird automatisch, d. h. mittels Hardware, irgendein Anwenderprogramm geladen, und zwar ausschnittweise aus einem zusätzlichen, i. Allg. prozessorexternen Speicher in den Programmspeicher des entstehenden Rechners. Anstelle der Addiere-Daten („unten“ im Bild) wird programmiert, d. h. durch Software, ein Ausschnitt der zugehörigen Anwenderdaten geladen, und zwar aus dem zusätzlichen Speicher in den Datenspeicher des Rechners. Hier gibt es keine Programm-Interpretationshierarchie, und man spricht traditionell nicht von Mikroprogrammierung (ggf. in extenso von extrem horizontaler Mikroprogrammierung: Mikrooperationen sämtlich nebeneinander), sondern nur von Maschinenprogrammierung. Während vorher das Problem bestand, das Mikroprogramm möglichst effizient zu erstellen, ist jetzt das Problem, den Programmspeicher vorausschauend mit den als nächstes auszuführenden Maschinenprogrammteilen zu füllen. Mit diesem Ansatz entstehen ebenfalls universell programmierbare Rechner: durch Verallgemeinerung von Bild 4-22b die moderne RegisterRechnerarchitektur, gemeinhin als RISC bezeich-
Bild 5-1. Weg zum Universalprozessor: Bild 4-21 → v.-Neumann-Rechner Bild 5-4, Bild 4-22 → CISC (oh-
ne Bild)
net (reduced instruction set computer), sowie die modernen Parallel-Rechnerarchitekturen: die Superskalar-Rechner und die VLIW-Rechner (very long instruction word). Die angesprochene Komplexitätssteigerung bedingt oben im Bild irgendein Anwenderprogramm (Maschinenprogramm), gespeichert als kleiner Ausschnitt in der Form einer laufend sich ändernden Kopie im prozessorinternen Programmspeicher (Cache), unten irgendwelche Daten des Maschinenprogramms, gespeichert in Kopie als kleiner Ausschnitt im Multiport-Registerblock und darüber hinaus ggf. in einem weiteren schnellen prozessorinternen Speicher. Das Originalprogramm mit seinen Daten befindet sich im zusätzlichen Speicher. Bild 5-2 illustriert die Zusammenhänge. Diese Sicht der Dinge interpretiert die entstehenden Prozessoren nun von vornherein als Universalprozessoren, denn sie werden für keinen bestimmten Zweck konstruiert, abgesehen von wenigen speziellen Funktionseinheiten, die zusätzlich eingebaut werden. Davon unbenommen bleibt, dass wirkungsvollere Elementaroperationen vorgesehen werden, z. B. solche, die sich gut in Einzelschritte zerlegen lassen und somit mehr als einen Takt benötigen (sodass – genau genommen – doch wieder Mikroprogrammierung ins Spiel kommt). Eine weitere, ganz andere Art von Prozessor„bau“ ist die, auf einem existierenden Rechner A, dem „Wirts“rechner, einen neuen Rechner B, den „Gast“rechner, mittels eines Instruktionsinterpre-
Bild 5-2. Weg 2 zum Universalprozessor: Bild 4-22 → RISC Bild 5-7, → Superskalar-Rechner (ohne Bild), → VLIW-Rechner Bild 5-9
J49
J50
J Technische Informatik / Digitale Systeme
tationsprogramms zu programmieren. Hier gibt es zwar eine Programm-Interpretationshierarchie, man spricht aber auch hier nicht von Mikroprogrammierung (bzw. in extenso von extrem vertikaler Mikroprogrammierung: Mikrooperationen sämtlich untereinander). Dies ist reine Programmierung und somit weder dem Hardware-Design noch dem Hardware-Software-Codesign, sondern ganz dem Software-Design zuzuordnen, nämlich der allumfassenden Aufgabenstellung der Simulation. – Man könnte einen solchen Rechner der Systematik folgend als VISC bezeichnen (virtual instruction set computer). Die Funktion eines Prozessors erfolgt durch Festlegung seines Maschinenprogramms, d. h. bestimmter Abfolgen seiner Befehle. Die Programmierung stützt sich dabei natürlich auf die Maschinenbefehle des Prozessors, repräsentiert durch Befehlsformate, Befehlssatz, Adressierungsarten; siehe 5.2 – Typisch für einen v.-Neumann-Rechner ist seine Programmierbarkeit „über“ den Akkumulator mit dem einen Operanden und dem Speicher für den anderen Operanden; siehe 5.3: Akkumulator-Architektur. – Typisch für die Programmierung eines CISC ist, dass Operanden bzw. deren Adressen in die Register gebracht werden und dass mit den Operanden dort direkt oder gleich im Speicher, nun aber registerindirekt gerechnet wird (deshalb auch Speicher-/SpeicherArchitektur genannt). Auf diese Weise werden wegen der kurzen Registeradressen auch Mehradressbefehle so kurz, dass sie in ein Speicherwort passen. Das gilt erst recht für einen RISC, wo ausschließlich in den Registern gerechnet wird mit der Konsequenz, sie programmiert mit Lade/Speichere-Befehlen füllen bzw. leeren zu müssen (deshalb auch Lade-/Speichere-Architektur genannt). Kennzeichnend für diese beiden Architekturen ist also, dass die Programmierung über die Register erfolgt; siehe 5.4: Register-Architektur. – Typisch für die Programmierung eines Superskalar-Rechners ist, dass auf die hier mögliche parallele Arbeitsweise auf Befehlsebene keine Rücksicht genommen zu werden braucht, da sie im Prozessor – für den Programmierer unsichtbar – automatisiert abläuft. Die Maschinenprogrammierung eines VLIW-Rechners Zur Maschinenprogrammierung.
hingegen muss auf dessen parallele Arbeitsweise auf Befehlsebene zugeschnitten sein; hier wird die Parallelisierung zwar auch automatisiert, aber durch den Compiler bewerkstelligt. Kennzeichnend für diese beiden Architekturen ist also, dass die Programmierung mit parallel angeordneten Befehlen erfolgt; siehe 5.5: Parallel-Architektur. Weitere Rechnerarchitekturen, insbesondere mit Parallelverarbeitung auf höheren Ebenen, wie Vektorrechner, Feldrechner und Mehrprozessorsysteme, werden in 7.4 behandelt.
5.2 Maschinenbefehle Prozessoren haben viele, oft sich über mehrere Speicherwörter erstreckende und ggf. viele Takte dauernde Maschinenbefehle (complex instruction set computer, CISC) oder vergleichsweise wenige, in ein Speicherwort passende und nur wenige Takte dauernde Befehle (reduced instruction set computer, RISC), bei Skalar-Prozessoren mit nur einem Operationscode, aber mehreren, in ihrer Anzahl wechselnden Adressen und mehr oder weniger Möglichkeiten zur deren Modifikation (Adressierungsarten). 5.2.1 Befehlsformate Dreiadressbefehle. Arithmetik-/Logikbefehle enthal-
ten zwei Adressen für die beiden Operanden und eine für das Ergebnis. Beispiel: Add-Befehl mit der Wirkung S := X + Y ADD S, X, Y
(5-1)
Bedingte Sprungbefehle enthalten zwei Adressen für die beiden Vergleichsgrößen und eine für das Sprungziel. Beispiel: Branch-if-equal-Befehl mit der Wirkung if X = Y then goto L BEQ X, Y, L
(5-2)
Zweiadressbefehle. Bei Arithmetik-/Logikbefehlen
muss zur Adressierung des Ergebnisses eine der Operandenadressen mitbenutzt werden, d. h., der Inhalt der Speicherzelle für den einen Operanden wird durch das Ergebnis der Operation ersetzt. Sollen die Werte beider Operanden erhalten bleiben, so muss der Operation ein Move- oder Load-Befehl
5 Prozessorstrukturen
vorangestellt werden; dann ist (5-1) der folgenden Befehlsfolge äquivalent: d. h. S := X ; S := S + Y ;
LOAD S, X ADD S, Y
Bei bedingten Sprungbefehlen ist kein Platz für die notwendigen drei Größen, sodass Programmverzweigungen mit zwei Befehlen programmiert werden müssen: Ein Compare-Befehl enthält die Adressen der Vergleichsgrößen und speichert die Vergleichsergebnisse als Condition-Code CC = [z n c v] im Statusregister SR des Prozessors, Branch-if-. . . Befehle enthalten die Sprungadresse und werten den Condition-Code aus; somit ist (5-2) der folgenden Befehlsfolge äquivalent: CMP X, Y BEQ L
d. h.
z := Y − X = 0 ; if z then goto L ;
weshalb entsprechende Rechner auch als Kelleroder Stack-Architekturen bezeichnet werden. Bei der Durchführung einer Operation wird der oberste Stack-Eintrag (top of stack, TOS) ersetzt durch die Verknüpfung des zweitobersten (TOS−1 ) mit dem obersten Stack-Eintrag (TOS). Die Reihenfolge der Befehle muss dieser Verarbeitungsweise angepasst werden. Sie entspricht der sog. Postfixnotation, auch umgekehrte polnische Notation genannt, wie sie bei Anwendung bestimmter Übersetzungsverfahren aus der syntaktischen Analyse arithmetischer Ausdrücke entsteht. Zum Füllen und Leeren des Stack (und somit seiner obersten Stack-Zelle TOS) sind neben den Nulladressbefehlen auch Lade- und SpeichereBefehle nötig, die mit Push bzw. Pop bezeichnet werden. – Beispiel: Der arithmetische Ausdruck in y := a · b + u · (v + w) lautet in Postfixnotation (Operationszeichen nach den Operanden) vollständig geklammert bzw. in klammerfreier Form: ((a, b) ·, (u, (v, w) +)·) +
Einadressbefehle. Bei Arithmetik-/Logikbefehlen sowie beim Compare-Befehl entfällt eine der Operandenadressen, sodass seine Adresse einem ausgezeichneten Register zugeordnet werden muss, dem Akkumulator (AC). Der Akkumulator hat seinen Namen von der Möglichkeit fortwährenden Aufaddierens (Sammelns, Akkumulierens) von Zahlen. Die „Adresse“ dieses Registers ist implizit im Operationscode enthalten. Mit Load- und Store-Befehlen wird der Akkumulator geladen bzw. sein Inhalt gespeichert; somit sind (5-1) und (5-2) den folgenden Befehlsfolgen äquivalent:
LDA X ADD Y STA S
d. h.
LDA X CMP Y BEQ L
d. h.
AC := X ; AC := AC + Y ; S := AC ; AC := X ; z := (AC − Y = 0) ; if z then goto L ;
Fehlt in den Befehlen die Angabe von Adressen völlig, so müssen die Operanden zur Verarbeitung immer in zwei ganz bestimmten Speicherzellen vorliegen. Das sind z. B. die „obersten“ beiden Zellen eines LIFO-Speichers (Keller, Stack),
Nulladressbefehle.
ab · uvw+ ·+ Die Reihenfolge der Befehle einer Stack-Architektur folgt dieser Notation (für das Beispiel siehe Tabelle 5-1): 5.2.2 Befehlssatz
Der Vorrat an Maschinenbefehlen, der Befehlssatz, variiert von Rechner zu Rechner stark. Allen gemeinsam ist ein Repertoire grundlegender Befehle, ohne Tabelle 5-1. Programm mit Stackbelegung bei einem Nulladressrechner
Programm PUSH A
TOS A
TOS−1
PUSH B
B
A
MUL
A·B
PUSH U
U
A·B
PUSH V
V
U
A·B
PUSH W
W
V
U
ADD
V +W
U
A·B
MUL
U · (V + W)
A·B
ADD
A·B+U ·(V +W)
POP Y
TOS−2
TOS−3
A·B
J51
J52
J Technische Informatik / Digitale Systeme
die selbst kleine Aufgaben nur sehr umständlich und ineffizient zu programmieren wären (obwohl im Prinzip eine Handvoll elementarer Befehle genügt, jede Aufgabe zu programmieren). Das im Folgenden skizzierte Grundrepertoire enthält eine Auswahl typischer Maschinenbefehle, wobei die Adressen X, Y, Z in den Befehlen Datenspeicher- oder Registeradressen sein können. Bei L handelt es sich um eine Programmspeicheradresse (Label). Genaueres zu den durch ihre Wirkung definierten Datentypen siehe 6.3. Arithmetik-/Logikbefehle. Zu
den Arithmetikbefehlen zählen alle Befehle, die ihre Operanden als Dualzahlen interpretieren (vorzeichenlos, unsigned; vorzeichenbehaftet, signed, integer): Clear
CLR X
X := 0
Increment
INC X
X := X + 1
Decrement DEC X
X := X − 1
Negate
NEG X
X := −X
Shift Left
ASL X,k
X := X · 2k X := X/2k ohne Rest
Shift Right ASR X,k Add
ADD Z,X,Y Z := X + Y
Subtract
SUB Z,X,Y Z := X − Y
Multiply
MUL Z,X,Y (Z, Z + 1) := X · Y
Divide
DIV Z,X,Y Z := (X, X + 1)/Y, X + 1 := Rest
Zu den Logikbefehlen zählen alle Befehle, die ihre Operanden als Bitvektoren interpretieren: Not
NOT
X
X := not X
And
AND
Z,X,Y Z := X and Y
Or
OR
Z,X,Y Z := X or Y
Exclusive Or
XOR
Z,X,Y Z := X xor Y
Neben den Arithmetik- und den Logikbefehlen gibt es Befehle, die keiner dieser beiden Gruppen eindeutig zugeordnet werden können: Move
MOV
Z,X
Z := X
Rotate Left
RSL
X,k
X := rotate left k bits
Rotate Right
RSR
X,k
X := rotate right k bits
Sprungbefehle. Dazu zählen alle Befehle, die
den Programmzähler beeinflussen und damit Programmverzweigungen hervorrufen können. Jumpoder Unconditional-Branch-Befehle entsprechen den Gotos höherer Programmiersprachen: Branch Always BRA
goto L
L
Conditional-Branch-Befehle werten die Bedingungsbits des Statusregisters aus, die i. Allg. durch den unmittelbar davor stehenden Befehl beeinflusst werden. Das sind in der Regel ein Compare-Befehl oder – als Nebeneffekt wirkend – auch viele der anderen Befehle, insbesondere Arithmetikbefehle. Steht genügend Platz im Befehlswort zur Verfügung, sodass drei Adressen untergebracht werden können, entfällt diese Zweischrittigkeit (und somit der Compare-Befehl). – Im Folgenden steht cc für einen Bedingungscode, der die auszuwertende Relation :: bestimmt, konkret EQ für =, NE für , LO für , GS für ≥: Compare Branch if cc
CMP Bcc
X,Y L
if X::Y then goto L
Weiterhin gibt es Sprungbefehle, die vor der Ausführung des Sprungs den Programmzähler retten, sodass später an diese Stelle im Programm zurückgesprungen werden kann. Diese Befehle sind paarweise definiert und dienen zum Anschluss von Unterprogrammen (Subroutinen), d. h. zum Hinsprung ins Unterprogramm und zum Rücksprung ins Hauptprogramm (siehe 6.4.4): Jump to Subroutine Return from Subroutine
JSR SUB RTS
call SUB return
Dazu zählen Befehle, die auf den Betrieb des Rechners wirken, wie Statusregister-Befehle, Trap- und Interrupt-Befehle (siehe 8.2), auch die Befehle
Systembefehle.
No Operation
NOP
Halt
HLT
5.2.3 Adressierungsarten
Um effizient programmieren zu können, insbesondere immer wiederkehrende Befehlsfolgen in der Form sog. Schleifen, bedient man sich verschiedener Möglichkeiten, die Adressen in den Befehlen zu modifizieren. Die elementarsten Adressierungsarten sind
5 Prozessorstrukturen
Bild 5-3. Veranschauli-
chung der Wirkung der Adressierungsarten am Beispiel des LDA-Befehls: a immediat, b direkt, c indirekt, d indiziert
Bild 5-4. Einadressrechner mit Beispielprogramm Z := X + Y im Speicher. Die Register IR, Operand, Zähler sowie μIR sind nur vom Mikroprogramm, nicht vom Maschinenprogramm beeinflussbar
J53
J54
J Technische Informatik / Digitale Systeme
neben der direkten oder absoluten Adressierung die folgenden Adressmodifizierungen: (1.) Anstelle der Adresse des Operanden im Befehl wird der Operand selbst als Konstante angegeben, um ihn direkt zu verarbeiten (immediat). (2.) Anstelle der Adresse des Operanden wird die Adresse der Adresse des Operanden angegeben, um mit verschiedenen, erst später bekannten Parametern zu arbeiten (indirekt). (3.) Die Adresse des Operanden wird hochgezählt, um die Größen eines Feldes, d. h. die mit einem Index ansprechbaren Elemente des Feldes, nacheinander erreichen zu können (indiziert). – Weitere Adressierungsarten siehe 6.4.4 und 8.3.3; eine systematische Darstellung gibt [1]. Bild 5-3 zeigt die Wirkung der immediaten, der indirekten und der indizierten Adressierung. Zum Vergleich ist die „direkte“ Adressierung mit einbezogen, also der ohne weitere Kennzeichnung benutzte Normalfall der Adressierung. Immediate Adressierung. Im Befehl zeigt ein Bit
an, ob die Adresse des Operanden oder der Operand selbst gemeint ist; zur symbolischen Kennzeichnung der immediaten Adressierung, des Direktoperanden, wird gewöhnlich das Zeichen # benutzt, siehe Bild 5-3a: nach Ausführung des LDA-Befehls steht die Zahl n im AC. Im Befehl zeigt ein Bit an, ob die Adresse des Operanden oder die Adresse einer Adresse des Operanden gemeint ist; zur symbolischen Kennzeichnung eines indirekt angesprochenen Operanden wird gewöhnlich das Zeichen @ benutzt, siehe Bild 5-3c: nach Ausführung des LDA-Befehls steht die Zahl n im AC; man sieht im Bild gut den zweiten Speicherzugriff, die dabei entstehende, wirksam werdende Adresse heißt effektive Adresse. Bei registerindirekter Adressierung – die Adresse des Operanden steht im Register – wird statt @ das Register in Klammern gesetzt. Indirekte Adressierung.
Indizierte Adressierung. Im Befehl gibt bei einem
einzigen Indexregister das Indexbit, bei mehreren die Registernummer an, ob ein bzw. welcher Index zur Adresse hinzuaddiert wird; zur symbolischen Kennzeichnung eines indiziert angesprochenen Operanden gibt man das in [ ] eingeschlossene Indexregister an,
z. B. [I] für das Indexregister IX, siehe Bild 5-3d: nach Ausführung des LDA-Befehls steht die Zahl n im AC; man sieht im Bild die Addition vor dem Zugriff auf den Operanden, die dabei entstehende, wirksam werdende Adresse ist die effektive Adresse.
5.3 Akkumulator-Architektur Die klassische Akkumulator-Rechnerarchitektur führt auf den Einadressrechner, in Bild 5-4 exemplarisch dargestellt: „oben“ das PLA mit dem Mikroprogramm und das μIR (Mikroinstruktionsregister), „unten“ das Register IR (Instruktionsregister) für die Aufnahme eines Befehls mit seinen Teilen Code, Mode, und Adresse, der Programmzähler PC (siehe 5.3.1), des Weiteren die Register AC (Akkumulator), MQ (Multiplikator/Quotient), IX (Index) usw. Das Programm mit seinen Daten befindet sich im Speicher P/D (Programm/Daten). – Die Struktur des Rechners ist auf seine Spezifikation und somit auf das Mikroprogramm zugeschnitten: mit speicherbezogenen Einadressbefehlen von im Prinzip hoher Komplexität. Jeder Befehl benötigt wenige bis viele Takte, und die Maschinenprogrammierung ist einfach, etwa in der Art der Programmierung eines Taschenrechners, jedoch mit Möglichkeiten zur Programmsteuerung. 5.3.1 Einadressrechner
Zur Illustration seiner Arbeitsweise zeigt Bild 5-4 rechts oben eine sehr kleine Programmieraufgabe: Zwei im Speicher befindliche Zahlen mit den Variablennamen bzw. den symbolischen Adressen X und Y sind zu addieren und das Ergebnis an eine dritte Größe mit der symbolischen Adresse Z zuzuweisen (in Wirklichkeit anstatt der symbolischen Adressen drei Nummern, zwei als Quelladressen und eine als Zieladresse). Die Befehlslänge ist gleich der Wortlänge des Speichers. Das Programm benötigt 6 Speicherzugriffe (von i. Allg. je mehreren Takten). – In einer höheren Programmiersprache würde man die Aufgabe durch Z := X + Y beschreiben. Programmzähler (besser Befehlszähler, Instrukti-
onszähler). Der Programmzähler (program counter PC) hat die elementare Aufgabe, die hintereinander
5 Prozessorstrukturen
angeordneten Befehle bzw. Instruktionen eines Maschinenprogramms einzeln aus dem Speicher zu holen und in das Instruktionsregister IR des Prozessors zu bringen. Dort werden sie decodiert und ihrer speziellen Bestimmung zugeführt: Mit dem Befehls-Code wird die dem Befehl zugeordnete Stelle im Mikroprogramm angewählt, mit dem Adress-Mode wird die Adressierungsart ausgewählt und der Befehlsteil Adresse entsprechend interpretiert. Ein Einadressbefehl besteht also aus den drei Teilen Code, Mode und Adresse. Der Condition-Code CC wird mit weiteren Informationen insbesondere für die Interruptverarbeitung und Managementaufgaben des Betriebssytems, wie z. B. Supervisor-/User-Betrieb, im Statusregister gespeichert. Zusammen mit dem Programmzähler enthält es in jedem Moment die relevante Information über den Zustand des Prozessors (siehe auch 8.2).
Statusregister.
5.3.2 Beispiel für Mikroprogrammierung
Bild 5-5 zeigt einen Teil des Mikroprogamms des Einadressrechners, und zwar für die drei Befehle LDA, ADD und STA des Beispielprogramms aus Bild 5-4: das oben beschriebene Befehl-Holen (Abruf), das Adresse-Interpretieren und ggf. -Modifizieren (Modif) sowie das BefehlDecodieren/-Ausführen (Decode/Execute). Um sich die Funktionsweise eines solch elementaren Rechners in allen Einzelheiten klarzumachen, spiele man das Beispielprogramm in Bild 5-4 mithilfe des Mikroprogramms Bild 5-5 Schritt für Schritt bzw. Takt für Takt durch und simuliere auf diese Weise die Ausführung des Programms und somit die Arbeitsweise des Rechners. Dazu wähle man eine Startadresse für den ersten Befehl LDA X, schreibe sie in das PC-Kästchen und trage die Veränderungen infolge der Ausführung von := fortlaufend in die Register ein; die Ausführung von .= wirkt auf Leitungen, nicht auf Register. – Der Nutzen dieser Übung besteht darin, dass man auf diese Weise einen guten Einblick in die Funktionsweise eines Digitalrechners gewinnt. Weitergehende Ausführungen zur Mikroprogrammierung findet man insbesondere in [1].
Bild 5-5. Ausschnitt aus dem Mikroprogramm des Einadressrechners mit den Befehlen des Beispielprogramms aus Bild 5-4 (-> bedeutet goto). Alle mit , getrennten Anweisungen werden im selben Takt ausgeführt. Somit benötigt das Mikroprogramm zur Decodierung/Ausführung der Befehle LDA, ADD und STA jeweils 1 Takt (unter der hier gewählten Annahme von Speicherzugriffen zu je 1 Takt)
5.3.3 Beispiel zur Maschinenprogrammierung
Zur Programmierung des Polynoms p = a0 xn + a1 xn−1 + . . . + an−1 x + an ist die indizierte Adressierung geeignet. Damit braucht das Inkrementieren der Adresse des Koeffizientenfeldes nicht explizit programmiert zu werden. Das folgende Maschinenprogramm orientiert sich an der mathematischen Formulierung der Aufgabe in der Form des sog. Horner-Schemas, bekannt vom
J55
J56
J Technische Informatik / Digitale Systeme
Bild 5-6. Maschinenprogramm zur Polynomberechnung; die Operanden (Variablenwerte) und ihre symbolischen Adressen (Variablennamen) als Speicherabzug
numerischen Rechnen lange vor der Erfindung des Computers. p = (. . . ((a0 x + a1 )x + . . . + an−1 )x + an Das Programm in Bild 5-6 ist als Schleife organisiert, sodass es für Polynome mit wählbarem Grad n gilt. Der Grad, die Koeffizienten sowie das
Argument müssen gegeben sein und im Speicher stehen, entweder zuvor ermittelt oder eingelesen. Das Ergebnis wird im Akkumulator fortschreitend aufgebaut und ist beim Verlassen der Schleife, nach Addition des letzten Koeffizienten, dort verfügbar. – Code, Mode und Adresse in den Befehlen sind symbolisch angegeben. Ein solches symbolisches Programm wird von einem Systemprogramm des Betriebssystems, dem Assembler, übersetzt, und zwar in die binären Entsprechungen der Befehlsteile; dabei werden die Adressquerbezüge und somit die Nummern für die Adressen automatisch ermittelt (siehe 6.4). – Auch hier ist es eine hilfreiche Übung, das Programm durchzuspielen, nun aber Befehl für Befehl, wodurch man einen guten Einblick in die Maschinenprogrammierung/-ausführung gewinnt.
5.4 Register-Architektur Die moderne Register-Rechnerarchitektur führt auf den Dreiadressrechner, in Bild 5-7 exemplarisch
Bild 5-7. Dreiadressrechner mit Beispielprogramm Z := X + Y im Cache und im Speicher. Fließbandregister gestrichelt gezeichnet. Die vier Stufen: 1. Befehl lesen, d. h. PC → Programm-Cache → IR; 2. Operanden lesen, d. h. IR → Registerblock → IU-Eingänge, bzw. Sprungadresse bereitstellen, d. h. IR → PC; 3. Ergebnis ermitteln und bereitstellen, d. h. IU-Eingänge → IU → IU-Ausgang und ggf. → CC; 4. Ergebnis schreiben, d. h. IU-Ausgang → Registerblock. Im Programm sind Register, die Operanden enthalten, durch Fettdruck hervorgehoben
5 Prozessorstrukturen
dargestellt (wobei – vgl. 5.1 – gegenüber Bild 4-22b die bedingten Sprungbefehle der Maschinenprogramme im Speicher hier nicht neben, sondern unter den Arithmetik-/Logikbefehlen angeordnet sind, sodass alle Befehle streng sequentiell ausgeführt werden müssen, dafür aber letztere als Dreiadressbefehle). Zu sehen sind: „oben“ der Programm-Cache P’ für den Ausschnitt aus einem Maschinenprogramm (siehe 5.4.1), weiterhin der PC und das IR, „unten“ der 3-Port-Registerblock D’ für einen Datenausschnitt sowie die arithmetisch-logische Einheit plus Multiplizierer, zur Festkomma- oder GanzzahlEinheit zusammengefasst (Integer-Unit, IU). Das gesamte Programm mit seinen Daten befindet sich im Speicher P/D. Der Rechner weist in erster Linie Dreiadressbefehle geringer Komplexität auf (bis +, − und ·, insbesondere keine Befehle, die auf Iterationen basieren). Sie arbeiten ausschließlich mit den Registern des Registerblocks. Nur die wichtigsten Adressierungsarten sind eingebaut. Für das Register-Laden und -Speichern werden weitere Befehlsformate nötig, da Ladeund Speichere-Befehle anders aufgebaut sind als Arithmetik-/Logikbefehle und bedingte Sprungbefehle. In jedem Takt wird genau ein Befehl fertiggestellt. Lade-/Speichere-Befehle benötigen jedoch oft einen zusätzlichen Takt. Die Maschinenprogrammierung ist schwierig; sie geht in Richtung Mikroprogrammierung, entsprechend aufwändig ist der Compilerbau. 5.4.1 Dreiadressrechner (RISC)
Bild 5-7 zeigt rechts oben die sehr kleine Programmieraufgabe, zwei im Speicher befindliche Zahlen X und Y zu addieren und das Ergebnis an eine dritte Größe Z zuzuweisen. Das Programm im Cache (als Kopie) benötigt 3 (Haupt-)Speicherzugriffe (von nur wenigen Takten). Wie man am Programm in Bild 5-7 sieht, gibt es bei dieser Art Rechner zum Laden und Speichern der Register ein Problem. Da Befehlslänge und Adresslänge beide gleich der Wortlänge des Speichers sind, kann ein ld- bzw. ein st-Befehl nicht die benötigte Information aufnehmen, sodass mehrere Befehle notwendig werden. Spezielle set-Befehle laden die Speicheradresse eines Operanden in ein Register: setl lädt die entsprechende Nummer als den unteren Teil (l lower
part), setu als den oberen Teil (u upper part) in das Register ri . Erst damit sind ld und st in der Lage, einen Operanden zwischen Register und Speicher zu transportieren: ld lädt Register r j (z. B. r4 im Programm in Bild 5-7) mit dem Inhalt der Speicherzelle, dessen Adresse in ri steht (r1 im Programm), st speichert den Inhalt eines Registers ri (r6 im Programm) in eine Speicherzelle, deren Adresse in r j steht (r3 im Programm). Aus dieser Umständlichkeit in der Maschinenprogrammierung darf aber nicht geschlossen werden, ein RISC sei ineffizienter als ein CISC. Was beim RISC als Maschinenprogramm abläuft, muss ein CISC im Mikroprogramm bewerkstelligen (wobei die Taktfrequenz des CISC i. Allg. niedriger als die des RISC ist). Die Aufgabe ist aber nicht typisch für die übliche Verwendung von Rechnern dieser Art. Es werden nicht im Speicher einzelne Rechenoperationen durchgeführt; vielmehr werden zuerst die zu verarbeitenden Größen mittels set-/ld-Befehle in die Register gebracht, dort wird gerechnet, und anschließend werden die Ergebnisse mittels set-/st-Befehlen zurück in den Speicher gebracht (siehe 5.4.3). Programm-Cache (vielfach Instruction-Cache oder
Befehls-Cache). Der Programm-Cache hat die Aufgabe, aktuelle Ausschnitte des Maschinenprogramms bereitzustellen (cache: etwa Depot). Er ist als schneller, prozessorinterner Speicher mit der Wirkung eines Assoziativspeichers (content addressable memory, CAM) realisiert, der nicht nur die zur Programmausführung benötigten Befehlswörter, sondern auch deren (Haupt-)Speicheradressen enthält. Dadurch können für Befehle, die im Cache stehen, Speicherzugriffe und damit Systembusbelegungen entfallen. Befehle hingegen, die nicht im Cache stehen, werden wie üblich aus dem Speicher geholt und verarbeitet, darüber hinaus aber auch in den Cache geladen in der Annahme, dass sie in allernächster Zukunft wieder benötigt werden (Ausnutzung der Programmlokalität bei Programmschleifen). Dabei werden bei kleineren Caches diejenigen Befehle überschrieben, deren Benutzung am weitesten zurückliegt (least recently used, LRU; eine besonders anschauliche Erklärung liefert [1]). Bei größeren Caches, insbesondere bei solchen, die neben Befehlen auch Operanden
J57
J58
J Technische Informatik / Digitale Systeme
enthalten, geht man in der Aufbautechnik andere Wege (siehe 7.2.3). Allgemein lassen sich in Assoziativspeichern abgelegte Tabellen unter Vorgabe einer oder mehrer Tabellenspalten durchsuchen, und zwar in einem einzigen Schritt, wobei Tabellenzeilen durch Treffer markiert werden. Die damit verbundenen (assoziierten) Tabelleninhalte (hier die Befehle) werden anschließend ausgelesen (beim Cache im selben Schritt). – Trotz ihrer Vielseitigkeit sind Assoziativspeicher bisher im Rechnerbau nicht in größerem Umfang eingesetzt worden. 5.4.2 Beschleunigung durch Fließbandtechnik
Der in Bild 5-7 gezeigte Rechner hat die Eigenschaft, dass ein Dreiadressbefehl in genau einem Takt vollständig ausgeführt wird; man erkennt im Bild die kursiv nummerierten vier Phasen der Befehlsausführung, die räumlich/zeitlich innerhalb eines Takts durchlaufen werden: 1 → 2 Befehl lesen, 2 → 3 Operanden lesen, 3 → 4 Ergebnis ermitteln, 4 → 5 Ergebnis schreiben. Die einzelnen Phasen, nun aber mehrerer, aufeinander folgender Befehle, lassen sich auch überlappend ausführen, man sagt: in Fließbandtechnik, in Pipelining. Aber nur, wenn an den kursiv nummerierten Stellen Register eingebaut werden (bis auf 5). Im Fließbandbetrieb werden „oben“ in die Pipeline laufend neue Befehle hineingeschoben, die in dieser Reihenfolge die Pipeline durchlaufen. In ihr befinden sich immer vier Befehle in jeweils aufeinander folgenden Phasen. Auf diese Weise wird in jedem Takt ein Befehl fertig, obwohl ein jeder 4 Takte dauert. – Die Taktfrequenz wird von der Signallaufzeit der sog. längsten Logikkette bestimmt (kritischer Pfad). Sie lässt sich mit Pipelining erhöhen, sodass die Leistung des Rechners signifikant steigt. Man spricht anstelle von Phasen von Stufen, dennoch gelegentlich zur Abgrenzung gegenüber anderen Pipelines von PhasenPipelining. Auffallend ist, dass die Mikroprogrammsteuerung des Rechners verkümmert. Ganz entfällt sie aber nur, wenn keine Leertakte nötig sind, was aber im Rechnerbau nur theoretisch möglich ist. Sofern nämlich z. B. die immer notwendigen Lade-/SpeichereBefehle mehr als einen Takt kosten, müssen Leertakte erzeugt werden, sodass Lücken auf dem Fließband entstehen, anschaulich „bubbles“ in der
Pipeline. – Sehr grundsätzliche Ausführungen zur Fließbandtechnik findet man in [1]. Fazit. Die Leistungssteigerung ist durch räumliche und zeitliche Parallelität zu erklären, wobei die zeitliche Parallelität nicht auf Gleichzeitigkeit derselben Operationen, sondern auf Überlappung aufeinander folgender Operationen beruht. Fließbandkonflikte und deren Lösungen. Es gibt
im Wesentlichen zwei Arten von Fließbandkonflikten: (1.) Datenkonflikte; sie entstehen, wenn ein Registeroperand benötigt wird, der sich noch in der Pipeline befindet, also noch nicht ins Register geschrieben wurde (dort steht noch der vorige Wert). (2.) Sprungkonflikte; sie entstehen dadurch, dass bei einer Programmverzweigung Befehle geholt werden (vorsorglich), bevor das Ergebnis der Verzweigung ermittelt worden ist (und die dann gültig oder ungültig sind). Beide Konfliktarten können verhindert werden durch Leertakte (interlocking), was aber zu einer Leistungsminderung führt. Datenkonflikte werden effizient dadurch vermieden, dass nicht erst gewartet wird, bis das IU-Ergebnis im Register steht, sondern das Ergebnis gewissermaßen am Registerblock vorbei gleich wieder an die IU-Eingänge gelegt wird (bypassing, forewarding). Fehlfunktionen bei Sprungkonflikten – Befehle des falschen Zweigs sind in der Pipeline – werden durch diverse, teilweise raffiniert ausgeklügelte Vorhersagemechanismen gemindert. Einfachere Lösungen hängen operativen Befehlen eine Bedingung an, sodass Sprungbefehle z. T. vermeidbar werden (predication). Oder nach dem Sprung angeordnete Befehle werden einfach immer mit ausgeführt (delayed branches); dann muss der Compiler diesen Schlitz (delay slot) geschickt füllen. Komplexere Lösungen, die auf den angesprochenen Vorhersagetechniken beruhen, sind die statische, die dynamische und die adaptive Sprungvorhersage; auch die Vorhersage des Sprungziels ist in Gebrauch. Schließlich werden zur Lösung beider Konfliktarten Wertvorhersagetechniken benutzt sowie eine ganz andere Art von Konfliktvermeidung, nämlich Programmpfade unterschiedlicher, eigenständiger Prozesse, sog. Threads, reihum auszuführen, sodass Abhängigkeiten selbst bei „tiefen“ Pipelines gar nicht erst auftreten können (multithreading). – Zu allen diesen Techniken siehe [2].
5 Prozessorstrukturen
5.4.3 Beispiel zur Maschinenprogrammierung
Das Programm zur Polynomberechnung aus 5.3.3, nun für den Dreiadressrechner formuliert, zeigt Bild 5-8. Dabei ist die Aufgabenstellung insofern modifiziert, als der Grad des Polynoms als fest angenommen wird (n = 3). Dann kann die Schleife „abgerollt“ werden, sodass Sprünge überflüssig sind. Das ergibt eine geringere Ausführungszeit und kommt überdies der Fließbandtechnik zugute. – Das Programm zeigt die typische Programmierung eines Rechners in Lade-/Speichere-Architektur, wobei für die skalare Größe X die Vorteile dieser Architektur mehr zum Tragen kommen als für die vektorielle Größe A (A benötigt viel Platz!). In Wirklichkeit ist das Programm viel länger, da die gezeigten load- und store-Befehle Pseudobefehle sind; das sind eigentlich sog. Makrobefehle (siehe 6.4.3), erst vom Assembler werden sie in wirkliche Maschinenbefehlsfolgen transformiert (vgl. das Programm in Bild 5-7). Das Programm Bild 5-8 hat gegenüber dem Programm Bild 5-6 den Vorteil einer viel höheren Geschwindigkeit, aber den Nachteil eines nur maximal zulässigen n (hier n = 3). Dieser Nachteil lässt sich eliminieren, wenn die Erzeugung des Maschinenprogramms dem Assembler oder dem Compiler übertragen wird. Diesem muss somit n vor der Programm-Übersetzung bekannt sein, d. h. genau genommen beim Programm-Schreiben. Steht diese Information aber erst zur Programm-Laufzeit fest, etwa durch Berechnen oder Einlesen, so lässt sich das Problem einer solchen Flexibilisierung von n nur lösen, indem Programm-Ausführen und Programm-Übersetzen verzahnt ablaufen. Das geschieht folgendermaßen: (1) Fehlt dem Prozessor beim Ausführen Information, hier z. B., wie viele mul/add-Paare ausgeführt werden sollen, so wird auf Übersetzen umgeschaltet. (2) Mit der berechneten bzw. eingelesenen Information wird beim Übersetzen das nächste Programmstück generiert und wieder auf Ausführen umgeschaltet. – Auf diese Weise lassen sich auch Programmläufe untersuchen und Laufzeitcharakteristika ermitteln, sodass entschieden werden kann, ob das betrachtete Programmstück so, wie es vorliegt, ausgeführt wird oder neu übersetzt wird, bevor es weiter ausgeführt wird (profiling, Profilbildung). Man schreibt diese Eigenschaft
Bild 5-8. Maschinenprogramm zur Polynomberechnung mit Operanden im Speicher und im Registerblock
JIT-Compilern zu (just in time compiling, Laufzeitübersetzung). Ausführliches zu dieser Thematik siehe [2].
5.5 Parallel-Architektur Als Kern einer Parallel-Rechnerarchitektur dienen Superskalar-Prozessoren. Sie arbeiten mit mehr als einem Befehl pro Instruktion, wirken jedoch wie Skalar-Prozessoren (mit einem einzigen Befehl pro Instruktion, siehe 5.3 und 5.4). Als Kern einer solchen Rechnerarchitektur dienen des Weiteren VLIW-Prozessoren. Diese arbeiten mit mehreren Befehlen pro Instruktion und wirken auch so (siehe 5.5.2, 5.5.3). 5.5.1 Superskalar vs. VLIW
Bezüglich der Hardware zur Parallelisierung sind Superskalar-Prozessoren viel aufwändiger als VLIWProzessoren aufgebaut. (Bezüglich prozessorinterner Speicher ist es umgekehrt.) In beiden Fällen müssen die Probleme, die aufgrund der parallelen Ausführung von eigentlich sequentiell gemeinten Befehlen entstehen, gelöst werden: entweder durch Hardware (beim Rechnerbau) oder durch Software (im Compilerbau). Im einfachsten Fall „injizieren“ Hardwarelösungen Leertakte (interlocks) und Softwarelösungen
J59
J60
J Technische Informatik / Digitale Systeme
Leerbefehle (no operations) in den Befehlsstrom. Anspruchsvollere Lösungen ordnen – wann immer möglich – die Befehlsreihenfolge um, selbstverständlich ohne die beabsichtigte Wirkung des Programms zu verändern. Wenn man der Vorstellung folgt – von einem Programm in höherer Programmiersprache ausgehend –, dass die Befehle immer streng sequentiell ausgeführt werden, so muss der Prozessor bzw. der Compiler die im Programm enthaltenen Parallelisierungsmöglichkeiten erkennen und umsetzen (instruction scheduling). Dabei sind die Anforderungen bezüglich der Superskalar- und der VLIW-Befehlsausführung unterschiedlich: Im Superskalar-Fall werden zur Laufzeit, d. h. durch den Prozessor, die Abhängigkeiten erkannt und Konflikte aufgelöst. Im VLIW-Fall geschieht dasselbe zur Übersetzungszeit, also durch den Compiler. Das Ziel ist, Interlocks bzw. No-Operations zu minimieren. Im Superskalar-Fall verteilt die Hardware die Befehle „dynamisch“ auf die parallelen Funktionseinheiten. Im VLIW-Fall verteilt die Software die Befehle „statisch“ auf die entsprechenden Positionen der Instruktionen. – Weitere Möglichkeiten, diese statische Operationsparallelität zu erhöhen, sind das SchleifenAbrollen (siehe 5.4.3) und das Software-Pipelining (siehe 5.5.3). Dazu sowie zur Erhöhung der sog. dynamischen Operationsparallelität siehe [2]. 5.5.2 Fünfbefehlrechner (VLIW)
Als Modellrechner mit VLIW-Architektur dient der Fünfbefehlrechner Bild 5-9 (wobei gegenüber Bild 4-22b in den Maschinenprogrammen im Speicher nun nicht nur zwei, sondern mehrere Befehle nebeneinander gespeichert vorliegen und ein Multiport-Registerblock mit so vielen Ports vorhanden ist, dass die fünf Befehle voll parallel ausgeführt werden können). Zu sehen sind: „oben“ der Programm-Cache P’ für den Ausschnitt eines Maschinenprogramms, der PC, das IR und „unten“ der 8-Port-Registerblock D” für einen kleineren Ausschnitt der Daten und ein 2-Port-Daten-Cache D’ für einen größeren Ausschnitt der Daten sowie die beiden Integer-Units IU, i. Allg. kombiniert mit weiteren speziellen Einheiten, wie einer FloatingPoint-Unit. Das gesamte Programm mit seinen Daten befindet sich im Speicher P/D.
Der Rechner besitzt registerbezogene Dreiadressbefehle. Für das Füllen und Leeren der Register sind Lade- und Speichere-Befehle nötig. In jedem Takt werden mehrere Befehle fertiggestellt (hier bis zu fünf ). Lade-/Speichere-Befehle benötigen jedoch oft einen zusätzlichen Takt, wodurch Bubbles in der Lade-/Speichere-Pipeline entstehen. Die Maschinenprogrammierung ist sehr schwierig, u. a. wegen Berücksichtigung der Befehlsparallelität in Verbindung mit der Fließbandverarbeitung. Sie entspricht im Schwierigkeitsgrad anspruchsvoller Mikroprogrammierung, und dementsprechend hochkomplex ist der Compilerbau. Hervorstechend in Bild 5-9 ist der gegenüber dem Speicher P/D auf mehrfache Wortlänge erweiterte Programm-Cache P’ mit dem langen IR. Die fünf Befehle sind nebeneinander angeordnet: zwei Dreiadressbefehle für die Fließbänder mit den IUs, zwei Lade-/Speichere-Befehle sowie ein bedingter Sprungbefehl. Die beiden Integer-Operationen werden taktsynchron parallel ausgeführt, d. h., die sie auslösenden Befehle werden als Doppelbefehle behandelt. Alle Befehle befinden sich, vom Compiler parallelisiert, im Speicher P/D, und zwar so, dass sie in der beabsichtigten Ordnung in den Programm-Cache P geladen werden können. Die Lade-/Speichere-Befehle ermöglichen es, Operanden zwischen dem Registerblock und dem Speicher bzw. dem 2-Port-Daten-Cache zu transportieren: ld lädt ein Register mit dem Inhalt einer Speicher-/Cachezelle, st speichert einen Registerinhalt in eine Speicher/Cachezelle. Das Programmbeispiel. Bild 5-10 zeigt das sehr kleine Programm zur Addition von zwei Zahlen, wie es im Programm-Cache steht, des Weiteren die Daten im Daten-Cache. Es benötigt unter der Annahme von 1 Takt pro Cache-Zugriff 6 Takte (gefüllte Fließbänder auch für die anfänglichen Befehlsausführungen vorausgesetzt). 5.5.3 Beispiel zur Maschinenprogrammierung
Wie bei Rechnern in Register-Architektur so auch bei Rechnern in Parallel-Architektur: Zuerst werden die zu verarbeitenden Größen mittels ld-Befehle in die Register gebracht, dann in oft vielstufigen Fließ-
5 Prozessorstrukturen
Bild 5-9. Fünfbefehlrechner (Fließbandregister unvollständig gezeichnet); neben den in der Mitte hervorstechenden zwei
Integer-Einheiten IU befinden sich – nicht durch eigenständige Symbolik gekennzeichnet – die Lade-/Speichere-Einheit und die Programm-Verzweige-Einheit. – Der Prozessor arbeitet fünffach parallel, d. h. maximal fünf Einheiten können fünf Befehle pro Instruktion gleichzeitig ausführen Bild 5-10. Beispielprogramm Z := X + Y für den Fünfbefehlrechner (Sprungbefehle treten nicht auf)
bändern direkt verarbeitet und schließlich ihre Ergebnisse mittels st-Befehle zurück in den Daten-Cache gebracht. Die Leistungsfähigkeit gegenüber einem skalaren Rechner in Register-Architektur ist nur dann höher, wenn Parallelverarbeitung von der Aufgabenstellung her möglich ist. Das ist bei der kleinen Aufgabe aus 5.5.2 nicht der Fall. Es trifft hingegen zu, wenn die Addition zweier Skalare aus Bild 5-10 verallgemeinert wird zur Addition eines Skalars mit einem Vektor. Dann
lässt sich ein entsprechendes Additionsprogramm für einen VLIW-Rechner so organisieren, dass die drei Operationen ld, add, st für die Additionen der skalaren Größe, etwa einer Konstanten, mit den Komponenten des Vektors in Fließbandorganisation erfolgen, wobei die Register des Registerblocks – programmiert – dieselbe Rolle wie die Pipeline-Register – strukturiert – einer entsprechenden Hardware spielen. Man spricht deshalb von Software-Pipelining.
J61
J62
J Technische Informatik / Rechnerorganisation
Bild 5-11. Maschinenprogramm
für Software-Pipelining mit Adressen und Operanden im Speicher und im Registerblock. Register, die Operanden enthalten, sind im Programm durch Fettdruck hervorgehoben. Die eingetragenen Größen zeigen einen Schnappschuss während der Ausführung der Instruktion „loop“. Der loop-Counter lc ist anfänglich auf 100 gestellt
Bild 5-11 zeigt das entsprechende Programm, wobei realistischerweise gegenüber dem Fünfbefehlrechner Bild 5-9 nun die Adressen wieder in den Registern stehen (wie bei der Registerarchitektur). In ein und derselben Instruktion codierte und in ein und demselben Takt parallel ablaufende Befehle sind durch das Fehlen von ; am Ende einer Programmzeile kenntlich gemacht. (Instruktionen als Ganzes sind nach wie vor mit ; abgeschlossen.) Bild 5-11 zeigt neben dem Programm eine schematische Darstellung, in der die Cache-Zellen sowie die Register nicht als Blocks gezeichnet sind, sondern „verstreut“, um die Wirkung des Pipelining besser erkennen zu können. Die hervorgehobenen Zellen und Register bilden die dreistufige Pipeline, die Einträge geben eine ausgewählte, bestimmte Situation innerhalb der Schleife wieder, also bei gefüllter Pipeline. – Zum Laden der Register mit den Anfangsdaten sowie zum anfänglichen Füllen der Pipeline sind vor der eigentlichen PipelineSchleife – es handelt sich um eine einzige Instruktion aus vier Befehlen! – ein Vorspann und zum abschließenden Leeren der Pipeline ein Nachspann erforderlich, was im Programm durch Linien markiert ist. Der augenscheinliche Nachteil der Speicherung vieler No-Operation-Befehle in VLIW-Programmen – in
Bild 5-10 zu sehen, in Bild 5-11 versteckt – lässt sich durch höhere Organisationsformen bezüglich des Instruktion-Holens vermeiden, etwa durch Anheften der Anzahl der Befehle pro Instruktion, durch Angabe einer Endekennung für jede Instruktion oder – wiederum – durch den Aufbau von Multiport-Caches, nun aber zur Programmspeicherung; zu diesen Möglichkeiten siehe z. B. [2]. Die vorgestellte Aufgabe ist hinsichtlich des Software-Pipelining auf den Fünfbefehlrechner Bild 5-9 abgestimmt (nämlich die Addition eines Skalars mit einem Vektor). Wird die Aufgabe weiter verallgemeinert, nämlich auf die Addition zweier Vektoren, so ist mit diesem Rechner kein optimales Software-Pipelining mehr möglich. Denn dann kann das dafür notwendige gleichzeitige Lesen nun der zwei Vektorkomponenten und Schreiben der dritten Komponente wegen des 2-Port-Daten-Cache nicht mehr in ein und demselben Takt erfolgen. Es stehen also – allgemein formuliert – nicht ausreichend Betriebsmittel zur Verfügung, was nun zu Bubbles in der Pipeline führt; man spricht von Ressourcen-Konflikten. Zur konfliktfreien Ausführung der so verallgemeinerten Aufgabe genügt also der vorgestellte Fünf befehl-
5 Prozessorstrukturen
rechner nicht. Dazu wäre ein Sechsbefehlrechner mit einem 3-Port-Daten-Cache mit 3-fach-CacheZugriff nötig, sodass Zweimal-Operanden-Lesen und Einmal-Ergebnis-Schreiben ohne Störung parallel ablaufen könnten. Eine nun mögliche ld-ld-add-stInstruktion würde zwar drei Takte dauern, aber jeden Takt ein Ergebnis liefern. (Man erweitere die Bilder 5-9 und 5-11 in dieser Weise, sodass – ungeachtet einer Realisierung – eine zwar aufwändigere, aber auch leistungsfähigere Parallel-Architektur entsteht.) Konklusion. Mit den Parallel-Rechnerarchitekturen schließt sich – abstrahiert – der Kreis der hier in Kapitel 5 behandelten Rechner. Stellt man sich nämlich vor, einen ersten Rechner (Ende Kapitel 5!), einen VLIW-Rechner „Wirt“, mit einem Instruktionsinterpretations- bzw. -simulationsprogramm für einen zweiten Rechner (Anfang Kapitel 5!), einen v.-Neumann-Rechner „Gast“, zu betreiben, und zwar nur zu diesem einen Zweck, so würde sich der Programm-Cache während des ersten Programmlaufs mit dem Simulationsprogramm füllen. Ist der Cache so groß, dass er das gesamte Simulationsprogramm aufnimmt, bleibt dieses unverändert, und der Cache wird vorteilhaft durch ein PLA ersetzt. Weiterhin werden bis auf Akkumulator und ALU die universellen durch spezielle Funktionseinheiten ersetzt und anstelle der universellen Mehradressbefehle nur noch spezielle Codes für ein paar Möglichkeiten an Befehlsausführungen verwendet. Auf diese Weise entsteht aus dem VLIW-Rechner Bild 5-9 der v.-Neumann-Rechner Bild 5-4: in gängi-
ger Terminologie horizontal mikroprogrammiert mit dem Mikroprogramm im PLA und darauf zugeschnittener Register-/Logik-Struktur. Das heißt umgekehrt, nämlich Mikroprogrammierung eine Ebene höher auf die Maschinenprogrammierung übertragen: Ein VLIW-Rechner ist horizontal programmierbar (hohe Parallelität), ein Superskalar-Rechner ist vertikal programmierbar (geringe Parallelität) und RISC, CISC und der v.-Neumann-Rechner sind extrem vertikal programmierbar (keine Parallelität an Maschinenbefehlen). Bemerkung. Leistungsangaben und -vergleiche blieben in diesem Kapitel bewusst ausgespart. Sie erscheinen wegen der völlig freien Programmierbarkeit von Universalrechnern nur sinnvoll, wenn sie streng aufgabenbezogen sind, d. h., wenn die zu lösende Aufgabe auf den zu vergleichenden Rechnern programmiert wird; dementsprechend gelten die Messergebnisse dann nur für diese Aufgabenstellung. (Einen gewissen Anhaltspunkt liefern BenchmarkAngaben.) – Wie die vorangehenden Beispiele zeigen, gibt es bei der Auslegung eines Prozessors einen weiten Spielraum, der begrenzt ist einerseits durch das schaltungstechnisch Machbare und andererseits durch das programmierungstechnisch Wünschenswerte. Wie dieser Spielraum zu nutzen ist, wird durch die Einbettung des Prozessors in das gesamte Rechensystem bestimmt, d. h. die Einbeziehung des Prozessors in die Rechnerorganisation (siehe Kapitel 6 bis 8) und die Programmierung (siehe Kapitel 9 bis 12).
Rechnerorganisation Th. Flik Rechnerorganisation umfasst die Struktur und die Funktion der Komponenten eines Rechnersystems sowie die für deren Zusammenwirken erforderlichen Verbindungsstrukturen und Kommunikationstechniken; hinzu kommt die für den Betrieb benötigte Systemsoftware. Zentraler Teil eines Rechnersystems ist der Prozessor, wie er in seinen prinzipiellen Strukturen in Kapitel 5 beschrieben ist. Er bestimmt die Informationsdarstellung, d. h. die Codierung der Befehle und Daten für deren Speicherung, Transport
und Verarbeitung. Zusammen mit den Speicher- und Ein-/Ausgabeeinheiten sowie den sie verbindenden Übertragungswegen entstehen leistungsfähige Rechnersysteme. Systeme höchster Leistungsfähigkeit sind dabei als Mehrprozessorsysteme oder als Verbund von Rechnern in Rechnernetzen ausgelegt. Die für den Betrieb von Rechnersystemen erforderliche Systemsoftware bezeichnet man als Betriebssystem. Abhängig von verschiedenen Rechneranwendungen gibt es unterschiedliche Betriebssystemarten.
J63
J64
J Technische Informatik / Digitale Systeme
Bemerkung. Die hier genannten Kennwerte für Speicherkapazitäten, Taktfrequenzen und Übertragungsraten sind für 2007 aktuell; sie nehmen aufgrund des technischen Fortschritts ständig zu.
6 Informationsdarstellung Die Informationsverarbeitung in Rechnersystemen geschieht durch das Ausführen von Befehlen mit Operanden (Rechengrößen). Da Befehle selbst wieder Operanden sein können, z. B. bei der Übersetzung (Assemblierung, Compilierung eines Programms), bezeichnet man Befehle und Operanden zusammenfassend als Daten. Ihre Darstellung erfolgt heute ausschließlich in binärer Form. Die kleinste Informationseinheit ist das Bit (binary digit, Binärziffer), das zwei Werte (Zustände) annehmen kann, die mit 0 und 1 bezeichnet werden (vgl. 3.1). Technisch werden die beiden Werte in unterschiedlichster Weise dargestellt, z. B. durch Spannungspegel, Spannungssprünge, Kondensatorladungen, Magnetisierungsrichtungen oder Reflexionseigenschaften von Oberflächen. Zur Codierung der Daten werden Bits zu Codewörtern zusammengefasst, die in ihrer Bitanzahl den für Speicherung, Transport und Verarbeitung erforderlichen Datenformaten entsprechen. Standardformate sind das Byte (8 Bits) und geradzahlige Vielfache davon, wie das Halbwort (half word, 16 Bits), das Wort (word, 32 Bits) und das Doppelwort (double word, 64 Bits). Der Terminus Wort bezeichnet einen Bitvektor von der Länge der jeweiligen Verarbeitungs- und Speicherbreite eines Rechners, hier eines 32-Bit-Rechners, er wird aber auch unabhängig davon im Ausdruck Codewort verwendet. Weitere Datenformate sind das Bit, das Halbbyte (4 Bits, Nibble, Tetrade) und das Bitfeld (mit variabler Bitanzahl – im Gegensatz zum Bitvektor). – Zur Angabe der Anzahl von Bits oder Codewörtern verwendet man in der Informatik in Anlehnung an die Einheitenvorsätze der Physik die Vorsätze: Kilo K = 210 = 1024, Mega M = 220 = 1 048 576, Giga G = 230 = 1 073 741 824, Tera T = 240 , Peta P = 250 . In grafischen Darstellungen von Datenformaten werden die Bits mit null beginnend von rechts nach
Bild 6-1. Datenformate. a Byte; b 32-Bit-Wort
links nummeriert. Gleichzeitig wird ihnen die im Hinblick auf die Darstellung von Dualzahlen zukommende Wertigkeit zugewiesen (Bild 6-1). Das Bit ganz rechts gilt als niedrigstwertiges Bit (least significant bit, LSB), das Bit ganz links als höchstwertiges Bit (most significant bit, MSB).
6.1 Zeichen- und Zifferncodes Die rechnerexterne Informationsdarstellung erfolgt symbolisch mit den Buchstaben, Ziffern und Sonderzeichen unseres Alphabets. Rechnerintern werden diese Zeichen (characters) binär codiert. Die wichtigsten hierfür eingesetzten Zeichencodes sind der ASCII und der EBCDIC mit 7- bzw. 8-BitZeichendarstellung. Um die internationale Vielfalt an Zeichensätzen erfassen zu können, werden größere Codetabellen mit 16 Bits (Unicode UTF-16 [11]) und 32 Bits (Unicode UTF-32 und UCS, Universal Character Set, ISO/IEC 10 646) verwendet. Neben den Zeichencodes gibt es reine Zifferncodes: die Binärcodes für Dezimalziffern, den Oktalcode und den Hexadezimalcode. – Zu Zeichen- und Zifferncodes siehe z. B. [1]. 6.1.1 ASCII
Der ASCII (American Standard Code for Information Interchange) ist ein 7-Bit-Code mit weltweiter Verbreitung in der Rechner- und Kommunikationstechnik (Tabelle 6-1). Er erlaubt die Codierung von 128 Zeichen, und zwar von 96 Schriftzeichen und 32 Zeichen zur Steuerung von Geräten und von Datenübertragungen (Tabelle 6-2). Der ASCII ist in der internationalen Norm ISO/IEC 646 festgelegt. Diese behält zwölf der 96 Schriftzeichen einer sprachenspezifischen Nutzung vor, wobei nach DIN 66 003 acht zur Codierung der Umlaute, des Zeichens ß und des Paragraphzeichens § genutzt werden (siehe Tabelle 6-1). – Rechnerintern wird den ASCIICodewörtern wegen des Datenformats Byte ein achtes Bit (MSB) hinzugefügt, teils mit festem
6 Informationsdarstellung
Tabelle 6-1. ASCII. US-amerikanische Version/deutsche Version (die mit Schrägstrich unterteilten Tabellenplätze des
ASCII sind nationalen Varianten vorbehalten)
Wert, teils als Paritätsbit oder aber zur Codeerweiterung (ISO/IEC 8859). Mit unterschiedlichen Erweiterungen werden verschiedene Sprachgruppen berücksichtigt, so z. B. die Gruppe Europa, Amerika, Australien (ISO/IEC 8859-1 und -15, als Latein 1 bzw. Latein 9 bezeichnet). 6.1.2 EBCDIC
Der EBCDIC (Extended Binary Coded Decimal Interchange Code) ist ein 8-Bit-Code (Tabellen 6-3 und 6-2), der vorwiegend bei Großrechnern Verwendung findet. Von den 256 Tabellenplätzen sind 64 mit Steuerzeichen belegt. Die in Tabelle 6-3 angegebenen Schriftzeichen entsprechen denen des ASCII, die nicht besetzten Plätze sind bestimmten Sprachbereichen oder bestimmten Sprachen vorbehalten: westliche Sprachen (Latein 1), östliche Sprachen (Latein 2), Kyrillisch, Griechisch oder Arabisch. 6.1.3 Binärcodes für Dezimalziffern (BCD-Codes)
BCD-Codes benutzen vier oder mehr Bits pro Codewort zur binären Codierung von Dezimalziffern. Der gebräuchlichste ist der Dualcode mit 4-Bit-Codewörtern (Tetraden), bei dem den Bits
die Gewichte 8, 4, 2 und 1 zugeordnet sind (Dualzahlcodierung der Dezimalziffern). Man spricht von gepackter Darstellung. Bei Dezimalziffern in einem der Zeichencodes ASCII oder EBCDIC, bei denen der 4-Bit-Dualcode um die höherwertigen Bits 011 bzw. 1111 erweitert ist, spricht man von ungepackter Darstellung. Andere BCD-Codes sind z. B. der Exzess-3-, der Aiken-, der Gray-, der Biquinär- und der 2-aus-5-Code (Tabelle 6-4). Da bei diesen Codes der Vorrat der möglichen Codewörter nicht voll ausgeschöpft wird, ist der Aufwand an Bits zur Darstellung von Dezimalziffern (allgemein: Zahlen) höher als bei der reinen Dualzahlcodierung. Diese Redundanz wird bei einigen Codes zur Codesicherung genutzt. 6.1.4 Oktalcode und Hexadezimalcode
Zifferncodes gibt es auch für die Zahlensysteme zur Basis 8 und 16, den Oktal- bzw. Hexadezimalcode (Sedezimalcode). Sie haben für die Arithmetik nur geringe Bedeutung und werden fast ausschließlich zur kompakten rechnerexternen Darstellung von binär codierter Information benutzt. Bei der oktalen Darstellung werden, beginnend beim LSB, jeweils drei Bits zusammengefasst, denen entsprechend ihrem Wert als Dualzahl, die „Oktalziffern“ 0 bis 7 zugeordnet wer-
J65
J66
J Technische Informatik / Digitale Systeme
Tabelle 6-2. Alphabetisch geordnete Zusammenfassung der Steuerzeichen des ASCII und des EBCDIC mit ihren Bedeutungen
Zeichen ACK BEL BS BYP CAN CR CSP CUi DCi DEL DLE DS EM ENP ENQ EO EOT ESC ETB ETX FF FS GE GS HT IFS IGS INP IR IRS IT IUS ITB LF MFA NAK NBS NL NUL POC PP RES RFF RNL RPT RS SA
Bedeutung Acknowledge Bell Backspace Bypass Cancel Carriage Return Control Sequence Prefix Customer Use i Device Control i Delete Data Link Escape Digit Select End of Medium Enable Presentation Enquiry Eight Ones End of Transmission Escape End of Transmission Block End of Text Form Feed File/Field Separator Graphic Escape Group Separator Horiziontal Tabulation Interchange File Separator Interchange Group Separator Inhibit Presentation Index Return Interchange Record Separator Indent Tab Interchange Unit Separator Intermediate Transmission Block Line Feed Modified Field Attribute Negative Acknowledge Numeric Backspace New Line Null Program-Operator Communication Presentation Position Restore Required Form Feed Required New Line Repeat Record Separator Set Attribute
Tabelle 6-2. (Fortsetzung)
Zeichen SBS SEL SFE SI SM SO SOH SOS SPS SP STX SUB SW SYN TRN UBS US VT WUS
Bedeutung Subscript Select Start Field Extended Shift In Set Mode Shift Out Start of Heading Start of Significance Superscript Space Start of Text Substitute Switch Synchronous Idle Transparent Unit Backspace Unit Separator Vertical Tabulation Word Underscore
den. Bei der hexadezimalen Darstellung werden jeweils vier Bits zusammengefasst und ihnen die Ziffern 0 bis 9 und A bis F (oder 0 bis f ) des Hexadezimalsystems zugeordnet. Dazu je ein Beispiel für dasselbe Muster von 16 Bits: 1 010 011 100 101 1102 = 1234568 1010 0111 0010 11102 = A72E16
6.2 Codesicherung Transport und Speicherung von Daten können Störungen unterliegen, die auf Übertragungswege bzw. Speicherstellen wirken. Dadurch hervorgerufene Änderungen von Binärwerten führen zu Fehlern in der Informationsdarstellung. Um solche Fehler erkennen und ggf. korrigieren zu können, muss die Nutzinformation durch Prüfinformation ergänzt werden (redundante Informationsdarstellung). Eine solche Codesicherung erfolgt entweder für einzelne Codewörter oder für Datenblöcke (Blocksicherung). Die Einzelsicherung ist kennzeichnend für die Übertragung einzelner Zeichen, z. B. zwischen Prozessor und einem Terminal. Die Blocksicherung wird bei blockweiser Datenübertragung, z. B. bei
6 Informationsdarstellung
Tabelle 6-3. EBCDIC
Tabelle 6-4. Binärcodes für Dezimalziffern. (Beim 2-aus5-Code folgt die Darstellung der Ziffer 0 nicht der Gewichtung.) Gewichte 0 1 2 3 4 5 6 7 8 9
Dual 8421 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001
Exzess-3 Aiken 2421 0011 0000 0100 0001 0101 0010 0110 0011 0111 0100 1000 1011 1001 1100 1010 1101 1011 1110 1100 1111
Gray Biquinär 543210 0000 000001 0001 000010 0011 000100 0010 001000 0110 010000 0111 100001 0101 100010 0100 100100 1100 101000 1101 110000
2-aus-5 74210 11000 00011 00101 00110 01001 01010 01100 10001 10010 10100
der Datenfernübertragung und in Rechnernetzen, sowie bei blockweiser Speicherung eingesetzt. Alle Sicherungsverfahren beruhen darauf, dass die vom Sender erzeugte und mit übertragene Prüfinformation mit der vom Empfänger unabhängig errechneten Prüfinformation übereinstimmen muss. Nutzbits und Prüfbits sind bezüglich einer Störung und der Fehlererkennung oder -korrektur gleichrangig. – Zur Codesicherung siehe auch [5] und z. B. [10]. Einzelsicherung. Ein Maß für die Anzahl der
bei einem bestimmten Code erkennbaren bzw. korrigierbaren Fehler in einem Codewort ist die
Hamming-Distanz h des redundanten Codes. Diese gibt an, wie viele Stellen eines Codewortes mindestens geändert werden müssen, damit ein anderes gültiges Codewort entsteht. Bei der einfachsten Codesicherung durch ein Paritätsbit ist h = 2, womit ein 1-Bit-Fehler erkannt, jedoch nicht korrigiert werden kann. Der Wert des Paritätsbits wird so bestimmt, dass die Quersumme des redundanten Codewortes entweder gerade (even parity, angewandt bei asynchron-serieller Übertragung) oder ungerade wird (odd parity, angewandt bei synchron-serieller Übertragung). Die Hamming-Distanz h = 3 erreicht man z. B. bei acht Bit Nutzinformation durch vier zusätzliche Prüfbits in geeigneter Codierung. Dies erlaubt es, entweder einen 2-Bit-Fehler zu erkennen oder einen 1-Bit-Fehler zu korrigieren. Entscheidet man sich für eine 1-Bit-Fehlerkorrektur, so ist diese bei einem 2-Bit-Fehler schädlich. Blocksicherung. Bei der Blocksicherung wird einem
Datenblock eine aus allen Codewörtern abgeleitete, gemeinsame Blocksicherungsinformation hinzugefügt. Einfache Verfahren sind z. B. das Bilden von Paritätsbits über alle Bits für jede Bitposition oder das Bilden der Summe über alle Codewörter. Durch Kombination der Einzelsicherung jedes Codeworts und der Blocksicherung entsteht die sog. Rechtecksicherung. Sie erlaubt das Erkennen und Korrigie-
J67
J68
J Technische Informatik / Digitale Systeme
ren von 1-Bit-Fehlern im Schnittpunkt einer fehlerhaften Zeile und einer fehlerhaften Spalte (error correcting code, ECC). Für einen Datenblock von z. B. 8 Bytes benötigt man 15 Prüfbits. Mit weniger Prüfbits kommen die Hamming-Codes aus. Hier genügen für einen Block von 8 Bytes (z. B. ein 64-Bit-Speicherwort) 7 Prüfbits, um 1-Bit-Fehler zu erkennen und zu korrigieren. Mit einem achten Prüfbit können zusätzlich 2-Bit-Fehler erkannt werden (single error correction, double error detection, SECDED). Angewandt wird diese Sicherung z. B. bei Hauptspeichern in Servern. (Server sind Rechner, die in Rechnernetzen für das Speichern und Bereitstellen von Information für die Nutzer der Netze, die Clients, zuständig sind.) Ein weiteres Verfahren der Blocksicherung, das bei der Datenübertragung und bei blockweiser Speicherung eingesetzt wird, ist die Blocksicherung mit zyklischen Codes (cyclic redundancy check, CRC, [10]). Dabei werden die Bits der aufeinanderfolgenden Codewörter als Koeffizienten eines Polynoms betrachtet und durch ein fest vorgegebenes, sog. Generatorpolynom dividiert. Die binären Koeffizienten des sich ergebenden Restpolynoms bilden die Prüfinformation, meist zwei Bytes, die an den Datenblock angefügt wird. Bei Fehlerfreiheit lässt sich der gesicherte Code ohne Rest durch das Generatorpolynom dividieren. Tritt ein Restpolynom (Fehlerpolynom) auf, so kann aus diesem ggf. auf die Fehlerart geschlossen werden. Durch geeignete Wahl des Generatorpolynoms kann das Prüfverfahren auf die Erkennung bestimmter Fehlerarten zugeschnitten werden. Die Polynomdivision lässt sich mit geringem Hardwareaufwand durch ein mit Exklusiv-ODER-Gattern rückgekoppeltes Schieberegister realisieren [2].
die Zusatzformate Bit und Bitfeld. Bitoperanden werden im Prozessor als Elemente der Standardformate adressiert. Bitfelder werden zur Verarbeitung in den Registerspeicher des Prozessors geladen, dort rechtsbündig gespeichert und um die zum Standardformat fehlenden höherwertigen Bits ergänzt. Abhängig von der Transportoperation sind dies 0-Bits (zero extension) oder Kopien des höchstwertigen Operandenbits (sign extension). Die Interpretation der in diesen Datenformaten enthaltenen Bits erfolgt durch die logischen und arithmetischen Operationen des Prozessors (siehe 5.2.2). Die zu einem bestimmten Datentyp gehörenden Operationen interpretieren die Bits in gleicher Weise, z. B. die arithmetischen Befehle für Operanden einer bestimmten Zahlendarstellung. Aufgrund der elementaren Datenformate spricht man von elementaren Datentypen; Tabelle 6-5 zeigt deren wichtigste Vertreter, nach denen dieser Abschnitt gegliedert ist. Fasst man Rechengrößen zu komplexeren Datenobjekten zusammen, so erhält man Datenstrukturen. Sie sind vor allem in den höheren Programmiersprachen von Bedeutung (siehe 10). Häufig vorkommende Strukturen, wie Stack und Feld, werden hinsichtlich des Zugriffs durch den Prozessor unterstützt, z. B. durch ein Stackpointerregister und dazu passende Maschinenbefehle oder Adressierungsarten. Sind für die Interpretation einer solchen Datenstruktur spezielle Maschinenbefehle vorhanden, so spricht man – aus der Sicht der Rechnerhardware – von einem höheren Datentyp. Dies ist z. B. bei den sog. Vektorrechnern der Fall, deren Datentypen in diesem Abschnitt mitbetrachtet werden.
6.3 Datentypen
Der Datentyp Zustandsgröße basiert auf dem Datenformat Bit mit den zwei Werten 0 und 1. Typische bitverarbeitende Operationen sind: Testen, Testen und Setzen, Testen und Rücksetzen, Testen und Invertie-
Dieser Abschnitt behandelt die Datentypen aus hardwarebezogener Sicht. Eine programmierungsorientierte Darstellung gibt Kapitel 10. Der Begriff Datentyp umfasst die Eigenschaften von Datenobjekten hinsichtlich ihres Datenformats und ihrer inhaltlichen Bedeutung (Interpretation). Elementare Datenformate, d. h. Formate, die nur eine Rechengröße umfassen, sind die Standardformate Byte, Halbwort, Wort, Doppelwort, die als Speicher- und Transporteinheiten benutzt werden. Hinzu kommen
6.3.1 Zustandsgröße
Tabelle 6-5. Elementare Datentypen
Datentyp Zustandsgröße Bitvektor ganze Zahl Gleitpunktzahl
Datenformate Bit Standardformate, Bitfeld Standardformate, Bitfeld Wort, Doppelwort
6 Informationsdarstellung
ren. Das Testergebnis wird für Verzweigungen ausgewertet. Beispiel: Test von Bit 5 des Registers r2. Wenn Bit 5 = 1, dann Sprung zur Adresse, die durch Addition des Displacements d16 (2-Komplement-Zahl) zum Befehlszähler entsteht (Branch on Bit Set). bb1 5,r2,d16 6.3.2 Bitvektor
Ein Bitvektor besteht aus einer Aneinanderreihung einzelner Bits in z.b. einem der Standarddatenformate. Die auf diesen Datentyp anwendbaren Operationen umfassen die Boole’schen Operationen AND, OR und XOR sowie NOT. Beispiel: Ausblenden („maskieren“) der Bits 0 bis 3 eines im Register r1 stehenden ASCII-Zeichens (Ziffer 5) mittels der Maske 0x0f und Speichern des Ergebnisses in r2. Das Präfix 0x steht als programmiersprachliche Kennzeichnung hexadezimaler Angaben (6.4.1). and.b r2,r1,0x0f Quelle r1: Maske 0x0f:
00110101 00001111
Ziel r2:
00000101
wobei das höchstwertige Bit an−1 als Vorzeichenbit interpretiert wird. Bei positivem Vorzeichen (an−1 = 0) ist der Zahlenwert gleich dem der vorzeichenlosen Zahl gleicher Codierung, bei negativem Vorzeichen (an−1 = 1) ist er gleich der vorzeichenlosen Zahl gleicher Codierung, jedoch um die Größe des halben Wertebereichs (2n−1 ) in den negativen Zahlenraum verschoben (Tabellen 6-6 und 6-7). Die Befehle für die Addition und die Subtraktion sind von den beiden Zahlendarstellungen unabhängig. Die ALU erzeugt jedoch Bedingungsbits (siehe 3.3.1) zur Anzeige von Bereichsüberschreitungen, die eine nachträgliche Interpretation zulassen: für die vorzeichenlosen Zahlen zeigt das Carry-Bit C (Übertragsbit) eine Bereichsüberschreitung an, für vorzeichenbehaftete Zahlen das Overflow-Bit V (Überlaufbit). Ausgewertet werden diese Bits z. B. bei Programmverzweigungen (siehe 5.2.2). Spezielle Additions- und Subtraktionsbefehle beziehen das Übertragsbit C in die Operationen mit ein, sodass Zahlen, deren Stellenanzahl die Standardformate überschreitet, in mehreren Schritten addiert bzw. subtrahiert werden können.
Tabelle 6-6. Darstellung ganzer Zahlen ZU (vorzeichenlos) und ZS (vorzeichenbehaftet) im Datenformat Byte
6.3.3 Ganze Zahl
Beim Datentyp ganze Zahl unterscheidet man die vorzeichenlose Zahl (unsigned binary number, Dualzahl) und die vorzeichenbehaftete Zahl in 2-Komplement-Darstellung (signed binary number, integer, 2-Komplement-Zahl), dargestellt in den Standardformaten. Die wichtigsten Operationen sind die vier Grundrechenoperationen Addition, Subtraktion, Multiplikation und Division sowie die Vorzeichenumkehr. Der Zahlenwert einer n-stelligen vorzeichenlosen Zahl ZU mit den binären Ziffern ai ist ZU =
n−1
Bei einer n-stelligen 2-Komplement-Zahl ZS ergibt er sich zu ZS = −an−1 2
+
n−2 i=0
ZU 0 1 2 .. . 127 128 129 .. . 255
ZS 0 1 2 .. . 127 −128 −127 .. . −1
Tabelle 6-7. Wertebereich für ganze Zahlen ZU (vorzeichen-
ai 2i .
i=0
n−1
Binärcode 00000000 00000001 00000010 .. . 01111111 10000000 10000001 .. . 11111111
ai 2 , i
los) und ZS (vorzeichenbehaftet) bei der Darstellung mit n Bits n 8 16 n
ZU 0 bis 255 0 bis 65 535 0 bis 2n − 1
ZS −128 bis +127 −32 768 bis +32 767 −2n−1 bis +2n−1 − 1
J69
J70
J Technische Informatik / Digitale Systeme
Die Multiplikation führt bei einfacher Operandenbreite von Multiplikand und Multiplikator (meist gleich der Verarbeitungsbreite des Prozessors) auf ein Produkt doppelter Breite, wahlweise auch einfacher Breite. Bei der Division hat der Dividend doppelte (wahlweise einfache) Breite; Divisor, Quotient und Rest haben einfache Breite. Ein Divisor mit dem Wert null führt zum Befehlsabbruch (zero-divide trap, 8.2.2). – Zur Arithmetik mit ganzen Zahlen siehe z. B. [6, 8, 9]. 6.3.4 Gleitpunktzahl Zahlendarstellung. Für das Rechnen mit reellen
(eigentlich: rationalen) Zahlen hat sich in der Rechnertechnik die halblogarithmische Zahlendarstellung mit Vorzeichen, Mantisse und Exponent, d. h. die der Gleitpunktzahlen ( floating-point numbers) durchgesetzt. Gegenüber den ganzen Zahlen erreicht man mit ihnen einen wesentlich größeren Wertebereich bei allerdings geringerer Genauigkeit. Die Gleitpunktdarstellung ist in IEEE 754–1985 bzw. DIN/IEC 60 559 festgelegt; nach ihr ergibt sich der Wert ZFP einer Zahl zu ZFP = (−1)s(1. f )2e−bias . Gleitpunktzahlen werden in zwei Grundformaten codiert (Bild 6-2): einfach lang mit 32 Bits (single precision), doppelt lang mit 64 Bits (double precision). Rechenwerksintern kann überdies in je einem erweiterten Format gearbeitet werden, um höhere Rechengenauigkeiten zu erzielen (meist wird einheitlich ein 80-Bit-Format benutzt). Der Übergang auf die Grundformate erfolgt dann durch Runden. s ist das Vorzeichen (sign) der Gleitpunktzahl (0 positiv, 1 negativ). Die Mantisse 1. f (significand) wird als gemischte Zahl in normalisierter Form angegeben. Dazu wird sie, bei entsprechendem Vermindern des
Exponenten, so weit nach links verschoben, bis sie eine führende Eins aufweist. Der „Dualpunkt“ steht immer rechts von dieser Eins. In den Grundformaten gespeichert wird lediglich der Bruch f ( fraction); die führende Eins wird von der Gleitpunktrecheneinheit ( floating-point unit, FPU) automatisch hinzugefügt. Die Mantisse hat den Wertebereich 1.0 ≤ 1. f < 2.0. Die Information des vorzeichenbehafteten Exponenten E wird im Datenformat durch den transformierten Exponenten e (biased exponent) dargestellt. Dazu wird zu E in seiner 2-Komplement-Darstellung eine Konstante (bias = 127 bzw. 1023) addiert, sodass sich eine positive (vorzeichenlose) Zahl ergibt: e = E + bias. Dadurch kann das Vergleichen von Gleitpunktzahlen, genauer, von deren Beträgen, als Ganzzahloperation realisiert werden. – Tabelle 6-8 zeigt für beide Grundformate die Zahlenbereiche und die Genauigkeiten bei normalisierter Darstellung (siehe auch 10.2). Der kleinste und der größte Exponentwert (e) sind zur Darstellung von null und unnormalisierten Zahlen bzw. von unendlich und Nichtzahlen (not a numbers, NaNs) reserviert (Bild 6-3). Unnormalisierte Zahlen haben mit der Mantisse der Form 0. f eine geringere Genauigkeit als normalisierte Zahlen (Bereichsunterschreitung); sie werden mit e = 1 interpretiert (Tabelle 6-9). Nichtzahlen dienen u. a. zur Kennzeichnung nichtinitialisierter Variablen und zur Übermittlung von Diagnoseinformation, wie sie z. B. während einer Berechnungsfolge aufgrund ungültiger oder nicht verfügbarer Operanden erzeugt wird. Operationen. Die Norm sieht als arithmetische Operationen die Addition, die Subtraktion, die Multiplikation, die Division, die Restbildung, den Vergleich und das Radizieren vor. Hinzu kommen Konvertierungsoperationen zwischen den Gleitpunktformaten und solche zwischen Gleitpunktzahlen und 2-Komplement-Zahlen sowie wenigstens einer Darstellung für Dezimalzahlen (BCD-Strings). Heutige Gleitpunktrecheneinheiten unterstützen ferner u. a. trigonometrische und logarithmische Operationen. – Zur Arithmetik mit Gleitpunktzahlen siehe z. B. [3, 4, 8, 9].
Bild 6-2. Grundformate für Gleitpunktzahlen. a Einfach
Runden. Die rechenwerksinterne Verarbeitung in den
lang (32 Bits); b doppelt lang (64 Bits)
erweiterten Formaten erfordert, sofern die überzähli-
6 Informationsdarstellung
Tabelle 6-8. Zahlenbereiche und Genauigkeiten für Gleitpunktzahlen einfacher und doppelter Länge
einfache Länge 32 Bits 24 Bits 2−24 ≈ 7 Dezimalstellen 8 Bits 127 −126 bis 127 2−126 ≈ 1, 2 · 10−38 (2 − 2−23 ) 2127 ≈ 3, 4 · 1038
Datenformat Mantisse größter relativer Fehler Genauigkeit transformierter Exponent e Bias Bereich für E kleinste positive Zahl größte positive Zahl
doppelte Länge 64 Bits 53 Bits 2−53 ≈ 16 Dezimalstellen 11 Bits 1023 −1022 bis 1023 2−1022 ≈ 2, 2 · 10−308 (2 − 2−52 ) 21023 ≈ 1, 8 · 10308
Resultate mittels zweier Schranken darstellen, innerhalb deren der korrekte Wert liegt (Intervallarithmetik). Beim Runden gegen null werden die das Grundformat überschreitenden Bitpositionen abgeschnitten. Bild 6-3. Darstellung von Gleitpunktzahlen. a Null; b unnormalisiert; c normalisiert; d unendlich; e Nichtzahl Tabelle 6-9. Beispiele zur Codierung von Gleitpunktzahlen
einfacher Länge. a Null; b unnormalisiert; c normalisiert; d unendlich; e Nichtzahlen a b c d e
s 0/1 0/1 0/1 0/1 0/1 0/1 0/1 0/1
e 00000000 00000000 00000000 00000001 11111110 11111111 11111111 11111111
f 00. . . 00 00. . . 01 11. . . 11 00. . . 00 11. . . 11 00. . . 00 00. . . 01 11. . . 11
= = = = = = = =
Wert ±0 ±0.00 . . . 01·2−126 ±0.11 . . . 11·2−126 ±1.00 . . . 00·2−126 ±1.11 . . . 11·2+127 ±∞ Nichtzahl Nichtzahl
gen Stellen des Bruches f relevante Werte aufweisen, ein Runden der Werte beim Anpassen an die Grundformate. Dabei sollen exakte Ergebnisse arithmetischer Operationen erhalten bleiben (z. B. bei der Multiplikation mit 1). Die bestmögliche Behandlung von Rundungsfehlern geschieht durch das sog. korrekte Runden. Dabei wird der Wert gleich dem nächstgelegenen Wert im Zielformat gesetzt, im Zweifelsfall gleich dem Wert mit geradzahliger Endziffer. Hingegen wird beim Aufrunden der Wert in Richtung plus unendlich, beim Abrunden in Richtung minus unendlich gerundet. Durch den Einsatz beider Verfahren lassen sich
6.3.5 Vektor
Der Begriff Vektor steht in der Informatik für einen höheren Datentyp, der auf der Datenstruktur Feld mit Datenobjekten eines einheitlichen elementaren Datentyps basiert. Vektoren werden durch sog. Vektorbefehle elementweise verarbeitet, d. h., ein Befehl löst mehrere Elementaroperationen aus. Implementiert werden diese Datentypen auf Vektorrechnern (siehe 7.4.1). Die wichtigsten Vektordatentypen sind: Vektor aus Bitvektoren mit den Elementaroperationen AND, OR und XOR, Vektor aus ganzen Zahlen mit den Elementaroperationen Addition und Subtraktion und Vektor aus Gleitpunktzahlen mit den Elementaroperationen Addition, Subtraktion, Multiplikation, Reziprokwertbildung, Normalisieren sowie weiteren, speziellen Operationen.
6.4 Maschinenund Assemblerprogrammierung Die Informationsverarbeitung in einem Rechner erfolgt durch ein Programm, das als Folge von Maschinenbefehlen im Hauptspeicher steht und vom Prozessor Befehl für Befehl gelesen und ausgeführt wird. Die Befehle sind, wie Texte und Zahlen, binär codiert. Bei der Programmierung des Rechners wird zur leichteren Handhabung eine symbolische Schreibweise angewandt. In der
J71
J72
J Technische Informatik / Digitale Systeme
hardwarenächsten Ebene, der Assemblerebene, entspricht dabei ein symbolischer Befehl einem Maschinenbefehl. Die symbolische Schreibweise wird Assemblersprache genannt. Sie ist durch den Befehlssatz des Prozessors geprägt, jedoch in ihrer Symbolik und Befehlsdarstellung (Notation, Syntax) von der Hardware unabhängig. Die Umsetzung eines in einer Assemblersprache geschriebenen Programms (Assemblerprogramm, Assemblercode) in ein vom Prozessor ausführbares Programm (Maschinenprogramm, Maschinencode) übernimmt ein Übersetzungsprogramm, der Assembler (siehe z. B. [7]). Anweisungen an den Assembler, wie z. B. das explizite Zuordnen von symbolischen zu numerischen Adressen, erfolgen durch Assembleranweisungen (Direktiven), die wie die Maschinenbefehle in das Programm eingefügt werden. Sie haben mit wenigen Ausnahmen keine codeerzeugende Wirkung. 6.4.1 Assemblerschreibweise Assemblerprogramm. Bild 6-4 zeigt links den
grundsätzlichen Aufbau eines Assemblerprogramms am Beispiel der Polynomauswertung, wie sie für die Akkumulator-Architektur in 5.3 beschrieben ist: y = a3 x + a2 x + a1 x + a0 3
2
1
= ((a3 x + a2 )x + a1 )x + a0
Jede der Programmzeilen enthält einen Befehl mit den Bestandteilen Marke (optional), Operation und Adresse, die durch Leerzeichen (spaces) oder Tabulatoren voneinander getrennt sind. Operations- und Adressteil beschreiben dabei den eigentlichen Maschinenbefehl. Mit der Marke (label) kann man einen Befehl als Einsprungstelle für Programmverzweigungen kennzeichnen. Der Adressteil ist hier für einen Einadressrechner ausgelegt, insofern ist hier nur ein einziger Operand angegeben. Bei einem Dreiadressrechner wären es drei Operanden, z. B. drei durch Komma getrennte Registeradressen. Daran anschließend kann, mit z. B. einem Semikolon beginnend, die Zeile kommentiert werden. Dieser Kommentar unterstützt die Programmdokumentation und hat keine Wirkung auf den Assembliervorgang. Die Assembleranweisungen des Programms mit den hier gewählten Abkürzungen ORG, DC, DS, EQU und END unterliegen der gleichen Formatierung, wobei jedoch ihre Marken- und Adressteile in individueller Weise genutzt werden. – Bild 6-4 zeigt rechts das gleiche Programm, jedoch in der höheren, aber hardwarenahen Programmiersprache C. Symbole, Zahlen und Ausdrücke. Als Operations-
symbole werden üblicherweise leicht merkbare Abkürzungen (mnemonics) verwendet. Sie können um ein Suffix zur Bezeichnung des Datenformats erwei-
Bild 6-4. Polynomauswer-
tung, links als Assemblerprogramm für einen Einadressrechner (angelehnt an Bild 5-6), rechts als C-Programm. Der Befehl TRAP bewirkt eine Programmunterbrechung und führt in das Betriebssystem zurück (8.2.2)
6 Informationsdarstellung
tert sein, z. B. der Maschinenbefehl „Addiere wortweise“ ADD.W oder die Assembleranweisung „Definiere Konstante als Byte“ DC.B. Mnemonisch vorgegeben sind auch die Bezeichner der allgemeinen Register des Prozessors, z. B. R0, R1, ... sowie SP für das Stackpointerregister und SR für das Statusregister. – Adresssymbole im Markenfeld sind weitgehend frei wählbar, unterliegen jedoch Vorschriften, wie: das erste Zeichen muss ein Buchstabe (Alphazeichen) sein, gewisse Sonderzeichen, z. B. das Leerzeichen, dürfen nicht verwendet werden. Gültige Symbole sind z. B. LOOP und VAR_1. Marken vor Maschinenbefehlen werden meist mit „:“ abgeschlossen, vor Assembleranweisungen nicht. – Je nach Assembler wird Groß- oder Kleinschreibung verwendet, oder es ist beides zugelassen. Zahlen sind dezimal (in Bild 6-4 keine Kennung), hexadezimal (in Bild 6-4 mit dem Präfix 0x, ggf. $) und oktal (Präfix @) darstellbar, z. B. 5, –2, 0xFFC0, @701. Zeichen und Zeichenketten (Textoperanden) werden üblicherweise durch einschließende Hochkommas gekennzeichnet, z. B. ‘TEXT NR. 1‘. Sie werden vom Assembler im ASCII oder EBCDIC dargestellt. Bitvektoren werden in binärer Schreibweise (z. B. Präfix %) oder in Hexadezimal- oder Oktalschreibweise dargestellt. Adresssymbole, Zahlen, Bitvektoren und Textoperanden im Adressteil können durch arithmetische und logische Operatoren zu Ausdrücken verknüpft werden, die vom Assembler ausgewertet werden. Sie dienen zur Darstellung von Konstanten und Speicheradressen. Beispiel: Der Wert von IO+2 in Bild 6-4 ergibt sich aus dem vom Assembler ermittelten Wert von IO, erhöht um 2. 6.4.2 Assembleranweisungen
Die Assembleranweisungen in Bild 6-4 haben folgende Wirkungen: ORG (origin) gibt mit 0x1000 die Anfangsadresse der nachfolgenden Speicherbelegung an. Diese erfolgt hier für eine Speicherwortbreite von 16 Bit und mit byteweiser Adressierung. Die EQU-Anweisung (equate) weist dem Symbol IO die Konstante 0xFFC0 zu. Dies hat keinen Einfluss auf die Speicherbelegung, sondern nur textersetzende Wirkung. Im vorliegenden Programm bezeichnet die Konstante die Adresse eines Geräteregisters, über das der Wert X im Wortformat eingelesen wird. Der um 2
erhöhte Wert IO+2 bezeichnet ein zweites Geräteregister, an das zum Programmende der Ergebniswert P ausgegeben wird. Die Berechnung des Ausdrucks IO+2 führt der Assembler während der Übersetzung des Programms durch. EQU dient grundsätzlich der Übersichtlichkeit und erleichtert eine nachträgliche Änderung eines solchen Wertes (wie #define in C). Die erste DC-Anweisung (define constant) erzeugt im Speicher eine Konstante im Wortformat (16 Bit) mit dem Wert 3 und der symbolischen Adresse N und weist N die durch ORG vorgegebene erste numerische Adresse 0x1000 zu. Die zweite DC-Anweisung erzeugt ein Speicherfeld mit vier Konstanten im Wortformat und weist dem Symbol ARRAY die nächste freie Adresse 0x1002 als Feldanfangsadresse zu. Mit DS (define storage) wird entsprechend der Angabe im Adressteil und abhängig vom Suffix ein Wortspeicherplatz für die Variable X reserviert, ohne ihn zu initialisieren. Das Symbol X erhält als Wertzuweisung den um die acht Byteadressen (vier Wörter) des Feldes erhöhten Wert 0x100A. Die zweite DSAnweisung reserviert in gleicher Weise das Speicherwort mit der Adresse 0x100C für die Variable P. Die Adressvergabe für die Maschinenbefehle beginnt im Anschluss an die Variable P mit der Adresse 0x100E, die so den Adresswert für die Marke POLY bildet. Durch Weiterzählen dieser Adresse, entsprechend den von den Befehlen belegten Speicherwörtern, wird auch der Marke LOOP ein Adresswert zugeordnet. Auf diese Weise ermittelt der Assembler in einem ersten Durchgang durch das Assemblerprogramm die Adresswerte aller als Marken auftretenden symbolischen Adressen. In einem zweiten Durchgang codiert er dann die Befehlszeilen und erzeugt so das Maschinenprogramm. Das Ende des Assemblercodes (physischer Abschluss) wird dem Assembler mit der END-Anweisung angezeigt. Sie gibt außerdem in ihrem Adressteil mit POLY die Programmstartadresse (hier 0x100E) für das Betriebssystem vor. Der logische Abschluss des Programms, d. h. der Rücksprung in das Betriebssystem erfolgt durch einen Trap-Befehl (siehe auch 8.2.2). – Der Maschinencode wird entweder direkt im Speicher an der von der ORG-Anweisung angegebenen Adresse erzeugt, oder er wird zunächst in eine Datei geschrieben und dann später in einem eigenen Ladevorgang dort abgelegt.
J73
J74
J Technische Informatik / Digitale Systeme
6.4.3 Makros
Assemblersprachen erlauben neben der 1-zu-1Umformung symbolischer Maschinenbefehle auch die 1-zu-n-Übersetzung sog. Makrobefehle in i. Allg. mehrere Maschinenbefehle. Diese Ausdehnung einer Zeile Assemblercode in n Zeilen Maschinencode während des Übersetzungsvorgangs wird als Makroexpansion bezeichnet. Ein solcher Makrobefehl hat dabei den gleichen Aufbau wie ein symbolischer Maschinenbefehl. Beispiel: Makrobefehl load für das Laden eines Speicheroperanden, bestehend aus der Befehlsfolge setl, setu und ld, angelehnt an das Programm in Bild 5-7 in 5.4.1. Beschrieben wird der Makrobefehl durch eine Makrodefinition, die vom Assembler (jetzt auch als Makroassembler bezeichnet) während des Assembliervorgangs ausgewertet wird: load
macro setl setu ld endm
/1,/2,/3 /2,/3 /2,/3 /1,/2
An den Stellen der Makroaufrufe „load“ im Assemblerprogramm, z. B. : load :
6.4.4 Unterprogramme
Ein Unterprogramm (Prozedur, subroutine) ist eine in sich abgeschlossene Befehlsfolge mit meist eigenem lokalen Datenbereich, die an beliebigen Stellen eines übergeordneten Programms, des Haupt- oder Oberprogramms, wiederholt aufgerufen und ausgeführt werden kann. Nach Abarbeitung der Befehlsfolge wird das übergeordnete Programm hinter der Aufrufstelle fortgesetzt (Bild 6-5). Beim Aufruf wird das Unterprogramm i. Allg. mit Rechengrößen versorgt, und es gibt Ergebnisse an das Oberprogramm zurück. Man bezeichnet diese Größen (wie bei der Makrotechnik) als Parameter und den Vorgang als Parameterübergabe. Vorteile dieser Technik sind: sich wiederholende Befehlsfolgen werden (anders als bei der Makrotechnik) nur einmal gespeichert; die Programme werden gegliedert und sind dadurch übersichtlicher und leichter zu testen; Unterprogramme können unabhängig vom Oberprogramm übersetzt werden; Standardunterprogramme können in Programmbibliotheken zur Verfügung gestellt werden.
r4,r1,x Aufruf und Rückkehr. Der Aufruf eines Unterpro-
erzeugt der Makroassembler die in der Makrodefinition durch die Anweisungen macro und endm (end macro) eingeschlossene Befehlsfolge und ersetzt dabei die formalen Parameter /1, /2, /3 durch die jeweils im Aufruf angegebenen aktuellen Parameter, hier durch r4, r1 und x: : setl setu ld :
ne Programmschleife, wenn die Anzahl ihrer Durchläufe während der Assemblierung bekannt ist, davon abhängig „abgerollt“ codiert oder als Schleife codiert werden. – Standardmakros können in Makrobibliotheken zur Verfügung gestellt werden.
gramms erfolgt durch einen speziellen Sprungbefehl (z. B. jump to subroutine, jsr) mit der Angabe der Startadresse des Unterprogramms als Sprungziel. Vor Neuladen des Befehlszählers wird dessen Inhalt als Rücksprungadresse auf den durch ein Stackpointerregister sr verwalteten Stack oder in ein Pufferregister des Prozessors (Link-Register) geschrieben. Die
r1,x r1,x r4,r1
Zur Steigerung der Effizienz der Codeerzeugung bedient man sich zusätzlich der bedingten Assemblierung. Sie ermöglicht es, bei der Makroexpansion in Abhängigkeit der aktuellen Parameter unterschiedlichen Maschinencode zu erzeugen. So kann z. B. ei-
Bild 6-5. Zweimaliges Aufrufen eines Unterprogramms; zeitlicher Ablauf entsprechend der Nummerierung
6 Informationsdarstellung
Rückkehr erfolgt durch einen weiteren speziellen Sprungbefehl (z. B. return from subroutine, rts), der als letzter Befehl des Unterprogramms den obersten Stackeintrag bzw. den Inhalt des Link-Registers als Rücksprungadresse in den Befehlszähler lädt. Parameterübergabe. Als Parameter werden beim
Aufruf entweder die Werte von Operanden (call by value) oder deren Adressen (call by reference) übergeben. Die Wertübergabe erfordert lokalen Speicherplatz im Unterprogramm und ist für einzelne Werte geeignet. Die Adressübergabe ist bei zusammengesetzten Datenobjekten, z. B. Feldern, notwendig, da für die (vielen) Werte meist nicht genügend Speicherplatz zur Verfügung steht (z. B. in den allgemeinen Registern). Sie erlaubt außerdem auf einfache Weise die Parameterrückgabe (auch für einzelne Werte).
Grundsätzlich erfolgt die Parameterübergabe durch Zwischenspeicherung an einem Ort, der sowohl für das Hauptprogramm als auch für das Unterprogramm zugänglich ist. Übliche Orte sind – der Registerspeicher des Prozessors, sofern die Anzahl der freien Register ausreicht, – der Stack als Hauptspeicherbereich, der über das Stackpointerregister allgemein zugänglich ist. Bild 6-6 zeigt die Wert- und Adressübergabe im Stack an einem Beispiel, erklärt durch die Zeilenkommentare und die in Bild 6-7 gezeigte dynamische Stackbelegung. Zur Vereinfachung der Programmierung von Stackzugriffen und allgemein von Feldern (arrays) werden Erweiterungen der registerindirekten Adressierung verwendet: – Registerindirekte Adressierung mit Prädekrement oder mit Postinkrement: Bei -(sp) und -(ri) wird der
Bild 6-6. Parameterübergabe und Statusretten auf dem Stack, adressiert über das Stackpointerregister sp, bei einem Speicherwortformat von 32 Bit. Beim Aufruf des Unterprogramms „subr“ werden an dieses der Wert „x“ (call by value) und die Adresse „string“ (call by reference) als Eingangsparameter übergeben; „x“ erhält nach der Rückkehr in das aufrufende Programm den Ergebniswert und wirkt somit auch als Ausgangsparameter. Die Inhalte der vom Unterprogramm benutzten Prozessorregister r4 und r5 werden von ihm zunächst auf den Stack gerettet und später wiederhergestellt. Das aufrufende Programm gibt zum Abschluss den Parameterbereich auf dem Stack wieder frei
J75
J76
J Technische Informatik / Digitale Systeme
Bild 6-7. Zeitliche Abfolge für die Belegung und Freigabe des Stacks durch das Programm aus Bild 6-6. Die Num-
mern spiegeln die Positionen des Stackpointers nach Ausführung der jeweiligen Programmzeile wider
Registerinhalt sp bzw. ri um die Byteanzahl des im Befehl angegeben Datenformats vor dem Speicherzugriff vermindert, bei (sp)+ und (ri)+ um diese Byteanzahl nach dem Speicherzugriff erhöht. – Registerindirekte Adressierung mit Displacement: Bei d(sp) und d(ri) wird die effektive Adresse durch Addition des Registerinhalts sp bzw. ri und eines im Befehl stehenden Displacements d (2-Komplement) gebildet. Schachtelung von Aufrufen. Ein Unterprogramm
kann seinerseits Unterprogramme aufrufen und erhält damit die Funktion eines Oberprogramms. Der Aufrufmechanismus kann sich so über mehrere Stufen erstrecken. Man bezeichnet das als Schachtelung von Unterprogrammaufrufen und unterscheidet drei Arten: Einfache Unterprogramme folgen dem behandelten Schema von Aufruf und Rückkehr, wobei der für das Retten der Rücksprungadresse benutzte Stack mit seinem LIFO-Prinzip genau der Schachtelungsstruktur entspricht. Lokale Daten und Parameter können in gesonderten Speicherbereichen oder auf dem Stack verwaltet werden. Rekursive Unterprogramme können aufgerufen werden, bevor ihre jeweilige Verarbeitung abgeschlossen ist. Dies geschieht entweder direkt, wenn sich das Unterprogramm selbst aufruft, oder indirekt, wenn der Wiederaufruf auf dem Umweg über ein oder mehrere Unterprogramme erfolgt. Bei rekursiven Unterprogrammen muss dafür gesorgt werden, dass mit jedem
Aufruf ein neuer Datenbereich bereitgestellt wird, damit der zuletzt aktuelle Bereich nicht beim erneuten Aufruf überschrieben wird. Hierfür bietet sich wiederum der Stack an. Reentrante (wiedereintrittsfeste) Unterprogramme können wie rekursive Unterprogramme aufgerufen werden, bevor sie ihre jeweilige Verarbeitung abgeschlossen haben. Bei ihnen ist jedoch der Zeitpunkt des Wiederaufrufs nicht bekannt, so z. B. beim Aufruf durch Interruptroutinen. Das heißt, das an beliebigen Stellen von einem Interrupt unterbrechbare Unterprogramm muss bei jedem Wiederaufruf selbst für das Retten seines Datenbereichs und seines Status sorgen. Auch hier bietet sich wieder der Stack an. Diese Technik findet z. B. bei Mehrprogrammsystemen Einsatz (8.1.4).
7 Rechnersysteme Rechnersysteme bestehen aus Funktionseinheiten, die durch Übertragungswege – Busse oder Punktzu-Punkt-Verbindungen – miteinander verbunden sind. Aktive Einheiten (master) sind in der Lage, Datentransfers auszulösen und zu steuern. Sie arbeiten entweder programmiert (Prozessoren) oder ihre Funktion ist fest vorgegeben bzw. in eingeschränktem Maße programmierbar (Controller). Passive Einheiten (slaves) werden von einem Master gesteuert (z. B. Speicher und passive Schnittstelleneinheiten zur Peripherie). Einfache Rechnersysteme bestehen aus einem Zentralprozessor als einzigem Master, aus Speichern und passiven Ein-/Ausgabeeinheiten als Slaves sowie aus Übertragungswegen. Eine Erhöhung der Leistungsfähigkeit erhält man durch weitere Master zur Steuerung von Ein-/Ausgabevorgängen, z. B. Direct-memory-access-Controller (DMA-Controller) oder Ein-/Ausgabeprozessoren oder durch weitere Prozessoren zur Unterteilung der zentralen Datenverarbeitung. Dieser Weg führt zu parallelarbeitenden Rechnern hoher Rechenleistung. Darüber hinaus werden Rechner und periphere Geräte über Verbindungsnetzwerke zu Rechnernetzen verbunden. Diese erlauben es dem Benutzer, mit anderen Netzteilnehmern Daten auszutauschen und die Rechen-, Speicher- und Ein-/Ausgabeleistung des gesamten Netzes mitzubenutzen.
7 Rechnersysteme
7.1 Verbindungsstrukturen Die herkömmlichen Verbindungsstrukturen zwischen den Funktionseinheiten eines Rechners sind parallele (und ggf. serielle) Busse, an die die Funktionseinheiten als „Buskomponenten“ (Master und Slaves) über mechanisch, elektrisch und funktionell spezifizierte Schnittstellen angekoppelt sind. Sie erlauben es in einfacher Weise, Rechner hinsichtlich Art und Anzahl der Funktionseinheiten flexibel zu konfigurieren. Sie haben allerdings den Nachteil, dass immer nur zwei Busteilnehmer miteinander kommunizieren können und dass die erreichbaren Bustaktfrequenzen weit unter denen von Prozessoren liegen. Bei hohem Leitungsaufwand erzielt man ggf. unzureichende Übertragungsraten. Busse werden deshalb verstärkt durch serielle und parallele Punkt-zu-Punkt-Verbindungen ersetzt, die jeweils nur zwei Funktionseinheiten miteinander verbinden. Diese Technik, verbunden mit differenzieller Signaldarstellung, wie sie für die serielle Übertragung gebräuchlich ist, ermöglicht sehr viel höhere Taktfrequenzen und damit höhere Übertragungsraten. Ausgehend von seriellen Punktzu-Punkt-Verbindungen kann die Übertragungsrate zwischen zwei Übertragungspartnern individuell angepasst werden, indem ggf. mehrere serielle Verbindungen parallel betrieben werden. Als weiterer Vorteil gegenüber Bussen können mehrere Punktzu-Punkt-Verbindungen gleichzeitig aktiv sein, also mehr als nur zwei Übertragungspartner gleichzeitig miteinander kommunizieren. – Vertiefend zu Abschnitt 7.1 siehe z. B. [2]. 7.1.1 Ein- und Mehrbussysteme Einbussysteme. Bei Einbussystemen sind alle Funktionseinheiten eines Rechners über einen zentralen Bus, den Systembus, der im Wesentlichen die Signalleitungen des Prozessors umfasst (Prozessorbus) miteinander verbunden (Bild 7-1a). Die Datenübertragung geschieht parallel über mehrere Datenleitungen (paralleler Bus), z. B. im Byteformat (8-Bit-Bus bei 8-Bit-Prozessoren) oder in geradzahligen Vielfachen von Bytes (z. B. 32-Bit-Bus bei 32Bit-Prozessoren). Typisch ist eine solche Struktur für die Steuerungstechnik (embedded control ), wobei die
Gesamtstruktur oft in einem einzigen Halbleiterbaustein, einem sog. Mikrocontroller untergebracht ist. Einbussysteme haben den Nachteil, dass immer nur ein einziger Datentransport stattfinden kann und somit bei mehreren Mastern im Rechner (im Bild 7-1a Prozessor und DMA-Controller, DMAC) Engpässe auftreten können. Ferner ist der Bus durch die erforderliche Buslänge und ggf. die Vielzahl der angeschlossenen Buskomponenten mit einer großen kapazitiven Buslast in seiner Übertragungsgeschwindigkeit beschränkt, was sich insbesondere beim Hauptspeicherzugriff nachteilig auswirkt. Mehrbussysteme mit Bridges. Bei Mehrbussys-
temen sind die Funktionseinheiten eines Rechners entsprechend ihren unterschiedlichen Übertragungsgeschwindigkeiten und ihren Wirkungsbereichen auf Busse unterschiedlicher Leistungsfähigkeit verteilt, die wiederum durch Steuereinheiten miteinander verbunden sind. Bild 7-1b zeigt eine solche Mehrbusstruktur mit Prozessorbus, Systembus und Peripheriebus in einer bzgl. ihrer Übertragungsgeschwindigkeiten hierarchischen Anordnung. Der Prozessorbus als sehr schneller Bus (z. B. 64 Bit breit) verbindet die Komponenten hoher Übertragungsgeschwindigkeit, d. h. Prozessor/Cache und Hauptspeicher. Der Systembus (z. B. PCI-Bus, 32 Bit breit, siehe 7.1.5) dient den „langsameren“ Komponenten, hauptsächlich den Schnittstellen und Steuereinheiten für die Ein-/Ausgabe, weshalb er häufig auch als Ein-/Ausgabebus bezeichnet wird. Verbunden sind die beiden Busse über eine Überbrückungssteuereinheit, eine sog. Bridge, die einerseits die Busaktivitäten entkoppelt und andererseits die Datenübertragung zwischen den Komponenten der verschiedenen Busse koordiniert. Sie enthält ggf. zusätzliche Steuereinheiten, wie DMA-Controller, Interrupt-Controller und Busarbiter. Der Peripheriebus ist üblicherweise als Kabelverbindung ausgeführt mit serieller oder paralleler (8 oder 16 Bit breiter) Datenübertragung für den Anschluss eigenständiger Geräte (rechnerintern oder -extern, z. B. SCSI) oder Prozesskomponenten (rechnerextern, z. B. Feldbusse). Seine Verbindung mit dem Systembus erfolgt über eine Steuereinheit (oft als Host-Adapter bezeichnet). In einfacherer
J77
J78
J Technische Informatik / Digitale Systeme
Bild 7-1. Rechnersysteme. a Einbussystem mit Prozessorbus/Systembus (z. B. 16 Bit parallel); b bridge-basiertes Mehrbus-
system mit Prozessorbus (z. B. 64 Bit parallel), Systembus/Ein-/Ausgabebus (z. B. 32 Bit parallel), Peripheriebus (seriell oder 8 Bit parallel) und einem Anschluss an ein lokales Rechnernetz (seriell); c hub-basiertes Rechnersystem (PC) mit Punkt-zu-Punkt-Verbindungen und Bussen
Ausführung reduziert sich der Peripheriebus auf eine Punkt-zu-Punkt-Verbindung mit passiver Anbindung an den Systembus (z. B. IDE/ATA). Moderne Peripherie“busse“ verbinden eine Vielzahl von Geräten Punkt-zu-Punkt, entweder aneinandergereiht als Kabel“bus“ (z. B. FireWire) oder in netzähnlicher Struktur (z. B. USB). – Bild 7-1b zeigt darüber hinaus die (serielle) Ankopplung des Rechners an ein lokales Netz über eine Netzsteuereinheit (LAN-Controller, local area network controller). Gegebenenfalls ist in einer solchen Mehrbusstruktur der Systembus/Ein-/Ausgabebus in zwei Busse aufgeteilt, die dann über eine weitere Bridge miteinander verbunden sind. Typisch ist dies bei älteren PCStrukturen mit PCI-Bus (Systembus) und langsamerem ISA-Bus (Ein-/Ausgabebus). Letzterer ist fast nur noch in Industrieanwendungen zu finden. Mehrbussysteme mit Hubs. Eine für neuere PCs
typische Mehrbusstruktur zeigt Bild 7-1c. Sie weist anstelle der Bridges sog. Hubs (zentrale Verteiler) und darüber hinaus weitere Strukturverbesserungen auf: (1.) Der Cache kommuniziert mit dem Prozessor
nicht mehr über dessen Busschnittstelle (FrontsideCache, z. B. 64 Bit), sondern über eine zusätzliche, höher getaktete Punkt-zu-Punkt-Verbindung mit ggf. breiterem Datenweg (Backside-Cache, z. B. 128 Bit). (2.) Der Speicher-Hub vermittelt sämtliche Datenübertragungen zwischen den ihn umgebenden schnellen Komponenten, wobei Übertragungen zwischen unterschiedlichen Übertragungspartnern gleichzeitig stattfinden können. Mit Ausnahme des Prozessorbusses (64 Bit), sind sämtliche Datenwege als schnelle parallele Punkt-zu-Punkt-Verbindungen ausgelegt: zum Hauptspeicher (z. B. 2 × 64 Bit), zur Grafikeinheit (z. B. 16 Bit), zum Systembus-Hub (z. B. 16 Bit) und zum E/A-Hub (z. B. 8 Bit). Der Speicher-Hub ist für die Übertragungen mit Pufferspeichern ausgestattet, außerdem enthält er die Steuerung für den Hauptspeicher (DRAM-Controller). Der Systembus-Hub versorgt den schnellen Systembus 1 (z. B. PCI-X-Bus, 64 Bit breit, siehe 7.1.5). (3.) Der E/A-Hub steuert sämtliche peripheren Busse (z. B. USB, FireWire) und Anschlüsse (z. B. für Festplatten, LAN) sowie den langsameren Systembus 2 (z. B.: PCI-Bus, 32 Bit breit, siehe 7.1.5). Durch die schnelle
7 Rechnersysteme
Punkt-zu-Punkt-Verbindung zum Speicher-Hub und durch Pufferspeicher im E/A-Hub können diese Einheiten ggf. gleichzeitig mit Daten versorgt werden. Der E/A-Hub enthält zusätzliche Funktionseinheiten, wie DMA-Controller, Interrupt-Controller, Timer. (4.) Die peripheren Busse und Anschlüsse des E/A-Hubs übertragen mit hohen Übertragungsraten seriell, der Systembus 2 parallel. – Man bezeichnet die aufeinander abgestimmten Hubs (bzw. Bridges) eines Rechners als dessen Chipsatz. 7.1.2 Systemaufbau
Rechner für allgemeine Anwendungen werden üblicherweise als modulare Mehrkartensysteme aufgebaut, sodass man in ihrer Strukturierung flexibel ist. Dabei werden zwei alternative Prinzipien verfolgt. Entweder wird ein festes Grundsystem durch zusätzliche Karten über Steckverbindungen erweitert, wobei Anzahl und Funktion der Karten in gewissem Rahmen wählbar sind, oder das System insgesamt wird durch steckbare Karten konfiguriert, sodass auch das Grundsystem als Karte wählbar bzw. austauschbar ist. Erwünscht ist dabei eine möglichst große Auswahl an Karten, was durch die Standardisierung von Systembussen und Punkt-zu-Punkt-Verbindungen gefördert wird; Prozessorbusse sind als „proprietäre“ Busse nicht standardisiert. Das Prinzip des Erweiterns eines Grundsystems findet man bevorzugt bei Arbeitsplatzrechnern (PCs, Workstations) und Servern. Hier sind elementare Funktionseinheiten, wie Chipsatz, Taktgeber (Clock) und das BIOS-Flash-RAM (Basic I/O System, Treibersoftware des Betriebssystems), fest auf einer Grundkarte (main board) untergebracht. Weitere Komponenten, wie Prozessor, prozessorexterner Cache, Hauptspeicher und Grafik-Controller, sind mittels spezieller, vom Chipsatz versorgter Stecksockel (slots) zusteckbar. Darüber hinaus bietet der Systembus universelle Steckplätze für quasi beliebige Zusatzkomponenten, womit ein solches System vielfältig erweiterbar ist. Man bezeichnet den Systembus deshalb auch als Erweiterungsbus. Weitere elementare Komponenten, wie Festplatte, DVD-Laufwerk, LAN, Tastatur und Monitor, werden mittels Kabelverbindungen mit dem Chipsatz bzw. mit dem Grafik-Controller verbunden. Externe Speicher und Ein-/Ausgabegeräte werden mittels
serieller Verbindungen oder paralleler Verbindungen vom Chipsatz aus betrieben. Solche Verbindungen sind entweder als Kabelbusse ausgelegt, d. h., die Geräte sind in Reihe miteinander verbunden, oder sie werden über interne und ggf. externe Hubs netzartig betrieben, d. h., die Geräte sind in einer Stern- oder Baumstruktur miteinander verbunden. Erkennt ein Rechnersystem beim Hochfahren seines Betriebssystems seine Komponenten (Steckkarten, Geräte am Kabelbus und an externen Hubs) selbst und führt es daraufhin z. B. die Vergabe von Interruptprioritäten, das Zuordnen von DMA-Kanälen und Adressbereichen an die Komponenten selbst durch, so spricht man von dem Prädikat „Plug and Play“; ist das Hinzufügen von Komponenten während des laufenden Betriebs möglich, von „Hot Plug and Play“. Das Prinzip des Konfigurierens eines ganzen Systems wird bei Rechnern für den industriellen Einsatz angewandt, um in der Strukturierung eine noch höhere Flexibilität als bei Arbeitsplatzrechnern zu erreichen. Dazu werden die Funktionseinheiten (Baugruppen) grundsätzlich als Steckkarten realisiert und diese dann als Einschübe nebeneinander in z. B. einem 19 Zoll breiten Baugruppenträger (19-Zoll-Rack) mit bis zu 20 Steckplätzen untergebracht. Zur Zusammenschaltung der Karten werden ihre Signalleitungen über Steckverbindungen auf eine Rückwandverdrahtung geführt. Diese Verdrahtung wird durch eine Leiterplatine (backplane) realisiert. Man bezeichnet einen solchen Bus auch als Backplane-Bus. 7.1.3 Busfunktionen
Ein Bus vermittelt die unterschiedlichen Funktionsabläufe zwischen den Busteilnehmern. Diese Abläufe unterliegen Regeln, die als sog. Busprotokolle Bestandteil der Busspezifikation sind. Zur Einhaltung dieser Regeln, in denen sich die Funktion der Bussignale, ihr Zeitverhalten und ihr Zusammenwirken widerspiegeln, sind bei den Busteilnehmern entsprechende Steuereinheiten erforderlich. Die wesentlichen Funktionen sind – die Datenübertragung zwischen Master und Slave, – die Busarbitration (Buszuteilung) bei mehreren Mastern, – die Interruptpriorisierung und
J79
J80
J Technische Informatik / Digitale Systeme
– Dienstleistungen (utilities), wie Stromversorgung, Taktversorgung (Systemtakt, Bustakt), Systeminitialisierung (Reset-Signal), Anzeige einer zu geringen Versorgungsspannung und Anzeige von Systemfehlern. Hinzu kommen ggf. Funktionen, wie – die Selbstidentifizierung von an den Bus angeschlossenen Komponenten (indem z. B. Steckkarten während einer Systeminitialisierung Statusinformation liefern, Plug and Play) und – das Testen elektronischer Bauteile von Buskomponenten zur Fehlererkennung während des Betriebs (IEEE 1149.1: JTAG Boundary Scan). Zur Realisierung dieser Funktionen unterscheidet man bei einem parallelen Bus fünf Leitungsbündel: Datenbus, Adressbus, Steuerbus, Versorgungsbus und Testbus. Buszyklus bei synchronem und asynchronem Bus.
Die Datenübertragung für eine Schreib- oder Leseoperation wird vom Master ausgelöst und umfasst die Adressierung des Slave und die Synchronisation der Übertragung. Die Regeln, nach denen ein solcher Buszyklus abläuft, sind als Busprotokoll festgelegt. Bei einem synchronen Bus (als der vorherrschenden Busart) sind Master und Slave durch einen gemeinsamen Bustakt miteinander synchronisiert, d. h., die Übertragung unterliegt einem festen Zeitraster mit fest vorgegebenen Zeitpunkten für die Bereitstellung und Übernahme von Adresse und Datum (Bild 7-2). Gesteuert wird der Ablauf durch ein Adressgültigkeitssignal (Address-Strobe-Signal AS), das die Bereitstellung der Adresse und somit den Beginn des Zyklus anzeigt, und durch ein Read/Write-Signal (R/W), das dem Slave die Transportrichtung vorgibt. Um den Bustakt nicht an den langsamsten Busteilnehmer anpassen zu müssen, wird das Protokoll durch ein Bereit-Signal (READY) erweitert. Dieses ist zunächst inaktiv und wird vom Slave aktiviert, sobald er zur Datenübernahme (Schreibzyklus) bzw. zur Datenabgabe (Lesezyklus) bereit ist. Der Busmaster fragt dieses Signal erstmals nach der für ihn kürzestmöglichen Buszykluszeit von 2 Takten ( je ein Takt für die Adress- und für die Datenübertragung) ab. Ist es inaktiv, so verlängert er den Buszyklus taktweise
Bild 7-2. Buszyklus (Schreiboperation) bei einem synchro-
nen Bus; Buszykluszeit von drei Takten einschließlich eines Wartezyklus; gegenpolige Doppellinien stehen für unterschiedliche Signalzustände bei mehreren Leitungen, die Mittellinie zeigt den Signalzustand Tristate an (vgl. 3.3.2)
um Wartezyklen (wait states), bis er den Bereitzustand vorfindet (siehe Bild 7-2). Da sich das Aktivieren und Inaktivieren der Signale AS und READY gegenseitig bedingen (AS → READY → AS → READY), spricht man auch von Handshake-Synchronisation und von Handshake-Signalen. Bei einem asynchronen Bus gibt es keinen gemeinsamen Bustakt. Die Synchronisation erfolgt aber auch hier durch Handshake-Signale; diese sind jedoch getrennt getaktet oder ungetaktet. Der Master zeigt die Gültigkeit von Adresse und Datum durch ein Adressund ein Datengültigkeitssignal an, und der Slave signalisiert asynchron dazu seine Datenübernahme bzw. -bereitstellung durch Aktivieren eines BereitSignals. Abhängig von diesem führt der Master einen Buszyklus ohne oder mit Wartezyklen durch. Bei beiden Busarten kann das Ausbleiben des BereitSignals bei defektem oder fehlendem Slave durch einen Zeitbegrenzer (watch-dog timer) überwacht werden, der dem Master das Überschreiten einer Höchstzeit mittels eines Trap-Signals meldet (bus error trap, 8.2.2), worauf dieser den Zyklus abbricht und eine Programmunterbrechung einleitet. Diese Möglichkeit wird insbesondere bei Steuerungssystemen genutzt. Die Anwahl eines Slave innerhalb eines Buszyklus geschieht durch
Adressierung und Busankopplung.
7 Rechnersysteme
Decodierung der vom Master ausgegebenen Adresse (Bild 7-3). Dabei wird genau ein Slave aktiviert (Signal SELECT), der sich daraufhin mit seinen Datenleitungen an den Bus ankoppelt. Ausgangspunkt für die Decodierung ist die Festlegung der Größe der Adressräume der Slaves in Zweierpotenzen. Bei einem Slave-Adressraum der Größe 2m und einem Gesamtadressraum der Größe 2n (n ≥ m), bilden die m niederwertigen Adressbits die Distanz (offset) im Adressraum des Slave. Die verbleibenden n − m höherwertigen Bits dienen, wie Bild 7-3 zeigt, zu dessen Anwahl. – Im entkoppelten Zustand sind die Datenanschlüsse des Slave hochohmig, d. h. offen (TristateTechnik, siehe 3.3.2). Busarbitration. Befinden sich an einem Bus mehrere Master, so muss der Buszugriff verwaltet werden, um Konflikte zu vermeiden. Dazu muss jeder Master, wenn er den Bus benötigt, diesen anfordern (bus request). Ein sog. Busarbiter (arbiter: Schiedsrichter) entscheidet anhand der Auswertung der Prioritäten der Master („Priorisierung“) über die Busgewährung (bus grant). Grundsätzlich muss dabei ein Master niedrigerer Priorität den Bus frühestens nach Abschluss des momentanen Buszyklus abgeben. – Busse, die die Busarbitration ermöglichen, bezeichnet man als multimasterfähig. Bei zentraler Priorisierung ist jedem Master eine Priorität in Form einer Request- und einer GrantLeitung als eigenes Leitungspaar zum Busarbiter zugewiesen (Bild 7-4a). Bei dezentraler Priorisierung werden sämtliche Anforderungssignale auf einer gemeinsamen Leitung zusammengefasst und dem Busarbiter zugeführt (Bild 7-4b). Dieser schaltet bei
Bild 7-3. Adressierung
und Busankoppelung Speichereinheit bei einem synchronen Bus
Freiwerden des Busses das Grant-Signal auf eine sog. Daisy-chain-Leitung, die die Anforderer miteinander verkettet. Die Priorisierung besteht darin, dass ein Anforderer seinen Daisy-chain-Ausgang blockiert und den Bus übernimmt, sobald das Grant-Signal an seinem Daisy-chain-Eingang anliegt. Master hingegen, die keine Anforderung haben, schalten das Daisy-chain-Signal durch. So erhält der Anforderer, der dem Busarbiter in der Kette am nächsten ist, die höchste Priorität; die nachfolgenden Master haben entsprechend abnehmende Prioritäten. Die dezentrale Lösung hat den Vorteil einer geringeren Leitungsanzahl, aber den Nachteil, dass die Buspriorität eines Masters durch seine Position in der Daisy-Chain festgelegt ist (bei einem Erweiterungsbus durch den verwendeten Stecksockel). Bei zentraler Priorisierung können dagegen auf einfache Weise unterschiedliche Priorisierungsstrategien realisiert werden, z. B. nach jeder Buszuteilung automatisch rotierende Prioritäten (Gleichverteilung, faire Zuteilung) oder programmierte Prioritäten. Interruptpriorisierung. Interruptsignale werden von
Buskomponenten mit Slave-Funktion, z. B. passiven Ein-/Ausgabeeinheiten, aber auch von solchen mit Master-Funktion, z. B. DMA-Controllern, erzeugt. Wie bei der Busarbitration müssen die Anforderungen priorisiert werden. Dies geschieht zum einen prozessorintern, sofern der Prozessor codierte Interruptanforderungen zulässt (z. B. sieben Prioritätsebenen bei drei Interrupteingängen und einem vorgeschalteten Prioritätencodierer), zum andern prozessorextern, wenn es nur einen Interrupteingang
Bild 7-4. Busarbitration. a Zentrale Priorisierung im Arbi-
einer
ter; b dezentrale Priorisierung im Arbiter und in der DaisyChain
J81
J82
J Technische Informatik / Digitale Systeme
gibt oder wenn bei codierten Anforderungen einzelne Interruptebenen des weiteren nach Prioritäten unterteilt werden müssen (siehe 8.2.2). Bei zentraler Priorisierung werden die Interruptsignale über eigene Interrupt-Request-Leitungen einem Interrupt-Controller zugeführt (in Bild 7-5a für einen Prozessor mit nur einem Interrupteingang gezeigt). Dieser priorisiert sie und unterbricht den Prozessor (u. U. in der Bearbeitung einer Interruptroutine niedrigerer Priorität), indem er ihm die Anforderung durch ein Interrupt-Request-Signal (IREQ) signalisiert. Bei einem maskierbaren Interrupt entscheidet der Prozessor anhand seiner Interruptmaske, ob er der Anforderung stattgibt. Wenn ja, quittiert er die Unterbrechung durch sein Interrupt-Acknowledge-Signal (IACK) und übernimmt in einem damit aktivierten Lesezyklus (Interrupt-Acknowledge-Zyklus) die vom Interrupt-Controller der Anforderung zugeordnete Vektornummer (zur Identifikation,siehe 8.2.3). In einem Mehrmastersystem muss der Prozessor dazu den Bus anfordern (Busarbitration). Bei dezentraler Priorisierung werden die Interruptsignale auf einer einzigen Interrupt-Request-Leitung (IREQ) zusammengefasst dem Interrupteingang des Prozessors zugeführt, der die Unterbrechungsgewährung über seine Interrupt-Acknowledge-Leitung (IACK) allen Interruptquellen mitteilt (Bild 7-5b). Die Priorisierung und somit die Anwahl des Anforderers höchster Priorität geschieht durch eine Daisy-chain-Leitung, deren Anfang mit dem Signalzustand „aktiv“ belegt ist. Die erste Quelle in der „Kette“ hat die höchste Priorität; die daran anschließenden Quellen haben abnehmende Prioritäten. Diese
hack Bild 7-5. Interruptpriorisierung, a zentral im InterruptController, b dezentral in der Daisy-Chain
Konfiguration ermöglicht ein Interruptprotokoll, das es einem Anforderer erlaubt, eine Interruptroutine niedrigerer Priorität zu unterbrechen (sofern die Interruptmaske des Prozessors zuvor explizit zurückgesetzt wurde; siehe auch [2]). Der Anforderer gibt sich danach in dem durch das IACK-Signal ausgelösten Lesezyklus durch seine Vektornummer zu erkennen. Bei den (seriellen) Punkt-zu-Punkt-Verbindungen mit der für sie typischen paketorientierten Übertragung gibt es üblicherweise keine Steuersignale mehr, so auch keine Interruptsignale. Hier erfolgt die Signalisierung auf den Datenleitungen durch spezielle Anforderungspakete. 7.1.4 Busmerkmale
Bei Prozessorbussen sind Daten- und Adressbus in ihrer Leitungsanzahl an die Verarbeitungsbreite bzw. die Adresslänge des Prozessors angepasst. Bei einfacheren Prozessoren umfasst der Datenbus 8 oder 16 Bit mit typischen Werten für den Adressbus von 16 oder 24 Bit (Adressräume von 64 Kbyte bzw. 16 Mbyte). Leistungsfähigere Prozessoren haben Datenbusbreiten von 32 oder 64 Bit mit Adressbusbreiten von üblicherweise 32 Bit (Adressraum von 4 Gbyte). Systembusse gibt es mit denselben Busbreiten. Diese müssen in einem Mehrbussystem nicht mit denen des Prozessorbusses übereinstimmen (siehe Funktion von Bridges und Hubs, 7.1.1, Bild 7-1). Datenbus- und Adressbusbreite.
Übertragungsrate und Bustaktfrequenz. Die ma-
ximal mögliche Übertragungsrate, die sog. Busbandbreite, wird bei parallelen Bussen (Verbindungen) in der Einheit Mbyte/s oder Gbyte/s angegeben. Sie ergibt sich als Produkt aus Bustaktfrequenz und Datenbusbreite in Bytes, geteilt durch die Anzahl der für die Übertragung eines Datums benötigten Bustakte. Die Bustaktfrequenz ist dabei die maximale Frequenz, mit der die Signalleitungen eines Busses arbeiten können. Bei synchronen Bussen ist diese Frequenz durch das für Master und Slave gemeinsame Bustaktsignal bestimmt; bei asynchronen Bussen obliegt deren Einhaltung den Buskomponenten, die die Handshake-Signale erzeugen. Da die Anzahl an Bustakten pro Datenübertragung auch unter eins liegen kann, z. B. bei Übertragungen mit Double- und
7 Rechnersysteme
Quad-Data-Rate, gibt man die Leistungsfähigkeit von Bussen häufig auch als Anzahl an Datentransfers pro Sekunde an, z. B. als MT/s, woraus sich mittels der Datenbusbreite wiederum die Busbandbreite ermitteln lässt. Bei seriellen Bussen (Verbindungen) wird die Übertragungsrate aufgrund der bitseriellen Übertragung in Mbit/s oder Gbit/s angegeben. – Die Busbandbreite ist eine idealisierte Größe; die real erreichbaren Übertragungsraten sind meist geringer. Bei seriellen Punkt-zu-Punkt-Verbindung wird kein eigenes Taktsignal geführt. Hier wird der für den Datenempfang erforderliche Takt aus den Pegelübergängen des Datensignals abgeleitet. Dazu wird das Datensignal so codiert, dass die für die Taktgewinnung erforderlichen Pegelübergänge quasi unabhängig von der Datenbitfolge gewährleistet werden (z. B. 8b/10bCodierung, [13]). Geteilter Bus und Multiplexbus. Die bisher zu-
grundegelegte Aufteilung der Busse in Datenbus und Adressbus (split bus) erfordert einen hohen Leitungsaufwand. Dieser wird z. B. bei Bussen, die für Mehrprozessorsysteme konzipiert sind, dazu genutzt, den Adress- und den Datenbus den Prozessoren getrennt, d. h. einzeln zuzuweisen. Auf diese Weise können Adress- und Datenübertragungen mehrerer Prozessoren überlappend ablaufen (split transactions), wodurch die Busauslastung verbessert werden kann. Beim sog. Multiplexbus (mux bus) werden die Daten und Adressen hingegen auf denselben Leitungen im Zeitmultiplexbetrieb übertragen. Auf diese Weise lässt sich (bei gleicher Leitungsanzahl, bezogen auf den geteilten Bus) die Busbandbreite verdoppeln. Ein solcher Adress-/Datenbus arbeitet z. B. mit 64-Bit-Datenübertragung und 32- oder 64-Bit-Adressierung. Multiplexbusse zahlen sich insbesondere bei Blockbuszyklen aus. Auch sie erlauben Split-Transaktionen von Prozessoren, nämlich zeitlich verzahnt. Buszyklusarten. Bei parallelen Bussen gibt es ne-
ben dem Buszyklus des Prozessors für das Lesen oder Schreiben eines einzelnen Datums (single cycle, minimal 2 Takte, Bild 7-6a, vgl. 7.1.3) weitere Buszyklusarten für die zusammenhängende Übertragung von Daten. Beim Blockbuszyklus (burst cycle), der zum Laden und Rückschreiben von Cache-Blöcken dient, wer-
den vier (ggf. acht) aufeinanderfolgend gespeicherte Datenwörter übertragen, wobei der Datenübertragung der Transport der Adresse des ersten Datums vorangestellt wird (minimal 5 Takte, 2-1-1-1-Burst, Bild 7-6b). Aufgrund der Übertragung der Daten im Taktabstand spricht man auch von einfacher Übertragungsrate (single data rate, SDR). Die Steuerung des Zyklus obliegt dem Cache-Controller, die Adressfortzählung den Speicherbausteinen. Beim langen Blockbuszyklus (long burst cycle), den es auf Systembussen gibt (z. B. PCI- und PCI-X-Bus) und der durch die Bridge oder durch Master am Bus gesteuert wird, folgt auf die Adresse des ersten Datums ein größerer Datenblock fester oder ggf. beliebiger Länge (Bild 7-6c). In einer Variante dieses Zyklus werden beide Flanken des Bustaktes für die Übertragungssteuerung genutzt, d. h., die Übertragung erfolgt mit doppelter Übertragungsrate (double data rate, DDR, z. B. PCI-X-Bus 2.0, Bild 7-6d). Blockbuszyklen ermöglichen eine gute Leitungsnutzung.
Bild 7-6. Zeitverhalten verschiedener Buszyklenarten bei Angabe der Zeitpunkte des Anlegens einer Adresse, A, und des Abschlusses des Datentransports, D, gemessen in Bustaktschritten. a Einzelner Buszyklus eines Prozessors; b Blockbuszyklus eines Cache-Controllers; c langer Blockbuszyklus eines Systembusses, gesteuert durch eine Bridge oder einen Master am Bus; d wie c, jedoch mit doppelter Datenrate; e DMA-Zyklus eines DMA-Controllers
J83
J84
J Technische Informatik / Digitale Systeme
Beim DMA-Zyklus (DMA cycle) wird ein Datenblock beliebiger Länge übertragen, wobei bei Übertragungen auf Bussen zu jedem Datentransport auch ein Adresstransport gehört (Bild 7-6e). Den DMAZyklus gibt es außerdem mit Double-Data-Rate, nämlich bei Festplattenübertragungen (IDE/ATA, SCSI); hier aber ohne explizite Adressierung. – Bemerkung: Die Nutzung beider Taktflanken zur Verdoppelung der Übertragungsrate findet man nicht nur bei Bussen, sondern auch bei Punkt-zuPunkt-Verbindungen und Speicherbausteinen (z. B. DDR-SRAM, DDR-SDRAM). 7.1.5 Zentrale Busse und Punkt-zu-Punkt-Verbindungen
Tabelle 7-1 zeigt einige gebräuchliche zentrale Busse (Systembusse, Ein-/Ausgabebusse) und zentrale Punkt-zu-Punkt-Verbindungen mit ihren Übertragungsraten, ergänzt um die Anzahl an Datenleitungen, die Übertragungstaktfrequenzen und weitere Angaben. Die Busse übertragen parallel, mit Taktfrequenzen, die aus physikalischen Gründen (Reflexionen, kapazitive Lasten, Übersprechen) wesentlich unter denen von Prozessoren liegen. Die Punkt-zu-Punkt-Verbindungen hingegen erlauben sehr hohe Taktfrequenzen, da ihre Leitungen aufgrund der nur zwei Übertragungsteilnehmer mit
geringen Reflexionen und geringen kapazitiven Lasten betrieben werden können. Außerdem erlauben sie aufgrund der geringen Anzahl an Datenleitungen die differenzielle Signaldarstellung, wodurch sich Störungen auf den Leitungen weitgehend aufheben. Sie erzielen so bei geringerer Leitungsanzahl sehr viel höhere Übertragungsraten als die Busse. Darüber hinaus sind sie hinsichtlich der Übertragungsrate skalierbar, indem serielle Verbindungen zu mehreren parallel betrieben werden können. – Die in der Tabelle aufgeführten Busse und Verbindungen sind in ihren Einsatzbereichen typisch für ältere PCs (ISA, EISA, PCI), für heutige PCs/Workstations/Server (PCI, PCI-X, PCI-Express, HyperTransport) und für industrielle Rechnersysteme (iPSB, VME). ISA, EISA. Als System- bzw. Ein-/Ausgabebus in
PCs war lange Zeit der ISA-Bus (Industry Standard Architecture) mit einer Datenbusbreite von 16 Bit und einer Bustaktfrequenz von 8,33 MHz vorherrschend. Er zeichnet sich als Erweiterungsbus durch bis zu 10 Steckplätze und eine große Vielfalt kostengünstiger Steckkarten aus. Heute kommt er bei PCs nur noch als Sonderausstattung vor, ist aber in industriellen Systemen traditionell noch verbreitet. Höhere Prozessortakte und damit höhere Anforderungen an die Busbandbreite führten (unter Wahrung der Kompatibilität zum ISA-Bus) zum EISA-Bus (Exten-
Tabelle 7-1. Merkmale einiger zentraler Busse (parallel) und zentraler Punkt-zu-Punkt-Verbindungen (seriell)
Bus, DatenTaktArt Idealisierte (Netto-) FußPunkt-zu-Punktleitungen freq. Übertragungsrate noten Verbindung Anzahl MHz Mbyte/s Mbit/s parallel: ISA 16 8,33 8,33 66 1 EISA 32 8,33 33 266 1 PCI 2.2 32 33 132 1064 2 PCI-X 1.0 64 133 1064 8512 2 PCI-X 2.0 64 133 DDR 2128 17 024 2 iPSB 32 10 40 320 2 VME 32 10 40 320 1 VME320 64 20 DDR 320 2560 2 seriell: PCI-Express 2 × (diff.) 2500 2 × 250 2 × 2000 3, 4, 5 Hypertransport 2 × 2 (diff.) 1400 DDR 2 × 700 2 × 5600 3, 5 1) Geteilter Bus; 2) Multiplexbus; 3) Punkt-zu-Punkt-Verbindung; 4) 8b/10b-Codierung; 5) Duplexbetrieb 2 × . . . , (diff.) steht für Leitungspaar
7 Rechnersysteme
ded ISA-Bus) mit einer Datenbusbreite von 32 Bit und annähernder Wahrung der Bustaktfrequenz von 8,33 MHz. Er fand jedoch aufgrund höherer Kosten keine weite Verbreitung. Weiter steigende Anforderungen führten schließlich 1992 zum PCI-Bus (Peripheral Component Interconnect Bus, [6, 8]), einem Multiplexbus mit in der Standardausführung 32 Bit Breite (in einer Erweiterung 64 Bit) und mit einer Bustaktfrequenz von meist 33 aber auch 66 MHz. Als Erweiterungsbus erlaubt er (bei 33 MHz) maximal vier Steckplätze; für mehr Steckplätze (und feste Komponenten) ist er kaskadierbar. Aufgrund seiner hohen Leistungsfähigkeit wird der PCI-Bus auch in Workstations eingesetzt. Eine zum PCI-Bus weitgehend kompatible Weiterentwicklung ist der PCI-X-Bus, der in der Revision 1.0 von 1999 [7] als 64-Bit-Multiplexbus mit 100 und 133 MHz getaktet ist, aber auch herkömmliche PCI-Komponenten mit geringerer Frequenz akzeptiert. Die gegenüber dem PCI-Bus erhöhte Taktfrequenz von 133 MHz wird durch Fließbandtechnik erreicht, indem die Signallaufzeiten auf dem Bus und durch die Decodierlogik des Empfängers auf zwei Taktschritte halber Schrittweite aufgeteilt werden. Die höheren Frequenzen verringern die Anzahl an Steckplätzen auf zwei bzw. einen. Eine effiziente Busnutzung ist durch Split-Transactions gegeben, bei denen der Slave eine Übertragung (Lesezugriff) nach der Adressierung unterbrechen und sie später fortsetzen kann. Zwischenzeitlich ist der Bus anderweitig nutzbar. (In der Revision 2.0 wird der Bus mit Double-Data-Rate übertragen, vorgesehen ist außerdem Quad-Data-Rate.) PCI/PCI-X-Bus.
PCI-Express (PCI-E, PCIe). PCI und PCI-X ge-
nügen manchen heutigen Anforderungen nicht mehr, so den hohen Übertragungsraten von z. B. 10-Gigabit-Ethernet und InfiniBand sowie den Zeitabhängigkeiten bei z. B. Video- und Audio-Daten (streaming data) und bei Echtzeitdaten in eingebetteten Systemen. Hinzu kommt der Anspruch, Übertragungen vollduplex und darüber hinausgehend generell mehrere Übertragungen gleichzeitig durchführen zu können. So wurde als Nachfolger der beiden Busse und softwarekompatibel zu diesen die
serielle Punkt-zu-Punkt-Verbindung PCI-Express mit paketorientierter Übertragung eingeführt. Sie wird als Verbindung zwischen Bausteinen und zwischen Karten (Grundkarte, Steckkarten) eingesetzt (chipto-chip und board-to-board interconnect) und wird in einer PC-Struktur, wie der in Bild 7-1c gezeigten, künftig die parallelen Punkt-zu-Punkt-Verbindungen wie auch die Systembusse ersetzen. Übertragen werden 2 × 1 Bit über zwei differenzielle Leitungspaare, die vollduplex arbeiten, eine sog. Lane, mit einer Taktfrequenz von derzeit 2, 5 GHz (künftig 5 Ghz). Unter Berücksichtigung der zur Taktrückgewinnung eingesetzten 8b/10b-Datencodierung [13] ergibt sich daraus eine Nettoübertragungsrate von 2 × 2 Gbit/s. Eine PCI-Express-Verbindung kann aus 1, 2, 4, 8, 12, 16 oder 32 solcher Lanes bestehen, d. h., durch Parallelbetrieb mehrerer Lanes kann die Übertragungsrate vervielfacht werden. Überbrückbar sind Entfernung bei z. B. 16 parallelen Lanes (×16) von bis zu 20 Zoll (50, 8 cm). – Zur Vertiefung siehe [1]. Hypertransport (HT). HyperTransport ist wie PCI-
Express eine serielle Punkt-zu-Punkt-Verbindung, überträgt paketorientiert mit differenzieller Signalübertragung und wird ebenfalls als Verbindung zwischen Bausteinen und zwischen Karten eingesetzt [5]. Sie nutzt jedoch die Double-Data-Rate-Übertragung und verzichtet auf die 8b/10b-Codierung, was sie insbesondere befähigt, den Prozessorbus zu ersetzen. Die einfachste Verbindung, ein Link, ist sowohl für den Halbduplex- als auch für den Vollduplexbetrieb konzipiert und überträgt 2 Bit pro Richtung parallel mit einer maximalen Übertragungsrate von 2 × 5600 Mbit/s bei einer Taktfrequenz von derzeit bis zu 1, 4 GHz (künftig 2, 6 GHz). Eine HyperTransport-Verbindung kann aus 1, 2, 4, 8 oder 16 solcher Links bestehen, womit eine Parallelität pro Richtung von bis zu 32 Bit erreicht wird. Die beiden Übertragungsrichtungen müssen dabei nicht symmetrisch ausgelegt sein. Die maximale Leitungslänge beträgt 24 Zoll (61 cm). Zwei wichtige industrielle Busse sind die Firmenstandards iPSB und VMEbus. Der iPSB (intel Parallel System Bus), ein 32-BitMultiplexbus, ist einer von drei miteinander kombinierbaren und sich ergänzenden Backplane-Bussen
iPSB (Multibus II).
J85
J86
J Technische Informatik / Digitale Systeme
(Multibus-II-Standard). Als zentraler Systembus ist er an allen Stecksockeln der Backplane zugänglich. Ergänzt wird er durch den iLBX-II-Bus (intel Local Bus Extension), einen schnellen Split-Bus für Prozessor-Speicher-Übertragungen mit kurzer Leitungsführung zwischen benachbarten Stecksockeln, und den seriellen iSSB-Bus (intel Serial System Bus), der als sog. Nachrichtenbus innerhalb einer Backplane wie auch zwischen den Backplanes verschiedener Baugruppenträger eingesetzt werden kann. VMEbus. Der VMEbus (Versa Module Europe
Bus), ebenfalls ein Backplane-Bus, wurde als asynchroner Split-Bus mit einer Datenbusbreite von 32 Bits und einer Busbandbreite von 40 Mbyte/s entwickelt. Er wurde dann zum 64-Bit-Multiplexbus erweitert, zunächst mit Single-Data-Rate (VME64), dann mit Double-Data-Rate (VME64x), jeweils mit Verdoppelung der Busbandbreite. Inzwischen überträgt er synchron mit Double-Data-Rate und einer Busbandbreite von 320 Mbyte/s (VME320, [11]). Den Bustakt liefert der jeweilige Sender, auf eine Empfangsquittierung wird verzichtet (source synchronous protocol). – Wie der iPSB wird der VMEbus durch einen schnellen Speicherbus, den VMXbus (VME extended bus), und einen seriellen Nachrichtenbus, den VMSbus (VME serial bus), ergänzt. 7.1.6 Periphere Busse und Punkt-zu-Punkt-Verbindungen
Periphere Verbindungen werden (abgesehen von Funk- und Infrarot-Übertragungen) mit Kabeln realisiert. Es gibt sie zum einen als Gerätebusse für die Anbindung von Ein-/Ausgabegeräten und Hintergrundspeichern an den Rechner, zum andern als sog. Feldbusse zur Anbindung von Sensoren, Aktoren (auch Aktuatoren genannt) und übergeordneten Einheiten, insbesondere in der Prozess-, Automatisierungs- und Steuerungstechnik. Gerätebusse sind entweder parallele oder serielle Busse mit einem Trend zur seriellen Übertragung, Feldbusse sind dagegen fast ausschließlich serielle Busse. – Der Begriff Bus spiegelt die logische Betrachtung wider. Physikalisch werden die Busse fast ausschließlich
durch Punkt-zu-Punkt-Verbindungen realisiert. Gebräuchlich ist hier das Hintereinanderschalten der Komponenten, d. h. die Form des Strangs, sowie das Verbinden der Komponenten unter Verwendung von Verteilern (Hubs), d. h. die Form des Baums. Serielle Busse sind gegenüber parallelen Bussen kostengünstiger (Kabel, Stecker, Anpasselektronik), einfacher zu verlegen und ermöglichen aufgrund geringerer Übersprechprobleme größere Leitungslängen und höhere Taktfrequenzen, d. h. Übertragungsraten. Maximale Leitungslänge und Taktfrequenz hängen vom Leitungsmaterial und der Leitungsart ab, und zwar mit steigenden Werten für (1.) Kupfer in Form von unverdrillten Zweidrahtleitungen, verdrillten Zweidrahtleitungen (twisted pair, TP) und Koaxialleitungen, (2.) Glas in Form von Glasfaserkabeln (Lichtwellenleitern, LWL) mit unterschiedlichen Übertragungsmodi. Serielle Busse unterscheiden sich in ihren technischen und strukturellen Aspekten oft nur wenig von lokalen Netzen (siehe 7.5.3). – Tabelle 7-2 zeigt die wichtigsten Daten der folgenden Busse/Punkt-zu-Punkt-Verbindungen. SCSI (Small Computer System Interface Bus, ANSI-Standard) ist ein paralleler Gerätebus für den Anschluss prozessorinterner und -externer Geräte, wie Festplatte, CD/DVD-Laufwerk, Drucker, Scanner. Es gibt ihn in verschiedenen Entwicklungsstufen mit 8 Bit (narrow) oder 16 Bit (wide) Datenbusbreite für bis zu 7 bzw. 15 durch ein Kabel miteinander in Reihe verbundene Teilnehmer (Strangstruktur), mit Taktfrequenzen von 5, 10, 20 und 40 MHz und der maximalen Übertragungsrate von 320 Mbyte/s. Mittels einer Disconnect-/Reconnect-Steuerung können auf ihm Wartezeiten, z. B. das Positionieren des Schreib-/Lesearms einer Festplatte, durch zwischenzeitliches Zuteilen des Busses an einen anderen Busteilnehmer überbrückt werden. Die Gerätesteuerung insgesamt erfolgt auf einer hohen Kommandoebene. – SCSI wird vorwiegend bei Rechnern mit hohen Leistungsanforderungen eingesetzt, so bei Servern.
SCSI.
Serial Attached SCSI ist der serielle Nachfolger von SCSI mit einer Übertragungsrate von zunächst 3 Gbit/s (8b/10b-Codierung: 2, 4 Gbit/s netto, d. h. 300 Mbyte/s). Der Anschluss
Serial Attached SCSI (SAS).
7 Rechnersysteme
Tabelle 7-2. Parallele und serielle Gerätebusse und Punkt-zu-Punkt-Verbindungen mit ihren maximalen Übertragungsra-
ten (abhängig von der Leitungsart). Bei Serial Attached SCSI, Serial ATA, Fibre Channel und InfiniBand ist mit Mbyte/s die Nettoübetragungsrate angegeben (8b/10b-Codierung!). Der maximale Geräteabstand soll die Einsatzmöglichkeiten verdeutlichen: rechnernah, rechnerfern Bus, Punkt-zu-PunktVerbindung parallel: SCSI (wide) IDE/ATA seriell: Serial Attached SCSI Serial ATA Serial ATA II Fire Wire (IEEE 1394a) Fire Wire (IEEE 1394b) USB 1.1: low speed USB 1.1: full speed USB 2.0: high speed Fibre Channel
max. Übertragungsrate Mbyte/s Mbit/s
Leitungsart
max. Reichweite
320 133
Kupfer Kupfer
12 m 0, 45 m
300 150 300 50 100 0,18 1,5 60 400
3000 1500 3000 400 800 1,5 12 480 4000
Kupfer Kupfer Kupfer Kupfer Kupfer/Glasfaser Kupfer Kupfer Kupfer Kupfer Glasfaser Kupfer oder Glasfaser
6m 1m 1m 4, 5 m 100 m 3m 4, 5 m 20 m 50 m 10 km 17 m oder 10 km
InfiniBand (×4) InfiniBand (×12, DDR)
1000 6000
10 000 60 000
an den SAS-Controller erfolgt punkt-zu-punkt; mittels eines sog. Fan-out-Expander sind jedoch mehrere Geräte anschließbar. Überbrückt werden bis zu 6 m, übertragen wird vollduplex über zwei differenzielle Leitungspaare. Die SCSI-Kommandostruktur ist beibehalten. Aufgrund gleicher Kabel und Stecker wie bei SATA (siehe unten) und da der SAS-Controller das SATA-Protokoll beherrscht, können an ihm auch SATA-Geräte betrieben werden. – Seit Jahren gibt es bereits andere serielle Realisierungen des SCSIKommandosatzes: FireWire und Fibre Channel (siehe unten) sowie Serial Storage Architecture. IDE/ATA. IDE (Integrated Drive Electronics), auch
als ATA (AT Attachment) bezeichnet, ist eine 16 Bit parallele Schnittstelle (Punkt-zu-Punkt-Verbindung), die ursprünglich für den Anschluss von bis zu zwei rechnerinternen Festplatten an den ISA-Bus (AT-Bus) mit einer Kabellänge von max. 45 cm ausgelegt wurde. Diese Funktionalität wurde inzwischen hinsichtlich anderer Systembusse (PCI) und einer größeren Vielfalt an Gerätetypen (wie bei SCSI)
erweitert. Des Weiteren wurde die ursprüngliche, programmierte Datenübertragung (programmed I/O, PIO) mit Übertragungsraten von 3 bis 20 Mbyte/s um die DMA-gesteuerte Übertragung mit Double-DataRate und Übertragungsraten von 33 bis 133 Mbyte/s (Ultra ATA/133) ergänzt. Die Gerätesteuerung erfolgt auf hoher Kommandoebene. Die für die Geräteerweiterung erforderlichen Kommandosätze sind in dem ursprünglichen ATA-Kommandoformat „verpackt“, weshalb man auch von ATAPI-Schnittstelle spricht (ATA Package Interface). – IDE wird vorwiegend bei PCs, verstärkt aber auch bei Servern eingesetzt. IDEFestplatten sind preiswerter als SCSI-Festplatten, mit dem Nachteil geringerer Zugriffsraten, Speicherkapazitäten und Zuverlässigkeit. Serial ATA (SATA). Serial ATA ist der serielle
Nachfolger von IDE/ATA und mit diesem softwarekompatibel. Die Übertragungsrate beträgt bei SATA 1, 5 Gbit/s, was bei 8b/10b-Codierung 1, 2 Gbit/s netto, d. h. 150 Mbyte/s bedeutet. In der Version SATA II wird bei doppelter Frequenz mit 3 Gbit/s
J87
J88
J Technische Informatik / Digitale Systeme
übertragen, geplant ist SATA III mit 6 Gbit/s. Die Verbindung arbeitet punkt-zu-punkt (jetzt mit nur noch einem einzigen Gerät), mit je einem differenziellen Leitungspaar pro Richtung und über eine Entfernung von bis zu 1 m. Die Übertragung erfolgt halbduplex für Daten und vollduplex für die Synchronisation. FireWire ist ein serieller Bus mit Strangoder Sternstruktur, an dem bis zu 64 Geräte mit einem maximalen Geräteabstand von 4, 5 m (Twisted-PairKabel) betrieben werden können. Übertragen wird mit 400 Mbit/s (IEEE 1394a) und 800 Mbit/s (IEEE 1394b), geplant sind 1600 und 3200 Mbit/s. Konzipiert wurde er für Multimedia-Anwendungen im Konsumbereich und sieht dafür u. a. die isochrone Datenübertragung vor, d. h., er garantiert die Übertragung innerhalb eines bestimmten Zeitrahmens, wie dies für Audio- und Video-Übertragungen erforderlich ist. Geräte am Bus können dabei direkt miteinander kommunizieren, ohne den Rechner über den HostAdapter (Bild 7-1b) zu beanspruchen (peer-to-peer). Darüber hinaus wird FireWire für den Anschluss prozessorexterner Geräte, z. B. Festplatten, eingesetzt. – FireWire steht in Konkurrenz zu USB.
FireWire.
Der Universal Serial Bus (USB) ist ein serieller Bus und wird wie FireWire für Multimedia-Anwendungen, insbesondere aber als Gerätebus bei PCs zur Versorgung langsamer Geräte, wie Tastatur und Maus, und schneller Geräte, wie externe Festplatten, Scanner usw., eingesetzt. Es gibt ihn derzeit mit drei verschiedenen Übertragungsraten mit Abwärtskompatibilität: USB 1.1 mit 1, 5 Mbit/s (low speed) und 12 Mbit/s (full speed), USB 2.0 mit 480 Mbit/s (high speed). Er hat eine Stern-StrangStruktur mit Hubs als Sternverteiler, von denen jeweils mehrere Punkt-zu-Punkt-Verbindungen ausgehen. Die Übertragung erfolgt grundsätzlich asynchron, Multimedia-Anwendungen werden durch die isochrone Übertragung unterstützt. Die Übertragungen laufen immer über den Host-Adapter (Bild 7-1b), d. h. über den Rechner.
Universal Serial Bus.
gungsraten von bis zu 4 Gbit/s, bei Entfernungen von bis zu 50 m (Kupferleitungen) und 10 km (Lichtwellenleiter). Aufgrund der 8b/10b-Codierung der Daten resultiert daraus eine Nettoübertragungsrate von 400 Mbyte/s pro Richtung. Eingesetzt wird Fibre Channel in drei unterschiedlichen Verbindungsformen: (1.) „Point-to-Point-Topology“. Hier wird nur ein einziges Gerät mit einem Rechner verbunden. (2.) „Arbitrated Loop Topology“. Hier werden in der ursprünglichen Ausführung bis zu 126 Geräte und Rechner punkt-zu-punkt in einer Ringstruktur miteinander verbunden (oft als Doppelring ausgelegt, Dual Loop). Heute wird anstelle des Rings bevorzugt eine Sternstruktur verwendet, in der ein Hub als zentraler Vermittler fungiert. Der Arbitrated Loop ist eine der seriellen SCSI-Varianten. (3.) „Fabric Topology“. Hier können sehr viele Rechner und Geräte (bis zu 16 Millionen adressierbar) in großen, netzförmigen Systemen miteinander verbunden werden. Dies wird insbesondere für die Realisierung von Speichernetzen (storage area networks, SANs) genutzt, bei denen die Server lokaler Netze mit ihren Speichereinheiten, sog. RAIDs (redundand arrays of independent/inexpensive disks), zu einem eigenen Netz zusammengefasst werden, um unabhängig vom lokalen Netz auf Dateien schnell und wahlfrei zugreifen zu können. Die Netzstruktur ist hier üblicherweise eine sog. Switched Fabric (Schaltgewebe), bei der mittels mehrerer Switches Mehrwegeverbindungen zwischen allen Netzteilnehmern herstellbar sind (any-to-any network). InfiniBand, zunächst als PCI-BusNachfolger vorgesehen, hat seinen Einsatzbereich bei der Vernetzung von Servern und Hintergrundspeichern (Storage Area Networks). Diese findet in Form der Switched Fabric statt (siehe dazu Fibre Channel). Übertragen wird vollduplex über zwei differenzielle Leitungspaare (1×-Link) mit 2,5 GHz-Takt und mit 8b/10b-Codierung, d. h. mit 2×2, 5 Gbit/s brutto bzw. 2 ×250 Mbyte/s netto. Erhöht wird die Übertragungsrate durch den Parallelbetrieb von 4 oder 12 solcher Verbindungen (4×-, 12×-Link), ggf. ergänzt um die Double-Data-Rate- oder Quad-Data-Rate-Technik.
InfiniBand.
Fibre Channel. Der Fibre Channel (FC, ANSI-
Feldbusse. Kommunikationssysteme in der Prozess-,
Standard) ist eine serielle Verbindung mit Übertra-
Automatisierungs- und Steuerungstechnik bestehen
7 Rechnersysteme
meist aus hierarchisch strukturierten Netzen, basierend auf ggf. unterschiedlichen Feldbussen, die über Gateways und Bridges (siehe 7.5.3) miteinander verbunden sind. Von den in lokalen Netzen (LANs) gebräuchlichen Techniken unterscheiden sich Feldbusse jedoch durch geringere Installationskosten, geringere Komplexität der Protokolle und ihre „Echtzeitfähigkeit“. Sie haben außerdem eine hohe Zuverlässigkeit, hohe Fehlertoleranz, geringe Störanfälligkeit und sind ggf. multimasterfähig. Die meisten dieser seriellen Busse benutzen auf der untersten, der physikalischen Ebene die Schnittstellennorm RS-485 (Electronic Industries Association, EIA) und erreichen, abhängig von der Streckenlänge, Übertragungsraten von 100 kbit/s (bis zu 1000 m) bis zu 1 Mbit/s (unter 50 m). Zu den bekanntesten der gut 50 Feldbusse zählen: Profi-Bus, FIP-Bus, CAN-Bus, Bitbus und Interbus S. Der sog. IEC-Bus (General Purpose Interface Bus, GPIB, IEC 625, IEEE 488) ist ein 8 Bit paralleler Bus für den Datenaustausch zwischen einem Rechnersystem und Mess- und Anzeigegeräten, z. B. in Laborumgebungen (Messbus). Seine Länge ist auf 20 m beschränkt, die maximale Übertragungsrate beträgt 1 Mbyte/s. Die bis zu 15 möglichen Busteilnehmer haben Senderfunktion (talker, z. B. Messgeräte) oder Empfängerfunktion (listener, z. B. Signalgeneratoren, Drucker) oder beides (z. B. Messgeräte mit einstellbaren Messbereichen). Verwaltet wird der Bus von einer Steuereinheit (Rechner), die gleichzeitig auch Sender und Empfänger sein kann.
7.2 Speicherorganisation Speicher sind wesentliche Bestandteile von Rechnern und werden für die heutzutage großen Programmpakete und Datenmengen mit entsprechend großen Kapazitäten benötigt. Da Speicherzugriffe den Durchsatz und damit die Leistungsfähigkeit eines Rechners stark beeinflussen, müssen Speicher kurze Zugriffszeiten haben. Beide Forderungen, große Kapazitäten und kurze Zugriffszeiten, führen zu hohen Kosten bzw. sind technisch nicht herstellbar. Einen Kompromiss zwischen niedrigen Kosten und hoher Leistungsfähigkeit stellt eine hierarchische Speicherstruktur dar mit Speichern, die im einen Extrem große Kapazitäten mit langen Zugriffszeiten und im andern Ex-
trem kurze Zugriffszeiten bei geringen Kapazitäten aufweisen (Bild 7-7). Zentraler Speicher einer solchen Hierarchie ist der Hauptspeicher (Arbeitsspeicher, Primärspeicher; ein Halbleiterspeicher) als der vom Prozessor direkt adressierbare Speicher, i. Allg. ergänzt um eine Speicherverwaltungseinheit. Dieser wird versorgt von Hintergrundspeichern (Sekundärspeichern) mit großen Kapazitäten (z. B. magnetischen und optischen Plattenspeichern, langsameren Halbleiterspeichern, Magnetbandspeichern). Zur Beschleunigung des Prozessorzugriffs auf den Hauptspeicher werden zwischen Prozessor und Hauptspeicher ein oder mehrere kleinere Pufferspeicher, sog. Caches, geschaltet. Als schnelle Halbleiterspeicher erlauben sie die Anpassung an die vom Prozessor vorgegebene Zugriffszeit. Schließlich gibt es in dieser Hierarchie den Registerspeicher (Registerblock) des Prozessors und ggf. einen Befehlspuffer (instruction queue/pipe) mit Zugriffszeiten gleich dem Verarbeitungstakt des Prozessors (siehe auch 5.4.1). Der Hauptspeicher, die Caches und die Prozessorregister sind als Halbleiterspeicher sog. flüchtige Speicher, d. h., ihr Inhalt geht beim Abschalten der Versorgungsspannung verloren. Hintergrundspeicher mit magnetischer oder optischer Speicherung sind hingegen nichtflüchtig. – Zur Speicherorganisation siehe z. B. auch [2]. 7.2.1 Hauptspeicher
Der Hauptspeicher realisiert einen Speicherraum mit fortlaufend nummerierten Speicherzellen und direktem Zugriff auf diese (man spricht von wahlfreiem Zugriff). Die Kapazitäten der Hauptspeicher von PCs liegen bei 256 Mbyte bis zu mehreren Gbyte. Eingesetzt werden derzeit Speicherbausteine (dynamische
Bild 7-7. Speicherhierarchie
J89
J90
J Technische Informatik / Digitale Systeme
RAMs: DRAMs) mit Kapazitäten von 64 Mbit bis zu 1 Gbit und mit Zugriffsbreiten von z. B. 4, 8 oder 16 Bit. Mehrere solcher Bausteine (z. B. acht oder 16) werden zu steckbaren Modulen, sog. DIMMs (dual in-line memory modules) mit 64-Bit-Zugriffsbreite zusammengefasst. Im Hinblick auf den Datentransfer mit Caches werden DRAM-Bausteine verwendet, die den 4-Wort- und 8-Wort-Blockbuszyklus von CacheControllern unterstützen, indem sie Folgezugriffe mit gegenüber dem Erstzugriff (lead-off cycle) verkürzten Zugriffszeiten erlauben (Bild 7-6). Gebräuchlich sind hier synchrone, d. h. getaktete DRAMs (SDRAMs), anfänglich mit Single-DataRate-Datenzugriff. Seit der zweiten Generation arbeiten sie mit Double-Data-Rate, d. h. mit zwei Folgezugriffen pro Takt (DDR-SDRAM), bei Taktfrequenzen von z. B. 133 und 200 MHz (DDR266, DDR400). In der dritten Generation (DDR2SDRAM) weisen sie eine erneute Verdoppelung der Übertragungsrate auf, und zwar durch Verdoppelung der Übertragungstaktfrequenz gegenüber der chipinternen Taktfrequenz (z. B. DDR2-800 mit 400 MHz Übertragungsfrequenz und Double-DataRate). Zur Aufrechterhaltung des Datenflusses wird bei den DDR-SDRAMs mit jedem Interntakt auf zwei Daten, bei DDR2-SDRAMs auf vier Daten gleichzeitig zugegriffen. Die Folgegeneration der DDR3-SDRAMs arbeitet mit 8-fachem Internzugriff, wodurch die Übertragungstaktfrequenz erneut verdoppelt werden kann. – Schnittstelle zu den DIMMs ist der DRAM-Controller, der die Speicherzugriffe durch Kommandos steuert. Verbunden ist er mit ihnen entweder (herkömmlich) über einen oder zwei busartige 64-Bit-Speicherkanäle oder (künftig) punkt-zu-punkt mit serieller Übertragungstechnik (10 Bit breit schreiben, 14 Bit breit lesen) und ggf. höherer Kanalanzahl. Die Speicherung eines Bits erfolgt bei DRAMs mittels der Ladung eines Kondensators, mit dem Vorteil eines geringen Chipflächenbedarfs der Speicherzelle und dem Nachteil des Zerstörens der Speicherinformation beim Auslesen von Zellen wie auch durch Leckströme. Der Speicherinhalt muss deshalb lokal bei jedem Auslesen und zusätzlich global, d. h. der gesamte Bausteininhalt, in einem vorgegebenen Zeitintervall „aufgefrischt“ werden (refresh). Die Steuerung hierfür übernimmt der DRAM-Controller.
Bild 7-8. Rechnerstruktur mit Speicherverwaltungseinheit
(MMU)
7.2.2 Speicherverwaltungseinheiten
Bei Rechnersystemen mit Mehrprogrammbetrieb (siehe 8) werden Programme und ihre Daten (Prozesse) mit Unterbrechungen ausgeführt und dazu ggf. zwischenzeitlich aus dem Hauptspeicher entfernt und bei Bedarf wieder geladen. Eine dabei evtl. notwendige Änderung des Ladeorts erfordert, dass Programme und Daten im Hauptspeicher verschiebbar (relocatable) sein müssen. Diese Verschiebbarkeit wird in flexibler Weise durch eine Speicherverwaltungseinheit (memory management unit, MMU) erreicht, die als Bindeglied zwischen dem Adressbus des Prozessors und dem Adresseingang des Hauptspeichers wirkt (Bild 7-8; zu anderen Techniken siehe 8.3.3). Sie setzt die vom Prozessor während der Programmausführung erzeugten sog. virtuellen, logischen Programmadressen in reale, physische Speicheradressen um und führt dabei zusätzlich eine Zugriffsüberwachung durch. Die hierfür erforderliche Information wird vom Betriebssystem in sog. Umsetztabellen bereitgestellt. Um deren Umfang gering zu halten, bezieht man die Adressumsetzung und den Speicherschutz nicht auf einzelne Adressen, sondern auf zusammenhängende Adressbereiche, und zwar auf Segmente oder Seiten. Segmente und Seiten. Bei
einer Speicherverwaltung mittels Segmenten werden die Bereiche so groß gewählt, dass sie logische Einheiten, wie Programmcode, Daten oder Stack, vollständig umfassen; sie haben dementsprechend variable Größe. Bei einer Speicherverwaltung mittels Seiten (pages) wird eine logische Einheit in Bereiche einheitlicher Länge unterteilt. Für den Zugriffsschutz (Speicherschutz) werden den Segmenten bzw. Seiten
7 Rechnersysteme
Schutzattribute zugeordnet, die von der MMU bei der Adressumsetzung unter Bezug auf die vom Prozessor erzeugten Statussignale ausgewertet werden. Adressumsetzinformation, Schutzattribute und zusätzliche Statusangaben eines Bereichs bilden dessen Deskriptor. Deskriptoren werden wiederum in Umsetztabellen zusammengefasst. Die folgenden Darlegungen beziehen sich auf jene Aspekte der Speicherverwaltung, die mit der Hardware von MMUs zusammenhängen. Zu den mehr softwaretechnischen Aspekten sei auf 8.3.3 verwiesen. MMU mit Segmentverwaltung (segmentation).
Das Bilden von Segmenten erfordert eine Strukturierung des virtuellen wie auch des realen Adressraums und somit des Hauptspeichers. Im Virtuellen wird dazu (als eine Möglichkeit) das virtuelle Adresswort unterteilt: in eine Segmentnummer als Kennung eines Segments, bestimmt durch die n höchstwertigen Adressbits (z. B. n = 8), und in eine Bytenummer als Abstand zum Segmentanfang (offset), festgelegt durch die verbleibenden m niederwertigen Adressbits (z. B. m = 24 bei 32-Bit-Adressen). Das heißt, der virtuelle Adressraum wird in Bereiche der Größe 2m (hier 16 Mbyte) eingeteilt, die die maximal mögliche Segmentgröße haben. Er wird daher bei kleineren Segmenten nur lückenhaft genutzt, was jedoch ohne Nachteil ist, da die eigentliche Speicherung auf einem Hintergrundspeicher erfolgt und dort Lücken durch eine weitere Adressumsetzung durch das Betriebssystem vermieden werden. Bei der Strukturierung des realen Adressraums ist man allerdings auf eine möglichst gute Hauptspeicherausnutzung angewiesen. Ein lückenloses Speichern von Segmenten erreicht man dadurch, dass man der virtuellen Segmentnummer eine Byteadresse (hier 32-Bit-Adresse) als Segmentbasisadresse zuordnet, zu der bei der Adressumsetzung die virtuelle Bytenummer addiert wird. Segmente können dadurch an jeder beliebigen Byteadresse beginnen. Eine solche Adressumsetzung zeigt Bild 7-9. Die Umsetztabelle einschließlich der Schutz- und Statusangaben, die sog. Segmenttabelle, hat hier den geringen Umfang von bis zu 256 Deskriptoren (n = 8) und wird deshalb insgesamt in einem „schnellen“ Registerspeicher der MMU gehalten. Bei einer anderen Möglichkeit der Strukturierung im Virtuellen wird das Adresswort um die Segmentnum-
mer erweitert. Hierfür hat die MMU mehrere Segmentnummerregister, die durch den Zugriffsstatus des Prozessors, nämlich Code- (Programm-), Daten- oder Stack-Zugriff angewählt werden. Der Vorteil gegenüber einer MMU mit Unterteilung des Adressworts ist, dass Segmente in ihrer Größe nicht beschränkt sind und in größerer Anzahl verwaltet werden können (abhängig von der Breite der Segmentnummerregister). Die dementsprechend größere Segmenttabelle wird nicht mehr in der MMU, sondern im Hauptspeicher untergebracht. Um dennoch schnell auf die aktuellen Deskriptoren zugreifen zu können, werden diese in Pufferregister der MMU, die den Segmentnummerregistern zugeordnet sind, kopiert. Nachteilig an der Segmentverwaltung ist, dass der beim Mehrprogrammbetrieb erforderliche Austausch von Speicherinhalten (swapping) abhängig von der Segmentgröße sehr zeitaufwändig sein kann und dass ein zu ladendes Segment immer einen zusammenhängenden Speicherbereich benötigt, somit freie Speicherbereiche ggf. nicht genutzt werden können. Dieser Nachteil tritt bei der Seitenverwaltung nicht auf. Bei der Seitenverwaltung wird der virtuelle Adressraum in Seiten (pages) als relativ kleine Bereiche einheitlicher Größe (512 Byte bis 8 Kbyte) unterteilt, die im Speicher auf Seitenrahmen (page frames) gleicher Größe abgebildet werden (Bild 7-10a). Dazu werden bei der Adress-
MMU mit Seitenverwaltung (paging).
Bild 7-9. Adressumsetzung für Segmente, deren Segment-
nummern aus einem Teil der virtuellen Adresse gebildet werden. Virtueller Adressraum von 4 Gbyte (32-BitAdressen), aufgeteilt in 256 Segmente mit jeweils bis zu 16 Mbyte
J91
J92
J Technische Informatik / Digitale Systeme
Die Seitentabelle wird wegen ihres großen Umfangs (im obigen Beispiel bis zu 220 Seitendeskriptoren) in Teilen im Hauptspeicher und auf dem Hintergrundspeicher gehalten, wobei sie u. U. selbst der Seitenverwaltung unterworfen wird. Um einen schnellen Deskriptorzugriff zu ermöglichen, werden die aktuellen Seitendeskriptoren in einen speziellen Cache der MMU, den sog. Translation-look-aside-Buffer (TLB) kopiert. In einer MMU-Variante lässt sich die Seitentabelle als sog. invertierte Seitentabelle auf die Größenordnung der Anzahl an Seitenrahmen reduzieren, indem sie mittels Hash-Adressierung verwaltet wird (Umcodieren der Seitennummern; siehe auch 10.7). mit zweistufiger Seitenverwaltung. Um Segmente einerseits als logische Einheiten verwalten und andererseits in kleineren Einheiten speichern zu können, kombiniert man die Verwaltung von logischen Einheiten (Segmenten) mit der Seitenverwaltung und erhält so eine zweistufige Adressabbildung, wie Bild 7-11 für die Segmentverwaltung durch Unterteilung des Adressworts zeigt. Da hier die Segmente als Zusammenfassungen von Seiten gebildet werden, spricht man von zweistufiger Seitenverwaltung. Ausgangspunkt der Adressabbildung ist die Segmenttabelle (das Seitentabellenverzeichnis), die für jedes Segment einen Deskriptor mit den Schutzattributen, dem Status und einem Zeiger auf eine Seitentabelle enthält. Die Seitentabelle wiederum enthält für jede Seite des Segments einen Deskriptor mit der Rahmennummer, dem Status (z. B. Seite geladen) und den seitenspezifischen Schutzattributen. Weicht ein Schutzattribut einer Seite von dem des Segments ab, so gilt z. B. das strengere Attribut. Diese Technik erlaubt es u. a., Segmente verschiedener Benutzer sich in Teilen (Seiten) überlappen zu lassen und den Benutzern unterschiedliche Zugriffsrechte für den gemeinsamen Speicherbereich (shared memory) einzuräumen. – Als Erweiterung dieser Technik gibt es MMUs mit mehr als zwei Tabellenebenen, z. B. mit dreistufiger Adressumsetzung.
MMU
Bild 7-10. Seitenverwaltung. a Abbildung der Seite 2 auf den Speicherrahmen 0 und der Seiten 1 und 4 auf den Speicherrahmen 2 (shared memory, siehe auch im Folgenden: MMU mit zweistufiger Seitenverwaltung); b Adressumsetzung bei einer Seitengröße von 4 Kbyte
umsetzung die n höchstwertigen Adressbits der virtuellen Adresse (Seitennummer) durch n Bits der realen Adresse (Rahmennummer) ersetzt (z. B. n = 20). Die verbleibenden m Bits der virtuellen Adresse (Bytenummer, Relativadresse der Seite) werden als Relativadresse des Rahmens unverändert übernommen (z. B. m = 12 bei 32-Bit-Adressen, Bild 7-10b). Der virtuelle Adressraum wird somit in Seiten unterteilt, die in beliebige freie, nicht notwendigerweise zusammenhängende Seitenrahmen geladen werden können und so eine bessere Nutzung des Speichers erlauben. Diese Technik ermöglicht es auch, nur die aktuellen Seiten eines Prozesses (working set) im Speicher zu halten. Das Betriebssystem muss dann jedoch so ausgelegt sein, dass es bei einem Zugriffsversuch auf eine nicht geladene Seite die Zugriffsoperation unterbricht, den Prozess blockiert, die fehlende Seite in den Speicher lädt und danach die Zugriffsoperation und damit den Prozess wieder aufnimmt (demand paging). Da bei diesem Vorgehen der verfügbare Hauptspeicherplatz geringer sein kann als der insgesamt benötigte, spricht man auch von virtuellem Speicher.
7.2.3 Caches Systemstrukturen. Ein Cache ist ein schneller
Speicher, der in der Speicherhierarchie als Puffer
7 Rechnersysteme
Bild 7-11. Zweistufige Adressumsetzung für Segment- und Seitenverwaltung. Virtueller Adressraum von 4 Gbyte (32-Bit-Adressen), aufgeteilt in 1024 Segmente mit jeweils bis zu 1024 Seiten von je 4 Kbyte. Von 1024 möglichen Seitentabellen ist nur eine dargestellt
Bild 7-12. Struktur einer Prozessor-Cache-Hauptspeicher-
Hierarchie. Schnittstelle 1: Off-chip-Cache, Schnittstelle 2: On-chip-Cache
zwischen dem Hauptspeicher und dem Prozessor angeordnet ist (Bild 7-12). Er ist üblicherweise in den Prozessorbaustein integriert (on-chip cache) und meist in zwei Caches für Befehle und Daten getrennt (split caches); derzeit mit einer Gesamtkapazität von bis zu 64 Kbyte, aber auch mehr. Ferner gibt es prozessorexterne Caches (off-chip caches), üblicherweise mit gemeinsamer Speicherung von Befehlen und Daten (unified cache) und mit einer Kapazität von 1 Mbyte und mehr. Bei der Kombination von On-chip-Cache und Off-chip-Cache wird der erste als First-level- und der zweite als Second-level-Cache bezeichnet (L1- bzw. L2-Cache). Häufig ist auch der L2-Cache in den Prozessorbaustein integriert, dann gibt es ggf. einen Off-chip-L3-Cache. Ein On-chip-Cache hat bei begrenzter räumlicher Ausdehnung auf dem Halbleitersubstrat, d. h. bei begrenzter Speicherkapazität, üblicherweise dieselbe kurze Zugriffszeit wie die Prozessorregister, d. h. einen Taktschritt mit der hohen prozessorinternen Taktfrequenz. Bei einen Off-chip-Cache hingegen
kommt es darauf an, wie er mit dem Prozessor verbunden ist. Ist er an die Prozessorbusschnittstelle angeschlossen (frontside cache, Bild 7-1b), so kommt die sehr viel niedrigere Taktfrequenz des Prozessorbusses zur Wirkung. Hat er einen eigenen Prozessoranschluss, der dann als Punkt-zu-PunktVerbindung ausgelegt ist (backside cache, Bild 7-1c), kann er mit z. B. halber oder auch ungeteilter Internfrequenz des Prozessors getaktet sein, benötigt ggf. aufgrund seiner Größe aber mehr als einen Takt pro Zugriff. Grundsätzlich erfolgt der Datenaustausch mit dem On-chip-Cache durch Blockbuszyklen (im günstigsten Fall als 2-1-1-1-Bursts, Bild 7-6b). Off-chip-Caches werden mit statischen RAMs (SRAMs) mit Zugriffsbreiten von 16 oder 32 Bit aufgebaut. Wie bei den DRAMs gibt es auch hier getaktete Varianten mit Unterstützung des Blockbuszyklus. Das DDR-SRAM überträgt mit Double-Data-Rate mit Taktfrequenzen von derzeit bis zu 333 MHz. Das DDR2-SRAM hat ihm gegenüber die doppelte Übertragungsrate durch Verdoppelung der Übertragungs- gegenüber der Interntaktfrequenz. Anders als bei DRAMs erfolgt die Bitspeicherung als Zustand einer Transistorschaltung (Flipflop, siehe 4.1.1), was sie im Zugriff schneller als DRAMs macht. Ihr Nachteil ist der höhere Chipflächenbedarf, d. h. eine geringere Speicherkapazität pro Baustein von derzeit bis zu 32 Mbit. Laden und Aktualisieren. Da ein Cache eine we-
sentlich geringere Kapazität als der Hauptspeicher hat, sind besondere Techniken für das Laden und Aktualisieren sowie für das Adressieren seiner Inhalte erforderlich. Bei Lesezugriffen des Prozessors wird zu-
J93
J94
J Technische Informatik / Digitale Systeme
nächst geprüft, ob sich das zur Hauptspeicheradresse gehörende Datum im Cache befindet. Bei einem Treffer (cache hit) wird es von dort gelesen; bei einem Fehlzugriff (cache miss) wird es aus dem Hauptspeicher gelesen und dabei gleichzeitig in den Cache geladen. Dieses Laden umfasst nicht nur das eigentlich adressierte Datum, sondern einen Block von 16, 32 oder 64 Bytes (data prefetch) entsprechend 4 oder 8 Übertragungen auf einem 32- oder 64-Bit-Datenbus (Blockbuszyklus, Bild 7-6b). Wird mit jedem CacheZugriff vorsorglich stets auch ein Speicherzugriff initiiert, der bei einem Cache-Hit abgebrochen wird, so spricht man von einem Look-aside-Cache (Zeitersparnis bei Einprozessorsystemen; veraltete Technik). Erfolgt ein Speicherzugriff stets erst mit Eintreten eines Cache-Miss, wie heute üblich, so spricht man von einem Look-through-Cache (geringe Busbelastung in Mehrmastersystemen, insbesondere in speichergekoppelten Mehrprozessorsystemen, siehe 7.4.3). Schreibzugriffe auf den Cache gibt es in der Regel nur auf Daten, nicht auf Befehle. Sie erfordern immer auch das Aktualisieren des Hauptspeichers. Beim Write-through-Verfahren erfolgt dies bei jedem Schreibzugriff, wobei der Cache für Schreibzugriffe seine Vorteile einbüßt. Teilweise Abhilfe schafft hier ein sog. Write-Buffer, ein Register, in dem das Datum für den Speicherschreibvorgang zwischengespeichert wird, damit der Cache sofort wieder für Prozessorzugriffe frei wird. Beim Copy-back-Verfahren hingegen erfolgt das Rückschreiben erst dann, wenn ein Block im Cache überschrieben werden muss. Dieses Verfahren ist aufwändiger in der Verwaltung, gewährt jedoch den Zugriffsvorteil auch für einen Großteil der Schreibzugriffe. Auch hier wird für das Schreiben in den Hauptspeicher ein Write-Buffer verwendet, jedoch mit der Kapazität eines Cache-Blocks. Eine besonders hohe Trefferquote (hit rate) bei Cache-Zugriffen erhält man bei wiederholtem Zugriff, z. B. bei Befehlszugriffen in Programmschleifen, die sich vollständig im Cache befinden sowie bei Operationen, die sich auf eine begrenzte Anzahl von Operanden beziehen. Trefferquoten zwischen 40 und 95% werden genannt. Adressierung. Die Adressierung eines Cache er-
folgt entweder durch virtuelle Adressen mit dem
Vorteil einer zur MMU parallelen, d. h. unverzögerten Adressauswertung oder, heute vorwiegend, durch reale Adressen mit dem Vorteil, dass die CacheSteuerung – auch bei Hauptspeicherzugriffen anderer Master – immer in der Lage ist, Hauptspeicher und Cache gemeinsam zu aktualisieren. Bei virtueller Adressierung muss u. U. nach dem Schreiben in den Hauptspeicher, z. B. durch einen DMA-Controller, der gesamte Cache-Inhalt als ungültig, da nicht aktualisiert, verworfen werden. Grundsätzlich ist bei beiden Adressierungsarten eine Adressumsetzung von einem großen Adressraum auf den kleineren des Cache erforderlich, wozu sich assoziative Speicherstrukturen anbieten. Bei einem vollassoziativen Cache wird zusätzlich zum Datenblock dessen Blockadresse als Blockkennung (tag) gespeichert, und das Auffinden eines Datums erfolgt durch parallelen Vergleich des Blockadressteils der anliegenden Adresse mit allen gespeicherten Blockkennungen. Der Vorteil ist hierbei, dass ein Block an beliebiger Position im Cache stehen kann, dafür ist allerdings der Hardwareaufwand mit je einem Vergleicher pro Cache-Block sehr hoch. Weniger Vergleicher erfordern teilassoziative Caches, bei denen jeweils zwei, vier, sechs oder mehr Blöcke im Cache zu einem Satz (set) zusammengefasst werden und nur ein Teil der Blockadresse als satzbezogene Blockkennung gespeichert wird. Der andere Teil der Blockadresse wird als Index bezeichnet und zur direkten Anwahl der Sätze benutzt (decodiert). Nachteilig ist, dass die Positionen der Speicherblöcke im Cache jetzt nicht mehr beliebig sind. Bei nur einem Block pro Satz, wo jede Blockadresse über ihren Indexteil auf eine bestimmte Position abgebildet wird, dafür aber auch nur ein einziger Vergleicher benötigt wird, spricht man von einem einfach assoziativen oder direkt zuordnenden Cache (direct mapped cache), hingegen bei mehreren (n) Blöcken pro Satz und damit n möglichen Positionen für jeden Speicherblock (bei n Vergleichern) von einem n-fach assoziativen Cache (n-way set associative cache). Bild 7-13 zeigt einen zweifach assoziativen Cache mit 1024 Sätzen zu je zwei Blöcken mit je 16 Bytes (32 Kbyte). Der mittlere Teil der am Cache anliegenden Hauptspeicheradresse (Index) adressiert die Sätze in herkömmlicher Weise und wählt jeweils zwei Da-
7 Rechnersysteme
tenblöcke (Cache-Zeilen) mit ihren Tag-Feldern aus. Der höherwertige Adressteil wird mit den Einträgen der beiden Tag-Felder verglichen. Bei Übereinstimmung mit einem der Einträge wird der niederwertige Adressteil (Offset) zur Byteadressierung im Datenblock herangezogen. – Zwei Statusbits für jeden Block, Valid und Dirty (im Bild nicht dargestellt), zeigen an, ob ein Block insgesamt gültig ist bzw. ob er seit dem Laden verändert wurde. Vom Valid-Bit hängt die endgültige Trefferaussage (cache hit), vom DirtyBit das Rückschreiben beim Copy-back-Verfahren ab. – Leistungswerte von Caches bezüglich Assoziativität und Dimensionierung finden sich in [4]. Vollassoziative Caches und teilassoziative Caches mit wenigstens 2 Blöcken pro Satz benötigen für das Laden von Blöcken eine in Hardware realisierte Ersetzungsstrategie, die bei vollem Cache bzw. Satz vorgibt, welcher Eintrag überschrieben werden soll. Das kann z. B. der am längsten nicht mehr adressierte (least recently used) oder auch ein zufällig ausgewählter Eintrag sein (random). 7.2.4 Hintergrundspeicher
Hintergrundspeicher dienen zur Speicherung großer Datenmengen sowohl zur Bereithaltung für die aktuelle Verarbeitung als auch zu deren Sicherung und Archivierung. Die wichtigsten Datenträger sind Magnetplatten, optische und magnetooptische Platten sowie Magnetbänder (Streamer-Kassetten). Kennzeichnend für diese Datenspeicher sind ihre (verglichen mit Hauptspeichern) großen Kapazitäten bei wesentlich geringeren Kosten pro Bit. Nachteilig sind jedoch die durch die mechanische Wirkungsweise bedingten langen Zugriffszeiten. Diese liegen um Größenordnungen über denen von Halbleiterspeichern und erst
Bild 7-13. Adressierung eines zweifach assoziativen Cache mit 1024 Sätzen
recht über den Taktzeiten von Prozessoren. Die Datenspeicherung erfolgt stets blockweise mit sequentiellem Zugriff; der beim Hauptspeicher übliche direkte Zugriff auf Einzeldaten ist nicht möglich. – Die Einbaugröße eines solchen Speichers wird durch den sog. Formfaktor bestimmt. Dieser basiert auf kreisscheibenförmigen Speichermedien und entspricht den Abmessungen ihrer Hüllen, z. B. 3,5 oder 5,25 Zoll. – Zu Hintergrundspeichern siehe z. B. [12]. Bei Magnetplattenspeichern wird die Information bitseriell in konzentrischen Spuren (tracks) einer rotierenden, auf einer oder beiden Oberflächen magnetisierbaren kreisförmigen Scheibe (disk) gespeichert. Der Zugriff auf die Spuren erfolgt mit einem auf einen radial bewegbaren Arm montierten Schreib-/Lesekopf. Die Spuren sind in Sektoren einheitlicher Größe eingeteilt, wovon jeder aus einem Datenfeld (z. B. 256 oder 512 Datenbytes) und einem vorangehenden Erkennungsfeld (identifier field, ID-Feld) mit der für den Zugriff benötigten Information besteht: Spurnummer, Oberflächenbezeichnung, Sektornummer und Datenfeldlänge. Ergänzt werden beide Felder durch vorangestellte Kennungsbytes (address marks) und angehängte Blocksicherungsbytes (CRC-Bytes, siehe 6.2). Der Zugriff auf einen Magnetplattenspeicher erfordert dementsprechend zwei Schritte: zunächst die Spur- und Sektoranwahl und dann das Schreiben bzw. Lesen der Bytes des Sektors. – Vor der ersten Benutzung muss eine Magnetplatte formatiert werden. Dazu wird sie in allen Spuren beschrieben, wobei die Datenfelder mit Platzhalter-Information gefüllt werden. Magnetplattenspeicher existieren in unterschiedlichen Ausführungen. Festplattenspeicher bestehen aus 1, 2 oder 3 übereinander angeordneten starren Magnetscheiben mit Speicherkapazitäten pro Scheibe (bei Nutzung beider Oberflächen) von derzeit bis zu 200 Gbyte (Formfaktor 3,5 Zoll, in PCs) und 100 Gbyte (2,5 Zoll, in Notebooks). Die Scheiben als Speichermedium und das eigentliche Laufwerk bilden dabei eine untrennbare Einheit, was hohe Umdrehungszahlen (derzeit bis zu 15 000 U/min) und damit hohe Zugriffsraten ermöglicht (bis zu 90 Mbyte/s). Der Vorteil mehrerer Scheiben ist, dass nach Positionierung der übereinanderliegenden
Magnetplattenspeicher.
J95
J96
J Technische Informatik / Digitale Systeme
Schreib-/Leseköpfe (Schreib-/Lesekamm) ein ganzer „Zylinder“, d. h. mehrere übereinanderliegende Spuren, erreichbar ist (Bild 7-14). Festplattenspeicher dienen zur ständigen Programm- und Datenbereithaltung für den Hauptspeicher und sind deshalb feste Komponenten von Rechnern mit IDE/ATAoder SCSI-Anschluss (ältere Ausführungen) oder mit SATA- oder SAS-Anschluss (neuere Ausführungen). Sie können aber auch als transportable Speichermedien eingesetzt werden, z. B. als Rechnereinschübe oder als prozessorexterne Geräte mit z. B. SCSI-, FireWire- oder USB-Kabelanschluss. Bei Wechselplattenspeichern ist das Speichermedium eine einzelne, in einer starren Kunststoffhülle untergebrachte, meist biegsame Scheibe/Folie, die als sog. Diskette vom Laufwerk trennbar ist. Beispiele sind die Floppy-Disk, die Super-Disk und die ZipDiskette. Mit Ausnahme der 3,5-Zoll-Floppy-Disk, die ggf. noch zum Versenden kleinerer Dateien (bis 1, 44 Mbyte) benutzt wird, sind sie durch die sog. Flash-Speicher weitgehend vom Markt verdrängt worden, insbesondere durch den USB-Stick (siehe unten). Optische Plattenspeicher. Optische Plattenspeicher
nutzen als Informationsträger eine starre, rotierende Scheibe, die in Durchmesser (12 cm) und Handhabung (Wechselmedium ohne Hülle) der Audio-Compact-Disc (Audio-CD) entspricht. Auch der Zugriff erfolgt wie bei ihr, berührungslos mit Laserlicht. Zu unterscheiden sind im zeitlichen Auftreten und mit zunehmenden Speicherkapazitäten (1.) Speicher mit herkömmlicher CD-Technik,
Bild 7-14. Zugriff auf den Plattenstapel eines Festplatten-
speichers
(2.) die DVD und (3.) die Blu-ray Disc in Konkurrenz zur High Definition DVD, jeweils mit Varianten hinsichtlich Nurlesbarkeit (ROM, Read-Only Memory), Einmalbeschreibbarkeit (R, Recordable) und Wiederbeschreibbarkeit (RW, ReWriteable). Compact Disc (CD). Die CD-ROM ist ein nur lesbares Medium mit Kapazitäten von 650 Mbyte und darüber. Wie bei Magnetplattenspeichern werden die Daten in Sektoren und Spuren abgelegt, jedoch spiralförmig. Die Datendarstellung erfolgt durch Übergänge zwischen der Oberfläche (land) des Mediums und in sie eingeprägte Vertiefungen (pits). Die CDROM dient zur Bereitstellung großer Datenmengen, z. B. von Softwarepaketen, Lexika, Versandkatalogen usw. Die CD-R entspricht im Aufbau der CD-ROM, ist jedoch einmal (ggf. in mehreren Sitzungen) beschreibbar. Dabei werden die Vertiefungen durch den Laserstrahl in eine organische Schicht eingebrannt. Sie hat Kapazitäten zwischen 650 und 900 Mbyte und dient zur Datenarchivierung und auch zur Erstellung von Audio-CDs. Die CD-RW mit 700 Mbyte Speicherkapazität ist wiederholt (ca. 1000-mal) beschreibbar. Gespeichert werden die Daten mittels des Laserstrahls durch unterschiedlich starke Erhitzung der Bitpositionen, wodurch sich die Bitmuster als amorphe (unstrukturierte) bzw. kristalline Oberflächenbereiche realisieren lassen, die den Laserstrahl beim Lesen unterschiedlich gut reflektieren (Phase-ChangeVerfahren). Die CD-RW dient zur Sicherung von Daten, die von Zeit zu Zeit aktualisiert werden, d. h. als sog. Backup-Medium. Die Übertragungsraten dieser Speicher werden als Vielfache von 150 kbyte/s, der Übertragungsrate einer Audio-CD, angegeben (z. B. Lesen einer CD-ROM 52-fach, d. h. 7, 8 Mbyte/s). Digital Versatile Disc (DVD). Die DVD-Speicherung basiert auf der CD-Technik, hat aber eine sehr viel höhere Speicherkapazität von zunächst 4, 7 Gbyte. Diese wird durch geringeren Spurabstand und geringere Pit-Abmessung erreicht. Sie kann durch Verwendung von zwei übereinander liegenden Informationsschichten oder/und durch zusätzliche Nutzung der Rückseite der Scheibe auf 8,5 und 17 Gbyte erhöht werden. Entwickelt wurde die DVD zur Speicherung von
7 Rechnersysteme
Video/Audio-Daten in komprimierter Form, sie wird aber auch allgemein als Datenträger eingesetzt. Bei den einmal- und den wiederbeschreibbaren DVDs hat sich kein einheitlicher Standard durchgesetzt. Zwar gibt es Aufzeichnungsgeräte, die alle vorhandenen Formate beherrschen; aber nicht alle Formate sind mit allen Wiedergabegeräten abspielbar. Die DVD-ROM ist wie die CD-ROM nur lesbar. Sie wird bevorzugt zum Vertrieb von Filmen eingesetzt. Die DVD-R, DVD+R, DVD-RW und DVD+RW sind wie die CD-R bzw. CD-RW nur einmal- bzw. wiederbeschreibbar. Sie werden bevorzugt zur Aufzeichnung von Filmen genutzt und lösen die VHS-Videoaufzeichnung ab. Die Datenraten für die Aufzeichnung und Wiedergabe werden in Vielfachen von 1, 35 Mbyte/s angegeben, derzeit in der Größenordnung 2-, 4- und 8- und 16-fach, abhängig vom Format und von Aufzeichnung/Wiedergabe. – DVD-Geräte übernehmen zusätzlich die Funktion von CD-Geräten und lösen diese ab. Blu-ray Disc (BD), High Definition DVD (HD DVD). Beide Speicher arbeiten mit einem gegenüber der DVD geänderten (blauen) Laserlicht, sodass sie zu dieser inkompatibel sind. Hierdurch und durch andere Veränderungen lassen sich jedoch die Speicherkapazitäten bei einlagigen Medien auf ca. 30 Gbyte erhöhen. Bis zu acht Lagen sind derzeit in der Erprobung. Die Datenrate wird in Vielfachen von 36 Mbit/s, d. h. 4, 5 Mbyte/s angegeben. Eingesetzt werden diese Medien insbesondere für Filmaufzeichnungen hoher Bildqualität. Magnetooptische Plattenspeicher (magneto-optical disks, MOs, MODs) haben als Wechselmedium eine in einer Hülle gelagerte Scheibe mit magnetisierbarer Oberfläche und einer Datenspeicherung in konzentrischen Spuren. Für das Schreiben wird der Effekt genutzt, dass ein ferromagnetischer Stoff bei Überschreitung der sog. Curie-Temperatur seine Magnetisierbarkeit verliert. Die Speicherstelle wird dazu mit einem Laserstrahl punktuell erhitzt, und es wird eine magnetische Ausrichtung durch einen Elektromagneten erzeugt. Für das Lesen wird der Kerr-Effekt genutzt, wobei polarisiertes Licht unter Einfluss eines Magnetfeldes in seiner Polarisationsebene gedreht wird. MOs haben derzeit Kapazitäten von 230 Mbyte bis Magnetooptische Plattenspeicher.
zu 2, 3 Gbyte (3,5 Zoll) und von 650 Mbyte bis zu 17,3 Gbyte (5,25 Zoll). Sie zeichnen sich insbesondere durch ihre häufige Wiederbeschreibbarkeit (ca. 1 Million mal) bei großer Datensicherheit aus. Sie werden zur Datensicherung und -archivierung eingesetzt. Magnetbandspeicher verwenden als Datenträger ein flexibles Kunststoffband, das auf einer Seite eine magnetisierbare Schicht trägt und zum Beschreiben und Lesen an einem Schreib-/Lesekopf mit (bei manchen Geräten ohne) Berührung vorbeigezogen wird. Das Band – früher als sog. Langband auf einer offenen Spule aufgewickelt – ist heute kompakt in einer Kassette untergebracht. Während beim Langband die Speicherung parallel erfolgte, z. B. 8 Bits plus 1 Paritätsbit (Bild 7-15a), gibt es bei den Kassetten zwei bitserielle Aufzeichnungstechniken: das Längsspurverfahren (linear recording) mit spurweiser, serpentinenartiger Aufzeichnung (ggf. auch mehrere Spuren parallel, z. B. 8), bei dem das Band wechselweise in beiden Laufrichtungen betrieben wird (Bild 7-15b), und das Schrägspurverfahren (helical scan recording), bei dem die Schreibund Leseköpfe auf einer rotierenden, schräg zum Band gestellten Trommel untergebracht sind (wie bei Video-Recordern, Bild 7-15c). Die meisten Kassetten (cartridges) haben zwei Bandwickel (Spulen). Beim Längsspurverfahren wird dann der Schreib-/Lesekopf in einer Kassettenaussparung an das Band angelegt (ähnlich der Audiokassette). Beim Schrägspurverfahren wird hingegen das Band aus der Kassette herausgeführt und mittel Führungsrollen um die Schreib-/Lesetrommel gelegt (ähnlich der Videokassette). Es gibt aber auch Kassetten mit nur einem Wickel, sodass mehr Platz für das Band zur Verfügung steht (DLT- und LTO-Streamer). Hier ist der zweite Wickel im Laufwerk untergebracht, und das Band wird im Betrieb aus der Kassette herausgezogen, über mehrere Rollen am Schreib-/ Lesekopf vorbeigeführt und am externen Wickel festgeklemmt. – Die Schrägspurtechnik bewirkt eine höhere Bandabnutzung als die Längsspurtechnik. Sowohl beim Längsspur- als auch beim Schrägspurverfahren erfolgt die blockweise Speicherung – anders als beim Langband – nicht im Start-Stopp-
Magnetbandspeicher, Streamer.
J97
J98
J Technische Informatik / Digitale Systeme
Tabelle 7-3. Speicherkapazitäten und Übertragungsraten von Streamer-Kassetten (exemplarisch) bei unkomprimierter Speicherung. Die Angaben „linear“ und „helical“ stehen für das Längs- bzw. Schrägspurverfahren
Bild 7-15. Datenspeicherung auf Magnetband. a Langband mit z. B. 9 parallelen Spuren; b Streamer-Band bei Längsspurverfahren mit serpentinenartigen Spuren; c StreamerBand bei Schrägspurverfahren
Betrieb mit seiner aufwändigen Bandsteuerung, sondern bei geringerem gerätetechnischen Aufwand mit kontinuierlichem Datenstrom, woraus die Gerätebezeichnung Streamer resultiert. Die Speicherkapazitäten von Streamern unterscheiden sich grundsätzlich nach der StreamerTechnologie aber auch innerhalb einer Technologie. Tabelle 7-3 zeigt dazu einige Beispiele unter Angabe der jeweils höheren Kapazitäten bei unkomprimierter Speicherung; bei Zuschaltung der in Hardware realisierten Datenkompression werden Werte in zwei- bis dreifacher Höhe erreicht. Streamer werden entsprechend ihrer Leistungsdaten (und Kosten) bei kleinen Rechnersysteme (PCs) bis hin zu Hochleistungssystemen (Servern) eingesetzt. Da Streamer insbesondere für die Datensicherung (backup) eingesetzt werden, ist darauf zu achten, dass ihre Speicherkapazitäten denen der zu sichernden Festplatten genügen. – Die Geräteabkürzungen bedeuten: DAT/DDS digital audio tape/digital data storage, SLR scalable linear recording, AIT advanced intelligent tape, DLT digital linear tape, ADR advanced digital recording, LTO linear tape open. Flash-Speicher. Im Gegensatz zu allen bisher ge-
nannten Hintergrundspeichern haben Flash-Speicher als rein elektronische Speicher keine beweglichen Teile. Ähnlich den DRAM-Speicherbausteinen wird ein Bit durch eine elektrische Ladung dargestellt, hier mittels eines Feldeffekttransistors (FET) mit spezieller Struktur. Die besondere Eigenschaft dieses Transistors ist, dass er die Ladung nach Abschalten
Streamertyp
Breite des Bandes
DAT/DDS-5 SLR 140 VXA-2 AIT SDLT 600 LTO-3 SAIT-1 DLT-S4
4 mm 0,25 Zoll 8 mm 8 mm 0,5 Zoll 0,5 Zoll 0,5 Zoll 0,5 Zoll
Speicherkapazität Gbyte 36 70 80 200 300 400 500 800
Übertragungsrate Mbyte/s 3 6 6 24 36 80 30 120
Aufzeichnung helical linear helical helical linear linear helical linear
der Versorgungsspannung nicht verliert, also die gespeicherte Information behält. Die Speicherinformation kann durch entsprechendes Ansteuern des Transistors geschrieben und gelesen werden. Die Art des Speichermediums, ein Halbleitersubstrat, hat unterschiedliche Erscheinungsformen von Flash-Speichern zur Folge. So gibt es diese einerseits als in Rechner und Peripheriegeräte integrierte Flash-Bausteine (Flash ROMs) und andererseits als externe Speicher, z. B. in Form von Steckkarten kleiner Baugröße (Flash Card, Memory Card), wie man sie insbesondere im Multimediabereich findet (Audio, Bild, Video), und als sog. USBSticks (USB-Geräte) in Form eines verlängerten USB-Steckers, wie man sie als Hintergrundspeicher zur Datensicherung verwendet. Es gibt sie außerdem als Pufferspeicher in sog. Hybrid-Festplatten. – Die Kapazitäten von Flash-Speichern reichen von einigen 10 Mbyte bis in den Gbyte-Bereich, wobei ggf. mehrere Flash-Bausteine zusammengeschaltet werden. Die Lebensdauer der Speicherzellen liegt je nach Technologie bei 10 000 bis zu mehreren 100 000 Lösch-/Schreibzyklen.
7.3 Ein-/Ausgabeorganisation Die Ein-/Ausgabeorganisation umfasst die Hardware und Software, um Daten zwischen Hauptspeicher und Peripherie (Geräten, devices) zu übertragen. Zur Peripherie gehören die Hintergrundspeicher und die Ein-/Ausgabegeräte. Hinzu kommen anwendungsspezifische Ein-/Ausgabeeinheiten, z. B.
7 Rechnersysteme
zur Übertragung von Steuer-, Zustands-, Mess- und Stellgrößen in der Prozessdatenverarbeitung. – Zur Ein-/Ausgabeorganisation siehe vertiefend z. B. [2]. Funktionen. Abhängig vom Peripheriegerät umfasst ein Ein-/Ausgabevorgang meist mehrere Aktionen, wie
– Starten des Vorgangs, z. B. durch Starten des Geräts, – Ausführen spezifischer Gerätefunktionen, z. B. Positionieren des Schreib-/Lesearms bei einem Magnetplattenspeicher, – Übertragen von Daten, meist in Blöcken fester oder variabler Byteanzahl, – Lesen und Auswerten von Statusinformation, z. B. zur Fehlererkennung und -behandlung, – Stoppen des Vorgangs, z. B. durch Stoppen des Geräts. Systemstrukturen. Die Unterschiede der Arbeitsgeschwindigkeiten und Datendarstellungen zwischen dem Systembus oder dem Ein-/AusgabeHub (Bild 7-1) und den Peripheriegeräten erfordern eine Anpassung der Geräte an den Bus bzw. Hub (Bild 7-16). Bei einfachen Geräteschnittstellen geschieht dies durch passive Anpassbausteine (interfaces, i/o ports). Die Geräteinitialisierung, die Übertragungssteuerung und die Statusauswertung übernimmt dabei der Prozessor. Er kann durch eine zusätzliche Steuereinheit mit Busmasterfunktion, einen DMA-Controller (DMAC), unterstützt werden, der ihn von der Datenübertragung entlastet. Bei Geräteschnittstellen mit komplexeren Steuerungsabläufen werden aktive Anpassbausteine (host adapter, hubs) eingesetzt. Sie entlasten den Prozessor, da die Steuerung auf einer höheren Kommandoebene erfolgt. Die Datenübertragung selbst wird auch hier meist von einem DMA-Controller durchgeführt. Sowohl die passiven als auch die aktiven Systembusbzw. Hub-Anschlüsse erfordern auf der Geräteseite eine Elektronik gleicher Art. Diese bildet zusammen mit der gerätespezifische Steuerungselektronik die Gerätesteuereinheit (device controller). Synchronisation. Da bei einem Ein-/Ausgabevor-
gang zwei oder mehr Steuereinheiten gleichzei-
Bild 7-16. Rechner mit unterschiedlichen Geräteanbindun-
gen, jeweils parallel oder seriell und mittels Kabel übertragend. a Peripheriebus, b Punkt-zu-Punkt-Verbindung für ein Einzelgerät, c kettenförmige und d baumförmige Struktur mit Punkt-zu-Punkt-Verbindungen zwischen den Geräten
tig aktiv sind, müssen die in ihnen ablaufenden Prozesse, die entweder als Programm oder als Steuerung realisiert sind, miteinander synchronisiert werden. Synchronisation bedeutet hier „aufeinander warten“; das gilt sowohl auf der Ebene der Einzeldatenübertragung (z. B. zwischen Interface und Device-Controller) als auch auf der Ebene der Block- oder Gesamtübertragung (z. B. zwischen Prozessor und DMA-Controller). Die Synchronisation einer Einzeldatenübertragung erfordert abhängig vom Zeitverhalten der Übertragungspartner verschiedene Techniken. Unter der Voraussetzung, dass der eine Partner immer vor dem anderen für eine Übertragung bereit ist, genügt es, wenn der langsamere Partner seine Bereitschaft signalisiert. Haben beide Partner variable Reaktionszeiten, so ist vor jeder Datenübertragung ein Signalaustausch in beiden Richtungen erforderlich. Man bezeichnet dieses Aufeinander-Warten auch als HandshakeSynchronisation (handshaking).
J99
J100
J Technische Informatik / Digitale Systeme
7.3.1 Prozessorgesteuerte Ein-/Ausgabe
Bei der prozessorgesteuerten Ein-/Ausgabe übernimmt der Prozessor im Zusammenwirken mit einem (passiven) Interface die gesamte Steuerung eines Ein-/Ausgabevorgangs, d. h. das Ausgeben und Einlesen von Steuer- und Statusinformation sowie das Übertragen und Zählen der einzelnen Daten. Bild 7-17 zeigt dazu eine Konfiguration mit einem Interface für byteweise Datenübertragung. Sie erfolgt über ein Pufferregister (data register, DR), unterstützt durch zwei Steuerleitungen (ReadySignale RDY1, RDY2). Ein ladbares Steuerregister (control register, CR) erlaubt das Programmieren unterschiedlicher Interface-Funktionen, z. B. die Einsignal-Synchronisation, die HandshakeSynchronisation oder das Sperren und Zulassen von Interruptanforderungen an den Prozessor. Ein lesbares Statusregister (SR) zeigt dem Prozessor den Interface-Status an, z. B. den Empfang des Signals RDY2. Der Ablauf einer Einzeldatenübertragung sei anhand einer Byteausgabe an ein Peripheriegerät demonstriert. Der Prozessor schreibt das Byte in DR, sodass die Bits auf dem peripheren Datenweg anliegen. Das wird dem Gerät durch das (Bereitstellungs-)Signal RDY1 angezeigt. Das Gerät übernimmt das Datum in ein eigenes Register oder einen Pufferspeicher und bestätigt die Übernahme durch das (Quittungs-)Signal RDY2. Das Interface setzt daraufhin ein Ready-Bit in SR und nimmt sein RDY1-Signal zurück; daraufhin setzt auch das Gerät sein RDY2-Signal zurück. Das Ready-Bit signalisiert dem Prozessor den Abschluss
Bild 7-17. Byteorientiertes Interface mit HandshakeSynchronisation
der Übertragung und kann von diesem entweder programmgesteuert, d. h. durch wiederholtes Lesen von SR und Abfragen des Ready-Bits (busy waiting, polling), oder interruptgesteuert, d. h. durch Freigeben des Ready-Bits als Interrupt-Request-Signal, ausgewertet werden. 7.3.2 DMA-Controllergesteuerte Ein-/Ausgabe
Ein DMA-Controller entlastet den Prozessor von der Datenübertragung, indem er, von diesem einmal initialisiert und gestartet, die Übertragung eines Datenblocks oder mehrerer, miteinander verketteter Datenblöcke selbstständig und parallel zur Verarbeitung im Prozessor durchführt. Man bezeichnet diese Organisationsform, bei der die Daten ohne Prozessoreingriff direkt zum/vom Speicher fließen, als Ein-/Ausgabe mit Direktspeicherzugriff (direct memory access, DMA). Da die Übertragungssteuerung des DMA-Controllers (DMAC) in Hardware realisiert ist, werden höhere Übertragungsgeschwindigkeiten als bei der prozessorgesteuerten Ein-/Ausgabe erreicht. Die für die Übertragung erforderlichen Parameter, wie Speicheradresse, Interface-Adresse, Datenformat, Blockgröße und Übertragungsrichtung, werden vom Prozessor bei der Initialisierung in dafür vorgesehene Register des Controllers geladen. Weitere Register speichern den Status. Ist ein solcher Registersatz mehrfach vorhanden, so spricht man von mehreren DMA-Kanälen. Sie benutzen das Steuerwerk des Controllers im Multiplexbetrieb. Die einzelnen Daten eines Blocks werden entweder direkt übertragen, d. h. in jeweils einem Buszyklus, indem der Controller gleichzeitig den Speicher über den Adressbus und das Interface-Datenregister über ein Anwahlsignal adressiert, oder indirekt, d. h. in zwei aufeinanderfolgenden Buszyklen, indem der Controller nacheinander beide Einheiten adressiert und jedes einzelne Datum zwischenspeichert. Die indirekte Technik ist zeitaufwändiger, ermöglicht aber Speicher-zu-Speicher-Übertragungen, z. B. zur Durchführung des Kompaktifizierens (siehe 8.3.3). Die Synchronisation von Prozessor und DMAController auf der Ebene der Blockübertragung erfolgt mit denselben Techniken wie bei der prozessorgesteuerten Einzeldatenübertragung, d. h.,
7 Rechnersysteme
der Controller signalisiert den Abschluss seiner Übertragung entweder durch eine vom Prozessor abzufragende Statusinformation oder durch eine Unterbrechungsanforderung. Während der Initialisierungsphase ist der DMAController Slave des Prozessors, sonst eigenständiger Busmaster, der sich in einem Einbussystem den Systembus mit dem Prozessor teilt. Bezüglich des Buszugriffs hat er höhere Priorität als der Prozessor. Arbeitet er im Cycle-stealing-Modus, so verdrängt er den Prozessor jeweils für die Übertragung eines Datums vom Bus und gibt danach den Bus bis zur nächsten Übertragung frei (für langsame Übertragungen geeignet). Arbeitet er im Burst-Modus, so belegt er den Bus für die Dauer einer Blockübertragung, wodurch der Prozessor für längere Zeit vom Bus verdrängt wird (für schnelle Übertragungen erforderlich). Siehe dazu auch 7.1.3, Busarbitration. 7.3.3 Ein-/Ausgabeprozessor
Ergänzt man den DMA-Controller-Baustein durch einen eigenen Prozessor, der ein im Hauptspeicher oder in einem lokalen Speicher stehendes Ein/Ausgabeprogramm ausführen kann, so erhält man einen Ein-/Ausgabeprozessor. Dieser kann außer der eigentlichen Datenübertragung auch eine Datenvorund Datennachverarbeitung vornehmen, z. B. eine Datentransformation oder -formatierung. Ferner kann er Statusmeldungen auswerten und so z. B. bei fehlerhafter Übertragung eines Datenblocks dessen Übertragung nochmal veranlassen. Für einen Ein-/Ausgabevorgang stellt der Zentralprozessor dabei nur noch ein Parameterfeld bereit, und der Ein-/ Ausgabeprozessor führt diesen Vorgang anhand dieser Angaben selbstständig durch. Frühere Einheiten dieser Art mit einem auf die Ein/Ausgabe zugeschnittenen Kommandosatz wurden als Ein-/Ausgabekanäle bezeichnet. Heutige Ein/Ausgabeprozessoren haben universelle Befehlssätze. Sie sind vielfach zu Ein-/Ausgaberechnern ausgebaut, indem sie zusätzlich zum DMA-Controller mit einem lokalen Bus und lokalen Buskomponenten ausgestattet sind, z. B. mit einem Speicher für Programme und Daten und mit verschiedenen Interfaces. Der lokale Bus und die Systembusschnittstelle sind dabei häufig standardisiert (z. B. PCI) und durch eine Onchip-Bridge (PCI-zu-PCI) miteinander verbunden,
wodurch sich der Systementwurf vereinfacht. Modernere Konzepte sehen Punkt-zu-Punkt-Verbindungen an der Bausteinschnittstelle vor. 7.3.4 Schnittstellen
Der Anschluss von Hintergrundspeichern und Ein-/Ausgabegeräten an einen Rechner erfolgt auf der Grundlage von Schnittstellenvereinbarungen, d. h. mit standardisierten Geräteschnittstellen. Als Vermittler fungieren Steuereinheiten (Host-Adapter, Hubs, Bild 7-16); übertragen wird seriell oder parallel. Hinsichtlich der eingesetzten Standards hat sich in den letzten Jahren ein vollständiger Wandel vollzogen. So wurden die inzwischen in die Jahre gekommenen, insbesondere bei PCs eingesetzten Schnittstellen PS/2 und RS-232-C (seriell) sowie Centronics und IEEE-1284 alias Parallel Port (parallel) durch moderne serielle Schnittstellen, nämlich USB und FireWire abgelöst. Desgleichen werden die parallelen Geräteverbindungen IDE/ATA und SCSI durch deren serielle Nachfolger SATA und SAS ersetzt. Zu diesen modernen Schnittstellen, die alle als Punkt-zu-Punkt-Verbindungen ausgelegt sind, ggf. aber Busfunktion haben, siehe 7.1.6. Für spezielle Geräteanbindungen in technischen Umgebungen gibt es jedoch weiterhin herkömmliche serielle und parallele Schnittstellen, die es erlauben, einfache Übertragungsprotokolle mit geringem Hardwareaufwand zu realisieren. Als serielle Schnittstellen mit Busfunktion seien hier I 2C (Inter-Integrated Circuit) und das Serial Peripheral Interface (SPI) erwähnt, die zur Kommunikation zwischen Digitalbausteinen eingesetzt werden. Sie arbeiten mit nur zwei bzw. drei Signal- und Taktleitungen und erlauben Übertragungsraten bis hin zu einigen Mbit/s. Sie sind zu ergänzen um den große Bereich der Feldbusse (7.1.6). Als „universelle“ parallele Schnittstellen gibt es die sog. Ein-/Ausgabetore (i/o ports), meist mit mehreren 8 Bit breiten Datenverbindungen, die aber auch bitweise für die Übertragung von Steuersignalen genutzt werden können. Sie sind als einfache, passive Interfaces realisiert und eignen sich sowohl für parallele Übertragungen, synchronisiert durch Steuersignale, als auch für die davon unabhängige Übermittlung bitweiser Steuerinformation.
J101
J102
J Technische Informatik / Digitale Systeme
7.3.5 Ein-/Ausgabegeräte
Zu den Ein-/Ausgabegeräten zählen zum einen die Hintergrundspeicher (7.2.4), zum anderen jene Geräte, die die Mensch-Maschine-Schnittstellen für das Ein- und Ausgeben von Zeichen (Programme, Daten, Text) und von Grafik bilden. Dargestellt wird die Information vorwiegend nach dem Rasterprinzip, d. h. durch spalten- und zeilenweises Aufteilen der Darstellungsfläche in Bildpunkte (picture elements, pixels), die Schwarzweiß-, Grau- oder Farbwerte repräsentieren. Daneben gibt es das Vektorprinzip, d. h. die Bilddarstellung durch Linien, deren Anfangsund Endpunkte durch x,y-Koordinaten festgelegt sind. Hinzu kommen Multimediageräte mit digitalen Daten für Sprache, Musik, Fotos und Filme. Terminal. Ein Terminal besteht aus einer Tastatur
(keyboard) zur Eingabe von Zeichen im ASCII oder EBCDIC und einer Bildschirmeinheit (Monitor, video display) zur Ausgabe von Zeichen und Grafik. Als Tastatur ist bei der deutschen ASCII-Version die sog. MF2-Tastatur (Multifunktionstastatur) mit 102 Tasten gebräuchlich. Ältere Bildschirmeinheiten, sog. Röhrenmonitore, haben eine Elektronenstrahlröhre zur Bilddarstellung (cathode ray tube, CRT). Sie arbeiten nach dem Punktrasterprinzip und stellen die Bildpunkte üblicherweise in Farbe, aber auch schwarzweiß oder in Graustufen dar. Aufgebaut wird das Farbbild durch drei Elektronenstrahlen (für Rot, Grün und Blau: RGB), die zeilenweise über den Schirm geführt werden und dabei eine Phosphorschicht beschreiben. Die Positionen der Bildpunkte werden dabei durch eine Loch- oder Streifenmaske vorgegeben. Wichtig ist hier eine Bildwiederholfrequenz von wenigstens 75 Hz, um ein flimmerfreies Bild zu erhalten (besser 85 Hz). Wichtig ist auch die Anzahl an Bildpunkten, da sie die Bildauflösung bestimmt. Als gering auflösend gelten die älteren Maße 640 × 480 (video graphics array, VGA) und 800 × 600 (super VGA, SVGA); heute gebräuchlich sind 1024 × 768 (extended GA, XGA), 1280 × 1024 (super XGA, SXGA) und 1600 × 1200 (ultra XGA, UXGA). Die Bildflächengröße wird durch das Diagonalenmaß bezeichnet, das einen nicht nutzbaren Bildrand mit einschließt. Üblich sind hier Größen zwischen 15 und 22 Zoll. Der Vorteil von Röhrenmonitoren liegt
in der weitgehenden Farbkonstanz bei unterschiedlichen Blickwinkeln. Nachteile sind das Flimmern (unbewusst wahrgenommen) und eine eingeschränkte Bildschärfe. Die Röhrenmonitore wurden inzwischen vielfach durch die platz- und energiesparenden Flachbildschirme verdrängt. Ihre Leuchtfähigkeit basiert entweder auf chemischen Substanzen, die unter Einfluss eines elektrischen Feldes Licht emittieren (wie beim Elektrolumineszenz-Display) oder, als heute vorherrschende Technik, Licht absorbieren (wie beim Flüssigkristall-Display, liquid crystal display, LCD), hier das Licht einer Hintergrundbeleuchtung. Bei den heute weniger gebräuchlichen, passiven LCDs (double super twisted nematic, DSTN) werden dazu die Kristalle durch gitterförmig angeordnete Leiterbahnen angesteuert. Bei den vorherrschenden aktiven LCDs hat jeder Bildpunkt einen eigenen Steuertransistor (thin film transistor, TFT), was eine sehr gute (und schnelle) Bilddarstellung erlaubt. Die Bildschirmdiagonalen liegen bei Notebooks derzeit bei bis zu 17 Zoll mit Auflösungen von bis zu 1920 × 1200 Bildpunkten, bei Standgeräten sind auch größere Diagonalen mit bis zu 23 Zoll (1920 × 1200) oder auch 30 Zoll (2560 × 1600) gebräuchlich. Gegenüber Röhrenmonitoren ist die durch das Diagonalmaß bezeichnete Bildfläche vollständig genutzt, ein Bildflimmern ist nicht wahrnehmbar, und die Bilddarstellung ist sehr scharf. Je nach Bildschirm kann es jedoch eine starke Farbabhängigkeit vom Blickwinkel geben. Außerdem ist das röhrenübliche 4:3-Format zugunsten der Bildschirmbreite verändert. Bildschirme werden durch Grafikeinheiten angesteuert. Diese speichern Bildinformation und unterstützen den rechenintensiven Bildaufbau durch Spezialhardware (Grafik-Controller). Moderne Grafikeinheiten weisen eine hohe Leistungsfähigkeit in der 3DDarstellung von Bewegtbildern auf. Beamer. Beamer
dienen zur Präsentation von Bildschirminhalten (Festbilder, Bewegtbilder) mittels Lichtstrahl auf einer Projektionsfläche, z. B. einer Leinwand. Dabei werden zwei Projektionstechniken unterschieden. Bei der (älteren) LCD-Technik wird mittels einer Metalldampflampe und monochromatischen Spiegeln das auf drei kleinen TFT-Schirmen
7 Rechnersysteme
dargestellte Bild in drei Teilbilder in den Farben Rot, Grün und Blau (RGB) erzeugt, diese dann in einem Prisma zusammengefügt und über eine Linsenoptik als Farbbild projiziert. Als Nachteil dieser Technik können aufgrund der Bildzusammenfügung Konvergenzprobleme (Unschärfe) und bei Verschmutzen der TFT-Schirme Farbstiche auftreten. Bei der (neueren) DLP-Technik (digital light processing) wird das Bild mittels eines optischen Halbleiterbausteins erzeugt, der für jeden darzustellenden Bildpunkt einen sehr kleinen Spiegel hat. Diese Spiegel reflektieren das Licht einer Lichtquelle und projizieren es über ein Linsensystem. Sie werden dabei abhängig von der digital vorliegenden Bildinformation (Bildpunkthelligkeit) bzgl. des Lichteinfalls gekippt und erzeugen so ein Helligkeitsspektrum zwischen Weiß und Schwarz. Für die Farbdarstellung wird das Licht nicht direkt, sondern durch ein Farbrad (RGB) hindurch auf die Spiegel gelenkt, wodurch das Farbbild durch drei aufeinanderfolgende Teilbilder (RGB) entsteht. Bei scharfem und kontrastreichem Bild können hier als Nachteil Farbschlieren auftreten. Beamer der höheren Leistungsklasse, wie sie auch für die Kinoprojektion eingesetzt werden, verwenden für jeden Farbanteil einen eigenen Spiegelbaustein und fassen die so erzeugten drei Teilbilder wiederum durch ein Prisma zusammen. Beamer gibt es mit Bildauflösungen von VGA bis UXGA (siehe oben: Terminal); gebräuchlich sind 800 × 600 (SVGA) und 1024 × 768 (XGA) Bildpunkte. Die Güte der Bildprojektion hängt außerdem von der Bildhelligkeit (gängig 1000 bis 4000 ANSI Lumen) und vom Kontrast (gängig 400:1 bis 1000:1) ab. Maus. Eine sog. Maus besteht aus einem handli-
chen Gehäuse, das auf dem Tisch (mechanische Maus mit Rollkugel) bzw. auf einer reflektierenden Unterlage (optische Maus) verschoben wird und dessen Position auf einem Bildschirm durch eine Marke angezeigt wird. Über Tasten und ggf. ein Rändelrad am Mausgehäuse können – im Zusammenwirken mit der unterstützenden Software – bestimmte Funktionen ausgelöst werden, z. B. das Anwählen von Feldern einer menügesteuerten Benutzeroberfläche, das Fixieren von Bezugspunkten für grafische Objekte eines Zeichenprogramms oder das Scrollen bei Bildschirmfenstern (Verschieben des Ausschnitts).
Tablett (tablet). Das Tablett ist ein grafisches Ein-
gabegerät, das eine entsprechende Arbeitsweise wie mit Bleistift und Papier erlaubt. Es erfasst die Position eines mit der Hand geführten Stiftes auf einer rechteckigen Fläche und überträgt dessen x,y-Koordinaten zum Rechner, der diese ggf. auf einem Bildschirm anzeigt. Die Erfassung der Koordinaten geschieht durch galvanische, akustische, kapazitive, magnetische oder magnetostriktive Kopplung von Stift und Fläche. – Bei den sog. Tablet-PCs ist der Flachbildschirm (eines Notebooks) um die Funktion des Tabletts erweitert, d. h., der Bildschirm dient als Anzeige- und als Eingabemedium, wobei beide Darstellungsebenen gleichzeitig zur Anzeige kommen. Abtaster (scanner). Ein
Scanner tastet eine zweidimensionale Vorlage mittels Helligkeits(Reflexionsgrad-)Messung zeilenweise Punkt für Punkt ab und speichert die Abtastwerte der Bildpunkte in Pixel-Darstellung. Diese kann auf einem Rechner weiterverwendet werden, entweder als Pixel-Grafik (Grafik oder Text) oder nachbearbeitet als ASCII- oder EBCDIC-Textdarstellung. Bei der Nachbearbeitung wird die Pixel-Darstellung von einem Segmentierungsprogramm in die Pixel-Bereiche der einzelnen Zeichen zerlegt, die dann von einem Zeichenerkennungsprogramm klassifiziert und im ASCII oder EBCDIC dargestellt werden (optical character recognition, OCR).
Drucker dienen zur Ausgabe von Text, codiert im ASCII oder EBCDIC, sowie von Grafik. Nadeldrucker (Matrixdrucker) arbeiten als reine Textausgabegeräte mit Zeichenmatrizen von z. B. 9 vertikalen Punkten (dots) bei ca. 3 mm Schriftzeichenhöhe. Die vertikalen Bildpunkte werden durch „Nadeln“, die in einem horizontal bewegten Schreibkopf untergebracht sind, mittels eines Farbbandes auf das Papier übertragen. Höher auflösende Nadeldrucker haben ein feineres Raster von z. B. 2 × 12 gegeneinander versetzten vertikalen Bildpunkten, womit ein wesentlich besseres Schriftbild erreicht wird. Darüber hinaus erlauben sie bei punktweisem Walzenvorschub auch die Ausgabe von Grafik. Nadeldrucker sind vergleichsweise langsam und laut und liefern ein verhältnismäßig schlechtes Druckbild.
Drucker (printer).
J103
J104
J Technische Informatik / Digitale Systeme
Sie haben jedoch den Vorteil eines dokumentenechten Drucks mit Durchschlägen und werden nur noch dafür eingesetzt. Tintenstrahldrucker arbeiten wie Nadeldrucker mit horizontal bewegtem Druckkopf und mit punktweiser Darstellung von Zeichen und Grafik. Anstelle der Nadeln haben sie jedoch bis zu 24 oder 48 feine Düsen, über die Tintentröpfchen gezielt auf das Papier gespritzt werden. Getrennte Tintenstrahlsysteme für Schwarz, Gelb („Yellow“), Cyan und Magenta erlauben den Farbdruck. Tintenstrahldrucker zeichnen sich durch hohe Auflösung und geringe Geräuschentwicklung aus. Laserdrucker sind die aufwändigsten Drucker. Bei ihnen wird die Information einer Druckseite durch einen Laserstrahl punktweise auf eine photoleitende Selenschicht auf einer rotierenden Trommel geschrieben. Ähnlich wie bei einem Kopiergerät wird diese Information durch Tonerpartikel auf Papier übertragen und fixiert. Farb-Laserdrucker verwenden schwarzen Toner sowie Toner in den drei Standardfarben Gelb („Yellow“), Cyan und Magenta. Laserdrucker zeichnen sich durch hohe Auflösung, große Präzision in der Darstellung sowie durch verhältnismäßig hohe Druckgeschwindigkeiten aus.
7.4 Parallelrechner Die Geschwindigkeitssteigerungen der Rechner basieren einerseits auf technologischen Fortschritten, wie sie sich in steigenden Speicherkapazitäten und Taktfrequenzen niederschlagen, und andererseits auf strukturellen Entwicklungen, wie z. B. Parallelisierung von Abläufen in Prozessoren und Rechnern. Nach einer groben, 1972 von Flynn eingeführten Klassifizierung [3] gibt es hinsichtlich der Parallelität von gleichzeitig wirkenden Befehls- und Datenströmen drei grundsätzliche Strukturformen. Mit SISD (single-instruction, single-data, Bild 7-18a) bezeichnet er Prozessoren, bestehend aus einer Befehlseinheit I und einer Verarbeitungseinheit D, die die Befehle eines Programms nacheinander ausführen. Solche Prozessoren arbeiten durchaus auch parallel, aber nur „intern“, z. B. im Pipelining, ggf. verbunden mit der Superskalar- oder der VLIWTechnik (siehe hierzu 5.5). Man bezeichnet sie aber nicht als Parallelrechner.
Mit SIMD (single-instruction, multiple-data, Bild 7-18b) bezeichnet Flynn Spezialprozessoren (proprietäre Prozessoren) mit nur einer Befehlseinheit (I), aber mehreren Verarbeitungseinheiten (D) mit lokalen Speichern, die von der Befehlseinheit einheitlich gesteuert werden. Diese Prozessoren werden bereits als Parallelrechner bezeichnet. Zu ihnen zählen die Vektorrechner und die Feldrechner. Als MIMD (multiple-instruction, multiple-data, Bild 7-18c) bezeichnet er die echten Parallelrechner mit mehreren eigenständigen, heute meist standardisierten Prozessoren. Je nachdem, ob es sich dabei um gleichartige oder unterschiedliche Prozessoren handelt, spricht man von homogenen bzw. inhomogenen Mehrprozessorsystemen. Hinsichtlich der Kommunikation zwischen den Prozessoren unterscheidet man zwischen speichergekoppelten und nachrichtengekoppelten Mehrprozessorsystemen. – Zu den SIMD- und MIMD-Systemen siehe vertiefend z. B. [10]. 7.4.1 Vektorrechner
Vektorrechner (genauer: Vektorprozessoren) sind charakterisiert durch Vektorbefehle, das sind Befehle, die eine ganze Reihe von Operandenpaaren adressieren und in gleicher Weise verknüpfen. Unter einem „Vektor“ wird hier ganz allgemein eine geordnete Menge gleichartig zu behandelnder Operanden verstanden. Der Flynn’schen Klassifizierung entsprechend müssten die Einzeloperationen eines Vektorbefehls – üblicherweise Gleitpunktoperationen – von entsprechend vielen Gleitpunktrecheneinheiten ausgeführt werden (SIMD), tatsächlich erfolgt die Ausführung jedoch effizienter in Fließbandverar-
Bild 7-18. Grobe Einteilung von Rechnern nach einfacher (S) und mehrfacher (M) Befehls- (I) und Datenverarbeitung (D). a SISD; b SIMD; c MIMD. Die Pfeile symbolisieren den Steuerungsfluss
7 Rechnersysteme
beitung in einer sog. Vektor-Pipeline. Im Gegensatz zu einer „skalaren“ Gleitpunktrecheneinheit mit Pipelining, die in Vektorrechnern meist zusätzlich vorhanden ist und die pro Befehl nur ein Operandenpaar verarbeitet, werden in die Vektor-Pipeline nach der Initiierung eines Befehls nacheinander sämtliche Vektorelemente eingespeist. Da dies taktweise geschieht, muss eine genügend schnelle Versorgung der Pipeline gewährleistet sein, z. B. durch Vektorregister (Registerspeicher für einen gesamten Vektor) und durch breite Verbindungswege zum Hauptspeicher, unterstützt durch parallele Zugriffsmöglichkeiten auf diesen (ggf. durch dessen Aufteilung in Speicherbänke). Vektorprozessoren haben meist mehrere, parallel arbeitende Vektor-Pipelines, die ggf. auch miteinander verkettet werden können (vector chaining). Dabei werden die Elemente eines Resultatvektors einem nachfolgenden Vektorbefehl als Elemente zugeführt, noch bevor die Ausführung des ersten Vektorbefehls abgeschlossen ist. Vektorrechner bestehen üblicherweise aus einer Vielzahl von Vektorprozessoren (z. B. als MIMDStruktur), womit sich sehr hohe Rechenleistungen erzielen lassen, z. B. bis zu 40 TFLOPS (nach Linpack, siehe 7.6) beim sog. „Earth Simulator“ (5120 Vektorprozessoren NEC SX-6). Sie eignen sich nur für Spezialaufgaben, hauptsächlich zur Lösung großer Differenzialgleichungssysteme, wie sie bei der Simulation kontinuierlicher Vorgänge auftreten (z. B. Wettervorhersage). 7.4.2 Feldrechner
Feldrechner (array computers) sind wie Vektorrechner für eine hohe Rechenleistung ausgelegt. Anders als diese führen sie jedoch aufeinanderfolgende Operationen nicht überlappend aus, sondern führen gemäß dem „reinen“ SIMD-Prinzip einen Befehl gleichzeitig mit vielen Operandenpaaren aus. Feldrechner haben dementsprechend zahlreiche gleiche Verarbeitungseinheiten, die zentral und taktsynchron gesteuert werden. Diese sind als Zeile, Gitter oder Quader regelmäßig angeordnet und haben üblicherweise lokale Speicher. Nachbarschaftsbeziehungen werden für den Datenaustausch genutzt. Die Verarbeitung erfolgt im Format der Wortlänge, z. B. mit 64 Bit, aber auch mit nur 1 Bit.
Feldrechner dienen hauptsächlich zur Lösung numerischer Probleme. Ein Beispiel sind die MasParRechner MP-1 und MP-2. Der MP-2 hat 1 K bis 32 K 32 Bit breite Verarbeitungseinheiten, die über ein lokales (festes) Netz und ein globales (wahlfreies) Netz miteinander verbunden sind (siehe [10]). Bemerkung. Das Prinzip des Feldrechners ist auch in heutigen Standardprozessoren als Zusatz zur Unterstützung von Multimedia-Anwendungen zu finden. 7.4.3 Speichergekoppelte Mehrprozessorsysteme
Ein speichergekoppeltes (eng gekoppeltes) Mehrprozessorsystem besteht aus mehreren, meist gleichen Prozessoren, die sich den Adressraum des Hauptspeichers teilen (shared memory system). Die Verbindungsstruktur ist entweder ein Bus oder ein Kreuzschienenverteiler. Darüber hinaus gibt es Varianten dieser Strukturen, basierend auf modernen zentralen Punkt-zu-Punkt-Verbindungen wie HyperTransport und PCI-Express (7.1.5). Der Bus kann ein für diese Struktur ausgelegter Prozessorbus sein (Bild 7-19a), der es erlaubt, die Adressbus- und Datenbuszuteilung voneinander zu trennen und Adress- und Datenübertragungen für mehrere Prozessoren zeitlich überlappend auszuführen mit dem Ziel einer effizienten Busnutzung (split transactions, siehe auch 7.1.4). Bei einem Kreuzschienenverteiler (crossbar switch, Bild 7-19b) ist der Hauptspeicher in Module gegliedert, die mit den Prozessormodulen über eine Matrix von Schaltern verbunden sind. Beim Bus wie beim Kreuzschienenverteiler wird die Anzahl der direkten Speicherzugriffe durch den Einsatz von L2-Caches großer Kapazität gering gehalten (siehe 7.2.3). Um dabei dennoch die Datenkohärenz zu gewährleisten, müssen sich die Cache-Controller bei Cache- und Speicherzugriffen untereinander verständigen, z. B. mittels des sog. MESI-Protokolls. Dieses steuert übergreifend die Zugriffe auf den gemeinsamen Adressraum, wobei es die jeweiligen Zustände ggf. adressierter Cache-Einträge auswertet (MESI: modified, exclusive, shared, invalid; siehe z. B. [2, 4]). – Da der Speicherzugriff in solchen Systemen im Prinzip von jedem Prozessor aus gleich schnell ist, spricht man auch von UMA-Architektur (unified memory access).
J105
J106
J Technische Informatik / Digitale Systeme
Der Vorteil eines speichergekoppelten Mehrprozessorsystems liegt in dem relativ einfachen Übergang vom Ein- zum Mehrprozessorsystem, bei dem im Wesentlichen das Betriebssystem dafür zu sorgen hat, dass die bisher auf einem einzigen Prozessor quasiparallel ausgeführten Prozesse auf die nun mehrfach vorhandenen Prozessoren verteilt werden. Dabei sind alle Prozessoren gleichrangig, auch bei der Entscheidung, auf welchem Prozessor das Betriebssystem läuft, weshalb man auch von symmetrischen Mehrprozessorsystemen bzw. SMP-Systemen spricht (symmetrical multiprocessing). Der Nachteil der UMA-Architektur ist die eingeschränkte Skalierbarkeit, d. h. die begrenzte Erweiterbarkeit um zusätzliche Prozessoren. Heutige UMA-Architekturen mit Busstruktur haben bis zu acht, solche mit Kreuzschienenverteiler bis zu 64 Prozessoren. Abhängig von der Anzahl n an Prozessoren spricht man von n-Wege-System. Mit dem Einsatz von Mehrkernprozessoren (multicore processors) entstehen kompakte UMAStrukturen, bei denen die Prozessoren bzw. Prozessorkerne und deren Caches sowie die Verbindungsstruktur und ggf. der DRAM-Controller innerhalb eines einzigen Chips aufgebaut sind.
Bild 7-20. Speichergekoppeltes Mehrprozessorsystem mit
NUMA-Architektur (als über Links verbundene UMASysteme gemäß Bild 7-19 a). Verteilter gemeinsamer
Speicher mit unterschiedlich schnellen Zugriffen für die Prozessoren
Die Skalierbarkeit läßt sich verbessern, indem man Rechnerknoten mit lokalen Speichern bildet und sie über spezielle Interfaces (links) miteinander verbindet (Bild 7-20). Dabei haben die Prozessoren wieder einen gemeinsamen Adressraum, der Hauptspeicher ist jetzt jedoch auf die Knoten verteilt. Man bezeichnet ein solches System deshalb auch als DSM-System (distributed shared memory) oder, da die lokalen bzw. nichtlokalen Speicherzugriffe unterschiedlich schnell sind, als NUMA-Architektur (non-unified memory access). Ein NUMA-Knoten kann z. B. aus mehreren Prozessoren in UMA-Architektur bestehen. 7.4.4 Nachrichtengekoppelte Mehrprozessorsysteme
Bild 7-19. Speichergekoppelte Mehrprozessorsysteme mit
UMA-Architektur bei unterschiedlichen Verbindungsstrukturen. a Gemeinsamer Bus (z. B. erweitertes Einprozessorsystem nach Bild 7-1 b); b Kreuzschienenverteiler. Je-
weils gemeinsamer Speicher mit gleich schnellen Zugriffen für alle Prozessoren
Ein nachrichtengekoppeltes (lose gekoppeltes) Mehrprozessorsystem ähnelt in seiner Struktur der NUMA-Architektur (Bild 7-21), besteht also aus Rechnerknoten (Prozessor-Speicher-Paaren), die über ein Verbindungsnetz miteinander gekoppelt sind. Hier gibt es jedoch keinen gemeinsamen Adressraum, vielmehr sind die lokalen Speicher nur von ihren jeweiligen lokalen Prozessoren aus zugreifbar. Die Kommunikation zwischen den Rechnerknoten ist daher nur durch Versenden von Nachrichten mittels des Verbindungsnetzes möglich. Sie wird, um die Prozessoren zu entlasten, durch spezielle Kommunikationshardware unterstützt. Die Unabhängigkeit der Rechnerknoten wird durch ein jeweils eigenes Betriebssystem unterstrichen. Der Vorteil nachrichtengekoppelter Systeme liegt in ihrer fast unbegrenzten Skalierbarkeit. Gebräuchlich
7 Rechnersysteme
sind Systeme mit bis zu mehreren tausend Rechnerknoten (häufig auch SMP-Systeme als Knoten) unter Verwendung von standardisierten Mikroprozessoren. Wegen der damit erreichbaren hohen Parallelität spricht man auch von MPP-Systemen (massive parallel processing). Ihr Nachteil liegt in der Programmierung, da die Parallelisierung der Anwendersoftware individuell vorzunehmen ist. Erreicht werden derzeit Rechenleistungen von bis zu 300 TFLOPS (nach Linpack, siehe 7.6) beim sog. „Blue Gene/L“ (ca. 131 000 PPC440-Prozessoren, IBM). Kurzfristig angestrebt wird die PFLOPS-Grenze (250 FLOPS). Eingesetzt werden MPP-Systeme zur Lösung von Spezialaufgaben hoher Komplexität, z. B. im Bereich der Simulation.
7.5 Rechnernetze Rechner sind heute in hohem Maße in Rechnernetzen miteinander verbunden, mit der Möglichkeit der Kommunikation zwischen den Rechnern wie auch deren Benutzern. Gegenüber dem isolierten Einsatz von Rechnern reicht das Spektrum der zusätzlichen Möglichkeiten vom „Resource-Sharing“, d. h. der gemeinsamen Benutzung von Geräten und Dateien, bis hin zum weltweiten Informationsaustausch im Internet. Grundlegend unterscheidet man zwischen lokalen Netzen (inhouse nets, local area networks, LANs), Weitverkehrsnetzen (Telekommunikationsnetzen, wide area networks, WANs) und globalen Netzen (global area networks, GANs). LANs sind Verbunde von geringer räumlicher Ausdehnung meist innerhalb von Gebäuden oder Grundstücken, die von einzelnen Nutzern (Unternehmen, Institutionen) betrieben werden. WANs haben landesweite Ausdehnung (üblicherweise flächendeckend) und werden
Bild 7-21. Serielle Datenübertragung, a asynchron; b syn-
chron
meist von den Telekommunikationsgesellschaften betrieben. GANs haben mittels Überseekabel und Satelliten globale Reichweiten und stehen üblicherweise im Verbund mit den regionalen WANs. Als Zwischenform von LAN und WAN gibt es die sog. Metronetze (metropolitan area networks, MANs). Sie sind Stadtnetze (Regionalnetze) und wirken innerhalb oder zwischen Ballungsräumen, oft als Hochgeschwindigkeitsnetze. – Zu Rechnernetzen siehe z. B. [9]. 7.5.1 Serielle Datenübertragung
Um den Leitungsaufwand in den Netzen gering zu halten, werden Daten grundsätzlich bitseriell übertragen, wobei die Bitfolge einem definierten Zeitraster zugeordnet wird. Bei asynchron-serieller Übertragung werden wahlweise fünf bis acht Datenbits eines Zeichens (ggf. plus Paritätsbit) in einem zur Synchronisation benötigten Rahmen (frame), bestehend aus einem Startbit und einem oder mehreren Stoppbits, zusammengefasst (Bild 7-21a). Bei der Übertragung aufeinanderfolgender Zeichen synchronisieren sich Sender und Empfänger bei jedem Zeichen anhand der fallenden Flanke des Startbits, sodass der Zeitabstand zwischen zwei Zeichen beliebig variieren darf. Bei der synchron-seriellen Übertragung bilden die Datenbits aufeinanderfolgender Zeichen einen lückenlosen Bitstrom (Bild 7-21b) und die Synchronisation geschieht laufend anhand der Pegelübergänge im Datensignal. Um auch bei längeren 0- oder 1-Folgen Pegelwechsel zu erzwingen, werden besondere Signalcodierungen verwendet, oder es werden vom Sender zusätzliche Synchronisationszeichen oder -bits eingefügt (character/bit stuffing). Diese Einfügungen werden vom Empfänger erkannt und eliminiert. Die Übertragung erfolgt blockweise, wozu auf logischer Ebene Rahmen mit ggf. zusätzlicher Adressierungs- und Steuerinformation gebildet werden. Die reziproke Schrittweite des Zeitrasters bezeichnet man als Schrittgeschwindigkeit (Einheit Baud, Bd). Die Übertragungsgeschwindigkeit oder Übertragungsrate in bit/s kann ein Vielfaches der Schrittgeschwindigkeit betragen, nämlich dann, wenn pro Taktschritt mehrere Bits codiert übertragen werden. Die erreichbare Übertragungsrate hängt
J107
J108
J Technische Informatik / Digitale Systeme
u. a. von der Leitungsart ab. Sie wächst in folgender Reihenfolge: unverdrillte Doppelader (Telefonleitung, Kupfer), nichtabgeschirmte oder abgeschirmte verdrillte Doppelader (unshielded/shielded twisted pair, UTP/STP, Kupfer), Koaxialkabel (Kupfer), Lichtwellenleiter (Glasfaser). 7.5.2 Weitverkehrsnetze (WANs)
Bild 7-22. Datenfernübertragung zwischen zwei Datenendeinrichtungen (DEE) mittels zweier Datenübertragungseinrichtungen (DÜE). Als Übertragungssystem wurde das analoge Fernsprechnetz angenommen, dementsprechend sind als DÜE Modems eingesetzt
Strukturen. Bei Weitverkehrsnetzen besteht das
Übertragungssystem aus Übertragungsleitungen und Vermittlungseinrichtungen, sog. Knotenrechnern (Vermittlungsrechner, interface message processor, IMP), die für die Durchschaltung der Übertragungsleitungen zuständig sind. Die Datenübertragung zwischen zwei Anwendungsrechnern erfolgt jeweils über die beiden ihnen zugeordneten Knotenrechner. Sind diese zwei Knotenrechner nicht direkt miteinander verbunden, so müssen die Daten über andere Knotenrechner geleitet werden (Punkt-zu-PunktNetz). Bei den paketvermittelnden Netzen erfolgt dieser Transport in Datenpaketen, die in den Knotenrechnern zunächst zwischengespeichert und dann weitergeleitet werden (store-and-forward network, packet switching, connectionless). Zusammengehörige Pakete können dabei unterschiedliche Wege mit unterschiedlichen Laufzeiten durchlaufen, je nachdem welche Verbindungsleitungen zwischen den Netzknoten jeweils verfügbar sind (Wegewahl, routing). Sie werden dabei nummeriert und können so dem Empfänger in der korrekten Reihenfolge zugestellt werden. Bei den leitungsvermittelnden Netzen hingegen wird für die Dauer der Datenübertragung ein Verbindungsweg fest durchgeschaltet (connection-oriented). Den Punkt-zu-Punkt-Netzen stehen die sog. Broadcast-Netze gegenüber. Bei ihnen werden die Datenpakete vom Sender gleichzeitig an mehrere oder an alle Netzteilnehmer übertragen, und der gemeinte Empfänger erkennt an der mitgelieferten Adressinformation, dass die Nachricht für ihn bestimmt ist. Typisch sind hier Funkübertragungen, z. B. mittels Satelliten. Als Datenfernübertragung man die Datenübertragung
Datenfernübertragung.
(DFÜ)
bezeichnet
zwischen sog. Datenendgeräten (Datenendeinrichtungen, DEE), z. B. zwei Rechnern, unter Benutzung von WANs, d. h. von Übertragungsleitungen und Vermittlungseinrichtungen der Telekommunikationsgesellschaften. Die Anpassung der Datenendgeräte an die Signaldarstellung und Übertragungsvorschriften dieser Unternehmen erfordert an der Teilnehmerschnittstelle Datenübertragungseinrichtungen (DÜE), die bei analoger Übertragung als Modems und bei digitaler Übertragung als Datenanschlussgeräte oder als Adapter bezeichnet werden (Bild 7-22). Protokolle. Die Kommunikation zwischen zwei
Rechnern bzw. Anwenderprozessen umfasst zahlreiche Funktionen, die von den übertragungstechnischen Voraussetzungen bis zu den logischen und organisatorischen Vorgaben auf der Anwenderebene reichen. Hierzu gehören: Aufbau, Aufrechterhaltung und Abbau einer Verbindung, Übertragen eines Bitstroms, Aufteilen eines Bitstroms in Übertragungsblöcke, Sichern der Datenübertragung sowie Fehlerbehandlung, Wegewahl im Netz, Synchronisieren der Übertragungspartner, Herstellen einer einheitlichen Datenrepräsentation, Aufteilen der zu übertragenden Information in logische und physikalische Abschnitte usw. Zur Beherrschung dieser Komplexität wurde von der ISO das OSI-Referenzmodell entwickelt (Open Systems Interconnection), das die Kommunikation in sieben hierarchischen Schichten (layers) beschreibt. Analoges Fernsprechnetz. Das analoge Fernsprech-
netz (Telefonnetz) ist das älteste öffentliche Telekommunikationsnetz und hat eine relativ geringe Übertragungsleistung entsprechend dem für Sprachsignale erforderlichen schmalen Frequenzbereich von 300 bis 3400 Hz. Der Netzzugang erfolgt über
7 Rechnersysteme
ein Modem (Modulator/Demodulator), welches das zu sendende digitale Signal in ein analoges und das zu empfangene Analogsignal in ein digitales umsetzt. Das Analogsignal wird mit einer in diesem Frequenzbereich liegenden sinusförmigen Trägerschwingung erzeugt, auf den das digitale Signal aufmoduliert wird. Man benutzt hier die aus der Nachrichtentechnik bekannten Modulationsarten Amplituden-, Frequenz- und Phasenmodulation. Setzt man zur Signalcodierung mehr als zwei Amplituden, zwei Frequenzen oder zwei Phasenwinkel ein oder kombiniert man die Modulationsverfahren, so lassen sich pro Übertragungstaktschritt mehr als nur ein Bit codieren. Mit solchen Verfahren erreicht man bei der für das analoge Fernsprechnetz kennzeichnenden Schrittgeschwindigkeit von 2400 Baud Übertragungsraten von bis zu 9600 bit/s (V.32-Modem). Durch Erhöhung der Bitanzahl pro Taktschritt erreicht man bis zu 14 400 bit/s (V.32bis) und bei zusätzlicher Erhöhung der Schrittgeschwindigkeit bis zu 33 600 bit/s (V.34). Mit einer anderen Technik, bei der die Daten nicht analog durch modulierte Schwingungen, sondern digital als diskrete Spannungspegel dargestellt werden, erreicht man bis zu 56 000 bit/s (56k-Modem, V.90). Digitales Fernsprechnetz, ISDN. Das analoge Fern-
sprechnetz wird durch das jüngere, digitale Netz ISDN (Integrated Services Digital Network) ergänzt bzw. ersetzt. Das ISDN erlaubt den direkten digitalen Netzzugang und bietet dazu für jeden Anschluss zwei (logische) Übertragungskanäle (B-Kanäle) zur gleichzeitigen Nutzung mit Übertragungsraten von je 64 kbit/s (ca. 8 000 Zeichen pro Sekunde) sowie einen Signalisierkanal (D-Kanal) mit 16 kbit/s, an die in einer Art Busstruktur bis zu acht Datenendgeräte, einschließlich Telefon, angeschlossen werden können. Die höhere Übertragungsleistung des ISDN ergibt sich durch eine Erweiterung des nutzbaren Frequenzbereichs auf bis zu 120 kHz bei digitaler Datendarstellung (digital subscriber line, DSL; Subscriber: Fernmeldeteilnehmer). Für die Teilnehmeranbindung an das Netz werden wie beim analogen Fernsprechnetz Zweidrahtleitungen verwendet. Mit beiden Fernsprechnetzen steht eine Vielzahl von Diensten für die Übertragung von Sprache, Daten,
Text, Festbildern und bedingt auch von Bewegtbildern zur Verfügung, so u. a. das Fernsprechen (Telefon, auch Bildtelefon) und das Fernkopieren (Telefax). Generell handelt es sich hierbei um relativ geringe Datenaufkommen. Reine Datennetze. Für höhere Datenaufkommen
gibt es reine Datennetze, bei denen der Zugang entweder über analoge oder digitale Fernsprechanschlüsse oder über spezielle Netzanschlüsse (Twisted-pair-, Koaxial- oder Glasfaserkabel) erfolgt. Im Gegensatz zu der bei den beiden Fernsprechnetzen gebräuchlichen Leitungsvermittlung arbeiten sie üblicherweise mit Paketvermittlung. Die hier verfügbaren Übertragungsraten reichen bis zu einigen Gbit/s. – Technisch möglich und erprobt sind bei Lichtwellenleitern Übertragungsgeschwindigkeiten im THz-Bereich. xDSL-Techniken. Die Übertragungsraten von ana-
logen und von ISDN-Teilnehmeranschlüssen können wesentlich erhöht werden, wenn auf der Leitungsverbindung zwischen Teilnehmer und Vermittlungsstelle keine zusätzliche Frequenzbandbegrenzung durch Signalverstärker auftritt und somit breitere bzw. mehr Frequenzbänder genutzt werden können (d. h. oberhalb von 3400 Hz bzw. 120 kHz). Hierfür kommen verschiedene Verfahren digitaler Datendarstellung zum Einsatz, die unter dem Begriff xDSL zusammengefasst werden (Tabelle 7-4). Sie sind Tabelle 7-4. xDSL-Techniken und ihre maximal gängigen Übertragungsraten. Die tatsächlich erreichbaren Werte hängen von der Leitungsdämpfung ab (zu überbrückende Entfernung, Leitungsqualität). Benötigt wird jeweils ein Adernpaar, bei HDSL ggf. zwei oder drei (zur Verringerung von Störeinflüssen). Im Vergleich dazu die maximalen Modem- und ISDN-Datenübertragungsraten
xDSL-Technik ADSL (asymmetric) ADSL2 (asymmetric) HDSL (high data rate) SDSL (single line) VDSL2 (very high data rate) Modem ISDN
Übertragungsrate/Mbit/s Hinkanal Rückkanal 0,512 6 1 16 (20) 1,54 oder 2 1,54 oder 2 3 3 5 (10) 25 (50) 0,033 0,056 0,144 0,144
J109
J110
J Technische Informatik / Digitale Systeme
eine Weiterentwicklung des für ISDN genutzten DSL-Verfahrens (x steht als Platzhalter für das jeweilige Verfahren) und dienen insbesondere dem Internet-Zugang, was eine ggf. höhere Datenübertragungsrate für den Rückkanal (Daten aus dem Netz, download) als für den Hinkanal (upload) rechtfertigt (asymmetrische Übertragung). Die Signaldarstellung erfolgt entweder im Basisbandverfahren (unmoduliertes Digitalsignal) oder im Breitbandverfahren (modulierter Träger). In Deutschland ist das asymmetrische ADSL am weitesten verbreitet, mit Übertragungsraten von derzeit bis zu 6 Mbit/s im Rückkanal, bei den neueren Varianten ADSL2 mit bis zu 12 und ADSL2+ mit bis zu 16 und 20 Mbit/s. Es erlaubt Datenübertragung und Telefonie gleichzeitig; zur Signaltrennung ist zum ADSL-Modem ein sog. Splitter erforderlich. VDSL2 schließt sich in der Leistung an ADSL2+ an, mit sowohl symmetrisch als auch asymmetrisch spezifizierten Übertragungsraten. Als erreichbarer Spitzenwert werden 200 Mbit/s angegeben; derzeitige Realisierungen sehen bis zu 50 Mbit/s vor. Der Bedarf wird im Übertragen von hochaufgelöstem Fernsehen (HDTV) gesehen. – DSL-Modems werden entweder direkt mit dem PC verbunden (USB, Punktzu-Punkt-Ethernet), oder sie sind als Router eines lokalen Netzes ausgelegt (WLAN, Ethernet-Switch mit mehreren Ports). 7.5.3 Lokale Netze (LANs)
Lokale Netze sind in ihrem Ursprung BroadcastNetze mit Bus- oder Ringstruktur, die im Gegensatz zu Weitverkehrsnetzen keine Knotenrechner enthalten. Statt dessen hat jeder Anwendungsrechner eine Netzsteuereinheit (network controller) in Form einer Interface-Karte (siehe LAN-Controller in Bild 7-1b), und das Übertragungssystem besteht im einfachsten Fall (Bus) nur aus einer Leitung. Davon abweichend haben heute Stern- und Baumstrukturen eine große Verbreitung (strukturierte Verkabelung). Hier kommen dann Vermittlungseinheiten zum Einsatz. – Zu beachten ist, dass die logische Struktur eines LAN von den im Folgenden betrachteten physikalischen Strukturen durchaus verschieden sein kann.
einander verbunden. Die Kommunikation erfolgt in fest vorgegebenem Umlaufsinn, wobei freie Übertragungskapazitäten durch umlaufende Marken (tokens) gekennzeichnet werden (Bild 7-23a). Der sendende Teilnehmer übergibt einem freien Token seine Nachricht zusammen mit seiner Adresse und der des Empfängers. Der durch die Empfängeradresse angesprochene Netzteilnehmer übernimmt die Nachricht und übergibt dem Token eine Empfangsbestätigung für den Sender, nach deren Empfang dieser das Token wieder freigibt. Vorteil der Ringstruktur ist die kollisionsfreie Übertragung, was eine gute Nutzung der Übertragungsraten erlaubt, sowie der geringe Aufwand. Sie hat jedoch den Nachteil, dass bei nur einer Unterbrechung im Ring der gesamte Ring funktionsunfähig wird. Ein Beispiel für die Ringstruktur ist der Token-Ring von IBM mit Übertragungsraten von 4 oder 16 Mbit/s (IEEE 802.5). Ein weiterer Token-Ring, das FDDI (Fiber Distributed Data Interface), vermeidet den oben geschilderten Nachteil durch Verdoppelung des Rings (ANSI X3T9.5). Die maximale Länge für den „primären“ wie auch für den „sekundären“ Ring beträgt hier 200 km, die Übertragungsrate 100 Mbit/s. FDDI gilt als Hochgeschwindigkeits-LAN und wird insbesondere auch als sog. Backbone eingesetzt, um LANs miteinander zu verbinden. Bus. Bei
der Busstruktur kommunizieren die Teilnehmer über einen Bus als passiven Vermittler (Bild 7-23b). Das Übertragungsmedium ist z. B. ein Koaxialkabel, an das auch während des Betriebs des Netzes neue Teilnehmer angeschlossen werden können. Der Ausfall eines Teilnehmers beeinträchtigt die Funktionsfähigkeit des Netzes nicht. Die Möglichkeit des gleichzeitigen Zugriffs auf den Bus macht jedoch eine Strategie zur Vermeidung von Kollisionen erforderlich. So muss (ähnlich der Busarbitration in
Ring. Bei der Ringstruktur (Token Ring) sind alle
Teilnehmer punkt-zu-punkt in einem Ring mit-
Bild 7-23. LAN-Strukturen. a Ring; b Bus; c Stern
7 Rechnersysteme
Rechnern) ein Sender vor Sendebeginn anhand des Signalpegels auf dem Bus zunächst prüfen, ob der Bus frei ist; und er muss mit Sendebeginn erneut prüfen, ob nicht gleichzeitig ein zweiter Sender zu senden begonnen hat. Im Konfliktfall muss er die Übertragung aufschieben bzw. abbrechen, um sie z. B. nach einer zufallsbestimmten Wartezeit erneut zu versuchen. Ein Verfahren mit dieser Organisationsform ist das CSMA/CD-Verfahren (Carrier Sense Multiple Access/Collision Detection), nach dem das weit verbreitete Ethernet von Xerox mit einer Übertragungsrate von 10 Mbit/s arbeitet (IEEE 802.3). – Weiterentwicklungen von Ethernet ermöglichen Übertragungsraten von 100 Mbit/s (Fast-Ethernet), 1 Gbit/s (Gigabit-Ethernet) und 10 Gbit/s (10-Gigabit-Ethernet) mit üblicherweise Stern- oder Baumstruktur. Eine andere Organisationsform hat der Token-Bus, bei dem wie beim Token-Ring ein Token zyklisch weitergereicht wird, wodurch sich eine eindeutige Zuteilung der Sendeberechtigung ergibt (IEEE 802.4). Ein Beispiel ist das MAP (manufacturing automation protocol) mit Übertragungsraten von 1, 5 bis zu 20 Mbit/s. Stern und Baum. Bei der Sternstruktur sind alle
Teilnehmer über einen zentralen Knoten (als passive oder aktive Vermittlungseinrichtung) miteinander verbunden, über den die gesamte Kommunikation läuft (Bild 7-23c), z. B. einen Hub oder einen Switch (siehe unten). Diese Technik birgt zwar eine größere Ausfallgefahr des gesamten Netzes, erleichtert aber den Netzaufbau und die Netzerweiterung wesentlich. Sie wird deshalb z. B. bei heutigen Ethernet-LANs bevorzugt eingesetzt. Die Baumstruktur entsteht durch Zusammenschluss von Bussen oder Sternstrukturen, wobei je nach Anpassungsbedarf zwischen den Teilnetzen unterschiedliche Netzverbinder eingesetzt werden. Netzverbinder. Für den Aufbau von LANs und
für den Übergang zwischen Netzen oder Netzsegmenten werden unterschiedliche Netzverbinder eingesetzt, abhängig davon, auf welcher Ebene des ISO/OSI-Referenzmodells der Übergang stattfindet: Repeater. Ein Repeater verbindet zwei gleichartige Netze in der untersten Schicht 1, z. B. zwei 10-Mbit/sEthernets. Er wirkt als Zwischenverstärker und führt
eine reine Bitübertragung durch, d. h., er nimmt keine Protokollumsetzung vor. Hub. Ein Hub („Nabe“, „Zentrum“) ist eine Verteilereinrichtung in der Schicht 1, die einen zentralen Anschluss sternförmig auf mehrere Anschlüsse aufteilt bzw. in der umgekehrten Richtung diese Anschlüsse zusammenfasst (Konzentratorfunktion). Hubs haben entweder Verstärkerfunktion (aktiver Hub) oder nicht (passiver Hub). Erstere wirken wie Repeater. Aufgrund der bei Hubs zentralisiert aufgebauten Netzsteuerung eignen sie sich insbesondere auch für die Realisierung logischer Bus- und Ringstrukturen. Bridge. Eine Bridge ist ein Netzverbinder in der Schicht 2. Sie verbindet zwei unterschiedliche Netze mit jedoch gleicher Realisierung in der Schicht 1, z. B. ein Ethernet und einen Token-Bus. Sie entscheidet anhand der den Daten mitgegebenen Adressinformation, was weitergeleitet werden soll, hat also Filterfunktion. Switch. Ein Switch („Schalteinrichtung“) ist ähnlich einem Hub ein sternförmiger Verteiler/Konzentrator. Im Gegensatz zum Hub, der die ankommenden Daten grundsätzlich an alle Netzteilnehmer weiterleitet und bei dem sich die Netzteilnehmer die Netzkapazität teilen müssen, schaltet ein Switch die Datenpakete anhand ihrer Adressen gezielt an einzelne Netzteilnehmer durch. Dabei kann er die Übertragungskapazität eines Anschlusses hoher Übertragungsrate (z. B. 1 Gbit/s) auf mehrere Anschlüsse mit geringeren Übertragungsraten (z. B. 100 oder 10 Mbit/s) aufteilen, wodurch ein hoher Datendurchsatz im Netz erreicht wird. Hinsichtlich der adressspezifischen Weiterleitung ist er der Schicht 2 (und ggf. darüber) zuzuordnen. Router. Ein Router stellt eine Netzverbindung in der Schicht 3 her. Er fungiert als Verbinder unterschiedlicher Netze mit unterschiedlichen Übertragungsmedien und ist mit entsprechenden Schnittstellen ausgestattet. Ankommende Datenpakete werden von ihm auf den richtigen Zielweg geschickt. Die Wegewahl bestimmt er anhand gespeicherter Routing-Tabellen. Er führt keine Filterung durch. Brouter. Ein Brouter ist eine Kombination aus Bridge und Router (Schichten 2 und 3).
J111
J112
J Technische Informatik / Digitale Systeme
Gateway. Ein Gateway schließlich stellt eine Netzverbindung auf der jeweils obersten Netzebene her. Es ist erforderlich, wenn die Netze nicht dem Referenzmodell entsprechen und es somit keine gemeinsame Schicht gibt. Dementsprechend führt ein Gateway neben der Routing-Funktion auch Protokoll- und Codeumwandlungen durch. Funknetze. Funknetze als drahtlose Verbindungen
lösen kabelgebundene Verbindungen ab. Derzeit am weitesten verbreitet ist das sog. WLAN (wireless LAN). Es folgt dem Basisstandard IEEE 802.11 mit Varianten, die durch eine zusätzliche Buchstabenkennung bezeichnet sind. Sein Netzaufbau im sog. Infrastruktur-Modus erfolgt über die WLANAdapter der einzelnen Netzteilnehmer und durch einer vermittelnde Basistation (access point, AP), die die Verbindung zu einem drahtgebundenen lokalen Netz, z. B. einem Ethernet herstellt. In einer einfacheren Version, dem Ad-hoc-Modus, können die Netzteilnehmer auch direkt mittels der WLANAdapter (und ohne eine Netzanbindung) miteinander kommunizieren (Peer-to-Peer-Netz). Die maximalen Übertragungsraten betragen 1 und 2 Mbit/s (802.11), 11 Mbit/s (802.11b), 54 Mbit/s (802.11g, 802.11a) und künftig zwischen 100 und 540 Mbit/s (802.11n). Die Funkreichweiten liegen innerhalb von Gebäuden bei 30 bis 80 m, im Freien bei mehreren 100 m. – Nachfolger von WLAN könnte das lizenzpflichtige Wimax (worldwide interoperability for microwave access) werden, das Reichweiten von (theoretisch) bis zu 50 km vorsieht. Für die drahtlose Vernetzung von Geräten, z. B. Computer und Peripheriegeräte, Mobiltelefone, PDAs (personal digital assistant), hat das sog. Bluetooth (IEEE 802.15.1) eine weite Verbreitung. Seine Übertragungsraten liegen bei 723 kbit/s bis maximal 2,1 Mbit/s für den Download und 57 kbit/s für den Upload. Überbrückt werden geringe Entfernungen von bis zu 10 m in Gebäuden. – Als Nachfolger von Bluetooth gilt UWB (ultrawideband) mit zunächst 55 Mbit/s und künftig 480 Mbit/s.
7.6 Leistungskenngrößen von Rechnersystemen und ihre Einheiten Die Leistungsfähigkeit eines Rechners wird bei pauschaler Beschreibung durch eine Reihe von
Leistungskenngrößen seiner Komponenten gekennzeichnet, die nachfolgend mit den üblichen Einheiten alphabetisch geordnet aufgelistet sind. Dabei ist zu beachten, dass die Vorsätze M (Mega), G (Giga) und T (Tera) je zwei verschiedene Bedeutungen haben: bei Speicherkapazitäten als Potenzen von 2 (M = 220 , G = 230 , T = 240 ) und für zeitbezogene Angaben (z. B. Frequenz, Übertragungsrate, Durchsatz) als Potenzen von 10 (M = 106 , G = 109 , T = 1012 ). Beim Vorsatz Kilo sind die beiden Bedeutungen durch die Schreibweise unterschieden (K = 210 = 1024, k = 103 ). Aufzeichnungsdichte (bit/recording density): bpi (bit per inch), bpi2 (bit per square inch); bei Speichermedien mit beschreibbaren Oberflächen, z. B. Magnetbändern und Magnetplatten. Bildauflösung von Bildschirmen (resolution): n × m Pixel (picture elements, Bildpunkte, Spaltenanzahl n mal Zeilenanzahl m). Bildwiederholfrequenz (refresh rate): Hz; bei Röhrenmonitoren; Werte zwischen 50 und 100 Hz, annähernd flimmerfrei ab 85 Hz. bpi, bpi2 : siehe Aufzeichnungsdichte. bps: siehe Übertragungsrate bei serieller Übertragung. Busbandbreite (bus bandwidth): byte/s (bytes per second); maximal mögliche Übertragungsrate bei parallelen Bussen/Verbindungen; ermittelt aus Bustaktfrequenz, multipliziert mit der Datenbusbreite in Bytes, geteilt durch die für eine Übertragung erforderliche Anzahl von Taktschritten. Bustaktfrequenz (bus clock frequency): MHz; Frequenz der Taktschritte bei Datenübertragungen auf einem Bus. Buszykluszeit (bus cycle time): bei parallelen Bussen Maß für die Dauer eines Buszyklus; üblicherweise als Anzahl der Taktschritte für die Durchführung des Buszyklus angegeben. cpi: siehe Zeichendichte, horizontale. cps: siehe Geschwindigkeit der Zeichendarstellung. Dhrystone: D/s (dhrystones per second); IntegerBenchmark, bestehend aus einem synthetischen Mix von z. B. C-Anweisungen für Ganzzahloperationen. Gemessen wird die Anzahl der Schleifendurchläufe pro Sekunde. Für die Ermittlung des Prozessordurchsatzes (in MIPS) herangezogen.
7 Rechnersysteme
dpi, dpi2 : siehe Punktdichte. Geschwindigkeit der Zeichendarstellung (character rate): cps (characters per second); auf Bildschirmen und durch Drucker. Linpack: MFLOPS (millions of floating-point operations per second); Floating-Point-Benchmark mit z. B. in Fortran geschriebenen Matrizenrechnungen. Heute auch in Java verfügbar. MFLOPS: siehe Prozessordurchsatz für Gleitpunktoperationen. MIPS: siehe Prozessordurchsatz. MWIPS: siehe Whetstone. Prozessorbustaktfrequenz (processor bus clock frequency): MHz; Frequenz der Taktschritte bei Datenübertragungen über die Datenanschlussleitungen eines Prozessors. Bei Prozessoren mit hoher Prozessortaktfrequenz ist sie technisch bedingt um einen Teiler geringer als diese. Prozessordurchsatz (throughput, processing speed): MIPS (millions of instructions per second). Einigermaßen vergleichbare Aussagen sind nur bei im Befehlssatz ähnlichen Prozessoren und bei gleichen Programmen, z. B. Benchmark-Programmen oder einheitlichem Befehlsmix sinnvoll. Prozessordurchsatz für Gleitpunktoperationen: MFLOPS (millions of floating-point operations per second, Megaflops), oft auch mit den Vorsätzen G (Gigaflops) und T (Teraflops); entweder als theoretischer Höchstwert (Ausführungszeit von Gleitpunktmultiplikation und -addition) oder als Durchschnittswert (siehe Linpack) angegeben. Prozessortaktfrequenz (processor clock frequency): MHz, GHz; Frequenz der prozessorinternen Operationsschritte. Punktdichte (resolution): dpi (dots per inch), dpi2 (dots per square inch); bei Text- und Grafikausdrucken. Schrittgeschwindigkeit bei serieller Datenübertragung (baud/modulation rate): Bd (Baud); Anzahl der Übertragungsschritte pro Sekunde (häufig inkorrekt als „Baudrate“ bezeichnet). Bei Übertragung von nur einem Bit pro Schritt ist die Schrittgeschwindigkeit gleich der Übertragungsrate. SPEC CPU2006: Leistungsangaben, basierend auf Benchmarks der Organisation SPEC (Standard Performance Evaluation Corporation) zur Bewertung
der Integer- und Floating-Point-Leistungsfähigkeit eines Rechners unter Berücksichtigung des Prozessors, Hauptspeichers und Compilers. Hierzu werden die Laufzeiten von 12 (SPECint2006) bzw. 17 (SPECfp2006) ausgesuchten Programmen in Relation zu vorgegebenen Bezugswerten gesetzt und aus diesen 12 bzw. 17 Verhältniszahlen jeweils das geometrische Mittel gebildet. – Benchmarks für andere Bereiche, z. B. für Grafikeinheiten und Server, sind verfügbar. Speicherkapazität von Haupt- und Hintergrundspeichern (memory/storage capacity): byte, B (Byte); wird in Kbyte (KB), Mbyte (MB), Gbyte (GB) oder Tbyte (TB) angegeben. Spurdichte (track density): tpi (tracks per inch); bei Speichermedien mit beschreibbaren Oberflächen, z. B. bei Magnetbändern und Magnetplatten. Suchzeit, mittlere (average seek time): ms; bei Sekundärspeichern mit mechanischen Zugriffsmechanismen: die Zeitdauer von der Speicheranwahl bis zur Bereitschaft, Daten zu liefern (Lesen) bzw. Daten zu übernehmen (Schreiben). tpi: siehe Spurdichte. Transferrate (transfer rate): T/s (transfers per second); Anzahl der maximal möglichen Datenübertragungen pro Sekunde; wird in MT/s oder GT/s angegeben. Übertragungsgeschwindigkeit (transmission speed): synonym mit Übertragungsrate. Übertragungsrate bei paralleler Übertragung (data transfer rate): Bps, byte/s, B/s (bytes per second); wird in kbyte/s, Mbyte/s oder Gbyte/s angegeben. Übertragungsrate bei serieller Übertragung (data transfer rate): bps, bit/s, b/s (bits per second); wird in kbit/s, Mbit/s oder Gbit/s angegeben. Wartezyklen (wait cycles): zusätzliche Taktschritte eines Busmasters, z. B. Prozessors, bei Überschreiten der minimalen Buszykluszeit (häufig auch als wait states bezeichnet). Whetstone: MWIPS (millions of whetstone instructions per second); Floating-Point-Benchmark mit Schwerpunkt auf Gleitpunktoperationen in mathematischen Funktionen. Zeichendichte, horizontale (character density): cpi (characters per inch); bei Textausgabe auf Bildschirmen und durch Drucker.
J113
J114
J Technische Informatik / Digitale Systeme
Zugriffszeit (access time): ns; bei Halbleiterspeichern: die Zeitdauer von der Speicheranwahl bis zur Datenbereitstellung (Lesen) bzw. Datenübernahme (Schreiben). Zykluszeit (cycle time): ns; bei Halbleiterspeichern: die Zeitdauer von der Speicheranwahl bis zur Bereitschaft für den nächsten Zugriff.
8 Betriebssysteme Die Software eines Rechners wird grob unterteilt in die Systemsoftware zur Verwaltung der Rechnerfunktionen und in die Anwendersoftware zur Lösung von Anwenderproblemen. Basis der Systemsoftware ist das Betriebssystem (operating system). Es „sitzt“ unmittelbar auf der Hardware und bietet der übrigen Systemsoftware sowie der Anwendersoftware eine von der Hardware abstrahierte, leichter handhabbare Schnittstelle in der Form von Systemaufrufen (Bild 8-1). Die übrige Systemsoftware unterstützt den Anwender beim Erstellen, Verwalten und Ausführen von Programmen. Zu ihr zählen z. B. die sog. Benutzerschnittstelle (über die der Benutzer mit dem Rechner kommuniziert), z. B. ein Kommandointerpreter oder eine grafische Oberfläche, weiterhin ein einfacher Editor sowie Assembler und Compiler für unterschiedliche Programmiersprachen. Die Anwendersoftware umfasst Programme wie Text- und Grafikprogramm (desktop publishing), Datenbankanwendungen, E-Mail-Programm, Internet-Browser usw. – Zur Vertiefung des Themas Betriebssysteme siehe z. B. [1, 4, 5].
mit dem Großrechner (main frame) als der zentralen Recheneinheit für viele Benutzer, anfangs ohne, später mit der Möglichkeit des Dialogbetriebs. Es folgte der Kleinrechner als persönlicher bzw. lokaler Arbeitsplatzrechner für den einzelnen Benutzer (Personal Computer, Workstation) bzw. in der Prozessdatenverarbeitung zur Steuerung technischer Systeme (Prozessrechner). Hinzu kamen die sog. eingebetteten Systemen (embedded control systems) als Steuerungen in z. B. Automobilen und Geräten allgemein. Heute dominiert die Vernetzung von Rechnern jeder Größenordnung mit ausgeprägter Kommunikation zwischen diesen und ihren Benutzern. 8.1.1 Stapelbetrieb
In den Anfängen der Rechnertechnik wurde die Abwicklung eines Rechenauftrags (job) durch den Bediener (operator) der Rechenanlage manuell über ein Bedienpult gesteuert. Dazu mussten das in Lochkarten gestanzte Programm und seine Daten in einem Lochkartenlesegerät bereitgestellt und das Programm eingelesen, übersetzt und gestartet werden. Mit den ersten Betriebssystemen wurde dieser Ablauf automatisiert und durch eingefügte Steueranweisungen einer Jobsteuersprache (job control language) gesteuert (Bild 8-2). Hinzu kam der automatische Jobwechsel, indem mehrere Jobs zu einem Stapel (batch)
Bild 8-1. Systemstruktur bei zwei Softwareebenen
8.1 Betriebssystemarten Die Begriffe für Betriebssysteme sind stark durch die Entwicklung der Rechnertechnik geprägt, beginnend
Bild 8-2. Lochkartenstapel mit Anweisungen zum Assemblieren, Laden und Starten eines Programms im Stapelbetrieb
8 Betriebssysteme
zusammengefasst und nacheinander abgearbeitet wurden (Stapelbetrieb, batch processing). Nachteilig für den Benutzer waren die langen Wartezeiten von der Abgabe eines Programms bis zum Erhalt der Ergebnisse. Durch den Einsatz von Magnetbandgeräten konnten die Wartezeiten reduziert und „gerechtere“ Strategien eingeführt werden, indem die Jobs nach ihrer Laufzeit vorsortiert und kürzere Jobs zuerst ausgeführt wurden. Eine weitere Verbesserung wurde durch die Überlappung von zentraler Verarbeitung und der Ein-/Ausgabe erreicht, indem für die Eingabe der Jobs und die Ausgabe ihrer Ergebnisse selbstständig arbeitende Ein-/Ausgabeeinheiten (DMA-Kanäle) eingesetzt wurden, unterstützt durch Magnetplattenspeicher für die Speicherung der Programme und Daten des Jobs und deren Ergebnisse. Heutzutage ist der Stapelbetrieb allenfalls eine Zusatzfunktion von interaktiven Betriebssystemen. Verarbeitungsabläufe werden dabei in sog. Script- oder Batch-Programmen festgelegt. Durch Zuweisung einer niedrigen Priorität kann die Jobbearbeitung in den Hintergrund gedrängt werden, sie kann jedoch einen Rechner auch in Zeiten schwacher Beanspruchung besser auslasten.
8.1.3 Einbenutzer- und Netzsysteme
8.1.2 Dialogbetrieb
Bemerkung. Ein Client-Server-System ist ggf. durch ein Speichernetz, ein sog. Storage Area Network (SAN) ergänzt, das Server und Hintergrundspeicher (Festplatten, Streamer) unabhängig vom vorhandenen Rechnernetz miteinander verbindet (siehe 7.1.6: Fibre Channel, InfiniBand).
Beim Dialogbetrieb teilen sich wie beim Stapelbetrieb viele Benutzer einen zentralen Rechner. Sie sind jedoch über eigene Terminals mit diesem verbunden und arbeiten interaktiv. Sie erhalten dazu den Rechner reihum für eine kurze Zeitscheibe zugeteilt (time slicing), sodass jeder Benutzer den Eindruck hat, den Rechner für sich allein zur Verfügung zu haben. Man sagt, jeder Benutzer habe seine eigene „virtuelle“ Maschine, und bezeichnet das Betriebssystem als Teilnehmersystem (time sharing system). Eine typische Anwendung des Dialogbetriebs sind die Transaktionssysteme, Teilnehmersysteme für die Verwaltung von Datenbanken mit sich laufend verändernden Datenbasen, wie sie etwa bei Kontoführungssystemen oder Buchungssystemen vorkommen. Sie müssen besonders die Konsistenz der Datenbasis gewährleisten und dementsprechend Simultanzugriffe auf einen Datensatz sicher verhindern.
Die gesunkenen Hardwarekosten haben es ermöglicht, anstelle des Einsatzes eines gemeinsamen „Zentralrechners“ jedem Benutzer einen eigenen „kleineren“ Rechner als Personal Computer oder Workstation zur Verfügung zu stellen. Die Betriebssysteme solcher Rechner sind zunächst Einbenutzersysteme (single-user systems), die sich durch eine komfortable Benutzeroberfläche auszeichnen. Innerhalb gemeinsamer Arbeitsumgebungen ist es üblich, solche Rechner miteinander zu vernetzen, um Ressourcen gemeinsam nutzen zu können. Am gebräuchlichsten sind hier Netze, in denen die gemeinsamen Ressourcen durch speziell ausgestattete Rechner, sog. Server, bereitgestellt werden, auf die die Benutzer als Klienten zugreifen: sog. Client-ServerSysteme. Ihnen gegenüber stehen die sog. Peer-to-peerSysteme, bei denen es keine Server gibt, sondern sich die Benutzer ihre Ressourcen über das Netz gegenseitig und mit gleichberechtigtem Zugriff zur Verfügung stellen. Jeder der Rechner hat bei dieser Vernetzung sein eigenes Betriebssystem, das jedoch um die für die Netzanbindung erforderliche Kommunikationssoftware erweitert ist.
8.1.4 Mehrbenutzer- und Mehrprogrammsysteme
Rechnernetze werden vielfach auch dazu genutzt, dem einzelnen Benutzer Rechenleistung auf anderen Rechnern im Netz zur Verfügung zu stellen. Dazu wählt sich der Benutzer von seinem Rechner aus in einen solchen anderen Rechner ein (remote log-in) und arbeitet dann unter dessen Betriebssystem. Dieses muss dementsprechend als Mehrbenutzersystem (multiuser system) ausgelegt sein, d. h., es muss gleichzeitig das Arbeiten des eigenen Benutzers wie auch das von externen Benutzern erlauben. Grundlage hierfür ist der Mehrprogrammbetrieb (multiprogramming), der üblicherweise auf der Basis
J115
J116
J Technische Informatik / Digitale Systeme
des Prozesskonzeptes realisiert wird (siehe 8.3.1). Hierbei können mehrere Programme in Form sog. Prozesse (tasks) gleichzeitig aktiv sein, wobei die Aktivitäten voreinander geschützt sind (multitasking). Steht dem einzelnen Rechner nur ein Prozessor zur Verfügung, so werden die Prozesse quasiparallel, d. h. zeitlich ineinander verzahnt ausgeführt; bei Mehrprozessorsystemen werden sie vom Betriebssystem auf die Prozessoren aufgeteilt. – Bemerkung: Das Multitasking wird häufig auch schon bei Einbenutzersystemen realisiert, um kürzere Wartezeiten durch quasiparallele bzw. echt parallele Ausführung von Anwender- und Systemprozessen zu erreichen.
8.2 Prozessorunterstützung
8.1.5 Verteilte Systeme
8.2.1 Privilegierungsebenen
Eine gegenüber dem Mehrbenutzerbetrieb verbesserte Nutzung der Leistungsfähigkeit eines Rechnernetzes erreicht man durch verteiltes Rechnen. Hierbei werden freie Rechenkapazitäten des Netzes in die Problembearbeitung eines Benutzers mit einbezogen, und zwar in der Weise, dass diese Aktivitäten für den Benutzer unsichtbar, man sagt transparent, bleiben. Die Rechner haben dabei keine individuellen Betriebssysteme mehr, vielmehr gibt es nur noch ein gemeinsames Betriebssystem, dessen Funktionen über die einzelnen Rechner verteilt sind. Man bezeichnet dies als ein verteiltes System.
In einem System mit zwei Privilegierungsebenen laufen die elementaren Betriebssystemfunktionen im privilegierten Supervisor-Modus und die Benutzeraktivitäten im nichtprivilegierten User-Modus ab. Den Benutzeraktivitäten rechnet man hierbei auch diejenigen Systemprogramme zu, die als Betriebssystemerweiterungen gelten, z. B. Compiler. Bestimmt wird die jeweilige Betriebsart durch ein Modusbit im Statusregister des Prozessors. Der Schutzmechanismus besteht zum einen in der prozessorexternen Anzeige der jeweiligen Betriebsart durch die Statussignale des Prozessors. Dies kann von einer Speicherverwaltungseinheit dazu genutzt werden, Zugriffe von im User-Modus laufenden Programmen auf bestimmte Adressbereiche einzuschränken (z. B. nur Lesezugriffe erlaubt) oder ganz zu unterbinden (siehe 7.2.2). Andererseits können der SupervisorEbene die vollen Zugriffsrechte eingeräumt werden. Der Schutzmechanismus besteht zum andern in der Aufteilung der Stack-Aktivitäten in einen Supervisorund einen User-Stack. Dazu sieht die Hardware oft zwei Stackpointerregister vor, die abhängig von der Betriebsart „sichtbar“ werden. Einen weiteren Schutz bieten die sog. privilegierten Befehle, die nur im Supervisor-Modus ausführbar sind. Zu ihnen zählen alle Befehle, mit denen die sog. Modusbits im Statusregister verändert werden können, so auch die Befehle für die Umschaltung in den User-Modus. Programmen, die im User-Modus laufen, ist neben der Einschränkung des Zugriffs auf die privilegierten Adressbereiche auch die Ausführung privilegierter Befehle verwehrt. Versuche, dies
8.1.6 Echtzeitsysteme
Eine gewisse Sonderstellung nehmen Rechnersysteme zur Steuerung technischer Systeme ein, da die Kommunikation mit ihnen primär nicht durch einen Benutzer, sondern durch ein technisches System erfolgt. Sie erfordern Betriebssysteme hoher Zuverlässigkeit, die in der Lage sind, auf kritische Zustände, wie sie z. B. durch Interruptsignale angezeigt werden, in vom technischen System diktierten Zeiträumen, d. h. in „Echtzeit“ zu reagieren. Die maximal zulässigen Reaktionszeiten liegen dabei im Bereich von Millisekunden. Diese sog. Echtzeitsysteme (real-time operating systems) sehen eine hierfür ausgewiesene Interrupt- und Prozessverwaltung vor (präemptives Multitasking, siehe 8.3). Sie müssen außerdem für eine effektive Fehlerbehandlung, d. h. Fehlerentdeckung und möglichst auch Fehlerbehebung ausgelegt sein.
Wesentlich für die Betriebssicherheit eines Rechners ist der Schutz der für den Betrieb erforderlichen Systemsoftware vor unerlaubten Zugriffen durch die Anwendersoftware (Benutzerprogramme). Grundlage hierfür sind die in der Prozessorhardware verankerten Betriebsarten (Modi) zur Vergabe von Privilegierungsebenen. Hier gibt es Systeme mit zwei oder mehr Ebenen. Eng verknüpft mit den Betriebsarten ist die Ausnahmeverarbeitung (exception processing), d. h. die Verwaltung von Programmunterbrechungen durch den Prozessor.
8 Betriebssysteme
zu durchbrechen, führen zu Programmunterbrechungen in Form von sog. Fallen (traps, siehe 8.2.2). Der Übergang vom Supervisor- in den User-Modus erfolgt durch einen der privilegierten Befehle (z. B. rte, return from exception), der Übergang vom Userin den Supervisor-Modus durch sog. Systemaufrufe (system calls, supervisor calls), realisiert durch TrapBefehle. 8.2.2 Traps und Interrupts
Programmunterbrechungen resultieren aus Anforderungen an den Prozessor, die Programmausführung zu unterbrechen und die Verarbeitung mit einer Unterbrechungsroutine fortzusetzen. Solche Anforderungen treten als Traps und Interrupts auf. Traps. Traps werden immer durch eine Befehls-
ausführung verursacht, lösen eine Anforderung also „synchron“ mit der Programmausführung aus. Sie entstehen dementsprechend vorwiegend prozessorintern, es gibt aber auch von außen kommende Trap-Signale. Typische Trap-Ursachen sind: – Division durch null (zero-divide trap), – Bereichsverletzung bei Operationen mit ganzen Zahlen in 2-Komplement-Darstellung (overflow trap), – Bereichsunterschreitung oder -überschreitung bei Gleitpunktoperationen (floating-point underflow bzw. floating-point overflow trap), – Aufruf eines privilegierten Befehls im User-Modus (privilege violation trap), – Aufruf eines Befehls mit nicht anwendbarem Operationscode (illegal instruction trap), – Fehler im Buszyklus, z. B. Ausbleiben des BereitSignals (bus error trap), – Zugriff auf eine nicht geladene Speicherseite (page fault trap; ermöglicht das Nachladen der Seite), – Ausführen eines Trap-Befehls (trap instruction trap als supervisor call, d. h. Betriebssystemaufruf), – Ausführen eines beliebigen Befehls bei gesetztem Trace-Bit im Prozessorstatusregister (trace trap; erlaubt das schrittweise Durchlaufen eines Programms für Testzwecke; die Trace-Trap-Routine dient dabei zur Statusanzeige). Interrupts werden durch prozessorexterne Ereignisse erzeugt, z. B. durch Anforderungen von
Interrupts.
Ein-/Ausgabeeinheiten oder von externen (technischen) Prozessen. Daher treten diese Anforderungen unvorhersehbar, d. h. „asynchron“ zur Programmausführung auf. Sie werden dem Prozessor als Interruptsignale zugeführt, die von ihm üblicherweise nach jeder Befehlsabarbeitung abgefragt werden. Maskierbare Interrupts bewirken bei Annahme einer Anforderung durch den Prozessor das Blockieren weiterer Anforderungen, indem dieser in seinem Prozessorstatusregister eine sog. Interruptmaske setzt. Abhängig davon, ob der Prozessor nur einen einzigen Interrupteingang hat oder ob er Interruptanforderungen codiert über mehrere Eingänge entgegennimmt, besteht diese Maske aus einem oder aus mehreren Bits. Bei z. B. einem 3-Bit-Interruptcode und einer 3-Bit-Interruptmaske können sieben Prioritätsebenen unterschieden werden (das übrige Codewort besagt, dass keine Anforderung vorliegt). Den 3-Bit-Code erzeugt ein externer Prioritätencodierer. Die Interruptmaske wird mit Abschluss der Interruptroutine (Befehl rte, siehe unten) durch Laden des ursprünglichen Prozessorstatus (Befehlszähler, Statusregister) wieder zurückgesetzt. Ein explizites Zurücksetzen kann, da die Maske zu den Modusbits des Statusregisters gehört, nur durch einen privilegierten Befehl erfolgen (8.2.1). Nichtmaskierbare Interrupts sind nicht blockierbar. Dies gewährleistet eine schnelle Reaktion bei nichtaufschiebbaren Anforderungen, z. B. das Retten des Rechnerstatus auf einen Hintergrundspeicher, wenn die Versorgungsspannung einen kritischen Grenzwert unterschreitet (power fail save). Ein spezieller Interrupt (Reset-Signal) dient zur Systeminitialisierung. Er setzt u. a. im Prozessorstatusregister den Supervisor-Modus (8.2.1), lädt den Befehlszähler und ein ggf. für den Supervisor-Modus eigenes Stackpointerregister mit zwei vorgegebenen Adressen des Betriebssystems und leitet dann die Programmausführung ein. Allen Interruptsignalen oder Interruptcodes sind Prioritäten zugeordnet, die für die Unterbrechbarkeit von Interruptroutinen maßgeblich sind. Höchste Priorität hat dabei das Reset-Signal. Interrupts können prozessorextern weiter nach Prioritätsebenen klassifiziert werden, womit sich mehrere Interruptquellen pro Signaleingang verwalten lassen (siehe 7.1.3). Bei der oben beschriebenen Mehrebenenstruktur für
J117
J118
J Technische Informatik / Digitale Systeme
maskierbare Interrupts bezieht sich diese Maßnahme auf die einzelnen Eingänge des Prioritätencodierers. 8.2.3 Ausnahmeverarbeitung (exception processing)
Eine Unterbrechungsanforderung bewirkt, sofern sie nicht durch den Prozessorstatus blockiert wird, eine Unterbrechung des laufenden Programms und führt zum Aufruf einer Unterbrechungsroutine (Bild 8-3). Damit verbunden sind das Retten des aktuellen Prozessorstatus (Befehlszähler, Statusregister) auf den Supervisor-Stack, das Setzen der Interruptmaske bei einer maskierbaren Anforderung, das Umschalten in den Supervisor-Modus, das Lesen der Startadresse der Unterbrechungsroutine aus einer sog. Vektortabelle, das Laden der Adresse in den Befehlszähler und das Starten der Unterbrechungsroutine. Die Rückkehr erfolgt durch einen privilegierten Rücksprungbefehl, der den alten Status wieder lädt (return from exception, rte). Wurde die Unterbrechung durch einen maskierbaren Interrupt ausgelöst, so ist sie wegen der dabei gesetzten Interruptmaske durch eine Anforderung gleicher Art nicht unterbrechbar, es sei denn, die Maske wurde innerhalb der Routine explizit zurückgesetzt. Das automatische Rücksetzen erfolgt erst mit dem Laden des alten Prozessorstatus durch den Rücksprungbefehl. Die Vektortabelle (Trap- und Interrupttabelle) ist eine vom Betriebssystem verwaltete Tabelle im Speicher für die Startadressen aller Trap- und Interruptroutinen. Bei der Unterbrechungsbehandlung erfolgt der Zugriff auf die Tabelle über eine der Anforderung zugeordnete Vektornummer, die der Prozessor als Tabellenindex benutzt. Bei einem Trap oder einem sog.
nichtvektorisierten Interrupt wird die Vektornummer, abhängig von der Trap-Ursache bzw. der aktivierten Interruptleitung, prozessorintern generiert. Bei einem sog. vektorisierten Interrupt wird sie von der anfordernden Interruptquelle bereitgestellt und vom Prozessor in einem Lesezyklus übernommen. Die der Quelle zugeordnete Vektornummer ist hierbei aus einem größeren Vorrat wählbar, d. h., es können bei nur einer Anforderungsleitung viele unterschiedliche Anforderungen verwaltet werden. Zu deren Priorisierung siehe 7.1.3.
8.3 Betriebssystemkomponenten Zu den wesentlichen Aufgaben eines Betriebssystems gehören: – die Abstraktion (als grundsätzliche, übergeordnete Aufgabe) durch Verbergen der Hardware und Herstellen des Rechnerzugangs auf einer höheren, logischen Ebene (siehe Bild 8-1), – das Verwalten der Betriebsmittel (resources, Hardware und Software), d. h. des Prozessors (oder der Prozessoren), des Hauptspeichers, der Hintergrundspeicher und der Ein-/Ausgabegeräte wie auch von Programmen (z. B. Editoren, Compiler, Textsysteme) und Daten, – das Gewährleisten der Systemsicherheit durch Schutzmechanismen, einerseits zwischen dem Betriebssystem und den übrigen Systemprogrammen sowie den Anwenderprogrammen, andererseits zwischen den Programmen verschiedener Benutzer, – das Bereitstellen einer Schnittstelle für die nicht zum Betriebssystem gehörende Systemsoftware sowie für die Anwendersoftware in Form von Systemaufrufen (system calls). Eine weitere Aufgabe, nämlich das Bereitstellen der Benutzerschnittstelle, wird durch das Betriebssystem sehr stark unterstützt. – Die wichtigsten Komponenten zur Durchführung dieser Aufgaben werden im Folgenden beschrieben. 8.3.1 Prozessverwaltung
Bild 8-3. Aufruf einer Unterbrechungsroutine, ausgelöst
durch einen maskierbaren Interrupt
Heutige Rechnersysteme sind durch parallel ablaufende Aktivitäten charakterisiert (multipro-
8 Betriebssysteme
gramming/-tasking). Hierbei handelt es sich entweder um echte Parallelität, z. B. bei der gleichzeitigen Ausführung eines Programms durch den Prozessor sowie der Abwicklung eines Ein-/ Ausgabevorgangs durch eine Ein-/Ausgabeeinheit (DMA-Controller) oder bei gleichzeitiger Ausführung mehrerer Programme, die auf mehrere Prozessoren oder mehrere Prozessorkerne verteilt sind (Mehrprozessor-/Mehrkernsystem). Oder es handelt sich um eine Quasiparallelität, z. B. wenn verschiedene Programme den Prozessor im Wechsel für eine begrenzte Zeit zugeteilt bekommen. „Von weitem“ betrachtet, kann auch diese Arbeitsweise als parallel angesehen werden. Um von den relativ komplizierten zeitlichen und örtlichen Abhängigkeiten dieser Abläufe zu abstrahieren, beruhen moderne Betriebssysteme auf dem Prozesskonzept. Als Prozess bezeichnet man im Prinzip ein Programm in seiner Ausführung [5], genauer, den zeitlichen Ablauf einer Folge von Aktionen, beschrieben durch ein Programm und die zu seiner Ausführung erforderliche Information. Diese umfasst den Befehlszähler, den Stackpointer und weitere Prozessorregister sowie die vom Programm benutzten Daten, z. B. die Variablenbereiche, Pufferadressen für die Ein-/Ausgabe und den aktuellen Status benutzter Dateien. Zur Verwaltung von Prozessen wird jedem ein Prozesskontrollblock zugeordnet, der dessen aktuellen Ausführungszustand (Prozessstatus) anzeigt. Während seiner „Lebenszeit“ befindet sich ein Prozess stets in einem von drei Zuständen (Bild 8-4). Er ist aktiv (running), wenn ihm ein Prozessor zugeteilt ist und sein Programm ausgeführt wird; er ist blockiert (blocked), wenn seine Weiterführung von einem Ereignis, z. B. der Beendigung eines Ein-/ Ausgabevorgangs, abhängt; und er ist bereit (ready, runnable), wenn dieses Ereignis eingetreten ist und er auf die Zuteilung eines Prozessors wartet. Prozesse im Zustand bereit sind in eine Warteschlange (pro-
Bild 8-4. Prozesszustände
cess queue) eingereiht. Die Zuteilung des Prozessors übernimmt der Scheduler des Betriebssystems. Bei einfachen Betriebsystemen leiten die Proze