Gewidmet meiner Familie
Quantenmechanik aus elementarer Sicht Buch1
Books on Demand
© 2013 Karl Fischer
Herstellung und Verlag: Books on Demand GmbH, Norderstedt
3. Auflage
ISBN 9783732209347
Die Quantentheorie gibt es seit gut 100 Jahren, die Quantenmechanik seit etwa 80 Jahren. Eine große Zahl von Wissenschaftlern und Professoren, abgesehen von den Entdeckern selbst haben seither viele Publikationen und Bücher veröffentlicht. So stellt sich die Frage, welche Nische übrig bleibt, mit der eine weitere Publikation, eben dieses Buch, seine Existenz rechtfertigt. Nun, es bringt jeder auch in Sachthemen eine subjektive Sicht ein, die erlaubt ist, sofern sie nicht falsch ist. Eine objektive Beschreibung der Dinge gibt es, menschlicherseits, nicht, so wie auch kein Mensch die Welt, schon rein optisch, genauso sehen kann wie ein anderer, denn da wo er ist, ist nicht der Andere, und ist er an derselben Stelle, so sieht er es mit „anderen Augen“. Auch kann man nicht die gesamte diesbezügliche Weltliteratur durchgehen, ob das schon vorhanden ist, und wenn es vorhanden ist, meistens ist es so, so will man es doch oft anders darstellen.
Zunächst vielleicht eine vereinfachte, aber griffige Unterscheidung der Begriffe:
Die Quantentheorie beschreibt quantenhafte Vorgänge in der Materie, ohne eigentlich zu wissen, was los ist, ohne zusammenhängende Hintergrundstheorie.
Sie ist verbunden mit dem Namen Planck mit der Einführung des Wirkungsquantums, symbolisch h, im Zusammenhang mit der Strahlungsformel für schwarze (Hohlraum)körper (1900),
mit dem Namen Lenard mit der Entdeckung des Photoeffekts, der Ablösung von Elektronen aus einer Metalloberfläche bei Bestrahlung mit Licht und deren Ausdeutung durch Einstein (1905),
mit dem Namen Compton und dem Comptoneffekt (1922), der Streuung von Röntgenstrahlen an einer Substanz (Graphit) und Messung der Streustrahlung, weiterhin mit Rutherford und seiner Streuformel. Dabei wird eine Goldfolie mit Alpha-Strahlen bestrahlt und die Winkelverteilung der herausfliegenden, gestreuten Alpha-Strahlen gemessen (1911).
Einen großen theoretischen Schritt brachte die Einführung des Begriffs Materiewellen, z.B. für Elektronen, in Analogie zu Lichtwellen durch de Broglie (1924), und deren experimenteller Nachweis durch Davidson und Germer (1927) bei der Ausdeutung der Reflexion von Elektronen an Nickel-Einkristallen.
Schließlich stehen die Namen Bohr und Sommerfeld, die ein Modell für das Wasserstoffatom erschlossen und Formeln für die Wellenlängen des von ihm ausgesandten Lichts (Spektrallinien) angaben (1913 bzw 1921). Dieses war notwendig, weil klassisch gesehen die Elektronen auf ihren Umläufen im Atom dauernd elektromagnetische Energie abstrahlen müssten und so ihre Energieniveaus nicht stabil sein könnten wie sie es tatsächlich sind.
Die Quantenmechanik mit den Entdeckern Schrödinger (1926) und Heisenberg (1925) brachte Licht über diese Phänomene und lieferte eine einheitliche Theorie, die sowohl den Korpuskelcharakter (z.B. Comptoneffekt) wie auch den Wellencharakter (Beugungsexperimente) von Licht und Materie(teilchen) widerspruchsfrei beschreibt.
Das vorliegende Buch unterstellt die Richtigkeit der Quantenmechanik ohne Hinterfragung.
Es beabsichtigt nicht, wie ein Lehrbuch alle Kapitel der Theorie durchzugehen, es beabsichtigt weiterhin nicht, sozusagen die Rolle der Entdecker nachzuspielen und anhand der Deutung der Experimente die Theorie neu einzuführen. Vielmehr hat es die Absicht, die Quantenmechanik, künftig mit QM abgekürzt, aus einem elementaren Blickwinkel neu hochzuziehen, wohl wissend, was die Ergebnisse sind und sein müssen.
Dieses beginnt mit der Einführung des Vektorraums, also von Vektoren und Matrizen, sowohl endlicher wie unendlicher Dimension, als mathematischer und erkenntnistheoretischer Basis für die QM. Davon ausgehend werden durch Grenzübergang mit immer feineren Schrittweiten, die bekannten kontinuierlichen reellen Größen und Variablen sowie Differentialquotienten (Differentialoperatoren), z.B. für Ort und Impuls, Zeit und Energie, inklusive ihrer Vertauschungsregeln abgeleitet. Letztere sind in der QM so zu sagen Alltag und bringen für die praktischen Rechnungen erhebliche Vereinfachungen gegenüber dem Diskontinuierlichem.
Weiterhin wird eingangs die QM nur für eine klassische Dimension entwickelt, konkret für den Ortsraum, so als gäbe es für eine punktartige Masse m, die man als greifbares Objekt einfach unterstellen muss, nur die eine Eigenschaft, dass sie sich am Ort x befindet, wobei jedem Ort x, und das ist das Neue der QM gegenüber der klassischen Mechanik, einem Vektor im Sinne der QM entspricht.
Wohl wissend, dass etwa ein konkretes Elementarteilchen mehr Eigenschaften hat, werden weitere Vektorräume eingeführt. So gibt es neben dem Raum für die Ortsvariable x auch die Räume für die Ortsvariablen y und z, für die Zeitkoordinaten t, und später auch den Raum für Spin s, Isospin I, usw.
Die Verbindung dieser (Vektor)räume geschieht prinzipiell, und dieser Ansatz wird durchgehalten, durch Produktbildung der Räume, durch Bildung des kartesischen Produkts der Räume, was man sich wie ein Nebeneinanderstellen denken kann.
So bekommt man einen systematischen Aufbau der QM, der nach oben offen ist, denn es ist von vornherein nicht festgelegt, welche Räume zur Beschreibung der Phänomene noch hinzugefügt werden sollen. So waren ursprünglich nur die Räume für Ort und Zeit x, y, z, t und und später auch für den Spin s vorgesehen. Eine adäquate Beschreibung der Elementarteilchen, z.B. des Typenpaares Proton-Neutron, brachte die Hinzufügung des Raumes für den Isospin, ebenfalls mittels Produktbildung.
Dieses Buch unterstreicht die Bedeutung formaler Beziehungen und den Vorrang formaler Beziehungen gegenüber der Anschaulichkeit. Ein Beispiel hierfür ist die hohe Bedeutung des Distributivgesetzes, insbesondere für die Addition von Vektoren (Linearkombination, Superpositionsprinzip, Spektralanalyse). Ein Beispiel für den Vorrang von Regeln, von Axiomen, vor der Anschaulichkeit ist die Gleichwertigkeit von Koordinatensystemen.
Ob ein Dreieck in einem Koordinatensystem auf Tafel1 oder in einem anderen auf Tafel2 gezeichnet wird, spielt offenbar keine Rolle. Gegebenenfalls kann man die Koordinaten von einem System aufs andere umrechnen. Es kommt eigentlich nur auf die Gestalt an.
Wendet man dieses Prinzip auf die Physik an, die Gleichwertigkeit von Koordinatensystemen, und fügt hinzu, eine Auswahl ist zu treffen, dass dann fundamentale Größen wie Elektronenmasse, Plancksches Wirkungsquantum, Lichtgeschwindigkeit und andere, in jedem Koordinatensystem gleich zu sein haben, so wird insbesondere wegen der Gleichheit der Lichtgeschwindigkeit in zueinander gleichförmig bewegten Koordinatensysteme, die spezielle Relativitätstheorie gewissermaßen erzwungen, obwohl sie anschaulich Probleme macht.
Das Buch baut die QM in ihren wesentlichen Zügen Schritt für Schritt auf, bringt aber auch Ungewöhnliches und Ergänzungen:
Die Herleitung der Impuls-Orts-Vertauschungsrelation aus dem diskreten Ortsraum heraus,
die Herleitung der Lösung der freien Diracgleichung durch doppelte Anwendung der Helizitätsgleichung,
dabei Ersatz der bekannten diesbezüglichen Matrizen durch leichter händelbare Produktmatrizen,
die Erweiterung der Pauli-Matrizen auf das n-Dimensionale samt Vertauschungsregeln und Anwendungen,
allgemeine Relationen über unendliche und endliche Anzahlräume,
die Einführung des Begriffs der Diagonalmatrizen samt Rechenregeln und Anwendungen,
die allgemeine Beziehung zwischen klassischen Gruppen und der QM-Transformationsgruppen wie Drehungen, Lorentztransformation,
die Herleitung der Drehimpulsalgebra aus allgemeinen Betrachtungen über Schiebeoperatoren,
die Herleitung der Maxwellgleichungen und weitere über verschiedene Wege, so über Spin-Matrizen und über eine neue Art von Ortsvektoren,
Ableitung der Feldstärkematrix samt Gleichung unmittelbar aus den Maxwellgleichungen heraus und vieles andere mehr.
Es werden auch Anfänge der Quantenfeldtheorie gebracht.
Das Buch bringt viele Beispiele und viele Nebenrechnungen, die im Allgemeinen in der Literatur fehlen.
Insofern ist es für den Nicht-Profi lesenswert, für den Profi ist vielleicht auch Interessantes vorhanden.
Es lohnt sich, hineinzuschauen und es zu lesen.
Jede Theorie braucht zunächst einmal Begriffe, auf die sich Verknüpfungen beziehen können. Typische Begriffe der klassischen Physik, insbesondere der Mechanik, der Physik des Massenpunktes, sind
die Ortskoordinaten x,y,z, vektoriell mit x oder r bezeichnet | ||
die Zeit t | ||
die Masse m | ||
daraus abgeleitete Größen wie | ||
die Geschwindigkeit | v | |
die Beschleunigung | b | |
die Kraft | K = m * b | Masse mal Beschleunigung |
der Impuls | p = m * v | Masse mal Geschwindigkeit |
der Drehimpuls | J = r x p | Ortsvektor kreuz Impulsvektor |
das Drehmoment | M = r x K | Ortsvektor kreuz Kraft |
die Energie | E = K * x | Kraft mal Weg |
Man kann x, t, m, v und b als elementare Größen betrachten, die nicht mehr zerlegbar sind,
K, p, J, M und E als zusammengesetzte Größen, die dann konkret eine größere Variationsbreite erlauben. Haben etwa zwei Massen gleichen Impuls, so müssen sie nicht in m und v übereinstimmen, es kann eine Masse größer als die andere sein und dafür die Geschwindigkeit kleiner. Weil die Energie darüber hinaus eine skalare (eindimensionale) Größe ist, ist die Variationsbreite besonders groß.
In der QM bleiben diese Begriffe erhalten, bekommen aber eine andere Gewichtung.
Im Blick stehen hier insbesondere die Begriffe Ort, Zeit, Impuls, Energie, Masse, Drehimpuls,
weniger die Begriffe Kraft, Geschwindigkeit, Beschleunigung.
Nun kommt der bedeutende Unterschied:
In der klassischen Mechanik entsprechen diesen Begriffen Variablen, Zahlen oder zu Vektoren vereinigte Zahlen,
in der QM entsprechen ihnen (Hilbert)vektoren und Operatoren (Matrizen)
Ein Beispiel:
Klassisch: Ein Massenpunkt m befinde sich am Ort x. x ist eine Variable.
Die Gesamtheit aller Orte bilden die x-Achse, die Menge aller reellen Zahlen.
QM: x ist keine Variable, sondern ein (Hilbert)vektor |x> x selbst dient zur Kennzeichnung des Vektors. Die Gesamtheit aller Orte bilden einen Vektorraum. Da es unendlich viele Werte von x gibt, sind es auch unendlich viele Vektoren. Die verschiedenen Werte von x sind in einem Operator, Matrix als so genannte Eigenwerte untergebracht, explizit oder implizit.
Was das nun auf sich hat, wird noch im Einzelnen erläutert werden.
Anmerkung: David Hilbert, deutscher Mathematiker (1862-1943)
Nun ist es nicht so, dass jede klassische Größe in der QM in einen Hilbertvektor übergeführt wird, sondern manche Größen bleiben Zahlen, insbesondere Parameter wie die Masse, elektrische Elementarladung, Lichtgeschwindigkeit, Planksches Wirkungsquantum, Koppelungskonstanten, usw
Auch sind die bei der Überführung entstehenden Vektorräume nicht immer unabhängig voneinander, sondern benutzen in manchen Fällen denselben Vektorraum auf verschiedene Weise und sind so gewissermaßen in Konkurrenz zueinander. So ist der Hilbertraum für Ort und Impuls eigentlich derselbe, was Abhängigkeit untereinander bewirkt (Unschärferelation).
Konkurrenz zwischen verschiedenen Variablen gibt es auch klassisch. So kann man für ein freies Teilchen Impuls und Energie nicht frei vorgeben, weil da Abhängigkeiten bestehen. In der QM wird diese Konkurrenz eine Stufe tiefer gelegt, eben Beispiel Ort und Impuls, auch Zeit und Energie. Das hat zur Folge, dass für quantenmechanische Berechnungen auch die Ausgangssituation, die Startwerte nicht immer in dem Umfang präzise vorgegeben werden können wie im Klassischen. Man kann, im Beispiel, einer Masse im Klassischen Ort und Geschwindigkeit (Impuls) beide exakt vorgeben, in der QM nicht oder nur mit Einschränkungen. Das wirkt sich natürlich auch auf die Ergebnisse aus. Man bleibt von Anfang bis Ende im System.
Man kann natürlich fragen, warum man nicht zu jeder klassischen Variablenart einen eigenen unabhängigen Vektorraum aufmacht, um das Problem der Konkurrenz nicht aufkommen zulassen. Das ist deswegen, weil zu einem Vektorraum meist mehrere Operatoren definierbar sind, die verschiedene klassische Variablen vertreten. Neben dem nun bekannten Beispiel ein anderes. Fasst man die drei unabhängigen Vektorräume für die Ortskoordinaten x, y und z zu einem zusammen, so sind darin nun auch die Drehimpulsoperatoren formulierbar, die untereinander und auch mit den anderen wiederum in Konkurrenz treten.
In der QM kommt eine neue Größe hinzu, die es klassisch nicht gibt, das sind die Wahrscheinlichkeitsamplituden, die Koeffizienten zu den (Hilbert)vektoren, die deren Isolierung aufheben und eine Verbindung zwischen ihnen herstellen. Aus ihnen sind dann Wahrscheinlichkeiten für physikalische Ereignisse errechenbar. Die Hilbertvektoren mit ihren Eigenwerten, auch Observable genannt, vertreten die experimentell erfassbaren Größen. Klassisch kennt man nur exakte Berechnung oder Rechnen mit Wahrscheinlichkeiten, aber eben nicht die Wahrscheinlichkeitsamplitude, sozusagen die „Wurzel aus der Wahrscheinlichkeit“.
Klassisch |
QM |
Variable x => Alle x-Werte |
Vektor zu x Operator X als Träger der x-Werte Vektorraum zu X mit Wahrscheinlichkeitsamplituden als Koeffizienten der Vektoren |
Elementar-Variable ohne Konkurrenz zueinander |
teilweise in Konkurrenz |
Man hat gewissermaßen eine Anhebung des Gesamtsystems von der Variablen-Ebene auf die Vektor-Ebene. Auch die Kompliziertheit der Rechnungen werden damit angehoben.
Die QM gilt als indeterministisch, wegen auch prinzipiell nicht weg retuschierbarer Wahrscheinlichkeiten, aber natürlich ist die Mathematik, die sie benutzt deterministisch, hier folgt aus dem Einen zwangsläufig das Andere. Das ist ihr fester Boden, auf dem sie steht.
Die QM beschäftigt sich hauptsächlich mit der Welt im Kleinen, mit atomaren Verhältnissen, wo das Plancksche Wirkungsquantum h nicht mehr vernachlässigbar ist. Hier hat sie das Sagen. Das Makroskopische, die Welt wie wir sie kennen, dagegen ist mehr das Feld der klassischen Physik. Tatsächlich hat die QM das Bestreben, das Kleine und noch Kleinere (Atome, Elementarteilchen) zu verstehen. Sie strebt ins Innere der Dinge.
Sowohl in der klassischen Physik wie in der QM ist der Begriff Vektor von großer Bedeutung.
Ein Vektor ist eine Kolonne von Zahlen, oft waagrecht geschrieben, dann spricht man von einem Zeilenvektor, senkrecht geschrieben, spricht man von einem Spaltenvektor.
Die einzelnen Zahlen eines Vektors heißen Komponenten des Vektors, die Anzahl der Zahlen in einem Vektor heißt Dimension. Unter einem n-dimensionalen Vektorraum versteht man die Gesamtheit der Vektoren der Dimension n. Bei komponentenhafter Darstellung eines Vektors schreibt man seine Komponenten in Klammern, entweder zeilenartig waagrecht oder spaltenartig senkrecht. Vektoren werden oft mit symbolischen Namen versehen und können so als Gesamtheit angesprochen werden. Darin liegt eine der Vorteile der Vektorrechnung.
Als Beispiel sei ein Raumpunkt mit seinen drei Koordinaten als Vektor dargestellt, etwa x = (2,-3,5), er hat also die Koordinaten x=2, y=-3, z=5.
Wie man am Beispiel sieht, geometrisiert man gern einen Vektorraum, indem man sich ein meist rechtwinkeliges n-dimensionales Koordinatensystem, im Beispiel n=3, zu Grunde liegend vorstellt, auch bei höheren Dimension n>3. In diesem Sinne kann man sich die Vektoren als Pfeile vorstellen, die vom Ursprung des KS ausgehen oder vom Pfeilschaft oder von der Pfeilspitze eines anderen Vektors oder von einem beliebigen Punkt ausgehen.
Durch seine Komponenten ist Richtung und Länge des Vektors fixiert, der Ausgangspunkt ist eigentlich beliebig.
Der Begriff Vektor wurde von Graßmann in die Mathematik eingeführt.
Anmerkung: Hermann Graßmann, deutscher Mathematiker, Physiker und Sprachforscher (1809-1877)
Beliebt ist natürlich wegen ihrer Anschaulichkeit die Darstellung zweidimensionaler Vektoren:
Figur:
Vektor a, Vektor b, Vektor c und es gilt hier offenbar c = a + b
Man kann Vektoren addieren oder subtrahieren, indem man die entsprechenden Komponenten addiert oder subtrahiert.
Man kann einen Vektor mit einem Faktor multiplizieren, indem man jede Komponente mit diesem Faktor multipliziert. Dabei bleibt die Richtung des Vektors gleich, er wird verlängert oder verkürzt oder gar in seiner Richtung umgekehrt, wenn der Faktor negativ ist.
Eine erste Gruppe von Axiomen für Vektoren kann also unmittelbar von den Axiomen für reelle Zahlen übernommen werden. Es gilt offenbar für Vektoren a, b und c
a + b = b + aKommutativgesetz für die Addition
Bei der Summenbildung können die Einzelvektoren nach Belieben vertauscht werden.
(a + b) + c = a + (b + c) Assoziativgesetz für die Addition
Bei der Summenbildung können Einzelvektoren nach Belieben zu Teilvektoren zusammengefasst werden.
Bezüglich von Faktoren gilt offenbar auch
a*(b*a) = a*b*a a*(a + b) = a*a + a*b sowie (a+b)*a = a*a + b*a
Letztere sind die Distributivgesetze für Faktoren.
Die Regeln für die Summenbildung von Vektoren eröffnen auch, umgekehrt gelesen, die Möglichkeit, einen Vektor nach Belieben in Einzelvektoren zu zerlegen, wenn nur deren Summe stimmt.
Von besonderer Bedeutung sind die Basisvektoren. Bei gedachter Zugrundelegung eines Koordinatensystems weisen sie je in Richtung einer Koordinatenachse.
Bei einem elementaren Basisvektor sind alle Komponenten gleich 0 bis auf die eine Komponente der betroffenen Achse. Sie lauten also der Reihe nach e1= (1,0,0,…), e2 = (0,1,0,…), e3 = (0,0,1,0,…), usw
Jeder Vektor ist in Basisvektoren zerlegbar oder kann, umgekehrt, aus ihnen kombiniert werden. Je nach Sicht kann man von einer Spektralzerlegung in Basisvektoren oder von einer Linearkombination aus Basisvektoren sprechen.
Gegeben seien die Basisvektoren e1, e2, …., en
Ein Vektor a kann dann dargestellt werden
durch a= a1*e1 + a2*e2 + … + an*en n ist die Dimension
ai sind die Komponenten des Vektors, man schreibt auch a = (a1, a2,…,an)
Der Vergleich zweier Vektoren a und b fällt leicht, wenn beide richtungsgleich oder richtungsentgegengesetzt sind, wenn sie sich also nur um einen Faktor unterscheiden. Trifft dies nicht zu, so stellt sich die Frage, was der Vergleich eigentlich aussagen soll.
Neben der Richtungsgleichheit ist die Orthogonalität zweier Vektoren, das zueinander Senkrechtstehen, ein besonderes Verhältnis zueinander hinsichtlich ihrer Lage, wie man aus der Geometrie allgemein kennt.
Bei Vorliegen ihrer Zahlenkolonnen kann man aber im Allgemeinen nicht unmittelbar erkennen, ob dies der Fall ist. Leicht hingegen tut man sich bei elementaren Basisvektoren.
Elementare Basisvektoren sind zu sich selber richtungsgleich, ansonsten orthogonal zueinander, weil nur eine Komponente ungleich 0 besetzt ist.
Es gibt daher Sinn, das skalare Produkt für Vektoren zunächst für elementare Basisvektoren einzuführen, das sowohl Richtungsgleichheit wie Orthogonalität ausdrückt, nämlich
Gegeben seien die elementaren Basisvektoren e1, e2, …., en
Dann ist deren Skalarprodukt gegeben durch
ei * ej = 1 wenn i = j die i-te Komponente ist je =1
Die Vektoren sind richtungsgleich.
ei * ej = 0 wenn i # j entsprechende Komponenten sind ungleich
Die Vektoren sind orthogonal zueinander.
Man kann darin auch die Multiplikation betroffener stellungsgleicher Komponenten sehen.
Gegeben sei nun ein Vektor a = a1*e1 + a2*e2 + … + an* en
sowie ein Vektor b = b1*e1 + b2*e2 + … + bn* en
Wir wenden nun das Distributivgesetz an und multiplizieren beide Ausdrücke
a*b = (a1*e1 + a2*e2 + … + an*en) * (b1*e1 + b2*e2 + … + bn*en)
Nun ist das Skalarprodukt der Basisvektoren mit verschiedenen Indizes gleich 0, so verbleibt
a * b = a1*b1 * e1*e1 + a2*b2 * e2*e2 + … = a1*b1 + a2*b2 + … + an*bn
Das ist nun die allgemeine Definition des Skalarprodukts zweier Vektoren. Das Ergebnis ist ein Skalar, eine Zahl
Allgemeine Eigenschaften des Skalarprodukts
Das Skalarprodukt eines Vektors mit sich selbst
a*a = a1* a1 + a2* a2 + … + an * an
ist geometrisch gesehen das Längenquadrat des Vektors und wird auch als Normquadrat des Vektors bezeichnet. Links ist das Quadrat der Hypothenuse, rechts sind die Quadrate der (An)katheten gemäß dem pythagoräischen Lehrsatz erkennbar. Das gilt nicht nur für den zwei-, drei-, sondern allgemein für den n-dimensionalen Raum.
Anmerkung: Pythagoras von Samos, griech. Philosoph (~570-500 v.Chr.)
Weiterhin gilt für das Skalarprodukt
a*b = b*a Kommutativgesetz, speziell bei Vektoren mit reellen Zahlen
(a + b) * c = a*c + b*c Distributivgesetz
a * (b + c) = a*b + a*c Distributivgesetz
Das Skalarprodukt einer Summe von Vektoren ist gleich der Summe der Saklarprodukte der Vektoren.
(f*a)*b = f * a*b speziell bei Vektoren mit reellen Zahlen, f ist ein Faktor
a*( f*b) = f * a*b
a*b = 0 wenn a und b orthogonal zueinander sind
Dass dieses die Bedingung für die Orthogonalität ist, wollen wir nun beweisen. Wir wählen einen anschaulichen geometrischen Beweis, schließlich stammt der Begriff rechter Winkel, senkrecht und orthogonal aus der euklidischen Geometrie und wurde erst nachträglich verallgemeinert.
Also:
Gegeben sei ein Vektor a, von dessen Pfeilspitze gehe ein Vektor b ab, sowie ein weiterer Vektor a. Wenn nun b senkrecht zu a sein soll, so muss die Pfeilspitze von b vom Beginn des ersten Vektors a und vom Ende des zweiten Vektors a gleichweit entfernt sein (siehe Figur):
Der erste Distanzvektor ist c = a + b
Der zweite Distanzvektor ist d = c - 2*a = b – a, wegen 2*a + d = c
Die Längen und somit auch die Längenquadrate der Distanzvektoren sollen gleich sein, also muss sein c*c = d*d
oder (a+b)*(a+b) = (b-a)*(b-a)
Ausrechnen ergibt a*a + b*b + 2* a*b = a*a + b*b – 2* a*b
Linke und rechte Seite können nur gleich sein, wenn a*b = 0 ist. Somit bewiesen.
Anmerkung: Euklid, griech. Mathematiker (~365-300 v.Chr.)
Nun ein Beispiel für orthogonale Vektoren im Zweidimensionalen.
Zu dem Vektor a = (a1,a2) ist der Vektor b = (-a2,a1) orthogonal.
Figur
Denn a*b = (a1,a2) * (-a2) = -a1 * a2 + a2 * a1 = 0
(a1)
Der erste Vektor wird als Zeile, der zweite als Spalte geschrieben.
Dieses verallgemeinert den Begriff des Basisvektors. Basisvektoren sind (im Allgemeinen) zueinander orthogonale Vektoren, die auf 1 normiert sind und den ganzen Vektorraum aufspannen. Für den n-dimensionalen Vektorraum braucht man n Basisvektoren. Es ist nicht möglich, einen Basisvektor durch die restlichen Basisvektoren des Vektorraums auszudrücken, zu kombinieren, denn seien ai die Basisvektoren und sei z.B. a1 = a2*a2 + … + an* an
Dann ergibt eine skalare Multiplikation von links mit a1 auf der linken Seite a1*a1 und auf der rechten Seite 0, ein Widerspruch.
Orthogonale Basisvektoren bringen es mit sich, dass das Normquadrat, das Skalarprodukt des Vektors mit sich, keine gemischten Terme enthält, sondern nur solche, die sich je auf einen Basisvektor beziehen. Das ist wichtig für die QM im Hinblick auf die Wahrscheinlichkeitsdeutung eines Zustandes. Sie kann dann verstanden werden als die Summe der Wahrscheinlichkeiten der Teilzustände (Basisvektoren). Das gilt auch für irgendeine Zerlegung des Raumes in orthogonale Vektoren, die ihrerseits durch mehrere Basisvektoren dargestellt werden.
Ist der Winkel zwischen den Vektoren a und b spitz, kleiner 90 Grad,
so ist a*b > 0, positiv. Das gilt auch für Winkel von 0 bis zu -90 Grad.
Ist der Winkel rechtwinkelig, gleich 90 oder -90 Grad, so ist a*b = 0
Ist der Winkel stumpf, grösser 90 bis 270 Grad, so ist a*b < 0, negativ
Allgemein:
Es gilt a*b = |a|*|b| * cosω ω ist der Winkel zwischen a und b, von a ausgehend.
|a|, |b| sind die Beträge, die Längen der Vektoren
Das Vektorprodukt, auch vektorielles oder Kreuzprodukt genannt, ist eigentlich nur im Dreidimensionalen definiert. Es ordnet zwei Vektoren a und b einen dritten Vektor c zu, der auf beiden senkrecht steht.
Dabei kann man sich allgemein der Fußregel bedienen: Steht der rechte Fuß auf dem ersten Vektor, der linke auf dem zweiten Vektor, so zeigt der Ergebnisvektor in Richtung des Rumpfes, des Kopfes (siehe Figur).
Wir wollen das Vektorprodukt zunächst anhand der elementaren Basisvektoren, der Einheitsvektoren in Richtung der Koordinatenachsen e1, e2, e3 definieren.
Es ist
e1 x e2 = e3
e2 x e3 = e1
e3 x e1 = e2
Das Ergebnis ist je der nächstfolgende Achsenbasisvektor.
Weiterhin gilt ei x ei = 0 für i=1,2,3
Das Vektorprodukt mit sich selbst ist gleich 0
Sowieei x ej = − ej x ei
Vorzeichenumkehrung beim Vertauschen, nicht kommutativ
Nun wenden wir das Distributivgesetz an und haben allgemein
a x b= (a1*e1 + a2*e2 + a3* e3) x (b1*e1 + b2*e2 + b3* e3) =
= a2*b3 * e2 x e3 + a3*b2 * e3 x e2
+ a1*b3 * e1 x e3 + a3*b1 * e3 x e2
+ a1*b2 * e1 x e2 + a2*b1 * e2 x e1
= (a2*b3 - a3*b2) * e1 Komponente in x-Richtung
+ (a3*b1- a1*b3) * e2 Komponente in y-Richtung
+ (a1*b2- a2*b1) * e3 Komponente in z-Richtung
In den Klammern sind die Komponenten des Ergebnisvektors bezüglich der x-, y- und z-Achse.
Der Ergebnisvektor steht auf a und b und somit auch auf der von ihnen aufgespannten Ebene senkrecht. Es gilt also (a x b) * a = (a x b) * b = 0
Man beweist das, indem man die Komponenten des Vektorprodukts wie die der Einzelvektoren einsetzt und das Skalarprodukt ausrechnet.
Nun einige unmittelbar einsehbare Rechenregeln
a x a =0
a x b= - b x a
(a + b) x c = a x c + b x c
a x (b + c) = a x b + a x c
f*a x b = a x f*b = f * (a x b)
Figur
Speziell: Zeigt a in Richtung der x-Achse, b in Richtung der y-Achse, so zeigt der Ergebnisvektor c in Richtung der z-Achse. Bei Anwendung der Fußregel darf man einen Vektor so verschieben, dass die Vektoren vom gleichen Punkt weggehen.
Wie man sieht, sind die Komponenten hinsichtlich ihrer Indizes antisymmetrisch, schiefsymmetrisch: Beim Vertauschen der Indizes i,j dreht sich das Vorzeichen um.
Beispiel: (a2*b3 - a3*b2) => (a3*b2 – a2*b3) = – (a2*b3 - a3*b2)
Die Vergabe der Indizes ist zyklisch: Zum Basisvektor1 gehören die Komponentenindizes 2,3, zum Basisvektor2 die Indizes 3,1 und zum Basisvektor3 die Indizes 1,2.
Schreibt man die Indizes mehrfach an, dann sind es jeweils die beiden Folgeindizes, also 1 2 3 1 2 3 1 2 3 … Auf 1 folgt 2,3, auf 2 folgt 3,1, usw
In der Elektrodynamik wird das Vektorprodukt auch im Vierdimensionalen verwendet. Man ergänzt die Vektoren je um eine nullte Komponente, die Zeit– Komponente:
Statt a hat man dann (a,a0), statt b hat man (b,b0) und man definiert allgemein
(a,a0) x (b,b0) = (a x b, a0*b – a* b0)
Es entstehen so zwei dreidimensionale Vektoren. Der erste, das Ergebnis des gewöhnlichen Vektorprodukts, ist senkrecht zu den Vektoren a und b, der zweite liegt in der von a und b aufgespannten Ebene.
Wesentlich dabei ist die Schiefsymmetrie der Komponenten. Diese gilt auch für den zweiten Vektor.
Beispiel: (a0*b1 – a1*b0) => (a1*b0 – a0*b1) = - (a0*b1 – a1*b0)
Nun Rechenregeln für die kombinierte Verwendung von Skalar- und Vektorprodukt.
a * (b x c) = b * (c x a) = c * (a x b)
Ergebnis ein Skalar. Die Vektoren a, b, c können hier zyklisch vertauscht werden.
a x (b x c) = (a*c) * b – (a*b) * c
Das Ergebnis ist ein Vektor in der von b und c aufgespannten Ebene.
(a x b) * (c x d) = (a*c) * (b*d) – (b*c) * (a*d)
Das Ergebnis ist ein Skalar.
a x (b x c) + b x (c x a) + c x (a x b) = 0
Die Summe der zyklischen Vertauschungen führt zum Nullvektor.
Vektoren, die bei Raumspiegelung ihr Vorzeichen umkehren, im Kontext die Vektoren a und b, nennt man polare Vektoren, denn aus a wird –a und aus b wird –b,
Vektoren, die bei Raumspiegelung ihr Vorzeichen behalten, also gleich bleiben, nennt man axiale Vektoren, hier a x b, denn (-a) x (-b) = a x b.
Ausgangspunkt ist die Beziehung zwischen Beschleunigung d2r/dt2 und Kraft K für eine Masse m gemäß Newton, nämlich
Masse mal Beschleunigung ist gleich Kraft
Man multipliziert die Gleichung von links mit dem Ortsvektor r vektoriell und hat r x m*d2r/dt2 = r x K
Aus der ersten richtigen Gleichung, dem Newton-Gesetz, folgt so wieder eine richtige Gleichung.
Auf diese Weise kommt sozusagen der Drehimpuls die Welt:
Nun ist d/dt(r x dr/dt) = (dr/dt x dr/dt) + (r x d2r/dt2) = r x d2r/dt2
Der erste Term ist 0, weil generell a x a = 0 ist.
Somit kann man die Gleichung weiter schreiben zu
d/dt(r x m*dr/dt) = r x K oder d/dt(r x p) = r x K
Dabei ist p = m*dr/dt, der Impuls
Man definiert nun
L = (r x p) als den Drehimpuls und M = r x K als das Drehmoment und
hat so das Gesetz
Die zeitliche Änderung des Drehimpulses ist gleich dem Drehmoment.
Das bedeutet:
Der Drehimpuls L ist ein (axialer) Vektor, wie auch das Drehmoment.
Er steht gemäß Fußregel senkrecht auf r und p.
Der Vektor bleibt konstant, wenn keine Kraft, kein Drehmoment einwirkt.
Der Vektor bleibt auch konstant, wenn eine Kraft einwirkt, die in Richtung oder Gegenrichtung zum Ortsvektor r ist, weil dann M ~ r x r = 0 ist.
Das ist der Fall bei zentraler Kraft, z.B. Sonne-Planeten (Keplersche Flächensatz).
Der Änderungsvektor des Drehimpulses dL
bei Einwirken eines Drehmoments r x K ist senkrecht zu r und K,
also senkrecht zu der von ihnen gebildeten Ebene.
Der Keplersche Flächensatz besagt, der Fahrstrahl Sonne-Planet überstreicht in gleichen Zeiten gleiche Flächen. Das ist unmittelbar einsehbar bei einer kreisförmigem Bahn, nicht aber, wenn die Bahn eine Ellipse, eine Parabel oder eine Hyperbel ist, weil dann die Bahngeschwindigkeit nicht gleich bleibt.
Anmerkung:
Isaac Newton, engl. Physiker, Mathematiker, Astronom (1643-1727)
Anmerkung:
Johannes Kepler, deutscher Astronom und Mathematiker (1571-1630)
Vom (Koordinaten)Ursprung, dem Lager, gehe aus eine um ihn freibewegliche Achse a, an deren Ende sich eine mittig um sie rotierende Hantel (2 Punktmassen m je mit Abstand r zur Achse) angebracht ist. Die Hantel, der Kreisel, möge im Gegen-Uhrzeigersinn bei Sicht vom Achsenende her rotieren. Ist die Achse in Richtung der z-Achse, so ist es die gewohnte Draufsicht.
Figur:
a Vektor der Achse vom Ursprung bis Achsenende
r Vektor Achsenende zur Punktmasse1, -r zur Punktmasse2
r1Vektor Ursprung zur Masse1, gleich a+r
r2Vektor Ursprung zur Masse2, gleich a - r
p1Impuls der Masse1, gleich m * v
p2Impuls der Masse2, gleich m * (-v)
v Rotations-Geschwindigkeit der Masse1, -v die für Masse2
KKraft auf Masse1 bzw Masse2, die Schwerkraft, entgegen der z-Achse gerichtet
L Drehimpuls der beiden Massen
dLÄnderung des Drehimpulsvektors in der Zeit dt
MDas durch die Kraft hervorgerufenen Drehmoment
Der Drehimpuls der beiden Massen ist
L = r1 x p1 + r2 x p2 = (a+r) x m*v + (a-r) x m*(-v) = 2*m* (r x v)
Also gleich der Summe der Einzeldrehimpulse, sichtlich nicht direkt abhängig von a.
Der Vektor (r x v), somit auch L, zeigt gemäß Fußregel in die gleiche Richtung wie die Achse a (bei Rotation im Gegenuhrzeigersinn, ansonsten dagegen). Das ist ein wichtiges Zwischenergebnis. Obwohl der Drehimpuls von der Lage des Koordinatensystem-Ursprungs abhängt, ist er hier gerade so, als läge der Ursprung im Rotationsmittelpunkt. Das gilt erkennbar auch dann, wenn zwischen a und r kein rechter Winkel besteht. Das erlaubt die Addition von Einzeldrehimpulsen, die je für sich auf ihren Mittelpunkt bezogen sind, z.B. den Spins von Elektronen (siehe später).
Das auf die beiden Massen wirkende Drehmoment wegen der an ihnen ansetzenden (Schwer)kraft ist
M = r1 x K + r2 x K = (a+r) x K + (a-r) x K = 2*(a x K)
Unabhängig von r, so als wären beide Massen am Achsenende angebracht.
Gemäß Fußregel ist M waagrecht, parallel zur x-y-Ebene, und zeigt von a ausgesehen nach links. Zur Erleichterung: Wäre a in Richtung der x-Achse, so würde K in Gegenrichtung zur z-Achse zeigen und M würde in Richtung der y-Achse zeigen.
Die Änderung des Drehimpulsvektors in der Zeit dt ist dL = M * dt, also gleichgerichtet wie M, dL ist kleines Stück des Präzessionskreises, waagrecht zeigend, und senkrecht zu L, denn das Skalarprodukt L * dL ist proportional
(r x v) * (a x K) = (r*a)*(a*K) - (v*a)*(a*K) = 0 ,
weil r wie auch v senkrecht zu a sind, also r*a= 0 und v*a=0.
Unter Präzession versteht man hier den Umlauf der Drehimpulsachse um die z-Achse, also die von Spielkreiseln bekannte kreisende Bewegung der Kreiselachse um die Senkrechte.
Die Richtungen sind bekannt, nun die Beträge, die Längen der Vektoren:
K = m*g g = Erdbeschleunigung = 9.81 m/sek
ω ist die Rotationsgeschwindigkeit um die Achse im Bogenmaß,
es ist v = r*ω,
M = |M| = 2*|a x K| = 2*a*K*sinθ θ =Winkel von der z-Achse zur Drehachse ωp Präzessionswinkel dωp dessen Zuwachs im Bogenmass
Nun die Präzession:
Es ist dL = L*sinθ * dωp, ein Stück auf dem Präzessionskreis, einerseits,
sowie dL = M * dt = 2*a*K*sinθ * dt, Drehmoment mal dt, andererseits,
somit L*dωp = a*2*K * dt, also ist die
Präzession =
dωp/dt = a*2*K/L = a*2*m*g / (2*m*r*v) = a*g /(r*v) = a*g /(r2*ω).
Sie ist also unabhängig von den Massen m und dem Neigungswinkel θ der Kreiselachse.
Also genügt es für die Berechnung, die Drehachse waagrecht anzunehmen:
Allgemein gilt dann dωp/dt = Drehmoment / Drehimpuls, wie es auch hier der Fall ist und beweisbar ist, indem man sich das Drehobjekt aus vielen symmetrisch um die Drehachse angeordneten Massen m bzw differenziell dm zusammengesetzt denkt.
Bezeichnen wir die Gesamtmasse des rotierenden Objekts mit m,
so haben wir in unserem Fall, Hantel, waagrechte Achse, m =2*m,
das Drehmoment = a*m*g und den Drehimpuls = m*r2*ω.
Ist stattdessen am Achsenende eine rotierende Scheibe oder eine Kugel der Gesamtmasse m mit dem Radius r zentrisch angebracht,
so ist das Drehmoment ebenfalls a*m*g, aber
der Drehimpuls der Scheibe ist ½*m*r2*ω und
der Drehimpuls der Kugel 2/5*m*r2*ω
Den vor ω liegenden Term nennt man Drehmasse θ, also
bei einer Scheibe θ = ½*m*r2,
bei einer Kugel θ = 2/5*m*r2 und
bei einem dünnen Kreisring (idealisiertes Rad) θ = m*r2.
Der Umlaufsinn der Präzession ist derselbe wie der Rotationssinn des Kreisels. In der Ableitung hier war linksdrehend, gegen den Uhrzeigersinn angenommen worden, bei rechtsdrehend ändern sich entsprechende Vorzeichen.
Der Kreisel mit seiner Präzession, obwohl ein Beispiel der klassischen Physik, strapaziert durchaus die Anschaulichkeit. Dass etwa eine rotierende Scheibe ihre Lage stabil halten will, wie etwa eine rollende Kugel ihre Bewegungsrichtung, ist einsehbar. Dass sie aber auf eine einwirkende Kraft nicht in Richtung der Kraft, sondern senkrecht dazu ausweicht, ist ohne Vorwissen verblüffend. Mathematiker und Physiker tun sich da leichter, indem sie es auf die zu Grunde liegenden elementaren Gesetze zurückführen. Die Bewegungsgleichungen für einen Kreisel wurden umfassend von Euler (Mechanica, 1736) aufgestellt.
Von Interesse mag auch sein das Verhältnis von kinetischer Energie zur Rotationsenergie einer massiven rollenden Kugel der Masse m und dem Radius r, etwa einer Billardkugel ohne Schlupf.
Die kinetische Energie ist Ekin = ½*m*v2 = ½*m*r2ω2
mit Winkelgeschwindigkeit ω = 2πν ν = Anzahl Umdrehungen pro Sekunde Die Rotationsenergie ist Erot = ½*θ*ω2 = ½*(2/5*m*r2)*ω2 für die Kugel
Somit ist das Verhältnis Ekin: Erot = 5:2 bei einer Kugel
Die Gesamtenergie ist E = Ekin + Erot Somit sind davon
etwa 71% kinetische Bewegungsenergie und 29% Rotationsenergie.
Analoge Rechnungen für eine Scheibe ergeben Ekin: Erot = 2:1
entsprechend 67% bzw 33%
Analog bei einem dünnen Kreisring (Rad) Ekin: Erot = 1
entsprechend 50% bzw 50%
Da ein Rad auch noch Speichen oder einen sonstigen Radialteil hat, ist der Anteil der Rotationsenergie in Praxis kleiner, aber größer als bei einer Scheibe.
Eine Matrix, eine Tabelle von Zahlen, kann man auffassen als eine Ansammlung von Spaltenvektoren.
Sind es die elementaren Basisvektoren, also (e1, e2, …., en), so ergibt jeder
Basisvektor einen Spaltenvektor der Art
( 1 0 0 0… )
( 0 1 0 0… )
( 0 0 1 0 …)
( 0 0 0 1 …)
Konkret handelt es sich hier um die Einheitsmatrix, die Hauptdiagonale ist mit Einsen besetzt, alle anderen Elemente sind gleich 0.
Die Spaltenvektoren können beliebige Vektoren sein.
So wollen wir die Elemente der Matrix wie folgt bezeichnen
(A11 A12 A13…)
(A21 A22 A23…)
(A31 A32 A33…)
(…. )
Der erste Index gibt die Nummer der Zeile an,
der zweite Index die Nummer der Spalte,
also in unserem Sinne die Nummer des Spaltenvektors an.
In der QM werden meist quadratische Matrizen benutzt, deren Zeilen und Spalten also die gleiche Dimension n haben, z.B. n = 2,3 oder gar unendlich.
Produkt Matrix mal Vektor
Sei also eine Matrix geben als eine Ansammlung von Spaltenvektoren,
also A = (a1, a2, …., an),
sei ferner gegeben
ein Vektor b = b1*e1 + b2*e2 + …+ bn* en = (b1 , b2 ,…, bn).
Das Produkt Matrix mal Vektor A*b = c ist dann nichts anderes als der Austausch der
Basisvektoren e1, e2, …., en im Vektor b gegen die Vektoren a1, a2, …., an
also b => c = b1*a1 + b2*a2 + … + bn*an
Es ist nun nicht mehr derselbe Vektor, sondern der Vektor ist transformiert, seine Komponenten sind gleich geblieben, aber die Basis ist eine andere, nämlich die, die durch die Matrix vorgegeben ist. Die neue Basis kann man interpretieren als die Achsen eines neuen Koordinatensystems, die auch Längen verschieden von 1 haben dürfen und nicht zueinander senkrecht sein müssen. Deren Koordinaten wie der des Vektors und Ergebnisvektors werden im Einheits-System ausgedrückt. Es geht nie anders, man braucht letztlich immer ein normiertes, orthogonales, elementares Hintergrunds-Basissystem. Das Produkt Matrix mal Vektor bewirkt also eine Transformation des Vektors.
Sind die Spaltenvektoren orthogonal zueinander und auf 1 normiert, also ein äquivalenter Ersatz für die Einheitsvektoren, so spricht man von einer orthogonalen Matrix.
Für die Multiplikation schreiben wir kurz c = A * b.
Bei Umsetzung in Komponentenschreibweise wird daraus
ci = Aij*bj summiert über j
ci sind die Komponenten des Ergebnisvektors, eines Spaltenvektors.
Beispiel: c2 = A21*b1 + A22*b2 + A23*b3 + …
Man multipliziert also je die Elemente einer Zeile der Matrix mit den Komponenten des Vektors der Reihe nach, summiert und ordnet sie als Spalte an.
Beispiel für das Dreidimensionale
Das Produkt Matrix mal Matrix
Es seien gegeben die Matrizen A und B
Jeder Spaltenvektor der Matrix B versteht sich nun wie ein Vektor b im obigen Sinne, ein Vektor auf Basis der Einheitsvektoren. Die Multiplikation mit der Matrix A bewirkt nun wieder einen Austausch dieser Basis durch deren Spaltenvektoren und das nun für jeden Spaltenvektor von B.
Wir schreiben kurz C = A * B, verwenden obige Formel für die Komponenten und haben als Produktformel für die Elemente Cik =Aij * Bjk über j summiert.
Dieses ist wiederum eine Matrix mit den Elementen Cik
Beispiel:
C21 = A21*B11 + A22*B21 + A23*B31 + … Element ij = Zeile i mal Spalte j
Rechenregeln für Matrizen
A + B = B + Akommutativ bezüglich der Summe
A + (B + C) = (A+ B) + Cassoziativ bezüglich der Summe
A* (B*C) = (A*B)* Cassoziativ bezüglich des Produkts
(A+B) * C = A*C + B*C distributiv
C * (A+B) = C*A + C*B distributiv
A*B # B*Aim Allgemeinen nicht kommutativ bezüglich des Produkts
Von besonderer Bedeutung ist die Einheitsmatrix, die wir bereits eingeführt haben. Sie sei mit E benannt. Für sie gilt allgemein A*E = E*A.
Wichtig ist auch die zu A gehörende inverse Matrix A-1.
Aber nicht immer gibt es sie.
Es gilt, falls sie existiert A * A-1 =A-1 *A =E
Es gilt weiterhin(A*B)-1 = B-1 * A-1
Voraussetzung für die Existenz einer inversen Matrix ist, dass die Determinante der Matrix ungleich 0 ist. Die Determinante D ist das Volumen des von den Spaltenvektoren (oder auch Zeilenvektoren) aufgespannten Parallelgebildes, die man sich vom Ursprung ausgehend denkt und parallel zu einem Volumen ergänzt. Im Zweidimensionalen ist es ein Parallelogramm. Es kann auch einen negativen Wert haben. Konkret ist da D = A11*A22 – A12*A21.
Die Determinante ist sicher gleich 0, wenn ein Spaltenvektor (oder Zeilenvektor) ein Nullvektor ist, also nur aus Nullen besteht, aber auch dann, wenn einer von ihnen aus anderen kombinierbar ist, wenn sie also nicht den vollen n-dimensionalen Raum aufspannen. Das umschlossene Volumen des Parallelgebildes ist dann gleich 0.