R.M. Dreizler und C.S. Lüdde Mathematische Ergänzungen III 1. Juni 2007 Springer Berlin Heidelberg NewYork Barcelona Hong Kong London Milan Paris Singapore Tokyo Vorwort Der dritte Mathematikteil erweitert die Liste der Eigenschaften der speziellen Funktionen, bespricht die mathematischen Grundlagen des Randwert- und des Eigenwertproblems, das in der Quantenmechanik eine besondere Rolle spielt, und ergänzt die Diskussion durch einen Ausflug in die Numerik. Die numerische Behandlung des Eigenwertproblems in algebraischer Form wird in allen Zweigen der Physik benutzt und gehört somit zum Rüstzeug des Fachs. Die in diesem Teil zitierten Literaturstellen sind im Anhang aufgeführt. Inhaltsverzeichnis 1 Rand- und Eigenwertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Das Randwertproblem für inhomogene, lineare Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.1 Das Lemma von Picone . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 Das Sturm-Liouvillesche Eigenwertproblem . . . . . . . . . . 5 1.2.3 Das Sturm-Liouville Problem: Beispiele und Erweiterung 11 2 Weitere spezielle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Die konfluente hypergeometrische Funktion . . . . . . . . . . . . . . . . 2.1.1 Ableitungen und Integrale . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Rekursionsformeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Integraldarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.4 Asymptotische Entwicklungen . . . . . . . . . . . . . . . . . . . . . . 2.1.5 Spezialfälle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.6 Die Whittacker Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Die Hermiteschen Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Die erzeugende Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Die Rodriguesformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Orthogonalitätsrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Ableitungs- und Rekursionsformeln . . . . . . . . . . . . . . . . . 2.2.5 Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Die einfachen Laguerreschen Polynome . . . . . . . . . . . . . . . . . . . . 2.3.1 Die erzeugende Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Die Rodriguesformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Die Orthogonalitätsrelation . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Rekursionsformeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Die zugeordneten Laguerreschen Polynome . . . . . . . . . . . . . . . . 2.4.1 Die erzeugende Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Die Rodriguesformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Rekursionsformeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 Integrale mit den zugeordneten Laguerrepolynomen . . . 2.4.5 Additionstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index . . 17 17 21 23 23 24 25 26 27 29 30 31 32 33 35 36 37 38 39 39 42 43 43 44 46 46 VIII Inhaltsverzeichnis 2.5.1 Die Bessel-Riccati Funktionen . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Die sphärischen Besselfunktionen . . . . . . . . . . . . . . . . . . . 2.5.3 Eine Integraldarstellung der regulären Bessel-Riccati Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Die Fresnelintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Die Betafunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 46 50 54 56 62 Das algebraische Eigenwertproblem . . . . . . . . . . . . . . . . . . . . . . . 65 3.1 Die Jacobimethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 1 Rand- und Eigenwertprobleme Ein Randwertproblem liegt vor, wenn die Werte der Lösung einer Differentialgleichung an verschiedenen Stellen vorgegeben sind. Die Diskussion von Randwertproblemen in diesem Kapitel soll auf den für die Physik wichtigen Fall von (gewöhnlichen) Differentialgleichungen zweiter Ordnung beschränkt bleiben. Da die allgemeine Lösung einer Differentialgleichung zweiter Ordnung zwei Integrationskonstanten enthält, muss man zur Festlegung der Lösung des entsprechenden Randwertproblems genau zwei Bedingungen, meist an den Randpunkten eines Intervalls, vorschreiben. Die Lösung von Randwertproblemen mit nichtlinearen Differentialgleichungen ist recht schwierig, insbesondere kann die Frage nach der Existenz und der Eindeutigkeit der Lösung nicht allgemein beantwortet werden. Die Situation ist hingegen einfacher für Randwertprobleme mit linearen Differentialgleichungen. Es ist nützlich, das Randwertproblem für homogene und nichthomogene Differentialgleichungen getrennt zu betrachten, wobei der nichthomogene Fall, der in der Quantenmechanik keine besondere Rolle spielt zuerst angedeutet wird. 1.1 Das Randwertproblem für inhomogene, lineare Differentialgleichungen zweiter Ordnung Die Lösung der linearen Differentialgleichung d2 y(x) dy(x) + p2 (x)y(x) = f (x) + p1 (x) 2 dx dx kann in der Form p0 (x) (1.1) y(x) = C1 y1 (x) + C2 y2 (x) + y0 (x) (1.2) angegeben werden. Dabei stellen {y1 (x), y2 (x)} ein Fundamentalsystem von Lösungen der homogenen Differentialgleichung und y0 (x) ein Partikulärintegral der inhomogenen Differentialgleichung x [y1 (z)y2 (x) − y1 (x)y2 (z)]f (z) y0 (x) = (1.3) dz W (z)p0 (z) dar. Die Größe W ist die Wronskideterminante der Lösungen der homogenen Differentialgleichung 2 1 Rand- und Eigenwertprobleme dy2 (z) dy1 (z) − y2 (z) . dz dz Sind zwei Fundamentallösungen bekannt, so kann man (vergleiche Band 1, Math.Kap. 2.2.2) die Lösung des inhomogenen Randwertproblems in dem Intervall a ≤ x ≤ b, das z.B. durch die Randbedingungen W (z) = y1 (z) y(a) = α und y(b) = β (1.4) gestellt wird, mit Hilfe von Greenschen Funktionen angeben. Man bestimmt die Integrationskonstanten C1 und C2 aus dem Gleichungssystem C1 y1 (a) + C2 y2 (a) = α − y0 (a) C1 y1 (b) + C2 y2 (b) = β − y0 (b) , setzt die Lösung in (1.2) ein und sortiert die inhomogenen Beiträge gemäß (1.3) . Das Resultat ist y(x) = [αy2 (b) − βy2 (a)]y1 (x) − [αy1 (b) − βy1 (a)]y2 (x) y1 (a)y2 (b) − y1 (b)y2 (a) + b dz G(x, z)f (z) . a Die Greensche Funktion des Randwertproblems hat die explizite Form ⎧ [y1 (x)y2 (b) − y1 (b)y2 (x)][y1 (z)y2 (a) − y1 (a)y2 (z)] ⎪ ⎪ ⎪ ⎪ [y1 (a)y2 (b) − y1 (b)y2 (a)]W (z)p0 (z) ⎪ ⎪ ⎪ ⎪ ⎨ f ür a ≤ z ≤ x ≤ b G(x, z) = . ⎪ ⎪ ⎪ [y1 (x)y2 (a) − y1 (a)y2 (x)][y1 (z)y2 (b) − y1 (b)y2 (z)] ⎪ ⎪ [y1 (a)y2 (b) − y1 (b)y2 (a)]W (z)p0 (z) ⎪ ⎪ ⎪ ⎩ f ür a ≤ x ≤ z ≤ b Die allgemeine Bedingung für die Existenz und Eindeutigkeit der Lösung ist gemäß diesen Resultaten, die Relation y1 (a)y2 (b) − y1 (b)y2 (a) = 0 . 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung Zur Diskussion steht unter dieser Überschrift die Lösung der Differentialgleichung d2 y(x) dy(x) + p2 (x)y(x) = 0 + p1 (x) dx2 dx mit den Randbedingungen p0 (x) (1.5) 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung y(a) = 0 und y(b) = 0 (1.6) in dem Intervall a ≤ x ≤ b . Verallgemeinerungen bezüglich der Form der Randwerte und des Intervalls werden später angesprochen. Besondere Bedeutung kommt dem Randwertproblem mit der Differentialgleichung d dy(x) p(x) + (q(x) + λr(x))y(x) = 0 (1.7) dx dx bzw. d2 y(x) + p(x) dx2 dp(x) dx dy(x) + (q(x) + λr(x))y(x) = 0 dx zu. Im Allgemeinen werden nichttriviale Lösungen (y(x) ≡ 0) dieser Differentialgleichung nur für bestimmte Werte des Parameters λ möglich sein. Die Bestimmung dieser Eigenwerte und die Bestimmung sowie die Untersuchung der zugehörigen Eigenfunktionen ist der Inhalt des Sturm-Liouvilleschen Eigenwertproblems. Das Randwertproblem (1.5) und (1.6) kann benutzt werden, um eine Basis zur Diskussion der Nullstellenverteilung der nichttrivialen Lösungen von homogenen Randwertproblemen zweiter Ordnung zu gewinnen. Die entsprechenden Aussagen, die zum Nachweis des Satzes von Sturm-Liouville benötigt werden, werden als die Identität oder das Lemma von Picone bezeichnet. 1.2.1 Das Lemma von Picone Zur Aufbereitung dieses Lemmas transformiert man die Differentialgleichung (1.5) mit der Substitution y(x) = ϕ(x)z(x) in die ’invariante’ Form d2 z(x) + q(x)z(x) = 0 , dx2 wobei die Funktion q(x) durch p2 (x) d p2 (x) − 1 − q(x) = 2 p0 (x) 4p0 (x) dx (1.8) p1 (x) 2p0 (x) (1.9) gegeben ist. Man gewinnt die Form (1.8), indem man den Ansatz in die Differentialgleichung einsetzt und sortiert (in abgekürzter Notation) p0 ϕz + (p1 ϕ + 2p0 ϕ )z + (p0 ϕ + p1 ϕ + p2 ϕ)z = 0 , die Funktion ϕ(x) so bestimmt, dass der Koeffizient des Terms mit z verschwindet p1 (x) ϕ(x) = exp − dx (1.10) 2p0 (x) 3 4 1 Rand- und Eigenwertprobleme und mit diesem Ergebnis die Funktion ϕ in dem Koeffizienten des Terms mit z eliminiert. Da ϕ(x) für endliche Werte der Variablen x nicht verschwindet, haben die Funktionen y(x) und z(x) die gleichen Nullstellen. Vergleicht man die Lösungen von zwei Differentialgleichungen mit verschiedenen Koeffizientenfunktionen q(x) und Q(x), so kann man das folgende Theorem beweisen: • Ist in einem Intervall a ≤ x ≤ b überall q(x) ≥ Q(x) aber q(x) ≡ Q(x) und existiert eine nichttriviale Lösung Z(x) der Differentialgleichung d2 Z(x) + Q(x)Z(x) = 0 dx2 mit den Randwerten Z(a) = Z(b) = 0, so hat jede Lösung der Differentialgleichung (1.8) mindestens eine Nullstelle in dem Intervall a ≤ x ≤ b. Zum Beweis bildet man (abgekürzte Notation) Z (zZ − z Z) , z mit der Voraussetzung z(x) = 0 in [a, b]. Wertet man den Ausdruck aus, so erhält man Z z z (zZ − z Z) = ZZ − Z 2 = (Z )2 + ZZ − Z 2 z z z (z )2 2 z Z − 2 ZZ , 2 z z bzw. mit Hilfe der zuständigen Differentialgleichungen 2 Z z 2 (zZ − z Z) = Z (q − Q) + Z − Z . z z + Integration über das Intervall liefert 2 b b Z z 2 (zZ − z Z) = dx Z (q − Q) + Z − Z . z z a a Die linke Seite diese Gleichung verschwindet infolge der vorgegebenen Randbedingungen für die Funktion Z(x), während die rechte Seite als Integral über eine positiv definite Funktion größer als Null ist. Der Widerspruch zeigt, dass die Voraussetzung, z(x) = 0 in [a, b] , nicht haltbar ist, die Funktion z(x) muss in dem Intervall [a, b] mindestens eine Nullstelle haben. Das Lemma erlaubt es, die Struktur der Nullstellen einer Funktion z(x) durch Vergleich mit der bekannten Nullstellenverteilung einer Funktion Z(x) zu beleuchten. So kann man durch Vergleich mit dem Randwertproblem Z (x) ± m2 Z(x) = 0 Z(a ) = 0 zwei wichtige Zusätze zu dem Lemma gewinnen: (1.11) 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung Zusatz 1: Die Lösung der Differentialgleichung Z (x) + m2 Z(x) = 0 , das ist Z(x) = sin[m(x − a )] , verschwindet an den Stellen kπ k = 0, ±1, ±2, . . . . x = a + m In jedem der Intervalle [a +(kπ)/m, a +([k+1]π)/m] besitzt dann die Lösung der Differentialgleichung z (x) + q(x)z(x) = 0 gemäß dem Lemma eine Nullstelle, falls in dem Intervall q(x) ≥ m2 > 0 ist. Ist diese Bedingung für das Intervall [a , ∞] erfüllt, so hat die Funktion z(x) in diesem Intervall unendlich viele Nullstellen. Zusatz 2: Durch Vertauschung der Rolle der Funktionen z(x) und Z(x) kann man eine nützliche Ergänzung gewinnen. Hätte die Lösung der Differentialgleichung z (x) + q(x)z(x) = 0 , wobei q(x) ≤ −m2 < 0 in dem Intervall [a , ∞] ist, zwei verschiedene Nullstellen in diesem Intervall, so müsste die Differentialgleichung Z (x) − m2 Z(x) = 0 eine Lösung mit einer Nullstelle dazwischen besitzen. Die Lösung Z(x) = emx besitzt aber überhaupt keine Nullstellen. Somit kann die Funktion z(x) höchstens eine Nullstelle in dem Intervall [a , ∞] haben. 1.2.2 Das Sturm-Liouvillesche Eigenwertproblem Die Differentialgleichung (1.7) d dy(x) p(x) + (q(x) + λr(x))y(x) , dx dx die in dem Theorem von Sturm und Liouville angesprochen wird, ist eine selbstadjungierte Differentialgleichung. Der Begriff ‘selbstadjungiert‘ beinhaltet die folgenden Definitionen: • Der zu einem linearen Differentialoperator L̂(y) = p0 (x)y(x) + p1 (x)y(x) + p2 (x)y(x) adjungierte Operator ist durch L̂ad (y) = [p0 (x)y(x)] − [p1 (x)y(x)] + p2 (x)y(x) definiert. • Der Operator ist selbstadjungiert, falls L̂ad (y) = L̂(y) ist. 5 6 1 Rand- und Eigenwertprobleme • Für den Sturm-Liouvilleoperator L̂S−L (y) = p(x)y (x) + p (x)y (x) + (q(x) + λr(x))y(x) gilt ˆ L̄ S−L,ad (y) = (p(x)y(x)) − (p (x)y(x)) + (q(x) + λr(x))y(x) = L̂S−L (y) . Das zentrale Theorem zu dem Sturm - Liouvilleschen Eigenwertproblem kann folgendermaßen formuliert werden: In dem endlichen Intervall [a, b] wird die Lösung der Differentialgleichung p(x)y (x) + p (x)y (x) + (q(x) + λr(x))y(x) = 0 mit den Randbedingungen y(a) = y(b) = 0 gesucht. Die Koeffizientenfunktionen erfüllen in [a, b] die Bedingungen p(x) > 0 q(x) r(x) > 0 und zweimal stetig differenzierbar stetig und stetig . (Insbesondere interessiert in der Quantenmechanik der Fall r(x) ≡ 1). Es gilt dann: • Die Eigenwerte λ sind reell und bilden eine abzählbar unendliche Folge λ0 < λ1 < λ2 < λ3 < . . . < λn < . . . . Die zugehörigen Eigenfunktionen yn (x), n = 0, 1, 2, . . . sind bis auf einen Faktor eindeutig bestimmt und besitzen genau n Nullstellen im Innern des Intervalls [a, b]. • Die Eigenfunktionen yn (x), n = 0, 1, 2, . . . bilden in [a, b] ein vollständiges Orthonormalsystem. Zum Beweis der Aussagen des Theorems beginnt man mit der Diskussion der Eigenwerte und Eigenfunktionen. 1.2.2.1 Eigenwerte und Eigenfunktionen: Man bringt mit der Transformation y(x) = ϕ(x)z(x) und (1.10) 1 p (x) 1 ϕ(x) = exp − dx = exp − ln p(x) = 2p(x) 2 p(x) die Sturm-Liouvillesche Differentialgleichung in die Form (1.8) 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung z (x) + (Q(x) + λR(x))z(x) = 0 . (1.12) Die Funktionen Q(x) und R(x) können anhand von (1.9) berechnet werden. Es ist Q(x) = p (x)2 − 2p(x)p (x) + 4p(x)q(x) 4p(x)2 R(x) = r(x) >0. p(x) Beide Funktionen sind stetig. Um die Struktur des Eigenwertspektrums der Differentialgleichung (1.12) zu untersuchen, benutzt man das Vergleichsproblem (1.11) Z (x) ± m2 Z(x) = 0 m2 > 0 mit der Randbedingung Z(a ) = 0. Nach dem zweiten Zusatz zu dem Lemma von Picone besitzt die Lösung der Differentialgleichung (1.12) in dem Intervall [a, b] höchstens eine Nullstelle, wenn in dem Intervall Q(x) + λR(x) < 0 ist. Das Randwertproblem mit z(a) = z(b) = 0 hat nur eine triviale Lösung. Entsprechend garantiert das Lemma, gemäß dem ersten Zusatz, dass für alle Werte von λ , für die in einem Intervall [a , ∞] Q(x) + λR(x) ≥ m2 > 0 ist, in diesem Intervall unendlich viele Nullstellen existieren, und zwar mindestens eine Nullstelle in jedem der Teilintervalle [a + kπ/m, a + (k + 1)π/m] mit k = 0, ±1, . . . . Die Nullstellen liegen um so dichter zusammen, je größer die Zahl m (d.h. je größer λ) ist. Man wählt nun die Stelle a so, dass die Nullstelle der Funktion Z(x) in dem Intervall [a − π/m, a ] in dem Punkt x = a liegt. Ist m zu klein, so muss die Nullstelle in dem folgenden Intervall [a , a + π/m] nicht in das vorgegebene Intervall [a, b] fallen (siehe Abb. 1.1a), so dass nur die triviale Lösung z(x) möglich ist. Es existiert dann jedoch ein größerer Wert m0 > m (bzw. ein λ0 ), für den dies der Fall ist (Abb. 1.1b). Die zugehörige Eigenfunktion z0 (x) verschwindet also genau in den Randpunkten des Intervalls, nicht aber im Innern. Erhöht man λ weiter, so rückt die Nullstelle in dem Intervall [a , a + π/m] näher an die Stelle x = a heran, die Nullstelle in dem folgenden Intervall [a + π/m, a + 2π/m] nähert sich der Stelle x = b und fällt für einen Parameter λ1 mit dieser zusammen (Abb. 1.2a und Abb. 1.2b). Die zugehörige Eigenfunktion z1 (x) verschwindet außer in den Randpunkten genau in einem inneren Punkt des Intervalls [a, b]. Schließt man auf diese Weise weiter, so erkennt man die Entstehung eines Satzes von Eigenfunktionen z0 (x), z1 (x), z2 (x), z3 (x), . . . , 7 8 1 Rand- und Eigenwertprobleme (a) (b) Z a b Z a b x x a’ a’ −π /m −π/m’ +π /m λ < λ0 : nur triviale Lösung +π /m’ λ = λ0 : Zustand n = 0 Abb. 1.1. Illustration des Knotentheorems I (a) (b) Z a b Z a b x x a’ − 2π /m’’ + 2π /m’’ λ0 < λ < λ1 : nur triviale Lösung a’ −3π /m’’’ +3π /m’’’ λ = λ1 : Zustand n = 1 Abb. 1.2. Illustration des Knotentheorems II die alle die geforderten Randbedingungen z(a) = z(b) = 0 erfüllen und deren zugehörige Eigenwerte λ 0 , λ1 , λ2 , λ3 , . . . eine stetig wachsende Folge mit λn+1 > λn darstellen. Die Anzahl der Nullstellen im Innern des Intervalls [a, b], die als Knoten der Eigenfunktionen bezeichnet werden, wächst ebenfalls an. Die Eigenfunktion zn+1 (x) hat einen Knoten mehr als die Eigenfunktion zn (x). Infolge der Relation y(x) = ϕ(x)z(x) mit einer positiv definiten Funktion ϕ(x) gelten die Aussagen für die Funktionen zn (x) auch für die Funktionen yn (x). 1.2.2.2 Orthogonalität und Vollständigkeit: Der Nachweis der Orthogonalität folgt dem üblichen Muster. Man betrachtet die Differentialgleichung für zwei Eigenfunktionen yn (x) und ym (x), in Kurzform (pym ) + (q + λm r)ym = 0 (pyn ) + (q + λn r)yn = 0 , multipliziert wechselweise mit der anderen Funktion und subtrahiert. Das Resultat 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung p(y n ym − y m yn ) + p (yn ym − y m yn ) + (λn − λm )ryn ym = 0 kann zusammengefasst werden [p(y n ym − y m yn )] = (λm − λn )ryn ym . Bei Integration über das Intervall [a, b] verschwindet das Integral auf der linken Seite dieser Gleichung b b dx [p(y n ym − y m yn )] = p(y n ym − y m yn ) = 0 a a infolge der Randbedingung. Es verbleibt die Aussage b (λm − λn ) dx r(x)yn (x)ym (x) = 0 , a der man die Orthogonalität der Eigenfunktionen bezüglich der Gewichtsfunktion r(x) entnehmen kann, wenn die Eigenwerte verschieden sind. Nach Normierung mit dem Faktor −1/2 b Nn = a dx r(x)yn2 (x) findet man für die normierten Funktionen (gleiche Bezeichnung) b dx r(x)yn (x)ym (x) = δnm . a Der Nachweis der Vollständigkeit des Orthonormalsystems mit einem diskreten Spektrum ist aufwendiger. Er soll skizziert, aber nicht in allen Facetten ausgeführt werden. Man nennt ein Orthonormalsystem von Funktionen yn (x) in einem Intervall [a, b] vollständig, wenn die folgenden Voraussetzung erfüllt ist: • Eine in [a, b] stetige und stückweise stetig differenzierbare Funktion f (x), die die gleichen Randbedingungen wie das Orthonormalsystem erfüllt, wird durch die gleichmäßig konvergente Fourierreihe ∞ f (x) = cn yn (x) n=0 mit Koeffizienten b cn = dx r(x)f (x)yn (x) a dargestellt. Um die gleichmäßige Konvergenz der Fourierreihe für f (x) zu beweisen, muss man zeigen, dass 9 10 1 Rand- und Eigenwertprobleme • die mit der Differenz der Eigenwerte gewichtete Reihe ∞ (λn − λ0 )c2n n=1 konvergiert und • die Reihe ∞ y 2 (x) n (λn − λ0 ) n=1 konvergiert und in [a, b] einen beschränkten Summenwert hat. Man benutzt anschließend die Ungleichung m+p 2 m+p m+p an bn ≤ a2n b2n n=m n=m (1.13) n=m mit an = (λn − λ0 )cn bn = yn (x) (λn − λ0 ) und bemerkt, dass die linke Seite von (1.13) der zu untersuchenden Fourierreihe entspricht m+p an bn = n=m m+p cn yn (x) . n=m Für die Faktoren auf der rechten Seite von (1.13) findet man m+p b2n ≤ n=m ∞ yn2 (x) <M (λn − λ0 ) n=1 infolge der Beschränktheit der Reihe und (mit ( > 0) m+p a2n < n=m 2 M infolge der Konvergenz dieser Reihe. Die Relation (1.13) zeigt, dass die Bedingung für gleichmäßige Konvergenz der Fourierreihe m+p cn yn (x) < n=m erfüllt ist. Im letzten Schritt ist noch zu zeigen, dass die Fourierreihe die Funktion f (x) wirklich darstellt. Man betrachtet zu diesem Zweck die Funktion F (x) = f (x) − ∞ n=0 cn yn (x) . 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung Multipliziert man mit r(x)ym (x) und integriert über das Intervall [a, b], so findet man b dx r(x)F (x)ym (x) = cm − cm = 0 , a wobei die Definition der Fourierkoeffizienten und die gleichmäßige Konvergenz der Fourierreihe zur gliedweisen Integration benutzt wurde. Die Funktion F (x) ist zu allen Eigenfunktionen yn (x) orthogonal. Außerdem zeigt man durch Widerspruch, dass b dx r(x)F 2 (x) = 0 a sein muss. Dies ist aber nur möglich, wenn in dem Intervall [a, b] F (x) ≡ 0 ist. 1.2.3 Das Sturm-Liouville Problem: Beispiele und Erweiterung Die bisher benutzten, einfachen Randbedingungen stellen nur einen Spezialfall dar. Das Sturm-Liouville Problem kann auch für allgemeine lineare homogene Randbedingungen (in einem Intervall [a, b]) a11 y(a) + a12 y (a) = 0 a21 y(b) + a22 y (b) = 0 (1.14) diskutiert werden. Einige direkte Beispiele für Orthonormalsysteme, die den Anforderungen des Sturm-Liouville Theorems genügen, sind: • Die Differentialgleichung y (x) + λy(x) = 0 (1.15) ist eine Differentialgleichung vom Sturm-Liouvilletyp (1.7), denn es ist p(x) = 1 p (x) = 0 q(x) = 0 r(x) = 1 . Betrachtet man z.B. in dem Intervall [0, 2π] die Randbedingung y(0) = 0 y(2π) = 0 , so erhält man die Eigenwerte m2 mit m = 1, 2, . . . 4 und die normierten Eigenfunktionen mx 1 . ym (x) = √ sin 2 π λm = Diese Resultate folgen aus der allgemeinen Lösung der Differentialgleichung 11 12 1 Rand- und Eigenwertprobleme √ √ y(x) = C1 sin λx + C2 cos λx durch Implementierung der Randbedingungen 0 + C2 = 0 √ √ C1 sin 2 λπ + C2 cos 2 λπ = 0 , die C2 = 0 und √ λ = ±m/2 m = 0, 1, 2, . . . √ liefert. Die Lösungen mit negativen Werten von λ und den korrespondierenden positiven Werten unterscheiden sich nur durch ein Vorzeichen. Da die Lösung nur bis auf einen Faktor bestimmt ist, ergibt sich bei Unterdrückung der trivialen Lösung mit (m = 0), die Beschränkung auf die Werte m = 1, 2, . . . . • Fordert man hingegen für die Differentialgleichung (1.15) die Randbedingung y (0) = 0 y (2π) = 0 , so ergeben sich ebenfalls die Eigenwerte λm = m2 /4 , jedoch in diesem Fall mit m = 0, 1, 2, . . . . Die normierten Eigenfunktionen sind 1 y0 (x) = √ 2π mx 1 ym (x) = √ cos 2 π m = 1, 2, . . . . • Ein weiterer Satz von Randbedingungen y(−π) = y(π) = 0 , in dem das Intervall gegenüber dem ersten Beispiel um den Betrag π verschoben ist, zeigt die Variation mit der indirekt geforderten Symmetrie der Funktionen. Die Randbedingung lautet explizit √ √ −C1 sin λπ + C2 cos λπ = 0 √ √ C1 sin λπ + C2 cos λπ = 0 . Die Forderung nach einer nichttrivialen Lösung dieses linearen Gleichungssystems führt auf (nur positive Vielfache von π zählen) √ √ m = 0, 1, 2, . . . . sin 2 λπ = 0 −→ 2 λπ = mπ √ Mit den Eigenwerten λm = m/2 findet man für die Lösung des linearen Gleichungssystems m m = gerade, > 0 → C2 = 0 ym (x) = sin x 2 m = ungerade → C1 = 0 ym (x) = cos m x. 2 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung Kosinus- und Sinusfunktionen wechseln sich ab. • Die periodischen Randbedingungen y (0) = y (2π) y(0) = y(2π) gehören nicht zu der Klasse (1.14) von linearen homogenen Randbedingungen. Sie definieren also kein reguläres Sturm-Liouville Problem. Trotzdem findet man z.B. für die Differentialgleichung (1.15) ein diskretes Spektrum von Eigenwerten, mit dem Unterschied, dass zu jedem (positivem) Eigenwert zwei linear unabhängige Eigenfunktionen gehören. Die Eigenfunktionen zu dem gleichen Eigenwert sind nicht automatisch orthogonal, sie können jedoch orthogonal gewählt werden. Explizit findet man in diesem Beispiel λ → λ m = m2 (m = 0, 1, 2, . . .) cos x sin x 1 cos 2x sin 2x √ , √ , √ √ , √ , , ... . π π π π 2π Dieses Orthogonalsystem ist die Basis für die Darstellung von periodischen Funktionen durch eine gleichmäßig konvergente (Standard)-Fourierreihe. • Die Differentialgleichung y(x) → ym (x) = (1 − x2 )y (x) − 2xy (x) + λy(x) = 0 für die Legendreschen Polynome ist ebenfalls eine Differentialgleichung vom Sturm-Liouville Typ. Man erhält aus diesem Grund die Funktionen Pl (x) und die Eigenwerte λl = l(l + 1) (auch) als Lösung eines regulären SturmLiouville Eigenwertproblems, wenn man, bezogen auf das Intervall [−1, 1] , die Randbedingungen 2 2 y(1) + y (1) = 0 y(0) − y (0) = 0 λ λ fordert. Damit sind die Legendreschen Polynome als ein vollständiges Orthormalsystem in dem Intervall [−1, 1] ausgewiesen. Von besonderem Interesse für die Randwertprobleme der Quantenmechanik ist die Erweiterung der Betrachtungen zu dem Sturm-Liouville Problem auf den Fall eines unendlich großen Grundintervalls (gegebenenfalls mit oder ohne die ’Randpunkte’) [−∞, ∞] eindimensionale Systeme [a, b] → . [0, ∞] Radialprobleme Da die Detaildiskussion dieser Erweiterungen recht aufwendig ist, werden hier nur die Resultate zitiert und durch Beispiele belegt. Interessenten können die Details z.B. in P.M. Morse and H. Feshbach, Methods of Theoretical Physics (Vol. I, chapt. 6 and Vol. II, chapt 12), McGraw-Hill (New York, 1953) 13 14 1 Rand- und Eigenwertprobleme oder E.A. Coddington and N. Levinson, Theory of Ordinary Differential Equations (chapt. 5 - 9), McGraw-Hill (New York, 1955) einsehen. Für das Radialproblem (ersetze x → r) gelten die Aussagen: (A) Fordert man die Randbedingung y(0) = 0, oder allgemeiner a11 y(0) + a12 y (0) = 0 , so findet man ein vollständiges aber nicht notwendigerweise diskretes Spektrum. (B) Für die stärkere Bedingung mit der zusätzlichen Forderung einer quadratintegrablen Funktion ∞ a11 y(0) + a12 y (0) = 0 und dr r2 y 2 (r) < M 0 ist das Spektrum diskret, doch nicht notwendigerweise vollständig. Zur Überprüfung der Vollständigkeit ist in diesem Fall ein zusätzlicher Schritt notwendig. Man kann eine Koordinatentransformation t = t(r) durchführen, durch die das Intervall [0, ∞] auf ein endliches Intervall abgebildet wird, so z.B. t = 1/(1 + r) mit einer Transformation auf das Intervall 0 ≤ t ≤ 1. Erfüllt die transformierte Gleichung die Anforderungen des SturmLiouville Problems, so kann der vollständige Satz von Eigenfunktionen {yn (t)} in den Satz {ỹn (r)} zurücktransformiert werden. Beispiele zu Problemen mit einem unendlichen Grundintervall sind: • Das Coulombproblem. Benutzt man, wie in Kap. 6.1, die Randbedingung (B), so erhält man den diskreten Teil des Spektrums. Eine zusätzliche Untersuchung der Vollständigkeit führt auf die Aussage, dass der Satz von diskreten Lösungen in dem Sinn vollständig ist, dass jede quadratintegrable Funktion, die die Randbedingung bei r = 0 erfüllt, durch diese Funktionen dargestellt werden kann. Mit der Randbedingung (A) erhält man den diskreten und den kontinuierlichen Anteil (den Streuanteil) des Coulombspektrums. Jede Funktion f (r), die die Anforderungen des Vollständigkeitstheorems erfüllt, kann somit in der Form cn yn (r) + dk k 2 c(k)yk (r) f (r) = n dargestellt werden. • Das (dreidimensionale) Oszillatorproblem. Infolge der Form des Potentials ist für den Radialanteil nur die Randbedingung (B) möglich. Das Spektrum ist diskret und, wie eine weitere Untersuchung zeigen würde, vollständig und somit zur Darstellung von quadratintegrablen Funktionen geeignet. 1.2 Das Randwertproblem für homogene, lineare Differentialgleichungen zweiter Ordnung • Die freie Schrödingergleichung. Die Randbedingung (B) kann für den Radialanteil nicht realisiert werden. Die Randbedingung (A) ergibt ein kontinuierliches Spektrum. Die zugehörigen Eigenfunktionen bilden, wie in Kap. 6.4 explizit gezeigt wird, ein vollständiges (uneigentliches) Orthonormalsystem (vergleiche auch Kap. 3.3 und Kap. 8.2) Im Rahmen der Diskussion der Vollständigkeit sind noch zwei Fragen zu beantworten. Es kann sein, dass ein Orthonormalsystem vorgegeben ist und die Frage entsteht, ob das System vollständig ist. Im Fall eines diskreten Spektrums lautet die Antwort: Eine hinreichende (aber nicht notwendige) Bedingung für die Vollständigkeit lautet yn (x)yn (x ) = δ(x − x ) , n bzw. yn∗ (x)yn (x ) = δ(x − x ) n im Fall von komplexen Funktionen. Zum Nachweis dieser Aussage schreibt man die Fourierreihe für eine Funktion f (x) in der Form b dx yn∗ (x )f (x ) yn (x) f (x) = a n (das Intervall kann endlich oder unendlich sein). Ist die Reihe gleichmäßig konvergent, so kann man Summation und Integration vertauschen und erhält b = dx δ(x − x )f (x ) = f (x) . a Hat das Spektrum einen diskreten und einen kontinuierlichen Anteil, so lautet das Kriterium yn∗ (x)yn (x ) + dλ yλ∗ (x)yλ (x ) = δ(x − x ) . n Die Frage nach der Vollständigkeit der Lösung einer partiellen Differentialgleichung ist einfach zu beantworten, falls die Differentialgleichung separiert. Liegt für jeden separierten Anteil eine Sturm-Liouville Situation vor, so ist Vollständigkeit der Gesamtlösung gegeben und es gilt z.B. die Darstellung cn1 ,n2 ,n3 fn1 (x)gn2 (y)hn3 (z) ψ(x, y, z) = n1 ,n2 ,n3 mit cn1 ,n2 ,n3 = d3 r ψ ∗ (x, y, z)fn1 (x)gn2 (y)hn3 (z) . 15 2 Weitere spezielle Funktionen Die Ausführungen in diesem Kapitel, ebenso wie der Inhalt des Math.Kap. 4 zu Band 2, sollen dazu dienen einige der Formeln, die in Werken wie M. Abramovitz and I.A. Stegun, Handbook of Mathematical Functions oder W. Magnus und F. Oberhettinger, Formeln und Sätze für die speziellen Funktionen der Mathematischen Physik (oder einer Vielzahl anderer Formelsammlungen dieser Art) zusammengestellt sind, zu begründen. Sie stellen kein Handbuch zur täglichen Nutzung dieser Formeln dar. 2.1 Die konfluente hypergeometrische Funktion Eine Funktion, die in vielen Beispielen als analytische Lösung der (radialen) Schrödingergleichung auftritt, ist die konfluente hypergeometrische Funktion. Spezialfälle dieser Funktion sind unter anderen die Exponentialfunktion, die Fehlerfunktion, die Laguerreschen und die Hermiteschen Polynome sowie diverse Besselfunktionen. Die kurze Zusammenstellung der Eigenschaften der konfluenten hypergeometrischen Funktion in Band 2, Math.Kap. 4.6 soll hier begründet und erweitert werden. Ein größeres Thema, das keine Erwähnung findet, ist der Bereich der Integraltransformationen (Laplace Transformation etc.) mit konfluenten hypergeometrischen Funktionen. Die Differentialgleichung, die die konfluente hypergeometrische Funktion definiert dy(x) d2 y(x) − ay(x) = 0 , (2.1) + [c − x] x dx2 dx hat eine reguläre Singularität bei x = 0 und eine irreguläre Singularität bei x = ∞ (siehe Band 2, Math.Kap. 4.2.1). Die Ähnlichkeit mit der Differentialgleichung der hypergeometrischen Funktion (Band 2, Math.Kap. 4.5) d2 y(z) dy(z) − aby(z) = 0 (2.2) + [c − (a + b + 1)z] dz 2 dz deutet eine Verwandtschaft zwischen den zwei Funktionen an. Der Zusammenhang der konfluenten hypergeometrischen Funktion mit der hypergeometrischen Funktion wird anhand der folgenden Betrachtung z(1 − z) 18 2 Weitere spezielle Funktionen sichtbar: Die Differentialgleichung (2.2) besitzt reguläre singuläre Stellen bei z = 0, b und ∞. Die bei z = 0 reguläre Lösung kann durch die Gaußsche oder hypergeometrische Reihe y(z) = F (a, b; c; z) = 1 + a(a + 1)b(b + 1) z 2 ab z+ + ... c c(c + 1) 2! ∞ = Γ (c) Γ (a + n)Γ (b + n) z n Γ (a)Γ (b) 0 Γ (c + n) n! (2.3) dargestellt werden. Mit der Substitution z = x/b erhält man als Differentialgleichung für die Funktion y(x) = F (a, b; c; x/b) x dy(x) x d2 y(x) − ay(x) = 0 . + c − (a + b + c + 1) x 1− b dx2 b dx Betrachtet man den Grenzübergang b → ∞, so erhält man die Differentialgleichung der konfluenten hypergeometrischen Funktion (2.1). Man erkennt, dass die drei singulären Stellen (alle regulär) von (2.2) in die zwei singulären Stellen (eine regulär, eine singulär) von (2.1) ’zusammengeflossen’ sind und somit den Zusatz ‘konfluent‘ begründen. Die zwei Differentialgleichungen (2.1) und (2.2) sind Spezialfälle einer übergeordneten Differentialgleichung, der Riemannschen Differentialgleichung. Allgemeine reguläre, hypergeometrische Funktionen werden mit Hilfe des Pochhammersymbols Γ (α + k) = a(a + 1) . . . (a + k − 1) k≥0 (2.4) (α)k = Γ (α) in der Form ∞ (α1 )k . . . (αm )k k x m Fn (α1 , α2 , . . . , αm ; β1 , β2 , . . . , βn ; x) = (β1 )k . . . (βn )k k=0 notiert. Die hier diskutierten Fälle enstsprechen m = n = 1 (die konfluente hypergeometrische Funktion 1 F1 (a, c; x) ≡ F (a, c; x)) und m = 2, n = 1 (die hypergeometrische Funktion 2 F1 (a, b; c; x) ≡ F (a, b; c; x)). Infolge der Relation zwischen den zwei Funktionen kann man die Eigenschaften der konfluenten hypergeometrischen Funktion durch Grenzprozesse aus den Eigenschaften der hypergeometrischen Funktion gewinnen. Hier soll jedoch die konfluente hypergeometrische Funktion auf der Basis der definierenden Differentialgleichung (2.1), der Kummerschen Differentialgleichung, diskutiert werden. Die bei x = 0 reguläre Lösung a(a + 1) x2 a + ... y1 (x) = F (a, c ; x) = 1 + x + c c(c + 1) 2! ∞ Γ (c) Γ (a + n) xn = Γ (a) 0 Γ (c + n) n! (2.5) 2.1 Die konfluente hypergeometrische Funktion 19 gewinnt man entweder durch die oben diskutierte Konfluenz oder durch Reihenentwicklung. Geht man mit dem Ansatz F (a, c ; x) = xs ∞ an xn n=0 in die Differentialgleichung (2.1) ein, so gewinnt man die Indexgleichung (siehe Band 2, Math.Kap. 4.2.2) s2 + (c − 1)s = 0 , mit der Lösung s = 0 und s = 1 − c, und die zweigliedrige Rekursionsformel an+1 = (n + s + a) an . (n + s + 1)(n + s + c) Die Rekursionsformel für s = 0 (n + a) an an+1 = (n + 1)(n + c) führt auf die Reihe (2.5), die Kummersche Funktion oder konfluente hypergeometrische Reihe. Das Konvergenzverhalten richtet sich nach der Form der Parameter a und c. Es gelten (m und n sind positive ganze Zahlen) die Aussagen: • c = −m, a = −n: Die Reihe konvergiert für alle Werte von x. • c= −m, a = −n: Die Lösung ist ein Polynom vom Grad m • c = −m, a = −n oder c = −m, a = −n mit n ≤ m: Es existiert ein einfacher Pol bei dem Parameterwert c = −m. Die Rekursionsformel für s = 1 − c an+1 = (n + a − c + 1) an (n − c + 2)(n + 1) ergibt ebenfalls eine Kummersche Funktion. Falls c keine ganze Zahl mit c ≥ 2 ist (die Reihe ist dann nicht wohldefiniert), ist y2 (x) = x1−c F (a − c + 1, 2 − c; x) (2.6) eine linear unabhängige Lösung der Differentialgleichung (2.1). Da sich die zwei Lösungen wie y1 (x) −→ x0 jedoch y2 (x) −→ x1−c am Ursprung verhalten, gilt die zusätzliche Einschränkung, dass c nicht gleich 1 sein darf. Solange also c keine ganze Zahl ist, kann jede Lösung der Kummerschen Differentialgleichung als Linearkombination dieser zwei Fundamentallösungen y(x) = A1 y1 (x) + A2 y( x) notiert werden. Verschiedene Aspekte der Lösungsmannigfaltigkeit sowie eine große Anzahl von nützlichen Relationen kann man mit Hilfe der Substitution x = αz 20 2 Weitere spezielle Funktionen und der Transformation y(x) = xβ eγx Y (z) gewinnen. Unter diesen Operationen geht die Differentialgleichung (2.1) in z d2 Y (z) dY (z) + [c + 2β − αz{1 − 2γ}] 2 dz dz β(β + c − 1) 2 + − α(a − γc + β − 2βγ) + α γ(γ − 1)z Y (z) = 0 z über. Damit diese Differentialgleichung die Form der Kummerschen Differentialgleichung hat, müssen die folgenden Bedingungen erfüllt sein: • Der Faktor der Variablen in dem zweiten Term muss 1 sein α(1 − 2γ) = 1 . • Die Faktoren der Beiträge mit den Variablen in dem dritten Term müssen verschwinden β(β + c − 1) = 0 γ(γ − 1) = 0 Diese Bedingungen sind erfüllt, wenn • β = 0, γ = 0, α = 1 x • mit d2 Y (−x) dY (−x) − (c − a)Y (−x) = 0 , + [c − x] dx2 dx β = 1 − c, γ = 1, α = −1 x mit d2 Y (x) dY (x) − (1 + a − c)Y (x) = 0 , + [2 − c − x] dx2 dx β = 0, γ = 1, α = −1 x • d2 Y (x) dY (x) − aY (x) = 0 , + [c − x] dx2 dx β = 1 − c, γ = 0, α = 1 x • mit der dazugehörigen Differentialgleichung mit d2 Y (−x) dY (−x) − (1 − a)Y (−x) = 0 . + [2 − c − x] 2 dx dx Die zugehörigen Lösungen, dargestellt durch die Kummersche Funktion F , sind: y1 (x) = F (a, c; x) y2 (x) = x1−c F (1 + a − c, 2 − c; x) , wie zuvor. Die Funktionen y3 (x) = ex F (c − a, c; −x) y4 (x) = x1−c ex F (1 − a, 2 − c; −x) (2.7) 2.1 Die konfluente hypergeometrische Funktion 21 sind jedoch ebenfalls Lösungen der Kummerschen Differentialgleichung. Da sich y3 und y4 am Ursprung wie x0 bzw. x1−c verhalten, sind diese zwei Lösungen linear unabhängig. Da die allgemeine Lösung der Differentialgleichung (2.1) höchstens aus zwei linear unabhängigen Funktionen bestehen kann, muss jede der Lösungen y1 bis y4 durch zwei andere darstellbar sein. Infolge des Verhaltens am Ursprung muss in der Relation y1 (x) = A2 y2 (x) + A3 y3 (x) der Koeffizient A2 gleich Null sein. Der Koeffizient A3 ist dann gleich 1, da sich y1 und y3 , sowie deren Ableitungen, am Ursprung gleich verhalten. Die Relation y1 (x) = y3 (x), bzw. explizit e−x F (a, c; x) = F (c − a, c; −x) (2.8) ist als Kummers erstes Theorem bekannt. Mit der gleichen Argumentation findet man y2 = y4 , d.h. x1−c F (1 + a − c, 2 − c; x) = x1−c ex F (1 − a, 2 − c; −x) . (2.9) Eine weitere Lösung der Kummerschen Differentialgleichung, die in der Anwendung der konfluenten hypergeometrischen Funktionen eine besondere Rolle spielt, ist die Linearkombination F (a, c; x) π (2.10) y5 (x) ≡ U (a, c; x) = sin πb Γ (c)Γ (1 + a − b) x1−c F (1 + a − c, 2 − c; x) − Γ (2 − c)Γ (a) . (2.11) Diese Funktion ist analytisch für alle Werte von a, c und x und hat einen endlichen Grenzwert für x → ∞. Mit dem gleichen Argument wie für die Funktion F kann man zu der Funktion U drei weitere Lösungen der Kummerschen Differentialgleichung erzeugen, so dass insgesamt acht Formen der Lösung der Differentialgleichung (2.1) im Gebrauch sind. Falls c eine positive ganze Zahl ist kann man für die Funktionen y2 keine Reihendarstellung angeben. In diesem Fall ist es möglich, eine logarithmische Lösung zu gewinnen (siehe e.g. L.J. Slater, Confluent Hypergeometric Functions, Cambridge University Press, 1960). Für die Kummersche Funktion kann man eine beachtliche Liste von Eigenschaften zusammenstellen, von denen einige ausgewählte Beispiele diskutiert werden sollen. Eine völlig parallele Liste von Eigenschaften könnte man für die Funktion U (a, c; x) erstellen. 2.1.1 Ableitungen und Integrale Die absolut konvergente Reihe (2.5) für die Funktion F (a, c; x) kann gliedeweise differenziert werden. Dies liefert (benutze das Pochhammersymbol (2.4)) 22 2 Weitere spezielle Funktionen ∞ a (a + 1)(n−1) d F (a, c; x) = nxn−1 . dx c (c + 1) n (n − 1)! (n−1) n=1 Umbenennung des Summationsindex ergibt d a F (a, c; x) = F (a + 1, c + 1; x) , dx c die sich auf dn (a)n F (a, c; x) = F (a + n, c + n; x) dxn (c)n n = 1, 2, . . . (2.12) erweitern lässt. Eine Ableitungsformel für den Fall F (a, c; x) multipliziert mit einem speziellen Faktor ist z.B ∞ d (a)n {xa F (a, c; x)} = (n + a)xn+a−1 dx (c) (n)! n n=0 Hier wird der erste Faktor des Pochhammersymbols abgespalten und der zusätzliche Faktor einbezogen ∞ a(a + 1)n a+n−1 d a {x F (a, c; x)} = x = axa−1 F (a + 1, c; x) . (2.13) dx (c) (n)! n n=0 Diese Ergebnis kann man umformen, so dass man eine Relation der Form F (a + 1, c; x) = 1 1−a d x {xa F (a, c; x)} a dx x d F (a, c; x) (2.14) a dx erhält. Man kann diese Art von Relationen als Rekursionsformeln mit den Funktionen und deren Ableitungen betrachten. Eine weitere Klasse von Ableitungsformeln ergeben sich aus dem Kummerschen Theorem (2.8) = F (a, c; x) + d −x d e F (a, c; x) = F (c − a, c; −x) dx dx (c − a) (c − a) −x F (c − a + 1, c + 1; −x) = − e F (a, c + 1; x) . b b Auch für diese Klasse ergibt die Umkehrung nützliche Relationen. So folgt z.B. d −x b ex e F (a, c; x) F (a, c + 1; x) = − (c − a) dx =− c = (c − a) d F (a, c; x) . F (a, c; x) − dx (2.15) 2.1 Die konfluente hypergeometrische Funktion 23 Alternative Faktoren wie xb−1 , xb−1 e−x und entsprechende n -fache Ableitungen können diskutiert werden. Die Ableitungsformeln können direkt benutzt werden, um unbestimmte Integrale mit der konfluenten hypergeometrischen Funktion anzugeben, gegebenenfalls mit einer Umbenennung der Parameter. So findet man z.B. als Gegenstück zu den benannten Ableitungen (b − 1) F (a − 1, c − 1; x) (a = 1) dx F (a, c; x) = (a − 1) dx xa−2 F (a, c; x) = dx e−x F (a, c; x) = xa−1 F (a − 1, c; x) (a − 1) e−x (c − 1) F (a, c − 1; x) (a + 1 − c) (a = 1) (c − a = 1) 2.1.2 Rekursionsformeln Rekursionsformeln für die Kummerschen Funktionen gewinnt man, indem man aus den Ableitungsformeln wie (2.14) und (2.15) die Ableitung F (a, c; x) eliminiert. Es entstehen lineare Relationen zwischen der Funktion F (a, c; x) und zwei weiteren Funktionen – den assoziierten Funktionen –, deren Argumente a und c um eine Einheit erhöht bzw. erniedrigt sind. So erhält man z.B. durch Kombination von (2.14) und (2.15) die Rekursionsformel c(a + x)F (a, c; x) − (c − a)xF (a, c + 1; x) − acF (a + 1, c; x) = 0 (2.16) Weitere Beispiele, die man auf diese Weise gewinnen kann, sind cF (a, c; x) − (c − a)F (a, c + 1; x) − aF (a + 1, c + 1; x) = 0 cF (a, c; x) − cF (a − 1, c; x) − xF (a, c + 1; x) = 0 (2a − c + x)F (a, c; x) + (c − a)F (a − 1, c; x) − aF (a + 1, c; x) = 0 etc. Kombiniert man derartige Rekursionsformeln, so erhält man eine weitere Klasse von Formeln, in denen nur assoziierte Funktionen auftreten. Rekursionsformeln dieser Art kann man auch erzeugen, indem man die Parameter in der ersten Klasse von Rekursionen erhöht oder erniedrigt. 2.1.3 Integraldarstellungen Die direkte Integraldarstellung der Kummerschen Funktion 1 Γ (c) dt ext ta−1 (1 − t)c−a−1 F (a, c; x) = Γ (a)Γ (c − a) 0 (2.17) kann man in der folgenden Weise gewinnen. Man beginnt mit der Reihendarstellung in der Form 24 2 Weitere spezielle Funktionen F (a, c; x) = ∞ Γ (a + r)Γ (c) xr r=0 Γ (c + r)Γ (a) r! , erweitert die rechte Seite dieser Gleichung in geeigneter Weise ∞ = Γ (c − a)Γ (a + r) xr Γ (c) , Γ (a)Γ (c − a) r=0 Γ (c + r) r! erkennt in dem Produkt von Gammafunktionen unter dem Summenzeichen die Betafunktion (siehe Math.Kap. 2.6), die durch 1 Γ (c − a)Γ (a + r) = B(c − a, a + r) = dt ta+r−1 (1 − t)c−a−1 Γ (c + r) 0 definiert ist, so dass man ∞ Γ (c) F (a, c; x) = Γ (a)Γ (c − a) r=0 1 dt ta+r−1 (1 − t)c−a−1 0 xr r! schreiben kann. Die von r abhängigen Terme werden zusammengefasst 1 ∞ Γ (c) (xt)r = , dt ta−1 (1 − t)c−a−1 Γ (a)Γ (c − a) 0 r! r=0 so dass man das Endergebnis Γ (c) F (a, c; x) = Γ (a)Γ (c − a) 1 dt ext ta−1 (1 − t)c−a−1 0 erhält. Die Grundformel kann mit Hilfe von Variablentransformationen in verschiedenster Weise umgeschrieben werden, so z.B. mit v = tx s = 1 − 2t cos θ = 1 − 2t etc. Die Darstellung (2.17) ist der Einschränkung c > a > 0, bzw. im Komplexen Re(c) > Re(a) > 0 unterworfen. Man kann sich von dieser Einschränkung lösen, wenn man das Integral entlang der reellen Achse zu einem Konturintegral entlang einer geeigneten Kontur erweitert. 2.1.4 Asymptotische Entwicklungen Von besonderem Interesse bei der Diskussion der Schrödingergleichung ist das asymptotische Verhalten der Kummerschen Funktion in der Variablen x. Die einigermaßen aufwendige Diskussion, die hier nicht beschrieben werden soll, basiert auf einer Darstellung der konfluenten hypergeometrischen Funktion durch eine komplexe Konturintegration, dem Barnschen Integral Γ (−s)Γ (a + s) 1 Γ (c) (−z)s , ds F (a, c; z) = 2πi Γ (a) K Γ (c + s) wobei die Kontur (Abb. 2.1) parallel zur imaginären Achse verläuft, dabei die Pole bei s = −a, −a − 1, −a − 2, . . . aus- und die Pole bei s = 0, 1, 2, . . . 2.1 Die konfluente hypergeometrische Funktion 25 einschließt und im Unendlichen geschlossen ist. Der Residuensatz liefert infolge der unendlichen Kette von Beiträgen durch die eingeschlossenen Pole eine Reihe, die bis auf Faktoren mit der Kummerschen Reihe identifiziert werden kann. Auswertung des Integrals für z → |x| → ∞ liefert nach einiger Im -a x x x x x x x x x x x x x x Re Abb. 2.1. Die Kontur des Barnesintegrals Rechnung die Aussagen lim F (a, c ; x) = Γ (c) x a−c e x Γ (a) (2.18) lim F (a, c ; x) = Γ (c) (−x)−a . Γ (c − a) (2.19) x→+ ∞ und x→− ∞ 2.1.5 Spezialfälle Die Darstellung von elementaren und nicht so elementaren Funktionen durch die konfluente hypergeometrische Funktion gewinnt man auf zwei Wegen. Man kann die Parameter a und c so wählen, dass man direkt die Reihenentwicklung der darzustellenden Funktion erkennt. Dies ist der Fall für die, wohl nicht so dringend benötigten, Darstellungen der Exponentialfunktion ex = F (a, a ; x) und der trigonometrischen Funktionen, z.B. 1 i sin x = xeix F (1, 2; −2ix) = x 1 + ix − x2 − + . . . 2 6 2 i 1 ∗ 1 − ix − x2 x3 + . . . = x 1 − x2 + . . . . 3 3 6 Bei der zweiten Methode benutzt man eine Transformation 26 2 Weitere spezielle Funktionen y(g(x)) = xα ef (x) Y (x) z = g(x) , um die Kummersche Differentialgleichung für y(z) in eine Differentialgleichung für die Funktion Y (x) umzuschreiben. So erhält man für die Wahl α = −ν f (x) = ix z = 2ix und die Identifizierung 1 a=ν+ c = 2a 2 die Besselsche Differentialgleichung 1 ν2 Y (x) + Y (x) + 1 − 2 Y (x) , x x so dass man (bei Berücksichtigung der jeweiligen Normierung) die Relation 1 xν e−ix F ν + , 2ν + 1; 2ix Jν (x) = ν 2 Γ (ν + 1) 2 oder auch jl (x) = xl Γ (1/2)e−ix F (l + 1, 2l + 2; 2ix) 2l+1 Γ (l + 3/2) notieren kann. 2.1.6 Die Whittacker Funktion Eine Funktion, die eng mit der konfluenten Funktion verwandt ist, ist die Whittacker Funktion. Diese Funktion wird durch die Differentialgleichung d2 y(x) 1/4 − m2 1 k + − + + y(x) = 0 (2.20) dx2 4 x x2 bestimmt. Setzt man die Transformation y(x) = x1/2−m e−x/2 Y (x) in (2.20) ein, so erhält man für Y (x) die Differentialgleichung 1 d2 Y (x) dY (x) x2 − − k − m Y (x) = 0 . + (1 − 2m − x) dx2 dx 2 Daraus folgt, dass Y (x) = F (1/2 − k − m, 1 − 2m; x) bzw. Y (x) = x2m F (1/2 − k + m, 1 + 2m; x) ist. Die zwei linear unabhängigen Lösungen der Differentialgleichung (2.20), mit der Notation 2.2 Die Hermiteschen Polynome 27 Mk,−m (x) = x1/2−m e−x/2 F (1/2 − k − m, 1 − 2m; x) (2.21) Mk,m (x) = x1/2+m e−x/2 F (1/2 − k + m, 1 + 2m; x) werden als die Whittakerschen Funktionen bezeichnet. Diese Funktionen zeichnen sich unter Anderem dadurch aus, dass die Lösungsmannigfaltigkeit von vier Funktionen analog zu dem Satz y1 bis y4 für die Kummersche Differentialgleichung eine einfachere Struktur aufweist. Bezeichnet man die Funktion Mk,m (x) mit f1 (x), so ist f2 (x) = Mk,−m (x) f3 (x) = M−k,m (−x) f4 (x) = M−k,−m (−x) . Eine weitere Whittakerfunktion, bzw. einen Satz von solchen Funktionen, erhält man, wenn man die konfluente Funktion y5 (x) = U (a, c; c) benutzt. Die gebräuchlichste Notation ist Wk,m (x) = x1/2+m e−x/2 U (1/2 − k + m, 1 + 2m; x) . Für die verschiedenen Whittackerfunktionen könnten entsprechende Eigenschaften wie für die Kummerschen Funktionen diskutiert werden. 2.2 Die Hermiteschen Polynome Die Differentialgleichung, die letztlich die Hermiteschen Polynome Hn (x) definiert, lautet dy(x) d2 y(x) + 2αy(x) = 0 . (2.22) − 2x dx2 dx Gesucht ist eine Lösung, die für alle Werte der Variablen endlich ist und die sich, wie für den harmonischen Oszillator in einer Raumdimension gefordert werden muss, für x −→ ∞ so verhält, dass exp[−x2 /2]y(x) → 0 geht. Die Lösung von (2.22) gewinnt man über einen Potenzreihenansatz y(x) = ∞ ar xr+s . r=0 Der Ansatz führt auf die Indexgleichung s(s − 1) = 0 und die Rekursionsformeln (2α − 2r) ar ar+2 = (s = 0) (r + 1)(r + 2) ar+2 = (2α − 2r − 2) ar (r + 2)(r + 3) (s = 1) . Die beiden Formeln erzeugen die gleichen Lösungen, so dass man sich auf die Auswertung der Rekursion mit s = 0 bei Vorgabe von a0 bzw. von a1 28 2 Weitere spezielle Funktionen beschränken kann. Die durch die Rekursion erzeugten Reihen erfüllen die geforderte asymptotische Form nicht, es sei denn α ist eine nichtnegative ganze Zahl n. Die resultierenden Polynomlösungen werden so normiert, dass der Term mit der höchsten Potenz die Form 2n xn hat. Aus diesem Grund ist es nützlich, die Rekursionformel nach absteigenden Potenzen auszuwerten ar = (r + 1)(r + 2) ar+2 . 2(n − r) Dies ergibt [n/2] y(n) = an (−1)r r=0 mit der Notation n/2 [n/2] = (n − 1)/2 n! xn−2r 22r r!(n − 2r)! f ür n gerade f ür n ungerade . Nach Festlegung der Normierung lautet die Formel für die Hermiteschen Polynome somit [n/2] Hn (n) = (−1)r r=0 n! (2x)n−2r . r!(n − 2r)! (2.23) Die expliziten Formeln für die niedrigsten Ordnungen sind H0 (x) = 1 H1 (x) = 2x H2 (x) = 4x2 − 2 H3 (x) = 8x3 − 12x H4 (x) = 16x4 − 48x2 + 12 H5 (x) = 32x5 − 160x3 + 120x . (2.24) Die Polynome selbst (für n = 2 bis n = 5) sind in Abbildung 2.2a aufgetragen. Man erkennt, dass sie im asymptotischen Bereich große Werte annehmen werden. In der Abbildung 2.2b sieht man (für die gleichen n -Werte) die Funktionen exp[−x2 /2] Hn (x), die in aktuellen physikalischen Situationen eine Rolle spielen. Das asymptotische Verhalten ist stark gedämpft. Mit der Normierung xn für die höchste auftretende Potenz werden die Polynome mit Hen (x) bezeichnet. Die Summendarstellung lautet [n/2] Hen (x) = r=0 (−1)r n! xn−2r . r!2r (n − 2r)! (2.25) 2.2 Die Hermiteschen Polynome (a) 29 (b) 4 50 0.5 1 x 1.5 2 5 40 3 2 4 20 0 3 2 5 0 –50 1 2 3 4 5 6 x –20 –100 –150 –40 Die Funktionen Hn (x), n = 2 . . . 5 Die Funktionen e−x 2 /2 Hn (x), n = 2 . . . 5 Abb. 2.2. Die hermiteschen Polynome Vergleich der Entwicklung (2.25) mit der Entwicklung (2.5) der konfluenten hypergeometrischen Funktion zeigt, das die modifizierten Hermitepolynome Hen direkt in der Form n 1 x2 (2n)! 1 F −n, , He2n (x) = − (2.26) 2 n! 2 2 He2n+1 (x) = n 3 x2 (2n + 1)! 1 F −n, , − 2 n! 2 2 (2.27) dargestellt werden können. 2.2.1 Die erzeugende Funktion Die erzeugende Funktion der Hermiteschen Polynome 2 g(t, x) = e2tx−t = ∞ n t Hn (x) n! n=0 (2.28) kann folgendermaßen verifiziert werden: Entwickelt man die zwei Exponentialfunktionen, so ergibt sich 2 e2tx−t = = ∞ (2tx)r (−t2 )s r! s! r,s=0 ∞ (−1)s r,s=0 (2x)r r+2s t . r!s! Man setzt r + 2s = n und hat bei der verbleibenden Summation über s zu berücksichtigen, dass r = n − 2s ≥ 0 bzw. s ≤ n/2 30 2 Weitere spezielle Funktionen sein muss. Dies bedeutet, dass die obere Grenze der Summation über s genau, wie oben festgelegt, [n/2] ist. Es gilt dann ⎛ ⎞ [n/2] ∞ ∞ n 2 n! t tn ⎝ e2tx−t = (2x)(n−2s) ⎠ = Hn (x) . (−1)s (n − 2s)!s! n! n! n=0 s=0 n=0 Die erzeugende Funktion erlaubt die Bestimmung der Werte der Polynome für x = 0. Ausgehend von e −t2 = ∞ nt (−1) n=0 2n n! = ∞ k t k=0 k! Hk (0) findet man durch Koeffizientenvergleich 1 1 (−1)n = H2n (0) n! (2n)! oder (2n)! . n! Ist der Index des Polynoms ungerade, so hat das Polynom den Wert Null H2n (0) = (−1)n H2n+1 (0) = 0 . 2.2.2 Die Rodriguesformel Gemäß dem Resultat (2.28) sind die Hermiteschen Polynome die Koeffizienten der Taylorreihe für die erzeugenden Funktion n ∂ 2tx−t2 Hn (x) = e . ∂tn t=0 Umformung ergibt n ∂ −(x−t)2 x2 Hn (x) = e e ∂tn t=0 n x2 = (−1) e 2 = (−1)n ex ∂ n −(x−t)2 e ∂xn ∂ n −z2 e ∂z n t=0 , z=x wobei im ersten Schritt die Differentiationsregel ∂n ∂n f (t − x) = (−1)n n f (t − x) n ∂t ∂x und im zweiten Schritt die Substitution z = x−t benutzt wurde. In der letzten Zeile kann man die partielle Ableitung durch die gewöhnliche ersetzen. Die Rodriguesformel lautet somit 2.2 Die Hermiteschen Polynome 2 Hn (x) = (−1)n ex 31 n d −x2 e . dxn (2.29) 2.2.3 Orthogonalitätsrelation Mit Hilfe der erzeugenden Funktion kann man die Orthogonalität der Her2 miteschen Polynome bezüglich der Gewichtsfunktion e−x nachweisen. Man entwickelt in dem Integral ∞ 2 2 2 I= dx e−x e(−t +2tx−s +2sx) −∞ die erzeugenden Funktionen ∞ ∞ ∞ 2 tn sm Hn (x)Hm (x) = I= dx e−x Inm . t!s! −∞ n,m=0 n,m=0 (2.30) Das Integral über die Exponentialfunktionen kann umgeformt werden ∞ 2 2 2 dx e[−x +2(s+t)x] I = e−(t +s ) −∞ 2 = e−(t +s2 ) ∞ dx e[−(x−(s+t)) 2 +(s+t)2 ] −∞ = e2st ∞ dx e[−(x−(s+t)) 2 ] −∞ = e2st ∞ dz e[−z 2 ] −∞ =e √ 2st π Es wurde in dem vorletzten Schritt z = x − (s + t) substituiert und anschließend der Wert des Fehlerintegrals eingesetzt. Entwicklung der verbleibenden Exponentialfunktion ergibt für das Integral I I= ∞ √ (2st)n . π n! n=0 Vergleich mit (2.30) zeigt, dass das Integral√Inm verschwindet, falls m = n ist, und dass sich für m = n der Wert 2n n! π ergibt, so dass man zusammenfassend ∞ √ 2 dx e−x Hn (x)Hm (x) = 2n n! π δnm (2.31) −∞ schreiben kann. 32 2 Weitere spezielle Funktionen 2.2.4 Ableitungs- und Rekursionsformeln Anhand der Differentialgleichung (2.22) kann man eine Formel für die Ableitung eines Hermitepolynoms gewinnen. Differentiation nach der Variablen x ergibt (mit α = n und y = Hn ) d2 Hn (x) dHn (x) dHn (x) + 2(n − 1)Hn (x) = 0 . − 2x Hn (x) = 2 dx dx dx Hier liest man ab, dass die Funktion Hn (x) ein Polynom (n − 1) -ten Grades ist, das proportional zu der Funktion Hn (x) sein muss. Die Konstante in Hn (x) = CHn (x) bestimmt man durch Vergleich des Koeffizienten von xn−1 zu n2n = C2n−1 −→ C = 2n und notiert Hn (x) = 2nHn−1 f ür n ≥ 1 , H0 (x) = 0 . (2.32) Schreibt man die Differentialgleichung (2.22) in der Form dHn (x) − 2xHn (x) + 2nHn (x) = 0 dx und setzt die Relation (2.32) für Hn (x) ein, so findet man nach Sortierung (x) = 2xHn−1 (x) − Hn (x) . Hn−1 (2.33) (x) mit (2.32) sowie n durch (n + 1), so findet man Ersetzt man hier Hn−1 nach Sortierung die Rekursionsformel Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) . (2.34) Die zitierten Resultate können auch mit Hilfe der erzeugenden Funktion gewonnen werden. So erhält man z.B. die Relation (2.31) aus dem Argument ∞ ∞ 2 ∂ (2tx−t2 ) tn tn = 2te(2tx−t ) = 2 e Hn (x) = Hn−1 (x) n! ∂x (n − 1)! n=0 n=1 durch Koeffizientenvergleich. Die erzeugende Funktion eignet sich ebenfalls zur Gewinnung von Rekursionsformeln mit Ableitungen höherer Ordnung. Betrachtet man z.B. die m -te Ableitung der erzeugenden Funktion, so findet man auf der einen Seite mit der Kette von Umformungen ∞ r+m ! dm t (2tx−t2 ) m (2tx−t2 ) m e = (2t) e Hr (x) =2 dxm r! r=0 = 2m Auf der anderen Seite ist ∞ tn Hn−m (x) . (n − m)! n=m 2.2 Die Hermiteschen Polynome dm dxm 2 e(2tx−t ) ! = 33 ∞ n t dm {Hn (x)} . n! dxm n=0 Koeffizientenvergleich ergibt hier, vorausgesetzt es ist n > m, dm 2m n! Hn−m (x) {H (x)} = n dxm (n − m)! (n > m) . (2.35) 2.2.5 Integrale Aus einer möglichen Vielzahl von Integralen sollen zwei typische Beispiele vorgestellt und diskutiert werden. Wie das Normierungsintegral (2.31) kann das Integral ∞ 2 (1) dx xe−x Hn (x)Hm (x) Inm = −∞ mit Hilfe der erzeugenden Funktion berechnet werden. Man schreibt mit der Zwischenrechnung in Math.Kap. 2.2.3 ∞ ∞ 2 dx xg(x, t)g(x, s) = e2st dx xe−(x−t−s) , −∞ −∞ substituiert z = x − t − s ∞ 2 2st =e dz (z + t + s)e−z −∞ und erhält =e 2st ∞ √ √ (2st)n , (t + s) π = (t + s) π n! n=0 2 da der Integrand ze−z eine ungerade Funktion ist. Zu vergleichen ist dieses Ergebnis mit ∞ ∞ ∞ sm tr . dx xg(x, t)g(x, s) = dx xHm (x)Hr (x) m!r! −∞ r,m=0 −∞ Durch Koeffizientenvergleich findet man Beiträge zu dem Integral I (1) falls r = m + 1, m = n und r = m − 1, r = n ist, die in der Form ∞ √ " 2 dx xe−x Hn (x)Hm (x) = π 2n−1 n! δn−1,m −∞ + 2n (n + 1)! δn+1,m ) zusammengefasst werden können. Die Berechnung des Integrals I facher, wenn man die Rekursion (2.34) 1 xHn (x) = nHn−1 (x) + Hn+1 (x) 2 (2.36) (1) ist ein- 34 2 Weitere spezielle Funktionen und das Normierungsintegral benutzt. Ein Integral der Form ∞ 2 (2) In = dt tn e−t Hn (xt) 0 stellt einen weiteren Typus von Integralen mit speziellen Funktionen dar. Setzt man die Summendarstellung (2.23) ein, so findet man In(2) ∞ = n −t2 dt t e 0 (−1)r r=0 [n/2] = [n/2] (−1)r r=0 (2x)n−2r n! r!(n − 2r)! n! (2xt)n−2r r!(n − 2r)! ∞ 2 dt t2n−2r e−t . 0 Das Integral ist (siehe Band 2, Math.Kap. 4.1) eine Darstellung der Gammafunktion ∞ 2 1 ∞ 1 dt t2n−2r e−t = dz z n−r−1/2 e−z = Γ (n − r + 1/2) 2 0 2 0 mit dem Wert Γ (n − r + 1/2) = 1 1 · 3 · 5 · 7 . . . (2n − 1)Γ 2n 1 (2n − 2r)! √ π. = 2n−2r 2 2 (n − r)! (2) Benutzt man diese Aussage, so erhält man für des Integral In √ [n/2] (2n − 2r)! n! π (2) xn−2r . In = (−1)r n 2 r=0 2 r!(n − 2r)!(n − r)! Die endliche Summe in diesem Resultat stellt ein Legendre Polynom dar, denn man findet (siehe Band 2, Math.Kap. 4.3.2.3) z.B. mit der zuständigen Rodriguesformel n # 1 dn n! 1 dn 2 n 2n−2r x Pn (x) = n n (x − 1) = n n . 2 dx 2 dx r!(n − r)! r=0 Die Ableitung verschwindet, falls 2n − 2r < n , d.h. r > n/2 ist. Die Summe bricht also ab, wenn r = n/2 (gerades n) oder r = (n − 1)/2 (ungerades n) ist. Außerdem gilt (2n − 2r)! dn 2n−2r . x = dxn (n − 2r)! Setz man diese Aussagen zusammen, so findet man [n/2] Pn (x) = r=0 (−1)r (2n − 2r)! xn−2r . 2n r!(n − 2r)!(n − r)! 2.3 Die einfachen Laguerreschen Polynome 35 (2) Das Integral In liefert also eine Darstellung der Legendre Polynome durch ein Integral über Hermite Polynome ∞ 2 2 dt tn e−t Hn (xt) . (2.37) Pn (x) = √ n! π 0 2.3 Die einfachen Laguerreschen Polynome Die allgemeinen Laguerrefunktionen sind reguläre Lösungen der Differentialgleichung d d2 α L (x) + (α + 1 − x) Lα (x) + nLα (2.38) n (x) = 0 . dx2 n dx n Diese Funktionen werden meist so normiert, dass 1 α 1 lim Ln (x) = (−1)n x→∞ xn n! ist, doch findet man in der Literatur abweichende Festlegungen. Falls α eine ganze Zahl ist, werden sie als zugeordnete Laguerre Polynome bezeichnet, im Fall α = 0 spricht man von (einfachen) Laguerre Polynomen, die zuerst betrachtet werden sollen. Obschon man die einfachen Polynome als Spezialfall der zugeordneten Polynome abhaken könnte, ist eine gesonderte Betrachtung lehrreich. Die Lösung der Laguerreschen Differentialgleichung mit α = 0 x d d2 Ln (x) + (1 − x) Ln (x) + nLn (x) = 0 , dx2 dx die am Ursprung regulär ist, kann über einen Potenzreihenansatz Ln (x) = xs ar xr x (2.39) r gewonnen werden. Die Indexgleichung liefert s = 0 und die Rekursion ar+1 = − (n − r) ar . (r + 1)2 Die Auflösung der Rekursion mit der üblichen Wahl a0 = 1 liefert Ln (x) = 1 − n n(n − 1) 2 x+ x + ... 12 (2!)2 +(−1)r n(n − 1) . . . (n − r + 1) r x + ... , (r!)2 mit der Zusammenfassung Ln (x) = n r=0 (−1)r n! xr . (n − r)!(r!)2 (2.40) 36 2 Weitere spezielle Funktionen Die ersten Laguerrepolynome sind demnach L0 (x) = 1 L1 (x) = 1 − x L2 (x) = 1 (2 − 4x + x2 ) 2! L3 (x) = 1 (6 − 18x + 9x2 − x3 ) 3! 1 (24 − 96x + 72x2 − 16x3 + x4 ) . 4! Diese Funktionen sind in Abbildung 2.3 angedeutet. L4 (x) = 2 6 4 3 2 0 1 2 3 x 4 5 6 4 –2 –4 5 Abb. 2.3. Die einfachen Laguerrepolynome mit n = 2, 3, 4, 5 Die Polynome können sowohl durch eine erzeugende Funktion als auch durch eine Rodriguesformel dargestellt werde. 2.3.1 Die erzeugende Funktion Der Nachweis, dass der Ausdruck g(x, t) = exp[−xt/(1 − t)] (1 − t) die erzeugende Funktion der Laguerrepolynome ist, ergibt sich durch Entwicklung der Exponentialfunktion ∞ exp[−xt/(1 − t)] (−1)r xr tr = (1 − t) r! (1 − t)r+1 r=0 2.3 Die einfachen Laguerreschen Polynome 37 und anschließende Entwicklung von 1/(1 − t)r+1 in eine binomische Reihe ∞ (r + s)! 1 ts . = r+1 (1 − t) r!s! s=0 Man setzt diese Entwicklungen zusammen ∞ exp[−xt/(1 − t)] (r + s)! r r+s = x t (−1)r , (1 − t) (r!)2 s! r,s=0 benennt die Summationsindizes um (n = r + s, s = n − r), so dass man mit (2.40) n # ∞ exp[−xt/(1 − t)] n! r r = x tn (−1) 2 (n − r)! (1 − t) (r!) n=0 r=0 = ∞ Ln (x)tn (2.41) n=0 erhält. 2.3.2 Die Rodriguesformel Der Beweis der Rodriguesformel ex dn " n −x $ Ln (x) = x e n! dxn beruht auf der Leibnizformel für die n -te Ableitung eines Produkts (2.42) n n! dn−r xn dr e−x ex dn " n −x $ ex x = e n n! dx n! r=0 (n − r)!r! dxn−r dxn mit den Zutaten dn−r xn n! = xr n−r dx r! Es folgt direkt und dr e−x = (−1)r e−x . dxn n n! r n! ex dn " n −x $ ex x (−1)r e−x x = e n! dxn n! r=0 (n − r)!r! r! = n r=0 (−1)r n! (r!)2 (n − r)! xr = Ln (x) . Sowohl die erzeugende Funktion als auch die Rodriguesformel sind geeignete Werkzeuge, um eine Vielzahl von Aussagen zu den Laguerrepolynomen zu gewinnen, so z.B. spezielle Werte für x = 0 . Die erzeugende Funktion mit x = 0 lautet 38 2 Weitere spezielle Funktionen ∞ ∞ 1 n = t = Ln (0)tn . (1 − t) n=0 n=0 Koeffizientenvergleich ergibt Ln (0) = 1 . Ergänzt wird diese Aussage durch Ln (0) = −n . Dies folgt aus der Differentialgleichung (2.39) an der Stelle x=0 Ln (0) + nLn (0) = 0 . 2.3.3 Die Orthogonalitätsrelation Die Laguerre Polynome sind bezüglich der Gewichtsfunktion e−x orthogonal ∞ dx e−x Ln (x)Lm (x) = δnm . (2.43) 0 Zum Nachweis dieser Aussage betrachtet man das Integral über das Produkt von zwei erzeugenden Funktionen multpliziert mit dem Exponentialfaktor ∞ exp[−xt/(1 − t)] exp[−xs/(1 − s)] dx e−x (1 − t) (1 − s) 0 ∞ = n,m=0 ∞ dx e−x Ln (x)Lm (x)tn sm . (2.44) 0 Das gesuchte Integral tritt auf der rechten Seite als Faktor des Terms tn sm auf. Die weitere Auswertung der linken Seite ergibt ∞ exp[−xt/(1 − t)] exp[−xs/(1 − s)] dx e−x (1 − t) (1 − s) 0 = 1 (1 − t)(1 − s) − ∗ exp −x 1 + 1 = (1 − t)(1 − s) = = 1 (1 + t/(1 − t) + s/(1 − s)) s t + (1 − t) (1 − s) − ∞ 0 1 1 + t/(1 − t) + s/(1 − s) 1 1 = (1 − t)(1 − s) + t(1 − s) + s(1 − t) (1 − st) ∞ sn tn . n=0 Vergleich der rechten Seite von (2.44) mit diesem Resultat 2.4 Die zugeordneten Laguerreschen Polynome ∞ n,m=0 ∞ dx e−x Ln (x)Lm (x)tn sm = 0 ∞ 39 sn tn n zeigt, dass das Integral den Wert 1 für m = n und 0 für m = n hat. 2.3.4 Rekursionsformeln Die Gewinnung von Rekursionsformeln wie (n + 1)Ln+1 (x) = (2n + 1 − x)Ln (x) − nLn − 1(x) Ln−1 (x) = Ln−1 (x) − Ln (x) (2.45) xLn (x) = nLn (x) − nLn−1 (x) kann der Herleitung der entsprechenden Formeln für die zugeordneten Laguerrepolynome in Math.Kap. 2.4.3 entnommen werden. Hier soll nur die Ableitungsformel Ln (x) =− n−1 Ls (x) (2.46) s=0 explizit bewiesen werden. Differentiation der erzeugenden Funktion nach x ergibt ∞ ∞ t −xt t Ln (x)tn = − exp − Ls (x)ts . = − 2 (1 − t) (1 − t) (1 − t) n=0 s=0 Entwickelt man 1/(1 − t) und sortiert, so erhält man ∞ Ln (x)tn = − n=0 ∞ Ls (x)ts+r+1 . s,r=0 Um beide Seiten zu vergleichen, setzt man s + r + 1 = n, bzw. r = n − s − 1 . Um zu gewährleisten, dass r ≥ 0 ist, muss n − s − 1 ≥ 0 sein. Die Summe über s ist somit auf s ≤ n − 1 beschränkt und es folgt die Relation n−1 # ∞ ∞ n {Ln (x)} t = − Ls (x) tn , n=0 n=0 s=0 die (2.46) entspricht. 2.4 Die zugeordneten Laguerreschen Polynome Die zugeordneten Laguerrepolynome können durch die konfluente hypergeometrische Funktion F (a, c; x) dargestellt werden. Durch Vergleich der Differentialgleichungen (2.38) 40 2 Weitere spezielle Funktionen d2 α d L (x) + (α + 1 − x) Lα (x) + nLα n (x) = 0 dx2 n dx n und (2.1) x d2 d F (a, c; x) + (c − x) F (a, c; x) − aF (a, c; x) = 0 dx2 dx kann man die Koeffizienten mit x a = −n c=α+1 und identifizieren. Es ist also bis auf eine Proportionalitätskonstante Lα n (x) = P (n, α)F (−n, α + 1; x) . Setzt man auf der rechten Seite die Kummerschen Reihe (2.5) ∞ F (a, c; x) = a a(a + 1) x2 Γ (c) Γ (a + k) xk =1+ x+ + ... Γ (a) Γ (c + k) k! c c(c + 1) 2! k=0 ein und vergleicht die Vorfaktoren der Terme in xn , so ergibt sich wegen der n n Festlegung Lα n (x) → (−1) (1/n!)x (man beachte, dass alternative Festlegungen in der Literatur zu finden sind) und der Relation P (n, α) ∗ 1 Γ (α + 1)(−1)(−2) . . . (−n) = (−1)n n!Γ (α + 1 + n) n! die Proportionalitätskonstante zu P (n, α) = Γ (α + n + 1) , Γ (n + 1)Γ (α + 1) so dass man die Relation Γ (α + n + 1) Lα F (−n, α + 1; x) n (x) = Γ (n + 1)Γ (α + 1) = (α + n)! F (−n, α + 1; x) n!α! (2.47) (n + α)! xr (n − r)!(α + r)!r! (2.48) und die Darstellung Lα n (x) = n r=0 (−1)r notieren kann. Die zugeordneten Laguerre Polynome können auch durch die α−fache Ableitung von einfachen Laguerre Polynomen dargestellt werden. Man berechnet (−1)α setzt n+α dα xr dα (n + α)! α r L (x) = (−1) (−1) , n+α dxα (r!)2 (n + α − r)! dxα r=0 2.4 Die zugeordneten Laguerreschen Polynome 41 d x r! xr−α = α dx (r − α)! α r mit (r − α) ≥ 0 ein und erhält (−1)α n+α dα (n + α)! α xr−α . L (x) = (−1) (−1)r n+α α dx (r!)(n + α − r)!(r − α)! r=0 Die Umbenennung (r − α) = s ≥ 0 mit smax = n ergibt schließlich dα (n + α)! xs L (x) = (−1)s n+α dxα (α + s)!(n − s)!s! s=0 n (−1)α oder dα Ln+α (x) . dxα Die einfachsten zugeordneten Laguerre Polynome sind α Lα n (x) = (−1) (2.49) Lα 0 (x) = 1 Lα 1 (x) = (α + 1 − x) L02 (x) = 1 − 2x + x2 2! x2 2! L12 (x) = 3 − 3x + L22 (x) = 6 − 4x + x2 2! x3 3x2 x3 − L13 (x) = 4 − 6x + 2x2 − ... . 2 3! 3! Die zugeordneten Laguerre Polynome mit n = 2 und n = 3 und 0 ≤ α ≤ 4 werden in den Abbildungen 2.4 wiedergegeben. L03 (x) = 1 − 3x + (a) (b) 15 30 20 10 10 5 0 0 1 2 3 4 x 5 6 7 n=2 unterste Kurve bei x = 0: α = 0 höchste Kurve bei x = 0: α = 4 8 1 2 3 4 x 5 6 7 8 –10 n=3 unterste Kurvebei x = 0: α = 0 höchste Kurvebei x = 0: α = 4 Abb. 2.4. Die zugeordneten Laguerre Polynome Lα n mit (a) n = 2 und (b) n = 3 42 2 Weitere spezielle Funktionen 2.4.1 Die erzeugende Funktion Die erzeugende Funktion der zugeordneten Laguerre Polynome ist gα (x, t) = ∞ e−xt/(1−t) = tn Lα n (x) . (1 − t)α+1 n=0 (2.50) Zum Nachweis dieser Aussage bildet man • die explizite Ableitung −t ∞ ∂ gα (x, t) = − ntn Lα n (x) , ∂t n=0 sowie • durch Anwendung der definierenden Differentialgleichung ∂2 ∂ x 2 + (α + 1 − x) gα (x, t) ∂x ∂x = n=0 t n ∂ ∂2 x 2 + (α + 1 − x) ∂x ∂x Lα n (x) = − ntn Lα n (x) . n=0 Da die rechten Seiten der letzten zwei Gleichungen übereinstimmen, muss dies auch für die linken Seiten gelten. Eine positive Antwort bestätigt die Gültigkeit der angegebenen erzeugenden Funktion. Es ist ∂ (α + 1) x gα (x, t) = − gα (x, t) ∂t (1 − t) (1 − t)2 und ∂ t gα (x, t) = − gα (x, t) ∂x (1 − t) ∂2 t2 g (x, t) = gα (x, t) . α ∂x2 (1 − t)2 Man bildet nun zum Nachweis der erzeugenden Funktion ∂2 ∂ x 2 + (α + 1 − x) gα (x, t) ∂x ∂x = xt2 t − (α + 1 − x) (1 − t)2 (1 − t) = −t (α + 1) x − (1 − t) (1 − t)2 gα (x, t) gα (x, t) = −t ∂ gα (x, t) . ∂t 2.4 Die zugeordneten Laguerreschen Polynome 43 2.4.2 Die Rodriguesformel Die Rodriguesformel Lα n (x) = ex xα (n)! dn " n −x $ x e dxn (2.51) wird auch in diesem Fall durch direkte Anwendung der Ableitungsformel von Leibniz bewiesen. Diese ergibt n ex ex dn " α+n −x $ dn−r xα+n dr e−x n! x = e . n (α + n)! dx (α + n)! r=0 (n − r)!r! dxn−r dxn Mit dn−r xα+n (α + n)! α+r x = dxn−r (α + r)! und dr e−x = (−1)r e−x dxn folgt direkt n (α + n)! α+r ex n! ex dn " n −x $ x x = e (−1)r e−x xα n! dxn xα n! r=0 (n − r)!r! (α + r)! = n r=0 (−1)r (α + n)! xr = Lα n (x) . (n − r)!(α + r)r! 2.4.3 Rekursionsformeln Mit Hilfe der erzeugenden Funktion kann man nützliche Rekursionsformeln für die Laguerre Polynome gewinnen. Eine dieser Formeln gewinnt man durch Betrachtung der Ableitung der erzeugenden Funktion nach der Variablen t (α + 1) ∂ x gα (x, t) = − ntn−1 Lα gα (x, t) = n (x) . 2 ∂t (1 − t) (1 − t) n=0 Man multipliziert mit (1 − t)2 durch und setzt die erzeugende Funktion ein 2 tn Lα ntn−1 Lα {(α + 1)(1 − t) − x} n (x) = (1 − t) n (x) , n=0 n=0 sortiert nach Potenzen von t n α (α + n + 1)tn+1 Lα n (x) + (x − α − 2n − 1)t Ln (x) n=0 + ntn−1 Lα n (x) = 0 und extrahiert durch Koeffizientenvergleich das Ergebnis α α (α + n)Lα n−1 (x) + (x − α − 2n − 1)Ln (x) + (n + 1)Ln+1 (x) = 0 . (2.52) 44 2 Weitere spezielle Funktionen Eine Rekursionsformel mit Ableitungen der Laguerre Polynome erhält man durch Differentiation der erzeugenden Funktion nach x ∂ d t gα (x, t) = − gα (x, t) = tn Lα n (x) . ∂x (1 − t) dx n=0 Sortiert man in entsprechender Weise, so erhält man d n+1 α (x) + t L (x) =0. (tn − tn+1 ) Lα n dx n n=0 Koeffizientenvergleich liefert in diesem Fall die Rekursionsformel & d % α Ln−1 (x) − Lα (2.53) Lα n−1 (x) = n (x) . dx Zusätzliche Rekursionsformeln kann man sowohl auf der Basis der Darstellung der zugeordneten Laguerrepolynome durch die konfluente hypergeometrische Funktion (Math.Kap. 2.1) als auch durch Differentiation der Rekursionsformeln für die einfachen Laguerre Polynome gewinnen. 2.4.4 Integrale mit den zugeordneten Laguerrepolynomen Multipliziert man die definierende Differentialgleichung x d2 α d Ln (x) + (α + 1 − x) Lα (x) + nLα n (x) = 0 2 dx dx n mit xα e−x , so kann man die ersten zwei Terme zusammenfassen d α d d2 α α −x α −x d α L (x) . x e x 2 Ln (x) + (α + 1 − x) Ln (x) = x e dx dx dx dx n Bildet man nun mit dem modifizierten, doch immer noch hermiteschen Operator d α −x d Ĥmod = x e − nxα e−z dx dx die Differenz ∞ α α α dx Lα n (x)(Ĥmod Ln (x)) − Ln (x)(Ĥmod Ln (z)) = 0 , 0 so findet man die Aussage ∞ α (n − n ) dx xα e−x Lα n (x)Ln (z) = 0 . (2.54) 0 Die Laguerre Polynome sind in dem Index n bezüglich der Gewichtsfunktion xα e−z orthogonal. 2.4 Die zugeordneten Laguerreschen Polynome 45 Zur Berechnung des Normierungsintegrals ∞ 2 In = dx xα e−x L(α) n (z) 0 kann man auf die erzeugende Funktion zurückgreifen. Man beginnt mit dem Ansatz ∞ ∞ (α) α −x 2 n+n dx x e gα (x, t) = dx xα e−α L(α) n (x)Ln (x)t 0 0 n,n = n ∞ 0 2 dx xα e−α L(α) (x) t2n . n (2.55) Schreibt man die linke Seite aus, so erkennt man, dass eine einfache Integration über die Variable x auszuführen ist. Mit der Standardformel ∞ Γ (α + 1) dx xα e−sx = sα+1 0 erhält man I(t) = ∞ dx xα e−x e−2xt/(1−t) 0 = ∞ dx xα e−(1+t)x/(1−t) 0 = 1 (1 − t)2α+2 1 (1 − t)2α+2 Γ (α + 1) 1 (1 − t)α+1 2α+2 (1 − t) (1 + t)α+1 = Γ (α + 1) 1 . (1 − t2 )α+1 Mit Entwicklung von (1 − t2 )−(α+1) in eine binomische Reihe (vergleiche Band 1, Math.Kap. 1.3.1.1) = Γ (α + 1) ∞ Γ (α + k + 1) k=0 Γ (α + 1) ∞ Γ (α + k + 1) t2k = t2k Γ (k + 1) Γ (k + 1) k=0 und Vergleich der Faktoren der Potenzen t auf beiden Seiten von (2.55) ergibt sich das Resultat ∞ 2 (α + n)! Γ (α + n + 1) = . (2.56) dx xα e−x L(α) = n (x) Γ (n + 1) n! 0 2n Weitere Integrale können mit der Rodriguesformel gewonnen werden. 46 2 Weitere spezielle Funktionen 2.4.5 Additionstheorem Als Beispiel für Additionstheoreme mit zugeordneten Laguerre Polynomen soll die Relation n β Lα+β+1 (x + z) = Lα (2.57) n r (x)Ln−r (z) r=0 bewiesen werden. Die erzeugende Funktion des Laguerrepolynoms auf der linken Seite dieser Gleichung lautet ∞ Lα+β+1 (x + z)tn = n 0 exp[−(x + z)t/(1 − t)] . (1 − t)α+β+2 (2.58) Der Bruch mit der Exponentialfunktion kann in der Form exp[−(x + z)t/(1 − t)] exp[−xt/(1 − t)] exp[−zt/(1 − t)] = (1 − t)α+β+2 (1 − t)α+1 (1 − t)β+1 aufgespalten werden und ergibt ∞ exp[−(x + z)t/(1 − t)] β r+s = Lα . r (x)Ls (z)t (1 − t)α+β+2 r,s=0 Die Summationsindizes werden umbenannt r+s=n bzw. s=n−r . Die Aussage, dass s = n − r ≥ 0 sein muss, beschränkt die Summe über r auf die obere Grenze n. Der Ansatz (2.58) nimmt dann die Form n # ∞ ∞ β α+β+1 n α Ln (x + z)t = Lr (x)Ln−r (z) tn , n=0 n=0 r=0 aus der durch Koeffizientenvergleich das Additionstheorem (2.57) folgt. 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index 2.5.1 Die Bessel-Riccati Funktionen Die regulären Lösungen der Differentialgleichung d2 fl (x) l(l + 1) + 1− fl (x) = 0 , dx2 x2 bzw. in Kurzform l(l + 1) fl (x) + 1 − fl (x) = 0 x2 (2.59) 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index 47 sind die Bessel-Riccati Funktionen fl (x) = ul (x). Diese Funktionen, sowie die zugehörigen (für x → 0) singulären Lösungen, die Neumann-Riccati Funktionen fl (x) = vl (x) sind nahe Verwandte der sphärischen Besselfunktionen, die in Band 2, Math.Kap. 4.4.3 als Spezialfall der allgemeinen Besselfunktionen Jν (x) mit halbzahligem Index eingeführt wurden. Die wichtigsten Eigenschaften der Bessel-Riccati und Neumann-Riccati Funktionen sollen in diesem Abschnitt auf der Basis der Differentialgleichung (2.59) diskutiert werden. Weitere Aussagen zu diesen Funktionen kann man Band 2, Math.Kap. 4.4.3 sowie dem folgenden Abschnitt, in dem zusätzliche Eigenschaften der sphärischen Besselfunktionen besprochen werden, entnehmen. Anstelle der üblichen Lösung einer Differentialgleichung über einen Reihenansatz bietet sich eine alternative Strategie an. Man beginnt mit dem einfachen Fall l = 0 und bestimmt die Lösungen für l > 0 durch Rekursionsformeln, die aus (2.59) gewonnen werden können. Die allgemeine Lösung der Differentialgleichung f0 (x) + f0 (x) = 0 kann durch das Fundamentalsystem f0 (x) −→ {sin x, cos x} oder wahlweise durch f0 (x) −→ {eix , e−ix } dargestellt werden. Anstatt direkt eine Rekursionsformel für die Funktionen fl (x) abzuleiten, ist es günstiger, das Verhalten dieser Funktion in der Umgebung der Stelle x = 0 abzuspalten und eine Rekursionsformel für die Restfunktion zu suchen. Eine Abspaltung des Verhaltens im asymptotischen Bereich ist nicht anzuraten, da keine quadratintegrable Lösung (siehe die Lösung für l = 0) gesucht wird. Mit dem Ansatz fl (x) = xl+1 gl (x) erhält man für die Restfunktion die Differentialgleichung 2(l + 1) gl (x) + gl (x) = 0 . x Anhand dieser Differentialgleichung kann man die Gültigkeit der Rekursionsformel g (x) (2.60) gl+1 (x) = − l x beweisen. Man vergleicht zu diesem Zweck die nochmals differenzierte Differentialgleichung für die Funktion gl (x) 2(l + 1) 2(l + 1) gl (x) + 1 − gl (x) + gl (x) = 0 x x gl (x) + 48 2 Weitere spezielle Funktionen mit der Gleichung, die man gewinnt, wenn man mit der Rekursionsformel in die Differentialgleichung für gl+1 (x) 2(l + 2) gl+1 (x) + gl+1 (x) = 0 x eingeht. Wegen g (x) g (x) g (x) = l 2 − l − l x x x (x) + gl+1 g (x) − l x = −2 gl (x) gl (x) gl (x) + 2 − x3 x2 x erhält man 1 2(l + 1) 2(l + 1) gl (x) + 1 − − gl (x) + gl (x) = 0 . x x x Da der Ausdruck in der geschweiften Klammer genau die differenzierte Differentialgleichung für gl (x) ist, ergibt sich kein Widerspruch und somit die Richtigkeit der Rekursion (2.60). Aus (2.60) kann man mit zwei Schritten eine Rekursionsrelation für die Bessel-Riccati Funktionen gewinnen. Es ist fl (x) fl+1 (x) = xl+2 gl+1 (x) = −xl+1 gl (x) = −xl+1 xl+1 (l + 1) fl (x) − fl (x) , x zusammengefasst = (l + 1) fl (x) − fl (x) . (2.61) x Mit Hilfe von (2.61) kann man aus den Fundamentallösungen für l = 0 Besselfunktionen erzeugen. Die eigentlichen Bessel-Riccati Funktionen, die mit ul (x) bezeichnet werden, gewinnt man, wenn man die Rekursion beginnend mit u0 (x) = sin x auswertet. Man erhält 1 u1 (x) = sin x − cos x x 3 3 u2 (x) = − 1 sin x − cos x 2 x x fl+1 (x) = .. . Diese Funktionen sind für x → 0 regulär 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index x→0 ul (x) −→ 49 xl+1 . (2l + 1)!! Die Neumann-Riccati Funktionen, die zur Unterscheidung mit vl (x) bezeichnet werden, entstehen durch konsekutive Anwendung der Rekursion beginnend mit v0 (x) = − cos x. Es ist (das Vorzeichen entspricht der Konvention) 1 v1 (x) = − cos x − sin x x 3 3 v2 (x) = 1 − 2 cos x − sin x x x .. . Diese Funktionen sind für x → 0 singulär (2l − 1)!! . xl Das zitierte Verhalten der zwei Riccatifunktionen für x → 0 ergibt sich aus der Differentialgleichung mit dem bei x = 0 dominanten Term x→0 vl (x) −→ − l(l + 1) fl (x) = 0 . x2 Mit dem Ansatz f = xα findet man α = l +1 und −l. Die jeweiligen Faktoren ergeben sich aus der expliziten Form. Das asymptotischen Verhalten kann man auch der Rekursion (2.61) entnehmen, die für x −→ ∞ auf die Form fl (x) − fl+1 (x) = −fl (x) reduziert werden kann. Es folgen dann die Sequenzen 0 ul 1 2 3 sin x − cos x − sin x cos x 4 sin x vl − cos x − sin x cos x sin x − cos x , die in der Form π x→∞ ul (x) −→ sin x − l 2 π x→∞ vl (x) −→ − cos x − l 2 zusammengefasst werden können. Die Funktionen {ul (x), vl (x)} sind Fundamentallösungen der Differentialgleichung (2.59). Man kann ein alternatives Fundamentalsystem, die HankelRiccati Funktionen, gewinnen, wenn man die Rekursion mit 50 2 Weitere spezielle Funktionen {w0 (x) = −ieix , w0 (x) = ie−ix } (+) (−) beginnt. Es ist dann z.B. i (+) w1 (x) = − 1 + eix x (+) w2 (x) = − 3i 3 − i eix + x2 x ... Die Hankel-Riccati Funktionen entsprechen somit den Kombinationen (+) (x) = ul (x) + ivl (x) (−) (x) = ul (x) − ivl (x) . wl wl 2.5.2 Die sphärischen Besselfunktionen Anstelle der Riccati-Funktionen werden alternativ die sphärischen Besselfunktionen benutzt, die durch sphärische Besselfunktion : jl (x) = ul (x) x sphärische Neumannfunktion : nl (x) = vl (x) x (±) wl (x) x definiert sind. Die sphärischen Besselfunktionen sind auf der anderen Seite mit den eigentlichen Besselfunktionen Jν (x) und Nν (x) verknüpft, so z.B. ' ' π π Jl+1/2 (x) Nl+1/2 (x) jl (x) = nl (x) = etc. 2x 2x (±) sphärische Hankelfunktionen : hl (x) = Diese enge Verknüpfung von drei Sätzen von Funktionen erlaubt es, einen dieser Sätze genauer zu studieren und die Eigenschaften der verwandten Funktionen daraus zu gewinnen. Da die Besselfunktionen die allgemeinere Klasse darstellen, ist es zweckmäßig, deren Eigenschaften als Ausgangspunkt zu nehmen. So kann man neben den auf diese Weise in Band 2, Math.Kap. 4.4.3 gewonnenen Rekursionsformeln (bezeichne die sphärischen Besselfunktionen (±) jl (x), nl (x), hl (x) generisch mit Rl (x)) Rl+1 (x) = (2l + 1) Rl (x) − Rl−1 (x) x (2.62) 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index 51 (2l + 1)Rl (x) = lRl−1 (x) − (l + 1)Rl+1 (x) einen erweiterten Satz von Rekursionsrelationen gewinnen. Anhand der Reihendarstellung von Jν (x) findet man z.B. ∞ x2r+2ν 1 d d (xν Jν (x)) = (−1)r dx dx r=0 r!Γ (ν + r + 1) 22r+ν = xν ∞ (−1)r x2r+ν−1 2(ν + r) r!Γ (ν + r + 1) 22r+ν (−1)r 1 x2r+ν−1 r!Γ (ν + r) 22r+ν−1 r=0 = xν ∞ r=0 = xν Jν−1 (x) . Setzt man hier für Jν = Jl+1/2 die sphärische Funktion jl ein, so folgt $ d " l+1 x jl (x) = xl+1 jl−1 (x) . dx Mit einem entsprechenden Argument gewinnt man auch $ d " −l x jl (x) = −x−l jl+1 (x) . (2.63) dx Auf der anderen Seite kann man jede Relation zwischen den Riccatifunktionen in eine Relation zwischen den sphärischen Besselfunktionen umschreiben. So folgt aus (2.61) mit der Ersetzung fl → xRl die erste der Relationen (2.62). Rayleighs Formeln für die sphärischen Besselfunktionen l 1 d sin x l l jl (x) = (−1) x x dx x nl (x) = (−1)l xl 1 d x dx (±) hl (x) = ∓i(−1)l xl l 1 d x dx cos x x l e±ix x leitet man dagegen vorzugsweise direkt her, z.B. mit vollständiger Induktion unter Zuhilfenahme von (2.63). Der Induktionsschritt lautet $ d " −l x jl (x) jl+1 (x) = −xl dx l d sin x d = −xl x−l (−1)l xl dx xdx x 52 2 Weitere spezielle Funktionen d x dx l+1 l = (−1) = (−1)l+1 xl+1 1 d x dx 1 d x dx l l+1 sin x x sin x x . Das asymptotische Verhalten der drei Sätze von Funktionen ist bis auf Faktoren gleich, so findet man z.B. für x → ∞ ' 1 π 2 cos x − ν + Jν (x) → πx 2 2 π 1 sin x − l x 2 π . ul (x) → sin x − l 2 Das Verhalten für x −→ 0 ist ebenfalls koordiniert x ν 1 Jν (x) → Γ (ν + 1) 2 jl (x) → jl (x) → xl (2l + 1)!! ul (x) → xl+1 . (2l + 1)!! Zum Nachweis, dass jeder der drei Sätze von Funktionen ein Fundamentalsystem der jeweiligen Differentialgleichung darstellt, muss man die Wronskideterminante W (x) berechnen. Man beginnt zweckmäßigerweise mit den eigentlichen Besselfunktionen. Der Ausgangspunkt ist dW (x) d = (Jν (x)Nν (x) − Jν (x)Nν (x)) = Jν (x)Nν (x) − Jν (x)Nν (x) . dx dx Beide Funktionen erfüllen die Differentialgleichung x2 y (x) + xy (x) + (x2 − ν 2 )y(x) , so dass man d (Jν (x)Nν (x) − Jν (x)Nν (x)) x2 dx " $ " $ = Jν (x) −xNν (x) − (x2 − ν 2 )Nν (x) − −xJν (x) + (x2 − ν 2 )Jν (x) = −x (Jν (x)Nν (x) − Jν (x)Nν (x)) erhält. Fasst man diese Relation als Differentialgleichung für die Wronskideterminante auf 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index 53 W (x) dW (x) =− , dx x so kann man die Lösung ln W (x) + ln x = ln(xW (x)) = const. in der Form const. x angeben. Zur Festlegung der Konstanten benutzt man ν = 0 und x → 0 mit Jν (x)Nν (x) − Jν (x)Nν (x) = J0 (x) → 1 und N0 (x) → 2 ln x π und findet J0 (x)N0 (x) − J0 (x)N0 (x) → 2 . πx Das Endresultat Jν (x)Nν (x) − Jν (x)Nν (x) = ergibt wegen Jl+1/2 (x) = 2 πx 2x/π jl (x) und Nl+1/2 (x) = (2.64) 2x/π nl (x) für die sphärischen Besselfunktionen 1 . (2.65) x2 Für die Riccati-Funktionen erhält man mit Rl (x) = fl (x)/x die Relation jl (x)nl (x) − jl (x)nl (x) = ul (x)vl (x) − ul (x)vl (x) = 1 . (2.66) Für die sphärischen Besselfunktionen kann man mit einem ähnlichen Argument wie bei der Gewinnung der Wronskideterminante eine Orthogonalitätsrelation gewinnen. Man geht z.B. von der Differentialgleichung x2 jl (x) + 2xjl (x) + (x2 − l(l + 1))jl (x) = 0 aus und fasst die ersten zwei Terme zusammen d " 2 $ x jl (x) + (x2 − l(l + 1))jl (x) = 0 . dx Entsprechend kann man für einen Index n $ d " 2 x jn (x) + (x2 − n(n + 1))jn (x) = 0 dx schreiben. Man bildet die Kombination $ $ d " d " jn (x)x2 jl (x) − jl (x)x2 jn (x) dx dx = [l(l + 1) − n(n + 1)]jl (x)jn (x) 54 2 Weitere spezielle Funktionen und integriert über das Grundintervall [0, ∞] ∞ [l(l + 1) − n(n + 1)] dx jl (x)jn (x) 0 ∞ = jn (x)x2 jl (x) − jl (x)x2 jn (x) . 0 Nur die obere Grenze trägt auf der rechten Seite dieser Gleichung bei. Mit lπ lπ 1 1 jl (x) −→ sin x − jl (x) −→ cos x − x 2 x 2 in führender Ordnung für x → ∞ erhält man π ∞ sin [l − n] 2 . dx jl (x)jn (x) = (l(l + 1) − n(n + 1)) 0 (2.67) Der Fall l = n, für den dieses Resultat unbestimmt ist, kann mit der Regel von L’Hospital behandelt werden. Man findet ⎡π π ⎤ ∞ cos [l − n] π 2 ⎦ . (2.68) dx jl2 (x) = ⎣ 2 = (2l + 1) 2(2l + 1) 0 n=l 2.5.3 Eine Integraldarstellung der regulären Bessel-Riccati Funktion In Kap. 6.4 wird die Integraldarstellung der Bessel-Riccatifunktion 1 l x ul (x) = (−i) dt eitx Pl (t) 2 −1 benötigt. Diese Relation soll in diesem Abschnitt abgeleitet werden. Der Ausgangspunkt ist das Integral 1 I(ν, x) = dt eixt (1 − t2 )ν−1/2 , (2.69) −1 das letztlich eine Integraldarstellung der Besselfunktion Jν (x) ergibt. Entwicklung der Exponentialfunktion ist der erste Schritt ∞ (ix)r 1 I(ν, x) = dt tr (1 − t2 )ν−1/2 . r! −1 r=0 Das Integral ist nur für gerade Werte von r von Null verschieden. Man setzt r = 2s und nutzt die Symmetrie des Integrals ∞ (ix)2s 1 I(ν, x) = 2 dt t2s (1 − t2 )ν−1/2 . (2s)! 0 s=0 2.5 Ergänzung zu den Besselfunktionen mit halbzahligem Index 55 Die Substitution u = t2 , du = 2t dt zeigt, dass das Integral eine Betafunktion (Math.Kap. (2.7) ist ∞ (ix)2s 1 I(ν, x) = du us−1/2 (1 − u)ν−1/2 (2s)! 0 s=0 = ∞ (ix)2s = B(ν + 1/2, s + 1/2) (2s)! s=0 ∞ (ix)2s Γ (ν + 1/2)Γ (s + 1/2) Γ (ν + s + 1) (2s)! s=0 . Die Gammafunktion Γ (s + 1/2) wird durch die explizite Form (2s)! √ π 22s s! ersetzt, so dass man nach Sortierung Γ (s + 1/2) = " x $2s−ν ∞ √ x −ν s 2 I(ν, x) = Γ (ν + 1/2) π (−1) 2 s!Γ (ν + s + 1) s=0 erhält. Die Summe stellt (siehe Band 2, Math.Kap. 4.4) die Besselfunktion dar. Das Ergebnis dieser Kette von Argumenten lautet also √ x −ν I(ν, x) = Γ (ν + 1/2) π Jν (x) . 2 Im Hinblick auf das gewünschte Endresultat setzt man noch ν = l + 1/2 und benutzt ' ' 2x 2 jl (x) = ul (x) , Jl+1/2 (x) = π πx um l+1 2 I(l + 1/2, x) = Γ (l + 1) ul (x) (2.70) x zu schreiben. In einem zweiten Durchgang wertet man, mit ν = l + 1/2, das Integral (2.69) durch l -fache Integration aus 1 dt eixt (1 − t2 )l I(l + 1/2, x) = −1 − = = 1 ix 1 ix l 1 dt eixt −1 l 1 −1 dt eixt dl (1 − t2 )l l dt dl 2 (t − 1)l . l dt 56 2 Weitere spezielle Funktionen Die Ableitung unter dem Integranden entspricht der Rodriguesformel für die Legendrepolynome (Band 2, Math.Kap. 4.3.1) dl 2 (t − 1)l = 2l l! Pl (t) . l dt Es ist somit l 1 2 dt eixt Pl (t) . I(l + 1/2, x) = l! ix −1 (2.71) Vergleich von (2.70) und (2.71) zeigt, dass eine Integraldarstellung der regulären Bessel-Riccati Funktion in der Form x 1 ul (x) = (−i)l dt eixt Pl (t) (2.72) 2 −1 angegeben werden kann. 2.6 Die Fresnelintegrale Die Fresnelintegrale x π t2 dt cos C(x) = 2 0 S(x) = x dt sin 0 π t2 , 2 (2.73) die in Abbildung 2.5 dargestellt sind, sind mit der Fehlerfunktion erf x ver- C(x) 0.8 S(x) 0.6 0.4 0.2 0 1 2 3 x 4 5 6 Abb. 2.5. Die Fresnelintegrale knüpft. Diese Funktion ist durch x 2 2 dt e−t erf x = √ π 0 (2.74) 2.6 Die Fresnelintegrale 57 definiert. Der Grenzwert dieser Funktion für x → ∞ entspricht bis auf einen Faktor dem Fehlerintegral, so dass lim erf x = 1 x→∞ ist. Um die Relation zwischen den Funktionen herzustellen, benutzt man in (2.73) die Substitution t= (1 + i) √ t . π Es ist dann (1 + i)2 t πt2 2 = = i t , 2 2 so dass man (1 + i) x 2 S(x) = √ dt sin i t π 0 2 C(x) = (1 + i) √ π x dt cos i t 2 0 erhält, wobei die obere Integrationsgrenze durch √ π(1 − i)x x = 2 gegeben ist. Die Kombination C(x) + iS(x) ergibt dann (1 + i) x −t 2 (1 + i) erf x C(x) + iS(x) = √ dt e = 2 π 0 (1 + i) erf = 2 √ π(1 − i)x . 2 (2.75) Eine Darstellung der Fresnelintegrale, die in der Theorie der Diffraktion viel benutzt wird, ist die Darstellung durch die Hilfsfunktionen f (x) und g(x) π π 1 x2 − g(x) cos x2 C(x) = + f (x) sin 2 2 2 (2.76) π π 1 − f (x) cos x2 − g(x) sin x2 . 2 2 2 Um diese Form zu gewinnen, kann man in verschiedener Weise vorgehen. Ein direktes Argument wurde zuerst von A. Cauchy (Comptes Rendus, XV (1842) S. 542 und 573) angegeben, das sich besonders für die Gewinnung der asymptotischen Form eignet. Man benutzt in (2.73) die Substitution z = πt2 /2 und findet zm (x) zm (x) 1 1 cos z sin z C(x) = √ S(x) = √ dz √ dz √ z z 2π 0 2π 0 S(x) = 58 2 Weitere spezielle Funktionen mit zm (x) = πx2 /2 . Für kleine Werte von x kann man die trigonometrischen Funktionen entwickeln und erhält Potenzreihen in x2 , so z.B. π2 4 x + ... , C(x) = x 1 − 40 die jedoch nicht der Form (2.76) entsprechen. Zur Diskussion des asymptotischen Grenzfalls beginnt man mit dem Integral ∞ I= dx x−1/2 eix . (2.77) a Mit der Substitution x = a + iy erhält man ∞ I = i eia dy e−y [a + i y]−1/2 . 0 Für (sehr) große Werte von a kann man die Wurzelfunktion entwickeln und gliedweise integrieren 3 15i i (cos a + i sin a) i − + 3 + ... . (2.78) I= 1− 2a 4a2 8a a1/2 Trennt man das Integral (2.77) in Real- und Imaginärteil und vergleicht mit (2.78), so kann man eine asymptotischen Entwicklung für ∞ 1 1 −1/2 − ... dx x cos x = 1/2 cos a I1 = 2a a a 3 − sin a 1 − 2 − . . . 4a und I2 = a ∞ dx x−1/2 sin x = 1 a1/2 1 15 − 3 + ... sin a 2a 8a 3 + cos a 1 − 2 − . . . 4a gewinnen. Gesucht werden jedoch die entsprechenden Integrale mit den Grenzen 0 und a. Man erhält diese, indem man die uneigentlichen Integrale (Gradstein und Ryshik, Integraltafeln Band 1, Verlag H. Deutsch, Frankfurt, 1981, Nr. 3.761.4 und 3.761.9) ' ∞ ∞ π dz z −1/2 cos z = dz x−1/2 sin z = 2 0 0 benutzt. Zu berechnen ist somit # ∞ ∞ cos z cos z 1 , dz √ − dz √ C(x) = √ z z 2π 0 zm (x) 2.6 Die Fresnelintegrale 59 wofür man in den Variablen von (2.76) 2 πx 1 1 3 C(x) = + 1 − 2 4 + . . . sin 2 πx π x 2 − 2 πx 1 15 − + . . . cos πx2 π 3 x6 2 (2.79) findet. Entsprechend erhält man 2 πx 1 3 1 1 − 2 4 + . . . cos S(x) = − 2 πx π x 2 + 2 πx 1 15 − + . . . sin . πx2 π 3 x6 2 (2.80) Diesen Resultaten entnimmt man noch einmal den Grenzwert 1 lim C(x) = lim S(x) = . x→∞ x→∞ 2 Für eine allgemeinere Diskussion der Fresnelintegrale (2.73) kann man die Funktionen von Lommel benutzen (C.N. Watson, Theory of Bessel Functions S. 537 ff.). Diese Funktionen können durch die Integraldarstellung 1 wν Uν (w, z) = ν−1 dt Jν−1 (zt) cos{w(1 − t2 )/2}tν z 0 z ν−1 Vν (w, z) = − ν−2 w ∞ dt J1−ν (zt) cos{w(1 − t2 )/2}t2−ν 1 definiert werden. Durch Betrachtung des Grenzwertes z → 0 mit Jν−1 (zt) 1 tν−1 = ν−1 z→0 z ν−1 2 Γ (ν) lim z ν−1 J1−ν (zt) = lim z→0 2ν−1 1−ν t Γ (2 − ν) erhält man Funktionen von einer Veränderlichen 1 wν Uν (w, 0) = ν−1 dt t2ν−1 cos{w(1 − t2 )/2} 2 Γ (ν) 0 Vν (w, 0) = − 2ν−1 Γ (2 − ν)wν−2 ∞ dt t3−2ν cos{w(1 − t2 )/2} , 1 die, zur Darstellung der Fresnelintegrale, um zwei weitere Funktionen ergänzt werden müssen. Mit partieller Integration erhält man bei Benutzung von d sin{w(1 − t2 )/2} = −wt cos{w(1 − t2 )/2} dt eine entsprechende Funktionen mit erhöhtem Index ν + 1 60 2 Weitere spezielle Funktionen Uν+1 (w, 0) = = wν+1 ν 2 Γ (ν + 1) wν 2ν−1 Γ (ν) 1 dt [t2ν ][t cos{w(1 − t2 )/2}] 0 1 dt t2ν−1 sin{w(1 − t2 )/2} , 0 sowie eine Funktion mit erniedrigtem Index ν − 1 ∞ 2ν−2 Vν−1 (w, 0) = − dt [t4−2ν ][t cos{w(1 − t2 )/2}] Γ (3 − ν)wν−3 1 =− 2ν−1 Γ (2 − ν)wν−2 ∞ dt t3−2ν sin{w(1 − t2 )/2} . 1 Mit Hilfe des Additionstheorems für trigonometrische Funktionen kann man aus den Funktionen Uν und Uν+1 die Kombinationen 2 1 wν t w w 2ν−1 dt t cos w = Uν (w, 0) cos + Uν+1 (w, 0) sin 2ν−1 Γ (ν) 0 2 2 2 wν 2ν−1 Γ (ν) 1 dt t 2ν−1 0 2 t w w sin w = Uν (w, 0) sin − Uν+1 (w, 0) cos 2 2 2 bilden, die eine Darstellung der Fresnelintegrale ermöglichen. Es ist 2 x 1 π πx 2 C(x) = z2 = x t dz cos dt cos 2 2 0 0 1 = √ 2 πx2 πx2 + U3/2 (πx2 , 0) sin U1/2 (πx , 0) cos 2 2 , 2 sowie (2.81) S(x) = x dz cos 0 1 = √ 2 π 2 z 2 1 =x dt cos 0 πx2 2 t 2 πx2 πx2 − U3/2 (πx2 , 0) cos U1/2 (πx , 0) sin 2 2 2 . Dieses Resultat, das nicht die Form (2.76) hat, ist geeignet, um eine Entwicklung der Fresnelintegrale nach aufsteigenden Potenzen von x zu gewinnen. Die Form (2.76) ergibt sich über die Kombination von ' 2w ∞ dt cos{w(1 − t2 )/2} U1/2 (w, 0) − V3/2 (w, 0) = π 0 und ' U3/2 (w, 0) − V1/2 (w, 0) = 2w π 0 ∞ dt sin{w(1 − t2 )/2} 2.6 Die Fresnelintegrale 61 zu K1 = (U1/2 (w, 0) − V3/2 (w, 0)) cos(w/2) + (U3/2 (w, 0) − V1/2 (w, 0)) ' ∗ sin(w/2) = 2w π ∞ 0 2 t dt cos w 2 und K2 = (U1/2 (w, 0) − V3/2 (w, 0)) sin(w/2) + (U3/2 (w, 0) − V1/2 (w, 0)) ' ∗ cos(w/2) = 2w π 0 ∞ 2 t dt sin w . 2 Die uneigentlichen Integrale auf der rechten Seite dieser Gleichungen haben (Gradstein und Ryshik, Integraltafeln Band 1, Verlag H. Deutsch, Frankfurt, 1981, Nr. 3.691) den Wert 2 ∞ 2 √ ∞ π t t dt cos w dt sin w = = √ . 2 2 2 w 0 0 Die Kombinationen K1 und K2 kann man demnach in der Form 1 w w U1/2 (w, 0) cos + U3/2 (w, 0) sin = √ 2 2 2 + V1/2 (w, 0) sin U1/2 (w, 0) sin w w + V3/2 (w, 0) cos 2 2 1 w w − U3/2 (w, 0) cos = √ 2 2 2 w w + V3/2 (w, 0) sin 2 2 sortieren. Setzt man diese Relationen (mit w = πx2 ) in (2.81) ein, so erhält man 1 πx2 πx2 1 + V3/2 (πx2 , 0) cos C(x) = + √ V1/2 (πx2 , 0) sin 2 2 2 2 − V1/2 (w, 0) cos und (2.82) 1 1 πx2 πx2 −√ − V3/2 (πx2 , 0) sin . V1/2 (πx2 , 0) cos 2 2 2 2 Man kann somit die Koeffizientenfunktionen f (x) und g(x) mit S(x) = V3/2 (πx2 , 0) V1/2 (πx2 , 0) √ √ und g(x) = − 2 2 identifizieren. Die Lommelfunktionen Vν eignen sich für asymptotische Entwicklungen und ergeben in führender Ordnung f (x) = 62 2 Weitere spezielle Funktionen V1/2 (πx2 , 0) ∼ √ 2 + ... πx √ V3/2 (πx2 , 0) ∼ − 2 + ... , π 2 x3 in Übereinstimmung mit dem vorherigen Resultat. 2.7 Die Betafunktion Die Betafunktion, eine Funktion von zwei Variablen, weist eine gewisse Verwandtschaft mit der Gammafunktion (Band 2, Math.Kap. 4.1) auf. Sie wird durch das Integral 1 dt tx−1 (1 − t)y−1 (2.83) B(x, y) = 0 definiert. Man muss voraussetzen, dass x > 0 und y > 0 ist, da das Integral sonst nicht konvergiert. Um eine explizite Darstellung dieser Funktion zu gewinnen, wertet man das Integral mit der Substitution t = cos2 ϕ aus. Die Grenzen gehen in π t=1→ϕ=0 t=0→ϕ= 2 über, so dass man π/2 B(x, y) = 2 dϕ (cos ϕ)2x−1 (sin ϕ)2y−1 0 erhält. Zur Auswertung diese Integrals muss man etwas weiterausholen. Man betrachtet zum einen das Doppelintegral I= dt du exp[−t2 − u2 ]t2x−1 u2y−1 . R Der Integrationsbereich ist der erste Quadrant der t - u -Ebene. Das Integral I faktorisiert in ∞ ∞ I= dt exp[−t2 ]t2x−1 du exp[−u2 ]u2y−1 t=0 u=0 In den Einzelintegralen erkennt man eine Gammafunktion, denn es ist (substituiere t = u2 ) ∞ ∞ 2 Γ (x) = dt e−t tx−1 = 2 du e−u t2x−1 . 0 0 Für das Integral I ergibt sich somit 1 Γ (x)Γ (y) . 4 Das Integral I kann alternativ mit I= t = r cos ϕ u = r sin ϕ 2.7 Die Betafunktion 63 in ebene Polarkoordinaten umgeschrieben werden. Es gilt dann π/2 ∞ 2 dr e−r r2(x+y)−1 dϕ (cos ϕ)2x−1 (sin ϕ)2y−1 . I= 0 0 Hier tritt noch einmal die Gammafunktion auf, so dass man nach Sortierung π/2 Γ (x)Γ (y) (2.84) dϕ (cos ϕ)2x−1 (sin ϕ)2y−1 = B(x, y) = 2 Γ (x + y) 0 erhält. Man erkennt die Symmetrie B(x, y) = B(y, x), die man auch mittels Substitution der Definition (2.83) entnehmen kann. Anhand der Eigenschaft Γ (x + 1) = xΓ (x) findet man für die Betafunktion eine ähnliche Relation x y B(x + 1, y) = B(x, y) B(x, y + 1) = B(x, y) . (x + y) (x + y) (2.85) Infolge der Verwandtschaft zwischen der Gammafunktion und der Betafunktion kann man die Funktionen wechselweise nutzen, um Eigenschaften der anderen zu beweisen. Ein Beispiel ist die Duplikationsformel 22x−1 Γ (2x) = √ Γ (x)Γ (x + 1/2) . π (2.86) Zum Beweis beginnt man mit 1 Γ (x)Γ (x) = B(x, x) = dt tx−1 (1 − t)x−1 Γ (2x) 0 und formt das Integral mit der Substitution t = (s + 1)/2 gefolgt von u = s2 um. Das Resultat ist Γ (1/2)Γ (x) B(x, x) = 2−2x+1 B(1/2, x) = 2−2x+1 , Γ (x + 1/2) so dass ein Vergleich der beiden Aussagen die Duplikationsformel ergibt. 3 Das algebraische Eigenwertproblem Die Matrixdarstellung von Hamiltonoperatoren für Probleme der Quantenmechanik bezüglich einer mehr oder weniger geschickt gewählten Basis ist in fast allen Fällen unendlich dimensional. Es ist jedoch oft möglich, sich in guter oder akzeptabler Näherung auf einen endlichen, n -dimensionalen Teilraum des Darstellungsraums zu beschränken. Die technische Aufgabe, die in diesem Fall ansteht, ist die Lösung eines algebraischen Eigenwertproblems, das in der folgenden Aufgabe besteht: Gegeben ist eine n × n Matrix ⎛ a11 a12 a13 . . . ⎜ ⎜a a a ... ⎜ 21 22 23 ⎜ A = (aik ) = ⎜ ⎜ .. .. .. ⎜ . . . ⎝ a1n ⎞ ⎟ a2n ⎟ ⎟ ⎟ ⎟ . .. ⎟ . ⎟ ⎠ an1 an2 an3 . . . ann Gesucht wird die Lösung der Matrixgleichung Ax = λx , (3.1) d.h. die Eigenwerte λ und die Eigenvektoren x ⎛ ⎞ x1 ⎜ ⎟ ⎜x ⎟ ⎜ 2⎟ ⎜ ⎟ x=⎜ ⎟ . ⎜ .. ⎟ ⎜ . ⎟ ⎝ ⎠ xn Der expliziten Form der Matrixgleichung (3.1) n (aik − λδik )xk = 0 i = 1, . . . , n (3.2) k=1 kann man eine Gleichung für die Bestimmung der Eigenwerte entnehmen. Das homogene, lineare Gleichungssystem (3.2) hat nur eine nichttriviale Lösung, falls 66 3 Das algebraische Eigenwertproblem a11 − λ a12 a a22 − λ 21 det(A − λE) = .. .. . . a an2 n1 a13 ... a23 ... .. . .. . an3 ... a2n =0 .. . ann − λ a1n gilt. Die Determinante definiert das charakteristische Polynom der Matrix A PA (λ) ≡ det(A − λE) = λn + bn−1 λn−1 + . . . + b1 λ + b0 = 0 , dessen n Nullstellen den n Eigenwerten entsprechen. Sind die Eigenwerte berechnet (siehe Math.Kap. 3.1 für die Beschreibung einer der numerischen Methoden), so erhält man den zu einem Eigenwert λ(i) gehörigen Eigenvektor x(i) durch Lösung des homogenen Gleichungssystems (A − λ(i) E)x(i) = 0 , bzw. in expliziter Form (i) (i) (i) (i) (i) (a11 − λ(i) )x1 + a12 x2 + a13 x3 + . . . + a1n x(i) n = 0 (i) a21 x1 + (a22 − λ(i) )x2 + a23 x3 + . . . + a2n x(i) n = 0 .. . .. . (i) .. . (i) .. . =0 (i) an1 x1 + an2 x2 + an3 x3 + . . . + (ann − λ(i) )x(i) n = 0. Da die n homogenen Gleichungen nur die Bestimmung von n−1 Koeffizienten als Funktion eines ausgewählten Koeffizienten erlauben, ist eine zusätzliche Bedingung erforderlich. Die üblicherweise benutzte Bedingung ist die Normierung der Eigenvektoren, z.B. mit n (i) |xk |2 = 1 i = 1, 2, . . . , n . k=1 Von besonderem Interesse in der Physik sind Eigenwertprobleme mit symmetrischen Matrizen (T steht für Transposition) AT = A −→ aik = aki und mit selbstadjungierten, d.h. hermiteschen Matrizen A† = A −→ aik = a∗ki mit dem Zusatz, dass die Komponenten der Eigenvektoren in diesem Fall komplexe Zahlen sein können. Das grundlegende Theorem zu dem algebraischen Eigenwertproblem lautet: 3 Das algebraische Eigenwertproblem 67 Die Eigenwerte λ1 . . . , λn von symmetrischen bzw. von hermiteschen n×n Matrizen A sind reell. Die zugehörigen Eigenvektoren bilden ein Orthonormalsystem n (i) ∗ (j) x(i) · x(j) = xk xk = δij . k=1 Zur numerischen Bestimmung der Eigenwerte und Eigenvektoren wird die Tatsache ausgenutzt, dass eine Ähnlichkeitstransformation der Matrix A mit einer Matrix Z A = Z−1 A Z die Eigenwerte der Matrix A nicht verändern. Es gilt nämlich det(Z−1 A Z − λE) = det(Z−1 (A − λE) Z) = det(Z−1 )det(A − λE)det(Z) = det(A − λE) . Wählt man nun die Matrix Z so, dass die Matrix A diagonal ist, so muss sie die Form ⎛ ⎞ λ1 0 0 . . . 0 ⎜ ⎟ ⎜ 0 λ 0 ... 0 ⎟ 2 ⎜ ⎟ ⎜ ⎟ A = ⎜ ⎟ .. ⎟ ⎜ .. .. .. ⎜ . . . . ⎟ ⎝ ⎠ 0 0 0 . . . λn haben. Die Eigenwerte können abgelesen werden. Es ist nicht möglich, eine Matrix Z mit der geforderten Eigenschaft zu erraten. Aus diesem Grund versucht man, die Matrix Z durch eine Sequenz von Ähnlichkeitstransformationen aufzubauen A −→ Z1 −1 A Z1 −→ Z2 −1 Z1 −1 A Z1 Z2 −→ etc. Falls die so konstruierte Matrix Z = Z1 Z2 Z3 . . . die Matrix A exakt diagonalisiert, so stellen die Spalten von Z die Eigenvektoren dar ⎛ (1) (2) (3) ⎞ (n) x1 x1 x1 . . . x1 ⎜ ⎟ ⎜ (1) (2) (3) ⎟ ⎜ x2 x2 x2 . . . x(n) ⎟ 2 ⎟ ⎜ ⎜ ⎟ , (3.3) Z=⎜ .. .. .. ⎟ ⎜ .. ⎟ . . . ⎟ ⎜ . ⎝ ⎠ (1) (2) (3) (n) xn xn xn . . . xn 68 3 Das algebraische Eigenwertproblem denn es gilt auf der einen Seite anhand der Eigenwertgleichung und der Orthonormierung der Eigenvektoren (x(i) )† Ax(k) = λi δik −→ n (i) ∗ xl alm x(k) m = λi δik , l,m=0 auf der anderen für das Matrixprodukt mit (3.3) ⎞ ⎛ n ∗ (i) ⎠ = (λi δik ) . Z† A Z = ⎝ xl alm x(k) m l,m=0 Drei Methoden, die zur numerischen Lösung des algebraischen Eigenwertproblems breitere Anwendung finden, sind die iterativen Jacobi- und Householder-Transformationsmethoden für symmetrische bzw. hermitesche Matrizen. Infolge der Tatsache, dass sie effektiv auf der Ebene der Maschinensprache implementiert werden kann, wurde seit ca. 1980 auch die konstruktive Lanczosmethode eingesetzt. • Bei der Jacobimethode, die in dem Abschnitt 3.1 näher beschrieben wird, wird bei jeder Teiltransformation Zk an einem außerdiagonalen Matrixelement alm angegriffen. Dieses Matrixelement wird durch die Anwendung einer Drehmatrix, die durch die Matrixelemente alm , all , amm bestimmt ist, auf den Wert Null gesetzt. In der einfachsten Variante wird der Prozess so lange wiederholt bis alle außerdiagonalen Matrixelemente unterhalb einer gewählten numerischen Schranke liegen. Mit dieser Methode werden sowohl die Eigenwerte (die verbleibenden diagonalen Matrixelemente) als auch die Eigenvektoren (das Produkt aller Drehmatrizen) gewonnen. Die Konvergenz der Methode kann bewiesen werden. • Bei der Householder Methode, die hier nicht weiter ausgeführt wird, werden in jedem Schritt orthogonale Transformationsmatrizen aus Spaltenvektoren konstruiert, um iterativ eine Tridiagonalmatrix zu erzeugen. Nach dem ersten Schritt hat die Matrix die Gestalt ⎞ ⎛ b11 b12 0 . . . 0 ⎟ ⎜ ⎜b b b ... b ⎟ 2n ⎟ ⎜ 12 22 23 ⎟ ⎜ ⎟ ⎜ ⎜ 0 b32 b33 . . . b3n ⎟ ⎟ ⎜ ⎟ A = ⎜ ⎜ 0 b42 0 . . . b4n ⎟ . ⎟ ⎜ ⎟ ⎜ ⎜ . . . .. ⎟ ⎟ ⎜ . . . ⎜ . . . . ⎟ ⎠ ⎝ 0 bn2 0 . . . bnn Die gleiche Technik wird jetzt auf die (n − 1) × (n − 1) Untermatrix angewandt und mit jeweils kleineren Matrizen (n − 2) × (n − 2) , etc. wiederholt, bis man nach dem letzten Schritt die symmetrische tridiagonale Matrix 3.1 Die Jacobimethode ⎛ a11 ⎜ ⎜z ⎜ 12 ⎜ ⎜ ⎜ 0 ⎜ T=⎜ ⎜ 0 ⎜ ⎜ ⎜ . ⎜ . ⎜ . ⎝ 0 z12 0 ... z22 z23 ... z23 z33 ... 0 z34 ... .. . .. . 0 69 ⎞ ⎟ 0 ⎟ ⎟ ⎟ ⎟ 0 ⎟ ⎟ ⎟ 0 ⎟ ⎟ ⎟ .. ⎟ ⎟ . ⎟ ⎠ 0 . . . zn,n−1 znn erhält. Für die Diagonalisierung von tridiagonalen Matrizen stehen besondere Methoden, z.B. die QR- und QL-Algorithmen zur Verfügung. • Mit der Lanczosmethode wird wie bei der Householdermethode eine tridiagonale Matrixdarstellung eines hermiteschen Operators  erzeugt. Man wählt einen normierten Startzustand | 1 und wirkt mit dem Operator auf ihn ein. Das Resultat ist Â| 1 = a11 | 1 + a12 | 2 , wobei der normierte Zustand | 2 orthogonal zu dem ersten Zustand ist. Im nächsten Schritt bildet man Â| 2 = a21 | 1 + a22 | 2 + +a23 | 3 . Der neu erzeugte, normierte Zustand | 3 ist orthogonal zu den zwei vorherigen. Die Zielsetzung der Methode zeigt sich im nächsten Schritt Â| 3 = a32 | 2 + a33 | 3 + +a34 | 4 . Falls der Operator hermitesch ist, gibt es kein Matrixelement a31 , denn es ist gemäß Konstruktion a31 = a∗13 = 0. In jedem weiteren Schritt werden ebenfalls nur drei Zustände erzeugt. Man erhält eine tridiagonale Matrix, die wie im Fall der Householdermatrix in einfacher Weise diagonalisiert werden kann. 3.1 Die Jacobimethode Bei dieser Methode ist jede Teiltransformation eine einfache Drehung, mit der ein außerdiagonales Matrixelement auf den Wert Null gebracht wird. Nachfolgende Transformationen können dies wieder zunichte machen, doch werden die außerdiagonalen Matrixelemente kleiner und kleiner, so dass numerische Konvergenz erreicht werden kann. Die Teiltransformation, die das Matrixelement alm auf den Wert Null setzen soll, hat die Form 70 3 Das algebraische Eigenwertproblem ⎛ Zlm 1 ⎜ ⎜ ⎜ ⎜0 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ = ⎜ ... ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 0 ... 0 .. 0 . cos ϕ 0 0 .. ... . .. . .. . 1 .. 0 sin ϕ 0 0 − sin ϕ 0 ... . 0 0 cos ϕ .. ... . 0 ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ .. ⎟ . .⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ 0⎟ ⎠ 1 In der (n × n) Einheitsmatrix werden die Elemente zll , zmm , zlm und zml durch die Elemente einer einfachen Drehmatrix mit dem Drehwinkel ϕ ersetzt. Man berechnet dann im k -ten Schritt Ak+1 = Z−1 lm Ak Zlm . In der Matrix Ak+1 werden die l -ten und m -ten Zeilen und Spalten modifziert, andeutungsweise ⎛ ⎞ . . . a1l . . . a1m . . . ⎜ ⎟ ⎜ . .. .. .. ⎟ ⎜ .. . . . ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ al1 . . . all . . . alm . . . aln ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ . ⎟ . . . ⎜ .. .. .. .. ⎟ Ak+1 = ⎜ ⎟ . ⎜ ⎟ ⎜ ⎟ ⎜ am1 . . . aml . . . amm . . . amn ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ . ⎟ . . . ⎜ .. .. .. .. ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ . . . anl . . . anm . . . Die einzelnen Matrixelemente (bei einer symmetrischen Ausgangsmatrix) sind arl = cos ϕ arl − sin ϕ arm r = l, m arm = cos ϕ arl + sin ϕ arm r = l, m 3.1 Die Jacobimethode all = cos2 ϕ all + sin2 ϕ amm − 2 cos ϕ sin ϕ alm 71 (3.4) amm = sin2 ϕ all + cos2 ϕ amm + 2 cos ϕ sin ϕ alm alm = (cos2 ϕ − sin2 ϕ) amm + cos ϕ sin ϕ(all − amm ) . Die Bedingung alm = 0 liefert den Drehwinkel (amm − all ) (cos2 ϕ − sin2 ϕ) = . (3.5) 2 cos ϕ sin ϕ 2alm Da die Kotangensfunktion mehrdeutig ist, benötigt man ein Kriterium zur Auswahl des Winkels. Es zeigt sich, dass der stabilste Weg zur Reduktion der außerdiagonalen Matrixelemente die Wahl ϕ ≤ π/4 ist. Die zur Berechnung der weiteren, modifizierten Matrixelemente benötigten Winkelfunktionen gewinnt man z.B. über 1 , cot ϕ = (1 − cot 2ϕ) sowie 1 cot ϕ sin ϕ = cos ϕ = . 2 1 + cot ϕ 1 + cot2 ϕ Hat cot 2ϕ einen zu großen Zahlenwert, so benutzt man 1 tan 2ϕ = cot 2ϕ und die entsprechenden Relationen, um den Sinus und Kosinus des Winkels ϕ zu extrahieren. Bezüglich der Strategie, der man bei der in jedem Schritt anstehenden Auswahl des zu eliminierenden Matrixelementes folgen sollte, ist zu bemerken, dass die einfachste Methode am effizientesten ist. Bei dieser zyklischen Jacobimethode wird in jedem Durchgang ein außerdiagonales Matrixelement nach dem anderen bearbeitet. Man benutzt also die Sequenz von n(n − 1)/2 Drehungen cot 2ϕ = Z12 , . . . , Z1n , Z23 , . . . , Z2n , . . . Zn−1,n in jedem Durchgang. Die Konvergenz des Verfahrens kann durch das folgende Argument belegt werden: Ist das Betragsquadrat der außerdiagonalen Matrixelemente nach einer Drehung gleich |ars |2 , S= r=s so ist gemäß (3.4) die Summe nach der folgenden Drehung Zlm gleich S = S − 2|alm |2 . Die Folge von Summen nimmt monoton (idealerweise bis zu dem Grenzwert Null) ab. Literaturliste • M. Abramovitz and I.A. Stegun, Handbook of Mathematical Functions, Dover Publications (New York, 1965) • A. Cauchy, Comptes Rendus XV (1842) S. 542 und 573 • E.A. Coddington and N. Levinson, Theory of Ordinary Differential Equations, McGraw-Hill (New York, 1955) • I. Gradstein und I. Ryshik, Integraltafeln Bd. 1 und 2, Verlag Harri Deutsch (Frankfurt, 1981) • W. Magnus und F. Oberhettinger, Formeln und Sätze für die speziellen Funktionen der Mathematischen Physik, Springer Verlag (Berlin, 1948) • P.M. Morse and H. Feshbach, Methods of Theoretical Physics, McGraw-Hill (New York, 1953) • L.J. Slater, Confluent Hypergeometric Functions, Cambridge University Press (Cambridge, 1960) • W. Walter, Gewöhnliche Differentialgleichungen, Springer Verlag (Heidelberg, 2000) • C.N. Watson, A treatise on the Theory of Bessel Functions, Cambridge University Press (Cambridge, 1966) Index adjungierter Operator, 5 Barnsches Integral, 24 Bessel-Riccati Funktion – Differentialgleichung, 46 – Integraldarstellung, 54 – Rekursionsformel, 47 Besselfunktionen – sphärische, siehe sphärische Besselfunktionen Betafunktion – Duplikationsformel, 63 – Integraldarstellung, 62 charakteristisches Polynom – n × n Matrix, 66 Coulombproblem, 14 Differentialgleichung – Bessel-Riccati Funktion, 46 – Hermitesche Polynome, 27 – hypergeometrische Funktion, 17 – konfluente hypergeometrische Funktion, 17 – Kummersche, 17, 18, 21 – Laguerresche Polynome, 35 – linear, homogen, 2 – linear, inhomogen, 1 – Riemannsche, 18 Eigenfunktion, 7 – Orthogonalität, 8 – Vollständigkeit, 9, 15 Eigenvektoren, 65 Eigenwerte, 65 Eigenwertspektrum, 7 Fresnelintegrale, 56 – asymptotische Entwicklung, 58 – Darstellung, 57, 59 Funktion – Bessel-Riccati, 48 – Beta-, 62 – Greensche, 2 – Hankel-Riccati, 49 – hypergeometrische, 17 – konfluente hypergeometrische, 17 – Kummersche, 19, 23, 24 – Neumann-Riccati, 49 – sphärische Bessel-, 50 – Whittacker, 26 Greensche Funktion, 2 Hankel-Riccati Funktion, 49 Hermitesche Polynome – Differentialgleichung, 27 – erzeugende Funktion, 29 – explizit, 28 – Integrale mit, 33 – modifiziert, 28 – Orthogonalitätsrelation, 31 – Rekursionsformel, 32 – Rodriguesformel, 30 Householder Methode, 68 hypergeometrische Reihe, 18 Jacobimethode, 68 – Details, 69 Kummersche Differentialgleichung, 17, 18 – Lösungsmannigfaltigkeit, 21 Kummersche Funktion, 19 – asymptotische Entwicklung, 24 – Integraldarstellung, 23 – Reihenentwicklung, 18 76 Index Kummersches Theorem, 22 Laguerresche Polynome – Differentialgleichung, 35 – erzeugende Funktion, 36 – explizit, 35 – Orthogonalitätsrelation, 38 – Rekursionsformeln, 39 – Rodriguesformel, 37 Laguerresche Polynome, zugeordnete, 39 – Additionstheorem, 46 – erzeugende Funktion, 42 – explizit, 40 – Integrale mit, 44 – Rekursionsformeln, 43 – Rodriguesformel, 43 Lanczosmethode, 69 Lemma von Picone, 3 Lommelfunktion, 59 n × n Matrix – charakteristisches Polynom, 66 – Eigenvektoren, 65 – Eigenwerte, 65 – Householder Methode, 68 – Jacobimethode, 68 – Lanczosmethode, 69 Neumann-Riccati Funktion, 49 Operator – adjungiert, 5 – selbstadjungiert, 5 Pochhammersymbol, 18 Randbedingung, 2 – allgemein – – linear, homogen, 11 – periodisch, 13 Reihe – hypergeometrische, 18 – konfluente hypergeometrische, 19 sphärische Besselfunktionen, 50 – Rayleighs Formeln, 51 – Rekursionsrelationen, 51 – Wronskideterminante, 52 Sturm und Liouville – Theorem, 5 Theorem – von Sturm und Liouville, 5 – Kummersches, 22 Whittacker Funktion, 26 Wronskideterminante, 1 – sphärische Besselfunktionen, 52
© Copyright 2025 Paperzz