4.4. Phasenraum und Parameter
Wie schon weiter vorn ausgeführt wurde, bestimmen verschiedene Dateiformate und Parameter das Vorhersagemodell, die im weiteren vorgestellt werden. Folgende Größen müssen definiert werden:
- Phasenraum mit den Zuständen x(t);
- Metrik d(x(t),x(
));
- Prognosefunktion ;
- Vorhersagefehler
V der Prognose;
- Adaptionsfehler
VA ;
- Ensemblegröße NE ;
- Adaptionsgröße NA bzw. die Differenz NA-NE ;
- Unabhängigkeitszeitfenster
T.
Im Zusammenhang mit den Vorhersagefehlern V und VA muß der Vorhersagezeitraum festglegt werden. Die Lernregel des Adaptionsprogrammes (23) optimiert die Koeffizienten Gi nur für konstante Rahmenbedingungen, nicht aber die Rahmenbedingungen selber. Da die Adaptionen sehr zeitaufwendig sind (vergleiche Kapitel 4.3), ist eine Reduzierung der zu untersuchenden Freiheitsgrade notwendig. Zu einem wesentlichen Teil geschieht das bereits durch die Festlegung des Vorhersageziels.
Vorhersageziel
Es wird eine Positionsprognose aus einem Ensemble von NE Mitgliedern für den Vorhersagezeitraum bis maximal 72 Stunden erstellt. Die Ensemblemitglieder werden mittels der Metrik d(x(t),x( )) gemäß (13) und (15) aus einer Bibliothek von Phasenraumzuständen bestimmt und durch eine ungewichtete Mittelwertbildung kombiniert, bei der die Analoga auf die Position der Referenz verschoben werden. Das wird durch die Prognosefunktion
| |
 |
(27) |
erreicht, wobei i die Werte 1 und 2 für die beiden Positionskomponenten des Phasenraumes (siehe unten) annimmt,  den zeitlichen Abstand der Zustände von 6 Stunden darstellt und n den Vorhersagezeitpunkt definiert. Eine Prognose der übrigen Komponenten ist ebenso möglich, allerdings muß beachtet werden, welche Komponenten durch die Adaption optimiert vorhergesagt werden können. Der Prognosefehler V wird als Großkreisentfernung (1) zwischen Beobachtung und Prognose definiert. Im vorherigen Kapitel wurde gezeigt, daß eine Erhöhung von NA nur zu einer leichten Veränderung des Prognosefehlers führen wird, daher wird, wie dort bereits erwähnt, für jede Ensemblegröße NE die Adaptionsgröße NA auf den Wert NA=NE + 1 gesetzt, um die Vergleichbarkeit der Versuche zu gewährleisten.
Phasenraum
Es werden zwei verschiedene Möglichkeiten aufgezeigt, den Phasenraum M zu konstruieren, wobei mehrere Überlegungen eingehen. Die Vektoren x(t) müssen den Zustand des Systems eindeutig beschreiben, insbesondere muß die Dimension des Phasenraumes hinreichend hoch sein, um das System einzubetten. Bei einem dynamischen System mit der Attraktordimension dim(A) ist die hinreichende Phasenraumdimension dim(M) gegeben durch den Satz von Mañe (Mañe, 1981):
| |
|
(28) |
Dimensionsbestimmungen der Dynamik von tropischen Zyklonenzugbahnen ergeben Werte von 4.86 im Nord-West Pazifik (Peng und Yan, 1994), etwa 6 für den Nord-Indischen Ozean (Pal, 1991) und zwischen 6 und 8 für das australische Bassin (Fraedrich und Leslie, 1989). Damit ergeben sich minimale Phasenraumdimensionen zwischen 10 und 17. Für den Atlantik liegt eine solche Bestimmung nicht vor, insofern wird hier ebenfalls von minimal 17 Dimensionen ausgegangen. Da Pike und Neumann (1987) das australische Bassin als das am schwersten vorherzusagende identifiziert haben, kann man mit der gebotenen Vorsicht davon ausgehen, daß die Dynamik der australischen Zyklonen auch die größte Komplexität, also Attraktordimension hat. Daß dieser Schluß nicht unbedingt korrekt zu sein braucht, erkennt man an dem Wert für den Nord-Indischen Ozean. Obwohl in diesem nach Pike und Neumann (1987) die Zyklonenzugbahnen besonders leicht vorherzusagen sind, liegt die von Pal bestimmte Dimension über derjenigen im Nord-West Pazifik. Allerdings weist Rückert (1995) darauf hin, daß man bei endlichen und fehlerbehafteten Zeitreihen grundsätzlich mit ungenauen Dimensionsschätzungen rechen muß. Die geschätzte Phasenraumdimension für den Atlantik stimmt gut mit der Anzahl der Vorhersagevariablen in CLIPER überein, dort wird ein Zustand in Breite und Länge durch insgesamt 18 verschiedene Variablen (vergleiche Tabelle 9 und Tabelle 10) beschrieben.
Berücksichtigt man, daß der Druckwert in dem ursprünglichen Datensatz nur sehr lückenhaft vorliegt, verbleiben pro Zustand 4 Angaben zur Beschreibung: Zeit, Ort (Länge und Breite) und Intensität in Form der maximal gemessenen Windgeschwindigkeit. Um den Phasenraum hinreichend zu dimensionieren, werden analog zu Rückert (1995) sogenannte Delayvektoren x in einer etwas veränderten Form eingeführt. In der ursprünglichen Form enthält der Delayvektor als Komponenten l aufeinander folgende Meßwerte einer univariaten Observablen der Systemzustände. Es ist xk= (z(t=k s)), wobei der gemessene Wert, z der Zustand zum Zeitpunkt t und ts die Samplingzeit, also das Meßintervall ist. Der Delayvektor x hat dann die Form
| |
 |
(29) |
Auf diese Art erhält man für l >= ds eine eineindeutige (also injektive) Zuordnung zwischen System A mit seinen Zuständen z und dem sogenannten rekonstruierten Phasenraum M mit den Delayvektoren x. Für diesen rekonstruierten Phasenraum M läßt sich nun eine rekonstruierte Dynamik fT finden, die jeden beliebigen Delayvektor xk auf den Entwicklungszustand xk+T abbildet. Aufgrund der Injektivität zwischen A und M läßt sich so die ursprügliche Dynamik FT des Systems rekonstruieren, so daß eine Vorhersage im rekonstruierten Phasenraum einer Prognose des eigentlichen Systems entspricht. Für eine ausführliche Betrachtung des Prinzips der Delayvektoren und seiner Probleme wird auf Rückert (1995) verwiesen.
Die Delayvektoren müssen nicht univariat, sondern können auch multivariat sein. Dies wird zum Beispiel bei Fraedrich und Rückert (1998) bei der Vorhersage einer Komponente des Lorenz-Attraktors (und anderer theoretischer dynamischer Modelle) ausgenutzt. Auf diese Weise wird eine mehrdimensionale Trajektorie (bzw. ein Teil einer Trajektorie) auf den Phasenraum projiziert. In der vorliegenden Arbeit sind die xk selbst 4-dimensional und enthalten Länge und Breite des Zustandes sowie zonale und meridionale Verschiebung in den letzten 6 Stunden. Der Delayvektor xk enthält die xk bis zum Zeitpunkt k-3, bei einer Samplingzeit von 6 Stunden also die Positionen vor 18 Stunden und die Verschiebungen zwischen 24 Stunden und 18 Stunden vor der Referenzzeit. Darüber hinaus wird der Vektor xk durch weitere Komponenten ergänzt, so daß man bei strenger Betrachtung nicht von reinen Delayvektoren sprechen kann. Diese zusätzlichen Informationen sind die Position vor 24 Stunden, der maximale Wind und die Nummer des Kalendertages im Jahr (beginnend mit 1 am 1. Januar), die beiden letzteren zum Referenzzeitpunkt. Insgesamt entsteht so ein 20-dimensionaler Phasenraum, der in dem zur Verfügung stehenden Zeitraum von 1886 bis 1996 insgesamt 24839 Zustände enthält. Die Variante des Modells, die diesen Phasenraum benutzt, wird zukünftig als Modell A bezeichnet. Die Komponenten des Phasenraumes mit Durchschnittswert und Standardabweichung über den gesamten Datensatz sind in Tabelle 7 dargestellt.
Die zweite betrachtete Möglichkeit, den Phasenraum zu konstruieren, ergibt sich aus der Überlegung, die die größte Varianz der Zyklonenbewegung erklärenden Variablen als Phasenraumkomponenten zu nutzen. Diese werden durch die CLIPER-Variablen beschrieben, wie sie in Tabelle 9 und Tabelle 10 genannt sind. Da das Programm auf die vorherzusagenden Größen angewiesen ist, wurde zusätzlich als erste und zweite Komponente die Position (Länge bzw. Breite) eingefügt. Es gehen wie in Modell A die Positionen bis 24 Stunden vor dem Referenzzeitpunkt ein, daher hat auch dieser Datensatz 24839 Zustände. Die Durchschnittswerte der Komponenten von Modell B sind in Tabelle 8 aufgeführt. Die Tatsache, daß U0 und V0 doppelt vorkommen, ist in der Programmentwicklung begründet und hat keinen Einfluß auf die Ergebnisse, allerdings auf Adaption und Größe der Gewichte. Da sich weiterhin die Komponenten 1 und 9 sowie 2 und 5 jeweils nur durch eine Konstante voneinander unterscheiden, verbleiben 18 unabhängige Komponenten, die letztlich den Phasenraum aufspannen. Bei der Adaption werden jedoch alle 22 Komponenten betrachtet, was wiederum in der Programmentwicklung begründet liegt.
Sonstige Parameter
Das Unabhängigkeitszeitfenster T kann in einem relativ weiten Rahmen liegen, ohne daß ein Einfluß auf die Vorhersagequalität sichtbar wird. Eine exakte Unabhängigkeit könnte erreicht werden, indem die Zugehörigkeit zu verschiedenen Stürmen für zu vergleichende Zustände gefordert wird. Das geschieht hier nicht, sondern es wird ein minimaler zeitlicher Abstand von 20 Zeitschritten á 6 Stunden, also von 5 Tagen gefordert. Bei diesem T kann von hinreichender Unabhängigkeit der Zustände ausgegangen werden.
Die Adaption erfolgt durch Optimierung der Zugbahn, das heißt, es soll der über den Vorhersagezeitraum summierte Vorhersagefehler minimiert werden. Das geschieht über den Adaptionsfehler
| |
 |
(30) |
wobei xc hier die physikalische Größe (geographische Länge und Breite), nicht aber die normalisierte Größe kennzeichnet. Es wird also der pythagoräische Abstand in den ersten beiden Komponenten zwischen Beobachtung nach 6n Stunden und zugehörigem Analogon x(tj), das entsprechend (27) in die Referenz verschoben wird, berechnet und über den Vorhersagezeitraum bis 72 Stunden aufsummiert. Die Kugelgestalt der Erde wird hierbei vernachlässigt, was einerseits im Gegensatz zu den Winkelfunktionen des Großkreises (1) die Rechnerkapazitäten weniger belastet, andererseits aber keinen großen Fehler verursacht, da es sich um eine Minimierung handelt. Allerdings wird hierbei mit zunehmender Breite die zonale Entfernung höher bewertet als die meridionale. Weiterhin wird eine Vorhersage einzeln zu den Vorhersagepunkten (in 12-stündigen Intervallen bis 72 Stunden) durchgeführt sowie eine Trennung in Breiten- bzw. Längenvorhersage untersucht. Dies geschieht über die Adaptionsfehler
| |
für n=1...6 |
(31) |
bei der Einzelvorhersage, wobei  =12 Stunden ist, bzw.
| |
für c=1,2 |
(32) |
bei der Breiten- und Längenvorhersage über den gesamten Vorhersagezeitraum mit einer Vorhersageperiode von  =6 Stunden. Die Einzelvorhersage von Länge und Breite zu bestimmten Zeitpunkten wird wegen der Vielzahl der hierfür nötigen Adaptionen nicht überprüft.
Als letzter Freiheitsgrad bleibt die Ensemblegröße NE zu untersuchen. Diese wird für beide Modelle (A und B) und die integrierte Adaption nach (30) variiert. Der Vergleich mit den getrennten Adaptionen nach Zeit (31) bzw. Komponente (32) erfolgt dann für die "optimale" Ensemblegröße, da eine Variation der Ensemblegröße bei diesen wegen der hohen Anzahl von nötigen Adaptionen zu zeitintensiv gewesen wäre.
|