|
|
© 2000 John Petroff; 2007 Übersetzung Hans H. Knauf; 2007 edited by Tanja Detwiler |
1) – Box-Jenkins-Zeitreihenanalyse
Es gibt drei Muster, die normalerweise untersucht
werden: Autoregression, gleitender Durchschnitt und Trend. Gelegentlich gibt
es auch unregelmäßige Beobachtungen oder Störungen, die entfernt oder
verbessert werden müssen. Dieser Prozess verlangt
drei Schritte in folgender Reihenfolge:
- Identifizierung, bei der verschiedene Muster (d. h. Autoregression,
gleitender Durchschnitt oder Trend, die weiter unten noch beschrieben werden)
ausprobiert werden,
- Schätzung, bei der geschätzte Koeffizientenwerte in eine Tabelle
eingetragen werden,
- diagnostische Überprüfung, bei der untersucht wird, ob die Analyse ausreichend ist,
und wenn dies nicht der Fall ist, wird der Vorgang wiederholt.
Wiederholungsfragen: Q-5F bis Q-5F.7.
Eine stufenweise Mehrfach-Regression wird an so vielen Kombinationen von verzögerten Reihen ausgeführt, wie notwendig, bis weitere verzögerte Reihen keine weitere Aussagekraft haben (d. h. sie verbessern die Regressionsergebnisse wie R2 nicht). Die überprüfte Gleichung heißt:
| Yt = a1Yt-1 + ... + apYt- p + et |
Gleichung E-5F.1 |
wobei e das Residuum oder die Störgröße ist, von dem/der angenommen wird, dass
sein/ihr
Durchschnittswert Null ist.
Die Periodenzahl p, die Y benötigt, um verzögert zu werden, ist dann
bestimmt, wenn die Stabilität der Koeffizienten erreicht worden ist. Das
bedeutet, werden Regressionen mit einem verzögerten Y über p hinaus
duchgeführt, dann bleiben die Schätzkoeffizienten unverändert; das beweist, dass über
p hinaus kein zusätzlich verzögertes Y eine zusätzliche Aussagekraft hat.
Wenn sich p als zwölf Monate herausstellt, dann stellt das Autoregressionsmodell ein Muster saisonaler Indexe auf, und das sind dann die Koeffizientenschätzungen. Wie bereits erwähnt, kann das saisonale Muster entfernt werden, um ausfindig zu machen, ob ein anderes Muster über einige Jahre hinaus besteht, oder ob sich das Muster sogar über einen sehr langen Zeitraum hinauszieht. Natürlich kann das autoregressive Modell auch zyklische Veränderungen aufdecken, die kürzer als 12 Monate sind. Es ist dem Analysten überlassen, auf diese kurzen Zyklen zu achten, sie aus den Daten zu entfernen oder sie ganz unbeachtet zu lassen.
Wiederholungsfragen: Q-5F1.1.
b)- Modell des gleitenden Durchschnitts
Das Modell des gleitenden Durchschnitts von Box-Jenkins geht davon aus, dass eine Zeitreihe durch eine Kombination von willkürlichen Ereignissen erklärt wird, die eine Periode q in die Vergangenheit zurückreichen.
| Yt = b1et-1 + ... + bpet- q + et |
Gleichung E-5F.2 |
wie vorher, so ist auch hier e eine willkürliche, seriell unabhängige Variable mit einem Mittelwert von Null.
Es gibt kein irdisches Ereignis, dass nicht von willkürlichen Geschehen betroffen ist. Zum Beispiel werden die Umsätze eines Produktes durch die Einführung vieler, verschiedener, neuer Produkte beeinflusst, oder der Aktienmarkt wird die ganze Zeit hindurch mit wahllosen, neuen Informationen bombardiert. Je zeitentfernter der Schock ist, desto geringer ist die Auswirkung auf die laufenden Beobachtungen. Wie vorher wird q gewählt, sodass die Koeffizienten stabil sind, und keine Aussagekraft wird über q hinaus gewonnen.
Wiederholungsfragen Q-5F2.1.
Ein Trend wird bestimmt, indem eine Regression durchgefeführt wird, bei der die Zeit t die exogene Variable ist
Yt = a + t + et
Der Box-Jenkins-Trend wird durch die Differenzierung der Zeitreihen bestimmt
dt = Yt - Yt-1
und Regressionen werden ausgeführt an
| dt = c1dt-1 + . . . + cpdt- p + et |
Gleichung E-5F.3 |
Ist die Regression nicht stabil, dann kann die Zeitreihe ein zweites Mal differenziert werden, d. h. Unterschiede der Unterschiede. Das ist jedoch normalerweise der einfachste Schritt.
d) - Korrelogramme
Die vollständige Box-Jenkins-Methode wird als komplex angesehen, weil man Schätzungen von den Koeffizienten a und b in den obigen Gleichungen E-5F.1 und E-5F.2 (sowie, falls nötig, von den Koeffizienten c in E-5.F3) braucht, und gleichzeitig entscheiden muss, wie viele Verzögerungen p und q man benutzen soll. Um diese Entscheidungen zu erleichtern, wird eine Liste von aufeinanderfolgenden Koeffizientenschätzungen erstellt. Diese Liste (oder Grafik) wird Korrelogramm genannt. Wenn die Werte des Koeffizienten über eine gewisse Zahl K hinaus sich nicht von Null unterscheiden (d.h. man findet Werte der t-Statistik, die zu niedrig sind, wie zuvor), dann ist das Modell ein gleitender Durchschnitt (Moving Average = MA) mit q=K.
Zusätzlich wird ein partielles Korrelogramm mit den geschätzten Koeffizienten von Regressionen der ursprünglichen Reihe an einer angepassten Reihe (d. h. die man aus den obigen vorherigen analytischen Arbeiten gewonnen hat) konstruiert. Unterscheiden sich die Werte dieser Koeffizienten über eine gewisse Zahl K hinaus nicht von Null, dann ist das Modell eine Autoregression (AR) mit p=K.
Ein Muster kann aus einer Kombination aus beiden bestehen, wenn die beiden Korrelogramme eine Konvergenz bei q und p anzeigen. Dann nennt man dies einen autoregressiven gleitenden Durchschnitt (ARMA = autoregressive moving average). Kann aber keine Konvergenz erreicht werden, d. h. die Koeffizienten werden nicht stabil, wenn weitere verzögerte Variablen hinzugefügt werden, dann muss ein Trend bestehen. In diesem Fall nennt sich das Muster autoregressiver integrierter gleitender Durchschnitt (ARIMA = autoregressiv integrated moving average). Das ist das umfassendste (und komplizierteste) Muster in der Zeitreihenanalyse.
Wiederholungsfragen: Q-5F4.1.
| Vorheriger Abschnitt: Zeitreihen |
|
Nächster Abschnitt: Dekomposition: |