© 2000 John Petroff; 2007 Übersetzung Hans H. Knauf; 2007 edited by Tanja Detwiler  

2) Dekomposition (fortgesetzt)

Um den Trend aus den Daten herauszugliedern, könnte man eine OLS-Regression mit einer linearen oder nicht linearen Annahme an den saisonal angepassten Daten durchführen. Die Regression wird an saisonal angepassten Daten durchgeführt, um saisonbedingte Verzerrungen zu vermeiden. Der b-Koeffizient gibt die Wachstumsrate an. Zur Vereinfachung der Berechnung werden die Zeitperioden von – tt/2 bis +tt/2 kodiert, wobei tt die Gesamtzahl der Zeitperioden darstellt. Das heißt also für die 144 monatlichen Beobachtungen von Januar 1985 bis Dezember 1996, dass der Januar 1985 -72 und der Dezember 1996 +72 wäre. Das vereinfacht die Formeln für die Koeffizientenschätzungen (wie bereits im vorigen Abschnitt vorgestellt), weil die Summe von t (d. h. ‘X’ in dem vorherigen Abschnitt) ist dann gleich null. Die Koeffizientenschätzung a* (d. h. der Achsenabschnitt) ist dann einfach

a* = sum(Yt) / n = E(Y)

Koeffizientenschätzung b* ist

b* = sum(ttYt) / sum(tt2)

wie man mittels der im Anhang genannten Ableitungen überprüfen kann. Die Kalkulation der Trendwerte Tt für jeden Monat (d. h. der angepasste Wert mit dem Trend) kann genauso einfach direkt in einem Spreadsheet kalkuliert werden, wenn man die folgende Formel anwendet:

Tt = a + b Yt = E(Y) + Yt(sum(ttYt)/ sum(tt2))

Um zu illustrieren, wie man den Trend erhält, fahren wir mit dem vorherigen Beispiel in der untenstehenden Tabelle T-5.31 fort und benutzen dazu ein Spreadsheet, wie man das bei der klassischen Dekompositionsmethode macht. Die Koeffizientenschätzungen für die Tabelle T-5.31 sind

a* = Sum(Yt) / n = Ave(Yt) = 1117

b* = sum(ttYt) / sum(tt2) = 86454 / 18910 = 4.57

Tabelle T-5.31

Umsatztrends für Januar 1995 bis Dezember 1999

Jahr

Monat

Tatsächlicher Umsatz

Angepasste Umsätze

Zeitperiode
Zeit
x
Reihe
Zeit
x
Zeit

Umsatztrend

.

.

Durchschn.=1118

Durchschn.=1117

Durchschn.=0

Summe=86454

Summe=18910

Durchschn.=1117

1995

Januar

820

918

-30

-27540

900

980

Februar

775

1052

-29

-30508

841

984

März

805

1002

-28

-28056

784

989

April

890

1002

-27

-27054

729

994

Mai

980

1001

-26

-26026

676

998

Juni

1150

1016

-25

-25400

625

1003

Juli

1270

1033

-24

-24792

576

1007

August

1250

1034

-23

-23782

529

1012

September

1210

1020

-22

-22440

484

1016

Oktober

950

1050

-21

-22050

441

1021

November

970

1036

-20

-20720

400

1026

Dezember

1120

1016

-19

-19304

361

1030

1996

Januar

840

941

-18

-16938

324

1035

Februar

760

1031

-17

-17527

289

1039

März

790

984

-16

-15744

256

1044

April

880

991

-15

-14865

225

1048

Mai

960

981

-14

-13734

196

1053

Juni

1170

1033

-13

-13429

169

1058

Juli

1290

1050

-12

-12600

144

1062

August

1300

1075

-11

-11825

121

1067

September

1260

1063

-10

-10630

100

1071

Oktober

970

1072

-9

-9648

81

1076

November

1020

1089

-8

-8712

64

1080

Dezember

1210

1098

-7

-7686

49

1085

1997

Januar

1050

1176

-6

-7056

36

1090

Februar

920

1248

-5

-6240

25

1094

März

850

1058

-4

-4232

16

1099

April

970

1092

-3

-3276

9

1103

Mai

1020

1042

-2

-2084

4

1108

Juni

1250

1104

-1

-1104

1

1112

Juli

1380

1123

1

1123

1

1122

August

1380

1141

2

2282

4

1126

September

1350

1138

3

3414

9

1131

Oktober

1060

1171

4

4684

16

1135

November

1050

1121

5

5605

25

1140

Dezember

1310

1189

6

7134

36

1144

1998

Januar

1080

1210

7

8470

49

1149

Februar

700

950

8

7600

64

1154

März

990

1233

9

11097

81

1158

April

1090

1227

10

12270

100

1163

Mai

1260

1287

11

14157

121

1167

Juni

1370

1210

12

14520

144

1172

Juli

1440

1172

13

15236

169

1176

August

1380

1141

14

15974

196

1181

September

1410

1189

15

17835

225

1186

Oktober

1020

1127

16

18032

256

1190

November

1120

1196

17

20332

289

1195

Dezember

1280

1161

18

20898

324

1199

1999

Januar

1040

1165

19

22135

361

1204

Februar

930

1262

20

25240

400

1208

März

1010

1258

21

26418

441

1213

April

1100

1238

22

27236

484

1218

Mai

1230

1257

23

28911

529

1222

Juni

1390

1227

24

29448

576

1227

Juli

1480

1204

25

30100

625

1231

August

1430

1183

26

30758

676

1236

September

1520

1282

27

34614

729

1240

Oktober

1080

1193

28

33404

784

1245

November

1190

1271

29

36859

841

1250

Dezember

1310

1189

30

35670

900

1254

Die untenstehende Grafik G-5.4 zeigt die Trendlinie.

Grafik G-5.4

Nachdem man die ursprünglichen Daten durch die saisonalen Indexe (St) und die Trendwerte (Tt) dividiert hat, bleibt lediglich ein mögliches zyklisches Muster übrig, und unregelmäßige (d. h. wahllose) Schwankungen mögen auch noch da sein. Das zyklische Muster wird mittels einer gleitenden Durchschnittsprozedur geschätzt, ähnlich der für saisonale Schwankungen. Die Länge des Zyklus muss natürlich von dem Analysten festgelegt werden, leider gibt es jedoch für diese Wahl keine theoretische Anleitung. Je länger die gewählte Zykluslänge, desto mehr unregelmäßige Variationen werden eliminiert.

Entfernen wir den Trend von den jetzt desaisonalisierten Umsatzzahlen, erhalten wir das in der untenstehenden Grafik G-5.5 gezeigte Residuum.

Grafik G-5.5

Die Grafik G-5.5 zeigt, dass die ungewöhnlichen Spitzen in März 1997 und Februar 1998 Ausreißer sind. Ein Analyst wird diese Ausreißer aus den ursprünglichen tatsächlichen Daten entfernen, sie mit den saisonal angepassten Durchschnitten für diese Monate ersetzen und eine neue Dekomposition mit einer verbesserten Vorhersagequalität erstellen wollen. Diese Vorhersagen können jedoch auch ohne die Entfernung der Ausreißer durchaus akzeptable sein. In unserem Beispiel haben wir den zyklischen Teil aus den Daten unter der Annahme eines sechs monatlichen Musters entfernt. Der letzte Schritt besteht darin, die vorhergesagten Werte zu zeigen, die man erhält, indem man die Zeit mit den Schätzungen von b* multipliziert und a* addiert, um die Trendwerte zu bilden, und dann mit den saisonalen Indexen und zyklischen Indexen multipliziert. Die Kalkulation der vorhergesagten Werte wird in Anhang 5b gezeigt. Weiterhin werden die vorhergesagten Werte in der untenstehenden Grafik G-5.6 abgebildet.

Grafik G-5.6

Die Grafik G-5.6 zeigt sehr eindeutig, dass die vorhergesagten Werte innerhalb dieses Datenbeispiels sehr gut mit den tatsächlichen Werten übereinstimmen. Man kann die vorhergesagten Werte, die über unser Beispiel (in der Grafik für Januar bis Dezember 2000 in grün gezeichnet) hinausgehen, ebenfalls als zuverlässige Vorhersagen betrachten.

Die traditionelle Dekompositionsmethode ergibt sehr gute Schätzwerte für den Zeitraum des Beispiels, weil alle Schätzungen mit den Zahlen des Beispiels selbst bestimmt werden. Über den Beispielszeitraum hinaus sind die Vorhersagen immer noch für ein oder zwei Monate annehmbar. Die Genauigkeit ist tatsächlich so gut, dass die US-Regierung diese Methode (Census II genannt) benutzt, um Vorhersagen über Einkommen und Verbrauch zu erstellen. Es wäre jedoch gefährlich sich mehr als ein Jahr über den Beispielszeitraum hinaus auf Vorhersagen zu verlassen, die nur mit dieser Methode erstellt wurden.

Wiederholungsfragen Q-5F5.1.

 

Vorheriger Abschnitt: Dekomposition

Zuletzt geändert: 01.Juni 2001
Nächster Abschnitt: Datenglättung