Monday 20 November 2017

Durchschnittliches Multiplikatives Modell


Spreadsheet-Implementierung der saisonalen Anpassung und exponentieller Glättung Es ist einfach, saisonale Anpassung durchzuführen und exponentielle Glättungsmodelle mit Excel anzupassen. Die unten aufgeführten Bildschirmbilder und Diagramme werden einer Tabellenkalkulation entnommen, die eine multiplikative saisonale Anpassung und eine lineare Exponentialglättung für die folgenden vierteljährlichen Verkaufsdaten von Outboard Marine darstellt: Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier. Die Version der linearen exponentiellen Glättung, die hier für Demonstrationszwecke verwendet wird, ist die Brown8217s-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es nur eine Glättungskonstante gibt, die optimiert werden soll. In der Regel ist es besser, Holt8217s Version, die separate Glättungskonstanten für Ebene und Trend hat. Der Prognoseprozess verläuft wie folgt: (i) Die Daten werden saisonbereinigt (ii) sodann für die saisonbereinigten Daten über lineare exponentielle Glättung prognostiziert und (iii) schließlich werden die saisonbereinigten Prognosen zur Erzielung von Prognosen für die ursprüngliche Serie herangezogen . Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der Saisonbereinigung besteht darin, einen zentrierten gleitenden Durchschnitt (hier in Spalte D) zu berechnen. Dies kann erreicht werden, indem der Durchschnitt von zwei einjährigen Durchschnittswerten, die um eine Periode relativ zueinander versetzt sind, genommen wird. (Eine Kombination von zwei Offset-Durchschnittswerten anstatt eines einzigen Mittels wird für die Zentrierung benötigt, wenn die Anzahl der Jahreszeiten gleich ist.) Der nächste Schritt besteht darin, das Verhältnis zum gleitenden Durchschnitt zu berechnen. Wobei die ursprünglichen Daten durch den gleitenden Durchschnitt in jeder Periode dividiert werden - was hier in Spalte E durchgeführt wird. (Dies wird auch Quottrend-Cyclequot-Komponente des Musters genannt, sofern Trend - und Konjunktur-Effekte als all dies betrachtet werden können Bleibt nach einer Durchschnittsberechnung über ein ganzes Jahr im Wert von Daten bestehen. Natürlich können die monatlichen Veränderungen, die nicht saisonal bedingt sind, durch viele andere Faktoren bestimmt werden, aber der 12-Monatsdurchschnitt glättet sie weitgehend Wird der geschätzte saisonale Index für jede Jahreszeit berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit gemittelt werden, was in den Zellen G3-G6 unter Verwendung einer AVERAGEIF-Formel erfolgt. Die Durchschnittsverhältnisse werden dann neu skaliert, so daß sie auf das genau 100-fache der Anzahl der Perioden in einer Jahreszeit, oder 400 in diesem Fall, das in den Zellen H3-H6 erfolgt, summieren. Unten in der Spalte F werden VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile der Datentabelle einzufügen, entsprechend dem Viertel des Jahres, das es repräsentiert. Der zentrierte gleitende Durchschnitt und die saisonbereinigten Daten enden wie folgt: Beachten Sie, dass der gleitende Durchschnitt typischerweise wie eine glattere Version der saisonbereinigten Serie aussieht und an beiden Enden kürzer ist. Ein weiteres Arbeitsblatt in derselben Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten beginnend in Spalte G. Über der Prognosespalte (hier in Zelle H9) wird ein Wert für die Glättungskonstante (alpha) eingetragen Zur Vereinfachung wird ihm der Bereichsname quotAlpha. quot zugewiesen (Der Name wird mit dem Befehl quotInsertNameCreatequot zugewiesen.) Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist die rekursive Einzelformel des Brown8217s-Modells: Diese Formel wird in der Zelle entsprechend der dritten Periode (hier Zelle H15) eingegeben und von dort nach unten kopiert. Beachten Sie, dass sich die LES-Prognose für die aktuelle Periode auf die beiden vorherigen Beobachtungen und die beiden vorhergehenden Prognosefehler sowie auf den Wert von alpha bezieht. Somit bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. (Natürlich könnten wir statt der linearen exponentiellen Glättung einfach statt der linearen exponentiellen Glättung verwenden, könnten wir stattdessen die SES-Formel ersetzen. Wir könnten auch Holt8217s anstelle von Brown8217s LES-Modell verwenden, was zwei weitere Spalten von Formeln erfordern würde, um das Niveau und den Trend zu berechnen Die in der Prognose verwendet werden.) Die Fehler werden in der nächsten Spalte (hier Spalte J) durch Subtrahieren der Prognosen von den Istwerten berechnet. Der Quadratwurzel-Quadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittelwerts berechnet. (Das ergibt sich aus der mathematischen Identität: MSE VARIANCE (Fehler) (AVERAGE (Fehler)). 2) Bei der Berechnung des Mittelwertes und der Varianz der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, da das Modell nicht tatsächlich mit der Prognose beginnt Die dritte Periode (Zeile 15 auf der Kalkulationstabelle). Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha gefunden werden, bis das minimale RMSE gefunden wird, oder Sie können das quotSolverquot verwenden, um eine genaue Minimierung durchzuführen. Der Wert von alpha, den der Solver gefunden hat, wird hier angezeigt (alpha0.471). Es ist in der Regel eine gute Idee, die Fehler des Modells (in transformierten Einheiten) zu zeichnen und ihre Autokorrelationen zu berechnen und zu zeichnen, bis zu einer Saison. Hier ist eine Zeitreihenfolge der (saisonbereinigten) Fehler: Die Fehlerautokorrelationen werden mit Hilfe der CORREL () - Funktion berechnet, um die Korrelationen der Fehler selbst mit einer oder mehreren Perioden zu berechnen - Einzelheiten sind im Kalkulationsblatt dargestellt . Hier ist ein Diagramm der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen: Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4 (deren Wert 0,35 ist) ist etwas mühsam Saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings ist es eigentlich nur marginal signifikant. 95 Signifikanzbanden zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, sind ungefähr plus-oder-minus 2SQRT (n-k), wobei n die Stichprobengröße und k die Verzögerung ist. Hier ist n gleich 38 und k variiert von 1 bis 5, so daß die Quadratwurzel von - n-minus-k für alle von etwa 6 ist, und daher sind die Grenzen für das Testen der statistischen Signifikanz von Abweichungen von Null grob plus - Oder-minus 26 oder 0,33. Wenn Sie den Wert von alpha von Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelationsdiagramme der Fehler sowie auf den Root-mean-squared-Fehler beobachten, der nachfolgend erläutert wird. Am Ende der Kalkulationstabelle wird die Prognoseformel quasi in die Zukunft gestartet, indem lediglich Prognosen für tatsächliche Werte an dem Punkt ausgetauscht werden, an dem die tatsächlichen Daten ablaufen - d. h. Wo die Zukunft beginnt. (Mit anderen Worten, in jeder Zelle, in der ein zukünftiger Datenwert auftreten würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diese Periode hinweist.) Alle anderen Formeln werden einfach von oben nach unten kopiert: Beachten Sie, dass die Fehler für die Prognosen von Die Zukunft werden alle berechnet, um Null zu sein. Dies bedeutet nicht, dass die tatsächlichen Fehler null sein werden, sondern lediglich die Tatsache, dass wir für die Vorhersage davon ausgehen, dass die zukünftigen Daten den Prognosen im Durchschnitt entsprechen werden. Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen wie folgt aus: Mit diesem für α-Periodenprognosen optimalen Wert von alpha ist der prognostizierte Trend leicht nach oben, was auf den lokalen Trend in den letzten 2 Jahren zurückzuführen ist oder so. Für andere Werte von alpha könnte eine sehr unterschiedliche Trendprojektion erhalten werden. Es ist normalerweise eine gute Idee, zu sehen, was mit der langfristigen Trendprojektion geschieht, wenn Alpha variiert wird, weil der Wert, der für kurzfristige Prognosen am besten ist, nicht notwendigerweise der beste Wert für die Vorhersage der weiter entfernten Zukunft sein wird. Dies ist beispielsweise das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0,25 gesetzt wird: Der projizierte Langzeittrend ist jetzt eher negativ als positiv Mit einem kleineren Wert von alpha setzt das Modell mehr Gewicht auf ältere Daten Seine Einschätzung des aktuellen Niveaus und Tendenz und seine langfristigen Prognosen spiegeln den in den letzten 5 Jahren beobachteten Abwärtstrend anstatt den jüngsten Aufwärtstrend wider. Dieses Diagramm zeigt auch deutlich, wie das Modell mit einem kleineren Wert von alpha langsamer ist, um auf quotturning pointsquot in den Daten zu antworten und daher tendiert, einen Fehler des gleichen Vorzeichens für viele Perioden in einer Reihe zu machen. Die Prognosefehler von 1-Schritt-Vorhersage sind im Mittel größer als die, die zuvor erhalten wurden (RMSE von 34,4 statt 27,4) und stark positiv autokorreliert. Die Lag-1-Autokorrelation von 0,56 übersteigt den oben berechneten Wert von 0,33 für eine statistisch signifikante Abweichung von Null deutlich. Als Alternative zum Abkürzen des Wertes von Alpha, um mehr Konservatismus in Langzeitprognosen einzuführen, wird manchmal ein Quottrend-Dämpfungsquotfaktor dem Modell hinzugefügt, um die projizierte Tendenz nach einigen Perioden abflachen zu lassen. Der letzte Schritt beim Erstellen des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu veranschaulichen. Somit sind die reseasonalisierten Prognosen in Spalte I einfach das Produkt der saisonalen Indizes in Spalte F und der saisonbereinigten LES-Prognosen in Spalte H. Es ist relativ einfach, Konfidenzintervalle für einstufige Prognosen dieses Modells zu berechnen: Erstens Berechnen Sie den RMSE (root-mean-squared Fehler, der nur die Quadratwurzel der MSE ist) und berechnen Sie dann ein Konfidenzintervall für die saisonbereinigte Prognose durch Addition und Subtraktion zweimal des RMSE. (Im Allgemeinen ist ein 95-Konfidenzintervall für eine Ein-Perioden-Vorausprognose ungefähr gleich der Punktvorhersage plus-oder-minus-zweimal der geschätzten Standardabweichung der Prognosefehler, vorausgesetzt, die Fehlerverteilung ist annähernd normal und die Stichprobengröße Ist groß genug, sagen wir, 20 oder mehr Hier ist die RMSE anstelle der Standardabweichung der Fehler die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, weil sie auch die Zufallsvariationen berücksichtigt.) Die Vertrauensgrenzen Für die saisonbereinigte Prognose werden dann reseasonalisiert. Zusammen mit der Prognose, durch Multiplikation mit den entsprechenden saisonalen Indizes. In diesem Fall ist die RMSE gleich 27,4 und die saisonbereinigte Prognose für die erste künftige Periode (Dez-93) beträgt 273,2. So dass das saisonbereinigte 95-Konfidenzintervall von 273,2-227,4 218,4 auf 273,2227,4 328,0 liegt. Das Multiplizieren dieser Limits durch Decembers saisonalen Index von 68,61. Erhalten wir niedrigere und obere Konfidenzgrenzen von 149,8 und 225,0 um die Dez-93-Punktprognose von 187,4. Die Vertrauensgrenzen für Prognosen, die länger als eine Periode vorangehen, werden sich in der Regel aufgrund der Unsicherheit über das Niveau und den Trend sowie die saisonalen Faktoren erweitern, da der Prognosehorizont zunimmt, aber es ist schwierig, diese im Allgemeinen nach analytischen Methoden zu berechnen. (Die geeignete Methode zur Berechnung der Vertrauensgrenzen für die LES-Prognose ist die Verwendung der ARIMA-Theorie, aber die Unsicherheit in den saisonalen Indizes ist eine andere Angelegenheit.) Wenn Sie ein realistisches Konfidenzintervall für eine Prognose über mehrere Zeiträume wünschen, Fehler zu berücksichtigen, ist Ihre beste Wette, empirische Methoden zu verwenden: Zum Beispiel, um ein Vertrauensintervall für eine 2-Schritt-Vorausprognose zu erhalten, könnten Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-Voraus-Prognose für jeden Zeitraum zu berechnen Durch Booten der Ein-Schritt-Voraus-Prognose). Berechnen Sie dann die RMSE der 2-Schritt-Vorhersagefehler und verwenden Sie diese als Basis für ein 2-stufiges Konfidenzintervall. Allgemeine saisonale ARIMA-Modelle: (0,1,1) x (0,1,1) usw Die saisonale ARIMA-Modellierung: Der saisonale Teil eines ARIMA-Modells hat die gleiche Struktur wie der nicht saisonale Teil: er kann einen AR-Faktor, einen MA-Faktor und andor eine Differenzierung aufweisen. Im saisonalen Teil des Modells, alle diese Faktoren arbeiten über Vielfache von Lag s (die Anzahl der Perioden in einer Saison). Ein saisonales ARIMA-Modell wird als ARIMA (p, d, q) x (P, D, Q) - Modell klassifiziert, wobei Pnummer der saisonalen autoregressiven (SAR) Terme, Dnumber der saisonalen Unterschiede, Qnumber der saisonalen gleitenden Durchschnittswerte (SMA) Bei der Identifizierung eines saisonalen Modells, ist der erste Schritt, um festzustellen, ob eine saisonale Unterschied erforderlich ist, zusätzlich oder vielleicht statt einer nicht-saisonalen Unterschied. Sie sollten auf Zeitreihenplots und ACF - und PACF-Plots für alle möglichen Kombinationen von 0 oder 1 nicht-saisonalen Unterschied und 0 oder 1 saisonalen Unterschied zu suchen. Achtung: Verwenden Sie nicht mehr als einen saisonalen Unterschied und nicht mehr als zwei Gesamtdifferenzen (saisonal und nicht saisonal kombiniert). Wenn das saisonale Muster sowohl stark und stabil über die Zeit (zB hoch im Sommer und niedrig im Winter, oder umgekehrt) ist, dann sollten Sie wahrscheinlich einen saisonalen Unterschied verwenden, unabhängig davon, ob Sie einen nicht-saisonalen Unterschied verwenden, da dies wird Verhindern, dass das saisonale Muster aus Zerlegung outquot in den langfristigen Prognosen. Fügen Sie diese zu unserer Liste der Regeln für die Identifizierung von Modellen hinzu Regel 12: Wenn die Serie eine starke und konsistente saisonale Muster hat, sollten Sie eine Reihenfolge der saisonalen Differenzierung verwenden - aber nie mehr als eine Reihenfolge der saisonalen Differenzierung oder mehr als 2 verwenden Aufträge der Gesamtdifferenzierung (saisonabhängig). Die Signatur von reinem SAR oder reinem SMA Verhalten ist ähnlich der Signatur von reinem AR oder reinem MA Verhalten, mit der Ausnahme, dass das Muster über Vielfache von Verzögerung s im ACF und PACF auftritt. Beispielsweise hat ein reines SAR (1) - Verfahren Spikes in der ACF bei den Verzögerungen s, 2s, 3s usw., während die PACF nach der Verzögerung s abschaltet. Umgekehrt hat ein reines SMA (1) - Verfahren Spikes in der PACF bei den Verzögerungen s, 2s, 3s usw., während der ACF nach der Verzögerung s abschaltet. Eine SAR-Signatur tritt gewöhnlich auf, wenn die Autokorrelation bei der saisonalen Periode positiv e ist, während eine SMA-Signatur normalerweise auftritt, wenn die saisonale Autokorrelation negativ ist. Daher: Regel 13: Wenn die Autokorrelation bei der Saisonzeit positiv ist. Erwägen, dem Modell einen SAR-Begriff hinzuzufügen. Wenn die Autokorrelation bei der Saisonperiode negativ ist. Erwägen, dem Modell einen SMA-Begriff hinzuzufügen. Vermeiden Sie das Mischen von SAR - und SMA-Begriffen in demselben Modell und vermeiden Sie die Verwendung von mehr als einer der beiden Arten. Normalerweise reicht ein SAR (1) oder SMA (1) Term aus. Sie werden selten einen echten SAR (2) - oder SMA (2) - Prozess finden und noch selten haben Sie genug Daten, um zwei oder mehr Saisonkoeffizienten abzuschätzen, ohne dass der Schätzalgorithmus in eine Quotefeedback-Schleife eintritt. "Obwohl ein saisonales ARIMA-Modell zu haben scheint Nur ein paar Parameter, denken Sie daran, dass backforecasting die Schätzung von ein oder zwei Jahreszeiten im Wert von impliziten Parametern, um es zu initialisieren erfordert. Daher sollten Sie mindestens 4 oder 5 Jahreszeiten von Daten, um eine saisonale ARIMA-Modell passen. Das am häufigsten verwendete saisonale ARIMA-Modell ist das (0,1,1) x (0,1,1) - Modell - d. h. Ein MA (1) xSMA (1) - Modell mit einer saisonalen und einer nicht-saisonalen Differenz. Dies ist im wesentlichen ein sequentielles exponentielles Glättungsmodell. Wenn saisonale ARIMA-Modelle an protokollierte Daten angepasst werden, können sie ein multiplikatives saisonales Muster verfolgen. Beispiel: AUTOSALE-Serie erneut besucht Rückruf, dass wir zuvor Prognose der Retail-Auto-Verkaufs-Serie mit einer Kombination aus Deflation, saisonale Anpassung und exponentielle Glättung. Lets jetzt versuchen, passen die gleiche Serie mit saisonalen ARIMA Modelle, mit der gleichen Stichprobe von Daten von Januar 1970 bis Mai 1993 (281 Beobachtungen). Wie vorher werden wir mit deflationierten Autoverkäufen arbeiten - d. H. Wir verwenden die Serie AUTOSALECPI als Eingangsgröße. Hier sind die Zeitreihenplots und ACF - und PACF - Diagramme der Originalreihe, die im Prognoseverfahren durch die Darstellung des Quotienten eines ARIMA (0,0,0) x (0,0,0) Modells mit Konstante erhalten werden Quotsuspension bridgequot Muster in der ACF ist typisch für eine Serie, die sowohl nichtstationäre und stark saisonal ist. Natürlich brauchen wir mindestens eine Ordnung der Differenzierung. Wenn wir eine nicht-saisonale Differenz annehmen, sind die entsprechenden Diagramme wie folgt: Die differenzierte Reihe (die Residuen eines Modells mit wahlfreiem Anstieg) sieht mehr oder weniger stationär aus, aber es gibt immer noch sehr starke Autokorrelation in der Saisonzeit (Verzögerung 12). Weil das saisonale Muster stark und stabil ist, wissen wir (aus Regel 12), dass wir eine Ordnung der saisonalen Differenzierung im Modell verwenden wollen. Hier sieht das Bild nach einem saisonalen Unterschied aus (nur): Die saisonal differenzierte Serie zeigt ein sehr starkes Muster positiver Autokorrelation, wie wir aus unserem früheren Versuch, ein saisonales Zufallsmodell anzupassen, erinnern. Dies könnte ein Zitat-Signaturquot - oder es könnte signalisieren die Notwendigkeit für einen anderen Unterschied. Wenn wir sowohl eine saisonale als auch eine nicht-saisonale Differenz einnehmen, werden folgende Ergebnisse erzielt: Dies sind natürlich die Residuen aus dem saisonal zufälligen Trendmodell, die wir früher an den Autoverkaufsdaten angepasst haben. Wir sehen jetzt die verräterischen Anzeichen einer leichten Überdifferenzierung. Sind die positiven Spikes in der ACF und PACF negativ geworden. Was ist die richtige Reihenfolge der Differenzierung Eine weitere Information, die hilfreich sein könnte, ist eine Berechnung der Fehlerstatistik der Serie auf jeder Ebene der Differenzierung. Wir können diese berechnen, indem wir die entsprechenden ARIMA-Modelle, in denen nur differencing verwendet wird, berechnen: Die kleinsten Fehler, sowohl in der Schätzperiode als auch in der Validierungsperiode, werden durch Modell A erhalten, das eine Differenz von jedem Typ verwendet. Dies, zusammen mit dem Auftreten der Plots oben, deutet stark darauf hin, dass wir sowohl eine saisonale und eine nonsaisonale Unterschied verwenden sollten. Das Modell A ist das saisonale Zufalls-Trend-Modell (SRT-Modell), während das Modell B nur das saisonal zufällige (SRW) Modell darstellt. Wie wir bereits beim Vergleich dieser Modelle festgestellt haben, scheint das SRT-Modell besser zu passen als das SRW-Modell. In der Analyse, die folgt, werden wir versuchen, diese Modelle durch die Zugabe von saisonalen ARIMA Bedingungen zu verbessern. Zurück zum Seitenanfang. Das häufig verwendete ARIMA (0,1,1) x (0,1,1) Modell: SRT Modell plus MA (1) und SMA (1) Begriffe Rückkehr zum letzten Satz von Plots oben, bemerken, dass mit einer Differenz von Jede Art gibt es eine negative Spitze in der ACF bei Verzögerung 1 und auch eine negative Spitze in der ACF bei Verzögerung 12. Wohingegen die PACF in der Nähe dieser beiden Verzögerungen ein graduelleres quadratisches Muster zeigt. Durch die Anwendung unserer Regeln zur Identifizierung von ARIMA-Modellen (speziell Regel 7 und Regel 13) können wir nun folgern, dass das SRT-Modell durch den Zusatz eines MA (1) - Terms und auch eines SMA (1) - Terms verbessert wird. Auch durch Regel 5 schließen wir die Konstante aus, da zwei Befehlsordnungen beteiligt sind. Wenn wir dies alles tun, erhalten wir das ARIMA (0,1,1) x (0,1,1) Modell. Welches das am häufigsten verwendete saisonale ARIMA-Modell ist. Seine Prognose-Gleichung ist: wobei 952 1 der MA (1) - Koeffizient und 920 1 (Kapital-Theta-1) der SMA (1) - Koeffizient ist. Man beachte, daß der Koeffizient des Lag-13-Fehlers das Produkt des MA (1) und des MA-1 ist SMA (1) Koeffizienten. Dieses Modell ist konzeptionell dem Winters-Modell insofern ähnlich, als es eine exponentielle Glättung effektiv auf Niveau, Trend und Saisonalität auf einmal anwendet, obwohl es auf fundierteren theoretischen Grundlagen beruht, insbesondere im Hinblick auf die Berechnung von Konfidenzintervallen für Langzeitprognosen. Seine Residualplots sind in diesem Fall wie folgt: Obwohl eine geringe Autokorrelation bei der Verzögerung 12 verbleibt, ist das Gesamtaussehen der Diagramme gut. Die Modellanpassungsergebnisse zeigen, dass die geschätzten MA (1) - und SMA (1) - Koeffizienten (die nach 7 Iterationen erhalten wurden) tatsächlich signifikant sind: Die Prognosen des Modells ähneln denen des saisonalen Zufallsmodells - d. h. Sie nehmen das saisonale Muster und den lokalen Trend am Ende der Serie auf - aber sie sind etwas glatter im Aussehen, da sowohl das saisonale Muster als auch der Trend in der letzten Zeit effektiv gemittelt werden (in einer exponentiell-glatten Art) Einige Jahreszeiten: Was ist dieses Modell wirklich tun Sie können es auf die folgende Weise denken. Zuerst berechnet er die Differenz zwischen jedem Monat8217s-Wert und einem 8220exponentiell gewichteten historischen Durchschnitt8221 für diesen Monat, der berechnet wird, indem exponentielle Glättung auf Werte angewandt wird, die im selben Monat in früheren Jahren beobachtet wurden, wobei der Glättungsbetrag durch die SMA bestimmt wird (1 ) - Koeffizient. Dann wird eine einfache exponentielle Glättung auf diese Unterschiede angewandt, um die Abweichung von dem historischen Durchschnitt vorherzusagen, der im nächsten Monat beobachtet wird. Der Wert des SMA (1) - Koeffizienten in der Nähe von 1,0 legt nahe, dass viele Jahreszeiten von Daten verwendet werden, um den historischen Durchschnitt für einen bestimmten Monat des Jahres zu berechnen. Es sei daran erinnert, dass ein MA (1) - Koeffizient in einem ARIMA-Modell (0,1,1) 1-minus-alpha im entsprechenden exponentiellen Glättungsmodell entspricht und dass das Durchschnittsalter der Daten in einer exponentiellen Glättungsmodellprognose 1alpha ist. Der SMA (1) - Koeffizient hat eine ähnliche Interpretation in Bezug auf Durchschnittswerte über die Jahreszeiten. Der Wert von 0,91 deutet darauf hin, dass das Durchschnittsalter der für die Schätzung des historischen Saisonmusters verwendeten Daten etwas mehr als 10 Jahre beträgt (fast die Hälfte der Länge des Datensatzes), was bedeutet, dass ein nahezu konstantes saisonales Muster angenommen wird. Der viel kleinere Wert von 0,5 für den MA (1) - Koeffizienten deutet darauf hin, dass relativ wenig Glättung durchgeführt wird, um die aktuelle Abweichung von dem historischen Durchschnitt für denselben Monat abzuschätzen, sodass der nächste Monat8217s vorhergesagte Abweichung von seinem historischen Durchschnitt in der Nähe der Abweichungen liegt Aus dem historischen Durchschnitt, die in den letzten Monaten beobachtet wurden. Das Modell ARIMA (1,0,0) x (0,1,0) mit konstantem SRW-Modell und AR (1) - Zustand Das Vorgängermodell war ein saisonales Random-Trend-Modell (SRT) 1) und SMA (1) Koeffizienten. Ein alternatives ARIMA-Modell für diese Serie kann erhalten werden, indem ein AR (1) - Term für die nicht-saisonale Differenz - d. h. Durch Hinzufügen eines AR (1) - Terms zu dem Seasonal Random Walk (SRW) - Modell. Dies ermöglicht es uns, das saisonale Muster in dem Modell zu bewahren, während der Gesamtbetrag der Differenzierung gesenkt wird, wodurch die Stabilität der Trendvorsprünge erhöht wird, wenn dies gewünscht wird. (Erinnern wir uns, dass die Reihe mit einer saisonalen Differenz alleine eine starke AR (1) Signatur zeigte.) Wenn wir dies tun, erhalten wir ein ARIMA (1,0,0) x (0,1,0) Modell mit konstanten, Was zu folgenden Ergebnissen führt: Der AR (1) - Koeffizient ist in der Tat sehr signifikant und der RMSE ist nur 2,06, verglichen mit 3,00 für das SRW-Modell (Modell B im obigen Vergleichsbericht). Die Prognose-Gleichung für dieses Modell ist: Der zusätzliche Begriff auf der rechten Seite ist ein Vielfaches des saisonalen Unterschieds, der im letzten Monat beobachtet wurde, was die Wirkung hat, die Prognose für die Wirkung eines ungewöhnlich guten oder schlechten Jahres zu korrigieren. Dabei bezeichnet 981 1 den AR (1) - Koeffizienten, dessen Schätzwert 0,73 ist. So zum Beispiel, wenn Verkäufe letzter Monat waren X Dollar vor Verkäufen ein Jahr früher, dann die Quantität 0.73X würde die Prognose für diesen Monat hinzugefügt werden. 956 bezeichnet die Konstante in der Prognose-Gleichung, deren Schätzwert 0,20 beträgt. Die geschätzte MEAN, deren Wert 0,75 ist, ist der Mittelwert der saisonal differenzierten Serien, was der jährliche Trend bei den Langzeitprognosen dieses Modells ist. Die Konstante ist (durch Definition) gleich den mittleren Zeiten 1 minus dem AR (1) - Koeffizienten: 0,2 0,75 (1 8211 0,73). Die Prognose zeigt, dass das Modell in der Tat eine bessere Arbeit als das SRW-Modell der Verfolgung zyklischer Veränderungen (dh ungewöhnlich gute oder schlechte Jahre): Aber die MSE für dieses Modell ist noch deutlich größer als das, was wir für die ARIMA (0, 1,1) x (0,1,1) - Modell. Wenn wir uns die Grundstücke der Residuen anschauen, sehen wir Raum für Verbesserungen. Die Residuen zeigen immer noch ein Zeichen der zyklischen Variation: Die ACF und PACF legen nahe, dass sowohl MA (1) als auch SMA (1) Koeffizienten benötigt werden: Eine verbesserte Version: ARIMA (1,0,1) x (0,1,1) Mit Konstanten Wenn wir die angezeigten MA (1) und SMA (1) Terme dem vorhergehenden Modell hinzufügen, erhalten wir ein ARIMA (1,0,1) x (0,1,1) Modell mit einer Konstante, deren Prognosegleichung Dies ist Ist fast das gleiche wie das ARIMA (0,1,1) x (0,1,1) - Modell, mit der Ausnahme, dass es die nicht-saisonale Differenz durch einen AR (1) - Term ersetzt (eine partielle Differentialquot) und einen konstanten Term enthält, Langfristigen Trend. Daher nimmt dieses Modell einen stabileren Trend an als das ARIMA (0,1,1) x (0,1,1) - Modell, und das ist der Hauptunterschied zwischen ihnen. Die Modell-Anpassungsergebnisse sind wie folgt: Beachten Sie, dass der geschätzte AR (1) - Koeffizient (981 1 in der Modellgleichung) 0,96 ist, der sehr nahe bei 1,0 liegt, aber nicht so nahe ist, dass er unbedingt ersetzt werden sollte Ein erster Unterschied: sein Standardfehler ist 0.02, also ist er ungefähr 2 Standardfehler von 1.0. Die anderen Statistiken des Modells (die geschätzten MA (1) - und SMA (1) - Koeffizienten und Fehlerstatistiken in den Schätz - und Validierungsperioden sind ansonsten fast identisch mit denen des ARIMA (0,1,1) x (0,1 , 1) - Modell. (Die geschätzten MA (1) und SMA (1) Koeffizienten sind 0,45 und 0,91 in diesem Modell gegenüber 0,48 und 0,91 in der anderen.) Die geschätzte MEAN von 0,68 ist der vorhergesagte langfristige Trend (durchschnittliche jährliche Steigerung). Dies ist im wesentlichen der gleiche Wert, der im (1,0,0) x (0,1,0) - mit konstanten Modell erhalten wurde. Der Standardfehler des geschätzten Mittels ist 0,26, so dass die Differenz zwischen 0,75 und 0,68 nicht signifikant ist. Wenn die Konstante nicht in diesem Modell enthalten wäre, wäre es ein gedämpftes Trendmodell: Der Trend in seinen sehr langfristigen Prognosen würde allmählich abflachen. Die Punktvorhersagen aus diesem Modell ähneln denen des (0,1,1) x (0,1,1) - Modells, da der durchschnittliche Trend ähnlich dem lokalen Trend am Ende der Serie ist. Allerdings wachsen die Konfidenzintervalle für dieses Modell etwas weniger schnell aufgrund seiner Annahme, dass der Trend stabil ist. Beachten Sie, dass die Vertrauensgrenzen für die zweijährigen Prognosen nun innerhalb der horizontalen Rasterlinien bei 24 und 44 bleiben, während die Werte des (0,1,1) x (0,1,1) Modells nicht: saisonale ARIMA Versus exponentielle Glättung und saisonale Anpassung: Jetzt können wir die Performance der beiden besten ARIMA - Modelle gegenüber einfachen und linearen exponentiellen Glättungsmodellen, begleitet von multiplikativen saisonalen Anpassungen, und dem Winters - Modell vergleichen, wie in den Folien der Prognose mit saisonaler Anpassung dargestellt: Sind die Ein-Perioden-Prognosen für alle Modelle in diesem Fall extrem eng. Es ist schwierig, eine 8220winner8221 basierend auf diesen Zahlen allein auszuwählen. Zurück zum Seitenanfang. Was sind die Kompromisse zwischen den verschiedenen saisonalen Modellen Die drei Modelle, die multiplikative saisonale Anpassung verwenden Deal mit Saisonalität in einer expliziten Weise - d. H. Saisonale Indizes werden als expliziter Teil des Modells ausgebrochen. Die ARIMA-Modelle behandeln Saisonalität in einer impliziteren Weise - wir können nicht leicht sehen, in der ARIMA-Ausgabe, wie die durchschnittliche Dezember, sagen, unterscheidet sich von der durchschnittlichen Juli. Abhängig davon, ob es wichtig ist, das saisonale Muster zu isolieren, könnte dies ein Faktor bei der Auswahl unter den Modellen sein. Die ARIMA-Modelle haben den Vorteil, dass sie, sobald sie initialisiert worden sind, weniger bewegliche Teile als die exponentiellen Glättungs - und Einstellmodelle haben und daher weniger wahrscheinlich sind, die Daten zu überladen. ARIMA Modelle haben auch eine solide zugrunde liegende Theorie in Bezug auf die Berechnung der Konfidenzintervalle für längerfristige Prognosen als die anderen Modelle. Es gibt mehr dramatische Unterschiede zwischen den Modellen in Bezug auf das Verhalten ihrer Prognosen und Konfidenzintervalle für Prognosen mehr als 1 Zeitraum in die Zukunft. Dies ist, wo die Annahmen, die in Bezug auf Veränderungen in der Trend-und saisonale Muster sind sehr wichtig. Zwischen den beiden ARIMA-Modellen schätzt eine (Modell A) einen zeitlichen Trend, während die andere (Modell B) einen langfristigen durchschnittlichen Trend aufweist. (Wir könnten, falls gewünscht, den langfristigen Trend im Modell B durch Unterdrücken des konstanten Terms abflachen.) Unter den exponentiellen Glättungs-plus-Anpassungsmodellen nimmt ein Modell C einen flachen Trend an, während das andere ( Modell D) einen zeitlich variierenden Trend. Das Winters-Modell (E) nimmt auch einen zeitlichen Trend an. Modelle, die einen konstanten Trend annehmen, sind in ihren Langzeitprognosen relativ zuversichtlicher als Modelle, die dies nicht tun, und dies wird sich in der Regel auch in dem Ausmaß widerspiegeln, in dem Vertrauensintervalle für Prognosen bei längeren Prognosehorizonten breiter werden. Modelle, die keine zeitvariablen Trends voraussetzen, haben im Allgemeinen schmalere Konfidenzintervalle für längerfristige Prognosen, aber schmaler ist es nicht, wenn diese Annahme nicht korrekt ist. Die beiden exponentiellen Glättungsmodelle in Verbindung mit saisonaler Anpassung gehen davon aus, dass das saisonale Muster während der 23 Jahre in der Datenstichprobe konstant geblieben ist, während die anderen drei Modelle dies nicht tun. Soweit das saisonale Muster für die meisten der Monat-zu-Monat-Variation in den Daten verantwortlich ist, ist es wichtig, für die Vorhersage, was wird mehrere Monate in die Zukunft geschehen. Wenn das saisonale Muster vermutlich sich im Laufe der Zeit langsam verändert hat, wäre ein anderer Ansatz, nur eine kürzere Datenhistorie für die Anpassung der Modelle zu verwenden, die feste Saisonindizes abschätzen. Für die Aufzeichnung sind hier die Prognosen und 95 Konfidenzgrenzen für Mai 1995 (24 Monate voraus), die von den fünf Modellen erzeugt werden: Die Punktvorhersagen sind tatsächlich überraschend nahe beieinander, bezogen auf die Breiten aller Konfidenzintervalle. Die SES-Punktvorhersage ist am niedrigsten, weil sie das einzige Modell ist, das am Ende der Serie keinen Aufwärtstrend annimmt. Das Modell ARIMA (1,0,1) x (0,1,1) c hat die engsten Konfidenzgrenzen, da es weniger zeitliche Variation in den Parametern annimmt als die anderen Modelle. Auch die Punktprognose ist etwas größer als die der anderen Modelle, da sie einen langfristigen Trend und nicht einen kurzfristigen Trend (oder Null-Trend) extrapoliert. Das Winters-Modell ist das am wenigsten stabile Modell der Modelle, und seine Prognose weist daher die breitesten Vertrauensgrenzen auf, wie sich aus den detaillierten Prognoseplänen für die Modelle ergab. Und die Prognosen und Vertrauensgrenzen des Modells ARIMA (0,1,1) x (0,1,1) und denen des LESseasonal-Anpassungsmodells sind praktisch identisch. Loggen oder nicht protokollieren Etwas, was wir noch nicht getan haben, aber Haben könnte, ist eine Log-Transformation als Teil des Modells enthalten. Saisonale ARIMA-Modelle sind von Natur aus additive Modelle, also, wenn wir ein multiplikatives saisonales Muster erfassen wollen. Müssen wir dies tun, indem wir die Daten vor dem Einbau des ARIMA-Modells protokollieren. (In Statgraphics müssten wir nur den "Natural Logquot" als Modellierungsoption angeben - keine große Sache.) In diesem Fall scheint die Deflationstransformation eine zufriedenstellende Aufgabe zu haben, die Amplituden der Saisonzyklen zu stabilisieren Scheint ein zwingender Grund zu sein, eine Protokolltransformation hinzuzufügen, soweit es sich um langfristige Trends handelt. Wenn die Residuen eine deutliche Zunahme der Varianz im Laufe der Zeit zeigten, könnten wir anders entscheiden. Es gibt noch eine Frage, ob die Fehler dieser Modelle eine konsistente Varianz über Monate des Jahres haben. Wenn sie don8217t, dann Konfidenzintervalle für Prognosen können dazu neigen, zu breit oder zu schmal nach der Saison. Die Residual-vs-Zeit-Diagramme zeigen in dieser Hinsicht kein offensichtliches Problem, aber um gründlich zu sein, wäre es gut, die Fehlerabweichung pro Monat zu betrachten. Wenn es tatsächlich ein Problem, eine Protokoll-Transformation könnte es zu beheben. Zurück zum Seitenanfang. Journal of Mathematics and Statistics Volume 7, Issue 1 Problembeschreibung: Die meisten saisonalen autoregressiven integrierten Moving Average (SARIMA) Modelle, die für die Prognose saisonale Zeitreihen verwendet werden, sind multiplikative SARIMA Modelle. Diese Modelle gehen davon aus, dass es einen signifikanten Parameter als Ergebnis der Multiplikation zwischen nicht saisonalen und saisonalen Parametern gibt, ohne durch einen bestimmten statistischen Test zu testen. Darüber hinaus ist die beliebteste statistische Software wie MINITAB und SPSS nur die Möglichkeit, ein multiplikatives Modell passen. Ziel dieser Forschung ist es, ein neues Verfahren zur Indentifizierung der geeignetsten Ordnung des SARIMA-Modells vorzuschlagen, ob es sich um subset-, multiplikative oder additive Ordnung handelt. Insbesondere untersuchte die Studie, ob ein multiplikativer Parameter im SARIMA-Modell existiert. Ansatz: Theoretische Ableitung über Autokorrelation (ACF) und partielle Autokorrelation (PACF) Funktionen aus subset, multiplikative und additive SARIMA-Modell wurde zunächst diskutiert und dann R-Programm wurde verwendet, um die Grafik dieser theoretischen ACF und PACF zu schaffen. Dann wurden zwei monatliche Datensätze als Fallstudien verwendet, d. H. Die internationalen Passagierdaten der Fluggesellschaft und Serien über die Anzahl der touristischen Ankünfte nach Bali, Indonesien. Der Modellidentifizierungsschritt, um die Reihenfolge des ARIMA-Modells zu bestimmen, wurde unter Verwendung des MINITAB-Programms und des Modellschätzschrittes mit dem SAS-Programm durchgeführt, um zu testen, ob das Modell aus einer subset-, multiplikativen oder additiven Ordnung bestand. Ergebnisse: Die theoretischen ACF und PACF zeigten, dass subset, multiplikative und additive SARIMA Modelle haben unterschiedliche Muster, vor allem bei der Verzögerung als Folge der Multiplikation zwischen nicht saisonalen und saisonalen Verzögerungen. Die Modellierung der Flugzeugdaten ergab ein SARIMA-Modell als das beste Modell, während ein additives SARIMA-Modell das beste Modell für die Vorhersage der Zahl der Touristenankünfte nach Bali ist. Fazit: Beide Fallstudien zeigten, dass ein multiplikatives SARIMA-Modell nicht das beste Modell für die Prognose dieser Daten war. Die Vergleichsuntersuchung ergab, dass subset - und additive SARIMA-Modelle genauere prognostizierte Werte in Out-Sample-Datenmengen liefern als multiplikatives SARIMA-Modell für Airline - und Touristenankunfts-Datensätze. Diese Studie ist ein wertvoller Beitrag zum Box-Jenkins-Verfahren, insbesondere bei den Modellidentifikations - und Schätzschritten im SARIMA-Modell. Weitere Arbeiten, die mehrere saisonale ARIMA-Modelle betreffen, wie kurzfristige Lastdatenvorhersagen in bestimmten Ländern, können weitere Erkenntnisse über die subset-, multiplikativen oder additiven Aufträge liefern. Kopieren Sie 2011 Suhartono. Dies ist ein Open Access Artikel, der unter den Bedingungen der Creative Commons Attribution License verteilt wird. Die uneingeschränkte Nutzung, Verbreitung und Vervielfältigung in jeglichem Medium gestattet, vorausgesetzt, der ursprüngliche Autor und die Quelle werden gutgeschrieben.

No comments:

Post a Comment