Saturday, October 15, 2016

B ) Moving Average Modelle

In die praktyk sal die bewegende gemiddelde 'n goeie raming van die gemiddelde van die tydreeks te verskaf indien die gemiddelde konstant of stadig verander. In die geval van 'n konstante gemiddelde, sal die grootste waarde van m die beste raming van die onderliggende gemiddelde gee. 'N langer tydperk waarneming sal gemiddeld uit die gevolge van variasie. Die doel van die verskaffing van 'n kleiner m is om voorsiening te maak die voorspelling om te reageer op 'n verandering in die onderliggende proses. Om te illustreer, stel ons 'n datastel wat veranderinge in die onderliggende gemiddelde van die tydreeks inkorporeer. Die figuur toon die tyd reeks gebruik ter illustrasie saam met die vraag gemiddelde waaruit die reeks was gegenereer. Die gemiddelde begin as 'n konstante by 10. Vanaf die tyd 21, verhoog dit met 'n eenheid in elke tydperk totdat dit die waarde van 20 ten tye 30. bereik Dan weer konstant raak dit. Die data word gesimuleer deur die byvoeging van die gemiddelde, 'n ewekansige geluid van 'n normale verspreiding met 'n nul gemiddelde en standaardafwyking 3. Die resultate van die simulasie is afgerond tot die naaste heelgetal. Die tabel toon die gesimuleerde Waarnemings wat gebruik word vir die voorbeeld. Wanneer ons die tafel gebruik, moet ons onthou dat op enige gegewe tyd, word slegs die afgelope data bekend. Die raming van die model parameter, vir drie verskillende waardes van m word saam met die gemiddelde van die tydreeks in die figuur hieronder. Die figuur toon die bewegende gemiddelde skatting van die gemiddelde by elke keer en nie die voorspelling. Die vooruitskattings sal die bewegende gemiddelde kurwes skuif na regs deur periodes. Een gevolgtrekking is onmiddellik duidelik uit die figuur. Vir al drie skattings loop die bewegende gemiddelde agter die lineêre tendens, met die lag verhoog met m. Die lag is die afstand tussen die model en die raming in die tydsdimensie. As gevolg van die lag, die bewegende gemiddelde onderskat die waarnemings as die gemiddelde is aan die toeneem. Die vooroordeel van die beramer is die verskil op 'n spesifieke tyd in die gemiddelde waarde van die model en die gemiddelde waarde voorspel deur die bewegende gemiddelde. Die vooroordeel wanneer die gemiddelde is aan die toeneem is negatief. Vir 'n dalende gemiddelde, die vooroordeel is positief. Die vertraging in die tyd en die vooroordeel wat in die raming is funksies van m. Hoe groter die waarde van m. hoe groter die omvang van die lag en vooroordeel. Vir 'n voortdurend toenemende reeks met tendens a. die waardes van die lag en vooroordeel van die beramer van die gemiddelde is in die onderstaande vergelykings. Die voorbeeld krommes stem nie ooreen hierdie vergelykings omdat die voorbeeld model is nie voortdurend aan die toeneem, eerder dit begin as 'n konstante, veranderinge aan 'n tendens en dan weer word konstant. Ook die voorbeeld krommes geraak word deur die lawaai. Die bewegende gemiddelde voorspelling van periodes in die toekoms word verteenwoordig deur die verskuiwing van die kromme na regs. Die lag en vooroordeel te verhoog proporsioneel. Die onderstaande vergelykings dui die lag en vooroordeel van 'n voorspelling tydperke in die toekoms in vergelyking met die model parameters. Weereens, hierdie formules is vir 'n tyd reeks met 'n konstante lineêre tendens. Ons moet nie verbaas wees oor die resultaat wees. Die bewegende gemiddelde beramer is gebaseer op die aanname van 'n konstante gemiddelde, en die voorbeeld het 'n liniêre tendens in die gemiddelde tydens 'n gedeelte van die studietydperk. Sedert real time reeks sal selde presies die aannames van enige model te gehoorsaam, moet ons bereid wees om vir sulke resultate. Ons kan ook aflei uit die figuur dat die variasie van die geraas het die grootste effek vir kleiner m. Die skatting is baie meer wisselvallig vir die bewegende gemiddelde van 5 as die bewegende gemiddelde van 20. Ons het die botsende begeertes te m verhoog die effek van variasie te verminder as gevolg van die geraas, en om m te verminder die voorspelling meer reageer op veranderinge aan te bring in die gemiddelde. Die fout is die verskil tussen die werklike data en die geskatte waarde. As die tyd reeks is werklik 'n konstante waarde van die verwagte waarde van die fout is nul en die variansie van die fout bestaan ​​uit 'n term wat 'n funksie is van en 'n tweede termyn wat die variansie van die geraas,. Die eerste kwartaal is die variansie van die gemiddelde geskatte met 'n monster van m waarnemings, die aanvaarding van die data kom uit 'n bevolking met 'n konstante gemiddelde. Hierdie term word tot die minimum beperk deur m so groot as moontlik. 'N Groot m maak die voorspelling nie reageer op 'n verandering in die onderliggende tydreekse. Die voorspelling reageer op veranderinge aan te bring, wil ons m so klein as moontlik (1), maar dit verhoog die foutvariansie. Praktiese vooruitskatting vereis 'n intermediêre waarde. Vooruitskatting met Excel Die vooruitskatting add-in implemente die bewegende gemiddelde formules. Die voorbeeld hieronder toon die analise wat deur die byvoeging in vir die voorbeeld van die data in kolom B. Die eerste 10 waarnemings word geïndekseer -9 deur 0. In vergelyking met die tabel hierbo, is die tydperk indekse verskuif deur -10. Die eerste tien Waarnemings verskaf die begin waardes vir die beraming en gebruik word om die bewegende gemiddelde vir tydperk 0. Die MA (10) kolom (C) toon die berekende bewegende gemiddeldes te bereken. Die bewegende gemiddelde parameter m is in sel C3. Vore (1) kolom (D) toon 'n voorspelling vir een periode na die toekoms. Die voorspelling interval is in sel D3. Wanneer die voorspelling interval verander word na 'n groter aantal van die getalle in die kolom vore geskuif af. Die kolom Fout (1) (e) toon die verskil tussen die waarneming en die voorspelling. Byvoorbeeld, die waarneming by die tyd 1 is 6. Die geskatte waarde uit die bewegende gemiddelde op tydstip 0 is 11.1. Die fout dan is -5,1. Die gemiddeldes en standaardafwykings Gemiddelde Afwyking (MAD) word bereken in selle E6 en E7 respectively. Moving gemiddelde en eksponensiële gladstryking modelle As 'n eerste stap in die beweging van buite gemiddelde modelle, ewekansige loop modelle, en lineêre tendens modelle, nonseasonal patrone en tendense kan wees geëkstrapoleer deur 'n bewegende-gemiddelde of glad model. Die basiese aanname agter gemiddelde en glad modelle is dat die tyd reeks is plaaslik stilstaande met 'n stadig wisselende gemiddelde. Vandaar, neem ons 'n bewegende (plaaslike) gemiddelde om die huidige waarde van die gemiddelde skat en dan gebruik dit as die voorspelling vir die nabye toekoms. Dit kan beskou word as 'n kompromie tussen die gemiddelde model en die ewekansige-stap-sonder-drif-model. Dieselfde strategie gebruik kan word om te skat en ekstrapoleer 'n plaaslike tendens. 'N bewegende gemiddelde is dikwels 'n quotsmoothedquot weergawe van die oorspronklike reeks, want kort termyn gemiddelde het die effek van gladstryking uit die knoppe in die oorspronklike reeks. Deur die aanpassing van die mate van gladstryking (die breedte van die bewegende gemiddelde), kan ons hoop om 'n soort van 'n optimale balans tussen die prestasie van die gemiddelde en die stogastiese wandeling modelle slaan. Die eenvoudigste soort gemiddelde model is die. Eenvoudige (ewe-geweeg) Moving Average: Die voorspelling vir die waarde van Y op tyd T1 wat gemaak word op tydstip t is gelyk aan die eenvoudige gemiddelde van die mees onlangse m waarnemings: (hier en elders sal ek die simbool 8220Y-hat8221 gebruik om op te staan vir 'n voorspelling van die tyd reeks Y gemaak op die vroegste moontlike voor datum deur 'n gegewe model.) Hierdie gemiddelde is gesentreer op tydperk t (M1) / 2, wat impliseer dat die skatting van die plaaslike gemiddelde sal neig om agter die werklike waarde van die plaaslike gemiddelde met sowat (M1) / 2 periodes. So, sê ons die gemiddelde ouderdom van die data in die eenvoudige bewegende gemiddelde is (M1) / 2 met betrekking tot die tydperk waarvoor die voorspelling is bereken: dit is die hoeveelheid tyd waarop voorspellings sal neig om agter draaipunte in die data. Byvoorbeeld, as jy gemiddeld die afgelope 5 waardes, sal die voorspellings wees oor 3 periodes laat in reaksie op draaipunte. Let daarop dat indien M1, die eenvoudige bewegende gemiddelde (SMA) model is soortgelyk aan die ewekansige loop model (sonder groei). As m is baie groot (vergelykbaar met die lengte van die skatting tydperk), die SMA model is gelykstaande aan die gemiddelde model. Soos met enige parameter van 'n voorspelling model, is dit gebruiklik om die waarde van k te pas ten einde die beste quotfitquot om die data, dit wil sê die kleinste voorspelling foute gemiddeld behaal. Hier is 'n voorbeeld van 'n reeks wat blykbaar ewekansige skommelinge toon om 'n stadig-wisselende gemiddelde. In die eerste plek kan probeer om dit aan te pas met 'n ewekansige loop model, wat gelykstaande is aan 'n eenvoudige bewegende gemiddelde van 1 kwartaal: Die ewekansige loop model reageer baie vinnig om veranderinge in die reeks, maar sodoende dit tel baie van die quotnoisequot in die data (die ewekansige skommelinge) asook die quotsignalquot (die plaaslike gemiddelde). As ons eerder probeer 'n eenvoudige bewegende gemiddelde van 5 terme, kry ons 'n gladder lyk stel voorspellings: Die 5 termyn eenvoudige bewegende gemiddelde opbrengste aansienlik kleiner foute as die ewekansige loop model in hierdie geval. Die gemiddelde ouderdom van die data in hierdie voorspelling is 3 ((51) / 2), sodat dit is geneig om agter draaipunte met sowat drie periodes. (Byvoorbeeld, blyk 'n afswaai het plaasgevind by tydperk 21, maar die voorspellings nie omdraai tot verskeie tydperke later.) Let daarop dat die langtermyn-voorspellings van die SMA model is 'n horisontale reguit lyn, net soos in die ewekansige loop model. So, die SMA model veronderstel dat daar geen neiging in die data. Maar, terwyl die voorspellings van die ewekansige loop model is eenvoudig gelyk aan die laaste waargenome waarde, die voorspellings van die SMA model is gelykstaande aan 'n geweegde gemiddelde van die afgelope waardes. Die vertroue perke bereken deur Stat Graphics vir die langtermyn-voorspellings van die eenvoudige bewegende gemiddelde nie groter as die vooruitskatting horison styg kry. Dit is natuurlik nie korrek Ongelukkig is daar geen onderliggende statistiese teorie wat ons vertel hoe die vertrouensintervalle behoort te brei vir hierdie model. Dit is egter nie te moeilik om empiriese ramings van die vertroue perke vir die langer-horison voorspellings te bereken. Byvoorbeeld, kan jy die opstel van 'n sigblad waarop die SMA model sal gebruik word om 2 stappe vooruit, 3 stappe vooruit, ens binne die historiese data monster voorspel. Jy kan dan bereken die monster standaardafwykings van die foute op elke voorspelling horison, en dan bou vertrouensintervalle vir langer termyn voorspellings deur optelling en aftrekking veelvoude van die toepaslike standaard afwyking. As ons probeer om 'n 9-termyn eenvoudige bewegende gemiddelde, kry ons selfs gladder voorspellings en meer van 'n sloerende uitwerking: Die gemiddelde ouderdom is nou 5 periodes ((91) / 2). As ons 'n 19-termyn bewegende gemiddelde te neem, die gemiddelde ouderdom toeneem tot 10: Let daarop dat, inderdaad, is die voorspellings nou agter draaipunte met sowat 10 periodes. Watter bedrag van smoothing is die beste vir hierdie reeks Hier is 'n tabel wat hulle dwaling statistieke vergelyk, ook met 'n 3-gemiddelde: Model C, die 5-termyn bewegende gemiddelde, lewer die laagste waarde van RMSE deur 'n klein marge oor die 3 - term en 9 termyn gemiddeldes, en hul ander statistieke is byna identies. So, onder modelle met 'n baie soortgelyke fout statistieke, kan ons kies of ons 'n bietjie meer responsiewe ingesteldheid of 'n bietjie meer gladheid in die voorspellings sou verkies. (Terug na bo.) Browns Eenvoudige Eksponensiële Smoothing (eksponensieel geweeg bewegende gemiddelde) Die eenvoudige bewegende gemiddelde model hierbo beskryf het die ongewenste eienskap dat dit behandel die laaste k Waarnemings ewe en heeltemal ignoreer al voorafgaande waarnemings. Intuïtief, moet afgelope data verdiskonteer in 'n meer geleidelike mode - byvoorbeeld, die mees onlangse waarneming moet 'n bietjie meer gewig kry as 2 mees onlangse, en die 2de mees onlangse moet 'n bietjie meer gewig as die 3 mees onlangse kry, en so aan. Die eenvoudige eksponensiële gladstryking (SES) model accomplishes hierdie. Laat 945 dui n quotsmoothing constantquot ( 'n getal tussen 0 en 1). Een manier om die model te skryf is om 'n reeks L dat die huidige vlak (dit wil sê die plaaslike gemiddelde waarde) van die reeks verteenwoordig as geraamde van data tot op hede te definieer. Die waarde van L op tydstip t is rekursief bereken uit sy eie vorige waarde soos volg: Dus, die huidige stryk waarde is 'n interpolasie tussen die vorige stryk waarde en die huidige waarneming, waar 945 kontroles die nabyheid van die geïnterpoleerde waarde tot die mees onlangse waarneming. Die voorspelling vir die volgende tydperk is eenvoudig die huidige stryk waarde: anders gestel ons kan die volgende voorspelling direk in terme van vorige voorspellings en vorige waarnemings uit te druk, in enige van die volgende ekwivalent weergawes. In die eerste weergawe, die voorspelling is 'n interpolasie tussen vorige skatting en vorige waarneming: In die tweede weergawe, is die volgende voorspelling verkry deur die aanpassing van die vorige skatting in die rigting van die vorige fout deur 'n breukdeel bedrag 945. is die fout gemaak by tyd t. In die derde weergawe, die voorspelling is 'n eksponensieel geweeg (dit wil sê afslag) bewegende gemiddelde met afslag faktor 1- 945: Die interpolasie weergawe van die voorspelling formule is die eenvoudigste om te gebruik as jy die uitvoering van die model op 'n spreadsheet: dit pas in 'n enkele sel en bevat selverwysings verwys na die vorige skatting, die vorige waarneming, en die sel waar die waarde van 945 gestoor. Let daarop dat indien 945 1, die SES model is gelykstaande aan 'n ewekansige loop model (sonder groei). As 945 0, die SES model is gelykstaande aan die gemiddelde model, met die veronderstelling dat die eerste stryk waarde gelyk aan die gemiddelde is ingestel. (Terug na bo.) Die gemiddelde ouderdom van die data in die eenvoudige eksponensiële-glad voorspelling is 1/945 relatief tot die tydperk waarvoor die voorspelling is bereken. (Dit is nie veronderstel duidelik te wees, maar dit kan maklik aangetoon deur die evaluering van 'n oneindige reeks.) Dus, die eenvoudige bewegende gemiddelde voorspelling is geneig om agter draaipunte met sowat 1/945 periodes. Byvoorbeeld, wanneer 945 0.5 die lag is 2 periodes wanneer 945 0.2 die lag is 5 periodes wanneer 945 0.1 die lag is 10 periodes, en so aan. Vir 'n gegewe gemiddelde ouderdom (bv bedrag van lag), die eenvoudige eksponensiële gladstryking (SES) voorspelling is 'n bietjie beter as die eenvoudige bewegende gemiddelde (SMA) voorspel, want dit plaas relatief meer gewig op die mees onlangse waarneming --i. e. dit is 'n bietjie meer quotresponsivequot om veranderinge voorkom in die onlangse verlede. Byvoorbeeld, 'n SMA model met 9 terme en 'n SES model met 945 0.2 beide het 'n gemiddelde ouderdom van 5 vir die data in hul voorspellings, maar die SES model plaas meer gewig op die laaste 3 waardes as wel die SMA model en by die Terselfdertyd is dit doesn8217t heeltemal 8220forget8221 oor waardes meer as 9 tydperke oud was, soos getoon in hierdie grafiek: nog 'n belangrike voordeel van die SES model die SMA model is dat die SES model maak gebruik van 'smoothing parameter wat voortdurend veranderlike, so dit kan maklik new deur die gebruik van 'n quotsolverquot algoritme om die gemiddelde minimum te beperk kwadraat fout. Die optimale waarde van 945 in die SES model vir hierdie reeks blyk te wees 0,2961, soos hier gewys word: die gemiddelde ouderdom van die data in hierdie voorspelling is 1 / 0,2961 3.4 tydperke, wat soortgelyk is aan dié van 'n 6-termyn eenvoudige bewegende gemiddelde. Die langtermyn-voorspellings van die SES model is 'n horisontale reguit lyn. soos in die SMA model en die ewekansige loop model sonder groei. Let egter daarop dat die vertrouensintervalle bereken deur Stat Graphics nou divergeer in 'n redelike aantreklike mode, en dat hulle aansienlik nouer as die vertrouensintervalle vir die ewekansige loop model. Die SES model veronderstel dat die reeks is 'n bietjie quotmore predictablequot as wel die ewekansige loop model. 'N SES model is eintlik 'n spesiale geval van 'n ARIMA model. sodat die statistiese teorie van ARIMA modelle bied 'n goeie basis vir die berekening van vertrouensintervalle vir die SES model. In die besonder, 'n SES model is 'n ARIMA model met een nonseasonal verskil, 'n MA (1) termyn, en geen konstante term. andersins bekend as 'n quotARIMA (0,1,1) model sonder constantquot. Die MA (1) koëffisiënt in die ARIMA model stem ooreen met die hoeveelheid 1- 945 in die SES model. Byvoorbeeld, as jy 'n ARIMA (0,1,1) model inpas sonder konstante om die reeks te ontleed hier, die beraamde MA (1) koëffisiënt blyk te wees 0,7029, wat byna presies 'n minus 0,2961. Dit is moontlik om die aanname van 'n nie-nul konstante lineêre tendens voeg by 'n SES model. Om dit te doen, net 'n ARIMA model met een nonseasonal verskil en 'n MA (1) termyn met 'n konstante, dit wil sê 'n ARIMA (0,1,1) model met 'n konstante spesifiseer. Die langtermyn-voorspellings sal dan 'n tendens wat gelyk is aan die gemiddelde tendens waargeneem oor die hele skatting tydperk is. Jy kan dit nie doen in samewerking met seisoenale aanpassing, omdat die aanpassing opsies seisoenale is afgeskakel wanneer die model tipe is ingestel op ARIMA. Jy kan egter 'n konstante langtermyn eksponensiële tendens om 'n eenvoudige eksponensiële gladstryking model voeg (met of sonder seisoenale aanpassing) deur gebruik te maak van die opsie inflasie-aanpassing in die vooruitskatting prosedure. Die toepaslike quotinflationquot (persentasie groei) koers per periode kan geskat word as die helling koëffisiënt in 'n lineêre tendens model toegerus om die data in samewerking met 'n natuurlike logaritme transformasie, of dit kan op grond van ander, onafhanklike inligting oor die langtermyn groeivooruitsigte . (Terug na bo.) Browns Lineêre (dws dubbel) Eksponensiële glad die SMA modelle en SES modelle aanvaar dat daar geen tendens van enige aard in die data (wat gewoonlik OK of ten minste nie-te-sleg vir 1- stap-ahead voorspellings wanneer die data is relatief raserig), en hulle kan verander word om 'n konstante lineêre tendens inkorporeer soos hierbo getoon. Wat van kort termyn tendense As 'n reeks vertoon 'n wisselende koers van groei of 'n sikliese patroon wat uitstaan ​​duidelik teen die geraas, en as daar 'n behoefte aan meer as 1 tydperk wat voorlê voorspel, dan skatting van 'n plaaslike tendens kan ook wees n probleem. Die eenvoudige eksponensiële gladstryking model veralgemeen kan word na 'n lineêre eksponensiële gladstryking (LES) model wat plaaslike begrotings van beide vlak en tendens bere te kry. Die eenvoudigste-time wisselende tendens model is Browns lineêr eksponensiële gladstryking model, wat twee verskillende reëlmatige reeks wat op verskillende punte gesentreer in die tyd gebruik. Die vooruitskatting formule is gebaseer op 'n ekstrapolasie van 'n streep deur die twee sentrums. ( 'N meer gesofistikeerde weergawe van hierdie model, Holt8217s, word hieronder bespreek.) Die algebraïese vorm van Brown8217s lineêr eksponensiële gladstryking model, soos dié van die eenvoudige eksponensiële gladstryking model, uitgedruk kan word in 'n aantal verskillende maar ekwivalente vorms. Die quotstandardquot vorm van hierdie model word gewoonlik uitgedruk as volg: Laat S dui die enkel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking om reeks Y. Dit is, is die waarde van S op tydperk t gegee word deur: (Onthou dat, onder eenvoudige eksponensiële gladstryking, dit sou die voorspelling vir Y by tydperk T1 wees) Dan Squot dui die dubbel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking (met behulp van dieselfde 945) tot reeks S:. ten slotte, die voorspelling vir Y tk. vir enige kgt1, word gegee deur: Dit lewer e 1 0 (dit wil sê kul n bietjie, en laat die eerste skatting gelyk wees aan die werklike eerste waarneming), en e 2 Y 2 8211 Y 1. waarna voorspellings gegenereer met behulp van die vergelyking hierbo. Dit gee dieselfde toegerus waardes as die formule gebaseer op S en S indien laasgenoemde is begin met behulp van S 1 S 1 Y 1. Hierdie weergawe van die model gebruik word op die volgende bladsy wat 'n kombinasie van eksponensiële gladstryking met seisoenale aanpassing illustreer. Holt8217s Lineêre Eksponensiële Smoothing Brown8217s LES model bere plaaslike begrotings van vlak en tendens deur glad die onlangse data, maar die feit dat dit nie so met 'n enkele glad parameter plaas 'n beperking op die data patrone wat dit in staat is om aan te pas: die vlak en tendens word nie toegelaat om wissel op onafhanklike tariewe. Holt8217s LES model spreek hierdie kwessie deur die insluiting van twee glad konstantes, een vir die vlak en een vir die tendens. Te eniger tyd t, soos in Brown8217s model, die daar is 'n skatting L t van die plaaslike vlak en 'n skatting T t van die plaaslike tendens. Hier is hulle rekursief bereken vanaf die waarde van Y op tydstip t en die vorige raming van die vlak en tendens waargeneem deur twee vergelykings wat eksponensiële gladstryking afsonderlik van toepassing op hulle. As die geskatte vlak en tendens op tydstip t-1 is L t82091 en T t-1. onderskeidelik, dan is die voorspelling vir Y tshy wat op tydstip t-1 sal gemaak is gelyk aan L t-1 T T-1. Wanneer die werklike waarde is waargeneem, is die opgedateer skatting van die vlak rekursief bereken deur interpol tussen Y tshy en sy voorspelling, L t-1 T T-1, die gebruik van gewigte van 945 en 1- 945. Die verandering in die geskatte vlak, naamlik L t 8209 L t82091. geïnterpreteer kan word as 'n lawaaierige meting van die tendens op tydstip t. Die opgedateer skatting van die tendens is dan rekursief bereken deur interpol tussen L t 8209 L t82091 en die vorige skatting van die tendens, T t-1. die gebruik van gewigte van 946 en 1-946: Die interpretasie van die tendens-glad konstante 946 is soortgelyk aan dié van die vlak glad konstante 945. Models met klein waardes van 946 aanvaar dat die tendens verander net baie stadig met verloop van tyd, terwyl modelle met groter 946 aanvaar dat dit vinniger is om te verander. 'N Model met 'n groot 946 is van mening dat die verre toekoms is baie onseker, omdat foute in die tendens-skatting word baie belangrik wanneer voorspel meer as een tydperk wat voorlê. (Terug na bo.) Die smoothing konstantes 945 en 946 kan in die gewone manier word beraam deur die vermindering van die gemiddelde kwadraat fout van die 1-stap-ahead voorspellings. Wanneer dit in Stat Graphics gedoen, die skattings uitdraai om te wees 945 0.3048 en 946 0,008. Die baie klein waarde van 946 beteken dat die model veronderstel baie min verandering in die tendens van een tydperk na die volgende, so basies hierdie model is besig om 'n langtermyn-tendens skat. Volgens analogie met die idee van die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike vlak van die reeks, die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike tendens is eweredig aan 1/946, hoewel nie presies gelyk aan Dit. In hierdie geval is dit blyk 1 / 0,006 125. Dit isn8217t n baie presiese aantal sover die akkuraatheid van die skatting van 946 isn8217t regtig 3 desimale plekke te wees, maar dit is van dieselfde algemene orde van grootte as die steekproefgrootte van 100 , so hierdie model is gemiddeld oor 'n hele klomp van die geskiedenis in die skatte van die tendens. Die voorspelling plot hieronder toon dat die LES model skat 'n effens groter plaaslike tendens aan die einde van die reeks as die konstante tendens geskat in die SEStrend model. Ook waarvan die beraamde waarde van 945 is byna identies aan die een wat deur die pas van die SES model met of sonder tendens, so dit is amper dieselfde model. Nou, doen hierdie lyk redelike voorspellings vir 'n model wat veronderstel is om te beraming 'n plaaslike tendens As jy hierdie plot 8220eyeball8221, dit lyk asof die plaaslike tendens afwaarts gedraai aan die einde van die reeks: Wat het die parameters van hierdie model gebeur is beraam deur die vermindering van die kwadraat fout van 1-stap-ahead voorspellings, nie langer termyn voorspellings, in welke geval die tendens 'n groot verskil doesn8217t maak. As alles wat jy is op soek na is 1-stap-ahead foute, is jy nie sien die groter prentjie van tendense oor (sê) 10 of 20 periodes. Ten einde hierdie model meer in harmonie te kry met ons oogbal ekstrapolasie van die data, kan ons met die hand die tendens-glad konstante pas sodat dit 'n korter basislyn vir tendens skatting. Byvoorbeeld, as ons kies om te stel 946 0.1, dan is die gemiddelde ouderdom van die gebruik in die skatte van die plaaslike tendens data is 10 periodes, wat beteken dat ons die gemiddeld van die tendens oor daardie laaste 20 periodes of so. Here8217s wat die voorspelling plot lyk asof ons '946 0.1 terwyl 945 0.3. Dit lyk intuïtief redelike vir hierdie reeks, maar dit is waarskynlik gevaarlik om hierdie tendens te ekstrapoleer nie meer as 10 periodes in die toekoms. Wat van die fout statistieke Hier is 'n model vergelyking vir die twee modelle hierbo asook drie SES modelle getoon. Die optimale waarde van 945.Vir die SES model is ongeveer 0,3, maar soortgelyke resultate (met 'n bietjie meer of minder 'n responsiewe ingesteldheid, onderskeidelik) verkry met 0,5 en 0,2. (A) Holts lineêre exp. glad met alfa 0,3048 en beta 0,008 (B) Holts lineêre exp. glad met alfa 0,3 en beta 0,1 (C) Eenvoudige eksponensiële gladstryking met alfa 0,5 (D) Eenvoudige eksponensiële gladstryking met alfa 0,3 (E) Eenvoudige eksponensiële gladstryking met alfa 0,2 hul statistieke is byna identies, so ons can8217t regtig die keuse te maak op die basis van 1-stap-ahead voorspelling foute binne die data monster. Ons het om terug te val op ander oorwegings. As ons glo dat dit sinvol om die huidige tendens skatting van wat die afgelope 20 periodes of so gebeur baseer, kan ons 'n saak vir die LES model met 945 0.3 en 946 0.1 maak. As ons wil hê agnostikus te wees oor die vraag of daar 'n plaaslike tendens, dan een van die SES modelle makliker om te verduidelik kan wees en sou ook vir meer middel-of-the-road voorspellings vir die volgende 5 of 10 periodes. (Terug na bo.) Watter tipe tendens-ekstrapolasie die beste: horisontale of lineêre empiriese bewyse dui daarop dat, indien die data is reeds aangepas (indien nodig) vir inflasie, dan is dit dalk onverstandig om kort termyn lineêre ekstrapoleer wees tendense baie ver in die toekoms. Tendense duidelik vandag mag verslap in die toekoms as gevolg van uiteenlopende oorsake soos produk veroudering, toenemende mededinging en sikliese afswaai of opwaartse fases in 'n bedryf. Om hierdie rede, eenvoudige eksponensiële gladstryking voer dikwels beter out-of-monster as wat dit andersins word verwag, ten spyte van sy quotnaivequot horisontale tendens ekstrapolasie. Gedempte tendens veranderinge van die lineêre eksponensiële gladstryking model word ook dikwels gebruik in die praktyk om 'n aantekening van konserwatisme in te voer in die tendens projeksies. Die gedempte-tendens LES model geïmplementeer kan word as 'n spesiale geval van 'n ARIMA model, in die besonder, 'n ARIMA (1,1,2) model. Dit is moontlik om vertrouensintervalle rondom langtermyn voorspellings wat deur eksponensiële gladstryking modelle bereken deur die oorweging van hulle as spesiale gevalle van ARIMA modelle. (Pasop: nie alle sagteware bereken vertrouensintervalle vir hierdie modelle korrek.) Die breedte van die vertrouensintervalle hang af van (i) die RMS fout van die model, (ii) die tipe glad (eenvoudige of lineêr) (iii) die waarde (s) van die smoothing konstante (s) en (iv) die aantal periodes voor jy voorspel. In die algemeen, die tussenposes versprei vinniger as 945 kry groter in die SES model en hulle uitgebrei, sodat baie vinniger as lineêre, eerder as eenvoudige smoothing gebruik. Hierdie onderwerp word verder in die ARIMA modelle deel van die notas bespreek. (Terug na bo.) 8.4 Moving gemiddelde modelle Eerder as om te gebruik afgelope waardes van die voorspelling veranderlike in 'n regressie, 'n bewegende gemiddelde model gebruik afgelope voorspelling foute in 'n regressie-agtige model. y c et theta e theta e kolle theta e, waar et is wit geraas. Ons noem dit 'n MA (Q) model. Natuurlik, ons het nie die waardes van et waarneem, so dit is nie regtig regressie in die gewone sin. Let daarop dat elke waarde van yt gesien kan word as 'n geweegde bewegende gemiddelde van die afgelope paar voorspel foute. Maar bewegende gemiddelde modelle moet nie verwar word met bewegende gemiddelde smoothing ons in Hoofstuk 6. 'n bewegende gemiddelde model bespreek word gebruik vir die voorspelling van toekomstige waardes, terwyl bewegende gemiddelde smoothing word gebruik vir die bepaling van die tendens-siklus van verlede waardes wees. Figuur 8.6: Twee voorbeelde van data uit bewegende gemiddelde modelle met verskillende parameters. Links: MA (1) met y t 20e t 0.8e t-1. Regs: MA (2) met y t e t-e t-1 0.8e t-2. In beide gevalle, is e t normaalverdeelde wit geraas met gemiddelde nul en variansie een. Figuur 8.6 toon 'n mate van data uit 'n MA (1) model en 'n MA (2) model. Die verandering van die parameters theta1, kolle, thetaq resultate in verskillende tyd reeks patrone. Soos met outoregressiemodelle, sal die afwyking van die term fout et net verander die skaal van die reeks, nie die patrone. Dit is moontlik om 'n stilstaande AR (p) model as 'n MA (infty) model skryf. Byvoorbeeld, met behulp van herhaalde vervanging, kan ons hierdie bewys vir 'n AR (1) model: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amp phi13y phi12e phi1 e et amptext einde verstande -1 Dit phi1 Dit 1, sal die waarde van phi1k kleiner te kry as k groter word. So uiteindelik kry ons yt et phi1 e phi12 e phi13 e cdots, 'n MA (infty) proses. Die omgekeerde gevolg het as ons 'n paar beperkinge op te lê op die MA parameters. Toe die MA-model is omkeerbaar genoem. Dit wil sê, dat ons 'n omkeerbare MA (Q) proses as 'n AR (infty) proses kan skryf. Omkeerbare modelle is nie net om ons in staat stel om van MA modelle om modelle AR. Hulle het ook 'n paar wiskundige eienskappe wat maak dit makliker om te gebruik in die praktyk. Die inverteerbaarheid beperkings is soortgelyk aan die stasionariteit beperkings. Vir 'n MA (1) model: -1lttheta1lt1. Vir 'n MA (2) model: -1lttheta2lt1, theta2theta1 GT-1, theta1 - theta2 Dit 1. Meer ingewikkelde voorwaardes hou vir qge3. Weereens, sal R sorg van hierdie beperkings wanneer die beraming van die models.2.1 bewegende gemiddelde modelle (MA modelle) tydreeksmodelle bekend as ARIMA modelle kan die volgende insluit outoregressiewe terme en / of bewegende gemiddelde terme. In Week 1, het ons geleer 'n outoregressiewe term in 'n tydreeks model vir die veranderlike x t is 'n vertraagde waarde van x t. Byvoorbeeld, 'n lag 1 outoregressiewe termyn is x t-1 (vermenigvuldig met 'n koëffisiënt). Hierdie les definieer bewegende gemiddelde terme. 'N bewegende gemiddelde termyn in 'n tydreeks model is 'n verlede fout (vermenigvuldig met 'n koëffisiënt). Laat (WT omslaan N (0, sigma2w)), wat beteken dat die w t is identies, onafhanklik versprei, elk met 'n normaalverdeling met gemiddelde 0 en dieselfde afwyking. Die 1 ste orde bewegende gemiddelde model, aangedui deur MA (1) is (xt mu wt theta1w) Die 2de orde bewegende gemiddelde model, aangedui deur MA (2) is (xt mu wt theta1w theta2w) Die Q de orde bewegende gemiddelde model , aangedui deur MA (Q) is (xt mu wt theta1w theta2w kolle thetaqw) Nota. Baie handboeke en sagteware programme definieer die model met negatiewe tekens voor die terme. Dit nie die geval verander die algemene teoretiese eienskappe van die model, hoewel dit flip die algebraïese tekens van beraamde koëffisiënt waardes en (unsquared) terme in formules vir ACFs en afwykings. Jy moet jou sagteware kyk om te kontroleer of negatiewe of positiewe tekens is gebruik om korrek te skryf die beraamde model. R gebruik positiewe tekens in sy onderliggende model, soos ons hier doen. Teoretiese Eienskappe van 'n tydreeks met 'n MA (1) Model Let daarop dat die enigste nie-nul waarde in die teoretiese ACF is vir lag 1. Alle ander outokorrelasies is 0. So 'n monster ACF met 'n beduidende outokorrelasie net by lag 1 is 'n aanduiding van 'n moontlike MA (1) model. Vir belangstellende studente, bewyse van hierdie eienskappe is 'n bylae tot hierdie opdragstuk. Voorbeeld 1 Veronderstel dat 'n MA (1) model is x t 10 w t 0,7 w t-1. waar (WT omslaan N (0,1)). So het die koëffisiënt 1 0.7. Die teoretiese ACF gegee word deur 'n plot van hierdie volg ACF. Die plot net aangedui is die teoretiese ACF vir 'n MA (1) met 1 0.7. In die praktyk, 'n monster gewoond gewoonlik verskaf so 'n duidelike patroon. Die gebruik van R, gesimuleerde ons N 100 monster waardes gebruik te maak van die model x t 10 w t 0,7 w t-1 waar w t IID N (0,1). Vir hierdie simulasie, 'n tydreeks plot van die steekproefdata volg. Ons kan nie sê baie van hierdie plot. Die monster ACF vir die gesimuleerde data volg. Ons sien 'n skerp styging in lag 1 gevolg deur die algemeen nie-beduidende waardes vir lags afgelope 1. Let daarop dat die monster ACF kom nie ooreen met die teoretiese patroon van die onderliggende MA (1), en dit is dat al outokorrelasies vir lags afgelope 1 sal wees 0 . 'n ander voorbeeld sou 'n effens verskillende monster ACF hieronder getoon, maar sal waarskynlik dieselfde breë funksies. Theroretical Eienskappe van 'n tydreeks met 'n MA (2) model vir die MA (2) model, teoretiese eienskappe is soos volg: Let daarop dat die enigste nie-nul waardes in die teoretiese ACF is vir lags 1 en 2. outokorrelasies vir hoër lags is 0 . So, 'n monster ACF met 'n beduidende outokorrelasies by lags 1 en 2, maar nie-beduidende outokorrelasies vir hoër lags dui op 'n moontlike MA (2) model. IID N (0,1). Die koëffisiënte is 1 0.5 en 2 0.3. Want dit is 'n MA (2), sal die teoretiese ACF nul waardes het net by lags 1 en 2. Waardes van die twee nie-nul outokorrelasies is 'n plot van die teoretiese ACF volg. Soos byna altyd die geval is, monster data gewoond te tree heeltemal so perfek as teorie. Ons gesimuleerde N 150 monster waardes vir die model x t 10 w t 0,5 w t-1 0,3 w t-2. waar w t IID N (0,1). Die tydreekse plot van die data volg. Soos met die tydreeks plot vir die MA (1) voorbeeld van die data, kan nie vir jou sê baie daaruit. Die monster ACF vir die gesimuleerde data volg. Die patroon is tipies vir situasies waar 'n MA (2) model nuttig kan wees. Daar is twee statisties beduidende spykers by lags 1 en 2, gevolg deur nie-beduidende waardes vir ander lags. Let daarop dat as gevolg van steekproeffout, die monster ACF nie die teoretiese patroon presies ooreenstem. ACF vir Algemene MA (Q) Models n eiendom van MA (Q) modelle in die algemeen is dat daar nie-nul outokorrelasies vir die eerste Q lags en outokorrelasies 0 vir alle lags GT q. Nie-uniekheid van verband tussen waardes van 1 en (rho1) in MA (1) Model. In die MA (1) model, vir enige waarde van 1. die wedersydse 01/01 gee dieselfde waarde vir so 'n voorbeeld, gebruik 0,5 vir 1. en gebruik dan 1 / (0,5) 2 vir 1. Jy sal kry (rho1) 0.4 in beide gevalle. Om 'n teoretiese beperking genoem inverteerbaarheid bevredig. Ons beperk MA (1) modelle om waardes met absolute waarde minder as 1. In die voorbeeld net gegee, 1 0.5 sal 'n toelaatbare parameter waarde wees nie, terwyl 1 1 / 0.5 2 nie. Inverteerbaarheid van MA modelle 'n MA-model word gesê omkeerbare te wees indien dit algebraïes gelykstaande aan 'n konvergerende oneindige orde AR model. Bevestig deur die, bedoel ons dat die AR koëffisiënte daal tot 0 as ons terug beweeg in die tyd. Inverteerbaarheid is 'n beperking geprogrammeer in die tyd reeks sagteware wat gebruik word om die koëffisiënte van modelle te skat met MA terme. Dit is nie iets wat ons gaan vir die data-analise. Bykomende inligting oor die inverteerbaarheid beperking vir MA (1) modelle word in die bylaag. Gevorderde teorie Nota. Vir 'n MA (Q) model met 'n bepaalde ACF, daar is net een omkeerbare model. Die noodsaaklike voorwaarde vir inverteerbaarheid is dat die koëffisiënte waardes sodanig dat die vergelyking 1- 1 y. - Q y q 0 het oplossings vir y wat buite die eenheidsirkel val. R-kode vir die voorbeelde in Voorbeeld 1, ons geplot die teoretiese ACF van die model x t 10 w t. 7W t-1. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik word om die teoretiese ACF plot was: acfma1ARMAacf (Mac (0,7), lag. max10) 10 lags van ACF vir MA (1) met theta1 0.7 lags0: 10 skep 'n veranderlike genaamd lags wat wissel van 0 tot 10. plot (lags, acfma1, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (1) met theta1 0.7) abline (H0) voeg n horisontale as om die plot die eerste opdrag bepaal die ACF en slaan dit in 'n voorwerp vernoem acfma1 (ons keuse van naam). Die plot opdrag (die 3de gebod) erwe lags teenoor die ACF waardes vir lags 1 tot 10. Die ylab parameter etikette die y-as en die belangrikste parameter sit 'n titel op die plot. Om te sien die numeriese waardes van die ACF net gebruik die opdrag acfma1. Die simulasie en erwe is gedoen met die volgende opdragte. xcarima. sim (N150, lys (Mac (0,7))) Simuleer N 150 waardes van MA (1) xxc10 voeg 10 tot gemiddelde 10. Simulasie gebreke maak beteken 0. plot (x, typeb, mainSimulated MA (1) data) ACF (x, xlimc (1,10), mainACF vir gesimuleerde steekproefdata) In Voorbeeld 2, ons geplot die teoretiese ACF van die model xt 10 wt 0,5 w t-1 0,3 w t-2. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik was acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (2) met theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, lys (Mac (0.5, 0.3))) xxc10 plot (x, typeb, hoof Gesimuleerde MA (2) Series) ACF (x, xlimc (1,10), mainACF vir gesimuleerde MA (2) Data) Bylae: Bewys van eiendomme van MA (1) vir belangstellende studente, hier is bewyse vir teoretiese eienskappe van die MA (1) model. Variansie: (teks (xt) teks (mu wt theta1 w) 0 teks (WT) teks (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wanneer h 1, die vorige uitdrukking 1 W 2. Vir enige h 2, die vorige uitdrukking 0 . die rede hiervoor is dat per definisie van onafhanklikheid van die WT. E (w k w j) 0 vir enige k j. Verder, omdat die w t het intussen 0, E (w j w j) E (w j 2) w 2. Vir 'n tydreeks, Pas hierdie resultaat aan die ACF hierbo kry. 'N omkeerbare MA model is die een wat geskryf kan word as 'n oneindige orde AR model wat konvergeer sodat die AR koëffisiënte konvergeer na 0 as ons oneindig terug in die tyd beweeg. Wel demonstreer inverteerbaarheid vir die MA (1) model. Ons het toe plaasvervanger verhouding (2) vir w t-1 in vergelyking (1) (3) (ZT wt theta1 (Z - theta1w) wt theta1z - theta2w) op tydstip t-2. vergelyking (2) word Ons het toe plaasvervanger verhouding (4) vir w t-2 in vergelyking (3) (ZT wt theta1 Z - theta21w wt theta1z - theta21 (Z - theta1w) wt theta1z - theta12z theta31w) As ons voortgaan ( oneindig), sou ons die oneindige orde AR model kry (ZT wt theta1 Z - theta21z theta31z - theta41z kolletjies) Nota egter dat as 1 1, die koëffisiënte die lags van Z vermenigvuldig sal toeneem (oneindig) in grootte as ons terug beweeg in tyd. Om dit te voorkom, moet ons 1 LT1. Dit is die voorwaarde vir 'n omkeerbare MA (1) model. Oneindige Bestel MA model In week 3, goed sien dat 'n AR (1) model kan omgeskakel word na 'n oneindige orde MA model: (xt - mu wt phi1w phi21w kolle phik1 w kolle som phij1w) Hierdie opsomming van verlede wit geraas terme is bekende as die oorsaaklike voorstelling van 'n AR (1). Met ander woorde, x t is 'n spesiale tipe MA met 'n oneindige aantal terme terug gaan in die tyd. Dit is 'n oneindige orde MA of MA () genoem. 'N Eindige orde MA is 'n oneindige orde AR en enige eindige orde AR is 'n oneindige orde MA. Onthou in Week 1, het ons opgemerk dat 'n vereiste vir 'n stilstaande AR (1) is dat 1 LT1. Kom ons bereken die Var (x t) met behulp van die oorsaaklike verteenwoordiging. Die laaste stap gebruik 'n basiese feit oor meetkundige reeks wat vereis (phi1lt1) anders sal die reeks divergeer. NavigationA Rima staan ​​vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan ​​bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan ​​slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n wetenskap.


No comments:

Post a Comment